Текст
                    A. H. КОЛМОГОРОВ, С. В. ФОМИН
ЭЛЕМЕНТЫ
ТЕОРИИ ФУНКЦИЙ
И ФУНКЦИОНАЛЬНОГО
АНАЛИЗА
ИЗДАНИЕ ЧЕТВЕРТОЕ, ПЕРЕРАБОТАННОЕ
Допущено Министерством
высшего и среднего специального образования СССР
в качестве учебника для студентов
математических специальностей университетов
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
Москва 1976

К 60 517.2 УДК 517.5(075.8) Элементы теории функций и функционального анализа, А. Н. Колмо- горов, С. В. Фомин. Главная редакция физико-математической литературы изд-ва «Наука», М., 1976 г. Книга представляет собой учебник, соответствующий в основном той про- грамме курса «Анализ III», которая принята в МГУ и в ряде других универси- тетов. Предназначена в первую очередь для студентов механико-математиче- ских и физико-математических факультетов университетов. Для ее чтения требуется владение основами математического анализа и линейной алгебры. Первая часть содержит основные теоретико-множественные понятия. В главах II—IV изложена теория линейных пространств, включающая элементы теории обобщенных функций. Эти главы, а также примыкающая к ним глава X, по- священная некоторым вопросам нелинейнего функционального анализа, не предполагают знакомства с понятием меры и лебеговой теорией интегриро- вания. Теория меры, измеримые функции, интеграл Лебега, а также лебегова теория дифференцирования и основные свойства линейных пространств сум- мируемых функций излагаются в главах V—VII. Глава VIII содержит ряды Фурье и интеграл Фурье. В главе IX изложены основные факты из теории интегральных уравнений. Помещенное в конце книги Дополнение содержит краткое изложение основных сведений о банаховых алгебрах и некоторых их применениях. Илл. 24, библ. 57 назв. TZ 20203-062 , 7fi К 053(02)-76 © Главная редакция физико-математической литературы издательства «Наука», 1976, с изменениями.
ОГЛАВЛЕН ИЕ Предисловие к четвертому изданию.................................. 9 Из предисловия ко второму изданию..................................10 Предисловие к третьему изданию.....................................12 Глава I Элементы теории множеств § 1. Понятие множества. Операции над множествами..................13 1. Основные определения (13). 2. Операции над множествами (13). § 2. Отображения. Разбиения на классы.............................16 1. Отображение множеств. Общее понятие функции (16). 2. Разбие- ние на классы. Отношения эквивалентности (18). § 3. Эквивалентность множеств. Понятие мощности множества.........21 1. Конечные и бесконечные множества (21). 2. Счетные множе- ства (22). 3. Эквивалентность множеств (24). 4. Несчетность множе- ства действительных чисел (26). 5. Теорема Кантора — Бернш- тейна (28). 6. Понятие мощности множества (28). § 4. Упорядоченные множества. Трансфинитные числа.................31 1. Частично упорядоченные множества (31). 2. Отображения, сох- раняющие порядок (32). 3. Порядковые типы. Упорядоченные мно- жества (33). 4. Упорядоченная сумма упорядоченных множеств (34). 5. Вполне упорядоченные множества. Трансфинитные числа (34). 6. Сравнение порядковых чисел (36). 7. Аксиома выбора, теорема Цермело и другие эквивалентные им утверждения (38). 8. Траис- финитная индукция (40). § 5. Системы множеств.............................................41 1. Кольцо множеств (41). 2. Полукольцо множеств (42). 3. Кольцо, порожденное полукольцом (44). 4. а-алгебры (45). 5. Системы множеств и отображения (46). Глава II Метрические и топологические пространства § 1. Понятие метрического пространства............................48 1. Определение и основные примеры (48). 2. Непрерывные отобра- жения метрических пространств. Изометрия (55). § 2. Сходимость. Открытые и замкнутые множества...................56 1. Предельные точки. Замыкание (56). 2. Сходимость (58). 3. Плот- ные подмножества (59). 4. Открытые и замкнутые множества (60). 5. Открытые и замкнутые множества на прямой (62). § 3. Полные метрические пространства..............................66 1. Определение и примеры полных метрических пространств (66). 2. Теорема о вложенных шарах (69). 3. Теорема Бэра (70). 4. По- полнение пространства (71).
4 § 4. § 5. § 6. § 7. § 8. § 1. § 2. § 3. § 4. § 5. ОГЛАВЛЕНИЕ Принцип сжимающих отображений и его применения..................74 1. Принцип сжимающих отображений (74). 2. Простейшие примене- ния принципа сжимающих отображений (75). 3. Теоремы сущест- вования и единственности для дифференциальных уравнений (78). 4. Применение принципа сжимающих отображений к интегральным уравнениям (81). Топологические пространства ................................... 83 1. Определение и примеры топологических пространств (83). 2. Сравнение топологий (85). 3. Определяющие системы окрестно- стей. База. Аксиомы счетности (86). 4. Сходящиеся последователь- ности в Т (90). 5. Непрерывные отображения. Гомеоморфизм (91). 6. Аксиомы отделимости (94). 7. Различные способы задания топо- логии в пространстве. Метризуемость (97). Компактность....................................................98 1. Понятие компактности (98). 2. Непрерывные отображения компактных пространств (101). 3. Непрерывные и полунепрерывные функции на компактных пространствах (101). 4. Счетная компакт- ность (103). 5. Предкомпактные множества (105). Компактность в метрических пространствах.......................106 1. Полная ограниченность (106). 2. Компактность и полная ограничен- ность (107). 3. Предкомпактные подмножества в метрических прост- ранствах (109). 4. Теорема Арцела (109). 5. Теорема Пеано (111). 6. Равномерная непрерывность. Непрерывные отображения метри- ческих компактов (113). 7. Обобщенная теорема Арцела (114). Непрерывные кривые в метрических пространствах.................115 Глава III Нормированные и топологические линейные пространства Линейные пространства..........................................119 1. Определение и примеры линейных пространств (119). 2. Линейная зависимость (121). 3. Подпространства (122). 4. Фактор-простран- ства (123). 5. Линейные функционалы (124). 6. Геометрический смысл линейного функционала (126). Выпуклые множества и выпуклые функционалы. Теорема Хана — Банаха..................................................128 1. Выпуклые множества и выпуклые тела (128). 2. Однородно-вы- пуклые функционалы (130). 3. Функционал Минковского (132). 4. Теорема Хана — Банаха (134). 5. Отделимость выпуклых мно- жеств в линейном пространстве (137). Нормированные пространства.....................................138 1. Определение и примеры нормированных пространств (139). 2. Подпространства нормированного пространства (140). 3. Фактор- пространства нормированного пространства (141). Евклидовы пространства........................................143 1. Определение евклидовых пространств (143). 2. Примеры (145). 3. Существование ортогональных базисов, ортогонализация (147). 4. Неравенство Бесселя. Замкнутые ортогональные системы (149). 5. Полные евклидовы пространства. Теорема Рисса — Фишера (152). 6. Гильбертово пространство. Теорема об изоморфизме (155). 7. Подпространства, ортогональные дополнения, прямая сумма (158). 8. Характеристическое свойство евклидовых пространств (161). 9. Комплексные евклидовы пространства (164). Топологические линейные пространства...........................167 1. Определение и примеры (167). 2. Локальная выпуклость (169). 3. Счетно-нормированные пространства (170).
ОГЛАВЛЕНИЕ 5 Глава IV Линейные функционалы и линейные операторы л 1. Непрерывные линейные функционалы..........................174 ]. Непрерывные линейные функционалы в топологических линейных пространствах (174). 2. Линейные функционалы на нормированных пространствах (175). 3. Теорема Хана — Банаха в нормированном пространстве (179). 4. Линейные функционалы в счетно-нормиро- ваниом пространстве (181). « 2. Сопряженное пространство..................................182 1. Определение сопряженного пространства (182). 2. Сильная топо- логия в сопряженном пространстве (182). 3. Примеры сопряженных пространств (185). 4. Второе сопряженное пространство (190). § 3. Слабая топология и слабая сходимость .................... 192 1. Слабая топология и слабая сходимость в линейном топологиче- ском пространстве (192). 2. Слабая сходимость в нормированных пространствах (194). 3. Слабая топология и слабая сходимость в сопряженном пространстве (197). 4. Ограниченные множества в сопряженном пространстве (199). § 4. Обобщенные функции .......................................203 1. Расширение понятия функции (203). 2. Пространство основных функций (204). 3. Обобщенные функции (205). 4. Действия над обоб- щенными функциями (207). 5. Достаточность запаса основных функ- ций (210). 6. Восстановление функции по производной. Дифферен- циальные уравнения в классе обобщенных функций (211). 7. Неко- торые обобщения (214). § 5. Линейные операторы........................................218 1. Определение и примеры линейных операторов (218). 2. Непре- рывность и ограниченность (222). 3. Сумма и произведение опера- торов (223). 4. Обратный оператор, обратимость (224). 5. Сопря- женные операторы (230). 6. Сопряженный оператор в евклидовом пространстве. Самосопряженные операторы (232). 7. Спектр опера- тора. Резольвента (234). § 6. Компактные операторы..................................... 237 1. Определение и примеры компактных операторов (237), 2. Основ- ные свойства компактных операторов (241). 3. Собственные значе- ния компактного оператора (244). 4. Компактные операторы в гиль- бертовом пространстве (245). 5. Самосопряженные компактные операторы в И (246). Глава V Мера, измеримые функции, интеграл § 1. Мера плоских множеств........................................251 1. Мера элементарных множеств (251). 2. Лебегова мера плоских множеств (256). 3. Некоторые дополнения и обобщения (262). § 2. Общее понятие меры. Продолжение меры с полукольца на кольцо. Аддитивность и а-аддитивность ............................... 265 1. Определение меры (265). 2. Продолжение меры с полукольца на порожденное им кольцо (266). 3. а-аддитивность (268). § 3. Лебегово продолжение меры....................................271 1. Лебегово продолжение меры, определенной на полукольце с единицей (271). 2. Продолжение меры, заданной на полукольце без единицы (274). 3. Расширение понятия измеримости в случае о-конечной меры (276). 4. Продолжение меры по Жордану (279). 5. Однозначность продолжения меры (280). .
6 ОГЛАВЛЕНИЕ § 4. Измеримые функции............................................282 1. Определение и основные свойства измеримых функций (282). 2. Действия над измеримыми функциями (283). 3. Эквивалент- ность (285). 4. Сходимость почти всюду (286). 5. Теорема Его- рова (287). 6. Сходимость по мере (288). 7. Теорема Лузина. С-свой- ство (291). § 5. Интеграл Лебега..............................................291 1. Простые функции (292). 2. Интеграл Лебега для простых функ- ций (292). 3. Общее определение интеграла Лебега иа множестве конечной меры (294). 4. о-аддитивность и абсолютная непрерывность интеграла Лебега (298). 5. Предельный переход под знаком интег- рала Лебега (302). 6. Интеграл Лебега по множеству бесконечной меры (306). 7. Сравнение интеграла Лебега с интегралом Ри- мана (307). § 6. Прямые произведения систем множеств и мер. Теорема Фубини 310 1. Произведения систем множеств (310). 2. Произведения мер (312). 3. Выражение плоской меры через интеграл линейной меры сече- ний и геометрическое определение интеграла Лебега (314). 4. Тео- рема Фубини (316). Глава VI Неопределенный интеграл Лебега. Теория дифференцирования § 1. Монотонные функции. Дифференцируемость интеграла по верхнему пределу..............................................ь..........321 1. Основные свойства монотонных функций (321). 2. Дифференци- руемость монотонной функции (324). 3. Производная интеграла по верхнему пределу (331). § 2. Функции с ограниченным изменением..............,. .,.......332 § 3. Производная неопределенного интеграла Лебега............. 337“ § 4. Восстановление функции по ее производной. Абсолютно непрерыв- ные функции................................................... 339' § 5. Интеграл Лебега как функция множества. Теорема Радона—Никодима 349> 1. Заряды. Разложение Хана и разложение Жордана (349). 2. Основные типы зарядов (352). 3. Абсолютно непрерывные за- ряды. Теорема Радона — Никодима (353). § 6. Интеграл Стилтьеса.........................................35& 1. Меры Стилтьеса (356). 2. Интеграл Лебега — Стилтьеса (358). 3. Некоторые применения интеграла Лебега — Стилтьеса в теории вероятностей (360). 4. Интеграл Римана — Стилтьеса (362). 5. Пре- дельный переход под знаком интеграла Стилтьеса (366). 6. Общий вид линейных непрерывных функционалов в пространстве непрерыв- ных функций (369). Глава VII Пространства суммируемых функций § 1. Пространство Lt............................................... 375 1. Определение и основные свойства пространства Li (375). 2. Всюду плотные множества в Lt (377). § 2. Пространство L2.............................................. 380 1. Определение и основные свойства (380). 2. Случай бесконечной меры (384). 3. Всюду плотные множества в L2. Теорема об изомор- физме (385). 4. Комплексное пространство L2 (387). 5. Сходимость в среднем квадратичном н ее связь с другими типами сходимости функциональных последовательностей (387).
ОГЛАВЛЕНИЕ 7 3. Ортогональные системы функций в L2. Ряды по ортогональным системам........................................................389 1. Тригонометрическая система. Тригонометрический ряд Фурье (390). 2. Тригонометрические системы иа отрезке (0, л] (393). 3. Ряд Фурье в комплексной форме (394). 4. Многочлены Лежандра (395). 5. Ортогональные системы в произведениях. Кратные ряды Фурье (397). 6. Многочлены, ортогональные относительно данного веса (399). 7. Ортогональный базис в пространствах £2 (—оо, оо) и L2(0, оо). (401). 8. Ортогональные многочлены с дискретным весом (402). 9. Системы Хаара и Радемахера — Уолша (404). Глава VIII Тригонометрические ряды. Преобразование Фурье § 1. Условия сходимости ряда Фурье................................406 1. Достаточные условия сходимости ряда Фурье в точке (406). 2. Условия равномерной сходимости ряда Фурье (412). $ 2. Теорема Фейера...............................................415 1. Теорема Фейера (415). 2. Полнота тригонометрической системы. Теорема Вейерштрасса (418). 3. Теорема Фейера для пространства Lt (419). $ 3. Интеграл Фурье...............................................419 1. Основная теорема (419). 2. Интеграл Фурье в комплексной форме (422). $ 4. Преобразование Фурье, свойства и применения..................423 1. Преобразование Фурье и формула обращения (423). 2. Основ- ные свойства преобразования Фурье (427). 3. Полнота функций Эрмита и Лагерра (431). 4. Преобразование Фурье быстро убываю- щих бесконечно дифференцируемых функций (431). 5. Преобразо- вание Фурье и свертка функций (432). 6. Применение преобразова- ния Фурье к решению уравнения теплопроводности (433). 7. Пре- образование Фурье функций нескольких переменных (435). § 5. Преобразование Фурье в пространстве Т2 (—оо, оо).......... 438 1. Теорема Планшереля (438). 2. Функции Эрмита (442). § 6. Преобразование Лапласа.....................................445 1. Определение и основные свойства преобразования Лапласа (445). 2. Применение преобразования Лапласа к решению дифференциаль- ных уравнений (операторный метод) (446). §7. Преобразование Фурье — Стилтьеса.............................448 1. Определение преобразования Фурье — Стилтьеса (448). 2. При- менения преобразования Фурье — Стилтьеса в теории вероятно- стей (450). $ 8. Преобразование Фурье обобщенных функций.....................452 Глава IX Линейные интегральные уравнения $ 1. Основные определения. Некоторые задачи, приводящие к интег- ральным уравнениям . , , ...................................456 1. Типы интегральных уравнений (456). 2. Примеры задач, приводя- щих к интегральным уравнениям (457). $ 2. Интегральные уравнения Фредгольма...........................460 1. Интегральный оператор Фредгольма (460). 2. Уравнения с сим- метрическим ядром (463). 3. Теоремы Фредгольма. Случай вырож- денных ядер (465). 4. Теоремы Фредгольма для уравнений с произ- вольными ядрами (467). 5. Уравнения Вольтерра (472). 6. Интег- ральные уравнения первого рода (473).
8 ОГЛАВЛЕНИЕ § 3. Интегральные уравнения, содержащие параметр. Метод Фред- гольма .........................................................474 1. Спектр компактного оператора в Н (474). 2. Отыскание реше- ния в виде ряда по степеням Л. Детерминанты Фредгольма (475). Глава X Элементы дифференциального исчисления в линейных пространствах § 1. Дифференцирование в линейных пространствах................480 1. Сильный дифференциал (дифференциал Фреше) (489). 2. Слабый дифференциал (дифференциал Гато) (482). 3. Формула конечных приращений (482). 4. Связь между слабой и сильной дифференци- руемостью (483). 5. Дифференцируемые функционалы (485). 6. Абст- рактные функции (485). 7. Интеграл (485). 8. Производные высших порядков (488). 9. Дифференциалы высших порядков (491). 10. Фор- мула Тейлора (491). § 2. Теорема о неявной функции и некоторые ее применения.......492 1. Теорема о неявной функции (492). 2. Теорема о зависимости решения дифференциального уравнения от начальных данных (495). 3. Касательные многообразия. Теорема Люстерника (496). § 3. Экстремальные задачи......................................499 1. Необходимое условие экстремума (500). 2. Второй дифференциал. Достаточные условия экстремума функционала (593). 3. Экстремаль- ные задачи с ограничениями (506). § 4. Метод Ньютона.............................................508 Дополнение Банаховы алгебры § 1. Определение и примеры банаховых алгебр....................518 1. Банаховы алгебры, изоморфизмы банаховых алгебр (513). 2. При- меры банаховых алгебр (514). 3. Максимальные идеалы (515). § 2. Спектр и резольвента.....................................516. 1. Определения и примеры (516). 2. Свойства спектра (517). 3. Тео- рема о спектральном радиусе (519). § 3. Некоторые вспомогательные результаты......................529 1. Теорема о фактор-алгебре (520). 2. Три леммы (521). § 4. Основные теоремы........................................ 521 1. Линейные непрерывные мультипликативные функционалы и мак- симальные идеалы (521). 2. Топология во множестве Л. Основные теоремы (523). 3. Теорема Винера; упражнения (525). Литература.....................................................529 Распределение литературы по главам ............................539 Предметный указатель...........................................531
ПРЕДИСЛОВИЕ К ЧЕТВЕРТОМУ ИЗДАНИЮ Это издание выходит уже после смерти Сергея Васильевича Фомина. Он успел, однако, проделать всю основную работу по усовершенствованию книги. Существенно переработана десятая глава. В ней добавлен параграф, посвященный теореме о неяв- ной функции и изменен параграф «Экстремальные задачи». Эти изменения повлекли за собой необходимость изменений в четвер- той главе (следствия из теоремы Хана — Банаха и теоремы Ба- наха об обратном операторе). Текст книги был просмотрен В. М. Алексеевым и В. М. Ти- хомировым, которым я выражаю искреннюю благодарность. А. Колмогоров
ИЗ ПРЕДИСЛОВИЯ КО ВТОРОМУ ИЗДАНИЮ Первое издание «Элементов теории функций и функциональ- ного анализа» вышло двумя отдельными выпусками в 1954 к 1960 годах. Появление этих выпусков было связано с включе- нием в конце 40-х годов в программу механико-математического факультета МГУ курса «Анализ III», объединявшего элементы теории меры и теории функций, интегральные уравнения, сведе- ния из функционального анализа, а позже и вариационное ис- числение. Этот курс, читавшийся в МГУ сперва А. Н. Колмого- ровым, а потом и другими лекторами, в том числе С. В. Фоми- ным, вошел в дальнейшем в программы и других университетов. В свое время замена в МГУ отдельных курсов теории функ- ций действительного переменного, интегральных уравнений и вариационного исчисления единым курсом «Анализ III» вызвала большие споры. Перед курсом была поставлена задача приучить студентов к двойному зрению: с одной стороны, следить за внут- ренней логикой развития теории множеств, общей теории непре- рывных отображений метрических и топологических пространств,, линейных пространств и функционалов и операторов на них, чи- стой теории меры и интегрирования в общих «пространствах с мерой», с другой, —не упускать из виду обслуживаемую этими более абстрактными областями математики проблематику клас- сического и даже прикладного анализа. При решении этой задачи мы в планировке книги отдаем- предпочтение абстрактной линии построения курса. От общей теории множеств (глава I) можно перейти к метрическим и то- пологическим пространствам и их непрерывным отображениям- (глава II) либо непосредственно к пространствам с мерой (без топологии) и интегрированию в них (глава V). В главах III и IV изучаются линейные пространства и линейные функционалы и операторы в них. От этих глав возможен прямой переход к гла- ве X (нелинейные дифференцируемые операторы и функцио- налы). В главе VII изучаются линейные пространства суммируе- мых функций. Лишь в главах VI и VIII внимание, по существу, сосредоточено на функциях действительного переменного.
ИЗ ПРЕДИСЛОВИЯ КО ВТОРОМУ ИЗДАНИЮ 11 Хотя в первую очередь в нашей книге излагаются общие по- нятия теории функций и функционального анализа, внимание к примыкающей сюда классической проблематике читатель может проследить почти во всех главах. Включение в книгу глав VI (теория дифференцирования), VIII (тригонометрические ряды и пнтеграл Фурье) и IX (линейные интегральные уравнения) при- водит к тому, что сейчас наша книга охватывает всю программу принятого в МГУ курса «Анализ III», кроме вариационного ис- числения. Мы не включили этот раздел в нашу книгу, ограничив- шись лишь изложением в главе X самых первых представлений о нелинейном функциональном анализе. В новом издании, как и в первоначальном, значительное ме- сто занимает-общая теория меры. В последнее время появилось довольно много изложений теории интегрирования, основанной на схеме Даниеля, не использующей аппарата теории меры. Мы полагаем, однако, что теория меры достаточно важна и сама по себе, независимо от введения понятия интеграла, и заслуживает включения в университетский курс. Включение новых глав заметно увеличило объем книги. Ста- рые главы тоже существенно переработаны и в них включены новые параграфы (например, о порядковых типах и трансфинит- ных числах, топологических пространствах, обобщенных функ- циях и др.). Перерабатывая нашу книгу и включая в нее новые разделы, мы старались, однако, сохранить в ней тот сравнительно эле- ментарный стиль изложения, который был выдержан, как нам кажется, в первом издании. Мы надеемся, что она найдет свое естественное место в университетском преподавании наряду с другими руководствами, в частности, с книгой Г. Е. Шилова «Математический анализ, специальный курс», в которой более подчеркнута аналитическая сторона дела, а интерес к метриче- ским и топологическим пространствам, мерам и т. д. как само- стоятельным объектам культивируется в меньшей степени. А. Колмогоров С. Фомин
ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ При подготовке нового издания мы сохранили общий план книги и постарались не увеличивать ее объем. Вместе с тем весь текст книги был заново просмотрен и отредактирован. Большую помощь в этой работе нам оказал Ф. В. Широков. В главах I и IV сделаны некоторые перестановки и изменения, облегчающие,, на наш взгляд, переход от более простых понятий к более слож- ным (например, от банаховых пространств к более общим в гл. IV). Довольно существенно переработано изложение теории меры (гл. V). В последние годы в курс «Анализ III» часто включаются эле- менты теории банаховых алгебр и спектрального анализа. По- этому мы сочли целесообразным включить в нашу книгу напи- санное В. М. Тихомировым дополнение, посвященное этим во- просам. А. Колмогоров С. Фомин
ГЛАВА I ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ § 1. Понятие множества. Операции над множествами 1. Основные определения. В математике встречаются самые разнообразные множества. Можно говорить о множестве граней многогранника, точек на прямой, множестве натуральных чисел и т. д. Понятие множества настолько общее, что трудно дать ему какое-либо определение, которое не сводилось бы просто к замене слова «множество» его синонимами: совокупность, собра- ние элементов и т. п. Роль, которую понятие множества играет в современной ма- тематике, определяется не только тем, что сама теория множеств стала в настоящее время весьма обширной и содержательной дисциплиной, но главным образом тем влиянием, которое теория множеств, возникшая в конце прошлого столетия, оказывала и оказывает на всю математику в целом. Не ставя своей задачей сколько-нибудь полное изложение этой теории, мы здесь лишь введем основные обозначения и приведем первоначальные теоре- тико-множественные понятия, используемые в дальнейшем. Множества мы будем обозначать прописными буквами А, В, ..., а их элементы — малыми а, Ь, ... Утверждение «эле- мент а принадлежит множеству А» символически записывается так: а е А (или А э а); запись а ф А (или А а) означает, что элемент а не принадлежит А. Если все элементы, из которых со- стоит А, входят и в В (причем случай А — В не исключается), то мы называем А подмножеством множества В и пишем А с В. Например, целые числа образуют подмножество в множестве всех действительных чисел. Иногда мы не знаем заранее, содержит ли некое множество (например, множество корней данного уравнения) хотя бы один элемент. Поэтому целесообразно ввести понятие пустого множе- ства, т. е. множества, не содержащего ни одного элемента. Мы будем обозначать его символом 0. Любое множество содержит 0 в качестве подмножества. Подмножества некоторого множе- ства, отличные от него самого и от 0, называются собствен- ными. 2. Операции над множествами. Пусть А и В — произвольные Множества; их суммой, или объединением С — A U В называется
14 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. I множество, состоящее из всех элементов, принадлежащих хотя бы одному из множеств А и В (рис. 1). Аналогично определяется сумма любого (конечного или бесконечного) числа множеств: если Аа — произвольные множе- ства, то их сумма (J Аа есть совокупность элементов, каждый а из которых принадлежит хотя бы одному из множеств Аа. Назовем пересечением С = А П В множеств Л и В множе- ство, состоящее из всех элементов, принадлежащих как А, так Рис. 1. А В £=А"В Рис. 2. и В (рис. 2). Например, пересечение множества всех четных чи- сел и множества всех чисел, делящихся на три, состоит из всех целых чисел, делящихся без остатка на шесть. Пересечением любого (конечного или бесконечного) числа множеств Аа на- зывается совокупность П Аа элементов, принадлежащих ка- а ждому из множеств Аа. Операции сложения и пересечения множеств по самому сво- ему определению коммутативны и ассоциативны, т. е. AUB = BUA, G4-UB)UC = AU (В UС), АПВ = ВПА, (АПВ) ПС = Af) (В П С). Кроме того, они взаимно дистрибутивны: (АиВ)ПС = (АПС)и(ВПС), (1) (А п в) и С = (А и с) п (В и с). (2) Действительно, проверим, например, первое из этих ра- венств1). Пусть элемент х принадлежит множеству, стоящему в левой части равенства (1), т. е. х е (A U В) Г) С. Это означает, что х входит в С и, кроме того, по крайней мере в одно из мно- жеств А или В. Но тогда х принадлежит хотя бы одному из мно- жеств А П С или В П С, т. е. входит в правую часть рассматри- ваемого равенства. Обратно, пусть хе(Л П С) U (В П С). Тогда ’) Равенство двух множеств А = В понимается как тождественное ра- венство, т. е. оно означает, что каждый элемент множества А принадлежит В, и наоборот. Иначе говоря, равенство А = В равносильно тому, что вы- полнены оба включения: А с. В и В с. А.
I 1] ПОНЯТИЕ МНОЖЕСТВА ОПЕРАЦИИ НАД МНОЖЕСТВАМИ 15 хеД П С или хеВРС. Следовательно, хеС и, кроме того, X входит в А или В, т. е. xe,4UB. Таким образом, хе(Я U В) П С. Равенство (1) доказано. Аналогично проверяет- ся равенство (2). Определим для множеств операцию вычитания. Мы назовем разностью С = А \ В множеств А и В совокупность тех элемен- тов из А, которые не содержатся в В (рис. 3). При этом, вообще Рис. 3. Рис. 4. говоря, не предполагается, что А В. Вместо А \ В иногда пи- шут А — В. Иногда (например, в теории меры) удобно рассматривать так называемую симметрическую разность двух множеств А и В, ко- торая определяется как сумма разностей А \ В и В \ А (рис. 4). Симметрическую разность С множеств А и В мы будем обозна- чать символом А Л В. Таким образом, по определению, АДВ = (А\В)и(В\А). Упражнение. Показать, что А А В = (A (J В) \ (А П В). Часто приходится рассматривать тот или иной запас мно- жеств, являющихся подмножествами некоторого основного мно- жества S, например, различные множества точек на числовой прямой. В этом случае разность S \ А называют дополнением множества А и обозначают СА или А'. В теории множеств и ее приложениях весьма важную роль играет так называемый принцип двойственности, кото- рый основан на следующих двух соотношениях: 1. Дополнение суммы равно пересечению дополнений s\U Aa=A(s\4). (3) a a 2. Дополнение пересечения равно сумме дополнений S\AAe=U(S\Aa). (4) a a
16 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ (ГЛ. I Принцип двойственности состоит в том, что из любого равен- ства, относящегося к системе подмножеств фиксированного мно- жества S, совершенно автоматически может быть по- лучено другое — двойственное — равенство путем замены всех рассматриваемых множеств их дополнениями, сумм множеств — пересечениями, а пересечений — суммами. Примером использо- вания этого принципа может служить вывод теоремы 3' из тео- ремы 3 § 2 гл. II. Приведем доказательство соотношения (3). Пусть х е S \ U Аа. Это означает, что х не входит в объеди- а пение U а> т- е- не входит ни в одно из множеств Аа. Следова- а тельно, х принадлежит каждому из дополнений-S \ Аа и потому х i= Р| (S \ Аа). Обратно, пусть х е П (S \ Аа), т. е. х входит а а в каждое S \ Аа; тогда х не входит ни в одно из множеств Аа, т. е. не принадлежит их сумме U Аа, а тогда х е S\U4- Ра- а а венство (3) доказано. Соотношение (4) доказывается аналогично. (Проведите доказательство.) Название «симметрическая разность» для операции Л Д В не совсем удачно; эта операция во многом аналогична операции взятия суммы мно- жеств ЛОВ. Действительно, ЛОВ означает, что мы связываем неисключаю- щим «или» два утверждения: «элемент принадлежит Л» и «элемент принад- лежит В», а Л Д В означает, что те же самые два утверждения связываются исключающим «или»: элемент х принадлежит Л Д В тогда и только тогда, когда он принадлежит либо только А, либо только В. Множество Л Д В можно было бы назвать «суммой по модулю два» множеств Л и В (берется объединение этих двух множеств, но элементы, которые при этом встречают- ся дважды, выбрасываются). § 2. Отображения. Разбиения на классы I. Отображение множеств. Общее понятие функции. В ана- лизе понятие функции вводится следующим образом. Пусть X — некоторое множество на числовой прямой. Говорят, что на этом множестве определена функция f, если каждому числу х^Х поставлено в соответствие определенное число y — f(x). При этом X называется областью определения данной функции, а У — совокупность всех значений, принимаемых этой функ- цией, — ее областью значений. Если же вместо числовых рассматривать множества какой угодно природы, то мы придем к самому общему понятию функ- ции. Пусть М и W— два произвольных множества. Говорят, что на М определена функция f, принимающая значения из IV, если каждому элементу х е М поставлен в соответствие один и толь- ко один элемент у из N. Для множеств произвольной природы (как, впрочем, и в случае числовых множеств) вместо термина
J 2) ОТОБРАЖЕНИЯ. РАЗБИЕНИЯ НА КЛАССЫ 17 «функция» часто пользуются термином «отображение», говоря об отображении одного множества в другое. При специализации природы множеств М и N возникают специальные типы функ- ций, которые носят особые названия «вектор-функция», «мера», «функционал», «оператор» и т. д. Мы столкнемся с ними в даль- нейшем. Для обозначения функции (отображения) из М в N мы бу- дем часто пользоваться записью f: М -> N. Если а — элемент из М, то отвечающий ему элемент b—f(a) из N называется его образом (при отображении f). Совокупность всех тех элементов а из М, образом которых является данный элемент b е N, .называется прообразом (или, точнее полным прообразом) элемента b и обозначается f~l(b). Пусть А — некоторое множество из Л1; совокупность У(а):аеА} всех элементов вида f(a), где ае<4, называется образом А и обозначается f(A). В свою очередь для каждого множества В из N определяется его (полный!) прообраз f~'(B), а именно: f~'(B) есть совокупность всех тех элементов из М, об- разы которых принадлежат В. Может оказаться, что ни один элемент b из В не имеет непустого прообраза, тогда и прообраз /-1(В) будет пустым множеством. Здесь мы ограничимся рассмотрением самых общих свойств отображений. Введем следующую терминологию. Мы будем говорить, что f есть отображение множества М «на» множество N, если f(M) — = N-, такое отображение называют также сюръекцией. В общем случае, т. е. когда f(M)cs N, говорят, что f есть отображение М «в» N. Если для любых двух различных элементов Х| и х? из М их образы у\ = f(xj) и z/2 = [(хг) также различны, то f называется инъекцией. Отображение f : М -> N, которое одновременно яв- ляется сюръекцией и инъекцией, называется биекцией или взаимно однозначным соответствием между М и N. Установим основные свойства отображений. Теорема 1. Прообраз суммы двух множеств равен сумме их прообразов: Г1 (А и в) = г' (А) и Г1 (В). Доказательство. Пусть элемент х принадлежит множе- ству f~l (A U В). Это означает, что f(x)e A U В, т. е. f(x)e.4 или f(x)^B. Но тогда х принадлежит по крайней мере одному из множеств f-1(А) или /-1(В),т. е. xef-1(A)U f-1 (В). Обратно, если xef-1(A) и /-1(В), то х принадлежит по крайней мере од- ному из множеств f~l(A) и f~'(B), т. е. f(x) принадлежит хотя бы одному из множеств А или В, следовательно, f(x)^A (J В, но тогда xef-1(A U В).
18 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. Г Теорема 2. Прообраз пересечения двух множеств равен пе- ресечению их прообразов: Г1(АПВ) = Г1(А)ПГ1(В). Доказательство. Если х е f~l (A Q В), то f (х) е А (] Вг т. е. f (х) sA и f (х) е В, следовательно, х е /-1 (А) и хе f (В), т. е. хе/-’(А)ПГ'(В). Обратно, если хе f 1 (А) П f '(В), т. е.хе/ '(А)ихе/ 1 (В), то /(х)еА и f (х) е В. Иначе говоря, f (х) е А (] В. Следова- тельно, хе/-1(АГ|В). Теоремы 1 и 2 остаются в силе для сумм и пересечений лю- бого (конечного или бесконечного) числа множеств так же, как и следующая теорема. Теорема 3. Образ суммы двух множеств равен сумме их образов: /(AUB) = /(A)U/(B). Доказательство. Если у е f (A U В), то это означает, что y = f(x), где х принадлежит по крайней мере одному из мно- жеств А и В. Следовательно, у = f (х)е f (A) U f(B). Обратно, если у е /(A) U f (В), то у — f(x), где х принадлежит по крайней мере одному из множеств А и В, т. е. х е A U В и, следователь- но, у = f(x)e= f(A U В). Заметим, что образ пересечения двух множеств, вообще го- воря, не совпадает с пересечением их образов. Например, пусть рассматриваемое отображение представляет собой проектирова- ние плоскости на ось х. Тогда отрезки О <^х «С 1, у — О, О^Сх^С 1, у= 1 не пересекаются, а в то же время их образы совпадают. Упражнение. Докажите, что прообраз дополнения равен дополнению прообраза. Верно ли аналогичное утверждение для образа дополнения? 2. Разбиение на классы. Отношения эквивалентности. В са- мых различных вопросах встречаются разбиения тех или иных множеств на попарно непересекающиеся подмножества. Напри- мер, плоскость (рассматриваемую как множество точек) можно разбить на прямые, параллельные оси х, трехмерное простран- ство можно представить как объединение концентрических сфер различных радиусов (начиная с г = 0), жителей данного города можно разбить на группы по их году рождения и т. п. Каждый раз, когда некоторое множество М представлено тем или иным способом как сумма своих попарно непересекающихся подмножеств, мы говорим о разбиении множества М на классы.
«2] ОТОБРАЖЕНИЯ. РАЗБИЕНИЯ НА КЛАССЫ 19 Обычно приходится иметь дело с разбиениями, построенными на базе того или иного признака, по которому элементы множе- ства М объединяются в классы. Например, множество всех тре- угольников на плоскости можно разбить на классы равных ме- жду собой или на классы равновеликих треугольников, все функции от х можно разбить на классы, собирая в один класс функции, принимающие в данной точке одинаковые значения, и т. д. Признаки, по которым элементы множества разбиваются на классы, могут быть самыми разнообразными. Но все же такой признак не вполне произволен. Предположим, например, что мы захотели бы разбить все действительные числа на классы, вклю- чая число b в тот же класс, что и число а, в том и только в том случае, когда b > а. Ясно, что никакого разбиения действитель- ных чисел на классы таким путем получить нельзя, так как если b > а, т. е. если b следует зачислить в тот же класс, что и а, то л < Ь, т. е. число а нельзя включить в тот же класс, что и Ь. Кроме того, так как .«не больше, чем само а, то а не должно по- пасть в один класс' с самим собой! Другой пример. Попробуем разбить точки плоскости на классы, относя две точки к одному классу в том и только том случае, когда расстояние между ними меньше 1. Ясно, что добиться этого нельзя, так как если рас- стояние от а до b меньше 1 и расстояние от b до с меньше 1, то это вовсе не означает, что расстояние от а до с меньше 1. Таким образом, зачисляя а в один класс с b, а b в один класс с с, мы получим, что в один и тот же класс могут попасть две точки, расстояние между которыми больше 1. Приведенные примеры подсказывают условия, при которых тот или иной признак действительно позволяет разбить элементы некоторого множества на классы. Пусть М — некоторое множество и пусть некоторые из пар (а, Ь) элементов этого множества являются «отмеченными»1). Дели (а, Ь)— «отмеченная» пара, то мы будем говорить, что эле- мент а связан с b отношением ср, и обозначать это символом а^Ь. Например, если имеется в виду разбиение треугольников на классы равновеликих, то а^Ь означает «треугольник а имеет ту же площадь, что и треугольник Ь». Данное отношение <р называется отношением эквивалентности, если оно обладает следующими свойствами: 1. Рефлексивность: а~а для любого элемента а е М. 2. Симметричность: если а ~Ь, то Ь~а. 3. Транзитивность: если а^Ь и Ь^с, то а.~с. ’) При этом элементы а и b берутся в определенном порядке, т. е. (а, Ь) и (Ь, а) — две, вообще говоря, различные пары.
20 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. [ Эти условия необходимы и достаточны для того, чтобы отно- шение ф (признак!) позволяло разбить множество М на классы. В самом деле, всякое разбиение данного множества на классы определяет между элементами этого множества некоторое отно- шение эквивалентности. Действительно, если а ~b означает «а находится в том же классе, что и Ь», то отношение ф будет, как легко проверить, рефлексивным, симметричным и транзи- тивным. Обратно, пусть ф — некоторое отношение эквивалентности между элементами множества М и Ка— класс элементов х из М, эквивалентных данному элементу а: х~а. В силу свойства рефлексивности элемент а сам принадлежит классу Ка- Пока- жем, что два класса Ка и Кь либо совпадают, либо не пересе- каются. Пусть некоторый элемент с принадлежит одновременно и Ка и Кь, т. е. с а и с~Ь. Тогда в силу симметричности а ~ с и в силу транзитивности «т6- (0 Если теперь х — произвольный элемент из Ка, т. е. х ~ а, то в силу (1) и свойства транзитивности х~Ь, т. е. х е Кь- Точно так же доказывается, что всякий элемент у е Кь вхо- дит в Ка- Таким образом, два класса Ка и Кь, имеющих хотя бы один общий элемент, совпадают между собой. Мы получили раз- биение множества М на классы по заданному отношению экви- валентности. Понятие разбиения множества на классы тесно связано с рас- смотренным в предыдущем пункте понятием отображения. Пусть f — отображение множества А в множество В. Собрав в один класс все те элементы из А, образы которых в В совпа- дают, мы получим, очевидно, некоторое разбиение множества А. Обратно, рассмотрим произвольное множество А и некоторое его разбиение на классы. Пусть В — совокупность тех классов, на которые разбито множество А. Ставя в соответствие каждому элементу а^А тот класс (т. е. тот элемент из В), к которому а. принадлежит, мы получим отображение множества А на множе- ство В. i Примеры. 1. Спроектируем плоскость ху на ось х. Прооб- разы точек оси х — вертикальные прямые. Следовательно, этому отображению отвечает разбиение плоскости на параллельные прямые. 2. Разобьем все точки трехмерного пространства на классы, объединив в один класс точки, равноудаленные от начала коор- динат. Каждый класс представляет собой сферу некоторого ра- диуса. Совокупность всех этих классов можно отождествить с множеством всех точек, лежащих на луче [0, оо). Итак, разбие-
$ 3] ЭКВИВАЛЕНТНОСТЬ МНОЖЕСТВ. ПОНЯТИЕ МОЩНОСТИ 2f нию трехмерного пространства на концентрические сферы отве- чает отображение этого пространства на полупрямую. 3. Объединим в один класс все действительные числа с оди- наковой дробной частью. Этому разбиению отвечает отображе- ние прямой линии на окружность единичной длины. Понятие эквивалентности является частным случаем более общего понятия бинарного отношения. Пусть М — произ- вольное множество. Обозначим через М X М или М2 совокуп- ность всех упорядоченных пар (а, Ь), где а, Ь^М. Говорят, что в М задано бинарное отношение <р, если в М2 выделено произ- вольное подмножество /?ц>. Точнее говоря, мы скажем, что эле- мент а находится в отношении <р к элементу b — обозначение acpft — в том и только том случае, когда пара (а, Ь) принадлежит /?.т. Примером бинарного отношения может служить отношение тождества е; именно, aeb в том и только том случае, если а — Ь; иначе говоря, это — отношение, задаваемое диагональю А в М X М, т. е. подмножеством пар вида (а, а). Ясно, что всякое отношение эквивалентности <р в некотором множестве М есть бинарное отношение, подчиненное следующим условиям: 1) Диагональ А принадлежит Rv (рефлексивность). 2) Если (а, 6)е/?ф, то и (b,a')^R,f (симметричность). 3) Если (а, Ь) е и (Ь, с) е /?<(, то и (а, с) е R$ (транзитив- ность) . Итак; эквивалентность — это бинарное отношение, удовлетво- ряющее условиям рефлексивности, транзитивности и симметрич- ности. В § 4 мы рассмотрим другой важный частный случай би- нарного отношения — частичную упорядоченность. § 3. Эквивалентность множеств. Понятие мощности множества 1. Конечные и бесконечные множества. Рассматривая раз- личные множества, мы замечаем, что иногда можно, если не фактически, то хотя бы примерно, указать число элементов в данном множестве. Таковы, например, множество всех вершин некоторого многогранника, множество всех простых чисел, не превосходящих данного числа, множество всех молекул воды на Земле и т. д. Каждое из этих множеств содержит конечное, хотя, быть может, и неизвестное нам число элементов. С другой сто- роны, существуют множества, состоящие из бесконечного числа элементов. Таково, например, множество всех натуральных чи- сел, множество всех точек на прямой, всех кругов на плоскости, всех многочленов с рациональными коэффициентами и т. д. При этом, говоря, что множество бесконечно, мы имеем в виду, что из него можно извлечь один элемент, два элемента и т. д., при- чем после каждого такого шага в этом множестве еще останутся элементы.
22 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. I Два конечных множества мы можем сравнивать по числу эле- ментов и судить, одинаково это число или же в одном из мно- жеств элементов больше, чем в другом. Спрашивается, можно ли подобным же образом сравнивать бесконечные множества? Иначе говоря, имеет ли смысл, например, вопрос о том, чего больше: кругов на плоскости или рациональных точек на пря- мой, функций, определенных на отрезке [0, 1], или прямых в про- странстве, и т. д.? Посмотрим, как мы сравниваем между собой два конечных множества. Можно, например, сосчитать число элементов в ка- ждом из них и, таким образом, эти два множества сравнить. Но можно поступить и иначе, именно, попытаться установить биек- цию, т. е. взаимно однозначное соответствие между элементами этих множеств, иначе говоря, такое соответствие, при котором каждому элементу одного множества отвечает один и только один элемент другого, и наоборот. Ясно, что взаимно однознач- ное соответствие между двумя конечными множествами можно установить тогда и только тогда, когда число элементов в них одинаково. Например, чтобы проверить, одинаково ли число сту- дентов в группе и стульев в аудитории, можно, не пересчитывая ни тех, ни других, посадить каждого студента на определенный стул. Если мест хватит всем и не останется ни одного лишнего стула, т. е. если будет установлена биекция между этими двумя множествами, то это и будет означать, что число элементов в них одинаково. Заметим теперь, что если первый способ (подсчет числа эле- ментов) годится лишь для сравнения конечных множеств, вто- рой (установление взаимно однозначного соответствия) приго- ден и для бесконечных. 2. Счетные множества. Простейшим среди бесконечных мно- жеств является множество натуральных чисел. Назовем счетным множеством всякое множество, элементы которого можно биек- тивно сопоставить со всеми натуральными числами. Иначе гово- ря, счетное множество — это такое множество, элементы которо- го можно занумеровать в бесконечную последовательность: •сц, а2, ..., ап, ... Приведем примеры счетных множеств. 1. Множество всех целых чисел. Установим соответствие ме- жду всеми целыми и всеми натуральными числами по следую- щей схеме: 0-1 1 -22..., 1 23 45..., вообще, неотрицательному числу п 0 сопоставим нечетное чис- ло 2п+1, а отрицательному п < 0 — четное число 2|п|: n«->2n-|- 1 при п^О, п *-> 2 \ п | при п < 0.
«3] ЭКВИВАЛЕНТНОСТЬ МНОЖЕСТВ. ПОНЯТИЕ МОЩНОСТИ 2J 2. Множество всех четных положительных чисел. Соответ- ствие очевидно: п -«-> 2п. 3. Множество 2, 4, 8, . .., 2П, ... степеней числа 2. Здесь со- ответствие также очевидно. Каждому числу 2П сопоставляется число п. 4. Рассмотрим более сложный пример, а именно,- покажем,, что множество всех рациональных чисел счетно. Каждое рацио- х нальное число однозначно записывается в виде несократимой дроби <x — plq, > 0. Назовем сумму |р| + q высотой рацио- нального числа а. Ясно, что число дробей с данной высотой п конечно. Например, высоту 1 имеет только число 0/1, высоту 2 — числа 1/1 и —1/1, высоту 3 — числа 2/1, 1/2, —2/1 и —1/2 и т. д. Будем нумеровать все рациональные числа по возрастанию вы- соты, т. е. сперва выпишем числа высоты 1, потом — числа вы- соты 2 и т. д. При этом всякое рациональное число получит не- который номер, т. е. будет установлено взаимно однозначное соответствие между всеми натуральными и всеми рациональны- ми числами. Бесконечное множество, не являющееся счетным, называется несчетным множеством. Установим некоторые общие свойства счетных множеств. 1. Всякое подмножество счетного множества конечно или счетно. Доказательство. Пусть А—счетное множество, а В — его подмножество. Занумеруем элементы множества A: aIt а2, ... ..., ап ... Пусть аЛ1, аП2, ... — те из них, которые входят в В. Если среди чисел пь п2, ... есть наибольшее, то В конечно, в. противном случае В счетно, поскольку его члены аП1, ап„.. . за- нумерованы числами 1,2,... 2. Сумма любого конечного или счетного множества счетных множеств есть снова счетное множество. Доказательство. Пусть Ль Л2, ... — счетные множества. Мы можем считать, что они попарно не пересекаются, так как иначе мы рассмотрели бы вместо них множества Ль Л2\Ль Лз\(Л1 U Л2), ... — каждое из которых не более чем счетно,— имеющие ту же самую сумму, что и множества Ль Л2, ... Все элементы множеств Ль Л2, ... можно записать в виде следую- щей бесконечной таблицы: Ян с12 а13 й|4 ... a2i Пи а23 а24 ... а31 а32 а33 °34 • • • Й41 Й42 Щ3 «44 . . .
24 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. I где в первой строке стоят элементы множества Alt во второй — элементы множества А2 и т. д. Занумеруем теперь все эти эле- менты «по диагоналям», т. е. за первый элемент примем а1Ь за второй Я12, за третий a2i и т. д., двигаясь в порядке, указанном стрелками на следующей таблице: «II —> «12 а13~* «14 «21 I «31 «22 «а «32 «33 «24 • £2’4 • «41 «42 «43 «44 • • • Ясно, что при этом каждый элемент каждого из множеств полу- чит определенный номер, т. е. будет установлено взаимно одно- значное соответствие между всеми элементами всех множеств Ay, А2, ... и всеми натуральными числами. Наше утверждение доказано. Упражнения. Доказать, что множество всех многочленов с ра- циональными коэффициентами счетно. 2. Число £ называется алгебраическим, если оно является корнем неко- торого многочлена с рациональными коэффициентами. Доказать, что множе- ство всех алгебраических чисел счетно. 3. Доказать, что множество всех рациональных интервалов (т. е. интер- валов с рациональными концами) на прямой счетно. 4. Доказать, что множество всех точек плоскости, имеющих рациональ- ные координаты, счетно. Указание. Воспользоваться свойством 2. 3. Всякое бесконечное множество содержит счетное подмно- жество. Доказательство. Пусть М — бесконечное множество. Выберем в нем произвольный элемент а\. Поскольку М беско- нечно, в нем найдется элемент а2, отличный от «|, затем найдет- ся элемент «3, отличный от «1 и от а2 и т. д. Продолжая этот процесс (который не может оборваться из-за «нехватки» эле- ментов, ибо М бесконечно), мы получаем счетное подмножество А = {а1; а2, ..., ап, ...} множества М. Предложение доказано. Это предложение показывает, что среди бесконечных мно- жеств счетные являются «самыми маленькими». Ниже мы выяс- ним, существуют ли несчетные бесконечные множества. 3. Эквивалентность множеств. Сравнивая те или иные беско- нечные множества с натуральным рядом, мы пришли к понятию счетного множества. Ясно, что множества можно сравнивать не только с множеством натуральных чисел; установление взаимно
5 3] ЭКВИВАЛЕНТНОСТЬ МНОЖЕСТВ. ПОНЯТИЕ МОЩНОСТИ 25 однозначного соответствия (биекции) позволяет сравнивать ме- жду собой любые два множества. Введем следующее опреде- ление. Определение. Два множества, М и N, называются экви- валентными (обозначение М ~ N), если между их элементами можно установить взаимно однозначное соответствие. Понятие эквивалентности применимо к любым множествам, как конечным, так и бесконечным. Два конечных множества эквивалентны между собой тогда (и только тогда), когда число элементов у них одинаково. Определение счетного множества можно теперь сформулировать следующим образом: множество называется счетным, если оно эквивалентно множеству нату- ральных чисел. Ясно, что два множества, эквивалентные тре- тьему, эквивалентны между собой; в частности, любые два счет- ных множества эквивалентны между собой. Примеры. 1. Множества точек на любых двух отрезках [а, 6] и [с, d] эквивалентны между собой. Из рис. 5 ясно, как установить между ними биекцию. Именно, точки р и q соответствуют друг другу, если они являют- ся проекциями одной и той же точки г вспомо- гательного отрезка ef. Рис. 6. 2. Множество всех точек на расширенной комплексной пло- скости эквивалентно множеству всех точек на сфере. Биекцию а »-> z можно установить, например, с помощью стереографиче- ской проекции (рис. 6). 3. Множество всех чисел в интервале (0, 1) эквивалентно множеству всех точек на прямой. Соответствие можно устано- вить, например, с помощью функции «/=4агс‘ех+т- Рассматривая примеры, приведенные здесь и в п. 2, можно заметить, что иногда бесконечное множество оказывается экви-
26 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ (ГЛ. I ^валентным своей истинной части. Например, натуральных чи- сел оказывается «столько же», сколько и всех целых или даже всех рациональных; на интервале (0, 1) «столько же» точек, сколько и на всей прямой, и т. д. Это явление характерно для бесконечных множеств. Действительно, в п. 2 (свойство 3) мы показали, что из всякого бесконечного множества М можно вы- брать счетное подмножество; пусть A=[at,a2, ..., ап, ...} та- кое подмножество. Разобьем его на два счетных подмножества А, = {аь «з, а5, ...} и А2 = {с2, а6, •••) и установим между А и At взаимно однозначное соответствие. Это соответствие можно затем продолжить до взаимно однознач- ного соответствия между множествами AU(A4\A) = A4 и Ai U (М \ А) = М \ А2, отнеся каждому элементу из М \ А сам этот элемент. Между тем множество М \ А2 не совпадает с М, т. е. является собственным подмножеством для М. Мы получаем, таким образом, следующее предложение: Всякое бесконечное множество эквивалентно некоторому сво- ему собственному подмножеству. Это свойство можно принять за определение бесконечного множества. Упражнение. Доказать, что если М — произвольное бесконечное множество и А счетно, то М ~ М U А. 4. Несчетность множества действительных чисел. В п. 2 мы привели примеры счетных множеств. Число этих примеров мож- но было бы увеличить. Кроме того, как мы показали, сумма ко- нечного или счетного числа счетных множеств снова есть счет- ное множество. Естественно возникает вопрос: а существуют ли вообще не- счетные множества? Положительный ответ на него дает следую- щая теорема. Теорема 1. Множество действительных чисел, заключенных между нулем и единицей, несчетно. Доказательство. Предположим, что дано какое-то счет- ное множество (всех или только некоторых) действительных чисел а, лежащих на отрезке [0, 1]: (Zj —0, Я. 1а12а13 • • • а1п • • •> Ct2 = О, fl2^22^23 • • • ®2а • • •> а3 = 0, а31а33а33 ... а3ге • • •, [ ап == 0, яП|С1а2(1п3 ... апп ..., (О
»3] ЭКВИВАЛЕНТНОСТЬ МНОЖЕСТВ. ПОНЯТИЕ МОЩНОСТИ 27 Здесь aih — k-я десятичная цифра числа ai. Построим дробь 0 = 0, Ь,Ь2 ... bn ... диагональной процедурой Кантора, а именно: за bi примем про- извольную цифру, не совпадающую с ап, за Ь2— произвольную Цифру, не совпадающую с а22, и т. д.; вообще, за Ьп примем про- извольную цифру, не совпадающую с апп. Эта десятичная дробь не может совпасть ни с одной дробью, содержащейся в переч- не (1). Действительно, от oci дробь 0 отличается по крайней мере первой цифрой, от аг — второй цифрой и т. д.; вообще, так как Ьп =# а.пп для всех п, то дробь 0 отлична от любой из дробей а,-, входящих в перечень (1). Таким образом, никакое счетное мно- жество действительных чисел, лежащих на отрезке [0, 1], не ис- черпывает этого отрезка. Приведенное доказательство содержит небольшой «обман». Дело в том, что некоторые числа (а именно, числа вида р/10«) могут быть записаны в виде десятичной дроби двумя способами: с бесконечным числом нулей или с бесконечным числом девяток; например, у = -^- = 0,5000 ... =0,4999 ... Таким образом, несовпадение двух десятичных дробей еще не гарантирует различия изображаемых ими чисел. Однако если дробь 0 строить осторожнее, так, чтобы она не содержала ни нулей, ни девяток, полагая, например, Ьп — 2, если апп — 1, и Ьп = 1, если апп =/= 1, то доказательство стано- вится вполне корректным. Упражнение. Показать, что числа, обладающие двумя различными десятичными разложениями, образуют счетное множество. Итак, отрезок [0, 1] дает пример несчетного множества. При- ведем некоторые примеры множеств, эквивалентных отрезку [0,1]. 1. Множество всех точек любого отрезка [а, Ь] или интервала (а, Ь). 2. Множество всех точек на прямой. 3. Множество всех точек плоскости, пространства, поверхно- сти сферы, трчек, лежащих внутри сферы, и т. д. 4. Множество всех прямых на плоскости. 5. Множество всех непрерывных функций одного или несколь- ких переменных. В случаях 1 и 2 доказательство не представляет труда (см. примеры 1 и 3 п. 3). В остальных случаях непосредствен- ное доказательство довольно сложно. Упражнение. Используя результаты этого пункта и упражнение 2 п. 2, доказать существование трансцендентных чисел, т. е. чисел, не являю- чцмгся алгебраическими.
28 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. I 5. Теорема Кантора—Бернштейна. Следующая теорема яв- ляется одной из основных в теории множеств. Теорема 2 (Кантор — Бернштейн). Пусть А и В — два произвольных множества. Если существуют взаимно одно- значное отображение f множества А на подмножество В1 мно- жества В и взаимно однозначное отображение g множества В на подмножество А[ множество А, то А и В эквивалентны. Доказательство. Не ограничивая общности, можно счи- тать, что А и В не пересекаются. Пусть х — произвольный эле- мент из А. Положим х = Хо и определим последовательность элементов {хп} следующим образом. Пусть элемент хп уже опре- делен. Тогда, если п четно, то за xn+i примем элемент из В, удо- влетворяющий условию g(xn+i) = Xn (если такой элемент суще- ствует), а если п нечетно, то хп-н — элемент из А, удовлетворяю- щий условию f(xn+i) = хп (если он существует). Возможны два случая. 1°. При некотором п элемента xn+i, удовлетворяющего ука- занным условиям, не существует. Число п называется порядком элемента х. 2°. Последовательность {хп} бесконечна '). Тогда х называет- ся элементом бесконечного порядка. Разобьем теперь А на три множества: Дв, состоящее из эле- ментов четного порядка, Ао — множество элементов нечетного порядка и А] — множество всех элементов бесконечного порядка. Разбив аналогичным образом множество В, заметим, что f ото- бражает Ае на Во и А/ на BIt a g~l отображает Ао на ВЕ. Итак, взаимно однозначное отображение т|>, совпадающее с f на Ае U А] и с g~l на Ао, есть взаимно однозначное отображение всего А на все В. 6. Понятие мощности множества. Если эквивалентны два ко- нечных множества, то они состоят из одного и того же числа элементов. Если же эквивалентные между собой множества М и N произвольны, то говорят, что М и N имеют одинаковую мощ- ность. Таким образом, мощность — это то общее, что есть у лю- бых двух эквивалентных между собой множеств. Для конечных множеств понятие мощности совпадает с привычным понятием числа элементов множества. Мощность множества натуральных чисел (т. е. любого счетного множества) обозначается символом «о (читается: «алеф нуль»). Про множества, эквивалентные мно- жеству всех действительных чисел отрезка [0, 1], говорят, что они имеют мощность континуума. Эта мощность обозначается символом с (или символом К). ’) При этом число различных элементов х„ может быть и конечно: они могут «зацикливаться», образуя бесконечную последовательность, содержа- щую лишь конечное число попарно различных элементов.
»3] ЭКВИВАЛЕНТНОСТЬ МНОЖЕСТВ ПОНЯТИЕ МОЩНОСТИ 29 Весьма глубокий вопрос о существовании мощностей, проме- жуточных между Ко и с, будет затронут ниже в § 4. Как пра- вило, бесконечные множества, встречающиеся в анализе, или счетны, или имеют мощность континуума. Для мощностей конечных множеств, т. е. для натуральных чисел кроме понятия равенства имеются также понятия «боль- ше» и «меньше». Попытаемся распространить эти последние на бесконечные мощности. Пусть А и В— два произвольных множества, а т(А) и т(В)— их мощности. Тогда логически возможны следующие случаи: 1. А эквивалентно некоторой части множества В, а В эквива- лентно некоторой части множества А. 2. А содержит некоторую часть, эквивалентную В, но в В нет части, эквивалентной А. 3. В содержит некоторую часть, эквивалентную Л, но в Л нет части, эквивалентной В. 4. Ни в одном из этих двух множеств нет части, эквивалент- ной другому. В первом случае множества Л и В в силу теоремы Кантора — Бернштейна эквивалентны между собой, т. е. т(А) — т(В). Во втором случае естественно считать, что т(А)>т(В), а в тре- тьем, что /п(Л)< т(В). Наконец, в четвертом случае нам при- шлось бы считать, что мощности множеств А и В несравнимы между собой. Но на самом деле этот случай невозможен! Это следует из теоремы Цермело, о которой речь будет идти в § 4. Итак, любые два множества А и В либо эквивалентны между собой (и тогда пг(А) — пг(В)), либо удовлетворяют одному из двух соотношений: пг(А) < пг(В) или пг(А) > пг(В). Мы отметили выше, что счетные множества — это «самые ма- ленькие» из бесконечных множеств, а затем показали, что суще- ствуют и бесконечные множества, бесконечность которых имеет более «высокий порядок»,—это множества мощности континуума. А существуют ли бесконечные мощности, превосходящие мощ- ность континуума? Вообще, существует ли какая-то «Наивыс- шая» мощность или нет? Оказывается, верна следующая теорема. Теорема 3. Пусть М — некоторое множество и пусть 9И — множество, элементами которого являются всевозможные под- множества множества М. Тогда имеет мощность большую, чем мощность исходного множества М. Доказательство. Легко видеть, что мощность m множе- ства не может быть меньше мощности пг исходного множе- ства М\ действительно, «одноэлементные» подмножества из М об- разуют в SDI часть, эквивалентную множеству М. Остается дока- зать, что мощности ш и пг не совпадают. Пусть между элементами и, Ь, ... множества М и какими-то элементами А, В, ... множе-
30 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. I ства 9И (т. е. какими-то подмножествами из А4) установлено взаимно однозначное соответствие а *-> А, b *-+ В, .. . Покажем, что оно наверняка не исчерпывает всего 9И. Имен- но, сконструируем такое множество X cz М, которому не соответ- ствует никакой элемент из М. Пусть X— совокупность элемен- тов из М, не входящих в те подмножества, которые им соответ- ствуют. Подробнее: если а *-*• А и ае<4, то элемент а мы не включаем в X, а если а иаф А, то мы включаем элемент а в X. Ясно, что X есть подмножество множества М, т. е. некото- рый элемент из 9И. Покажем, что подмножеству X не может со- ответствовать никакой элемент из М. Допустим, что такой эле- мент х X существует; посмотрим, будет ли он содержаться в X или нет? Пусть х^Х; но ведь по определению в X входит всякий элемент, не содержащийся в подмножестве, которое ему соответствует, следовательно, элемент х должен быть вклю- чен в X. Обратно, предположив, что х содержится в X, мы полу- чим, что хне может содержаться в X, так как в X включены только те элементы, которые не входят в соответствующие им подмножества. Итак, элемент х, отвечающий подмножеству X, должен одновременно и содержаться и не содержаться в X. От- сюда следует, что такого элемента вообще не существует, т. е. что взаимно однозначного соответствия между элементами мно- жества М и всеми его подмножествами установить нельзя. Тео- рема доказана. Итак, для любой мощности мы действительно можем по- строить множество большей мощности, затем еще большей и т. д., получая, таким образом, не ограниченную сверху шкалу мощностей. Замечание. Мощность множества обозначают симво- лом 2т, где т — мощность М. (Читатель легко поймет смысл этого обозначения, рассмотрев случай конечного М.) Таким об- разом, предыдущую теорему можно выразить неравенством т < 2т. В частности, при т = Ко получаем неравенство Ко < < 2s’. Покажем, что 2s’ — К, т. е. покажем, что мощность мно- жества всех подмножеств натурального ряда равна мощности континуума. Разобьем подмножества натурального ряда на два класса, и ®,— на те (класс 9|J), у которых дополнение бесконечно, и на те (класс ®), у которых оно конечно. К классу ® относится, в частности, сам натуральный ряд, ибо его дополнение пусто. Чис- ло подмножеств в классе ® счетно (доказать). Класс ® не влияет на мощность множества 9И = U ®. Между подмножествами класса и действительными числа- ми а из полусегмента [0, 1) можно установить взаимно одно-
4] УПОРЯДОЧЕННЫЕ МНОЖЕСТВА. ТРАНСФИНИТНЫЕ ЧИСЛА 31 лначное соответствие. Именно, сопоставим подмножеству А ее число а, 0 а < 1, с двоичным разложением ___ 61 | е2 | | 6П | а = —-T-gT-r ••• -глрг-г тде еп = 1 или 0 в зависимости от того, принадлежит ли п мно- жества А или нет. Проверку деталей предоставляем'читателю. Упражнение. Доказать, что совокупность всех числовых функций (или вообще функций, принимающих значения в множестве, содержащем не менее двух элементов), определенных на некотором множестве М, имеет мощ- ность большую, чем мощность множества М. Указание. Воспользоваться тем, что множество всех индикаторов, т. е. функций на М, принимающих только два значения, 0 и 1, эквивалентно мно- жеству всех подмножеств из М. § 4. Упорядоченные множества. Трансфинитные числа В этом параграфе изложен ряд понятий, связанных с идеей упорядоченности множеств. Мы ограничимся здесь самыми пер- воначальными сведениями; более подробное изложение можно найти в литературе, указанной в конце книги. 1. Частично упорядоченные множества. Пусть М — произ- вольное множество и ср — некоторое бинарное отношение в нем (определяемое некоторым множеством с: /ИХ М). Мы назо- вем это отношение частичной упорядоченностью, если оно удов- летворяет условиям: 1) рефлексивности: асра, 2) транзитивности: если acpb и йсрс, то асрс, 3) антисимметричности: если асрб и bqa, то а — Ь. Частичную упорядоченность принято обозначать символом Таким образом, запись а b означает, что пара (а, Ь) принад- лежит соответствующему множеству /?1р. Про элемент а при этом говорят, что он не превосходит b или что он подчинен Ь. Множество, в котором задана некоторая частичная упорядочен- ность, называется частично упорядоченным. Приведем примеры частично упорядоченных множеств. 1. Всякое множество можно тривиальным образом рассмат- ривать как частично упорядоченное, если положить в том и только том случае, когда а — Ь. Иначе говоря, за частичную упорядоченность всегда можно принять бинарное отношение то- ждества е. Этот пример не представляет, конечно, большого ин- тереса. 2. Пусть М — множество всех непрерывных функций на от- резке [а, р]. Положив g в том и только том случае, когда I (/) g(t) для всех t, а t р, мы получим, очевидно, частич- ную упорядоченность.
32 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. I 3. Множество всех подмножеств некоторого фиксированного множества частично упорядочено по включению: М, М2 озна- чает, что М] с: М2. 4. Множество всех натуральных чисел частично упорядочено, если а b означает «Ь делится без остатка на а». Пусть М— произвольное частично упорядоченное множество. В случае, когда а b и а #= Ь, мы будем пользоваться симво- лом <, т. е. писать а < b и говорить, что а меньше b или что а строго подчинено Ь. Наряду с записью а b мы будем поль- зоваться равносильной записью 6 а и говорить при этом, что b не меньше а (больше а, если b #= а) или что Ь следует за а. Элемент а называется максимальным, если из а b следует, что b — а. Элемент а называется минимальным, если из с<а следует, что с = а. Частично упорядоченное множество, для любых двух точек а, Ь кото- рого найдется следующая за ними точка с (а с, Ь с), называется направ- ленным. 2. Отображения, сохраняющие порядок. Пусть М и М' — два частично упорядоченных множества и пусть f есть отобра- жение М в М'. Мы скажем, что это отображение сохраняет по- рядок, если из а гС Ь, где a, b ge М, следует, f(a) f(b) (в М'). Отображение f называется изоморфизмом частично упорядочен- ных множеств М и М', если оно биективно, а соотношение f (а) f(b) выполнено в том и только том случае, когда а Ь. Сами множества М и М' называются при этом изоморфными ме- жду собой. Пусть, например, М есть множество натуральных чисел, ча- стично упорядоченное по «делимости» (см. пример 4 п. 1), а М' — то же самое множество, но упорядоченное естественным образом, т. е. так, что b а, если b — а — положительное число. Тогда отображение М на М', ставящее в соответствие каждому числу п его само, сохраняет порядок (но не является изомор- физмом). Отношение изоморфизма между частично упорядоченными множествами представляет собой, очевидно, отношение эквива- лентности (оно симметрично, транзитивно и рефлексивно). Сле- довательно, если у нас имеется какой-то запас1) частично упо- рядоченных множеств, то все эти множества можно разбить на классы изоморфных между собой. Ясно, что если нас интересует не природа элементов множества, а только имеющаяся в нем частичная упорядоченность, то два изоморфных между собой ча- ') Мы воздерживаемся от понятий вроде «все частично упорядоченные множества», так как они, подобно понятию «множество всех множеств», по существу, внутренне противоречивы и не могут быть включены в четкие ма- тематические концепции,
«<] УПОРЯДОЧЕННЫЕ МНОЖЕСТВА. ТРАНСФИНИТНЫЕ ЧИСЛА 33 стично упорядоченных множества можно рассматривать просто как тождественные. 3. Порядковые типы. Упорядоченные множества. Про изо- морфные между собой частично упорядоченные множества мы будем говорить, что они имеют один и тот же порядковый тип. Таким образом, порядковый тип — это то общее, что, присуще любым двум изоморфным между собой частично упорядоченным множествам, подобно тому как мощность — это то общее, что присуще эквивалентным между собой множествам (рассматри- ваемым независимо от какого бы то ни было отношения порядка в них). Пусть а и b — элементы частично упорядоченного множества. Может оказаться, что ни одно из соотношений а b и b а не имеет места. В этом случае элементы а и b называются не- сравнимыми. Таким образом, отношение порядка определено лишь для некоторых пар элементов, поэтому мы и говорим о частичной упорядоченности. Если же в частично упорядоченном множестве М несравнимых элементов нет, то множество М на- зывается упорядоченным (линейно упорядоченным, совершенно упорядоченным}. Итак, множество М упорядочено, если оно ча- стично упорядочено и если для любых двух различных элемен- тов a, b е М обязательно либо а < Ь, либо b < а. Ясно, что всякое подмножество упорядоченного множества само упорядочено. Множества, указанные в примерах 1—4 п. 1, являются лишь частично упорядоченными. Простейшими примерами линейно упорядоченных множеств могут служить натуральные числа, со- вокупность всех рациональных чисел, всех действительных чисел на отрезке [0, 1] и т. п. (с естественными отношениями «больше» и «меньше», которые в этих множествах имеются). Поскольку упорядоченность есть частный случай частичной упорядоченности, к упорядоченным множествам применимо по- нятие отображения, сохраняющего порядок, и, в частности, по- нятие изоморфизма. Поэтому можно говорить о порядковом типе упорядоченного множества. Ряд натуральных чисел 1, 2, 3, ... с естественным отношением порядка между его элементами пред- ставляет собой простейший пример бесконечного упорядоченного множества. Его порядковый тип принято обозначать символом со. Если два частично упорядоченных множества изоморфны ме- жДу собой, то они, конечно, имеют одинаковую мощность (изо- морфизм— это биекция), поэтому можно говорить о мощности, отвечающей данному порядковому типу (например, типу ш от- вечает мощность «о). Однако обратное неверно; множество дан- ной мощности может быть упорядочено, вообще говоря, многими разными способами. Лишь порядковый тип линейно упорядочен- ного конечного множества однозначно определяется числом п
34 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. I его элементов (и обозначается также через п). Уже для счетного множества натуральных чисел возможен, например, наряду с его «естественным» типом ш, такой тип: 1, 3, 5, .... 2, 4, 6, ..., т. е. такой, когда любое четное число следует за любым нечет- ным, а нечетные и четные числа между собой упорядочены по возрастанию. Можно показать, что число различных порядковых типов, отвечающих мощности Ко, бесконечно и даже несчетно. 4. Упорядоченная сумма упорядоченных множеств. Пусть TWj и М2— два непересекающихся упорядоченных множества с порядковыми типами 0! и 02. В объединении U Af2 множеств Mt и М2 можно ввести порядок, считая, что два элемента из М, упорядочены как в Mit два элемента из М2 упорядочены как в М2 и что всякий элемент из предшествует всякому элементу из М2. (Проверьте, что это действительно линейная упорядоченность!) Такое упорядоченное множество мы будем называть упорядоченной суммой множеств Мг и М2 и обозначать Мг М2. Подчеркнем, что здесь важен порядок слагаемых: сум- ма М2 + Mi не изоморфна, вообще говоря, сумме M1 + Af2. По- рядковый тип суммы Mi + М2 мы будем называть упорядочен- ной суммой порядковых типов 0] и 02 и обозначать 01 + 02. Это определение легко распространяется на произвольное ко- нечное число слагаемых 0Ь 02...0т. Пример. Рассмотрим порядковые типы шип. Легко ви- деть, что п + ш = ш; действительно, если мы к натуральному •ряду 1, 2, 3, ..., k, ... припишем слева конечное число членов, то мы получим тот же порядковый тип ш. В то же время поряд- ковый тип ш + п, т. е. порядковый тип множества 1, 2, 3, ... ... k, ..., ai, а2, ..., ап, не равен, очевидно, ш. 5. Вполне упорядоченные множества. Трансфинитные числа. Выше мы ввели понятия частичной упорядоченности и упорядо- ченности. Введем еще более узкое, но весьма важное понятие полной упорядоченности. Определение. Упорядоченное множество называется вполне упорядоченным, если каждое его непустое подмножество содержит наименьший (т. е. предшествующий всем элементам этого подмножества) элемент. Если упорядоченное множество конечно, то оно, очевидно, и вполне упорядочено. Примером упорядоченного, но не вполне упорядоченного множества может служить отрезок [0, 1]. Само это множество содержит наименьший элемент — число 0, но его подмножество, состоящее из положительных чисел, наи- меньшего элемента не содержит. Ясно, что всякое (непустое) подмножество вполне упорядо- ченного множества само вполне упорядочено.
•j 4] УПОРЯДОЧЕННЫЕ МНОЖЕСТВА. ТРАНСФИНИТНЫЕ ЧИСЛА 35 Порядковый тип вполне упорядоченного множества называют порядковым числом (трансфинитным порядковым числом или, короче трансфинитом, когда хотят подчеркнуть, что речь идет о бесконечном множестве). Натуральный ряд (с естественным отношением порядка) представляет собой множество не только упорядоченное, но и вполне упорядоченное. Таким образом, его порядковый тип со есть порядковое число (трансфинит!). Порядковым числом бу- дет и со 4- k, т. е. тип множества 1,2,... п, ..., alt а2, ..., ак. Напротив, множество .... — п, ..., — 3, — 2, - 1 ’ (1) ^упорядочено, но не вполне упорядочено. Здесь в каждом непу- стом подмножестве есть наибольший элемент (т. е. следующий "за всеми), но, вообще говоря, нет наименьшего (напоимер, наи- меньшего элемента нет во всем множестве (1)). Порядковый тип (не являющийся порядковым числом!) множества (1) при- нято обозначать символом оз*. Докажем следующий простой, но важный факт. Лемма 1. Упорядоченная сумма конечного числа вполне упорядоченных множеств есть вполне упорядоченное множество. В самом деле, пусть М— произвольное подмножество упоря- доченной суммы М\ + М2 + ... + Мп вполне упорядоченных мно- жеств; рассмотрим первое из множеств Mi<, содержащее эле- менты из М. Пересечение М П М’> является подмножеством вполне упорядоченного множества М^ и, значит, имеет первый элемент. Этот элемент будет первым элементом и всего М. Следствие. Упорядоченная сумма порядковых чисел яв- ляется порядковым числом. Мы можем, таким образом, отправляясь от некоторого за- паса порядковых чисел, строить новые порядковые числа. На- пример, отправляясь от натуральных чисел (т. е. конечных по- рядковых чисел) и порядкового числа со, можно получить по- рядковые числа со + п, со + со, со + со + п, со -ф со -ф со ит. д. Читатель легко построит вполне упорядоченные множества, от- вечающие этим трансфинитам. Наряду с упорядоченной суммой порядковых типов можно ввести упоря- доченное произведение. Пусть М\ и М2— множества, упорядоченные по типам 6, и 02. Возьмем много экземпляров множества Mi — по одному на каждый элемент М2—и заменим в множестве М2 его элементы этими экземплярами Mi. Полученное множество называется упорядоченным произведением AJi и
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. 1 -36 М2 и обозначается символом Afi-Af2. Формально Mi-M2 строится как множе- ство пар (а, Ь), где а е Mt и b е М2, причем (аь 6,) < (а2, Ь2), если (ч < 6, (при любых аь а2), и (ab Ь) < (а2, Ь), если ю < а2. Аналогично определяется упорядоченное произведение любого конечного числа сомножителей Л41-Л42 ... Мр. Порядковый тип 0 произведения М^-М, упорядоченных множеств называется произведением порядковых типов 0[ и 02: 0 = 0J02- Как и упорядоченная сумма, упорядоченное произведение некоммутативно. Лемма 2. Упорядоченное произведение двух вполне упорядоченных мно- жеств есть вполне упорядоченное множество. Доказательство. Пусть М — некоторое подмножество произведения Mi-M2; множество М есть множество пар (а, Ь). Рассмотрим все вторые эле- менты Ь пар, входящих в М. Они образуют некоторое подмножество в Л[2. В силу полной упорядоченности М2 это подмножество имеет первый элемент. Обозначим его 4>0.и рассмотрим все пары вида (а, Ьо), входящие в М. Их пер- вые элементы а образуют некоторое подмножество в М|. В силу полной упо- рядоченности Mi среди них имеется первый элемент. Обозначим его а0. Тогда пара (во, Ьо), как легко видеть, и будет первым элементом М. Следствие. Упорядоченное произведение порядковых чисел является порядковым числом. Примеры. Легко видеть, что <о + <о = <о 2, а + <о = <о -3. Легко также построить множества, упорядоченные по типам ton, а2, а2п, со2, ... ..., <ор, ... Все эти множества будут иметь счетную мощность. Можно определить и другие действия над порядковыми типами, напри- мер, возведение в степень, и ввести в рассмотрение такие порядковые числа, как, скажем, а“, а“Ш и т. д. 6. Сравнение порядковых чисел. Если п.\ и п2 — два конеч- ных порядковых числа, то они или совпадают, или одно из них больше другого. Распространим это отношение порядка на трансфинитные порядковые числа. Введем для этого следующие понятия. Всякий элемент а линейно упорядоченного множества М определяет начальный отрезок Р (совокупность элементов <а) и остаток Q (совокупность элементов ^а). Пусть а и р — два порядковых числа, а М и W— множества, типа аир соответственно. Мы скажем, что а = р, если множе- ства М и N изоморфны, что а < р, если М изоморфно какому- либо начальному отрезку множества N, и что а > р, если, обратно, W изоморфно начальному отрезку множества М. Теорема 1. Любые два порядковых числа аир связаны между собой одним и только одним из соотношений: а = р, а < р или а > р. Для доказательства установим прежде всего следующую лемму. Лемма 3. Если f — изоморфное отображение вполне упоря- доченного множества А на какое-либо его подмножество В, то f(a)^ а для всех а ее А. Действительно, если бы имелись такие элементы а ее А, что f(a)<Za, то среди них был бы первый (полная упорядочен-
J 4] УПОРЯДОЧЕННЫЕ МНОЖЕСТВА. ТРАНСФИНИТНЫЕ ЧИСЛА 37 ность!). Пусть это — элемент а0 и пусть Ьо = f(a0). Тогда Ьо < а0 и, поскольку f — изоморфизм, f(b0) < f(a0) = b0, т. е. а0 не был бы первым среди элементов с указанным свойством. Из этой леммы сразу же вытекает, что вполне упорядочен- ное множество не может быть изоморфно своему отрезку. Если бы А было изоморфно отрезку, определяемому элементом а, то выполнялось бы соотношение f(a) < а. Поэтому соотношения а = ₽иа<[}не могут иметь места одновременно. Аналогично не может быть одновременно a = р и a > р. Точно так же не- совместны соотношения a < р и а > р, так как иначе мы по- лучили бы (транзитивность!), что а < а, а это, как мы видели, невозможно. Итак, мы показали, что наличие одного из соотно- шений а = р исключает два остальных. Покажем теперь, что одно из этих соотношений всегда имеет место, т. е. что лю- бые два порядковых числа сравнимы. Сначала для каждого порядкового числа а построим множе- ство ^(а), служащее его «стандартным представителем». Имен- но, примем за №(а) множество всех порядковых чисел, мень- ших а. Числа, входящие в ^(а), все сравнимы между собой, а само множество №(а) (упорядоченное по величине порядко- вых чисел) имеет тип а. Действительно, если множество А = {..., а, .... Ь, ...} имеет тип а, то, по самому определению, порядковые числа, меньшие, чем а, взаимно однозначно отвечают начальным от- резкам множества А, а следовательно, и элементам этого мно- жества. Иначе говоря, элементы множества, имеющего тип а, можно перенумеровать с помощью порядковых чисел, мень- ших а: А = (а0, at, ..., ак, ...). Пусть теперь а и р — два порядковых числа; тогда А — = №(а) и В — №(Р) —множества типов аир соответственно. Пусть, далее, С = А П В — пересечение множеств А и В, т. е. совокупность порядковых чисел, меньших аир одновременно. Множество С вполне упорядочено; обозначим его тип у. Пока- жем, что у а. Действительно, если С = А, то у = а, если же С =/= А, то С есть отрезок множества А и тогда у < а. В самом деле, при всех С, г] ge А \ С числа g и г] сравнимы, т. е. g г]. Но соотношение г] < | < а невозможно, так как то- гда г] ge С. Итак, | < т], откуда и видно, что С есть отрезок мно- жества А и у < а. Кроме того, у есть первый элемент множе- ства А \ С. Итак, у=С а и аналогично у si р.
38 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ Г При этом случай у < а, у < р невозможен, так как тогда мы имели бы уеА\С, у ее В\С, т. е., с одной стороны, уф С, с другой стороны, у ее А П В = С. Следовательно, воз- можны лишь случаи у — а, у = р, а = р, у = а, у < р, а < р, у < а, у =Р, а> р, т. е. а и р сравнимы. Теорема полностью доказана. Каждому порядковому числу отвечает определенная мощ- ность, а из сравнимости порядковых чисел следует, очевидно, и сравнимость соответствующих мощностей. Поэтому: Если А и В — два вполне упорядоченных множества, то либо они эквивалентны между собой (равномощны), либо же мощ- ность одного из них больше, чем мощность другого (j. е. вполне упорядоченные множества не могут иметь несравнимых мощно- стей) . Рассмотрим совокупность всех порядковых чисел, отвечаю- щих конечной или счетной мощности. Они образуют впол- не упорядоченное множество. Нетрудно убедиться в том, что само это множество уже несчетно. Действительно, обозначим, в соответствии с общепринятой символикой, через <0i порядко- вый тип множества всех счетных трансфинитов. Если бы отве- чающая ему мощность была счетной, то счетным было бы и мно- жество, имеющее порядковый тип + 1. Вместе с тем число <щ следует, очевидно, за всеми трансфинитами, отвечающими ко- нечной или счетной мощности. Обозначим мощность, отвечающую порядковому трансфини- ту ан, символом Нр Легко видеть, что никаких мощностей т, удовлетворяющих неравенству К о < tn < Hi, нет. Действительно, если бы такая мощность т существовала, то в множестве 1Е(«ц) всех порядковых трансфинитов, пред- шествующих <01, имелось бы подмножество мощности т. Это подмножество вполне упорядочено и несчетно. Но тогда его по- рядковый тип а предшествовал бы <щ и в то же время следовал за всеми счетными трансфинитами. Мы получили бы противоре- чие с определением <o(. 7. Аксиома выбора, теорема Цермело и другие эквивалент- ные им утверждения. Сравнимость вполне упорядоченных мно- жеств по мощности подсказывает следующую постановку во- проса: нельзя ли всякое множество вполне упорядочить каким- либо образом? Положительный ответ означал бы, в частности,
$4] УПОРЯДОЧЕННЫЕ МНОЖЕСТВА. ТРАНСФИНИТНЫЕ ЧИСЛА 39 что несравнимых мощностей вообще не существует. Такой ответ дал Цермело, доказав, что каждое множество может быть впол- не упорядочено. Доказательство этой теоремы (мы не будем воспроизводить его здесь, см., например, [2]) существенно опи- рается на так называемую аксиому выбора, состоящую в сле- дующем. Пусть А — некоторое множество индексов а и пусть для каж- дого а задано некоторое произвольное множество Ма. Тогда, как утверждает аксиома выбора, можно построить функцию <р на А, относящую каждому аеЛ некоторый элемент пга из со- ответствующего множества Ма. Иными словами, можно соста- вить некоторое множество, выбрав из каждого Ма по одному и только одному элементу. Теория множеств в той форме, в которой мы ее излагаем, восходит к Кантору и Цермело и является «наивной» теорией множеств. Аксиома вы- бора, называемая также аксиомой Цермело, возникшая в рамках наивной теории множеств вместе с другими вопросами, такими, как континуум- гипотеза, т. е. вопрос о совпадении мощности континуума с первой не- счетной мощностью К], привела к многочисленным спорам и к длинной серии работ по математической логике и основаниям математики. Были построены аксиоматические теории множеств Гёделя — Бернайса и Цермело — Френ- келя. В рамках этих теорий была установлена непротиворечивость и незави- симость аксиомы выбора. Мы отсылаем читателя к специальным работам: А. Френкель и И. Бар-Хиллел, Основания теории множеств, «Мир», 1966; П. Дж. Коэн, Теория множеств и континуум-гипотеза, «Мир», 1969. Заметим, что отказ от аксиомы выбора существенно обедняет теоретико-мно- жественные построения. Вместе с тем критика наивной теории множеств и попытки обойтись без аксиомы выбора повели к созданию таких замечательных теорий, как теория рекурсивных функций, и таких понятий, как понятие вычислимого числа. Сформулируем некоторые предложения, каждое из которых эквивалентно аксиоме выбора (т. е. каждое из них может быть доказано, если принять аксиому выбора, и обратно, аксиому вы- • бора можно доказать, допустив справедливость какого-либо из этих предложений). Прежде всего ясно, что таким предложе- нием является сама теорема Цермело. Действительно, если пред- положить, что каждое из множеств Ма вполне упорядочено, то для построения функции ср, существование которой утверждается аксиомой выбора, достаточно в каждом Ма взять первый эле- мент. Для формулировки других предложений, эквивалентных аксиоме выбора, введем следующие понятия. Пусть М — частич- но упорядоченное множество. Всякое его подмножество А, в ко- тором любые два элемента сравнимы между собой (в смысле введенной в М частичной упорядоченности), будем называть цепью. Цепь называется максимальной, если она не содержится в качестве собственного подмножества ни в какой другой цепи, принадлежащей М. Далее, назовем в частично упорядоченном
40 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. Г множестве М элемент а верхней гранью подмножества М' cz М, если любой элемент а' <= М' подчинен а. Теорема Хаусдорфа. В частично упорядоченном мно- жестве всякая цепь содержится в некоторой его максималь- ной цепи. Следующее предложение представляет собой, пожалуй, наи- более удобную из всех формулировок, эквивалентных аксиоме выбора. Лемма Цорна. Если всякая цепь в частично упорядочен- ном множестве М имеет верхнюю грань, то всякий элемент из М подчинен некоторому максимальному. Доказательство равносильности всех приведенных утвержде- ний (аксиома выбора, теорема Цермело, теорема Хаусдорфа,. лемма Цорна) имеется, например, в книге А. Г. Курош, Лек- ции по общей алгебре, Физматгиз, 1962; см. также [8]. Мы не будем его здесь воспроизводить. Если множество верхних граней подмножества А имеет наименьший эле- мент а, то а называют точной верхней гранью подмножества Л; аналогично определяется точная нижняя грань. Частично упорядоченное множество, вся- кое непустое конечное подмножество которого обладает точной верхней гранью и точной нижней гранью, называется решеткой, или структурой. 8. Трансфинитная индукция. Широко распространенный ме- тод доказательства тех или иных утверждений — это метод мате- матической индукции. Он, как известно, состоит в следующем. Пусть имеется некоторое утверждение Р(п), которое формули- руется для каждого натурального числа п, и пусть известно, что: 1) утверждение Р(1) верно; 2) из того, что P(k) верно для всех k п, следует, что Р(п + 1) верно. Тогда утверждение Р(п) верно для всех п= 1, 2, ... Дей- ствительно, в противном случае среди тех п, для которых Р(п) неверно, нашлось бы наименьшее число^ скажем, Пр Очевидно, что «1 > 1, т. е. — 1 тоже натуральное число, и мы приходим к противоречию с условием 2). Аналогичный прием может быть использован с заменой на- турального ряда любым вполне упорядоченным мно- жеством. В этом случае он носит название трансфинитной ин- дукции. Таким образом, метод трансфинитной индукции состоит в следующем. Пусть дано некоторое вполне упорядоченное мно- жество А (если угодно, его можно считать множеством всех порядковых трансфинитов, меньших некоторого данного) и пусть Р(а)—некоторое утверждение, формулируемое для каждого ае/1и такое, что Р(а) верно для первого элемента из А и вер- но для а, если оно верно для всех элементов, предшествую- щих а. Тогда Р(а) верно для всех а е А. Действительно, если бы существовали элементы в А, для которых Р(а). не имеет
$5) СИСТЕМЫ МНОЖЕСТВ 41 места, то в множестве таких элементов нашелся бы первый, ска- жем, а*, и мы пришли бы к противоречию, поскольку для всех а < а* утверждение Р(а) было бы верно. Так как в силу теоремы Цермело всякое множество можно вполне упорядочить, трансфинитная индукция может быть, в принципе, применена к любому множеству. Однако практически бывает удобнее пользоваться заменяющей ее леммой Цорна, которая опирается лишь на наличие частично упорядоченности в рассматриваемом множестве. А некоторая частичная упоря- доченность рассматриваемых объектов в задачах, требующих лрименения леммы Цорна, обычно возникает естественным об- разом, «сама собой». § 5. Системы множеств ’) 1. Кольцо множеств. Системой множеств называется всякое множество, элементы которого сами представляют собой какие- либо множества. Если не оговорено противное, мы будем рас- сматривать системы таких множеств, каждое из которых яв- ляется подмножеством некоторого фиксированного множества X. Системы множеств мы будем обозначать прописными готиче- скими буквами. Основной интерес для нас будут представлять системы множеств, удовлетворяющие (по отношению к введен- ным в § 1 операциям) некоторым определенным условиям зам- кнутости. Определение 1. Непустая система множеств SR называет- ся кольцом, если она обладает тем свойством, что из А е SR и В е SR следует Л АВ е Я и Л П В е Я. Так как для любых А и В AUВ = (АДВ)Д(АПВ) и А\В = АД(АЛВ), то из Ае й и Вей вытекает также принадлежность к 9? мно- жеств A U В и А \ В. Таким образом, кольцо множеств есть си- стема множеств, замкнутая по отношению к взятию суммы и пересечения, вычитанию и образованию симметрической разно- сти. Очевидно, что кольцо замкнуто и по отношению к образо- ванию любых конечных сумм и пересечений вида С = U Ль D = A Ak. k=l fe=l Любое кольцо содержит пустое множество 0, так как всегда А \ А = 0. Система, состоящая только из пустого множества, представляет собой наименьшее возможное кольцо множеств. *) Рассматриваемые в этом параграфе понятия понадобятся нам в гл. V яри изложении общей теории меры. Поэтому чтение данного параграфа мо- жет быть отложено. Читатель, решивший ограничиться при изучении теории меры мерой на плоскости (§ 1 гл. V), может этот параграф пропустить совсем.
42 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ ,[ГЛ. I Множество Е называется единицей системы множеств <3, если оно принадлежит <3 и если для любого Ле® имеет место равенство Xf|£ = X. Таким образом, единица системы множеств © есть не что иное, как максимальное множество этой системы, содержащее все другие входящие в 3 множества. Кольцо множеств с единицей называется алгеброй множеств. Пр и меры. 1. Для любого множествах система 9Й(Х) всех его подмножеств представляет собой алгебру множеств с еди- ницей Е = А. 2. Для любого непустого множества А система {0, X}, со- стоящая из множества X и пустого множества 0, образует ал- гебру множеств с единицей Е = X. 3. Система всех конечных подмножеств произвольного мно- жества X представляет собой кольцо множеств. Это кольцо бу- дет алгеброй в том и только том случае, когда множество X само конечно. 4. Система всех ограниченных подмножеств числовой прямой является кольцом множеств, не содержащим единицы. Из определения кольца множеств непосредственно вытекает Теорема 1. Пересечение SR = Q 9ta любого множества ко- а лец есть кольцо. Установим следующий простой, но важный для дальнейшего факт. Теорема 2. Для любой непустой системы множеств 3 су- ществует одно и только одно кольцо 9i(3), содержащее $ и содержащееся в любом кольце 9?, содержащем 3. Доказательство. Легко видеть, что кольцо 9t(S) опре- деляется системой $ однозначно. Для доказательства его су- ществования рассмотрим объединение X = (J X всех мно- жеств X, входящих в 3, и кольцо 2R(X) всех подмножеств мно- жества X. Пусть 2 — совокупность всех колец множеств, содер- жащихся в 2R(X) и содержащих 3. Пересечение $= Q 9? всех 9) <= S этих колец и будет, очевидно, искомым кольцом 9i(3). Действительно, каково бы ни было кольцо 9?*, содержащее <S>r пересечение 9? = 9ft* f] 2R (X) будет кольцом из 2 и, следовательно, <5 cz 9i cz 9fi‘, т. е. ф действительно удовлетворяет требованию минимальности. Это кольцо называется минимальным кольцом над 3 или кольцом, порожденным 3, и обозначается 9i((3). 2. Полукольцо множеств. В ряде вопросов, например, в тео- рии меры наряду с понятием кольца важную роль играет более общее понятие полукольца множеств.
СИСТЕМЫ МНОЖЕСТВ 43 >51 Определение 2. Система множеств <5 называется полу- кольцом, если она содержит пустое множество 0„ замкнута по отношению к образованию пересечений и обладает тем свой- ством, что из принадлежности к <5 множеств А и AiCzA выте- п кает возможность представления А в виде А = J Ak, где Лл — fe=l попарно непересекающиеся множества из <5, первое из которых есть заданное множество At. В дальнейшем всякий набор попарно непересекающихся мно- жеств 711, А2, ..., Ап, объединение которых есть заданное мно- жество А, мы будем называть конечным разложением множе- ства А. Всякое кольцо множеств SR является полукольцом, так как если А и Ai cz. А входят в 9?, то имеет место разложение А = Ai U Л2, где А2 = А \ А{ s 9t. Примером полукольца, не являющегося кольцом множеств, может служить совокупность всех интервалов (а,Ь), отрезков [«,/?] и полуинтервалов [а, Ь) и (а, 6] на числовой прямой ’). Еще одним примером служит совокупность всех «полуоткрытых» пря- моугольников а <х Ь, с < у d на плоскости или совокуп- ность всех полуоткрытых параллелепипедов в пространстве. Установим следующие свойства полуколец множеств. Лемма 1. Пусть множества Ai, А2, ..., Ап, А принадлежат полукольцу <5, причем множества А, попарно не пересекаются и все содержатся в А. Тогда набор множеств А, (1 = 1, 2, ... ..., п) можно дополнить множествами /ln+i, ..., Ая<=& до ко- нечного разложения А = U А (« > п) 4=1 множества А. Доказательство проведем по индукции. При п — 1 справедливость утверждения леммы вытекает из определения полукольца. Предположим, что это утверждение справедливо для п = m и рассмотрим m + 1 множеств Ah ..., Am, Am+h удовлетворяющих условиям леммы. По сделанному иредполо- жению, Л = АиЛи ... иА^и^и ... USP, где все множества Bq (q = \,2, ..., р) принадлежат ©. Поло- жим Bqi — Am+i П Bq. По определению полукольца, имеется раз- ложение Bq = Bqi U Bq2 U ... U B9r, где все Bqj принадлежат ©. ') При этом в число интервалов включается, конечно, «пустой» интервал (а, а), а в число отрезков — отрезок, состоящий из одной точки [а, а].
44 ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ [ГЛ. г Легко видеть, что Р Z л = л,и ... U (U вч1 ?=1 \/=2 Таким образом, утверждение леммы доказано для п = т + 1, а следовательно, и вообще для всех п. Лемма 2. Какова бы ни была конечная система множеств Ль ..., Ап, принадлежащих полукольцу ©, в ® найдется такая конечная система попарно непересекающихся множеств Вь ... ..., Bt, что каждое Аь может быть представлено в виде суммы некоторых из множеств Ва. Доказательство. При п = 1 лемма тривиальна, так как достаточно положить /=1, В1 = Ль Допустим, что она спра- ведлива для п = пг, и рассмотрим в <5 некоторую систему мно- жеств Ai, ..., Am, Am+i- Пусть Bi, В2, ..., Bt — множества из <г>, удовлетворяющие условиям леммы по отношению к А{, А2, ... ..., А Ш- Положим В si — Дт+1 П Bs. В силу леммы 1 имеет место разложение t а Am+l = U Bst и U В'„, Вр^&, (1) S=I Р=1 а в силу самого определения полукольца имеет место разло- жение = ... U Bsfs, Bsi^e. Легко видеть, что fs Ak= U U Bs!, k = \, 2........пг, s^Mk i-\ и что множества Bsl, Bp попарно не пересекаются. Таким образом, множества BSj, В'? удовлетворяют условиям леммы по отношению к Ai.......Am, A m+l • 3. Кольцо, порожденное полукольцом. Мы уже видели в п. 1, что для каждой системы множеств S существует единственное минимальное кольцо, содержащее S. Однако для произвольной системы S фактическое построение кольца 9?(<s) по <5 довольно сложно. Оно становится вполне обозримым в том важном слу- чае, когда <5 представляет собой полукольцо. Это построение дается следующей теоремой.
СИСТЕМЫ МНОЖЕСТВ 45 $5] Теорема 3. Если <г> — полукольцо, то 3?(<s) совпадает с си- стемой 3 множеств А, допускающих конечные разложения л = U л *=i на множества Ah<=&. Доказательство. Покажем, что система 3 образует кольцо. Если А и В — два произвольных множества на 3> т0 имеют место разложения п m А = и В = и Bh A, *= ®> Bj е S. i=i /=i Так как © — полукольцо, то множества = А( П В/ тоже входят в <s. В силу леммы 1 имеют место разложения ч sj Л=усг/ийУ^; B/ = U CoUljC/b (2) где Dik, Eji е <г>. Из равенств (2) вытекает, что множества А П В и А АВ допускают разложения лпв = ис,-/, лдв = и^ии^п i.i i.k i.i и, следовательно, входят в 3- Таким образом, 3 действительно представляет собой кольцо; его минимальность среди всех ко- лец, содержащих (ю, очевидна. 4. о-алгебры. В различных вопросах, в частности, в теории меры, приходится рассматривать суммы и пересечения не только конечного, но и счетного числа множеств. Поэтому целесообраз- но, помимо понятия кольца множеств, ввести еще следующие понятия. Определение 3. Кольцо множеств называется о-кольцом, если оно вместе с каждой последовательностью множеств Ль Л2, ..., Лп, ... содержит сумму s=U4 п Определение 4. Кольцо множеств называется б-кольцом, если оно вместе с каждой последовательностью множеств Ль А2, .... Лп, ... содержит пересечение Р=Г14. п Естественно назвать о-алгеброй о-кольцо с единицей и 6-ал- геброй б-кольцо с единицей. Легко, однако, видеть, что эти два
46 ЭЛЕМЕНТЫ ТЕОРИИ- МНОЖЕСТВ [ГЛ. I понятия совпадают: каждая о-алгебра является в то же время б-алгеброй, а каждая 6-алгебра — а-алгеброй. Это вытекает из соотношений двойственности (см. § 1) и Л„ = Е\П(£\ЛД Плп = Е\и(^\лд п п п п Простейшим примером о-алгебры является совокупность всех подмножеств некоторого множества А. Если имеется некоторая система множеств S, то всегда су- ществует хотя бы одна 0-алгебра, содержащая эту систему. Дей- ствительно, положим Х = U А Ле® и рассмотрим систему 23 всех подмножеств множества X. Ясно, что 23 есть о-алгебра, содержащая <5. Если © — произвольная <т-алгебра1, содержащая <5 и X — ее единица, то каждое Л е З содержится в X и, следовательно, X — J -4czX. Назовем о-ал- Ле® ~ гебру © неприводимой (по отношению к системе <S), если X = = U А. Иначе говоря, неприводимая а-алгебра — это о-алгебра, Лед не содержащая точек, не входящих ни в одно из А е®, Есте- ственно в каждом случае рассмотрением только таких о-алгебр и ограничиваться. Для неприводимых о-алгебр имеет место теорема, аналогич- ная теореме 2, доказанной выше для колец. Теорема 4. Для любой непустой системы множеств су- ществует неприводимая (по отношению к этой системе) о-алгеб- ра 23 (<s), содержащая <Е> и содержащаяся в любой о-алгебре, содержащей Доказательство проводится в точности тем же методом, что и доказательство теоремы 2; а-алгебра 2Э(©) называется минимальной а-алгеброй над системой <S. В анализе важную роль играют так называемые борелевские множества, или В-множества— множества на числовой прямой, принадлежащие минимальной о-алгебре над совокупностью всех сегментов [а, 6]. 5. Системы множеств и отображения. Отметим следующие -факты, которые нам понадобятся при изучении измеримых функций. Пусть у — f(x) —функция, определенная на множестве М и принимающая значения из множества N, и пусть Ш1— некоторая система подмножеств множества М. Обозначим через f(SDf) си- стему всех образов f(A) множеств, принадлежащих 5R. Пусть, кроме того, — некоторая система множеств, содержащихся
*5] СИСТЕМЫ МНОЖЕСТВ 47 в N, и —система всех прообразов /-1(Л) множеств, вхо- дящих в 5R. Справедливы следующие утверждения, проверка ко- торых предоставляется читателю: 1) Если 9? есть кольцо, то и f~l (97) есть кольцо. 2) Если 97 есть алгебра, то и f~l (97) есть алгебра. 3) Если 97 есть о-алгебра, то и f~l (97) есть о-алгёбра. 4) й(г,(9г)) = г1(К(Ж Останутся ли эти утверждения справедливыми, если f-1 заме- нить на f, а 97 — на Эй?
ГЛ A BA II МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА § 1. Понятие метрического пространства 1. Определение и основные примеры. Одной из важнейших операций анализа является предельный переход. В основе этой операции лежит тот факт, что на числовой прямой определено расстояние от одной точки до другой. Многие фундаментальные факты анализа не связаны с алгебраической природой действи- тельных чисел (т. е. с тем, что они образуют поле), а опираются лишь на понятие расстояния. Обобщая представление о действи- тельных числах как о множестве, в котором введено расстояние между элементами, мы приходим к понятию метрического пространства — одному из важнейших понятий современной математики. Ниже мы изложим основные факты теории метри- ческих пространств и их обобщения — топологических про- странств. Результаты этой главы существенны для всего даль- нейшего изложения. Определение. Метрическим, пространством называется пара (X, р), состоящая из некоторого множества (пространства) X элементов (точек) и расстояния, т. е. однозначной, неотрица- тельной, действительной функции р(х, у), определенной для лю- бых х и у из X и подчиненной следующим трем аксиомам: 1) р(х, у) = 0 тогда и только тогда, когда х = у, 2) р(я, У) = р(у, х) (аксиома симметрии), 3) р(х, г) p(x, у) + р(у, z) (аксиома треугольника). Само метрическое пространство, т. е. пару (X, р), мы будем обозначать, как правило, одной буквой: R = (X, р). В случаях, когда недоразумения исключены, мы будем за- частую обозначать метрическое пространство тем же символом, что и сам «запас точек» X. Приведем примеры метрических пространств. Некоторые из этих пространств играют в анализе весьма важную роль. 1. Положив для элементов произвольного множества ( 0, если х — у, р(х, у) = { , ' ( 1, если х #= у,
§ 11 ПОНЯТИЕ МЕТРИЧЕСКОГО ПРОСТРАНСТВА 49 мы получим, очевидно, метрическое пространство. Его можно на- звать пространством изолированных точек. 2. Множество действительных чисел с расстоянием р(х, у) = | х — у\ образует метрическое пространство R*. 3. Множество упорядоченных групп из п действительных чи- сел х = (%1, х2, ..., хп) с расстоянием Р (х, у) TAyk — xk)2 (1) ’ k—l называется п-мерным арифметическим евклидовым простран- ством R”. Справедливость аксиом 1) и 2) для R” очевидна. По- кажем, что в R” выполнена и аксиома треугольника. Пусть % = (%!, ..., хп), y = (yi, Уп) и z = (z(.....Zn); тогда аксиома треугольника записывается в виде V £ (Z* - xk)2 < А/ £ (уk- Хк)2 + А/ t(Zk- у к)2 . (2) v к=1 v ft=l v Полагая yk — хк = ah, гк — yk = bh, получаем Zh — Xit = ah + bk, а неравенство (2) принимает при этом вид Vs (°*+w < Vx, • <=» Но это неравенство сразу следует из известного неравенства Коши — Буняковского *) ап \2 п п <4> Действительно, в силу этого неравенства имеем п п п п 2, («. + =£ “«+2 2, “А +< П / п п п / / П / п \2 < 2, +2 V £ “* • £ "•+£ ** - ( у S. “*+V £ ч) тем самым неравенство (3), а следовательно и (2), доказано. ’) Неравенство Коши — Буняковского вытекает из тождества ✓ п ч 2 п п п п / t=i s=i /=1 /=i которое проверяется непосредственно.
50 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 1Г 4. Рассмотрим то же самое множество упорядоченных групп из п действительных чисел х = (хь ..., хп), но расстояние опре- делим в нем формулой п Pi (х, у) = £ I xk — ук\. (5> ft=i Справедливость аксиом 1)—3) здесь очевидна. Обозначим это метрическое пространство символом R". 5. Возьмем снова то же самое множество, что и в приме- рах 3 и 4, и определим расстояние между его элементами фор- мулой РоЖ У) = max \yk — xk\. (6> 1С k С п Справедливость аксиом 1)—3) очевидна. Это пространство, ко- торое мы рбозначим R^, во многих вопросах анализа не менее удобно, чем евклидово пространство R". Последние три примера показывают, что иногда и в самом, деле важно иметь различные обозначения для самого метриче- ского пространства и для множества его точек, так как один и тот же запас точек может быть по-разному метризован. 6. Множество С [а, Ь] всех непрерывных действительных функ- ций, определенных на сегменте [а, Ь], с расстоянием p(f,g)= max — f(t)\ (7) также образует метрическое пространство. Аксиомы 1)—3) про- веряются непосредственно. Это пространство играет очень важ- ную роль в анализе. Мы будем его обозначать тем же симво- лом С [а, &], что и само множество точек этого пространства. Вместо С[0, 1] мы будем писать просто С. 7. Обозначим через /2 метрическое пространство, точками ко- торого служат всевозможные последовательности х = (хь х2, ... ..., хп, •) действительных чисел, удовлетворяющие условию а расстояние определяется формулой Р (х, у) = А/ £ (</* — xtf . (8) “ й = 1 Из элементарного неравенства (xft ± у^2 2 (х| + у2} следует, что функция р(х, у) имеет смысл для всех х, у е /2, т. е. ряд оо У, (yk — xj2 сходится, если k=i 00 со У X2 < ОО и У у2 < ОО.
ПОНЯТИЕ МЕТРИЧЕСКОГО ПРОСТРАНСТВА 51 4>] Покажем теперь, что функция (8) удовлетворяет аксиомам мет- рического пространства. Аксиомы 1) и 2) очевидны, а аксиома треугольника принимает здесь вид VOO / оо / оо Е - xky < д/ Е - yky + у Е (yk - . (9) fe— I fe — I fe——-1 В силу сказанного выше каждый из трех написанных здесь ря- дов сходится. С другой стороны, при каждом п справедливо неравенство д/1 - чу < д/е{Zk ~Ук)2 + л/Д~ (см. пример 4). Переходя здесь к пределу при п->оо, получаем (9), т. е. неравенство треугольника в /2- 8. Рассмотрим, как и в примере 6, совокупность всех функ- ций, непрерывных на отрезке [а, Ь], но расстояние определим иначе, а именно, положим G? х7» I (*(0~ y(t))2dtj . (10) Такое метрическое пространство мы будем обозначать С2[а, Ь] и называть пространством непрерывных функций с квад- ратичной метрикой. Здесь аксиомы 1) и 2) метрического про- странства опять-таки очевидны, а аксиома треугольника непо- средственно вытекает из интегральной формы неравенства Ко- ши — Буняковского’) . Ь .26 6 Н х (i) у (t) dt j х* 1 (t) dt • у2 (t) dt. \а /а а 9. Рассмотрим множество всех ограниченных последователь- ностей х — (%1, Лг, хп, ...) действительных чисел. Положив р (х, у) = sup | yk — xk I, (11) k мы получим метрическое пространство, которое обозначим пг. Справедливость аксиом 1)—3) очевидна. *) Это неравенство может быть получено, например, из легко, проверяе- мого тождества z ь .26 ь 6 6 I (О У (t) = j х2 (0 dt j y2(t)dt — у j j [x (s) у (t) — у (s) x (OP ds di. 'a 'a a a a
52 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. II 10. Множество упорядоченных групп из п действительных чисел с расстоянием / п \1/р Рр(М !/) = ( Е \Ук-Ч\Р] . (12) где р — любое фиксированное число ^1, представляет собой метрическое пространство, которое мы обозначим Rp. Справед- ливость аксиом 1) и 2) здесь опять-таки очевидна. Проверим аксиому 3). Пусть х = (.г1, ..., xn), y — {yi, - Уп), z = = (21, 2П)—три ТОЧКИ ИЗ R*. Положим yk~ Xk = akr Zk — yk= bk, тогда неравенство Рр (х, 2) < Рр (х, у) + Рр (у, 2), справедливость которого мы должны установить, примет вид / п \1/Р / п \1/Р / п \ 1/р (£|aft + 6J₽) <(Elad₽ + ElM) • (13} \s=i / \*=i / \ft=i / Это — так называемое неравенство Минковского. При р= 1 не- равенство Минковского очевидно (модуль суммы не превосхо- дит суммы модулей), поэтому будем считать, что р > 1 ’). Доказательство неравенства (13) при р >• 1 основано на так называемом неравенстве Гёльдера п / п \1/Р / п \1/<7 Е I akbk |<( Е | ak И El bk\q) , (14) где числа p > 1 и <? > 1 связаны условием 7 + 7=1’ т-е- q = (15) Заметим, что неравенство (14) однородно. Это значит, что если оно выполнено для каких-либо двух векторов а = (ai, ... ..., ап) и b = (bi, ..., bn), то оно выполнено и для векторов Ха и цб, где X и р.— произвольные числа. Поэтому неравенство (14) достаточно доказать для случая, когда п п El^lP = gl/’d?=1- (16) Итак, пусть выполнено условие (16); докажем, что п Е|«Л1<1- (17) А=1 ’) При р <. 1 неравенство Минковского не имеет места. Иначе говоря, если бы мы захотели рассматривать пространство R” при р <. 1, то в таком пространстве не была бы выполнена аксиома треугольника.
fl] ПОНЯТИЕ МЕТРИЧЕСКОГО ПРОСТРАНСТВА 53 Рассмотрим на плоскости (£, л) кривую, определяемую урав- нением л — Вр-1 (£ > 0), или, что то же самое, уравнением £ = = Л9-1 (рис. 7). Из рисунка ясно, что при любом выборе поло- жительных значений а и b будет Sj + S2 ab. Вычислим пло- щади X, и Х2: а ь Sfp-1 ар „ С о-1 , Ьр Г dt, = —~, Х2= \ л <^1 = —-. Р J ч о о Таким образом, справедливо числовое не- равенство Заменив здесь о на | аь | и b на |&а| до п, получим, учитывая (15) и (16), Е k=i Неравенство (17), а следовательно, и общее неравенство (14) доказаны. При р = 2 неравенство Гельдера (14) переходит в не- равенство Коши — Буняковского (4). Перейдем теперь к доказательству неравенства Минковского. Для этого рассмотрим тождество (I а | +1 N)₽ = (I а | +1 Ь |)₽“1 | а | + (| а | +1 Ь |)₽~1 | Ь |. Заменяя в написанном тождестве а на аь и b на Ьь. и суммируя по k от 1 до п, получим t (I ak\ + | bk\)p = E (I ak\ +1 bk |)р-* | ak\ + E (I ak |+| b t \)р~' | bk [. k=l *=l fe=l Применяя теперь к каждой из двух сумм, стоящих справа, неравенство Гельдера и учитывая, что (/?— \)q = р, получим 2,(1 / П \Ч<1 / Г п Т/РЧ <( Е (|ad + l^l)₽) rElad₽l'/₽+ Eiw • \й=1 / \Lfe=i J Lft=i J / Деля обе части этого неравенства на ап \ 1/? L (I ak | +1 bk |)₽J ,
54 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. И лолучим an \*/р ( п \!/р / “ \1/р •откуда сразу следует неравенство (13). Тем самым установлена аксиома треугольника в пространстве R". Рассмотренная в этом примере метрика рР превращается в евклидову метрику (пример 3) при р = 2 и в метрику примера 4 при р = 1. Можно показать, что метрика Р„о (*, У) = max | yk — xk ], I •введенная в примере 5, является предельным случаем метрики _рР(х, у), именно: / П \'/Р Роо (*> у} = lim I Е I Уь — xklp) . д->оо \fe=l Z Из неравенства , аР , ьч /1.1 ,х оо --------- I-----------— 1 I, Р <7 \ р Q J установленного выше, легко выводится и интегральное неравен- ство Гельдера h . Ь ,\!р.Ь >1/0 J \x(t)y(t)]dt^\\ |х(/)|₽Л) , а \а / \а / -справедливое для любых функций x(t) и y(t), для которых стоящие справа интегралы имеют смысл. Отсюда в свою очередь получается интегральное неравенство Минковского ,Ь ,1/р ,Ь у\!р .Ь . 1/р Qix(o+f/(oip^j +^if/(oipdj . 11. Укажем еще один интересный пример метрического про- -странства. Его элементами являются всевозможные последова- тельности действительных чисел х = (хь х2, ..., хп, ...), такие, что Z I xk\p < ОО, *=1 где р 1 — некоторое фиксированное число, а расстояние опре- деляется формулой GOO к 1/р S I Ун — Xk Ij • (18) .Это метрическое пространство мы обозначим 1Р.
5 и ПОНЯТИЕ МЕТРИЧЕСКОГО ПРОСТРАНСТВА 5(> В силу неравенства Минковского (13) имеем при любом п- 0” \'/Р / п \ЧР / п \1/р L\yk-4\p) <(eiwJ • Так как, по предположению, ряды Е 1^1₽ и Е \Ук\Р k=l fe=l сходятся, то, переходя к пределу при п->со, получим Goo \'/р / 00 \*/р / оо \ 1/р Llyk-Xkl") + (Е I Уь 1₽) < 00 (191- Таким образом, доказано, что формула (18), определяющая рас- стояние в 1Р, действительно имеет смысл для любых х, у е /р.. Одновременно неравенство (19) показывает, что в 1Р выполнена аксиома треугольника. Остальные аксиомы очевидны. Неограниченное количество дальнейших примеров дает сле- дующий прием. Пусть R = (X, р) —метрическое пространство и М — любое подмножество в X. Тогда М с той же функцией р(х, у), которую мы считаем теперь определенной для х и у из М, тоже представляет собой метрическое пространство; оно' называется подпространством пространства R. 2. Непрерывные отображения метрических пространств. Изо- метрия. Пусть X и У — два метрических пространства и f — ото- бражение пространства X в У. Таким образом, каждому х^Х ставится в соответствие некоторый элемент у — f(x) из У. Это- отображение называется непрерывным в точке х0 е X, если для. каждого е > 0 существует такое 6 > 0, что для всех х е X та- ких, что р (х, х0) < 6, выполнено неравенство Pi (f (х), f (х0)) < е (здесь р — расстояние в X, a pi — расстояние в У). Если ото- бражение f непрерывно во всех точках пространства X, то го- ворят, что f непрерывно на X. Если X и У — числовые множе- ства, т. е. f — числовая функция, определенная на некотором подмножестве X числовой оси, то приведенное определение не- прерывности отображения превращается в хорошо известное из элементарного анализа определение непрерывности функции. Аналогично можно определить непрерывную функцию (ото- бражение) f от нескольких переменных XjeXi, ..., хп Хп (где Xi, ..., Хп—метрические пространства) со значениями в- метрическом пространстве У.
56 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА (ГЛ. П Заметим, в этой связи, что само расстояние р(х, у), если рас- сматривать его как функцию переменных х и у из X, непрерыв- но. Это сразу же следует из неравенства I Р (х, У} — Р (-«о, Уо} К Р (-«о, х) + р (уо, у), легко выводимого из неравенства треугольника. Если отображение X -> Y взаимно однозначно, то суще- ствует обратное отображение х = f_| (у) пространства Y на про- странство X. Если отображение f взаимно однозначно и взаимно непрерывно (т. е. f и f-1 — непрерывные отображения), то оно называется гомеоморфным отображением или гомеоморфизмом, а сами пространства X и Y, между которыми можно установить гомеоморфизм, называются гомеоморфными между собой. При- мером гомеоморфных метрических пространств могут служить вся числовая прямая (—оо, сю) и интервал, например, интервал (—1, 1). В этом случае гомеоморфизм устанавливается фор- мулой 2 L у = — arctg х. Важным частным случаем гомеоморфизма является так назы- ваемое изометрическое отображение. Говорят, что биекция f между метрическими пространствами R = (X, р) и R' — (У, р') является изометрией, если р(М, x2) = p'(f (*i)> f(x2)) для любых Х\, x2<=R. Пространства R и R', между которыми можно установить изометрическое соответствие, называются изо- метричными. Изометрия пространств R и R' означает, что метрические связи между их элементами одни и те же; различной может быть лишь природа их элементов, что с точки зрения теории метрических пространств несущественно. В дальнейшем изо- метричные между собой пространства мы будем рассматривать просто как тождественные. К изложенным здесь понятиям (непрерывность, гомеомор- физм) мы вернемся, с более общей точки зрения, в конце § 5 этой главы. § 2. Сходимость. Открытые и замкнутые множества 1. Предельные точки. Замыкание. Мы введем здесь некото- рые понятия теории метрических пространств. Эти понятия мы неоднократно используем в дальнейшем. Открытым шаром В(х0,г) в метрическом пространстве R мы /Зудем называть совокупность точек x^R, удовлетворяющих
>2] СХОДИМОСТЬ. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА 57 условию р (х, х0) < г. Точка х0 называется центром этого шара, а число г — его ра- диусом. Замкнутым шаром В [х0, г] мы назовем совокупность точек хе R, удовлетворяющих условию р (х, х0) < г. Открытый шар радиуса е с центром хо мы будем называть также е-окрестностью точки хо и обозначать символом Ое(х0). Упражнение. Привести пример метрического пространства и таких двух шаров В (х, р]), В (у, р2) в нем, что р[ > р;, и тем не менее В (х, р() с: '<= В (у, р2). Множество Л1 ей называется ограниченным, если оно со- держится целиком в некотором шаре. Точка х е R называется точкой прикосновения множества М с R, если любая ее окрестность содержит хотя бы одну точку из М. Совокупность всех точек прикосновения множества М обозначается [Л4] и называется замыканием этого множества. Таким образом, мы определили для множеств метрического про- странства операцию замыкания — переход от множества М к его замыканию [Л4]. Теорема 1. Операция замыкания обладает следующими свойствами-. 1) М с [Л4], 2) [[М]] = [М], 3) если Mi cz М2, то [MJ с [М2], 4) [М, U М2] = [М,] U [М2]. Доказательство. Первое утверждение очевидно, так как всякая точка, принадлежащая М, является для М точкой при- косновения. Докажем второе. Пусть х е= [рМ]]. Тогда в любой окрестности Ое(х) этой точки найдется точка xi е [М]. Положим е — р(х, х1)= и рассмот- рим шар Oe,(xi). Этот шар целиком лежит внутри шара ОЕ(х). Действительно, если zeOE:(Xi), то р(г, Xi)<ei, и так как р(х, Xj) = е — 61, то по аксиоме треугольника p(z, х) <8, + (8 — 8!)== 8, т. е. геО8(х). Так как х{ s [Л4], то в O£1(Xi)найдется точка х2еМ. Но тогда х2еОе(х). Так как Ое(х) — произвольная окрестность точки х, то.хе[Л4]. Второе утверждение доказано. Третье свойство очевидно. Докажем, наконец, четвертое свойство.
-•58 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. U Если XEpMj U А42], то х содержится по крайней мере в од- ном из множеств [MJ или [М2], т. е. Так как MiCzM] U М2 и M2czMl (J М2, то обратное включение •следует из свойства 3). Теорема доказана полностью. Точка хе/? называется предельной точкой множества .М с: /?, если любая ее окрестность содержит бесконечно много точек из М. Предельная точка может принадлежать, а может и не при- надлежать М. Например, если М — множество рациональных чи- сел из отрезка [0, 1], то каждая точка этого отрезка — предель- ная для М. Точка х, принадлежащая М, называется изолированной точкой этого множества, если в достаточно малой ее окрестно- сти Ое(х) нет точек из М, отличных от х. Предлагаем читателю доказать в качестве упражнения следующее утверждение: Всякая точка прикосновения множества М есть либо пре- дельная, либо изолированная точка этого множества. Отсюда можно заключить, что замыкание [М] состоит, во- обще говоря, из точек трех типов: 1) изолированные точки множества М; 2) предельные точки множества М, принадлежащие М; 3) предельные точки множества М, не принадлежащие М. Таким образом, замыкание [М] получается присоединением к М всех его предельных точек. 2. Сходимость. Пусть хь х2, ... — последовательность точек в метрическом пространстве R. Говорят, что эта последователь- ность сходится к точке х, если каждая окрестность 0е(*) точ- ки х содержит все точки хп, начиная с некоторой, т. е. если для всякого е>0 найдется такое число Ne, что Ое(х) содержит все точки хп с п > 7Ve. Точка х называется пределом последователь- ности {Хп}. Это определение можно, очевидно, сформулировать еще и •следующим образом: последовательность {хп} сходится к х, если lim р (х, х„) = 0. Ц-> оо Непосредственно из определения предела вытекает, что 1) никакая последовательность не может иметь двух различных пределов, и что 2) если последовательность {хп} сходится к точ- ке х, то и всякая ее подпоследовательность сходится к той же самой точке. Следующая теорема устанавливает тесную связь между по- нятиями точки прикосновения и предела.
J 2] СХОДИМОСТЬ. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА 59’ Теорема 2. Для того чтобы точка х была точкой прикос- новения множества М, необходимо и достаточно, чтобы суще- ствовала последовательность {хп} точек из М, сходящаяся к х. Доказательство. Условие необходимо, так как если х — точка прикосновения множества Л1, то в каждой ее окрестности Oi/п (х) содержится хотя бы одна точка хп е М. Эти точки об- разуют последовательность, сходящуюся к х. Достаточность оче- видна. Если х — предельная точка множества Л1, то точки хп е е О./„ (х) П М, отвечающие разным п, можно выбрать попарно различными. Таким образом, для того чтобы точка х была предельной для М, необходимо и достаточно, чтобы в М суще- ствовала последовательность попарно различных точек, сходя- щаяся к х. Понятие непрерывности отображения метрического простран- ства X в метрическое пространство У, введенное в § 1, можно теперь сформулировать в терминах сходимости последовательно- стей. Именно, отображение у — f(x) непрерывно в точке х0, если для всякой последовательности {хп}, сходящейся к х0, последо- вательность {yn = f(xn)} сходится к y0 = f(x0). Доказательство равносильности этого определения приведенному в § 1 ничем не отличается от доказательства равносильности двух определе- ний непрерывности («на языке е, 6» и «на языке последователь- ностей») функций числового аргумента и может быть предостав- лено читателю. 3. Плотные подмножества. Пусть А и В — два множества в метрическом пространстве R. Множество А называется плот- ным в В, если [Л] во В. В частности, множество А называется всюду плотным (в пространстве /?), если его замыкание [.1] сов- падает со всем пространством R. Например, множество рацио- нальных чисел всюду плотно на числовой прямой. Множество А называется нигде не плотным, если оно не плотно ни в одном шаре, т. е. если в каждом шаре В с: R содержатся другой шар В', не имеющий с А пи одной общей точки. Примеры пространств, и меющ их в сю д у плот- ное Счетное множество. Пространства, в которых имеет- ся счетное всюду плотное множество, называют сепарабельными. Рассмотрим с этой точки зрения примеры, которые приведены в § 1. 1. «Дискретное» пространство, описанное в примере 1 § 1, содержит счетное всюду плотное в нем множество тогда и толь- ко тогда, когда оно само состоит лишь из счетного числа точек. Дело в том, что замыкание [М] любого множества М в этом про- странстве совпадает с М. Все пространства, перечисленные в примерах 2—8 § 1, со- держат счетные всюду плотные множества. Укажем в каждом
60 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. и из них по такому множеству, настоятельно рекомендуя читателю провести подробные доказательства. 2. На действительной оси R1— рациональные точки. 3—5. В n-мерном евклидовом пространстве R" и в простран- ствах R?, Ri — совокупность векторов с рациональными коор- динатами. 6. В пространстве С [а, 6] — совокупность всех многочленов с рациональными коэффициентами. 7. В пространстве h — совокупность последовательностей, в каждой из которых все члены рациональны и лишь конечное (свое для каждой последовательности) число этих членов от- лично от нуля. 8. В пространстве С2[а, 6]— совокупность всех многочленов с рациональными коэффициентами. Вместе с тем пространство ограниченных последовательно- стей пг (пример 9 § 1) несепарабельно. Действительно, рассмотрим всевозможные последовательно- сти, состоящие из нулей и единиц. Они образуют множество мощности континуума (так как между ними и подмножествами натурального ряда можно установить взаимно однозначное со- ответствие). Расстояние между двумя такими точками, опреде- ляемое формулой (11) § 1, равно 1. Окружим каждую из этих точек открытым шаром радиуса 1/2. Эти шары не пересекаются. Если некоторое множество всюду плотно в пг, то каждый из построенных шаров должен содержать хотя бы по одной точке из этого множества, и, следовательно, оно не может быть счетным. 4. Открытые и замкнутые множества. Рассмотрим важней- шие типы множеств в метрическом пространстве, а именно, от- крытые и замкнутые множества. Множество М, лежащее в метрическом пространстве R, на- зывается замкнутым, если оно совпадает со своим замыканием: [М] = М. Иначе говоря, множество называется замкнутым, если оно содержит все свои предельные точки. В силу теоремы 1 замыкание любого множества М есть зам- кнутое множество. Из той же теоремы вытекает, что [М] есть наименьшее замкнутое множество, содержащее М. (Докажите это!) Примеры. 1. Всякий отрезок [a, 6] числовой прямой есть замкнутое множество. 2. Замкнутый шар представляет собой замкнутое множество. В частности, в пространстве С [а, 6] множество функций f, удов- летворяющих условию |f(Z) | К, замкнуто. 3. Множество функций в С [а, 6], удовлетворяющих условию (открытый шар), не замкнуто; его замыкание есть совокупность функций, удовлетворяющих условию |/(/) |
$2] СХОДИМОСТЬ. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА 61 4. Каково бы ни было метрическое пространство 7?, пустое множество 0 и все В замкнуты. 5. Всякое множество, состоящее из конечного числа точек, замкнуто. Основные свойства замкнутых множеств можно сформулиро- вать в виде следующей теоремы. Теорема 3. Пересечение любого числа и сумма любого ко- нечного числа замкнутых множеств суть замкнутые множества. Доказательство. Пусть F = П Fa — пересечение замкну- тых множеств Fa и пусть х— предельная точка для F. Это озна- чает, что любая ее окрестность Ое(х) содержит бесконечно мно- го точек из F. Но тогда тем более Ое (х) содержит бесконечно много точек из каждого Fa и, следовательно, так как все Fa замкнуты, точка х принадлежит каждому Fa; таким образом, X е F = П Fa, т. е. F замкнуто. Пусть теперь F — сумма конечного числа замкнутых мно- п жеств: F = (J В,-, и пусть точка х не принадлежит F. Покажем, 1=1 что х не может быть предельной для F. Действительно, х не принадлежит ни одному из замкнутых множеств В,-, следова- тельно, не является предельной ни для одного из них. Поэтому для каждого i можно найти такую окрестность О&1 (х) точки х, которая содержит не более чем конечное число точек из Fi. Взяв из окрестностей Ое,(х), ..., 06fi(x) наименьшую, мы по- лучим окрестность Ое(х) точки х, содержащую не более чем конечное число точек из F. Итак, если точка х не принадлежит F, то она не может быть предельной для F, т. е. F замкнуто. Теорема доказана. Точка х называется внутренней точкой множества М, если существует окрестность Ое(х) этой точки, целиком содержа- щаяся в М. Множество, все точки которого внутренние, называется от- крытым. Примеры. 6. Интервал (а, Ь) числовой прямой R1 есть от- крытое множество; действительно, если а < а < Ь, то ОЕ(а), где e = min(a — а, b — а), целиком содержится в интервале (а, Ь). 7. Открытый шар В (а, г) в любом метрическом простран- стве R есть открытое множество. Действительно, если хе еВ(а, г), то р(а, х)<г. Положим е = г — р(а, х). Тогда В(х, е)е В (а, г). 8. Множество непрерывных функций на [а, &], удовлетворяю- щих условию где g(t)—некоторая фиксированная Непрерывная функция, представляет собой открытое подмноже- ство пространства С [а, &].
62 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. II Теорема 4. Для того чтобы множество М было открыто необходимо и достаточно, чтобы его дополнение R\ М до всего- пространства R было замкнуто. Доказательство. Если М открыто, то каждая точка х из М имеет окрестность, целиком принадлежащую М, т. е. не имеющую ни одной общей точки с R \ М. Таким образом, ни одна из точек, не принадлежащих не может быть точкой прикосновения для R\M, т. е. /?\А1 замкнуто. Обратно, если 7? \ М замкнуто, то любая точка из М имеет окрестность, цели- ком лежащую в М, т. е. М открыто. Так как пустое множество и все R замкнуты и в то же время служат дополнениями друг друга, то пустое множество и все R открыты. Из теоремы 3 и из принципа двойственности (пересечение дополнений равно дополнению суммы, сумма дополнений равна дополнению пересечения, см. стр. 15) вытекает следующая важ- ная теорема, двойственная теореме 3. Теорема 3'. Сумма любого (конечного или бесконечного) числа и пересечение любого конечного числа открытых множеств суть открытые множества. Множества, принадлежащие о-алгебре, порожденной всеми открытыми и замкнутыми подмножествами пространства R, на- зываются борелевскими множествами. 5. Открытые и замкнутые множества на прямой. Структура открытых и замкнутых множеств в том или ином метрическом пространстве может быть весьма сложной. Это относится к открытым и замкнутым множествам даже евклидова про- странства двух или большего числа измерений. Однако в одно- мерном случае, т. е. на прямой, исчерпывающее описание всех открытых множеств (а следовательно, и всех замкнутых) не представляет труда. Оно дается следующей теоремой. Теорема 5. Всякое открытое множество на числовой пря- мой представляет собой сумму конечного или счетного числа попарно непересекающихся интервалов'). Доказательство. Пусть G — открытое множество на прямой. Введем для точек из G отношение эквивалентности, счи- тая, что х ~ у, если существует такой интервал (а, р), что х, г/е(а, p)czG. Очевидно, это отношение рефлексивно и симмет- рично, оно и транзитивно, так как если х ~ у и у ~ z, то суще- ствуют такие интервалы (а, р) и (у, 6), .что « е (а, P)cG и у, z^ (у, б) с G. Но тогда у < р и интервал (а, 6) лежит целиком в G и содер- жит точки х и z. Следовательно, G распадается на непересекаю- ') Множества вида (—оо, оо), (а, оо) и (—оо, р) мы при этом также включаем в число интервалов.
2] СХОДИМОСТЬ. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА 63 щиеся классы Л эквивалентных между собой точек: 0 = иЛ- Докажем, что каждое 1Х есть интервал (а, Ь), где а = inf 1Х, b = suplx. Включение Ix с (а, Ь) очевидно. С другой стороны, если х, у е 7Х, то по самому определению Д интервал (х, у) со- держится в /т. В любой близости от а справа и в любой близо- сти от b слева есть точки из 1Х. Поэтому 1Х содержит любой интервал (а',Ь'), концы которого принадлежат (а, Ь), откуда Jx = (a,b). Система таких непересекающихся интервалов /т не более чем счетна; действительно, выбрав в каждом из этих ин- тервалов произвольным образом рациональную точку, мы уста- новим взаимно однозначное соответствие между этими интерва- лами и некоторым подмножеством множества рациональных чи- сел. Теорема доказана/ Так как замкнутые множества—-это дополнения открытых, то отсюда следует, что всякое замкнутое множество на прямой получается выбрасыванием из прямой конечного или счетного числа интервалов. Простейшие примеры замкнутых множеств — отрезки, отдель- ные точки и суммы конечного числа таких множеств. Рассмот- рим более сложный пример замкнутого множества на прямой — так называемое канторово мно- жество. Пусть Го — отрезок [0, 1]. Вы- бросим из него интервал (‘/з, 2/з), а оставшееся замкнутое множе- ство обозначим Ft. Затем выбро- сим из Fi интервалы ('/э, 2/э) и (7/э, 7э), а оставшееся замкнутое множество (состоящее из четырех отрезков) обозначим F2. В каж- дом из этих четырех отрезков вы- бросим средний интервал длины (*/з)3 и т. д. (рис. 8). Продолжая этот процесс, получим убывающую тых множеств Fn. Положим О 1/з ______7 F rt 0_ _/з_ % 1 Vg 7/э 8/g г __ __ -- --Fs ............................t Рис. 8. последовательность замкну- оо F = A Fn. F — замкнутое множество (как пересечение замкнутых). Оно по- лучается из отрезка [О, I] выбрасыванием счетного числа интер- валов. Рассмотрим структуру множества F. Ему принадлежат, оче- видно, точки О, 1, 7з, 7з. 7э. %, 79, %,... (1)
64 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. Ц — концы выбрасываемых интервалов. Однако множество F не исчерпывается этими точками. Действительно, те точки отрезка [О, 1], которые входят в множество F, можно охарактеризовать следующим образом. Запишем каждое из чисел х, 0 х 1 в троичной системе: где числа ап могут принимать значения 0, 1 и 2. Как и в случае десятичных дробей, некоторые числа допускают двоякую запись. Например, 3 з т 3, т • т з1! т • • з "Г 32 -г Зз -г • • • -г Зп -Г • • . Легко проверить, что множеству F принадлежат те и только те числа х, О^х^ 1, которые могут быть записаны хотя бы одним способом, в виде троичной дроби так, чтобы в последо- вательности ai, а2, ..., ап, ... ни разу не встретилась единица. Таким образом, каждой точке хе F можно поставить в соответ- ствие последовательность а2, . .., ап.... (2) где ап равно 0 или 2. Совокупность таких последовательностей образует множество мощности континуума. В этом можно убе- диться, поставив в соответствие каждой последовательности (2) последовательность ^1, b2, . •., Ьп, ..., (2Л) где Ьп = 0, если ап = 0, и bn = 1, если ап = 2. Последователь- ность (2') можно рассматривать как запись некоторого действи- тельного числа у, 0 у 1, в виде двоичной дроби. Таким об- разом, мы получаем отображение множества F на весь отрезок [0,1]. Отсюда вытекает, что F имеет мощность континуума1). Так как множество точек (1) счетно, то эти точки не могут ис- черпывать все F. Упражнения. 1. Доказать непосредственно, что точка 1/4 принадле- жит множеству F, не являясь концом ни одного из выбрасываемых интер- валов. Указание. Точка 1/4 делит отрезок [0, 1] в отношении 1 : 3. Отрезок [0, 1/3], остающийся после первого выбрасывания, она делит также в отношении 1 : 3 и т. д. Точки (1) называются точками первого рода множества F, остальные его точки называются точками второго рода. ’) Установленное соответствие между F и отрезком [0, 1] однозначно, но не взаимно однозначно (из-за того, что одно и то же число иногда может изображаться различными дробями). Отсюда следует, что F имеет мощность не меньше, чем мощность континуума. Но F — часть отрезка [0, 1], следова- тельно, его мощность не может быть больше, чем мощность континуума.
«2] СХОДИМОСТЬ. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА 65 2. Доказать, что точки первого рода образуют в F всюду плотное мно- жество. 3. Показать, что числа вида ti + где Л, /2 е F, заполняют весь отре- зок [0, 2]. . Мы показали, что множество F имеет мощность континуума, т. е. содержит столько же точек, сколько и весь отрезок [0, 1]. С этим фактом интересно сопоставить следующий результат: 12 4 сумма длин у + -g- + всех выброшенных интерва- лов составляет в точности единицу! Дополнительные замечания. (1) Пусть М — некоторое множество в метрическом пространстве R и X — точка этого же пространства. Расстоянием от точки х до множества М называется число р (х, М) = inf р (х, а). as М. Если х е М, то р(х, М) = 0, однако из того, что р(х, Л1) = 0, не следует, что х е М. Из определения точки прикосновения непосредственно получаем, что р(х, М) =0 в том и только том случае, когда х — точка прикосновения множества М. Таким образом, операцию замыкания можно определить как присоединение к множеству всех тех точек, расстояние которых до множества равно нулю. (2) Аналогично определяется расстояние между двумя множествами. Если А, В — два множества в метрическом пространстве R, то р (А, В) = inf р (а, Ь). а<=А Если А П В =/= 0L то р(А,В) =0; обратное, вообще говоря, неверно. (3) Пусть Мк-— множество всех функций f из С [а, ЭД, удовлетворяющих условию Липшица; для всех /2 е [а, ЭД If (h) - f (*2) КК| <2 - 6 I, где К—некоторое фиксированное число. Множество Мд замкнуто. Оно сов- падает с замыканием множества всех дифференцируемых на [а, ЭД функций таких, что | f'(t) | К. (4) Множество М = М^ всех функций, каждая из которых удовлетво- К ряет условию Липшица при каком-либо К, не замкнуто. Его замыкание есть все С [а, ЭД. (5) Открытое множество G в n-мерном евклидовом пространстве назы- вается связным, если любые две точки х, у е G могут быть соединены лома- ной, целиком лежащей в G. Например, внутренность круга х2 + у2 < 1 — связное множество. Наоборот, сумма двух кругов х2 + у2 < 1 и (х - 2)2 + у2 < 1 — не связное множество (хотя у этих кругов есть общая точка прикоснове- ния!). Открытое подмножество Н открытого множества G называется компо- нентой множества G, если оно связано и не содержится нн в каком большем связном открытом подмножестве G. Введем в G отношение эквивалентности:
66 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. II х •— у, если существует открытое связное подмножество Н из О, накрываю- щее хну: х, yeHcQ. Как и в случае прямой, легко проверяется транзитивность и поэтому G рас- падается на непересекающиеся классы: G = ш. Эти классы — открытые ком- поненты G. Число их не более чем счетно. В случае п = 1, т. е. на прямой, всякое связное открытое множество есть интервал (в число интервалов включаются и бесконечные интервалы (—оо, а), (Ь, оо) и (—оо, оо)). Таким образом, теорема 5 о строении открытых множеств на прямой состоит из двух утверждений): а) всякое открытое мно- жество на прямой есть сумма конечного или счетного числа компонент и б) связное открытое множество на прямой есть интервал. Первое из этих утверждений верно и для множеств в n-мерных евклидовых пространствах (и допускает дальнейшие обобщения), а второе относится именно к прямой. § 3. Полные метрические пространства 1. Определение и примеры полных метрических пространств. С первых шагов изучения математического анализа мы видим, сколь важную роль играет в анализе свойство полноты числовой прямой, т. е. тот факт, что всякая фундаментальная последова- тельность действительных чисел сходится к некоторому пределу. Числовая прямая служит простейшим примером так называемых полных метрических пространств, основные свойства которых мы рассмотрим в этом параграфе. Последовательность {хп} точек метрического пространства R мы будем называть фундаментальной, если она удовлетворяет критерию Коши, т. е. если для любого 8 > О существует такое число Ne, что p(xrt', хп”) < е для всех п' > Ne, п" > NR. Из аксиомы треугольника непосредственно следует, что вся- кая сходящаяся последовательность фундаментальна. Действи- тельно, если {хп} сходится к х, то для данного 8 > 0 можно най- ти такое число NR, что р (хп, х) < е/2 для всех п > NR. Тогда Р (хп', Хп") Р (хп'> х) + Р Un"", х) < е для любых п' > NR и п" > NR. Определение 1. Если в пространстве R любая фундамен- тальная последовательность сходится, то это пространство назы- вается полным. Примеры. Все пространства, рассмотренные в § 1, за иск- лючением указанного в примере 8, полные. Действительно: 1. В пространстве изолированных точек (пример 1 § 1) фун- даментальны только стационарные последовательности, т. е. та- кие, в которых, начиная с некоторого номера, повторяется все время одна и та же точка. Всякая такая последовательность, конечно, сходится, т. е. это пространство полно. 2. Полнота евклидова пространства R1 — совокупности дей- ствительных чисел — известна из анализа. 3. Полнота евклидова пространства Rn непосредственно вы- текает из полноты R1. В самом деле, пусть {х^)}—фундамен-
S3] ПОЛНЫЕ МЕТРИЧЕСКИЕ ПРОСТРАНСТВА 67 тальная последовательность точек из Rn; это означает, что для каждого е > О найдется такое N — Ne, что Д (4й - < «2 при всех р, q больших, чем N. Здесь х(р) = {х{р), ..., х<пр)}. Тогда для каждого k= 1, 2, ..., п получаем соответствующее нера- венство для координаты xJp); |Чр)-4?)|<в для всех р, q > N, т. е. {x(fep)} — фундаментальная числовая по- следовательность. Положим xfe= lim х^р) и х = (х1,х2, ..., х! р->оо Тогда, очевидно, Нт х(₽) = х. Р —> оо 4—5. Полнота пространств R™ и R? доказывается совершен- но аналогично. 6. Докажем полноту пространства С [а, Ь]. Пусть {хп(/)}— некоторая фундаментальная последовательность в С [а, &]. Это означает, что для каждого е > О существует такое N, что I хп (0 — хт (/) | < е при п, т> N для всех t, а t Ь. Отсюда вытекает, что по- следовательность {хп(Ш равномерно сходится. Как известно, в этом случае ее предел x(t) будет непрерывной функцией. Устрем- ляя в предыдущем неравенстве т к бесконечности, получим I хп (/) — х (t) К е для всех t и для всех п > N, а это и означает, что {хп(0} схо- дится к x(t) в смысле метрики пространства С [а, &]. 7. Пространство /г- Пусть {х<п>} — фундаментальная последо- вательность в /г- Это означает, что для любого е > 0 найдется такое N, что р2(x(n), х(т)) = (х^ — < е при п, т> N. (1) Здесь x(n) = (xjn), х<п), ..., х<.п), ...).Из (1) следует, что при лю- бом k (х^ — х^)2 < е, т. е. при каждом k последовательность действительных чисел {х^} фундаментальна и потому сходится.
68 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. II Положим xk = lim хф. Обозначим через х последовательность rt->oo (Xi, х2, ..., хд, ...). Нужно показать, что: оо а) У, х\ < о°, т. е. xeL А=1 б) lim р (х(п), х) = 0. ft->OO Сделаем это. Из неравенства (1) следует, что для любого фикси- рованного М м В этой сумме теперь только конечное число слагаемых, и мы мо- жем, зафиксировав п, перейти к пределу при т->оо. Получим м fcZ(4rt)-^)2<e. Это равенство верно при любом Af. Восстановим бесконечный ряд, переходя к пределу при Af -> оо; получаем £ (4П)-О2<е- (2) оо оо Из сходимости рядов У (x(fen))2 и У (xW — xfe)2 следует сходи- оо мость ряда У х2ь (в силу элементарного неравенства (a-f-6)2^: А=1 2(a2-f-62)), т. е. утверждение а) доказано. Далее, так как е произвольно мало, то неравенство (2) означает, что VOO У (х^ — xfe)2 = О, fe=l т. е. х(п)->х в метрике /г- Утверждение б) доказано. 8. Легко убедиться в том, что пространство С2[а, 6] не полно. Рассмотрим, например, последовательность непрерывных функ- ций { — 1 при — 1/п, nt при — 1 при 1/п</<1. Она фундаментальна в С2[—1, 1], так как 1 J (фП (0 —Фт 2 min (п, т)
f 3] ПОЛНЫЕ МЕТРИЧЕСКИЕ ПРОСТРАНСТВА 69 Однако она не сходится ни к какой функции из С2[—1, 1]. Действительно, пусть f — некоторая функция из С2[—1, 1] и ф— разрывная функция, равная —1 при t < 0 и +1 при t 0. В силу интегрального неравенства Минковского (справедли- вого, очевидно, и для кусочно-непрерывных функций) имеем (1 \'/а -1 ' (1 / 1 +( $(фп(0-Ф(0)2л) • -1 ' '--1 ' В силу непрерывности функции f интеграл в левой части отличен от нуля. Далее, ясно, что 1 lim ((<р„(0 — ф(0)2Л = 0. n->oo J — 1 I Поэтому (/ (0 — фп (О)2 dt не может стремиться к нулю при -1 П —> оо. Упражнение. Доказать, что пространство всех ограниченных после- довательностей (пример 9 § 1) полно. 2. Теорема о вложенных шарах. В анализе широко исполь- зуется так называемая лемма о вложенных отрезках. В теории метрических пространств аналогичную роль играет следующая теорема, называемая теоремой о вложенных шарах. Теорема 1. Для того чтобы метрическое пространство R было полным, необходимо и достаточно, чтобы в нем всякая по- следовательность вложенных друг в друга замкнутых шаров, ра- диусы которых стремятся к нулю, имела непустое пересечение. Доказательство. Необходимость. Пусть простран- ство R полно и пусть Si, В %, 53, ... — последовательность вло- женных друг в друга замкнутых шаров. Пусть гп — радиус, а хп — центр шара Вп. Последовательность центров {хп} фунда- ментальна, поскольку p(xn, хт) < г„ при пг > п, а гп -> 0 при п-> оо. Так как R полно, то lim хп существует. Положим х = п->оо = lim х„; тогда xeQ Вп.Действительно, шар Вп содержит все П->0О п точки последовательности {хД, за исключением, быть может, то- чек Xi, х2, ..., хп—1- Таким образом, х является точкой прикосно- вения для каждого шара Вп. Но так как Вп — замкнутое множе- ство, то х е Вп для всех п.
70 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. П Достаточность. Пусть {хп}—фундаментальная последо- вательность. Докажем, что она имеет предел. В силу фундамен- тальности мы можем выбрать такую точку хП1 нашей последова- тельности, что р(хп, хП1) < 1/2 при всех п П\. Примем точку хп за центр замкнутого шара радиуса 1. Обозначим этот шар Вь Выберем затем хПг из {хп} так, чтобы было п2> Пу и р (хп, хП1) < < 1/22 при всех п п2. Примем точку хП1 за центр шара ра- диуса 1/2 и обозначим этот шар В2. Вообще, если точки хп^ хп , • • •, xnk уже выбраны (th < п2 < ... < Па), то выберем точ- ку Xnk+x так, чтобы было nh+i > nh и р (хп, хП{!+1) < l/2fe+1 при всех п nk+i, и окружим ее замкнутым шаром Bh+i радиуса l/2ft. Продолжая это построение, получим последовательность замкнутых шаров Вл, вложенных друг в друга, причем шар Bk имеет радиус 1/2й-1. Эта последовательность шаров имеет, по предположению, общую точку; обозначим ее х. Ясно, что эта точка х служит пределом подпоследовательности {xnfe}- Но если фундаментальная последовательность содержит сходящуюся к х подпоследовательность, то она сама сходится к тому же пределу. Таким образом, х= Нт хп. Упражнения. 1. Доказать, что пересечение замкнутых вложенных шаров в предыдущей теореме сводится к одной точке. 2. Диаметром множества М в метрическом пространстве называется число d (Л4) = sup р (х, у), х, у^М Доказать, что в полном метрическом пространстве всякая последовательность, вложенных друг в друга непустых замкнутых множеств, диаметры которых стремятся к нулю, имеет непустое пересечение. 3. Привести пример полного метрического пространства и последователь- ности вложенных друг в друга замкнутых шаров в нем, имеющей пустое пересечение. 4. Доказать, что подпространство полного метрического пространства Д полно тогда и только тогда, когда оно замкнуто в R. 3. Теорема Бэра. В теории полных метрических пространств фундаментальную роль играет следующая теорема. Теорема 2 (Бэр). Полное метрическое пространство R не может быть представлено в виде объединения счетного числа ни- где не плотных множеств. Доказательство. Предположим противное. Пусть R — ОО «= U ЛТ„, где каждое из множеств Afn нигде не плотно. Пусть п—1 So — некоторый замкнутый шар радиуса 1. Поскольку множе- ство All, будучи нигде не плотным, не плотно в So, существует замкнутый шар S] радиуса меньше 1/2, такой, что Si cz Sfl и
£ з] ПОЛНЫЕ МЕТРИЧЕСКИЕ ПРОСТРАНСТВА 71 f] Afi = 0. Поскольку множество М2 не плотно в Sb по той же причине в шаре Si содержится замкнутый шар S2 радиуса мень- ше 1/3, для которого S2 П А12= 0 и т. д. Мы получаем после- довательность вложенных друг в друга замкнутых шаров {Sn}, радиусы которых стремятся к нулю, причем Sn fl Мп = 0. оо В силу теоремы 1 пересечение П $п содержит некоторую точ- п=1 ку х. Эта точка по построению не принадлежит ни одному из множеств Мп, следовательно, х U Мп, т. е. R ф J Мп, в про- п п тиворечии с предположением. В частности, всякое полное метрическое пространство без изолированных точек несчетно. Действительно, в таком про- странстве каждое множество, содержащее лишь одну точку, ни- где не плотно. 4. Пополнение пространства. Если пространство R не полно, то его всегда можно включить некоторым (и, по существу, един- ственным) способом в полное пространство. Определение 2. Пусть R —• метрическое пространство. Полное метрическое пространство R* называется пополнением пространства R, если: 1) R является подпространством пространства R*; 2) R всюду плотно в R*, т. е. [Я] = R*. (Здесь [7?] означает, естественно, замыкание пространства R в R*.) Например, пространство всех действительных чисел является пополнением пространства рациональных чисел. Теорема 3. Каждое метрическое пространство R имеет по- полнение, и это пополнение единственно с точностью до изомет- рии, оставляющей неподвижными точки из R. Доказательство. Начнем с единственности. Нам нужно доказать, что если R* и R** — два пополнения простран- ства R, то существует такое взаимно однозначное отображение <р пространства R* на R**, что 1) ф(х) = х для всех х е R-, 2) если х* •*-* х** и у* у**, то рДх*, у*) = р2(х**, у**), где pi — расстояние в R*, а р2 — расстояние в R**. Отображение <р определяется следующим образом. Пусть х* — произвольная точка из R*. Тогда, по определению пополне- ния существует последовательность {хп} точек из R, сходящаяся к х*. Точки {хп} входят и в R**. Так как R** полно, то {хп} схо- дится в R** к некоторой точке х**. Ясно, что х** не зависит от выбора последовательности {хп}> сходящейся в точке х*. Поло- жим <р(х*) = х**. Отображение <р и есть искомое изометрическое отображение.
72 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА (ГЛ. И Действительно, по лее, пусть {х„}->х* {yn}-*y* построению ф(х) = х для всех хеR. Да- в R* и {хп} -> х** в R**, в R* н {уп}-»у** в R**; тогда в силу непрерывности расстояния, Pi« У*) = Нт Р1(хп, уп) = lim р(х„, уп) п->со и, аналогично, р2 (х**, у**) = lim р2 (х„, уп) = lim р (х„, уп). rt->oo Следовательно, Р1 (X*, /) = Р2 (X**, у**). Докажем теперь существование пополнения. Идея этого доказательства та же, что и в канторовой теории действитель- ных чисел. Положение здесь даже проще, чем в теории действи- тельных чисел, так как там для вновь вводимых объектов — ир- рациональных чисел — требуется еще определить все арифмети- ческие операции. Пусть R—произвольное метрическое пространство. Назовем две фундаментальные последовательности{хп} и {x'j из R экви- валентными (обозначение {хп}— {хп})> если Нт р (хп, х'} — 0. Л-> СО Название «эквивалентность» оправдано, поскольку это отноше- ние рефлексивно, симметрично и транзитивно. Отсюда следует, что все фундаментальные последовательности, которые можно составить из точек пространства R, распадаются на классы экви- валентных между собой последовательностей. Определим теперь пространство R*. За его точки мы примем всевозможные классы эквивалентных между собой фундаментальных последовательно- стей, а расстояние между ними зададим следующим образом. Пусть х* и у* — два таких класса. Выберем в каждом из этих классов по одному представителю, т. е. по некоторой фундамен- тальной последовательности {хп} и {уп}- Положим ') р(х*,/)= lim р(х„, i/„). (3) П->со Докажем корректность этого определения расстояния, т. е. докажем, что предел (3) существует и не зависит от выбора представителей {хп} е х* и {z/n} е у*. В силу неравенства I Р (хп, уп) р (хт, Ут) | р (Хп, Хт) р (уп, Z/m) (4) ’) Чтобы не усложнять запись мы обозначаем расстояние, в R* тем же символом р, что и расстояние в исходном пространстве R.
$ 3] ПОЛНЫЕ МЕТРИЧЕСКИЕ ПРОСТРАНСТВА 73 получаем, что для всех достаточно больших пит I Р (хп, уп) — р (хт, ут) | < е, так как последовательности {хп} и {уп} фундаментальные. Таким образом, последовательность действительных чисел sn = р(хп, уп) удовлетворяет критерию Коши и, следовательно, имеет предел. Этот предел не зависит от выбора {хп} е х* и {z/n} е у*. Дей- ствительно, пусть К}> и ОЛ’ {у'^у'- Выкладка, в точности аналогичная (4), дает IР (Л> Уп) ~ Р «> Уп) I < Р (А> хп) + Р (Уп> Уп)- Поскольку {хп} ~{%'} и {уп}~{у'п}, отсюда следует, что Um р(х„, j/„)= lim р(х'п, y'J. П~^ ОО Я“> О° Докажем теперь, что в R* выполнены аксиомы метрического пространства. Аксиома 1) непосредственно вытекает из определения экви- валентности фундаментальных последовательностей. Аксиома 2) очевидна. Проверим теперь аксиому треугольника. Так как в исходном пространстве R аксиома треугольника выполнена, то Р (•'"п, 2-п) Р Уп) “Ь Р (Ут %п)- Переходя к пределу при п->оо, получаем lim р (хп, zn) < lim р (хп, уп) + lim р (уп, zn), П-**> n->°° т. е. р « Z*) < р « у*) + р (у*, Z*). Докажем теперь, что R можно рассматривать как подпро- странство пространства R*. Каждой точке хе R отвечает некоторый класс эквивалент- ных фундаментальных последовательностей, именно, совокуп- ность всех последовательностей, сходящихся к точке х. Этот класс непуст, поскольку он содержит стационарную последова- тельность, все члены которой равны х. При этом, если х — lim хп и у — lim уп, то п+°° р (х, у) = lim р (х„, уп). Следовательно, соотнеся каждой точке х е R класс х* сходя- щихся к ней фундаментальных последовательностей, мы изомет- рически отобразим R в пространство R*. В дальнейшем мы
74 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. II можем не различать само пространство R и его образ в R* и рассматривать R как подпространство в R*. Покажем теперь, что R всюду плотно в R*. Действительно, пусть х* — некоторая точка из R* и в > 0 произвольно. Выбе- рем в х* представителя, т. е. некоторую фундаментальную после- довательность {хп}. Пусть N таково, что p(xn, хт) <Z в для всех n,m>N. Тогда имеем p(*n, х*)= Нт р(х„, хт)<е о© при п > /V, т. е. произвольная окрестность точки х* содержит не- которую точку из R. Таким образом, замыкание 7? в R* есть все R*. Остается доказать полноту R*. Заметим, прежде всего, что по построению R* любая фундаментальная последовательность Х[, Х2, .... хп, ... точек из R сходится в R* к некоторой точке, а именно, к точке х* е R*, определяемой самой этой последова- тельностью. Далее, так как R плотно в R*, то для любой фунда- ментальной последовательности х*, х*, . . ., х*, . . . точек из R* можно построить эквивалентную ей последовательность хь Хг, ... . . ., Хп, . • • точек из R. Для этого достаточно в качестве хп взять любую точку из R, такую, что р(хп, х*) < 1/га. Построенная по- следовательности {хп} фундаментальна в 7? и, по определению, сходится к некоторой точке х* е R*. Но тогда к х* сходится и последовательность {х*}. § 4. Принцип сжимающих отображений и его применения 1. Принцип сжимающих отображений. Ряд вопросов, связан- ных с существованием и единственностью решений уравнений того или иного типа (например, дифференциальных уравнений), можно сформулировать в виде вопроса о существовании и един- ственности неподвижной точки при некотором отображении со- ответствующего метрического пространства в себя. Среди раз- личных критериев существования и единственности неподвижной точки при такого рода отображениях один из простейших и в то же время наиболее важных — так называемый принцип сжи- мающих отображений. Пусть R — метрическое пространство. Отображение А про- странства R в себя называется сжимающим отображением, или короче, сжатием, если существует такое число а < 1, что для любых двух точек х, у ^.R выполняется неравенство р(Дх, Лг/)<ар(х, у). (1) Всякое сжимающее отображение непрерывно. Действительно, если Хп-*х, то в силу (1) и Ахп->Ах.
4] ПРИНЦИП СЖИМАЮЩИХ ОТОБРАЖЕНИИ И ЕГО ПРИМЕНЕНИЯ 75 Точка х называется неподвижной точкой отображения А, если Ах — х. Иначе говоря, неподвижные точки — это решения уравнения Ах = х. Теорема 1 (Принцип сжимающих отображе- ний). Всякое сжимающее отображение, определенное в полном метрическом пространстве R, имеет одну и только одну непо- движную точку. Доказательство. Пусть Хо— произвольная точка в R. Положим X] = Ахо, х2 = Axi = А2х0 и т. д.; вообще, хп = = Лхп-i = Апх0. Покажем, что последовательность {хп} фундаментальная. Действительно, считая для определенности m п, имеем Р (Хп> %m) = Р С4 Хо, А Хо) р (Xq, Хт—п) а" {р (х0, X]) + р (хь х2) + ... + р (хт_„_], хга_п)} «С апр (х0, Х[) {1 + а + а2 + ... + ат-п~ < апр (х0, х^ j 2 а • Так как а < 1, то при достаточно большом п эта величина сколь угодно мала. В силу полноты R последовательность {хп}, будучи фундаментальной, имеет предел. Положим х= lim х„. Тогда в силу непрерывности отображения А Ах = А lim х„ = lim Ахп = lim хп+1 = х. П->оо П->оо rt->oo Итак, существование неподвижной точки доказано. До- кажем ее единственность. Если Лх = х, Ау — у, то неравенство (1) принимает вид р(х, г/)<ар(х, г/); так как а <; 1, отсюда следует, что р(х, г/) = 0, т. е. х — у. Упражнение. Показать на примере, что отображение А, удовлетво- ряющее условию р(Дх, Ау) < р(х, у) для всех х У= у, может не иметь ни од- ной неподвижной точки. 2. Простейшие применения принципа сжимающих отображе- ний. Принцип сжимающих отображений можно применять к до- казательству теорем существования и единственности решений для уравнений различных типов. Помимо доказательства суще- ствования и единственности решения уравнения Ах = х, принцип
76 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. П сжимающих отображений дает и фактический метод приближен- ного нахождения этого решения (метод последователь- ных приближений). Рассмотрим следующие простые при- меры. 1. Пусть f — функция, которая определена на сегменте [а, &], удовлетворяет условию Липшица I f (х2) — f (xi)-l < КI х2 — xt |, с константой К <. 1 и отображает сегмент [а, fe] в себя. Тогда f есть сжимающее отображение и, согласно доказанной теореме, последовательность х0, x1 = f(x0), x2 = f(xi), ... сходится к единственному корню уравнения х = f(x). В частности, условие сжимаемости выполнено, если функция имеет на сегменте [a, fe] производную f'(x), причем |f'(x)|^ </<< 1. На рис. 9 и 10 изображен ход последовательных приближе- ний в случае 0 < f'(x) < 1 и в случае —1 < f'(x) < 0- Пусть теперь мы имеем дело с уравнением вида F(x) = 0, причем F(a) < 0, F(b) > 0 и 0 < К\ ?'(х) К2 на [а, &]. Вве- дем функцию f(x) = x — XF(x) и будем искать решение уравне- ния x = f(x), равносильного уравнению F(x) = 0 при X =/= 0. Так KaKf'(x)=l—kF'(x), то 1—'/.К2 f' (х) 1—ХК, и не- трудно подобрать число X так, чтобы можно было действовать методом последовательных приближений. Это — распространен- ный метод отыскания корня. 2. Рассмотрим отображение А га-мерного пространства в себя, задаваемое системой линейных уравнений п Vi = chjXj + (i = 1, 2..............га).
| 4) ПРИНЦИП СЖИМАЮЩИХ ОТОБРАЖЕНИИ И ЕГО ПРИМЕНЕНИЯ 77 Если А есть сжатие, то мы можем применить метод последо- вательных приближений к решению уравнения х = Ах. При каких же условиях отображение А будет сжатием? От- вет на этот вопрос зависит от выбора метрики в пространстве. Рассмотрим три варианта. а) Пространство R2,, т. е. р (х, у) = max | х{ —- yt |; = (max £ | ац Q р (х', х"). Отсюда условие сжимаемости £|а;/К<х<1, i=l, п. (2) /=| п б) Пространство R7, т. е. р(х, у) = I xi ~ У1 h Р (у', у") = Е I y'i — у" I = Е | Е (х' — х'') | < < Е Е | atl 11 х' - х/ | < (max £ | a{j|) р (х', х"). Отсюда условие сжимаемости Е|а0|<а<1, /=1, ..., п. (3) в) Пространство R", т. е. р(х, у) — Е ~ У^2- На осно- вании неравенства Коши — Буняковского имеем Р2 (/,'/') = Е (Е «г/ (*j — x'j'lj2 < (Е Е а2,) Р2 (х', х"). Отсюда условие сжимаемости ЕЕйЬ<“<1- (4) i / Таким образом, если выполнено хотя бы одно из условий *) (2) — (4), то существует одна и только одна точка (хь х2,..., хп) ’) В частности, из любого из условий (2)—(4) вытекает, что Оц — 1 012 • • • Ощ ^21 О22 1 • • • а2П 0. ani оП2 ... апп — 1
78 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. II такая, что xt = У, ЯцХ/ + blt причем последовательные прибли- жения к этому решению имеют вид х<°> = ^(0), A.(0)j х^ = (Х(1); Х(1>, .... Х(1)); Х^..... где „ х^^х?-»-^, а в качестве х(0) = (х(10), ..х<^) можно взять любую точку из Rn. Каждое из условий (2) — (4) достаточно для того, чтобы отображение у = Ах было сжатием. Относительно условий (2) и (3) можно было бы доказать, что они и необходимы для того, чтобы отображение у = Ах было сжатием (в смысле мет- рик а) или б) соответственно). Ни одно из условий (2) — (4) не необходимо для применимо- сти метода последовательных приближений. Если |аг;|<1/п, то все три условия (2) — (4) выполнены и метод последовательных приближений заведомо применим. Если | ац | 1/п, то ни одно из условий (2) — (4) не выпол- нено. 3. Теоремы существования и единственности для дифферен- циальных уравнений. В предыдущем пункте были даны два про- стейших примера применения принципа сжимающих отображе- ний в одномерном и в n-мерном пространствах. Однако наиболее существенны для анализа применения этого принципа в беско- нечномерных функциональных пространствах. Сейчас мы пока- жем, как с его помощью можно получить теоремы существова- ния и единственности решения для некоторых типов дифферен- циальных и интегральных уравнений. 1. Задача Коши. Пусть дано дифференциальное уравне- ние < = (5) с начальным условием У(х0) = у0, (6) причем функция f определена и непрерывна в некоторой пло- ской области G, содержащей точку (х0, уо), и удовлетворяет в этой области условию Липшица по у. I f (х, уд — f (х, у2) |< М | г/1 — г/21.
ПРИНЦИП СЖИМАЮЩИХ ОТОБРАЖЕНИИ И ЕГО ПРИМЕНЕНИЯ 79 Докажем, что тогда на некотором сегменте |х— x0|^d су- ществует, и притом только одно, решение у = ф(х) уравнения (5), удовлетворяющее начальному условию (6) (теорема Пи- кара). Уравнение (5) вместе с начальным условием (6) эквивалент- но интегральному уравнению X ф (х) = У о + р (t, ф (/)) dt. (7) Хп В силу непрерывности функции f имеем |f(x, у) | К в некото- рой области G' cz G, содержащей точку (х0, Уо)- Подберем d > 0 так, чтобы выполнялись условия: 1) (х, у) е G', если | х — х01 d, | у — Уо | Kd; 2) Md < 1. Обозначим через С* пространство непрерывных функций ф, определенных на сегменте |х— x0|^d и таких, что |ф(х)— — Уо | AV/, с метрикой р (фь ф2) = шах | ф! (х) — ф2 (х) |. X Пространство С* полно, так как оно является замкнутым под- пространством полного пространства всех непрерывных функций на [х0 — d, Хо + d]. Рассмотрим отображение ф = Дф, определяе- мое формулой X Ф(х) = Уо+ j f(t, 4>(t))dt, где |х — х0|<Д Это отображение переводит полное простран* ство С* в себя и является в нем сжатием. Действительно, пусть Ф е С*, | х — Хо | d. Тогда I Ф W — У о I = f(t, ф(0)Л ^Kd и, следовательно, Д(С*)сг С*. Кроме того, X I Ч>1 (х) — ф2 (х) к j I f (t, ф( (/)) — f (t, ф2(0) j dt < Md max | qpj (x) — qp2 (x) |. X Так как Md < 1, то A — сжатие. Отсюда вытекает, что уравнение ф — Дф (г. е. уравнение (7)) имеет одно и только одно решение в пространстве С*. 2. Задача Коши для системы уравнений. Пусть дана система дифференциальных уравнений ф'Дх) = ?.(х, ф,(х), ..., Ф„(х)), / = 1, 2, ...,« (8)
80 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА (ГЛ. И с начальными условиями <Pi(Xo) = f/o,-, t=l, 2.....п, (9) причем функции fi определены и непрерывны в некоторой обла- сти G пространства R’H', содержащей точку (х0, с/01......Уоп), и удовлетворяют условию Липшица | ft (х, у\'\ ..., y<f>) - fi(x, .... у™) | < Af max | c/<'> — г/<2> |. 1 i ^.n 1 Докажем, что тогда на некотором сегменте |х— x0|^d су- ществует одно и только одно решение начальной задачи (8), (9), т. е: одна и только одна система функций ср,, удовлетворяющих уравнениям (8) и начальный условиям (9). Система (8) вместе с начальными условиями (9) эквивалент- на системе интегральных уравнений X 4i(x) = y0l + .....qn(t))dt, i=l.........n. (10) Xf, В силу непрерывности функции fi ограничены в некоторой об- ласти G' с G, содержащей точку (х0, Уо\, > Уоп), т. е. суще- ствует такое постоянное число К, что |fi(x, У\, ..., уп) | К. Подберем d > 0 так, чтобы выполнялись условия: 1) (х, yi.....yn)^G', если |х —х0|^< |г/, — r/0»| Kd\ i = I, ..., п; 2) Md< 1. Рассмотрим пространство Сп, элементами которого являются наборы ср = (qpi, • • •, фп) из п функций, определенных и непре- рывных при |х — х0| d, и таких, что |ср<(х)—Опре- делим метрику формулой Р(ф, ф)= max| Ф( (х) — ф, (х) |. X, i Введенное пространство полно. Отображение ф = Дер, зада- ваемое системой равенств X Ф.- W = Ут + J fi (Л qpi (0..... (0) dt, Хц есть сжимающее отображение полного пространства С*п в себя. Действительно, Ф'/Ч*) — X = 5 [fi (t, ф[>(0...Ф<*> (О) - fi ft, Ф(12> (0.Ф(„2> (t)y\dt Xi
ПРИНЦИП СЖИМАЮЩИХ ОТОБРАЖЕНИЙ И ЕГО ПРИМЕНЕНИЯ 81 и, следовательно, max | (х) — (х) | < Md max | ф<‘> (х) — ф^ (х) Отображение А — сжимающее, поскольку Md <Z 1. Отсюда вытекает, что операторное уравнение ф = Дф имеет одно и только одно решение в пространстве С*п. 4. Применение принципа сжимающих отображений к инте- гральным уравнениям. 1. Уравнения Фредгольма. Применим теперь метод сжимающих отображений для доказательства существования и единственности решения неоднородного линейного интегрально- го уравнения Фредгольма второго рода, т. е. уравнения ъ /(х) = Л ^(х, г/)/(г/)сГг/4-ф(х), (11) а. где К (так называемое ядро) и ф суть данные функции, f — иско- мая функция, а X — произвольный параметр. Мы увидим, что наш метод применим лишь при достаточно малых значениях параметра X. Предположим, что /((х, у) и ф(х) непрерывны при а х Ь, а у b и, следовательно, | /((х, у) | М. Рассмотрим отобра- жение g = Af полного пространства С[а, 6] в себя, задаваемое формулой ь g(x) = Л J (х, у) f (у) dy + <P (*)• а Имеем p(gi, g2) = max|g1(x) — g2(x)|<|A,| М (b — а)тах\{{ (x) — f2 (х) |. Следовательно, при Л < м отображение А — сжимающее. Из принципа сжимающих отображений заключаем, что для всякого X с | Л | < уравнение Фредгольма имеет един- ственное непрерывное решение. Последовательные приближения к этому решению /о. fi....fn, .. имеют вид ь fn(x) = X^K (х, у) /„_! (у) dy 4- ф(х), а где в качестве /о(х) можно взять любую непрерывную функцию.
82 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. П 2. Нелинейные интегральные уравнения. Прин- цип сжимающих отображений можно применить и к нелиней- номуинтегральномууравнению вида ь f W = A j /((х, у, f(y))dy + <f(x), (12) а где К и <р непрерывны и, кроме того, ядро К удовлетворяет усло- вию Липшица по своему «функциональному» аргументу; | К (х, у; z,) — К (х, у, z2) К М| zi — z21. В этом случае для отображения g — Af полного пространства С [а, 6] в себя, заданного формулой ь g(x) = K^K(x,y,f(y))dy + <f(x), (13) а имеет место неравенство max | g, (х) — g2 (х) К | A |М (b — a) max | (х) — f2 (х) где gi = Aflt g2 = Af2. Следовательно, при | А | < -м а) ото- бражение А будет сжимающим. 3. Уравнения Вольтерра. Рассмотрим, наконец, инте- гральное уравнение типа Вольтерра X f (х) = А /С (х, y)f(y)dyA-<f(x). (14) а Здесь, в отличие от уравнений Фредгольма, верхний предел в интеграле — переменная величина х. Формально это уравнение можно рассматривать как частный случай уравнения Фредголь- ма, доопределив функцию К равенством: 2((х, у) = 0 при у > х. Однако в случае интегрального уравнения Фредгольма мы были вынуждены ограничиться малыми значениями параметра А, а к уравнениям Вольтерра принцип сжимающих отображений (и метод последовательных приближений) применим при всех значениях А. Точнее, речь идет о следующем обобщении принци- па сжимающих отображений. Пусть А — такое непрерывное отображение полного метриче- ского пространства R в себя, что некоторая его степень В = Ап является сжатием-, тогда уравнение Ах = х имеет одно и только одно решение.
45] ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА 83 Действительно, пусть х— неподвижная точка отображения В, т. е. Вх = х. Имеем: Ах = АВкх = Вк Ах = Вкх0 —> х (£->оо), ибо отображение В — сжимающее, а потому последовательность Вхо, В2х0, В3х0, ... для любого х0 R сходится к неподвижной точке х отображения В. Следовательно, Ах = х. Эта неподвижная точка единственна, поскольку всякая точ- ка, неподвижная относительно А, неподвижна и относительно сжимающего отображения Ап, для которого неподвижная точка может быть только одна. Покажем теперь, что некоторая степень отображения X Af(x) = ?^K(x, y)f(y)dy + <p(x) является сжатием. Пусть fi и /г — две непрерывные функции на •отрезке [а, й]. Тогда X I Af1 (х) - Af2 (х) I = | X | $ Д' (х, у) (f, (у) - f2 (у)) dy а < I X | М (х — a) max | fl (х) — f2 (х) |. Здесь М = гпах| Д (х, у) |. Отсюда | A2f! (х) — A2f2 (х) К | X |2 М2 (x~2ayi- max | (х) — f2 (х) | и, вообще, | Anft (х) - Anf2(х) К| X ГМп {х~а}П m < | X ГМпт (Ь~а)П- где т = max | Л (х) — f2 (х) |. При любом значении X число п можно выбрать настолько большим, что ^1пМп(Ь-а)п nl < • Тогда отображение Ап будет сжатием. Итак, уравнение Воль- терра (14) при любом X имеет решение, и притом единственное. § 5. Топологические пространства 1. Определение и примеры топологических пространств. Основные понятия теории метрических пространств (предельная точка, точка прикосновения, замыкание множества и т. д.) мы вводили, опираясь на понятие окрестности или, что, по существу,
84 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 1Г то же самое, на понятие открытого множества. Эти последние понятия (окрестность, открытое множество) в свою очередь оп- ределялись с помощью метрики, заданной в рассматриваемом пространстве. Можно, однако, стать на другой путь и, не вводя в данном множестве /? метрику, непосредственно определить в /? систему открытых множеств посредством аксиом. Этот путь, обеспечивая значительно большую свободу действий, приводит нас к топологическим пространствам, по отношению к которым метрические пространства представляют собой хотя и весьма важный, но несколько специальный случай. Определение. Пусть X — некоторое множество — про- странство-носитель. Топологией в X называется любая система т его подмножеств G, удовлетворяющая двум требованиям: 1°. Само множество X и пустое множество 0 принадлежат т. 2°. Сумма [J Ga любого (конечного или бесконечного) и а п пересечение П G^ любого конечного числа множеств из т при- надлежат т. Множество X с заданной в нем топологией т, т. е. пара (X, г), называется топологическим пространством. Множества, принадлежащие системе т, называются откры- тыми. Так же как метрическое пространство есть совокупность мно- жества точек—«носителя» и введенной в этом множестве мет- рики, топологическое пространство есть совокупность множества точек и введенной в 'нем топологйи. Таким образом, задать топо- логическое пространство — это значит задать некоторое множе- ство X и задать в нем топологию т, т. е. указать те подмноже- ства, которые считаются в X открытыми. Ясно, что водном и том же множестве X можно вводить разные топологии, превращая его тем самым в различные топо- логические пространства. И все же топологическое пространство, т. е. пару (X, т), мы будем обозначать одной буквой, скажем, Т. Элементы топологического пространства мы будем называть точ- ками. Множества Т\ G, дополнительные к открытым, называются замкнутыми множествами топологического пространства Т. Из аксиом 1° и 2° в силу соотношений двойственности (§ 1 гл. I)’ вытекает, что: 1. Пустое множество 0 и все Т замкнуты. 2. Пересечение любого (конечного или бесконечного) числа и сумма конечного числа замкнутых множеств замкнуты. На основе этих определений естественно вводятся во всяком топологическом пространстве понятия окрестности, точки при- косновения, замыкания множества и т. д. Именно:
f 5] ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА 85- Окрестностью точки х е Т называется всякое открытое мно- жество G с Г, содержащее точку х; точка х е Т называется точ- кой прикосновения множества М czT, если каждая окрестность точки х содержит хотя бы одну точку из М- х называется пре- дельной точкой множества М, если каждая окрестность точки х содержит хотя бы одну точку из М, отличную от х. Совокупность всех точек прикосновения множества М называется замыканием множества М и обозначается символом [Af]. Легко доказать (про- ведите это доказательство), что замкнутые множества (опреде- ленные нами выше как дополнения открытых), и только они, удовлетворяют условию [М] = М. Как и в случае метрического пространства, [М] есть наименьшее замкнутое множество, содер- жащее М. Упражнение. Докажите, что операция замыкания [AJ], определенная с помощью топологии, обладает свойствами 1)—4), сформулированными в теореме 1 § 2. Примеры. 1. В силу теоремы 3' § 2 открытые множества ВО' всяком метрическом пространстве удовлетворяют аксиомам 1° и 2° определения топологического пространства. Таким образом, всякое метрическое пространство является и топологическим пространством. 2. Пусть Т — произвольное множество. Будем считать откры- тыми все его подмножества. Аксиомы 1° и 2° при этом, очевидно, выполнены, т. е. мы действительно получаем топологическое про- странство. В нем все множества одновременно и открыты и замк- нуты, и, значит, каждое из них совпадает со своим замыканием. Такой дискретной топологией обладает, например, метриче- ское пространство, указанное в примере 1 § 1. 3. В качестве другого крайнего случая рассмотрим в произ- вольном множестве X тривиальную топологию, состоящую только из двух множеств: всего X и пустого множества 0. Здесь замыкание каждого непустого множества есть все X. Такое то- пологическое пространство можно назвать «пространством слип- шихся точек». 4. Пусть Т состоит из двух точек а и Ь, причем открытыми множествами мы считаем все Т, пустое множество и множество, состоящее из одной точки Ь. Аксиомы 1° и 2° здесь выполнены. В этом пространстве (которое часто называют связным двоето- чием) замкнуты такие подмножества: все Т, пустое множество и точка а. Замыкание одноточечного множества {Ь} есть все Т. Упражнение. Постройте все топологии в пространстве X, состоящем из двух, трех, четырех и пяти точек. 2, Сравнение топологий. Пусть на одном и том же носителе X заданы две топологии Ti и Тг (тем самым определены д в а топологических пространства: 7’1= (X, ti) и Т2 = (Х, Тг)- Мы
«6 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. [J скажем, что топология Х[ сильнее, или тоньше топологии т2, если •система множеств хг содержится в хь Про топологию хг при этом говорят, что она слабее, или грубее, чем хр В совокупности всех возможных топологий множества X есте- ственным образом вводится частичная упорядоченность (тополо- гия Т2 предшествует xi, если она слабее, чем xj. В этой совокуп- ности топологий есть максимальный элемент — топология, в ко- торой все множества открыты (пример 2), — и минимальный — топология, в которой открыты только все X и 0 (пример 3). Теорема 1. Пересечение произвольного множества тополо- гий х — А ха в X есть топология в X. Эта топология х слабее лю- а бой из топологий ха. Доказательство. Ясно, что П та содержит X и 0. Да- а лее, из того, что каждое ха замкнуто относительно взятия любых сумм и конечных пересечений, следует, что этим свойством об- ладает и х = П та- а Следствие. Пусть S3 — произвольный запас подмножеств множества X; тогда существует минимальная топология в X, со- держащая S3. Действительно, топологии, содержащие S3, существуют (на- пример, та, в которой все А с X открыты). Пересечение всех то- пологий, содержащих S3, и есть искомая. Эта минимальная топо- логия называется топологией, порожденной системой S3, и обо- значается x(S3). Пусть X — произвольное множество и А — его подмножество. Следом системы множеств S3 на подмножестве А называется си- стема 53а, состоящая из подмножеств вида А П В, Be S3. Легко видеть, что след (на Д) топологии х (заданной в X) является топологией та в А. Таким образом, всякое подмножество А лю- бого топологического пространства само оказывается топологи- ческим пространством. Топологическое пространство (Д, тА) на- зывается подпространством исходного топологического простран- ства (X, х). Ясно, что две различные топологии, xi и т2, в X могут порождать одну и ту же топологию в А с X. Топология та на- зывается относительной топологией в А. 3. Определяющие системы окрестностей. База. Аксиомы счетности. Как мы видеДИ, задать в пространстве Т тополо- гию — это значит задать в нем систему открытых множеств. Од- нако в конкретных задачах бывает удобно задавать не всю топо- логию, а лишь некоторую ее часть, т. е. некоторый запас откры- тых множеств, по которому однозначно определяется совокуп- ность всех открытых подмножеств. Так, например, в метриче- ском пространстве мы ввели сначала понятие открытого шара (е-окрестности), а затем определили открытые множества как
$ 5] ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА 87 такие, в которых каждая точка содержится вместе с некоторой своей шаровой окрестностью. Иными словами, в метрическом пространстве открыты те и только те множества, которые можно представить как суммы открытых шаров (в конечном или беско- нечном числе). В частности, на прямой открыты множества,, представимые в виде сумм интервалов, и только они. Эти сооб- ражения приводят нас к важному понятию базы топологиче- ского пространства. Определение. Совокупность 3 открытых подмножеств на- зывается базой топологии пространства Т, если всякое откры- тое множество в Т может быть представлено как сумма некото- рого числа (конечного или бесконечного) множеств из 3. Так, например, совокупность всех открытых шаров (с произ- вольным центром и радиусом) образует базу в метрическом пространстве. В частности, система всех интервалов — база на прямой. Базу на прямой образуют и одни только интервалы с рациональными концами, поскольку в виде суммы таких ин- тервалов можно представить любой интервал, а значит, и лю- бое открытое множество на прямой. Итак, топологию т пространства Т можно задать, указав в этом пространстве некоторую ее базу 3-, эта топология т совпа- дает с совокупностью множеств, представимых как суммы мно- жеств из 3. Всякая база 3 в топологическом пространстве Т = (X, т) об- ладает следующими двумя свойствами: 1) любая точка хе X содержится хотя бы в одном G ^3\ 2) если х содержится в пересечении двух множеств Gi и G2 из 3, то существует такое G3 е 3, что х е= G3 с Gi П G2. Действительно, свойство 1) просто означает, что все X, бу- дучи открытым, должно представляться как сумма каких-то мно- жеств из 3, а 2) вытекает из того, что Gi П G2 открыто и, сле- довательно, есть сумма каких-то элементов базы. Обратно, пусть X — произвольное множество и 3 — система подмножеств в X, обладающая свойствами 1) и 2). Тогда сово- купность множеств, представимых как суммы множеств из 3, образует в X топологию (т. е. удовлетворяет аксиомам 1° и 2°" определения топологического пространства). Действительно, пусть т(3)— совокупность всех множеств из X, представимых как суммы множеств из 3. Тогда пустое мно- жество ') и все X принадлежат т(3) и сумма любого числа мно- жеств из т(3) также принадлежит т(3). Покажем, что пересе- чение любого конечного числа множеств из х(3) принадлежит ’) Оно получается как сумма пустого множества элементов системы У».
«8 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. П т(^). Достаточно проверить это для двух множеств. Пусть А — J Ga и В= Gp, тогда 4f|B^= U (Ga Г1 Gp). Из условия 2) следует, что каждое Ga П G$ содержится в т(З’). Но тогда и А ПВ е t(S’). Итак, мы получаем следующий результат. Теорема 2. Для того чтобы система 3 подмножества G множества X была базой некоторой топологии в X необходимо и достаточно, чтобы 3 обладала свойствами 1) и 2). Пусть теперь в пространстве Т задана некоторая фиксиро- ванная топология т. Взяв в Т некоторую систему 3 открытых множеств, обладающую свойствами 1) и 2), и приняв ее за базу, мы очевидно получили в Т топологию т(3), или совпадающую с исходной топологией т, или более слабую. Установим условия, при которых 3 порождает именно данную топологию т. Теорема 3. Для того чтобы система 3 с:т была базой дан- ной топологии т, необходимо и достаточно следующее условие-. 3) для каждого открытого множества G и каждой точки x^G существует такое Gx е 3, что x^GxcG. Доказательство. Если условие 3) выполнено, то всякое открытое множество G представимо в виде G= U Gx, x^G т. е. 3 есть база топологии т. Обратно, если 3 есть база тополо- гии т, то всякое Сет представимо в виде суммы множеств из 3, а тогда для всякого хе G найдется такое Gx^3, что x^GxcG. Упражнение. Пусть St и S2 — две базы в X (т. е. две системы мно- жеств, удовлетворяющих условиям 1) и 2) стр. 87), аци т2— определяемые ими топологии. Докажите, что Ti ст2 в том и только том случае, если для .любого Gt е St и любой точки xeG, существует такое G2 е S2, что JceG,c Gt- С помощью теоремы 3 легко установить, например, что во всяком метрическом пространстве совокупность всех открытых шаров образует базу его топологии. Совокупность всех шаров с рациональными радиусами также представляет собой базу. На прямой базой может служить, например, совокупность всех ра- циональных интервалов (т. е. интервалов с рациональными кон- цами). Важный класс топологических пространств образуют про- странства со счетной базой, т. е. такие пространства, в которых существует хотя бы одна база, состоящая не более чем из счетного числа множеств. Пространства со счетной базой называют также пространствами со второй аксиомой счетности. Если в топологическом пространстве Т имеется счетная база, то в нем обязательно имеется счетное всюду плотное множество.
$ 5] ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА 89’ т. е. такое счетное множество, замыкание которого есть все Т. Действительно, пусть {Gn}—такая база. Выберем в каждом ив элементов этой базы произвольную точку хп- Счетное множество X = {хп} всюду плотно в Т, так как в противном случае непу- стое открытое множество G = 7'\[Х] не содержало бы ни одной точки из X, что невозможно, поскольку G есть сумма некоторых множеств из системы {Gn}, а хп е Gn. Топологические пространства со счетным всюду плотным множеством, как и метрические, называются сепарабельными. Для метрических иространств верно утверждение, обратное^ только что доказанному: Если метрическое пространство R сепарабельно, то в R есть и счетная база. Действительно, такую базу образуют, например, открытые шары B(xn, 1М), где {хп}—счетное всюду плотное множество, а п и пг независимо пробегают все натуральные чис- ла. Таким образом, справедлива следующая теорема: Теорема 4. Метрическое пространство R имеет счетную базу тогда и только тогда, когда оно сепарабельно. В силу этой теоремы все примеры сепарабельных метриче- ских пространств могут служить и примерами метрических про- странств со второй аксиомой счетности. Несепарабельное про- странство ограниченных последовательностей (см. пример 9 § 1) не имеет и счетной базы. Замечание. Теорема 4, вообще говоря, неверна для про- извольных (не метрических) топологических пространств: можно указать примеры сепарабельных пространств без счетной базы. Поясним происходящие здесь явления. Для каждой точки х мет- рического пространства R существует счетная система U ее окрестностей (например, система открытых шаров В(х, 1/п)),. обладающая следующим свойством: каково бы ни было откры- тое множество G, содержащее точку х, найдется окрестность из системы U, целиком лежащая в G. Такая система окрестностей называется определяющей системой окрестностей точки х. Если точка х топологического пространства Т имеет счетную определяющую систему окрестностей, то говорят, что в этой точке выполнена первая аксиома счетности. Если это верно для каждой точки пространства Т, то пространство Т называется пространством с первой аксиомой счетности. Всякое метрическое пространство, даже и несепарабельное, автоматически удовлетворяет первой аксиоме счетности. Однако в произвольном топологическом пространстве (даже если оно- состоит лишь из счетного числа точек) первая аксиома счетно- сти может не иметь места. Поэтому те рассуждения, с помощью которых мы для метрического пространства вывели из наличия счетного всюду плотного множества существование в таком про- странстве счетной базы, не переносятся на случай произвольного-
-90 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. И топологического пространства. Но даже и в сепарабельном то- пологическом пространстве с первой аксиомой счетности счетной -базы может не быть. Система множеств {MJ называется покрытием множества X, если U Ма X. Покрытие топологического пространства Т, со- а стоящее из открытых (замкнутых) множеств, называется от- крытым (замкнутым) покрытием. Если некоторая часть {MaJ покрытия {/Wa} сама образует покрытие пространства Т, то {MaJ называется подпокрытием покрытия {MJ. ‘ Теорема 5. Если Т — топологическое пространство со счет- ной базой, то из всякого его открытого покрытия можно выбрать конечное или счетное подпокрытие. Доказательство. Пусть {Оа}—некоторое открытое по- крытие пространства Т. Тогда каждая точка х е Т содержится в некотором Оа. Пусть {Gn} — счетная база в Т. Для каждого х е Т существует такой элемент Gn(x) этой базы, что хе eGn(x)cOa. Совокупность выбранных таким образом мно- жеств Gn(x) конечна или счетна и покрывает все Т. Выбрав для каждого Gn(x) одно из содержащих его множеств Оа, мы и по- лучим конечное или счетное подпокрытие покрытия {Оа}. Тео- рема доказана. По определению топологического пространства пустое мно- жество и все пространство Т одновременно открыты и замкнуты. Пространство, в котором нет никаких других множеств, одновре- менно открытых и замкнутых, называется связным. Прямая ли- ния R1 представляет собой один из простейших примеров связ- ных пространств. Если же из R1 удалить одну или несколько то- чек, то оставшееся пространство уже не будет связным. 4. Сходящиеся последовательности в Т. На топологические пространства легко переносится знакомое нам в случае метри- ческих пространств понятие сходящейся последователь- ности. Именно, последовательность xh х2, ..., хп, ... точек из Т называется сходящейся к точке х, если любая окрестность точки х содержит все точки этой последовательности, начиная с некоторой. Однако в топологических пространствах это поня- тие сходимости не играет той фундаментальной роли, которая ему принадлежит в метрических пространствах. Дело в том, что в метрическом пространстве R точка х есть точка прикосновения множества М cz R в том и только том случае, когда в М суще- ствует последовательность, сходящаяся к х, тогда как в топо- логическом пространстве это, вообще говоря, не так. Из того, что х есть точка прикосновения для М (т. е. принадлежит [Л4]) в топологическом пространстве Т, не вытекает существование в М последовательности, сходящейся к х. Возьмем в качестве примера отрезок [0, 1] и назовем открытыми те его подмноже-
$ 5] ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА ства (наряду с пустым множеством), которые получаются ид него выбрасыванием любого конечного или счетного числа точек. Легко проверить, что требования 1° и 2° (стр. 84) при этом бу- дут выполнены, т. е. мы получим топологическое пространство. В этом пространстве сходящимися будут только стационарные последовательности, т. е. такие, элементы которых, начиная с некоторого номера, совпадают: хп = Хп-н = ... (докажите это!). С другой стороны, если мы возьмем, например, в качестве М полуинтервал (0, 1], то точка 0 будет для него точкой прикосно- вения (проверьте!), но никакая последовательность точек из М не сходится к 0 в нашем пространстве. Сходящиеся последовательности «восстанавливаются в своих правах», если мы рассматриваем не произвольные топологиче- ские пространства, а пространства с первой аксиомой счетности, т. е. если у каждой точки х пространства Т существует счетнан определяющая система окрестностей. В этом случае каждая точка прикосновения х произвольного множества М с. Т может быть представлена как предел некоторой последовательности точек из М. Действительно, пусть {Оп} — счетная определяющая система окрестностей точки х. Можно считать, что On+i с: Оп И \ (иначе мы заменили бы Оп на П Ok I . Пусть хь — произволь- fe=l / ная точка из М, содержащаяся в Ok (k = 1, 2, ...). Ясно, что- такое Xk существует, иначе х не было бы точкой прикосновения для М. Последовательность {хй}, очевидно, сходится к х. Первой аксиоме счетности удовлетворяют, как мы отмечали, все метрические пространства. Именно поэтому мы и смогли все такие понятия, как замыкание, точка прикосновения и т. д., сформулировать для метрических пространств в терминах схо- димости последовательностей. 5. Непрерывные отображения. Гомеоморфизм. Понятие не- прерывного отображения, введенное нами для метрических про- странств в § 1, естественно обобщается на произвольные топо- логические пространства. Определение. Пусть X и У— два топологических про- странства. Отображение f пространства X в пространство У на- зывается непрерывным, в точке хо, если для любой окрестности Uy„ точки г/о —f(xo) найдется такая окрестность V х„ точки х0, что f (У*,) cz Uyil. Отображение f: X -> У называется непрерыв- ным, если оно непрерывно в каждой точке хеХ. В частности, непрерывное отображение топологического пространства X в. числовую прямую называется непрерывной функцией на этом пространстве. Легко убедиться, что для метрических пространств это опре- деление действительно превращается в то определение непре-
”92 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. П рывности отображения одного метрического пространства в дру- гое, которое было дано в § 1. Данное нами определение носит «локальный» характер. Не- прерывность отображения f на всем X определяется через не- прерывность f в каждой точке. Оказывается, что понятие не- прерывности отображения одного топологического пространства в другое можно сформулировать в терминах открытых множеств, т. е. в терминах топологии этих пространств. Теорема 6. Для того чтобы отображение f топологического пространства X в топологическое пространство У было непре- рывным, необходимо и достаточно, чтобы прообраз r = f~l(G) всякого открытого множества G с: У был открыт {в X). Доказательство. Необходимость. Пусть отобра- жение f непрерывно и пусть G — открытое множество в У. Дока- жем, что r = f~1(G) открыто. Пусть х — произвольная точка множества Г и у = f(x). Тогда G служит окрестностью точки у. По определению непрерывности найдется такая окрестность Vx точки х, что f(Vx) с: G, т. е. Vx cz Г. Иначе говоря, если х е Г, то существует окрестность Vx этой точки, содержащаяся в Г. Но это и значит, что Г открыто. Достаточность. Пусть r = f_|(G) открыто, если СсУ открыто. Рассмотрим произвольную точку х е X и произволь- ную окрестность Uy точки y=f(x). Поскольку у е Uу, точка х принадлежит множеству f~l(Uy). Это открытое множество и слу- жит той окрестностью точки х, образ которой содержится в Uy. Замечание. Пусть X и У — произвольные множества и f — отображение X в У: Если в У задана некоторая топология г (т. е. система множеств, содержащая 0 и У и замкнутая отно- сительно взятия любых сумм и конечных пересечений), то про- образ топологии т (т. е. совокупность всех множеств f~'(G), где Сет) будет топологией в X. Для доказательства достаточно вспомнить теоремы о про- образе суммы и пересечения множеств (см. § 2 гл. I). Мы обо- значим эту топологию /"'(т). Если теперь X и У — топологиче- ские пространства с топологиями тх и ту, то теорему 6 можно сформулировать так: отображение f: X -> У непрерывно в том и только том случае, если топология тх сильнее топологии f~l(i:y). Из того, что прообраз дополнения есть дополнение прооб- раза, следует теорема, двойственная к теореме 6. Теорема 6'. Для того чтобы отображение f топологического пространства X в топологическое пространство У было непре- рывно, необходимо и достаточно, чтобы прообраз всякого зам- кнутого множества из У был замкнут (в X). Легко убедиться, что образ открытого (замкнутого) множе- ства при непрерывном отображении не обязательно открыт (замкнут). Рассмотрим, например, отображение полуинтервала
«5] ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА 93 X = [0, 1) на окружность. Множество [*/2, 1), замкнутое в [0, 1), переходит при этом в незамкнутое множество на окружности (рис. 11). Отображение называется открытым, если оно переводит ка- ждое открытое множество снова в открытое. Отображение, пе- реводящее каждое замкнутое мно- жество в замкнутое, называется f(0) замкнутым. Для непрерывных отображений / \ справедлива следующая теорема, л /Л / \ / аналогичная хорошо известной из ' анализа теореме о непрерывности fO/i) сложной функции. Теорема?. Пусть X, Y uZ — то- Рис. 11. пологические пространства и пусть f и ф — непрерывные отображения X в Y и Y в Z соответственно. Тогда отображение х*-*-tp(f(x)) пространства X в Z непре- рывно. Доказательство этой теоремы сразу получается из тео- ремы 6. На топологические пространства распространяется понятие гомеоморфизма, введенное нами в § 1 для метрических про- странств, а именно, отображение f топологического простран- ства X на топологическое пространство У называется гомеомор- физмом, если оно взаимно однозначно и взаимно непрерывно; пространства X и У при этом называют гомеоморфными. Гомео- морфные пространства обладают одними и теми же топологиче- скими свойствами, и с топологической точки зрения их можно рассматривать просто как два экземпляра одного и того же про- странства. Топологии в двух гомеоморфных пространствах слу- жат образами и прообразами друг друга. Отношение гомеоморф- ности рефлексивно, симметрично и транзитивно; поэтому любая совокупность топологических пространств распадается на не- пересекающиеся классы гомеоморфных между собой про- странств. Замечание. Следует иметь в виду, что метрические свойства двух гомеоморфных между собой метрических про- странств могут быть различны1). Так, одно из них может быть полно, а другое — нет. Например, интервал (—л/2, л/2) гомео- морфен числовой прямой (соответствующий гомеоморфизм мож- но задать функцией x-*tgx), но при этом прямая — полное пространство, а интервал — нет. ') Метрика пространства R однозначно определяет его топологию, но не наоборот: одну и ту же топологию в R = (X, р) можно получить, задавая в X различные метрики.
94 Метрические и топологические пространства [гл. и 6. Аксиомы отделимости. Хотя многие из основных понятий теории метрических пространств легко переносятся на произ- вольные топологические пространства, все же такие простран- ства представляют собой объект, слишком общий с точки зрения задач анализа. Здесь возникают ситуации, существенно отли- чающиеся от того, что может иметь место в метрических про- странствах. Так, мы видели, что конечное множество точек в топологическом пространстве может быть не замкнутым (при- мер 4, стр. 85) и т. п. Среди топологических пространств можно выделить про- странства, более близкие по своим свойствам к пространствам метрическим. Для этого следует к аксиомам 1° и 2° топологиче- ского пространства (стр. 84) присоединить еще те или иные дополнительные условия. Такими условиями служат, например, аксиомы счетности; они позволяют изучать топологию простран- ства на основе понятия сходимости. Другой важный тип допол- нительных условий составляют требования иной природы — так называемые аксиомы отделимости. Мы перечислим эту серию аксиом в порядке их постепенного усиления. Аксиома Т\ (первая аксиома отделимости)-, для любых двух различных точек х и у пространства Т существуют окрестность Ох точки х, не содержащая точку у, и окрестность Оу точки у, не содержащая точки х. Пространства, удовлетворяющие этой аксиоме, называются Т\-пространствами. Примером топологического пространства, не являющегося /^-пространством, может служить связное двое- точие. В /^-пространстве любая точка есть замкнутое множество. Действительно, если х у, то существует окрестность Оу точ- ки у, не содержащая х, т. е. у^[х]. Поэтому [х] = х. Следова- тельно, в /^-пространстве замкнуто и любое конечное множество точек. Более того, как легко проверить, аксиома 7\ в точности равносильна требованию замкнутости всех таких множеств. Выше (см. стр. 85) мы определили предельную точку х множества М в топологическом пространстве Т как такую точку, для которой пересечение /7ПЛ4\{х} непусто. Здесь U — про- извольная окрестность точки х. В пространствах, не удовлетворяющих аксиоме 1\, предель- ные точки могут иметь даже множества М, состоящие только из конечного числа точек. Пусть Т — связное двоеточие с тополо- гией, состоящей из 0, {Ь} и {а, Ь}. Тогда точка а является пре- дельной для множества М = {&}. В /^-пространствах такое явление уже не может иметь ме- ста. Именно, верно следующее утверждение. Лемма. Для того чтобы точка х была предельной для мно- жества М в ТГпространстве, необходимо и достаточно, чтобы
I 5] ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА 95 любая окрестность U этой точки содержала бесконечно много точек из М. Достаточность этого условия очевидна. Установим его необ- ходимость. Пусть х — предельная точка для М\ допустим, что Существует такая окрестность U точки х, которая содержит только конечное число точек из М. Пусть х\, х2, ..., хп — все эти точки, кроме самой х (если таковая принадлежит М). Тогда V = U — {%1, ..., хп} — окрестность х и V Я М \ {%} = 0. Всякое метрическое пространство заведомо является ^-про- странством. Поэтому за определение предельной точки множе- ства в метрическом пространстве и было принято свойство, ука- занное в лемме. Усилением первой аксиомы отделимости является аксиома Т2. Аксиома Т2 (вторая, или хаусдорфова, аксиома отделимо- сти): любые две различные точки хну топологического про- странства Т имеют непересекающиеся окрестности Ох и Оу. Пространства, удовлетворяющие этой аксиоме, называются Т2-пространствами, или хаусдорфовыми пространствами. Всякое уаусдорфово пространство есть /^-пространство, но не наоборот. Примером не хаусдорфова /^-пространства может служить от- резок [О, 1], в котором открытыми считаются пустое множество и все множества, получающиеся из отрезка выбрасыванием не более чем счетного числа точек. Аксиома Т3 (третья аксиома отделимости): любая точка и не содержащее ее замкнутое множество имеют непересекаю- щиеся окрестности. При этом окрестностью множества М в то- пологическом пространстве Т называется всякое открытое мно- жество U, содержащее М. Этой аксиоме можно дать следующую эквивалентную фор- мулировку: Любая окрестность U произвольной точки х содержит мень- шую окрестность той же точки, входящую в U вместе со своим замыканием. Читатель может доказать это в качестве упражнения. Поскольку в произвольном топологическом пространстве точка может не быть замкнутым множеством, третья аксиома отделимости интересна только для пространств, удовлетворяю- щих аксиоме 7\. Пространства, удовлетворяющие обеим аксио- мам Тх и Т3, называются регулярными. Всякое регулярное пространство, разумеется, хаусдорфово. Примером хаусдорфова пространства, не являющегося регуляр- ным, может служить отрезок [0, 1], в котором окрестности всех точек, кроме точки 0, определяются обычным способом, а окрест- ностями нуля считаются всевозможные полуинтервалы [0, а), из которых выкинуты точки вида 1/п (п, — 1, 2, ...). Это — хаус- дорфово пространство, но в нем точка 0 и не содержащее ее
96 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. п замкнутое множество {1/п} не отделимы друг от друга непере- секающимися окрестностями, т. е. аксиома Т3 не выполнена. Обычно в анализе не приходится встречаться с простран- ствами более общими, чем регулярные. Более того, как пра- вило, интересные с точки зрения анализа пространства удовле- творяют и следующему более сильному требованию, так назы- ваемой нормальности пространства. Аксиома Т\ (аксиома нормальности): ^-пространство назы- вается нормальным, если в нем всякие два непересекающихся замкнутых множества имеют непересекающиеся окрестности. К нормальным пространствам относятся, в частности, все метрические пространства. Действительно, пусть X и Y — два непересекающихся замкнутых множества в метрическом про- странстве /?. Каждая точка х е X имеет окрестность Ох, не пе- ресекающуюся с У и, следовательно, находится от Y на неко- тором положительном расстоянии рх. Аналогично расстояние каждой точки у е Y от X есть положительная величина ру. Рас- смотрим открытые множества ’) U = U В(х, рж/2) и V= U В(у,ри/2), х^Х y^Y содержащие X и Y соответственно, и покажем, что их пересече- ние пусто. Допустим, что z е U Г) V. Тогда в X существует такая точка х0, что р (х0, z) < pXj/2, а в Y — такая точка у0, что р (z, z/0) < Pyj'X Пусть для определенности РУо- Тогда Р (*о- У о) < Р (*о- z) + Р (2> *о) < Р J2 + РУо/2 < РУо> т. е. х0 е В (yQ, РУо), но это противоречит определению руо. Наше утверждение доказано. Всякое подпространство метрического пространства само яв- ляется метрическим пространством и поэтому всегда обладает свойством нормальности. Это, вообще говоря, неверно для про- извольных нормальных пространств: подпространство нормаль- ного пространства не обязано быть нормальным. Таким обра- зом, нормальность пространства не есть наследственное свойство 2). Наследственным свойством является так называемая полная регулярность топологических пространств, представляющая со- бой важное усиление свойства регулярности. Топологическое Г]-пространство называется вполне регулярным, если для ка- ждого замкнутого множества FczT и каждой точки Xo^T\F существует непрерывная на Т действительная функция f, равная ') Здесь, как обычно, В(х, г) — открытый шар радиуса г с центром х. 3) Свойство Р называется наследственным, если из того, что им обладает данное топологическое пространство Т, следует, что им обладают и все его подпространства.
।S] ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА 97 дулю в точке х0, единице на F и удовлетворяющая условию f(x)^ 1. Всякое нормальное пространство вполне регуляр- но ’)> но не обратно. Любое подпространство вполне регулярного (в частности, нормального) пространства само вполне регуляр- но. А. Н. Тихонов, которому принадлежит и само понятие вполне регулярного пространства, показал, что класс вполне, регуляр- ных пространств совпадает с классом всех подпространств нормальных пространств. С точки зрения анализа вполне ре- гулярные пространства важны потому, что на всяком таком про- странстве имеется «достаточно много» непрерывных функций, именно, для любых различных точек х, у вполне регулярного пространства Т существует определенная на Т непрерывная ве- щественная функция, принимающая в этих точках различные значения. 7. Различные способы задания топологии в пространстве. Метризуемость. Самый прямой способ задать топологию в неко- тором пространстве состоит в том, чтобы непосредственно ука- зать те множества, которые мы считаем открытыми. Набор этих множеств должен удовлетворять требованиям 1° и 2° (см. стр. 84). Равносильный этому двойственный способ — указать, набор замкнутых множеств. Такой набор должен, очевидно, удовлетворять условиям 1 и 2 (стр. 84). Однако фактически этот способ редко может быть применен. Так, например, даже в случае плоскости вряд ли можно дать непосредственное опи- сание всех открытых подмножеств (как это удается сделать для прямой (теорема 5 § 2)). Распространенный способ задания топологии состоит в вы- боре некоторой базы; фактически именно так и вводится топо- логия в метрических пространствах, где мы, опираясь на мет- рику, задаем базу — совокупность открытых шаров. Еще один из возможных способов задать топологию в про- странстве— это ввести в нем понятие сходимости. Однако за пределами метрических пространств такой способ не всегда удо- бен, поскольку, как уже указывалось в п. 4, не всегда переход от множества к его замыканию можно описать в терминах сходящихся последовательностей. Этот способ можно сделать универсальным, обобщив соответствующим образом само по- нятие сходящейся последовательности (см., например, [29], гл. 2). Можно ввести в пространстве топологию, определив в нем аксиоматически операцию замыкания. Именно, говорят, что в множестве X задана операция замыкания, если каждому А а X ’) Этот (совсем не очевидный) факт вытекает из следующей теоремы П. С. Урысона: если Т — нормальное пространство и Fi, F2 — два его непере- секающихся замкнутых подмножества, то на Т существует непрерывная функ- ция, f, 0 f(x) 1, равная нулю на и единице на F2,
98 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА (ГЛ. И поставлено в соответствие некоторое множество [Д] с X, назы- ваемое замыканием. А, причем операция перехода от А к [Д] об- ладает свойствами 1)—4), указанными в теореме 1 § 2. Опреде- лив после этого замкнутые множества как те, для которых [Д] = А, легко показать, что этот класс множеств удовлетворяет условиям 1 и 2 (стр. 84), т. е. действительно определяет в X топологию. Задание метрики — один из важнейших способов введения топологии, хотя и далеко не универсальный. Как мы уже ви- дели, всякое метрическое пространство нормально и удовлетво- ряет первой аксиоме счетности. В пространстве, лишенном хотя бы одного из этих двух свойств, топологию нельзя задать с по- мощью какой бы то ни было метрики. Определение. Топологическое пространство Т называется метризуемым, если его топологию можно задать с помощью ка- кой-либо метрики. В силу только что сказанного нормальность пространства и первая аксиома счетности представляет собой необходимые условия метризуемости пространства. Вместе с тем ни каждое из этих условий в отдельности, ни даже их совокупность недоста- точны для метризуемости пространства. Однако имеет место следующая теорема, принадлежащая П. С. Урысону: Для того чтобы топологическое пространство со счетной ба- зой было метризуемо, необходимо и достаточно, чтобы оно было нормально. Необходимость этого условия ясна; доказательство достаточ- ности имеется, например, в [2]. § 6. Компактность 1. Понятие компактности. Фундаментальную роль в анализе играет следующий факт, известный под названием леммы Г ейне — Борел я: Из любого покрытия отрезка [а, Ь] числовой прямой интер- валами можно выбрать конечное подпокрытие. Это утверждение останется справедливым, если вместо ин- тервалов рассматривать любые открытые множества: из всякого открытого покрытия отрезка [и, Ь] можно выделить конечное подпокрытие. Отправляясь от этого свойства отрезка числовой прямой, введем следующее важное понятие. Определение. Топологическое пространство Т называется компактным, если любое его открытое покрытие содержит ко- нечное подпокрытие. Компактное топологическое пространство, удовлетворяющее аксиоме отделимости Хаусдорфа, называется компактом.
КОМПАКТНОСТЬ 99 «6] Как мы увидим ниже, свойством компактности наряду с от- резками обладают все замкнутые ограниченные подмножества евклидова пространства любой конечной размерности. Наобо- рот, прямая, плоскость, трехмерное пространство служат про- стейшими примерами некомпактных пространств. Назовем некоторую систему подмножеств {Д} множества Т п центрированной, если любое конечное пересечение П Дг членов этой системы не пусто. Из сформулированного определения ком- пактности и соотношений двойственности вытекает следующая теорема. Теорема 1. Для того чтобы топологическое пространство Т было компактным, необходимо и достаточно, чтобы оно удовле- творяло условию: (R) каждая центрированная система его замкнутых подмно- жеств имеет непустое пересечение. Действительно, пусть {FJ — центрированная система замкну- тых подмножеств в Г и пусть Т компактно. Множества Ga=T\Fa открыты, причем из того факта, что никакое ко- п нечное пересечение П Pi не пусто, следует, что никакая конеч- ная система множеств Gt = Т\ Fi не покрывает все Т. Но тогда и все Ga не образуют покрытия (компактность!), а это значит, что nFa#=0. Итак, если Т компактно, то в нем условие (/?) выполнено. Обратно, пусть Т удовлетворяет условию (R) и {Ga} — открытое покрытие пространства Т. Положив Fa = T\GV, получим, что ПЕа = 0, откуда следует (условие (/?)), что си- стема {Еа} не может быть центрированной, т. е. существуют та- п кие F\, ..., Fn, что П Е;=0. Но тогда соответствующие t=i Gi = T\F{ образуют конечное подпокрытие покрытия {Ga}. Итак, условие (R) равносильно компактности. Установим некоторые основные свойства компактных про- странств. Теорема 2. Если Т — компактное пространство, то каждое его бесконечное подмножество имеет хотя бы одну предельную точку. Доказательство. Если Т содержит бесконечное множе- ство X, не имеющее ни одной предельной точки, то в нем можно взять счетное множество Xi = (xi, Хг, . •.), также не имею- щее ни одной предельной точки. Но тогда множества Хп — = (хп, Xn+i, ...) образуют центрированную систему замкнутых- множеств в Т, имеющую пустое пересечение, т. е. Т не компактно. Теорема 3. Замкнутое подмножество компактного про- странства компактно.
100 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. II Доказательство. Пусть F — замкнутое подмножество компактного пространства Т и {Fa} — произвольная центриро- ванная система замкнутых подмножеств подпространства FcT. Тогда каждое Fa замкнуто и в Т, т. е. {Fa}—центриро- ванная система замкнутых множеств в Т. Следовательно, В силу теоремы 1 отсюда следует компактность F. Поскольку подпространство хаусдорфова пространства само хаусдорфово, отсюда получаем: Следствие. Замкнутое подмножество компакта есть ком- пакт. Теорема 4. Компакт замкнут в любом содержащем его хаусдорфовом пространстве. Доказательство. Пусть К— компактное множество в хаусдорфовом пространстве Т и пусть у ф К. Тогда для любой точки х е К существуют окрестность Ux точки х и окрестность Vx точки у такие, что UxftVx = <Z). Окрестности Ux образуют открытое покрытие множества К.. В силу компактности К из него можно выделить конечное под- покрытие Uxe Ux2, •••, Uxn- Положим V = Vxjl Vx2 Л • • • Л Vxn. ТогдаУ—окрестность точки у, не пересекающаяся cUXl U Ux2 U • • • Следовательно, и значит, К замкнуто. Тео- рема доказана. Теоремы 3 и 4 показывают, что в классе хаусдорфовых про- странств компактность есть внутреннее свойство пространства, т. е. всякий компакт остается компактом, в какое бы более ши- рокое хаусдорфово пространство мы его ни включали. Теорема 5. Всякий компакт представляет собой нормаль- ное пространство. Доказательство. Пусть X и Y — два непересекающихся замкнутых подмножества компакта К. Повторив рассуждения, проведенные в доказательстве предыдущей теоремы, легко убе- диться в том, что для каждой точки у е Y существуют такая ее окрестность Uv и такое открытое множество Оу зэ X, что Uy Л Л Оу — 0. Тем самым доказано, что всякий компакт регулярен. Пусть теперь у пробегает множество Y. Выберем из покрытия {Uy} множества Y конечное подпокрытие UVi, ..., UVn. Тогда открытые множества 0(,) = <М ... ло,„ и 0<2>=^,и ... 1Ж„ будут удовлетворять условиям 0(|)=>Х, и О(,)ЛО(2) = 0> а это и означает нормальность.
§ 6] КОМПАКТНОСТЬ 101 2. Непрерывные отображения компактных пространств. Непрерывные отображения компактных пространств, в частно- сти, компактов, обладают рядом интересных и важных свойств. Теорема 6. Непрерывный образ компактного пространства есть компактное пространство. Доказательство. Пусть X— компактное пространство и f — его непрерывное отображение в топологическое пространство Y. Рассмотрим какое-либо покрытие {Ра} образа f(X) откры- тыми в f(X) множествами. Положим Ua = f-1 (Va). Множества Па открыты (как прообразы открытых множеств при непрерыв- ном отображении) и образуют покрытие пространства X. Из этого покрытия можно выбрать, в силу компактности X, конеч- ное подпокрытие Ult U2, .... Un. Тогда множества Vb V2, ... Vn, где Vi = f(Ui), покрывают весь образ f(X) простран- ства X. Теорема 7. Взаимно однозначное и непрерывное отобра- жение ср компакта X на хаусдорфово пространство Y есть гомео- морфизм. Доказательство. Нужно показать, что из условий тео- ремы вытекает непрерывность обратного отображения ф-1. Пусть F — замкнутое множество в X и Р = ф(₽)—его образ в У. В силу предыдущей теоремы Р — компакт и, следователь- но, Р замкнуто в У. Таким образом, прообраз при отображении Ф-1 всякого замкнутого множества F <^Х замкнут. А это и озна- чает непрерывность отображения ф~*. 3. Непрерывные и полунепрерывные функции на компакт- ных пространствах. В предыдущем пункте речь шла о непре- рывных отображениях компакта в хаусдорфово пространство. Частным случаем таких отображений являются отображения компактов в числовую прямую, т. е. числовые функции на ком- пактах. Для таких функций сохраняются основные свойства функций на отрезке, известные из анализа. Теорема 8. Пусть Т — компактное пространство и f — не- прерывная на нем числовая функция. Тогда f ограничена на Т и достигает на Т верхней и нижней граней. Доказательство. Непрерывная функция есть непрерыв- ное отображение Т в числовую прямую R1. Образ Т в R1 в силу общей теоремы 6 компактен. Но, как читателю известно из курса анализа (см. также п. 2 § 7), компактное подмножество числовой прямой замкнуто и ограничено и потому не только имеет конечные верхнюю и нижнюю грани, но и содержит эти трани. Теорема доказана. Упражнение. Пусть К — компактное метрическое пространство и А — такое отображение К в себя, что р(Ах,Ау) <р(х,у) при х у. Показать,, что отображение А имеет в К единственную неподвижную точку.
102 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. II Утверждения последней теоремы допускают обобщение и на более широ- кий класс функций, а именно, на так называемые полунепрерывные функции» Функция f(x) называется полунепрерывной снизу (сверху) в точке х0, если для любого в > 0 существует такая окрестность точки х0, в которой f(x) > f(xo) — е (соответственно, f(x) < f(x0) + g). Например, функция «целая часть от х», f(x) = Е(х) полунепрерывна сверху. Если увеличить (уменьшить) значение f(х0) непрерывной функции в какой-либо одной точке х0, то мы получим полунепрерывную сверху (снизу) функцию. Если f(x) полунепрерывна сверху, то — f(x) полунепрерывна снизу. Эти два замечания позволяют сразу построить большое число примеров полу- непрерывных функций. При изучении свойств полунепрерывности действительных функций удобно- допускать для них бесконечные значения. Если f(xQ) = —ос, то функцию f будем считать полунепрерывной снизу в точке х0; если же для любого h > О' имеется окрестность точки х0. в которой f(x) <_ —h, то будем считать, что- функция f полунепрерывна и сверху в точке х0. Если f(x0) — +<», то функцию f будем считать полунепрерывной сверху в х0; если же для любого h > 0 имеется окрестность точки х0, в которой f(x) > Л, то будем считать, что функция f полунепрерывна и снизу в точке х0. Пусть f(x)—действительная функция на метрическом пространстве R. Верхним пределом f(xQ) функции f(x) в точке Хо называется величина (конеч- ная или бесконечная) lim [sup [(•*)]• Нижний предел f(x0) определяется е->0 (х0. е) — аналогично с заменой верхней грани на нижнюю. Разность оэ/(х0) —J(x0) — — f(xo) (если она имеет смысл, т. е. если числа f(x0) и f(x0) не равны беско- нечности одного знака) называется колебанием функции f(x) в точке х0. Лег- ко видеть, что для непрерывности f(x) в точке х0 необходимо и достаточно,, чтобы ы[(х0) = 0, т. е. чтобы —оо < f(x0) = f (х0) < оо. Для любой функции f(x), заданной на метрическом пространстве, функ- ция f(x) полунепрерывна сверху, а функция Цх) полунепрерывна снизу. Это- легко вытекает из определения верхнего и нижнего пределов. Рассмотрим метрическое пространство М, элементами х которого служат все действительные ограниченные функции <р(/), заданные на сегменте [а, £>].. Метрику в М зададим равенством р (х,у) = р (<р, ф) = sup |ф(/) — ф(/)|. Функции на М, как это обычно делается, будем называть функционалами^ чтобы отличать их от функций <р(/) —элементов М. Рассмотрим один важный пример полунепрерывного функционала. Определим длину кривой у — f (х) (а х Ь) как функционал Lba (f) = sup £ V(x(.-xi_1)^ + (f(x1.)-f(x/_1))^ i=l где верхняя грань (которая может быть равна -|-оо) берется по всевозмож- ным разбиениям отрезка [а, д]. Этот функционал определен на всем простран- стве М. Для непрерывных функций он совпадает со значением предела max lx11? I->0 Д + Наконец, для функций с непрерывной производной его можно записать в виде ъ ___________ § V1 + № (я) dx. а
^g] КОМПАКТНОСТЬ' 103 функционал Lba (f) полунепрерывен снизу в Л4, что легко следует из его •определения. На полунепрерывные функции обобщается установленная выше теорема. Теорема 8а. Полунепрерывная снизу (сверху) конечная функция на компактном Т^-пространстве Т ограничена снизу (сверху). Действительно, допустим, что inf f(x) ——оо. Тогда существует такая последовательность {хп}, что f(xn) < —п. Поскольку пространство Т ком- пактно, его бесконечное подмножество {х„} имеет (в силу теоремы 2) хотя бы одну предельную точку х0. По предположению, функция f конечная и полу- непрерывна снизу; поэтому найдется такая окрестность U точки хо, что f(x) > f(xo) — 1 при х е U. Но тогда окрестность U может содержать лишь конечное число точек множества {х„}, а это противоречит тому, что точка Хо—предельная для этого множества. Аналогично доказывается теорема и для случая полунепрерывной сверху функции. Теорема 86. Полунепрерывная снизу (сверху) конечная функция на компактном Т^пространстве Т достигает своей нижней (верхней) грани. Пусть функция f(x) полунепрерывна снизу. Тогда по теореме 8а она имеет конечную нижнюю грань, и существует такая последовательность {хп}, •что f (х„) С inf f(x) + \/п. Поскольку Т компактно, множество {х„} имеет предельную точку хо. Если бы было f(x0) > inf f, то, в силу полунепрерывности функции f снизу, нашлись бы такая окрестность U точки х0 и такое б > 0, что f(x) > inf f + 4- 6 при х е [/. Но тогда окрестность U не могла бы содержать никакого бесконечного подмножества множества {х„}. Следовательно, f (х0) = inf f, что и требовалось доказать. 4. Счетная компактность. Введем следующее определение. Определение. Пространство Т называется счетно-ком- пактным, если каждое его бесконечное подмножество имеет хотя бы одну предельную точку. Доказанная в п. 1 теорема 2 означает, что всякое компактное пространство счетно-компактно. Обратное, вообще говоря, не- верно. Вот «традиционный» пример счетно-компактного, но не компактного пространства. Рассмотрим множество X всех по- рядковых чисел а, меньших первого несчетного порядкового чис- ла <£>1. Назовем интервалом (а, 0) в X совокупность всех по- рядковых чисел у, удовлетворяющих неравенствам а < у < 0. Открытым множеством в X назовем объединение произвольного числа интервалов. Легко проверить, что построенное простран- ство счетно-компактно, но не компактно. Соотношение между понятиями компактности и счетной ком- пактности становится ясным из следующей теоремы. Теорема 9. Для того чтобы топологическое пространство было счетно-компактным, необходимо и достаточно любое из следующих двух условий: 1) Каждое счетное открытое покрытие пространства Т содер- жит конечное подпокрытие. 2) Каждая счетная центрированная система замкнутых мно- жеств в Т имеет непустое пересечение.
104 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. IT Доказательство. Равносильность условий 1) и 2) не- посредственно следует из соотношений двойственности. Далее, если Т не счетно-компактно, то, повторив рассуждения, прове- денные при доказательстве теоремы 2, мы получим, что в Т су- ществует счетная центрированная система замкнутых множеств с пустым пересечением. Тем самым достаточность условия 2) (а значит, и 1)) установлена. Докажем необходимость условия 2). Пусть Т счетно-компактно и {Fn} — счетная центрированная система замкнутых множеств в Т. Покажем, что П ^^=0. Пусть п п Фп= П Pk- Ясно, что все Фп замкнуты, не пусты (в силу цен- k=l трированности {Еп}) и образуют невозрастающую систему Ф1гдФ2гд ..., и что П = П Л>- Возможны два случая: п п 1) Начиная с некоторого номера п0 Фп»== Фпо+1 == • • • Тогда, очевидно, Q Ф„ = фПо =/= 0. п 2) Среди Фп имеется бесконечно много попарно различных. При этом достаточно рассмотреть случай, когда все Фп раз- личны между собой. Пусть Последовательность {хп} представляет собой бесконечное мно- жество различных точек из Г; в силу счетной компактности Т она должна иметь хотя бы одну предельную точку, скажем, х0. Так как Фп содержит все точки хп, xn+i.....то х0 — предель- ная точка для Фп и в силу замкнутости Фп, хоефп. Следова- тельно, П фпэхо> т. е. П фп#= 0. п п Таким образом, и компактные и счетно-компактные простран- ства характеризуются «поведением» своих открытых покрытий. И в том, и в другом случае из открытого покрытия можно вы- брать конечное, но в первом случае речь идет о любых покры- тиях, а во втором — только о счетных. Хотя в общем случае из счетной компактности компактность не вытекает, имеет место следующий факт. Теорема 10. Для пространств со счетной базой понятия компактности и счетной компактности совпадают. Действительно, из любого открытого покрытия пространства Т, имеющего счетную базу, можно выбрать счетное подпокры- тие (теорема 5 § 5). Если же Т к тому же и счетно-компактно, то из этого последнего можно в силу предыдущей теоремы вы- брать конечное подпокрытие. Тем самым устанавливается, что Г компактно.
КОМПАКТНОСТЬ' 105 $ 6] Замечание. Понятие счетной компактности топологиче- ского пространства оказалось на самом деле (в противовес ком- пактности) не очень удачным и естественным. Оно возникло так «казать «по инерции». Дело в том, что для метрических про- странств (как и для пространств со счетной базой) эти два понятия совпадают (это будет показано в следующем парагра- фе). При этом для метрических пространств понятие компакт- ности было поначалу дано именно как наличие у каждого бес- конечного подмножества предельной точки, т. е. как определение •счетной компактности. «Автоматический» перенос этого опреде- ления с метрического случая на топологический и привел к по- нятию счетно-компактного топологического пространства. Иногда в литературе, особенно более старой, термин «компактность» понимается как «счетная компактность», а топологическое про- странство, компактное в нашей терминологии, т. е. такое, из каждого открытого покрытия которого можно выделить конеч- ное подпокрытие, называется бикомпактным. При этом компакт- ное хаусдорфово пространство (т. е. компакт) именуется биком- пактом, а термин «компакт» резервируется для обозначения метрического компактного пространства. Мы будем при- держиваться тех терминов (компактность, счетная компакт- ность), которые введены выше; при этом мы и компактные метрические пространства также будем называть компакта- ми, а в тех случаях, когда наличие метрики желательно спе- циально подчеркнуть, — «метрическими компактами». 5. Предкомпактные множества. Если множество М, лежащее в некотором хаусдорфовом пространстве Т, не замкнуто в Т, то М не может быть компактно. Например, ни одно из незамкнутых подмножеств числовой прямой не является компактом. Может, однако, оказаться, что замыкание [Af] такого множества М в Т уже обладает свойством компактности. Например, этому усло- вию удовлетворяет любое ограниченное подмножество на числовой прямой или в n-мерном пространстве. Введем следую- щее определение. Определение. Множество М, лежащее в некотором топо- логическом пространстве Т, называется предкомпактным (или компактным относительно Т), если его замыкание в Т компакт- но. Аналогично, М называется счетно-предкомпактным в Т, если всякое бесконечное подмножество A cz М имеет хотя бы одну предельную точку (которая может принадлежать, но может и не принадлежать М). Понятие предкомпактности (в отличие от компактности) свя- зано, очевидно, с тем пространством Т, в котором мы данное множество рассматриваем. Например, множество рациональных точек в интервале (0, 1) предкомпактно, если его рассматривать как подмножество числовой прямой, но оно не будет предком-
106 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. IF пактным как подмножество пространства всех рациональных, чисел. Понятие предкомпактности наиболее существенно в случае метрических пространств, о чем будет идти речь в следующем параграфе. § 7. Компактность в метрических пространствах 1. Полная ограниченность. Поскольку метрические прост- ранства представляют собой частный случай топологических, на них распространяются те определения и факты, которые была изложены в предыдущем параграфе. В метрическом случае ком- пактность тесно связана с понятием полной ограниченно- сти, которое мы сейчас введем. Пусть М— некоторое множество в метрическом пространстве R и е — некоторое положительное число. Множество А из R на- зывается е-сетью для М, если для любой точки хе.М найдется хотя бы одна точка а е А, такая, что р (х, а) е. (Множество А не обязано содержаться в М и может даже не иметь с М ни одной общей точки, однако, имея для М некото- рую е-сеть А, можно построить 2е-сеть В с<М.) Н_апример, целочисленные точки образуют на плоскости 1/-\/2-сеть. Множество М называется вполне ограниченным, если для него при любом е > 0 существует конечная е-сеть. Ясно,, что вполне ограниченное множество обязательно ограничено, как сумма конечного числа ограниченных множеств. Обратное, вообще говоря, неверно, как показывает приводимый ниже при- мер 2. Часто бывает полезно следующее очевидное замечание: если множество М вполне ограничено, то его замыкание [М] также- вполне ограничено. Из определения полной ограниченности сразу следует, что если само метрическое пространство R вполне ограничено, то- оно сепарабельно. Действительно, построим для каждого п в R конечную 1/п-сеть. Сумма их по всем п представляет собой счетное всюду плотное в R множество. Поскольку сепарабель- ное метрическое пространство имеет счетную базу (теорема 4- § 5), мы получаем, что всякое вполне ограниченное метрическое пространство имеет счетную базу. Примеры. 1. В n-мерном евклидовом пространстве полная ограниченность совпадает с обычной ограничен- ностью, т. е. с возможностью заключить данное множество в достаточно большой куб. Действительно, если такой куб раз- бить на кубики с ребром е, то вершины этих кубиков будут
7] КОМПАКТНОСТЬ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ 107 образовывать конечную (V^/2) е-сеть в исходном кубе, а зна- чит, и подавно, в любом множестве, лежащем внутри этого куба. 2. Единичная сфера S в пространстве 12 дает нам пример ограниченного, но не вполне ограниченного множества. Действи- тельно, рассмотрим в S точки вида t?i =(1, 0, 0....0, 0, ...), е2 = (0, 1,0.....0, 0, ...), е„ = (0, 0, 0......1,0, ...). Расстояние между любыми двумя такими точками еп и ет <(п =/= т) равно л]2. Отсюда видно, что в S не может быть конечной е-сети ни при каком е <V2/2. 3. Рассмотрим в /2 множество П точек х = (хь х2.хп ...), подчиненных условиям |Х.1<1, I Х21< 1/2....|х„|<1/2п-1, ... Это множество называется основным параллелепипедом («гиль- бертовым кирпичом») пространства /2. Оно служит примером бесконечномерного вполне ограниченного множества. Для дока- зательства его полной ограниченности поступим следующим об- разом. Пусть в>0 задано. Выберем п так, что 1/2п-1 < в/2. Ка- ждой точке х = (хь х2....*„,.•) (I) из П сопоставим точку x* = (xi, х2...хп, 0, 0, ...) (2) из того же множества. При этом р(*,Л = д/ <|. * к=п+\ * fe=n Множество П* точек вида (2) из П вполне ограничено (как ограниченное множество в n-мерном пространстве). Выберем в П* конечную в/2-сеть. Ясно, что она будет в то же время с-сетью во всем П. 2. Компактность и полная ограниченность. Теорема 1. Если метрическое пространство R счетно-ком- пактно, то оно вполне ограничено. Доказательство. Предположим, что R не вполне огра- ничено. Это значит, что при некотором ео > 0 в R не суще- ствует конечной ео-сети. Возьмем в R произвольную точку
108 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. и В /? найдется хотя бы одна такая точка, скажем, а2, что р(а1,аг)>ео (иначе точка си была бы ео-сетью для /?). Далее, в R найдется такая точка а3, что р(а1,аз)>ео и р(а2, «з) > еэ, иначе пара точек аь а2 была бы ео-сетью. Если точки aj, ..., afi. уже фиксированы, то выберем точку йа+1 е R так, что р(аг-, aft+I) > е0, i = 1, 2, ..., k. Это построение дает нам бесконечную последовательность аь а2.....которая не имеет ни одной предельной точки, по- скольку р(а{, aj) > ео при i j. Но тогда R не счетно-компактно. Теорема доказана. Итак, мы показали, что для метрических пространств счет- ная компактность влечет полную ограниченность, которая в свою очередь влечет наличие счетной базы. В силу теоремы 10 § 6 отсюда получаем такой важный ре- зультат. Следствие. Всякое счетно-компактное метрическое про- странство компактно. Мы показали, что полная ограниченность есть необходи- мое условие компактности метрического пространства. Это усло- вие не достаточно; например, совокупность рациональных точек отрезка [0, 1] с обычным определением расстояния между ними есть вполне ограниченное, но не компактное пространство: последовательность точек этого пространства 0; 0,4; 0,41; 0,414; 0,4142; ..., т. е. последовательность десятичных приближений числа V2 — 1, не имеет в нем предельной точки. Однако имеет место следующая теорема. Теорема 2. Для того чтобы метрическое пространство R было компактом, необходимо и достаточно, чтобы оно было од- новременно: 1) вполне ограниченным, 2) полным. Доказательство. Необходимость полной ограниченности уже отмечалась. Необходимость полноты очевидна: в самом деле, если {хп} — фундаментальная последовательность в R, не имеющая предела, то эта последовательность не имеет в R ни одной предельной точки. Покажем теперь, что если R вполне ограничено и полно, то оно компактно. В силу следствия из теоремы 1 для этого до- статочно установить, что R счетно-компактно, т. е. что всякая последовательность {хп} точек из R имеет хотя бы одну пре- дельную точку. Построим вокруг каждой из точек, образующих 1-сеть в R„ замкнутый шар радиуса 1. Так как эти шары покрывают все Rr а число их конечно, то по крайней мере один из них, назовем
*7] КОМПАКТНОСТЬ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ 109 его Bi, содержит некоторую бесконечную подпоследовательность х*0, х^, ... последовательности {хп}. Далее, выберем ^2-сеть в В\ и вокруг каждой из точек этой сети построим зам- кнутый шар радиуса 1/2. По крайней мере один из этих шаров, назовем его В2, содержит бесконечную подпоследовательность х)Ч х®, ... последовательности {х^}. Далее, найдем зам- кнутый шар Вз с центром в В2 радиуса 1/4, содержащий беско- нечную подпоследовательность х)3), ... х@\ ... последователь- ности {х®} и т. д. Рассмотрим теперь наряду с каждым шаром Вп замкнутый шар Ап с тем же центром, но в два раза боль- шего радиуса. Легко видеть, что шары Ап вложены друг в друга. оо В силу полноты пространства /? пересечение П Ап не пусто и п==1 состоит из одной точки Хо- Эта точка — предельная для исход- ной последовательности {хп}, так как каждая ее окрестность со- держит некоторый шар Вь, а значит, и бесконечную подпоследо- вательность {х^5} последовательности {хп}. 3. Предкомпактные подмножества в метрических простран- ствах. Понятие предкомпактности, введенное нами в предыду- щем параграфе для подмножеств произвольного топологического пространства, применимо, в частности, к подмножествам метри- ческого пространства. При этом, очевидно, понятие счетной пред- компактности совпадает здесь с понятием предкомпактности. Отметим следующий простой, но важный факт. Теорема 3. Для того чтобы множество М, лежащее в пол- ном метрическом пространстве R, было пр ед компактным, необ- ходимо и достаточно, чтобы оно было вполне ограниченным. Доказательство сразу следует из теоремы 2 и того очевид- ного факта, что замкнутое подмножество полного метрического пространства само полно. Значение этой теоремы состоит в том, что, как правило, легче установить полную ограниченность того или иного множе- ства, чем непосредственно доказать его предкомпактность. Вме- сте с тем для применений в анализе важна обычно предкомпакт- ность. 4. Теорема Арцела. Вопрос о компактности того или иного множества в метрическом пространстве — довольно распростра- ненная в анализе задача. Между тем, попытка непосредственно применить теорему 2 сталкивается с трудностями. Поэтому для множеств в конкретных пространствах полезно дать специаль- ные критерии компактности (или предкомпактности), более удобные на практике. В n-мерном евклидовом пространстве предкомпактность множества равносильна, как мы видели, его ограниченности.
по МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. II Однако для более общих метрических пространств это уже не- верно. Одним из важнейших в анализе метрических пространств является пространство С[а, &]. Для его подмножеств важный и часто используемый критерий предкомпактности доставляет так называемая теорема Арцела. Чтобы ее сформулировать, нам понадобятся следующие понятия. Семейство Ф функций ср, определенных на некотором отрез- ке [а, Ь], называется равномерно ограниченным, если существует такое число К, что I Ф W I < К для всех х е [а, Ь] и всех (ре Ф. Семейство Ф — {ср} называется равностепенно непрерывным, если для каждого е > 0 найдется такое 6 > 0, что |ф(Х1) —ф(х2) I < в для всех и х2 из [а, Ь] таких, что p(%i,x2)< 6, и для всех <р е Ф. Теорема 4 (Арцела). Для того чтобы семейство Ф не- прерывных функций, определенных на отрезке [а, &], было пред- компактно в С[а, &], необходимо и достаточно, чтобы это семей- ство было равномерно ограничено и равностепенно непрерывно. Доказательство. Необходимость. Пусть семейство Ф предкомпактно в С [a, ft]. Тогда по предыдущей теореме для каждого положительного е в семействе Ф существует конечная е/3-сеть <pi, ср2, .... ерь. Каждая из функций ср,, как непрерыв- ная функция на отрезке, ограничена: |ср,(х) | Ki. Положим К = max Kt + е/3. По определению е/3-сети, для всякого ср е Ф имеем, хотя бы для одного ср,, Р (ф, Фс) = max I ф (х) — Ф; (*) I е/3. X Следовательно, IФ (*) КI Фс W I + у + у < К. Итак, Ф равномерно ограничено. Далее, так как каждая из функций ср,, образующих е/3-сеть, непрерывна, а следовательно, и равномерно непрерывна на [а, &], то для данного е/3 существует такое 6,, что I Ф> (*i) — Фс (*2) I < е/3, если |%1 — х2| < 6,-. Положим 6 = minfi;. Для произвольной функции среФ вы- берем ф(- так, чтобы р (ср, ср() < е/3; тогда при | х{ — х21 < 6
КОМПАКТНОСТЬ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ 111 будем иметь | <Р1 (*1) — ф(х2) KI ф(*1) — Ф« (*1) 1 + 1 Ф/ (*1) — Ф/(х2)1 + + I Ф« (х2) — Ф (х2) I < е/3 + е/3 + е/3 = е. Равностепенная непрерывность Ф также доказана. Достаточность. Пусть Ф — равномерно ограниченное и равностепенно непрерывное семейство функций. Согласно тео- реме 3 мы установим его предкомпактность в С[а, ft], если по- кажем, что при любом е > 0 для него в С[а, ft] существует ко- нечная е-сеть. Пусть |ф(х) | К для всех среФ и пусть 6 > О выбрано так, что |ф(Х]) —ф(х2) | < е/5 при |Х] — х2|<6 для всех (р еФ. Разобьем отрезок [a, ft] на оси х точками х0 = = й] < Xi < х2 < ... < хп = ft на промежутки длины меньше б и проведем через эти точки вертикальные прямые. Отрезок [— К, /С] на оси у разобьем точками г/о = —К < У\ < */2 < ... ... < Ут = К на промежутки длины меньше е/5 и проведем че- рез точки деления горизонтальные прямые. Таким образом, пря- моугольник а х ft, —К у К разобьется на ячейки с го- ризонтальной стороной меньше 6 и вертикальной стороной мень- ше е/5. Сопоставим теперь каждой функции ср е Ф ломаную ф(х) с вершинами в точках (хь, yi), т. е. в узлах построенной сетки, и уклоняющуюся в точках х& от функции ф(х) меньше чем на е/5 (существование такой ломаной очевидно). Поскольку по построению | ср (xk) — ф(xft) | < е/5, |cp(xft+1) — — ф (xft+1) | < е/5, | ф (xk) — ф (xft+1) | < е/5, то I Ф (*.<) —Ф<Хл+1)1 < Зе/5. Так как между точками xh и xh+i функция ф(х) линейна, то I ф (**) — Ф (х) I < Зе/5 для всех хе[хьхь]]. Пусть теперь х — произвольная точка отрезка [a, ft] и Xk— ближайшая к х слева из выбранных нами точек деления. Тогда | Ф (х) — ф (х) К | Ф (х) — Ф (xft) | + +1 Ф М — Ф (xk) | +1 ф (xfe) — ф (х) К е. Следовательно, ломаные ф(х) по отношению к Ф образуют е-сеть. Число их очевидно, конечно; таким образом, Ф вполне ограничено. Теорема полностью доказана. 5. Теорема Пеано. Покажем, как применяется теорема Арцела на при- мере следующей теоремы существования для обыкновенных дифференциаль- ных уравнений с непрерывной правой частью. Теорема 5 (Пеано). Пусть дано дифференциальное уравнение (3> Если функция f непрерывна в некоторой ограниченной замкнутой области G, то через каждую внутреннюю точку (х0, t/о) этой области проходит хотя бы одна интегральная кривая данного уравнения.
112 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. П Доказательство. Так как функция f непрерывна в ограниченной замкнутой области, то она ограничена: |f(x, у) | < М = const. Проведем через точку (х0, у0) прямые с угловыми коэффициентами М н —М. Проведем, далее, вертикальные прямые х — а и х — Ь так, чтобы от- секаемые ими два треугольника с общей вершиной (х0, уо) целиком лежали внутри области G. Эта пара треугольников образует замкнутое множество Д. Построим теперь для данного уравнения так называемые ломаные Эй- лера следующим образом: проведем из точки (х0, Уо) прямую с угловым коэф- фициентом f(x0, у0). На этой прямой возьмем некоторую точку (хь yt) и про- ведем через нее прямую с угловым коэффициентом f(xi,yt). На этой прямой возьмем точку (х2,у2), проведем через нее прямую с угловым коэффициен- том f(x2, у2) и т. д. Рассмотрим теперь последовательность ломаных Эйлера £i, L2, ..., Ln...проходящих через точку (х0, уо), таких, что длина наи- большего из звеньев линии £л стремится к нулю при fe->-oo. Пусть <р*— функция, график которой есть линия Li. Функции <pi, ф2, .... фл, ... обла- дают следующими свойствами: 1) они определены на одном и том же отрезке [а, 6], 2) они равномерно ограничены, 3) они равностепенно непрерывны. На основании теоремы Арцела из последовательности {<р&} можно вы- брать равномерно сходящуюся последовательность. Пусть это будет подпосле- довательность <р(1), <р(2), ..., ф<*>, ... Положим ф(х) = lim ф<*>(х) при k->-oo. Ясно, что ф(х0) = Уо- Остается проверить, что <р удовлетворяет на отрезке [a, Z>] данному дифференциальному уравнению. Для этого требуется показать, что для любого е > О I <р (х") — ф (х') , I | f(х', <р(х))I<е, если только величина \х" — х'| достаточно мала. Для доказательства этого в свою очередь нужно установить, что при достаточно больших k ф<*>(х")-ф<*>(х') х" - х' f (х', Ф(А) (х'У) | < е, если только разность \х" — х'\ достаточно мала. Так как f непрерывна в области G, то для любого в > 0 найдется такое 7] > 0, что если f (х', y') — e<f (х, у) < f (*', у') + е (/ = ф (*')), |х —х'|<2п и [у — у' | < 4А4-П- Совокупность точек (х, у) s G, удовлетворяющих этим двум неравен- ствам, представляет собой некоторый прямоугольник Q. Пусть теперь К на- столько велико, что для всех k > К | Ф (х) — ф<4) (х) | < 2Af-q и все звенья ломаной Lk имеют длину меньше Тогда при |х — х'\ < 2т| все ломаные Эйлера ф^), для которых k > К, целиком лежат внутри Q. Далее, пусть (а0, Ьо), (аь bt), ..., (an+i,6„+i)—вершины ломаной £*, причем а0 < х' < а, < а2 < ... < ап < х" < an+i
J 7] КОМПАКТНОСТЬ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ ИЗ (мы для определенности считаем х" > х'\ аналогично рассматривается случай х" < х'). Тогда для соответствующей функции <р<*> имеем <р<*) (aj — <р<*> (х') = f (а0, Ьо) (а, — х'), <P(*)(fli+l)-<P(*)(e/) = 4ar М(а/+1-“;)- « = 1. 2........п-1, <p(ft) (х") _ ф(*) (а„) = f (ап, Ьп) (х" — ап). Отсюда при |х" — х'\ < Т| получаем [/ (*'. У’) ~ е] (щ — х') < <р<*> (ai) — (*') < [f (х', у') + в] (а1 — х'), I/ (*'> у') - е1 («*+1 - ад < <₽(ft) (а/+1) - (“/) < < [f (x', у') + e] (a/ + 1 — az); i = 1, ..n — 1, If (x', y') — e] (x" — an) < <p<*> (x") — <p<fe> (a„) < [/ (x', y') + g] (x" — an). Суммируя эти неравенства, находим [/ (х', у') — е] (х" — х') < (х") - <р<*> (х') < [f (х', у') + в] (х" — х'), что и требовалось доказать. Разные подпоследовательности ломаных Эйлера могут сходиться к раз- ным решениям уравнения (3). Поэтому решение уравнения у' — f(x, у), про- ходящее через точку (х0, уо), вообще говоря, не единственно. 6. Равномерная непрерывность. Непрерывные отображения метрических компактов. Для отображений метрического прост- ранства в метрическое пространство, в частности, для число- вых функций на метрических пространствах, наряду с понятием непрерывности имеет смысл важное для анализа понятие равно- мерной непрерывности: отображение F метрического простран- ства X в метрическое пространство У называется равномерно непрерывным, если для каждого е > 0 найдется такое б ~> О, что p2(F(X1), F(x2))<e как только pi(хь х2) < б (здесь р( — расстояние в X, а.р2— расстояние в У), причем б зависит только от е, но не от х\ и х2. Упражнение. Показать, что числовая функция F(x) = supx(t) равно- a<t <(> мерно непрерывна на пространстве С[а, &]. Для непрерывных отображений метрических компактов имеет место следующая теорема, обобщающая хорошо извест- ную из элементарного курса анализа теорему о непрерывных функциях на отрезке. Теорема 6. Непрерывное отображение метрического ком- пакта в метрическое пространство равномерно непрерывно. Доказательство. Пусть отображение F метрического компакта К в метрическое пространство М непрерывно, но не равномерно непрерывно. Это значит, что для -некоторого е > О и каждого натурального п найдутся в К такие точки хп и х'п, что ₽i(xn’<)<V« и в то же время p2(F(x„), F(x'n)^e (р, — расстояние в К, рг — расстояние в Л4). Из последовательности
114 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. и {хп} в силу компактности К можно выбрать подпоследователь- ность {xnk}, сходящуюся к некоторой точке х <= К. Тогда и {х^у сходится к х; но при этом для каждого k должно быть выпол- нено хотя бы одно из неравенств р2 (F (х), F (х„ > е/2; р2 (F (х), F (xJJ) > е/2, что противоречит непрерывности отображения F в точке х. 7. Обобщенная теорема Арцела. Пусть X и У— два метриче- ских компакта и пусть Cxy— множество всех непрерывных ото- бражений f компакта X в У. Введем в Cxy расстояние при по- мощи формулы p(f, g) = sup p(f (х), g(x)). X E A Легко проверить, что таким образом Cxy превращается в метрическое пространство. Теорема 7 (обобщенная теорема Арцела). Для. предкомпактности множества D cz Cxy необходимо и достаточ- но, чтобы входящие в D функции f были равностепенно непре- рывны. Последнее означает, что для любого е > 0 должно существо- вать такое б > 0, что из Р« х")<6 (4) вытекает p(f(x'), f (%"))< в, (5) каковы бы ни были f из D и х' и х" из X. Доказательство. Необходимость доказывается так же, как и в теореме 4. Докажем достаточность. Для этого погрузим Cxy в про- странство Mxy всех отображений компакта X в компакт У с той же самой метрикой p(f, g) = sup р (/ (х), g(x)), xsX которая была введена в С.уу, и докажем предкомпактность мно- жества D в Mxy- Так как Cxy замкнуто в Mxy ’), то из пред- компактности множества D в Л4уу следует его предкомпактность в Cxy- Зададим е > 0 произвольно и выберем б так, чтобы из (4) вытекало (5) для всех f из D и всех х', х" из X. Легко видеть, что X можно представить как сумму конечного числа непересе- кающихся множеств Е{, таких, что из х', х" е следует ') Поскольку предел равномерно сходящейся последовательности непре- рывных отображений есть также непрерывное отображение. Указанное пред- ложение представляет собой непосредственное обобщение известной теоремы анализа и доказывается так же, как и эта теорема.
< 8] НЕПРЕРЫВНЫЕ КРИВЫЕ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ 115 р(х', х") < 6. Действительно, для этого достаточно выбрать точ- ки Xt, х2, .... хп так, чтобы они образовали б/2-сеть в X и по- ложить, например, Et = В (xt, 6/2) \ В (xh 6/2), где В(Хг, 6/2)— шар радиуса 6/2 с центром х;. Рассмотрим теперь в компакте Y некоторую конечную е-сеть yi, Уз, , Ут, и пусть L — совокупность функций g(x), прини- мающих на множествах Ei значения Число таких функций, очевидно, конечно. Покажем, что они образуют 2е-сеть по отно- шению к D в MXy- Действительно, пусть f D. Для всякой точ- ки Xi из Xi, ..., хп найдется такая точка у, из у\, ..., ут, что p{f{Xi),y^< е. Пусть функция g <= L выбрана так, что g(xi) = у>. Тогда р( f (х), g (х)) < р (/ (х), f (х()) + р (/ (хх-), g (xf)) + р (g (xf), g (x)) < 2e, если i выбрано так, что x Ej. Отсюда вытекает, что конечное множество L действительно есть 2е-сеть для D и, таким образом, D предкомпактно в MXy, а следовательно, и в CXY- § 8. Непрерывные кривые в метрических пространствах1) Пусть задано непрерывное отображение P = f(t) отрезка а t sg b в метрическое пространство R. Когда t «пробегает» отре- зок от а до &, соответствующая точка Р «пробегает» некоторую «непрерывную кривую» в пространстве R Нам предстоит дать строгие определения, связан- ные с изложенной сейчас грубой идеей. Порядок, в котором проходятся точки Рис. 12. Рис. 13. Рис. 14. кривой, существен. Одно и то же множество, изображенное на рис. 12, про- ходимое в направлениях, указанных на рис. 13 и 14, мы будем считать раз- личными кривыми. В качестве другого примера рассмотрим действитель- ную функцию, определенную на отрезке [0, 1], которая изображена на рис. 15. Она определяет «кривую», расположенную на отрезке [0, 1] оси у, отличную от этого отрезка, однократно пройденного от точки 0 до точки Ц так как отрезок [Л, В] проходится трижды (два раза вверх и один раз вниз). ') Этот параграф не связан с дальнейшим изложением. При желании чи- татель может его опустить.
116 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. п Однако при одинаковом порядке прохождения точек простран- ства выбор «параметра» t мы будем считать несущественным. Например, функции, изображенные на рис. 15 и 16, определяют одну и ту же «кривую», расположенную на оси у, хотя значения параметра t, отвечающие какой-либо точке кривой, в случаях рис. 15 и 16 могут быть различными. Например, в случае рис. 15 точке А соответствуют иа оси t две изолированные точки, а в случае рис. 16 — одна изолированная точка н лежащий правее нее отрезок (когда t пробегает этот отрезок, точка на кривой остается на месте). (Допу- скать такие отрезки неподвижности Р = f(/) будет удобно в дальнейшем при исследовании компактности систем кривых.) Перейдем к формальным определениям. Две непрерывные функции P = f'(t') н P = i"(t”), определенные соответственно на отрезках а' t' Ь' и а" t" Ъ" н принимающие значения в метрическом пространстве К. назовем эквивалент- ными, если существуют две непрерывные неубывающие функции /' = ф'(0 н = определенные на некотором отрезке а t b и обладающие свойствами ф' (а) = а', ф' (Ь) = Ь', Ф" (а) = а", у" (Ь) = Ь", для всех t е [а, 6]. Легко видеть, что так введенное отношение эквивалентности рефлексивно (f эквивалентно f), симметрично (если f' эквивалентно f", то f" эквивалентно /'). Можно показать, что оно и транзитивно (из эквивалентности f' н и эквивалентности f" и f'" вытекает эквивалентность [' и" f'"). Поэтому все не- прерывные функции рассматриваемого типа разбиваются на классы функций, эквивалентных между собой. Каждый такой класс и определяет непрерывную кривую в пространстве R. Для любой функции Р = определенной на каком-либо отрезке [а', Ь'], найдется эквивалентная ей функция, определенная на отрезке [а", Ь"] =
НЕПРЕРЫВНЫЕ КРИВЫЕ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ 11? »« ев [0, !]• Действительно достаточно положить ') i' = <р' (/) = (Ь' — a') i + a', i" — q>" (/) = t. Таким образом, всякую кривую можно предполагать заданной параметриче ски при помощи функции, определенной на отрезке [0, 1]. Поэтому целесообразно ввести в рассмотрение пространство Ci, r непре- рывных отображений f отрезка I = [0, 1] в пространство R с метрикой Р (Л g) = supp(f (0,5(0)- t Будем считать, что последовательность кривых Llt L2, ..., Ln, .. схо- дится к кривой L, если кривые Ln можно параметрически представить в виде Р = 0</<1, а кривую L — в виде P = f(t), 1, так что p(f, fn) ->0 при оо. Применяя обобщенную теорему Арцела (теорема 7 § 7), легко доказать следующую теорему. Теорема 1. Если последовательность кривых L\, L2, ..., Ln..........ле- жащих в компакте К, можно представить параметрически при помощи равно- степенно непрерывных функций на отрезке [0, 1], то из нее можно выделить сходящуюся подпоследовательность. Определим теперь длину кривой, заданной параметрически функцией P = f(t), как верхнюю грань сумм вида п <=i где точки Н подчинены лишь условиям И “ ^0 Н ••• tl ••• ~ Легко видеть, что длина кривой ие зависит от выбора ее параметриче- ского представления. Если ограничиться параметрическими представлениями посредством функций, заданных на отрезке [0, 1], то легко доказать, что длина кривой есть полунепрерывный снизу функционал от f (в пространстве С/, л). На геометрическом языке этот результат можно выразить в виде следующей теоремы о полунепрерывиости. Теорема 2. Если последовательность кривых Ln сходится к кривой L, то длина кривой L не больше нижнего предела длин кривых Ln. Расмотрим теперь специально кривые конечной длины. Пусть- кривая определена параметрически функцией P = f(t), Функция f, рассматриваемая лишь на отрезке [a, Т], где а Т Ь, опреде- ляет «начальный отрезок» кривой от точки Ра = f(a) до точки Рт — f(T). Пусть s = ф(Т) —его длина. Легко устанавливается, что Р = g(«) = f [ф~‘ («)] ’) Мы считаем, что всегда а < Ь. Однако мы не исключаем «кривых», ко- торые состоят из одной-единствеииой точки и получаются, если на [а, Ь] функ- ция f(t) постоянна. Это тоже удобно для дальнейшего.
118 МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА (ГЛ. П есть новое параметрическое представление той же кривой. При этом s пробе- гает отрезок 0 s S, где S — длина всей рассматриваемой кривой. Это представление удовлетворяет требованию o(g(si), g(s2)X|s2 — Si I (длина дуги не меньше хорды). Переходя к отрезку [О, 1], получим параметрическое представление P = F(-v) = g(s), т = s/S, удовлетворяющее условию Липшица p(F(Ti), F (т2))< S | Ti — т21. Мы видим, таким образом, что для всех кривых длины S М, где М — некоторая константа, возможно параметрическое представление равностепенно непрерывными функциями, заданными на отрезке [0, 1]. К ним, следовательно, применима теорема 1. Покажем силу полученных общих результатов на примере доказательства следующего важного предложения. Теорема 3. Если в компакте К две точки, А и В, можно соединить непрерывной кривой конечной длины, то среди таких кривых существует кри- вая наименьшей длины. В самом деле, пусть У есть нижняя грань длин кривых, соединяющих А и В в компакте К. Пусть длины кривых Lh L2, , Ln, ..., соединяющих А и В, стремятся к У. Из последовательности Ln по теореме 1 можно выбрать сходящуюся подпоследовательность. По теореме 2 предельная кривая этой подпоследовательности не может иметь длину больше У. Отметим, что даже в случае, когда К является замкнутой гладкой (над- лежащее число раз дифференцируемой) поверхностью в евклидовом трехмер- ном пространстве, эта теорема не вытекает непосредственно из результатов, устанавливаемых в курсе дифференциальной геометрии, где ограничиваются обычно случаем достаточно близких друг к другу точек А и В. Все изложенное выше приобрело бы большую прозрачность, если бы мы наделили множество всех кривых данного метрического пространства R струк- турой метрического пространства. Это можно сделать, определяя расстояние между кривыми Д и L2 формулой p(Lb L2) = infpC’I, f2), где нижняя грань берется по всем возможным парам параметрических пред- ставлений кривой Li при помощи функции Р = fi (/), 0 t I, и кривой Li при помощи функции Р = f2(t), 0 t 1. Доказательство того, что это расстояние удовлетворяет обычным аксио- мам, очень просто, за исключением одного пункта: представляет некоторые трудности доказать, что нз p(Lt,L2) == 0 вытекает тождество кривых Li и L2. Этот факт является непосредственным следствием того обстоятельства, что нижняя грань в формуле, которой мы определили расстояние p(Li, L2), до- стигается при надлежащем выборе параметрических представлений ft и f2. Но доказательство этого последнего утверждения тоже не очень просто,
ГЛАВА III НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА § 1. Линейные пространства Понятие линейного пространства относится к числу самых основных в математике. Оно будет играть важную роль не толь- ко в этой главе, но и во всем дальнейшем изложении. 1. Определение и примеры линейных пространств. Определение 1. Непустое множество L элементов у,, z, ... называется линейным, или векторным, пространством, если оно удовлетворяет следующим условиям: 1. Для любых двух элементов х, у <= L однозначно определен третий элемент геА, называемый их суммой и обозначаемый х + у, причем 1) ху = ух (коммутативность), 2) х + (у + г) = (х + у) + z (ассоциативность), 3) в L существует такой элемент 0, что х + 0 = х для всех хе L (существование нуля), 4) для каждого хе L существует такой элемент — х, что %+(—х) = 0 (существование противоположного элемента). II. Для любого числа а и любого элемента xeL определен . элемент ах е L (произведение элемента х на число а), причем 1) а(рх) = (а(3)х, 2) 1-х = х, 3) (а+р)х = ах +рх, 4) а(х + у)= ах + ау. В зависимости от того, какой запас чисел (все комплексные или только действительные) используется, различают комплекс- ные и действительные линейные пространства1). Всюду, где не оговорено противное, наши построения будут верны как для действительных, так и для комплексных пространств. Заметим, что всякое комплексное линейное пространство можно рассматривать как некоторое действительное простран- ство, если ограничиться в нем умножением векторов на действи- тельные числа. ‘) Можно было бы рассматривать и линейные пространства над произ- вольным полем.
120 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. (и Рассмотрим некоторые примеры линейных пространств, пре- доставив читателю проверить для каждого из них сформулиро- ванные выше аксиомы. 1. Прямая линия R1, т. е. совокупность действительных чисел, с обычными арифметическими операциями сложения и умноже- ния, представляет собой линейное пространство. 2. Совокупность всевозможных систем п действительных чи- сел х = (хь х2, ..., хп), где сложение и умножение на число определяются формулами (*Ь х2....х„) + (1/1, у2, • • •, Уп) = (xt + ylt х2 + у2, хп + уп), а(хь х2, хй) —(ахь ах2, ..., ах„), также является линейным пространством. Оно называется дей- ствительным п-мерным1) арифметическим пространством и обо- значается символом Rn. Аналогично, комплексное п-мерное арифметическое пространство Сп определяется как совокупность систем п комплексных чисел (с умножением на любые комплекс- ные числа). 3. Непрерывные (действительные или комплексные)-функции на некотором отрезке [a, ft] с обычными операциями сложения функций и умножения их на числа образуют линейное простран- ство С [а, &], являющееся одним из важнейших для анализа. 4. Пространство 12, в котором элементами служат последо- вательности чисел (действительных или комплексных) * = (*!, х2, хп, ...), удовлетворяющие условию £|х„|2<оо, (1) п—1 с операциями <хь х2, ..., х„, ...) + («/!, г/2, •••, Уп> = = (Х! 4-Z/1, Х2 + у2, .... Х„+уп, ...), а(хь х2, ..х„, ...) = (ахь ах2, ..., ахп, . ..), является линейным пространством. Тот факт, что сумма двух последовательностей, удовлетворяющих условию (1), также удо- влетворяет этому условию, вытекает из элементарного неравен- ства (а( + а2)2 < 2af + 2a|. 5. Сходящиеся последовательности х = (хь х2, ...) с покоор- динатными операциями сложения и умножения на числа обра- зуют линейное пространство. Обозначим его с. !) Этот термин будет разъяснен в дальнейшем.
линейные пространства 12t 6. Последовательности, сходящиеся к 0, с теми же операция- ми сложения и умножения, также образуют линейное простран- ство. Обозначим его Со. 7. Совокупность т всех ограниченных числовых последова- тельностей, с теми же операциями сложения и умножения на числа, что и в примерах 4—6, тоже представляет собой линейное пространство. 8. Наконец, совокупность R00 всевозможных числовых после- довательностей, с теми же самыми операциями сложения и ум- ножения на числа, что и в примерах 4—7, тоже является линей- ным пространством. Поскольку свойства линейного пространства — это свойства операций сложения элементов и умножения их на числа, есте- ственно ввести следующее определение. Определение 2. Линейные пространства L и L* назы- ваются изоморфными, если между их элементами можно уста- новить взаимно однозначное соответствие, которое согласовано с операциями в L и L*. Это означает, что из х*->х*, у*-*/ (х, y^L, х*, следует х + У *-* X* + У* и ах*-* ах* (а — произвольное число). Изоморфные пространства можно рассматривать как различ- ные реализации одного и того же пространства. Приме- рами изоморфных линейных пространств могут служить арифме- тическое n-мерное пространство (действительное или комплекс- ное) и пространство всех многочленов степени п — 1 (соот- ветственно с действительными или комплексными коэффициен- тами) с обычными операциями сложения многочленов и умноже- ния их на числа (докажите изоморфность!). 2. Линейная зависимость. Элементы х, у, w линейного пространства L называются линейно зависимыми, если суще- ствуют такие числа а, 0, ..., А, не все равные 0, что ах -|- 0г/ -|- ... -|- Xw = 0. (2) В противном случае эти элементы называются линейно незави- симыми. Иначе говоря, элементы х, у, ..., w линейно независи- мы, если из равенства (2) вытекает, что а = 0 = ... = А, = О. Бесконечная система элементов х, у, ... пространства L называется линейно независимой, если любая ее конечная под- система линейно независима.
122 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА (ГЛ. ИГ Если в пространстве L можно найти п линейно независимых элементов, а любые п +1 элементов этого пространства линейно зависимы, то говорят, что пространство L имеет размерность п. Если же в L можно указать систему из произвольного конечного числа линейно независимых элементов, то говорят, что простран- ство L бесконечномерно. Базисом в n-мерном пространстве L на- зывается любая система из п линейно независимых элементов. Пространства Rn в действительном случае и Сп в комплексном имеют, как легко проверить, размерность п, оправдывая тем са- мым свое название. В курсе линейной алгебры рассматриваются линейные про- странства конечной размерности. Наоборот, мы, как правило, будем заниматься пространствами бесконечного числа измере- ний, представляющими основной интерес с точки зрения анализа. Мы предоставляем читателю проверить, что каждое из про- странств, указанных в примерах 3—8, имеет бесконечную раз- мерность. 3. Подпространства. Непустое подмножество L' линейного пространства L называется подпространством, если оно само об- разует линейное пространство по отношению к определенным в L операциям сложения и умножения на число. Иначе говоря, L'cL есть подпространство, если из хе L', у е L' следует, что ах + е L' при любых аир. Во всяком линейном пространстве L имеется подпростран- ство, состоящее из одного нуля, — нулевое подпространство. С другой стороны, все L можно рассматривать как свое подпро- странство. Подпространство, отличное от L и содержащее хотя бы один ненулевой элемент, называется собственным. Приведем примеры собственных подпространств. 1. Пусть L — какое-либо линейное пространство и х— неко- торый его ненулевой элемент. Совокупность элементов {Хх}, где X пробегает все числа (соответственно действительные или ком- плексные), образует, очевидно, одномерное подпространство. Оно является собственным, если размерность L больше 1. 2. Рассмотрим пространство непрерывных функций С [а, Ь] (пример 3 п. 1) ив нем совокупность всех многочленов Р[а, й]. Ясно, что многочлены образуют в С [а, 6] подпространство (имею- щее, как и все С [а, й], бесконечную размерность). В то же время само пространство С [а, й] можно рассматривать как подпро- странство более обширного пространства всех, непрерывных и разрывных, функций на [а, й]. 3. Рассмотрим, наконец, пространства l2, Со, с, m и R°° (при- меры 4—8 п. 1). Каждое из них является собственным подпро- странством последующего. Пусть {ха}—произвольное непустое множество элементов линейного пространства L. Тогда в L существует наименьшее
ЛИНЕЙНЫЕ ПРОСТРАНСТВА 123 $11 подпространство (быть может, совпадающее с L), которое содер- жит {ха}- Действительно, по крайней мере одно подпростран- ство, содержащее {ха}, в L существует: это все L. Далее ясно, что пересечение любого множества {Lv} подпространств есть снова подпространство. В самом деле, если L* = Q Lya х, у е L*, v то и ах + Ру е L* при всех а, р. Возьмем теперь все подпро- странства, содержащие систему векторов {ха}, и рассмотрим их пересечение. Это и будет наименьшее подпространство, содержа- щее систему {ха}. Такое минимальное подпространство мы назо- вем подпространством, порожденным множеством {ха}, или ли- нейной оболочкой множества {ха}. Мы будем обозначать это подпространство L ({ха}). Упражнения. Линейно независимая система {ха} элементов линейного пространства L называется базисом Гамеля, если ее линейная оболочка сов- падает с L. Доказать следующие утверждения: 1) В каждом линейном пространстве существует базис Гамеля. Указание. Использовать лемму Цорна. 2) Если {ха}—базис Гамеля в L, то каждый вектор xeL единственным образом представляется в виде конечной линейной комбинации некоторых, векторов системы {ха}. 3) Любые два базиса Гамеля в линейном пространстве равномощны; мощ- ность базиса Гамеля линейного пространства иногда называют алгебраической размерностью этого пространства. 4) Линейные пространства изоморфны тогда и только тогда, когда они имеют одинаковую алгебраическую размерность. 4. Фактор-пространства. Пусть L — линейное пространство, и L' — некоторое его подпространство. Скажем, что два элемен- та х и у из L эквивалентны, если их разность х—-у принадле- жит L'. Это отношение рефлексивно, симметрично и транзитивно, т. е. определяет разбиение всех xeL на классы. Класс эквива- лентных элементов называется классом смежности (по подпро- странству L'). Совокупность всех таких классов мы назовем фактор-пространством L по L' и обозначим L/L'. В любом фактор-пространстве, естественно, вводятся опера- ции сложения и умножения на числа. Именно, пусть £ и ц — два класса, представляющих собой элементы из L/L'. Выберем в ка- ждом из этих классов по представителю, скажем, х и у соответ- ственно, и назовем суммой классов £ и т] тот класс £, который содержит элемент х 4- у, а произведением класса £ на число а тот класс, который содержит элемент ах. Легко проверить, что результат не изменится от замены представителей х и у какими- либо другими представителями х' и у' тех же классов £ и гр Та- ким образом, мы действительно определили линейные операции над элементами фактор-пространства L/L'. Непосредственная проверка показывает, что эти операции удовлетворяют всем тре- бованиям, содержащимся в определении линейного пространства
724 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. 1Ц (проведите эту проверку!). Иначе говоря, каждое фактор-про- странство L/L' (с теми операциями сложения и умножения на числа, которые мы сейчас в нем определили) представляет собой линейное пространство. Если L — пространство п измерений, а его подпространство L' имеет размерность k, то фактор-пространство L/L' имеет раз- мерность п — k (докажите это!). Пусть L — произвольное линейное пространство и L' — неко- торое его подпространство. Размерность фактор-пространства L]L' называется коразмерностью подпространства L' в простран- стве L. Если подпространство L' с: L имеет конечную коразмерность п, то в L можно выбрать элементы хь х2, ..., хп так, что всякий элемент х е L будет (однозначно) представим в виде х = a, Xj + ... + апхп + у, где аь ..., ап — числа и у е L'. Действительно, пусть фактор- пространство L/L' имеет размерность п. Выберем в этом фактор- пространстве базис •••, и из каждого класса выбе- рем по представителю xh. Пусть теперь х — любой элемент из L и £ — тот класс в L/L', который содержит х. Тогда 5 = ai£i + • • • + ап£п. По определению это значит, что каждый элемент из £, в част- ности х, отличается лишь на элемент из L' от такой же линей- ной комбинации элементов .......хп, т. е. x = aix1+ ... апхп-\- у. Однозначность такой записи предоставляем доказать чита- телю. 5. Линейные функционалы. Числовую функцию f, опреде- ленную на некотором линейном пространстве L, мы будем назы- вать функционалом. Функционал f называется аддитивным, если f (.х + у) = f (х) + f (у) для всех х, уе=Ь\ он называется однородным, если f (ax) = af (х) (a — произвольное число). Функционал f, определенный в комплексном линейном пространстве, называется сопряженно-однородным, если f(ax) = — af(x), где a—число, комплексно сопряженное а. Аддитивный однородный функционал называется линейным функционалом. Аддитивный сопряженно-однородный функцио- нал называется сопряженно-линейным, а иногда полулинейным.
ЛИНЕЙНЫЕ ПРОСТРАНСТВА 125 * Ч Укажем примеры линейных функционалов. 1. Пусть R” есть /г-мерное арифметическое пространство с элементами х — (xi, ..., хп) и а = (аь ..., ап)— произвольный набор из п фиксированных чисел. Тогда f W = £ aix{ ы — линейный функционал в Rn. Выражение f W = X diXi i=l представляет собой сопряженно-линейный функционал в Сп. 2. Интегралы ь ь IМ = х (0 dt и 7 [х] = к (0 dt а а представляют собой соответственно линейный и сопряженно-ли- нейный функционалы в пространстве С [а, Ь]. 3. Рассмотрим более общий пример. Пусть уо — некоторая фиксированная непрерывная функция на [а, Ь]. Положим для лю- бой функции х <= С [а, Ь] ь F (х) = х (0 уо (0 dt. а Линейность этого функционала следует из основных свойств операции интегрирования. Функционал ь F(x)= х (0 y0(t) dt а будет сопряженно-линейным (в комплексном пространстве С[а,Ь]). 4. Рассмотрим в том же самом пространстве С [а, б] линейный функционал другого типа, а именно, положим б/„(х) = х(/0), так что значение функционала f>t„ на функции х равно значению этой функции в фиксированной точке t0. Этот функционал обычно записывают в виде ь 6fo(x)= x(t)b(t — t0)dt, а понимая под б «функцию», которая равна нулю всюду, кроме точки t = 0, и интеграл от которой равен единице (б-функция
126 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. ПГ Дирака). Такие «функции» получили строгое определение в рам- ках теории обобщенных функций, элементы которой будут изло- жены в § 4 следующей главы. 5. Приведем пример линейного функционала в простран- стве /г- Пусть k — фиксированное целое положительное число. Для каждого х — (xi, ..., хп, .. .) из /2 положим Д(х) = х&. Ли- нейность такого функционала очевидна. Эти функционалы до- пускают «распространение» на другие пространства последова- тельностей, например, на cQ, с, т, R°° (примеры 5—8 п. I). 6. Геометрический смысл линейного функционала. Пусть f — некоторый отличный от тождественного нулЦ линейный функ- ционал на линейном пространстве L. Совокупность тех элемен- тов х из L, которые удовлетворяют условию Дх) = 0, представляет собой подпространство пространства L — подпро- странство нулей или ядро функционала f. Действительно, если f (-^) = f (i/) = 0, то f (ах + Ру) = af (х) + pf (у) == 0. Это подпространство обозначается Kerf ’). Подпространство Kerf имеет коразмерность 1. Действитель- но, возьмем какой-либо элемент Хо, не входящий в Ker f, т. е. такой элемент, что f(xo)=0=O. Такой элемент найдется, поскольку f(x)^feO. Без ограничения общности можно считать, что f (х0) = 1, ибо в противном случае мы заменили бы х0 на • (Ясно, I \хо) X что f ( f(Xx° j~) = 1) Для кажД°Г0 элемента х положим у = = х —f(x)x0; тогда f (у) = f (х — f (х)х0) = 0, т. е. у <= Kerf. Представление элемента х в виде х — ах0 + у, где у & Ker f, при фиксированном элементе х0 единственно. В самом деле, пусть х = ах0 т У, У е Ker f, х = а'х0 + у', у' е Ker f. Тогда (а — а')х0 = у' — у. Если здесь а — а', то очевидно, что у' = у. Если же а =0= а', то х0 = е Ker f, что противо- речит выбору Хо. Отсюда следует, что два элемента Xi и х2 тогда и только то- гда принадлежат одному классу смежности по подпространству Kerf, когда f(х,)= f(x2). Действительно, из Xi = f(Х])х0 + yi, х2 = f(х2)х0 + у2 выте- кает, что Xj —x2 = (f(xi) —/(х2))-х0-|-(у1 —у2). Отсюда видно, что X] — х2 е Ker f тогда и только тогда, когда коэффициент при Хо, т. е. f (xi)— f(x2) равен 0. >) От английского слова kernel — ядро.
4'1 ЛИНЕЙНЫЕ ПРОСТРАНСТВА 127 Всякий класс £ по подпространству Ker f определяется лю- <5ым из своих представителей. В качестве такого представителя можно взять элемент вида ах0. Отсюда видно, что подпростран- ство L/Кег f действительно одномерно, т. е. Ker f имеет кораз- мерность 1. Подпространство Ker f определяет линейный функционал, об- ращающийся на нем в нуль, с точностью до постоянного множи- теля. В самом деле, пусть функционалы f и g имеют одно и то же ядро: Ker f = Ker g. Выберем элемент х0 так, чтобы f(x0)= 1. Мы утверждаем, что g(x0) =4= 0. Действительно, x = f(x)x0 + у, у (= Ker f == Ker g, я g W = f (x) g (x0) + g (y) = f (x) g (x0). Если бы значение g(x0) равнялось 0, то функционал g был бы тождественным нулем. Из равенства g(x) = g(x0)f(x) и выте- кает пропорциональность функционалов g и f. Для всякого подпространства L' коразмерности 1 можно ука- зать такой функционал f, что Ker f = L'. Достаточно выбрать произвольный элемент хофЬ' и представить каждый элемент х е= L в виде х = ах0 у. Такое представление единственно. По- ложив f(x)— а, мы получим линейный функционал f, для кото- рого Ker f — L' (проверить это!). Пусть L' — какое-нибудь подпространство коразмерности 1 в линейном пространстве L\ тогда всякий класс смежности про- странства L по подпространству L' называется гиперплоскостью, параллельной подпространству L' (в частности, само подпро- странство L' является гиперплоскостью, содержащей 0, т. е. «проходящей через начало координат»). Иными словами, гипер- плоскость М', параллельная подпространству L', — это множе- ство, получающееся из L' параллельным переносом (сдвигом) на какой-нибудь вектор х0 s L: М' = L' + х0 = {у: у = х + х0, x^L'}. Ясно, что если хое L', то M'=L'; если же х^фЬ', то М'^Ь'. Если f — нетривиальный линейный функционал на пространстве Д то множество Mf = {х: f(x)= 1} является гиперплоскостью, параллельной подпространству Ker f (действительно, фиксируя какой-нибудь элемент х0, для которого f(xQ)= 1, мы можем вся- кий вектор х е Mf представить в виде х = х0 + у, где у е Ker f). “С другой стороны, если М' — какая-нибудь гиперплоскость, па- раллельная подпространству L' (коразмерности 1) и не проходя- щая через начало координат, то существует единственный линейный функционал f такой, что М' — {х: f[x)= 1}. Действи- тельно, пусть М' = L' 4- х0, х0 е L-, тогда всякий элемент хе L
128 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. [ц однозначно представим в виде х = ах0 + У, где у е L'. Полагая, как и выше, f(x) = а, мы получим искомый линейный функцио- нал; единственность следует из того, что если g(x)== 1 при х е М', то g(y) = 0 при у е L', так что g (ах0 + У) = а = f (ах0 + у). Таким образом, установлено взаимно однозначное соответ- ствие между всеми нетривиальными линейными функционалами, определенными на L, и всеми гиперплоскостями в L, не проходя- щими через начало координат. Упражнение. Пусть f, fi, .... fn — такие линейные функционалы на линейном пространстве L, что из fi(x) = ... = fn(x) = 0 вытекает f(x) = 0. п Тогда существуют такие постоянные alt ,ал, что f (х) — а^/г(.х) для всех х е L. § 2. Выпуклые множества и выпуклые функционалы. Теорема Хана — Банаха 1. Выпуклые множества и выпуклые тела. В основе многих важных разделов теории линейных пространств лежит понятие выпуклости. Оно опирается на наглядные геометрические пред- ставления, но вместе с тем допускает и чисто аналитическую формулировку. Пусть L — некоторое линейное действительное про- странство и х, у — две его точки. Назовем замкнутым отрезком в L, соединяющим точки х и у, совокупность всех элементов вида ах -ф ₽У, где а, р^О, а-|-р=1. Отрезок без концевых точек х и у называется открытым от- резком. Множество М с L называется выпуклым, если оно вместе с любыми двумя точками х и у содержит и соединяющий их отрезок. Назовем ядром 1 (Е) произвольного множества Е с L сово- купность таких его точек х, что для каждого у L найдется та- кое число е = е (у) > 0, что х -f- ty е Е при 111 •< е. Выпуклое множество, ядро которого не пусто, называется выпуклым телом. Примеры. 1. В трехмерном евклидовом пространстве куб, шар, тетраэдр, полупространство представляют собой выпуклые тела. Отрезок, плоскость, треугольник в том же пространстве — выпуклые множества, но не выпуклые тела. 2. Рассмотрим в пространстве непрерывных функций на от- резке {a, ft] множество функций, удовлетворяющих условию
J 2] ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИОНАЛЫ 129 .(/(/) | 1. Это множество выпукло; действительно, если |f(0 I 1 и I g(0 I 1, то при а + р = 1,а, pxssO I af (О + ₽g(0 К а + ₽= 1. Упражнение. Проверить, является ли это множество выпуклым телом. 3. Единичный шар в /2, т. е. совокупность таких точек х — =2 (хь ... , х„, .. .), что 2Z х„ 1> есть выпуклое тело. Его ядро состоит из точек х, удовлетворяющих условию У, х2 < 1. 4. Основной параллелепипед П в /2— выпуклое множество, но не выпуклое тело. В самом деле, пусть хеП; это означает, что \хп | 1/2п-1 для всех п = 1,2, ... Положим у0 = (1, 1/2, ... ..., 1/п,...). Пусть х4-/г/0еП, т. е. \хп + t/n\ 1/2п-1; тогда откуда t — 0, т. е. ядро множества П пусто. Упражнения. 1. Пусть Ф — совокупность точек х= ...... ...) из h, удовлетворяющих условию 1. Доказать, что Ф — выпуклое множество, но не выпуклое тело. 2. Доказать то же самое для множества точек в /2, каждая из которых имеет лишь конечное число отличных от нуля координат. Если М — выпуклое множество, то его ядро J (М) тоже вы- пукло. Действительно, пусть х, у е 7(Л1) и z — ах + $у, а, 0X^0, а+р=1. Тогда для данного «еА найдутся такие ei > 0 и е2 > 0, что при | Л | < ei, | /21 < е2 точки х + t\a и у + t^a принадлежат множеству Л1, следовательно, ему принадлежит и точка а (х + ta) + р (у + ta) = z 4- ta при 111 < е = min (ei, 62), т. е. z <= 7(Л1). Установим следующее важное свойство выпуклых множеств. Теорема 1. Пересечение любого числа выпуклых множеств есть выпуклое множество. Доказательство. Пусть М = П Ма и все Ма — выпук- а лые множества. Пусть, далее, х и у — две произвольные точки из М. Тогда отрезок, соединяющий точки х и у, принадлежит каждому Ма, а следовательно, и М. Таким образом, М действи- тельно выпукло. Заметим, что пересечение выпуклых тел (будучи выпуклым множеством) не обязано быть выпуклым телом (приведите пример). Для произвольного множества А в линейном пространстве L существует наименьшее выпуклое множество, которое его со- держит; им будет пересечение всех выпуклых множеств, со- держащих А (по крайней мере одно выпуклое множество, содержащее А, существует — это все L). Минимальное выпуклое
130 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. IH множество, содержащее А, мы назовем выпуклой оболочкой множества А. Рассмотрим один важный пример выпуклой оболочки. Пусть Хь х2, Хп+1 — точки некоторого линейного пространства. Мы скажем, что эти точки находятся в общем положении, если векторы х2— X], х3 — Xi, ..., хп+1 — Х] линейно независимы. (Это rt+1 rt+1 равносильно тому, что из У, Mxf = 0 и У Af = O вытекает, что t=i £=| М = Л2 = ... =Xn+i=0). Выпуклая оболочка точек хь х2, .. . , Хп+ь находящихся в общем положении, называется «-мерным симплексом, а сами точки Xi, х2...х„+1 — его вер- шинами. Нульмерный симплекс — это одна точка. Одномерный симплекс — отрезок, двумерный — треугольник, трехмерный — тетраэдр. Если точки Xi, х2, ..., Хп+1 находятся в общем положении, то любые k 1 из них (£ < п) также находятся в общем поло- жении и, следовательно, порождают некоторый й-мерный сим- плекс, называемый k-мерной гранью данного «-мерного сим- плекса. Например, тетраэдр с вершинами е2, е3, е4 имеет четыре двумерные грани, определяемые соответственно трой- ками вершин (е2, е3, <?4), (еь е3, е4), (е{,е2,е4), (еь е2, е3), шесть одномерных граней и четыре нульмерных. Теорема 2. Симплекс с вершинами Х\, х2, ..., xn+i есть совокупность всех точек, которые можно представить в виде п-Ы rt+1 ^=Е“Л, а*>0, Еац=1. (1) Х=1 fe=l Доказательство. Легко проверить, что совокупность S точек вида (1) представляет собой выпуклое множество, содер- жащее точки Xi, х2, ..., хп+ь С другой стороны, всякое выпук- лое множество, содержащее эти точки, должно содержать и точки вида (1); следовательно, S является наименьшим вы- пуклым множеством, содержащим точки Xi, х2, ..., хп+ь 2. Однородно-выпуклые функционалы. С понятием выпук- лого множества тесно связано важное понятие однородно-вы- пуклого функционала. Пусть L — действительное линейное про- странство. Определенный на L функционал р называется вы- пуклым, если р(ах-ф(1 — а)г/)<ар(х) + (1 — а)р(у) (2) для всех х, y^L и 0^а^1. Функционал р называется положительно-однородным, если р (ах) = ар (х) для всех х е L и всех а > 0. (3)
5 2] ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИОНАЛЫ 131 Для выпуклого положительно-однородного функционала вы- полнено неравенство: р(х + у)^р(х) + р(у). (2') Действительно p(^+i/) = 2p(AY£)<2(p (у)+ Р (у)) = pW + р(у). Легко понять, что условие (2') вместе с условием (3) обеспе- чивает выпуклость функционала р. Положительно-однородный выпуклый функционал мы будем называть короче однородно- выпуклым. Укажем некоторые простейшие свойства однородно- выпуклых функционалов. 1. Полагая в равенстве (3) х = 0, получаем р(0) = 0. (4) 2. Из (2') и (4) следует, что О = р{х + (— х)) < р (х) + р(— х) для всех xeL. (5) Это неравенство означает, в частности, что если р(х)<0, то обязательно р(—х) > 0. Таким образом, ненулевой однородно- выпуклый функционал может быть всюду неотрицателен, но если всюду р(х) 0, то р(х) bs 0. 3. При любом а р (ах) ар (х). При а > 0 это следует из (3), при а = 0 — из (4); если же а < 0, то в силу (5) получаем 0 < р (ах) 4- р (| а | х) = р (ах) +1 а | р (х), т. е. р (ах) > — | а | р (х) = ар (х). Примеры. 1. Всякий линейный функционал является, оче- видно, однородно-выпуклым. Однородно-выпуклым будет и функционал р(х) = |/(х) |, если / линеен. 2. Длина вектора в л-мерном евклидовом пространстве есть однородно-выпуклый функционал. Здесь условие (2') означает, что длина суммы двух векторов не превосходит суммы их длин (неравенство треугольника), а (3) непосредственно следует из определения длины вектора в Rn. 3. Пусть т — пространство ограниченных последовательно- стей х = (xi, х2,..., хп,...). Функционал р (х) = sup | х„ | п — однородно-выпуклый.
132 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. Hi 3. Функционал Минковского. Пусть L — произвольное ли- нейное пространство и А — выпуклое тело в L, ядро которого содержит точку 0. Функционал Ра (х) = inf { г: у- е А, г > 0 } (6) называется функционалом Минковского выпуклого тела А. Теорема 3. Функционал Минковского (6) — однородно- выпуклый и неотрицательный. Обратно, если р(х)— произволь- ный однородно-выпуклый неотрицательный функционал на ли- нейном пространстве Luk — положительное число, то А = {х: p(x)<fe) (7) есть выпуклое тело, ядром которого служит^ множество {х: p(x)<k) (содержащее точку 0). Если в (7) k= 1, то исход- ный функционал р(х) есть функционал Минковского для А. Доказательство. Для всякого x^L элемент х/r при- надлежит А, если г достаточно велико; поэтому величина рА(х), определяемая равенством (6), неотрицательна и конечна. Про- верим положительную однородность функционала (6). Если t > 0 и у = tx, то Ра (у) — inf (г > 0; У1Г е А} = inf {г > 0: tx/r е А) = = inf {tr' > 0: xjr' А} = t inf {г' > 0: x/r е А} = tpA (х). (8) Проверим выпуклость рА(х). Пусть xt, x2^L и е>0 произ- вольно. Выберем числа (i— 1,2) так, что рА(Хг)<г,< <Рл(Хг) + е; тогда хД-еА. Положим г = г, + г2, тогда точка (%! -|- х2)/г = Г1%1/(гг1) + г2х2/(гг2) принадлежит отрезку с кон- цами xjri и х2]г2. В силу выпуклости А этот отрезок, а значит, и точка (%1 4-х2)/г принадлежат А, откуда Ра (Xi + х2)< г = Г| + г2 < рА (%i) + рА (х2) + 2е. Так как е > 0 здесь произвольно, то Ра (xi + х2) < рА (х,) + рА (х2). Следовательно, рА(х) удовлетворяет условиям (27) и (3), а по- тому это — неотрицательный однородно-выпуклый функционал. Рассмотрим теперь множество (7). Если х,у <= А и а + + Р = 1, а, Р 0, то р (ах + Ру) < ар (х) + Рр (у) < k, т. е. А выпукло. Далее, пусть p(x)<Zk, / > 0 и у е L, тогда р (х ± ty)^p (х) + tp (± у).
$2] ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИОНАЛЫ 133 Если р(—у) = р(у) = 0, то x±ty<=A при всех t; если же хотя бы одно из неотрицательных чисел р(у), р(—у) отлично от О, то х ± ty <= А при t < k~P(x) max [р (у), р (— у)] • Непосредственно из введенных определений ясно, что р слу- жит функционалом Минковского для множества {х: р(х)^1}. Итак, введя понятие функционала Минковского, мы устано- вили соответствие между неотрицательными однородно-выпук- лыми функционалами и выпуклыми телами с ядром, содержа- щим точку 0. Примеры. 1. При А = L имеем, очевидно, pL(x)==0. 2. Пусть А — шар с центром 0 и радиусом г в Rn. Тогда Ра (х) = II х ||/г, где || х || — длина вектора х. 3. Пусть А — «слой» —I sC Х\ 1 в пространстве 12 после- довательностей х = (хь х2,..., хп,...). Тогда Ра(*) = 1 *i I- Замечания. 1. Иногда удобно рассматривать однородно- выпуклые функционалы, которые могут принимать не только конечные значения, но и значение -фоо (но не —сю). Тогда из равенства р(ах) = ар(х) (где а > 0) следует, что р(0) = 0 или р(0)=оо. Легко проверить, что в этом последнем случае можно, не нарушая однородной выпуклости функционала, из- менить его значение в одной точке, положив р(0) = 0 вместо р(0) = +°о. Так обычно и делают. Если р(х) — однородно-выпуклый, но не обязательно конеч- ный, функционал, то А = {х: p(x)^k} есть выпуклое множе- ство, но не обязательно выпуклое тело. Обратно, если А — про- извольное выпуклое множество, содержащее точку 0, то для него можно определить функционал Минковского формулой (6), но при этом придется для г допускать и значение + °о. 2. Если Pi(x) и р2(х)— однородно-выпуклые функционалы, то таковы же pi (х) + Рг(х) и арДх) при а > 0. Далее, если {p5(x)}ssS — произвольное семейство однородно-выпуклых функ- ционалов, то таков и функционал р(х) = supps(x). В частности, s^S верхняя грань р (х) = sup fs (х) любого непустого множества seS линейных функционалов на L есть однородно-выпуклый функцио-
134 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. IIF нал. Воспользовавшись теоремой Хана — Банаха, легко показать что так можно представить всякий (конечный) однородно-выпук- лый функционал. Упражнение. Множество А в линейном пространстве L называется- поглощающим, если для всякого х s L существует такое а > 0, что х е ХЛ для всех л > а. Доказать, что выпуклое множество А — поглощающее- в том и только том случае, если его ядро содержит точку О. 4. Теорема Хана — Банаха. Пусть L — действительное ли- нейное пространство и Lo — некоторое его подпространство. Пусть, далее, на подпространстве Lo задан некоторый линейный функционал f0. Линейный функционал f, определенный на всем пространстве L, называется продолжением функционала fQ, если f (х) = f0 (х) для всех х <= Lo. I Задача о продолжении линейного функционала часто встре- чается в анализе. Основную роль во всем этом круге вопросов^ играет следующая теорема. Теорема 4 (Хан — Банах). Пусть р — однородно-выпук- лый функционал, определенный на действительном линейном: пространстве L, и пусть Lo — линейное подпространство в Если f0 — линейный функционал на Lo, подчиненный на Lo функ- ционалу р(х), т. е. если на Lo /oMO(4 (9> то f0 может быть продолжен до линейного функционала f на L„ подчиненного р(х) на всем L. Доказательство. Покажем, что если Lo =/= L, то функ- ционал f0 можно продолжить с Lo на некоторое большее под- пространство L' с сохранением условия (9). Действительно,, пусть z— произвольный элемент из L, не принадлежащий Lo> и пусть L' — подпространство, порожденное Lo и г. Каждый элемент из L' имеет вид tz -)- х, где х е Lo. Если f' — искомое продолжение функционала fo на L', то f' (tz + х) = if' (z) + f0 (x), или, если положить f'(z) = с, f' (tz + x) = tc + f0 (x). Теперь выберем с так, чтобы сохранить на L' условие подчине- ния (9), т. е. так, чтобы при всех х <= Lo и всех действительных t выполнялось неравенство fo(x) + tc р(х + tz). При t > О оно равносильно условию fo (т) + c^p(-7 + z)> или c<p(-7 + z) — fo (7).
j 2] ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИОНАЛЫ 135 а при t < 0 — условию /о(у) + с>-р(-Т-г), или Покажем, что всегда существует число с, удовлетворяющее этим двум условиям. Пусть у' и у” — произвольные элементы из Lo- Тогда — fo (У") + Р {у" + z) > — f0 (у') — р(—у' — г). (10) Это вытекает из неравенства fo (У") — fo < Р (У" — У') = Р ((/' + z) — (У' + z)) < < р (у" + z) + р (— у' — z). Положим с" — inf (— f0 (у") + р (у" + z)), с' = sup (— fo (у') — р (— у' — z)). у" «' Из (10' в силу произвольности у' и у" следует, что с" с'. Вы- брав с так, что с" с', определим функционал f' на L' формулой Г (tz + х) = tc + fo (х). Этот функционал удовлетворяет условию подчинения (9). Итак, мы показали, что если функционал fo определен на не- котором подпространстве Lo с L и удовлетворяет на Lo усло- вию (9), то fo можно продолжить с сохранением этого условия на некоторое большее подпространство L'. Если в L можно выбрать счетную систему элементов хь jc2, -. •, хп, ..., порождающую все L, то функционал на L строим по индукции, рассматривая возрастающую цепочку подпрост- ранств L(1) = {L0, xj, L(2) = {Lll), х2}, ... “(здесь {LW, Xfe+i} означает минимальное линейное подпростран- ство в L, содержащее LW и Хь+1). Тогда каждый элемент хе£ ©ойдет в некоторое LW и, следовательно, функционал будет про- должен на все L. В общем случае (т. е. когда счетного множества, порождаю- щего L, не существует) доказательство заканчивается примене- нием леммы Цорна. Совокупность 3 всевозможных продолже- ний функционала f0, удовлетворяющих условию подчинения (9), частично упорядочена, и каждое ее линейно упорядоченное подмножество Зо обладает верхней гранью; этой верхней
136 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ III гранью служит функционал, определенный на объединении об- ластей определения функционалов f' е g0 и совпадающий с каждым таким f' на его области определения. В силу леммы Цорна во всем § существует максимальный элемент f. Этот максимальный элемент f и представляет собой искомый функ- ционал. Действительно, он является продолжением исходного' функционала f0, удовлетворяет условию (9) на своей области определения и задан на всем L, так как иначе мы продолжили бы его описанным выше способом с того собственного подпро- странства, на котором он определен, на большее подпростран- ство, и f не был бы максимальным. Теорема доказана. Приведем еще комплексный вариант теоремы Хана — Ба- наха. Неотрицательный функционал р на комплексном линей- ном пространстве L называется однородно-выпуклым, если для всех х, у L и всех комплексных чисел А р(х + у)^р(х) + р(у), р(Ах) = | А|р(х). Теорема 4а. Пусть р — однородно-выпуклый функционал на комплексном линейном пространстве L, a f0 — линейный функционал, определенный на некотором линейном подпрост- ранстве LaciL и удовлетворяющий на нем условию lfo(x)Kp(x), xeL0. Тогда существует линейный функционал f, определенный на всем L и удовлетворяющий условиям 1/(х)Ю(х), x^L, f(x) = f0(x), x(eeL0. Доказательство. Обозначим через LR и L0R простран- ства L и Lo, рассматриваемые как действительные линейные пространства. Ясно, что р — однородно-выпуклый функционал на Lr, а /он(х) = Ref0(x)— действительный линейный функцио- нал на Lqr, удовлетворяющий условию I f or (х) К р (х) и, тем более, условию (х) < р (х). В силу теоремы 4 существует действительный линейный функ- ционал fR, определенный на всем LR и удовлетворяющий усло- виям fR(x)<p(x), xe=LR(=L), ?R (х) == foR (х), X е Lqr (= Lo).
$ 2J ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИОНАЛЫ 137 Ясно, что —'fn(x) = fR(—х) р(—х) = р(х), так что |/я(х)|<р(х), x<=Lr(=L). (II) Определим функционал f на L, полагая f (х) = f R (х) — ifR (ix) (здесь мы пользуемся тем, что L — комплексное линейное пространство, так что в нем определено умножение на ком- плексные числа). Непосредственная проверка показывает, что f — комплексный линейный функционал на L, причем f (х) = f0 (х) при х (= Lo, Re f (х) — fR(x) при xeL. Осталось показать, что | f (х) | р (х) для всех xeL. До- пустим противное; тогда для некоторого xaeL имеем |/(х0) | > >р(х0). Представим комплексное число f(xQ) в виде f(x0) = =ре‘ф, где р > 0, и положим y0—e~i4>xa. Тогда fR (у0) =Re f (t/0) = = Re (x0)] = p > p (x0) = p(yo), что противоречит усло- вию (11). Теорема доказана. Упражнение. Покажите, что условие конечности функционала р в теореме Хана — Банаха можно опустить. 5. Отделимость выпуклых множеств в. линейном простран- стве. Пусть L — действительное линейное пространство, а М « N — два его подмножества. Говорят, что определенный на L линейный функционал f разделяет эти множества, если суще- ствует такое число С, что f(x)^C при хеМ и f(x)^C при xe.V, т. е. если inf f (х) > sup f (х). х<=М xesN Функционал f называется строго разделяющим множества М и N, если выполнено строгое неравенство inf f (х) > sup f (х). хеN Следующие два утверждения непосредственно вытекают из определения разделимости. 1) Линейный функционал f разделяет множества М и N в том и только том случае, когда он разделяет множества -А1 — N и {0} (т. е. множества всех элементов вида х — у, где X е М, у <= М, и точку 0). 2) Линейный функционал f разделяет множества М и W в том и только том случае, когда при каждом хе L он разде- ляет множества М — х и N — х.
138 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА (ГЛ. ИГ Из теоремы Хана — Банаха легко получается следующая теорема об отделимости выпуклых множеств в линейном про- странстве, имеющая многочисленные применения. Теорема 5. Пусть М и N — выпуклые множества в дей- ствительном линейном пространстве L, причем ядро хотя бы: одного из них, скажем М, не пусто и не пересекается с другим- множеством. Тогда существует ненулевой линейный функционал, на L, разделяющий М и N. Доказательство. Без ограничения общности можно счи- тать, что точка 0 принадлежит ядру М множества М. (Иначе- мы рассмотрели бы множества М — х0 и N — х0, где х3е,Й.) Пусть уо е N, тогда точка — у0 принадлежит ядру множества: М — N, а 0 принадлежит ядру д множества К = М — N уо.. О о Так как М Г) N = 0, то 0 не принадлежит ядру Af — N и у0<£ К. Пусть р — функционал Минковского для К. Тогда р(уо)^ 1, по- скольку уо^К. Введем линейный функционал fo (ai/o) = «Р (i/o). Он определен на одномерном пространстве, состоящем из эле- ментов вида ауо, и удовлетворяет условию fo(az/oXp(az/o), поскольку р(ауо)=ар{Уо) при a 0, и fo(af/o) = af0(Po) < 0 < < p(apo) при a < 0. По теореме Хана — Банаха функционал /о можно продолжить до линейного функционала f, определенного на всем L и удовлетворяющего на L условию f(y)^p(y). Отсю- да следует, что f(y)^ 1 при у е К и в то же время f(yo)^ L. Таким образом, f разделяет множества К и {г/0}, а следователь- но, f разделяет М — N и {0}; но тогда f разделяет множества М и N. Теорема доказана. § 3. Нормированные пространства В главе II мы занимались топологическими и, в частности,, метрическими пространствами, т. е. множествами, в которых: введено, тем или иным способом, понятие близости элементов» а в предыдущих параграфах данной главы мы имели дело с ли- нейными пространствами. До сих пор каждое из этих понятий стояло особняком. Однако в анализе приходится иметь дело с пространствами, в которых введены как операции сложения эле- ментов и умножения их на числа, так и некоторая топология,, т. е. рассматривать так называемые т о п о л о г и ч е с к и е ли- нейные пространства. Среди последних важный класс об- разуют нормированные пространства. Теория этих
*3] НОРМИРОВАННЫЕ ПРОСТРАНСТВА 139 пространств была развита в работах С. Банаха и ряда других авторов. 1. Определение и примеры нормированных пространств. Определение 1. Пусть L — линейное пространство. Одно- родно-выпуклый функционал р, определенный на L, называется нормой, если он удовлетворяет следующим дополнительным ус- ловиям (помимо выпуклости): 1) р (х) = 0 только при х = О, 2) р(ах) = | а| р(х) для всех а. Таким образом, вспоминая определения из п. 2 § 2, мы мо- жем сказать, что нормой в L называется функционал, удовлетво- ряющий следующим трем условиям: 1) р (х) 0, причем р (х) — 0 только при х = О, 2) р(х + у)^р(х) + р(у), х, y<=L, 3) р(ах) = |а|р(х), каково бы ни было число а. Определение 2. Линейное пространство L, в котором за- дана некоторая норма, мы назовем нормированным простран- ством. Норму элемента хе L мы будем обозначать симво- лом ||х||. Всякое нормированное пространство становится метрическим Пространством, если ввести в нем расстояние Р (х, у)—Цх — уЦ. Справедливость аксиом метрического пространства тотчас же -вытекает из свойств 1)—3) нормы. На нормированные про- странства переносятся, таким образом, все те понятия и факты, жоторые были изложены в гл. II для метрических пространств. Полное нормированное пространство называется банаховым пространством или, короче, В-пространством. Примеры нормированных пространств. Многие из пространств, рассматривавшихся в гл. II в качестве примеров ’метрических (а в § 1 данной главы — линейных) пространств, ж действительности могут быть наделены естественной структу- рой нормированного пространства. 1. Прямая линия R1 становится нормированным простран- ством, если для всякого числа xeR1 положить ||х||=|х|. 2. Если в действительном n-мерном пространстве Rn с эле- ментами Х = (Х1, х2, ..., хп) положить то все аксиомы нормы будут выполнены. Формула Р(х, I/) = l|x— Vll = у/ ^(хк — ук)2
140 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. ПГ определяет в Rn ту самую метрику, которую мы в этом про- странстве уже рассматривали. В этом же линейном пространстве можно ввести норму п 1И1, = Е I xk I (2) А=1 или норму IIX ||„ = max I xk |. (3) Эти нормы определяют в Rn метрики, которые мы рассматри- вали в примерах 4 и 5 п. 1 § 1 гл. II. Проверка того, что в ка- ждом из этих случаев аксиомы нормы действительно выполнены, не составляет труда. В комплексном n-мерном пространстве Сп можно ввести норму 1И1=д/Е \xk I2, » fe=i или любую из норм (2) или (3). 3. В пространстве С[а, 6] непрерывных функций на отрезке [а, &] определим норму формулой Ilf»- max |/(0|. (4) Соответствующее расстояние уже рассматривалось в примере 6 п. 1 § 1 гл. II. 4. Пусть т — пространство ограниченных числовых последо- вательностей X = (Хь Х2, ..., Хп, .. ). Положим ||x|| = sup|x„|. (5) п Условия 1)—3) определения нормы здесь, очевидно, выполнены. Метрика, которая индуцируется в т этой нормой, совпадает с той, которую мы уже рассматривали (гл. II, § 1, п. 1, при- мер 9). 2. Подпространства нормированного пространства. Мы опре- делили подпространство линейного пространства L (не снабжен- ного какой-либо топологией) как непустое множество Lo, обла- дающее тем свойством, что если х, у <= Lo, то ах 0г/ <= Lo. В нормированном пространстве основной интерес представляют замкнутые линейные подпространства, т. е. подпространства, со- держащие все свои предельные точки. В конечномерном норми- рованном пространстве всякое подпространство автоматически замкнуто (докажите это!). В бесконечномерном случае это не так.. Например, в пространстве С[а, Ь] непрерывных функций с
I 31 НОРМИРОВАННЫЕ ПРОСТРАНСТВА 141 нормой (4) многочлены образуют подпространство, но не замк- нутое1). Другой пример: в пространстве т ограниченных последова- тельностей последовательности, содержащие лишь конечное число отличных от нуля членов, образуют подпространство. Од- нако оно не замкнуто по норме (5): в его замыкании содер- жится, например, последовательность (1, 1/2, ..., 1/п, ...). Как правило, мы будем рассматривать только замкнутые подпространства, поэтому естественно изменить терминологию, которая была установлена в § 1. Подпространством нормирован- ного пространства мы будем называть теперь только замкнутое подпространство; в частности, подпространством, порожденным данной системой элементов {ха}, мы будем называть наимень- шее замкнутое подпространство, содержащее {ха}. Мы будем говорить о нем, как о линейном замыкании системы {ха}. Сово- купность элементов (не обязательно замкнутую), содержащую вместе с х и у их произвольную линейную комбинацию ах + $у, будем называть линейным многообразием. Систему элементов, лежащую в нормированном пространстве Е, мы будем называть полной, если порожденное ею (замкну- тое!) подпространство есть все Е. Например, в силу теоремы Вейерштрасса совокупность всех функций 1, t, t2........tn, ... полна в пространстве непрерывных функций С [a, ft]. 3. Фактор-пространства нормированного пространства. Пусть R— нормированное пространство и М — некоторое его подпро- странство. Рассмотрим фактор-пространство Р = R/М. В соот- ветствии со сказанным в п. 4 § 1 этой главы Р есть линейное пространство. Определим в нем норму, положив для каждого класса смежности g 11511= inf II х||. (6) Покажем, что при этом выполнены сформулированные в п. 1 аксиомы нормированного пространства. Ясно, что всегда ||g||^ 0. Если go — нулевой элемент фактор-пространства Р (т. е. go сов- падает с подпространством Л4), то в качестве хе go можно взять нуль пространства R, и тогда получаем, что llgoll = 0. Об- ратно, если || g || = 0, то из определения нормы (6) следует суще- ствование в классе g последовательности, сходящейся к нулю. Но так как М замкнуто, то замкнут и каждый класс смежности, значит, 0 е g, а это означает, что g = М, т. е. g есть нулевой элемент в Р. Итак, || g || 0 и ||g|| = 0 лишь тогда, когда g — нуль пространства Р. *) В силу теоремы Вейерштрасса, гласящей, что всякая непрерывная Функция на отрезке есть предел равномерно сходящейся последовательности Многочленов, замыкание подпространства многочленов в С[а, 6] есть все Ча, &].
142 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. III Далее, для всякого хе/? и всякого а имеем || ах || = | а | • || х ||. Беря в обеих частях этого равенства нижнюю грань по хе^, получаем |<Х| • II а Наконец, пусть 5, т[ е/1 и хе i/ец. Тогда Н + п1К1|х + 1/||<||х|| + ||1/||. Беря в правой части этого неравенства нижнюю грань по всем хе с, i/е д получаем, что П + пИСШ + ИпИ. Итак, все аксиомы нормированного пространства для Р выпол- нены. Покажем теперь, что если R полно, то и Р = R/М полно. Действительно, согласно (6) для каждого £ е R/М найдется такой элемент хе с, что Пусть {£п}—фундаментальная последовательность в Р. Пере- ходя, если нужно, к подпоследовательности, можно считать, что ряд III П—1 сходится. Добавив к {£п} еще — нулевой элемент простран- ства Р,— выберем XnG5n+i_Gn (п = 0, 1, 2, ...) тйк, что ||^ + 1-^||>1||хп||. оо Тогда ряд XII хп II сходится, а значит, в силу полноты про- п=0 оо оо странства R сходится и ряд хп- Положив х=Ххп и обо- п=0 п=0 значив через g класс, содержащий х, получим (поскольку п хк е при каждом п) к=0 II ” II П—при П-*ОО, II *=о II т. е. £ = lim %п. Итак: П->ОО Фактор-пространство банахова пространства по любому его (замкнутому) подпространству есть банахово пространство.
«“1 ЕВКЛИДОВЫ ПРОСТРАНСТВА 143 Упражнения. 1. Пусть R— банахово пространство, В| сэ В2 сэ ... ... зэВпЗЭ... — последовательность вложенных замкнутых шаров в нем. Докажите, что она имеет непустое пересечение (не предполагается, что ра- диусы этих шаров стремятся к 0; ср. с упражнением 3 на стр. 70). Приведите пример последовательности вложенных непустых ограниченных замкнутых вы- пуклых множеств в некотором В-пространстве, имеющих пустое пересечение. 2. Пусть R—бесконечномерное В-пространство; тогда его алгебраическая размерность (см. упражнение 3 на стр. 123) несчетна. 3. Пусть R — линейное нормированное пространство; доказать справедли- вость следующих утверждений: 1) всякое конечномерное линейное многообразие в R замкнуто; 2) если М — подпространство, a W — конечномерное подпространство в R, то их сумма М + N = [х: х — у + г, у s М, геН] замкнута; привести пример двух (замкнутых) линейных подпространств в (2, сумма которых не замкнута; 3) пусть Q — открытое выпуклое множество в R, и пусть х0& Q; тогда существует гиперплоскость, проходящая через точку х0 и не пересекающая Q. 4. Две нормы, Il-Hi и ||-||2, в линейном пространстве R называются экви- валентными, если существуют такие постоянные а, b > 0, что alUlli Мг 6||х|11 для всех х е R. Доказать, что если пространство R конечномерно, то любые две нормы в нем эквивалентны. § 4. Евклидовы пространства 1. Определение евклидовых пространств. Один из хорошо известных способов введения нормы в линейном пространстве — это задание в нем скалярного произведения. Напомним, что скалярным произведением в действительном линейном простран- стве R называется действительная функция (х,у), определенная для каждой пары элементов х, у е R и удовлетворяющая сле- дующим условиям: 1) (х,у) = (у,х), 2) (xl+x2,y) = (xi,y) + (x2,y), 3) (U, у) = Цх, у), 4) (х, х) 0, причем (х, х) = 0 только при х — 0. Линейное пространство с фиксированным в нем скалярным произведением называется евклидовым пространством. В евкли- довом пространстве R вводится норма с помощью формулы 11*11 = V(*> х) . Из свойств 1)—4) скалярного произведения следует, что все аксиомы нормы при этом выполнены. Действительно, выполнение аксиом 1) и 3) нормы (п. 1 § 3) очевидно, а выполнение аксиомы 2) (неравенство треугольника) вытекает из неравенства Коши — Буняковского 1(*. */)К1И1-1Ы1> (1) которое мы сейчас докажем.
144 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. III Рассмотрим квадратный трехчлен от действительной пере- менной X, неотрицательный при всех значениях X: ф (Л) = (Ах + у, кх + у) = А2 (х, х) + 2А (х, у) + (у, у) — = 1|х|рА2 + 2(х, у)К + \\у\\\ Так как это выражение представляет собой скалярный квадрат некоторого вектора, то всегда ф(А)0. Следовательно, дискри- минант этого трехчлена меньше или равен нулю. Неравенство Коши — Буняковского (1) как раз и выражает не что иное, как неположительность дискриминанта этого квад- ратного трехчлена <р(А). Отметим, что в евклидовом пространстве сумма, произведе- ние на число и скалярное произведение непрерывны, т. е. если хп->х, уп-^у (в смысле сходимости по норме), АП->А (как числовая последовательность), то хп + Уп~*х-\-у, Кпхп -> Ах, (хп, уп)-+(х, у). Доказательство этих фактов основано на использовании не- равенства Коши — Буняковского (1) и предоставляется чита- телю в качестве упражнения. Наличие в R скалярного произведения позволяет ввести в этом пространстве не только норму (т. е. длину) вектора, но и угол между векторами; именно, угол q> между векторами х и у определяется формулой с05’-тагйг- (2) При этом из неравенства Коши — Буняковского (1) вытекает, что выражение, стоящее в (2) справа, по модулю не превосхо- дит 1 и, следовательно, формула (2) действительно для любых ненулевых х и у определяет некоторый угол ф, 0 q> л. Если (х, у} = 0, то из (2) получаем, что q> = л/2; в этом слу- чае векторы х и у называются ортогональными. Система ненулевых векторов {ха} из R называется орто- гональной, если (ха, хр) = 0 при а=Н=₽. Если векторы {ха} ортогональны, то они линейно независимы. В самом деле, пусть Я1Ха1 Ц2Ха2 4“ • • ^пХап == 0>
ЕВКЛИДОВЫ ПРОСТРАНСТВА 145 § 4] поскольку {ха}— ортогональная система, имеем (%az, aiXat + . . . + апХап) = Я/ (хО/, XaJ = О, но (хар ха.) =/= 0 и, значит, л,- = 0 для всех I — 1, 2, .. ., п. Если ортогональная система {х7} полна (т. е. наименьшее со- держащее ее замкнутое подпространство есть все R), то она называется ортогональным базисом. Если при этом норма ка- ждого элемента равна 1, то система {ха} называется ортогональ- ным нормированным базисом. Вообще, если система {ха} (пол- ная или нет) такова, что ( 0 при а=0=Р, (х„, Хц) = ( . о р (, 1 при а = Р, то она называется ортогональной нормированной (короче орто- нормальной} системой. Ясно, что если {ха} — ортогональная си- {Ха 1 р— — | — ортогональная нормированная система. 2. Примеры. Рассмотрим некоторые примеры евклидовых пространств и ортогональных базисов в них. 1. n-мерное арифметическое пространство Rn, элементами ко- торого служат системы действительных чисел х = (хь х2, ... ..., хп), с обычными операциями сложения и умножения и ска- лярным произведением (х, у} = Е хд{, (3) £=1 представляет собой хорошо известный пример евклидова про- странства. Ортогональный нормированный базис в нем (один из бесконечного числа возможных) образуют векторы б! =(1, 0, 0, ..., 0), е2 = (0, 1,0, ..., 0), е„ = (0, 0, 0, ..., 1). 2. Пространство /2 с элементами х = (хь х2, .... х„, ...), где Е х2 < ОО, 4 = 1 и скалярным произведением (X, у} = Е Xitji (4) [=1 есть евклидово пространство. Действительно, сходимость ряда, стоящего в (4) справа, следует из неравенства (4) гл. II, § 1.
146 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. III Свойства 1)—4) скалярного произведения проверяются непо- средственно. Простейший ортогональный нормированный базис в образуют векторы е, = (1, 0, 0, е2~ (0, 1> 0, • • •)> , /£\ е3 = (0, 0, 1, ...), Ортогональность и нормированность этой системы ясны; вместе с тем система (5) полна: пусть x = (xj, х2, *п, ...)—лю- бой вектор из 12 и = (%], х2, хп, 0, 0, ...). Тогда есть линейная комбинация векторов б]....еп и ||х<п> — х||->0- при п -> оо. 3. Пространство С2[а, &], состоящее из непрерывных на [а, д}, действительных функций, со скалярным произведением ъ (f,g)=\f(t)g(t)dt (6> а также является евклидовым. Среди различных ортогональных базисов, которые можно указать в нем, важнейшим является тригонометрическая система, состоящая из функций cos п -т-, sinn-r--- (л=1,2, ...). (7Y 2 b — a b — a v ’’ ' v ' Ортогональность этой системы проверяется непосредственно. Если рассматриваются непрерывные функции на отрезке длины 2л, скажем, на [—л, л], то соответствующая тригономет- рическая система есть: 1/2, cosn/,. sin nt (п — 1, 2, ...). Система (7) полна. Действи- тельно, согласно теореме Вейер- штрасса, всякая непрерывная йа отрезке [а, д] функция ф, при- нимающая в точках а и b оди- наковые значения, может быть рис 17. представлена как предел равно- мерно сходящейся последователь- ности тригонометрических многочленов, т. е. линейных ком- бинаций элементов системы (7). Такая последовательность и подавно сходится к ф по норме пространства С2[а, &]. Если же f — произвольная функция из С2[а, &], то ее можно предста- .вить как предел (по норме пространства С2[а, &]) последователь- ности функций фп, каждая из которых совпадает с f на отрезке [а, b — l/п], линейна на [Ь — 1/п, Ь] и в точке b принимает то же значение, что и в точке а (рис. 17). Следовательно, каждый эле-
f 4] ЕВКЛИДОВЫ ПРОСТРАНСТВА 147 мент из С2[а, д] можно приблизить сколь угодно точно (в мет- рике этого пространства) линейными комбинациями элементов системы (7), а это и означает ее полноту. 3. Существование ортогональных базисов, ортогонализация. На протяжении оставшейся части этого параграфа мы ограни- чимся сепарабельными евклидовыми пространствами, (т. е. со- держащими счетное всюду плотное множество). Каждое из про- странств, указанных в предыдущем пункте, сепарабельно (до- кажите это!). Пример несепарабельного евклидова пространства можно построить так. Рассмотрим на прямой всевозможные функции х, для каждой из которых множество точек tt, t2, ..., в которых она отлична от нуля, не более чем счетно, а сумма %x2(t), взятая по всем таким точкам, конечна. Операции сло- жения и умножения на числа определим в этом пространстве как обычные сложение и умножение функций, а скалярное про- изведение определим формулой (х, = где сумма берется по множеству тех точек t, в которых x(/)z/(/)У= 0. Доказательство того, что в этом пространстве нет Счетного всюду плотного подмножества, мы предоставляем чи- тателю. Отметим, что это пространство — полное. Итак, пусть R— сепарабельное евклидово пространство. По- кажем, что в таком пространстве всякая ортогональная система не более чем счетна. Действительно, без ограничения общности можно считать рассматриваемую систему {фа} не только ортогональной, но и Нормированной (иначе мы заменили бы ее системой { ~у~фЦ ц~} ) • При этом II Фа — Ф(3 II = V2 , если а у= 0. Рассмотрим совокупность шаров В(<ра, 1/2). Эти шары не пе- ресекаются. Если счетное множество {фп} всюду плотно в R, то в каждом таком шаре есть по крайней мере один элемент из {фп}. Следовательно, число таких шаров (а значит, и элемен- тов <ра) не более чем счетно. В каждом из приведенных выше примеров евклидовых про- странств мы указали по ортогональному базису. Докажем те- перь следующую общую теорему, аналогичную теореме о су- ществовании ортогонального базиса в n-мерном евклидовом пространстве. Теорема 1 (об ортогонализации)./?усть A. f2, .... fa, ... (8)
148 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. Ш — линейно независимая система элементов в евклидовом про- странстве R. Тогда в R существует система элементов Ф1, Ф2, ..... (9) удовлетворяющая следующим условиям-. 1) система (9) ортогональная и нормированная-, 2) каждый элемент фп есть линейная комбинация элементов h, f2, фп = аП1Л+ ••• +annfn, причем аПп =/= 0; 3) каждый элемент fn представляется в виде Л,==Ь„1Ф1+ ••• +&ппфп, причем Ьпп^=0. Каждый элемент системы (9) определяется условиями 1)—3) однозначно с точностью до множителя ±1. Доказательство. Элемент <pi ищется в виде Ф1 = «нА; при этом «и определяется из условия (Фо Ф1) = а?1 (Л. А)=1. откуда 1 ±1 a, j =--— . bn л/(4> fi) Ясно, что (pi определяется этим однозначно (с точностью да знака). Пусть элементы фь(й < и), удовлетворяющие условиям 1)—3), уже построены. Тогда fn можно представить в виде /л = ^П1Ф1+ ••• + ^л.л-1фл-1 + Лп> где (Л„, Фа) — 0 при k < п. Действительно, соответствующие коэффициенты йпа, а значит, и элемент hn, однозначно определяются из условий (ЙЛ, Фй) = (/л—^Л1Ф1—•• •—^л,л-1Фл-1, Фа) = (/л, Фа)~&лА(фА. ф*)=0. Очевидно, что (Лп, йп) > 0 (предположение (hn, йя) = 0 про- тнворечило бы линейной независимости системы (8)). Положим ______________________________ Фл “ V(*n,M ’ Из индуктивного построения ясно, что hn, а значит, и <рп^ выражаются через /ь ..., fn, т. е. фп = an\fi + ... + annfn, где ann==—ir=T =^°- Кроме того, V(Лп> ”п) (фл> Фл) = 1 > (фп, Фа) = 0 (k<n) и ______ fn = &л|ф, + • • • + ЛллФл (bnn = V(hn, hn) ф 0), т. е. фл удовлетворяет условиям теоремы.
$4] ЕВКЛИДОВЫ ПРОСТРАНСТВА 149 Переход от системы (8) к системе (9), удовлетворяющей условиям 1)—3), называется процессом ортогонализации. Ясно, что подпространства, порожденные системами (8) и (9), совпадают между собой. Следовательно, эти системы полны или не полны одновременно. Следствие. В сепарабельном евклидовом пространстве R существует ортогональный нормированный базис. Действительно, пусть фь фг> ..., фп, ... — счетное всюду плотное множество в /?. Выберем из него полную систему ли- нейно независимых элементов {fn}. Для этого достаточно из по- следовательности {фп} исключить все те элементы каждый из которых может быть представлен как линейная комбинация ф4 с i < k. Применив к полученной таким образом полной си- стеме линейно независимых элементов процесс ортогонализации, мы и построим ортогональный нормированный базис. Упражнения. 1. Привести пример (несепарабельного) евклидова про- странства, в котором нет ни одного ортогонального базиса. Доказать, что В полном евклидовом пространстве (не обязательно сепарабельном) суще- ствует ортогональный нормированный базис. 2. Доказать, что в полном евклидовом пространстве (не обязательно се- парабельном) всякая последовательность непустых вложенных выпуклых зам- кнутых ограниченных множеств имеет непустое пересечение (ср. с упражне- ниями на стр. 70 и 143). 4. Неравенство Бесселя. Замкнутые ортогональные системы. Выбрав в n-мерном евклидовом пространстве ортогональный нормированный базис et, е2........еп, можно каждый вектор хе Rn записать в виде п x=Eckek, (10) А=1 где Ck = (x,ek). (11) Выясним, как обобщить разложение (10) на случай евклидова бесконечномерного пространства. Пусть Ф1, Фг....(12) — ортогональная нормированная система в евклидовом про- странстве R и f — произвольный элемент из R. Сопоставим эле- менту f eR последовательности чисел Ck = (f,4k), k=l, 2................... (13) которые мы будем называть координатами, или коэффициентами Фурье элемента f по системе {фл}, и ряд (пока формальный) Еэдрь (14> k который мы назовем рядом Фурье элемента / по системе {фп}.
150 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ, III Естественно возникает вопрос: сходится ли ряд (14), т. е. стремится ли последовательность его частичных сумм (в смысле метрики пространства /?) к какому-либо пределу, и если он сходится, то совпадает ли его сумма с исходным элементом /? Чтобы ответить на эти вопросы, рассмотрим предварительно следующую задачу: при заданном п подобрать коэффициенты ак (k = I, 2.....п) так, чтобы расстояние между f и суммой 5л = Еал (15) t=i было минимальным. Вычислим это расстояние. Так как си- стема (12) ортогональна и нормирована, то II f — s„ ||2 = 6 — £ f — Е адЛ = \ &=t fe=i / = (Л f) — 21 f, E адч) + ( E адь E ад/1 = \ k=l / \ft=! /=1 / n n n n =Il f if - 2 E w + E «5 - ll f if - E A + E («, - ft=l я=1 Ясно, что минимум этого выражения достигается тогда, когда последнее слагаемое равно 0, т. е. при ак — ск (k— 1, 2, ..., п). (16) В этом случае 1И-5л||2 = НЛ12-Еф (17) Мы показали, что среди всех сумм вида (15) при данном п наименее уклоняется от f частичная сумма ряда Фурье эле- мента f. Геометрически этот результат можно пояснить следую- щим образом. Элемент f — Е й=1 ортогонален всем линейным комбинациям вида Е Мь t=i т. е. ортогонален подпространству, порожденному элементами фь <Р2, ' •, фп, в том и только том случае, когда выполняется условие (16) (проверьте это!). Таким образом, полученный нами результат представляет собой обобщение известной теоремы эле- ментарной геометрии: длина перпендикуляра, опущенного ид
ЕВКЛИДОВЫ ПРОСТРАНСТВА 15Г »«1 данной точки на прямую или плоскость, меньше, чем длина лю- бой наклонной, проведенной из той же точки. Так как всегда ||/— Sn||2 0, то из равенства (17) сле- дует, что п Z c2k <11 лр. *=1 Здесь п произвольно, а правая часть не зависит от п; следова- сю тельно, ряд У С1 сходится и 4=1 ® fc2<||/|p. (18)’ 4=1 к Это неравенство называется неравенством Бесселя. Геометри- чески оно означает, что сумма квадратов проекций вектора f на взаимно ортогональные направления не превосходит квад- рата длины самого вектора f. Введем следующее важное понятие. Определение 1. Ортогональная нормированная система (12) называется замкнутой, если для любого f^R справедливо равенство Г С2 =11/ IP, (19>- 4=1 называемое равенством Парсеваля. Из тождества (17) следует, что замкнутость системы (12) равносильна тому, что для каждого f е R частичные суммы ряда оо Фурье £ спФл сходятся к f. п=! Понятие замкнутости ортогональной нормированной системы тесно связано с введенным выше понятием полноты системы. Теорема 2. В сепарабельном евклидовом пространстве R всякая полная ортогональная нормированная система является замкнутой, и обратно. Доказательство. Пусть система {фп} замкнута; тогда, каков бы ни был элемент f е R, последовательность частичных сумм его ряда Фурье сходится к f. Это означает, что линейные- комбинации элементов системы {фп} всюду плотны в R, т. е. си- стема {фп} полна. Обратно, пусть система {фп} полна, т. еЛлюбой элемент f^R можно сколь угодно точно аппроксимировать ли- п нейной комбинацией S а4<Р4 элементов системы {фп}; частич- 4=1 п ная сумма У, ck<pk ряда Фурье для f дает не менее точную
152 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. П[ аппроксимацию. Следовательно, ряд ckqk сходится к f, и ра- £=1 венство Парсеваля имеет место. В предыдущем пункте мы доказали существование полных ортогональных нормированных систем в сепарабельном евкли- довом пространстве. Поскольку для ортогональных нормиро- ванных систем понятия замкнутости и полноты совпадают, су- ществование замкнутых ортогональных систем в R не нуждается в новом доказательстве, а приведенные в предыдущем пункте примеры полных ортогональных нормированных систем являют- ся в то же время примерами замкнутых систем. Выше мы все время предполагали рассматриваемые ортого- нальные системы нормированными. Можно переформулировать понятия коэффициентов Фурье, ряда Фурье и т. д. и для любых ортогональных систем. Пусть {ф„}— произвольная ортогональ- ная система. По ней можно построить нормированную систему, состоящую из элементов -".г. Для любого f^R имеем II фп II Cn = (f. Фп) = (Л Фп) И СО ОО со X спФп = X Ф” = X art<Pn’ п=1 П=1 п=1 где ___ сп ____ (ft фп) П~ ||фп|| ~ II Фп II2 • Коэффициенты ап, определяемые формулой (20), мы назовем коэффициентами Фурье элемента f по ортогональной (ненорми- рованной) системе {ф„}. Подставив в неравенство (18) вместо сп их выражения сп = ап11фп11 из (20), получаем ОО I ||Фп1К<ИЛ12 (21) П=1 — неравенство Бесселя для произвольной ортогональной си- стемы. 5. Полные евклидовы пространства. Теорема Рисса — Фи- шера. Начиная с п. 3 мы рассматривали сепарабельные евкли- довы пространства; с этого момента мы будем, кроме того, пред- полагать, что рассматриваемые пространства полны. Итак, пусть R — полное сепарабельное евклидово простран- ство и {фп} — некоторая ортогональная нормированная система в нем (не обязательно полная). Из неравенства Бесселя сле- дует, что для того чтобы числа Сь С2> гп, ... служили ко- (20)
4 4) ЕВКЛИДОВЫ ПРОСТРАНСТВА 153 эффициентами Фурье какого-либо элемента f е R, необхо- димо, чтобы ряд ОО сходился. Оказывается, что в полном пространстве это условие не только необходимо, но и достаточно. Именно, справедлива следующая теорема. Теорема 3 (Рисе — Фишер). Пусть {<рп} — произвольная ортогональная нормированная система в полном евклидовом пространстве R, и пусть числа ci> с2, ..., сп, ... таковы, что ряд Z cl (22) А=1 сходится. Тогда существует такой элемент f е R, что с» = if, 4>k) и D = llf IP- fe=l Доказательство. Положим п f П S k=i Тогда II fn+p fn IP II £n+14Pn + l H- • • • H- Cn+pTn+p IP == 2C c?. fe=n+l Так как ряд (22) сходится, то отсюда в силу полноты R выте- кает сходимость последовательности {/п} к некоторому элементу f eR. Далее (Л ф/) = (fn, Ф.) + (f — fn, фД (23) причем справа первое слагаемое при п i равно а, а второе стремится к нулю при п-*оо, так как I if — fn, ф/) Kllf - Ml • IIФ/ II. Левая часть равенства (23) от п не зависит; поэтому, пере- ходя в нем к пределу при п-> оо, получаем, что (Л ф/) =
154 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. III Так как, по определению f, II/ —/„||-*0 при то п. A=I Действительно, (f — Ё Cfe<Pfe, f — Ё с*фЛ = (f, f) — Ё c2k ->o \ A=l A=1 / A=1 при n -> oo. Установим в заключение следующую полезную теорему. Теорема 4. Для того чтобы ортогональная нормированная система {<рп} в полном сепарабельном евклидовом пространстве была полна, необходимо и достаточно, чтобы в R не существо- вало ненулевого элемента, ортогонального всем элементам си- стемы {фп}- Доказательство. Пусть система {<рп} полна и, следова- тельно, замкнута. Если f ортогонален всем элементам системы {фп}, то все его коэффициенты Фурье равны нулю. Тогда из ра- венства Парсеваля получаем (Л /) = Ё^ = о, А=1 т. е. f = 0. Обратно, пусть система {фп} не полна. Тогда в R существует такой элемент g ф 0, что оо (g, g) > Г cl (где ck = (g, фй)). R=1 На основании теоремы Рисса — Фишера существует такой эле- мент f е R, что if, Фа) = ck и (/, П = Ё 4- Элемент f — g ортогонален всем ф,. Из неравенства (Л F) = Ё cl < (g, g) А=1 следует, что f — g 0. Упражнения. 1. Пусть Н — полное евклидово пространство (не обя- зательно сепарабельное); тогда в нем существует полная ортогональная нор- мированная система {<ра) (см. упражнение 1 на стр. 149). Доказать, что для .всякого вектора f е Н справедливы разложения / = £(Афа)фа, IIГII2 = £ (f. фа)2> а а
g 4] ЕВКЛИДОВЫ ПРОСТРАНСТВА 155- где в суммах, стоящих справа, имеется не более счетного числа отличных от О слагаемых. 2. Система {<ра} векторов евклидова пространства R называется тоталь- ной, если в R не существует отличных от 0 векторов, ортогональных ко всем <ра. Теорема 4 означает, что в полном евклидовом пространстве тотальность, системы векторов эквивалентна ее полноте. Показать, что в неполных про- странствах могут существовать тотальные, но не полные системы. 6. Гильбертово пространство. Теорема об изоморфизме. Про- должим рассмотрение полных евклидовых пространств. При этом нас, как и до сих пор, будут интересовать бесконечномер- ные пространства, а не конечномерные, исчерпывающее описа- ние которых дается в курсах линейной алгебры. По-прежнему мы, как правило, будем предполагать наличие в рассматривае- мых пространствах счетного всюду плотного множества. Вве- дем следующее определение. Определение 2. Полное евклидово пространство беско- нечного числа измерений называется гильбертовым простран- ством '). Таким образом, гильбертовым пространством называется со- вокупность И элементов f, g, ... произвольной природы, удов- летворяющая следующим условиям (аксиомам). I. Н есть евклидово пространство (т. е. линейное простран- ство с заданным в нем скалярным произведением). II. Пространство Н полно в смысле метрики p{f,g) = = llf-gll. III. Пространство Н бесконечномерно, т. е. в нем для любого п можно найти п линейно независимых элементов. Чаще всего рассматриваются сепарабельные гильбертовы пространства, т. е. пространства, удовлетворяющие еще одной аксиоме. IV. Н сепарабельно, т. е. в нем существует счетное всю- ду плотное множество. Примером сепарабельного гильбертова пространства может служить действительное пространство /г- В дальнейшем мы будем рассматривать только сепарабель- ный случай. Аналогично определению 2 из § 1 два евклидовых простран- ства, R и R*, называются изоморфными, если между их элемен- тами можно установить взаимно однозначное соответствие так,, что если х <-> х', у++у* (х, у е R; X*, у* е R*), ’) По имени знаменитого немецкого математика Д. Гильберта (1862— 1943), который ввел это понятие.
156 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. Щ ТО X + у X* + у*, ах -*-> ах* и (х, у} = « у*). Иначе говоря, изоморфизм евклидовых пространств — это взаим- но однозначное соответствие, сохраняющее как линейные опе- рации, определенные в этих пространствах, так и скалярное произведение. Как известно, любые два n-мерных евклидовых пространства изоморфны между собой и, следовательно, каждое такое про- странство изоморфно арифметическому пространству Rn (при- мер 1, п. 2). Евклидовы пространства бесконечного числа из- мерений не обязательно изоморфны друг другу. Например, про- странства /2 и С2[а, Ь] между собой не изоморфны. Это видно, например, из того, что первое из них полно, а второе — нет. Однако имеет место следующий факт. Теорема 5. Любые два сепарабельных гильбертовых про- странства изоморфны между собой. Доказательство. Покажем, что каждое гильбертово про- странство Н изоморфно пространству /2. Тем самым будет до- казано утверждение теоремы. Выберем в Н произвольную пол- ную ортогональную нормированную систему {<рп} и поставим в соответствие элементу f е Н совокупность Ci, с2, ..., сп, ... его оо коэффициентов Фурье по этой системе. Так как £ с2 < оо, то fe=i к последовательность (сд, с2, ..., сп, ...) есть некоторый элемент из 12. Обратно, в силу теоремы Рисса — Фишера всякому эле- менту (ti, с2, ..., сп, • •) из 12 отвечает некоторый элемент имеющий числа сь с2, ..., сп, ... своими коэффициента- ми Фурье. Установленное соответствие между элементами из Н в 12 взаимно однозначно. Далее, если f с2, ..., сп, ...) и g*+(dh d2.....dn, ...), то f + g4-> (ti + db с2 + d2.сп + dn, ...) и а/-«-> (ctC], ас2, ..., асп, ...), т. е. сумма переходит в сумму, а произведение на число — в про- изведение соответствующего элемента на это же число. Нако- нец, из равенства Парсеваля следует, что (f,g^Ycndn. (24) л=1
ЕВКЛИДОВЫ ПРОСТРАНСТВА 157 Действительно, из того, что (£,£)= f d’ п=1 п=1 И tf + g, f + g) = (f, f) + 2(f, g) + (g, g) = оо оо оо оо = S (С.+о1 = Sл + 2 s с А + У п=1 п=1 п=1 П=1 (вытекает (24). Таким образом, установленное нами соответствие между элементами пространств Н и 12 действительно является изоморфизмом. Доказанная теорема означает, что, с точностью до изомор- физма, существует лишь одно (сепарабельное) гильбертово пространство (т. е. система аксиом I—IV полна) и что про- странство /2 можно рассматривать как его «координатную реа- лизацию», подобно тому как n-мерное арифметическое простран- п ство со скалярным произведением х1у1 представляет собой .. i = I координатную реализацию евклидова пространства п измерений, заданного аксиоматически. Другую реализацию гильбертова пространства можно полу- чить, взяв функциональное пространство С2[а, Ь] и рассмотрев его пополнение. Действительно, легко проверить, что пополне- ние R* всякого евклидова пространства R (в том смысле, как мы определили пополнение метрического пространства в § 3 гл. II) становится линейным евклидовым пространством, если в нем определить линейные операции и скалярное произведение, продолжая их по непрерывности с пространства R, т. е. по- лагая х + у = lim (хп + уп), ах = lim ахп и (х, у) — lim (хп, уп), П-Х» где хп -> х и уп -> У, хп, Уп е R. (Существование всех этих пре- делов и их независимость от выбора последовательностей {хп} и {//„} легко устанавливается). Тогда пополнение пространства С2[а, Ь] будет полным евклидовым пространством, очевидно, бес- конечномерным и сепарабельным, т. е. гильбертовым простран- ством. В главе VII мы вернемся к этому вопросу и покажем, что те элементы, которые нужно присоединить к С2[а, &], чтобы по- лучить полное пространство, тоже можно представить как функ- ции, но только уже не непрерывные (а именно, как функции, квадрат которых суммируем в смысле Лебега).
158 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. пг 7. Подпространства, ортогональные дополнения, прямая сумма. В соответствии с общими определениями § 3 линейным многообразием в гильбертовом пространстве Н мы назовем та- кую совокупность L элементов из Н, что если f, g е L, то а/ + Pg е L для любых чисел а и р. Замкнутое линейное многообразие называется подпространством. Приведем некото- рые примеры подпространств гильбертова пространства. 1. Пусть h — произвольный элемент из Н. Совокупность всех элементов f е Н, ортогональных к h, образует в Н подпростран- ство. 2. Пусть Н реализовано как 12, т. е. его элементы суть такие последовательности (Xj, х2, хп, ...) чисел, что Лх?<оо. к Элементы, подчиненные условию Xj = х2, образуют подпро- странство. 3. Пусть снова Н реализовано как пространство 12. Элементы х = (х\, х2, хп, ...), у которых хп = 0 при п = 2, 4, 6, ... (и хп произвольны при п= 1, 3, 5, ...), образуют подпростран- ство. Читателю рекомендуется проверить, что указанные в приме- рах 1—3 совокупности векторов действительно являются под- пространствами. Всякое подпространство гильбертова пространства либо яв- ляется конечномерным евклидовым пространством либо само представляет собой гильбертово пространство. Действительно, справедливость аксиом I—III для каждого такого подпростран- ства очевидна, а справедливость аксиомы IV вытекает из сле- дующей леммы. Лемма. Любое подмножество R' сепарабельного метриче- ского пространства R само сепарабельно. Доказательство. Пусть £1> ^2> • • • > • • • — счетное всюду плотное множество в R и an= inf p(g„, т]). Для любых натуральных пит найдется такая точка г)п, m е R', что Р Лт. т) < 4“ 1/ш. Пусть е > 0 и \/пг < е/3; для любого г) е R' найдется такое п„ что р(^п, т))< е/3 и, следовательно, Р (In. П™. m) < ап + Ш < е/3 + е/3 = 2е/3; но тогда р (т), т)п, т) < е, т. е. не более чем счетное множество {т)п, т} (п, m — 1, 2, ...) всюду плотно в R'.
4 4] ЕВКЛИДОВЫ ПРОСТРАНСТВА 159 Подпространства гильбертова пространства обладают неко- торыми специальными свойствами (не имеющими места для лодпространств произвольного нормированного пространства). Эти свойства связаны с наличием в гильбертовом пространстве скалярного произведения и основанного на нем понятия орто- гональности. Применив процесс ортогонализации к какой-либо счетной всюду плотной последовательности элементов произвольного лодпространства гильбертова пространства, получаем следую- щую теорему. Теорема 6. В каждом подпространстве М пространства Н содержится ортогональная нормированная система {фп}, линей- ное замыкание которой совпадает с М. Пусть М — подпространство гильбертова пространства Н. Обозначим через M± = HQM множество элементов g Н, ортогональных ко всем элементам / е М, и докажем, что тоже есть подпространство простран- ства И. Линейность А1-1 очевидна, так как из (g\, f) = (gz, f) = = 0 вытекает (aigi + azgz, f) = 0. Для доказательства замкну- тости допустим, что элементы gn принадлежат М1 и сходятся к g. Тогда для любого f е Al (g, f) = Игл (gn, f) = 0, n->oo и потому g тоже входит в Al-1-. Подпространство М1- называется ортогональным дополне- нием подпространства М. Из теоремы 6 легко получается следующая теорема. Теорема 7. Если М—(замкнутое!) линейное подпростран- ство пространства Н, то любой элемент f^H единственным об- разом представим в виде f — h + h', где h М и h' е Al1. Доказательство. Докажем сначала существование та- кого разложения. Для этого найдем в А1 полную ортогональную нормированную систему {фп} и положим оо А = £ СпФп, сп = (f, ф„). л=1 оо Так как (по неравенству Бесселя) ряд У, с2п сходится, то эле- п=1 мент h существует и принадлежит А4. Положим h' = f — h.
160 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. III Очевидно, что для всех п (Л', <рп)=0 и, поскольку произволь- ный элемент £ из М представим в виде ОО £= £ «Пфп. п—1 имеем оо (А', £)=!«„ (Л', <р„) = 0, П=1 т. е. h' е Л11. Допустим теперь, что, кроме построенного нами разложения f = h + h', существует другое разложение: f = hi + hi, hi^M, Тогда при всех п <fn) = (f, фп) = с„, откуда следует, что hi = h, h'\ = h'. Из теоремы 7 вытекают некоторые полезные следствия. Следствие 1. Ортогональное дополнение к ортогональному дополнению линейного подпространства М совпадает с самим М. Таким образом, можно говорить о взаимно дополнительных подпространствах пространства Н. Если М и Л41 — два таких дополняющих друг друга подпространства и {фп}, {<p'j—полные (соответственно в М и Л!1) ортогональные системы, то соедине- ние систем {ф„} и {<р'} дает полную ортогональную систему во всем пространстве Н. Поэтому имеет место следствие: Следствие 2. Каждая ортогональная нормированная си- стема может быть расширена до системы, полной в Н. Если система {фп} конечна, то число входящих в_н.ее эле- ментов равно размерности подпространства М, порожденного {фп}, и коразмерности подпространства Л1-1-. Таким образом, по- лучаем еще одно следствие: Следствие 3. Ортогональное дополнение к пространству конечной размерности п имеет коразмерность п, и наоборот. Если каждый вектор f е Н представим в виде f == h + h', h^M, h' e M1 (M1 — ортогональное дополнение M), то гово- рят, что Н есть прямая сумма взаимно ортогональных подпро- странств М и М1 и пишут Я = МфЛ1-Ч Ясно, что понятие прямой суммы может быть непосредственно обобщено на любое конечное или даже счетное число подпро-
ЕВКЛИДОВЫ ПРОСТРАНСТВА 161 «*] странств; именно, говорят, что Н есть прямая сумма своих под- пространств М>, М2, ..., Мп, ... H = Mi®M2® ... ©Мяф..., если 1) подпространства Mi попарно ортогональны, т. е. любой вектор из Mi ортогонален любому вектору из Mh при Г=/= й; 2) каждый элемент f е Н может быть представлен в виде f = hx + h2+ ... +hn + ..., hnf=Mn, причем если число подпространств Мп бесконечно, то ^||ЛЛ||2 — п сходящийся ряд. Легко проверить, что если такое представление элемента f существует, то оно единственно и что llflF = Zll/in II2. п Наряду с прямой суммой подпространств можно говорить о прямой сумме конечного или счетного числа произвольных гильбертовых пространств. Именно, если Hi и Н2— два гильбер- товых пространства, то их прямая сумма Н определяется сле- дующим образом: элементы пространства Н— это всевозможные пары (hi,h2), где hx е Hit h2^.H2, а скалярное произведение двух таких пар равно ((hi, h2), (hi, h'2)) = (hi, hi) + (h2, h2). В пространстве H содержатся, очевидно, взаимно ортогональ- ные подпространства, состоящие из пар вида (hi,0) и (0, h2) со- ответственно; первое из них можно естественным образом ото- ждествить с пространством Hi, а второе — с пространством Н2. Аналогично определяется сумма любого конечного числа пространств. Сумма H — ^QHn счетного числа пространств Hi, Н2, ..., Нп, ... определяется так: элементы пространства Н — это всевозможные последовательности вида h = (hi, h2, • ., hn, ...) (hns=Hn), такие, что У, || hn |р < оо. Скалярное произведение (h, g) эле- п ментов h и g из Н равно Е(й„, ёп)- п 8. Характеристическое свойство евклидовых пространств. Рассмотрим следующий вопрос. Пусть R— нормированное про- странство. Каким дополнительным условиям должна удовлетво- рять норма, определенная в R, чтобы пространство R было ев- клидовым, т. е. чтобы норма в нем определялась некоторым
162 нормированные и топологические пространства [ГЛ. ш скалярным произведением? Иначе говоря, как охарактеризовать евклидовы пространства в классе всех нормированных про- странств? Такую характеристику дает следующая теорема. Теорема 8. Для того чтобы нормированное пространство R было евклидовым, необходимо и достаточно, чтобы для любых двух элементов, fug, выполнялось равенство II f + g II2 + II f - g II2 = 2 (II f II2 + II g ||2). (25) Поскольку f + g и f — g — это диагонали параллелограмма, построенного на сторонах f и g, равенство (25) выражает из- вестное свойство параллелограмма в евклидовом пространстве: сумма квадратов диагоналей параллелограмма равна сумме квадратов всех его сторон. Таким образом, необходимость усло- вия очевидна. Докажем его достаточность. Положим (f, £) = |(llf + £ll2-|lf-£ll2), (26) и покажем, что если равенство (25) выполнено, то функция (26) удовлетворяет всем аксиомам скалярного произведения. По- скольку при f = g имеем (f, f) = т (II 2f II2 - II f - f II2) = II/ II2, (27) это и будет то скалярное произведение, которое порождает в пространстве R заданную там норму. Прежде всего, из (26) сразу видно, что (f, g) = (g, Г), т. е. свойство 1) скалярного произведения выполнено. Кроме того, в силу (27) имеет место и свойство 4). Для установления свойства 2) рассмотрим функцию трех векторов Ф(/, g, A) = 4[(f + g, h)-(f, h)-(g, h)], t. e. W, g, h) = \\f + g + h\\2-\\f + g-h\?- - II f + h ||2 +1| f - h ||2 - || g + h ||2 +1| g - h ||2, (28) и покажем, что она тождественно равна нулю. В силу (25) имеем ||f + g ± h ||2 = 2|| f ± /г |]2 + 2|| g||2-1| f ± h - g||2. Подставив соответствующие выражения в (28), получим Ф(А g, h) = -\\f + h-gf+\\f-h-g\? + + II f + A ||2 — || f —/г ||2 — Hg + А||2+ 11 g —A ||2. (29)
,4] ЕВКЛИДОВЫ ПРОСТРАНСТВА 163 Взяв полусумму (28) и (29), имеем Ф(/, g> Л) = у(11 g + h + f II2 + || g + h - f ||2) - - у (llg - h + f II2 + llg - h - f ||2) -1| g + A||2 +||g - /i||2. В силу (25) первое слагаемое равно II g + h 112 +1| f 112, а второе — равно — II g — A ||2 — II f II2, Таким образом, Ф(/, g, л>о. Установим, наконец, свойство 3)—однородность скалярного произведения. Рассмотрим для этого при любых фиксированных f и g функцию ф(с) = (с/, g) — c(f, g). Из (26) сразу следует, что <p(o)=4dlgll2-llglP)=o и <р(— 1) — 0, поскольку (—f, g)= — (f, g). Поэтому для любого целого п (nf, g) = (sgn п (f + ... + f), g) = = sgnn[(f, g)+ ... +(f, g)] = |n|sgnn(f, g) = n(f, g), t. e. <p(n) = 0. При целых p, q и q ф 0 (fA g)=p(yf. g) = f?(|A g) = ftf. g). t. e. <p(c) = O при всех рациональных c\ поскольку функция <р непрерывна, <р(с) =0. Тем самым мы показали, что функция (f, g) обладает всеми свойствами скалярного произведения. Примеры. 1. Рассмотрим n-мерное пространство Rp, в ко- тором норма определена формулой / п \(/Р ||х||р = ( Е|х*И . \fe=l / При р 1 все аксиомы нормы выполнены, однако евклидовым пространством Rp будет только при р = 2. Действительно, рас- смотрим в Rp два вектора: f = (1, 1, 0, 0..0), g = (l, -1, 0, 0, .... 0);
164 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. П[ имеем f + g = (2, 0, 0..0), f-g = (O, 2, 0....0), откуда II f llP = II g ИР = 21/р, llf + g||p = llf-gl|p = 2, так что тождество параллелограмма (25) при р#= 2 не выпол- няется. 2. Рассмотрим пространство непрерывных функций на отрез- ке [0, п/2]. Положим f(/) = cos/, g(t) — sint. Имеем llfll = llgll=l и llf+g|| = max | cos t + sin/1 = -y/2 , 0<t<n/2 Ilf —g 11 = max | cos/— sin/1= 1. 0<(<Я/2 Отсюда видно, что Ilf + gll2 + llf-gll2^2(||f||2 + U||2). Таким образом, норму пространства С[0, л/2] нельзя задать с помощью какого бы то ни было скалярного произведения. Легко видеть, что и пространство непрерывных функций С[а,Ь] на лю- бом отрезке [а, &] не есть евклидово пространство. 9. Комплексные евклидовы пространства. Наряду с действи- тельным может быть введено и комплексное евклидово про- странство (т. е. комплексное линейное пространство со скаляр- ным произведением в нем). Однако аксиомы 1)—4), сформули- рованные в начале этого параграфа, не могут быть в комплекс- ном пространстве выполнены одновременно. Действительно, из 1) и 3) следует (Лх, Лх) = V (х, х), откуда при к — i имеем (/х, /х) — — (х, х), т. е. скалярные квадраты векторов х и /х не могут быть одно- временно положительны. Иными словами, аксиомы 1) и 3) несовместимы с аксиомой 4). Поэтому аксиомы, с помощью ко- торых определяется скалярное произведение, в комплексном случае должны быть несколько изменены по сравнению с дей- ствительным. В комплексном пространстве скалярное произве-
« 4J ЕВКЛИДОВЫ ПРОСТРАНСТВА 165 дение мы определим как числовую (комплекснозначную) функ- цию двух векторов, удовлетворяющую следующим условиям: 1) (х,у) = (у7х), 2) (Ах, z/) = А(х, у), 3) (xi + у) = (х1( у) + (х2, у}, 4) (х, х) 0, причем (х, х) > 0, если х=£0. (Таким образом, мы внесли поправку в первую аксиому, сохранив три остальные без изменений.) Из условий 1) и 2) следует, что (х, Ау) = = А (х, у). Действительно, (х, >.у) = (Ху, х) = К (у, х) = А (х, у). Хорошо известный пример комплексного евклидова простран- ства п измерений — это линейное пространство Сп (§1, при- мер 2), в котором скалярное произведение элементов X = (хь х2, ..., х„) и у = (yi, уъ . . ., 1/„) определяется формулой п (X, у)= ^xkyk. fe=l Как известно, всякое комплексное евклидово пространство раз- мерности п изоморфно этому пространству. Примерами бесконечномерных комплексных евклидовых про- странств могут служить: 1) комплексное пространство /2, в котором элементы — это последовательности комплексных чисел х = (х,, х2...х„, ...), удовлетворяющие условию £|х„|2<оо, п=1 а скалярное произведение определяется формулой оо (я, у)== хпуп', п=1 2) пространство С2[а, &] комплекснозначных непрерывных •функций на отрезке [а, &] со скалярным произведением ь (f, а В комплексном евклидовом пространстве длина (норма) век- тора определяется, как и в действительном случае, формулой
166 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА (ГЛ. пт Понятие угла между векторами в комплексном случае обычно не вводят (поскольку величина ’ д х ।. д у ц' • вообще говоря, ком- плексна и может не быть косинусом какого-либо действитель- ного угла); однако понятие ортогональности сохраняется: эле- менты х и у называются взаимно ортогональными, если (х, у} = = 0. Если {фп}—какая-либо ортогональная система в комплекс- ном евклидовом пространстве /?, и f — произвольный элемент из /?, то, как и в действительном случае, числа Яп== фп) называются коэффициентами Фурье, а ряд £ ^пфл п — рядом Фурье элемента f по ортогональной системе {фп}- Имеет место неравенство Бесселя: ElWl ап |2<(f, f). п В частности, если система {фп} ортогональна и нормирована, то коэффициенты Фурье по такой системе определяются форму- лами cn = (f, Ф„), а неравенство Бесселя имеет вид Zlc„|2<(f, f). п Полное комплексное евклидово пространство бесконечной раз- мерности называется комплексным гильбертовым пространством. На комплексный случай переносится теорема об изоморфизме- гильбертовых пространств: Теорема 9. Все сепарабельные комплексные гильбертовы. простр,анства изоморфны между собой. Простейшей реализацией комплексного гильбертова про- странства является комплексное пространство /г- С другой, функ- циональной, реализацией комплексного гильбертова простран- ства мы познакомимся в гл. VII. Предоставляем читателю проверить, что все теоремы, до- казанные выше для действительных евклидовых, в частности гильбертовых, пространств, справедливы (с незначительными- изменениями, учитывающими комплексность скалярного произ- ведения) и для комплексных пространств.
5 5] ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА 167 § 5. Топологические линейные пространства 1. Определение и примеры. Задание нормы — лишь один из возможных способов введения топологии в линейном простран- стве. Развитие таких областей функционального анализа, как теория обобщенных функций (о них будет сказано в следующей главе), показало, что во многих случаях полезно рассматривать линейные пространства с топологией, задаваемой не с помощью нормы, а каким-либо иным способом. Определение 1. Множество Е называется топологическим, линейным пространством, если I. Е представляет собой линейное пространство (с умноже- нием элементов на действительные или комплексные числа). II. Е является топологическим пространством. III . Операции сложения и умножения на числа в Е непре- рывны относительно заданной в Е топологии. Подробнее послед- нее условие означает следующее: 1) если го = Хо + г/о, то для каждой окрестности U точки z0 можно указать такие окрестности V и W точек Хо и у0 соот- ветственно, что х + у е Е при х е V, у е W; 2) если ао*о = Уо, то для любой окрестности U точки у0 су- ществуют такая окрестность V точки хо и такое число 8 > О, что ах е U при | а — а01 < е и х е V. Из связи, существующей в линейном топологическом про- странстве между алгебраическими операциями и топологией, вытекает, что топология в таком пространстве полностью опре- деляется заданием системы окрестностей нуля. Действительно, пусть х — точка линейного топологического пространства Е, и U — некоторая окрестность нуля в Е. Тогда U -j- х — «сдвиг» этой окрестности на х — есть окрестность точки х; очевидно, что любая окрестность любой точки хеЕ может быть получена та- ким способом. Из непрерывности операций сложения и умножения на числа в топологическом линейном пространстве Е непосредственно вы- текают следующие утверждения. 1. Если U, V — открытые множества в Е, то и множество И + V (т. е. совокупность всех элементов вида х + у, х е U, у е <= V) открыто. 2. Если U открыто, то и множество KU (т. е. совокупность всех элементов вида Хх, х е U) при любом Z =У= О открыто. 3. Если F замкнутое множество в Е, то и XF замкнуто при любом Л. Примеры. 1. К топологическим линейным пространствам относятся прежде всего все нормированные пространства. Действительно, из свойств нормы сразу следует, что операции сложения векторов и умножения их на числа в нормированном
168 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. ИГ пространстве непрерывны в той топологии, которая опреде- ляется нормой. 2. Зададим определяющую систему окрестностей нуля в про- странстве R°° всевозможных числовых последовательностей х = = (хь х2, хп, ...) так. Каждая окрестность U(ki, ..., kr', е) определяется целыми числами kit ..., kr и числом е> 0 и со- стоит из всех тех х е R°°, которые удовлетворяют условиям: | < е, 1=1, 2, .... г. Легко проверить, что задание этой системы окрестностей пре- вращает R°° в линейное топологическое пространство. (Наряду с R°° можно рассматривать пространство С°° всех комплекс- ных последовательностей.) 3. Пусть К[а, fe]— пространство бесконечно дифференцируе- мых ') функций на отрезке [а, 6]. Топологию в К [а, fe] определим с помощью следующей системы окрестностей нуля. Каждая та- кая окрестность Um, е определяется номером т и числом е, > О и состоит из всех функций <р, удовлетворяющих неравенствам | <p(fc) (х) | < е, k = 0, 1, 2, ..., т, где — производная k-ro порядка от функции ср. Тот факт, что в топологическом линейном пространстве топо- логия связана с линейными операциями, определенными в нем, накладывает на его топологию довольно жесткие ограничения. Именно, в топологическом линейном пространстве Е точка х и не содержащее ее замкнутое множество имеют непересекаю- щиеся окрестности. При доказательстве этого утверждения достаточно рассмот- реть точку х = 0 и любое не содержащее ее замкнутое множе- ство F. Положим U — E\F. В силу непрерывности операции вычитания в Е найдется такая окрестность нуля W, что W — W ед U. В качестве W можно взять пересечение окрестно- стей нуля и W2 таких, что х — у е U, если х gz Wj и у е W2. Проверим, что замыкание окрестности W содержится в U. Пусть у е [W7]. Тогда каждая окрестность точки у, в частности, у + W, содержит какую-либо точку z из W. Следовательно, z — у ^W, т. е. у е W — W ст U, что и утверждалось. При этом W и £\ [И?]-—искомые окрестности точки 0 и множества F со- ответственно. Топологическое пространство называется /^-пространством, если оно удовлетворяет аксиоме отделимости Т], т. е. если лю- бое его одноточечное подмножество замкнуто; очевидно, что ли- нейное топологическое пространство есть /^-пространство тогда ') Т, е. имеющих производные всех порядков.
3 5] ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА 169 и только тогда, когда пересечение всех окрестностей нуля не содержит ненулевых элементов. Топологические пространства, удовлетворяющие аксиомам отделимости 1\ и Т3, мы назвали в гл. II регулярными-, из доказанного в предыдущем абзаце сле- дует, что топологическое линейное Т{-пространство регулярно. В нормированных пространствах важную роль играет поня- тие ограниченного множества. Хотя там это понятие вводится при помощи нормы, оно может быть естественно сформулиро- вано и для любых линейных топологических пространств. Множество М, лежащее в топологическом линейном про- странстве Е, назовем ограниченным, если для каждой окрестно- сти нуля U существует такое п > 0, что W zo М при всех |Х|^ п. Ясно, что для нормированных пространств это понятие огра- ниченности совпадает с ограниченностью по норме (т. е. с воз- можностью поместить данное множество внутрь некоторого шара ||х|| R). Пространство Е называется локально ограничен- ным, если в нем существует хотя бы одно непустое открытое ограниченное множество. Всякое нормированное пространство локально ограничено. Примером пространства, не являющегося локально ограниченным, может служить пространство R00, ука- занное в примере 2 (докажите это!). Упражнения. 1. Пусть Е— топологическое линейное пространство; докажите справедливость следующих утверждений: (а) множество М с. Е ограничено тогда и только тогда, когда для любой последовательности {xn) с. М и любой последовательности положительных чисел {е„}, стремящейся к нулю, последовательность 8пХп стремится к нулю; (б) если и хп—► х, то {хп}—ограниченное множество; (в) если Е локально ограничено, то в нем выполняется первая аксиома счетности. Выполнена ли первая аксиома счетности в пространстве R”? 2. Мы скажем, что множество М в топологическом линейном простран- стве Е поглощается окрестностью нуля U, если существует такое X S> 0, что 1.U до М. Доказать, что в локально ограниченном пространстве существует фундаментальная система окрестностей нуля, взаимно поглощающих друг друга. Что можно принять за такую систему в нормированном пространстве? 2. Локальная выпуклость. Произвольные топологические линейные пространства могут обладать свойствами, слишком уж далекими от привычных свойств евклидовых или нормиро- ванных пространств. Важный класс пространств, более общих, чем нормированные, но сохраняющих многие свойства послед- них, образуют так называемые локально выпуклые простран- ства. Определение 2. Топологическое линейное пространство называется локально выпуклым, если в нем всякое непустое открытое множество содержит непустое выпуклое открытое под- множество.
170 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА 1ГЛ. нг Заметим, что если пространство Е локально выпукло, то- для любой точки ге£ и любой ее окрестности U найдется та- кая выпуклая ее окрестность V, что хе Vc Действительно, достаточно проверить справедливость этого утверждения для точки х = 0. Пусть U — какая-нибудь окрестность нуля. Най- дется такая окрестность нуля V, что V— V cz U. Так как Е ло- кально выпукло, то найдется непустое выпуклое открытое мно- жество V'cz V; пусть у е V', тогда V'— у — выпуклая окрест- ность нуля, содержащаяся в U. Всякое нормированное пространство локально выпукло. Дей- ствительно, в нем любое непустое открытое множество содержит некоторый шар. Таким образом, всякое нормированное простран- ство локально ограничено и локально выпукло. Можно пока- зать, что, по существу, нормированными пространствами и ис- черпывается класс пространств, обладающих обоими этими свойствами. Именно, назовем линейное топологическое про- странство Е нормируемым, если та топология, которая имеется в Е, может быть задана с помощью некоторой нормы. Имеет ме- сто следующая теорема: всякое отделимое локально выпуклое и локально ограниченное линейное топологическое пространство нормируемо. Упражнения 1. Докажите, что открытое множество U в топологиче- ском линейном пространстве выпукло тогда и только тогда, когда U + U = = 2U. 2. Пусть Е — линейное пространство; множество U с. Е называется сим- метричным, если из х е U следует — х U. Пусть & — семейство всех вы- пуклых симметричных подмножеств пространства Е, совпадающих со своим- ядром (см. § 2). Доказать справедливость следующих утверждений. (а) Семейство & является определяющим семейством окрестностей нуля для некоторой локально выпуклой отделимой топологии в пространстве Е' (эта топология называется ядерно-выпуклой). (б) Ядерно-выпуклая топология является сильнейшей из локально вы- пуклых топологий, в которых линейные операции в Е непрерывны. (в) Всякий линейный функционал на Е непрерывен относительно ядер- но-выпуклой топологии. 3. Счетно-нормированные пространства. Очень важным для анализа классом линейных топологических пространств оказа- лись так называемые счетно-нормированные пространства. Для того чтобы сформулировать соответствующее определение, нам понадобится одно вспомогательное понятие. Пусть в линейном пространстве Е заданы две нормы || • ||i и || • Цг- Они называются согласованными, если всякая последова- тельность {хп} из Е, фундаментальная по каждой из этих норм и сходящаяся к некоторому пределу хе £ по одной из них,, сходится к тому же пределу х и по второй норме. Говорят, что норма Ц-lh не слабее, чем || • ||2, если существует такая по- стоянная с > 0, что llxill Зг с Цх||2 для всех х Е.
ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА 171 § 5] Если первая норма не слабее второй, а вторая — не слабее первой, то эти две нормы называются эквивалентными. Две нормы называются сравнимыми, -если одна из них не слабее другой. Определение 3. Счетно-нормированным пространством называется линейное пространство Е, в котором задана счетная система попарно согласованных норм ||-||п- Всякое счетно-нор- мированное пространство становится линейным топологическим, если за определяющую систему окрестностей нуля принять сово- купность множеств Ur, е, каждое из которых определяется номе- ром г и положительным числом е и состоит из всех тех элемен- тов х е Е, которые удовлетворяют условиям IIX lit < е..|| X ||г < е. Мы предоставляем читателю проверить, что такая система •окрестностей нуля действительно определяет в Е топологию, в которой операции сложения элементов и умножения их на числа непрерывны. Заметим, что всякое счетно-нормированное пространство удовлетворяет первой аксиоме счетности, поскольку систему окрестностей нуля Ur, е можно заменить (не изменяя топологии) счетной подсистемой, в которой е принимает лишь значения 1, 1/2, 1/3, ..., 1/п, ... Более того, топология в счетно-нормиро- ванном пространстве может быть задана при помощи некоторой .метрики, например, такой: оо р(х, у) = У 2~п -1-1*~у||д|| , х, у<=Е. (1) г \ 2_1 1 +1| х — у ||п ’ ’ у ' л=1 Предлагаем читателю проверить, что функция р(х, у) удовле- творяет всем аксиомам расстояния и инвариантна относительно сдвигов (т. е. p(x-|-z, У + z) — р(х, у), х, у, z^E) и что по- рождаемая ею топология совпадает с исходной. Таким образом, мы получаем возможность говорить о полноте счетно-нормиро- ванного пространства, понимая под этим полноту относительно введенной выше метрики. Заметим еще, что последовательность {-*/<} фундаментальна относительно метрики (1) тогда и только тогда, когда она фундаментальна относительно каждой из норм II • ||п, и сходится (в этой метрике) к элементу х^Е тогда и только тогда, когда она сходится к х по каждой из норм || • ||п. Иными словами, полнота счетно-нормированного пространства означает, что в нем всякая последовательность, фундаменталь- ная по каждой из норм || • ||п, сходится. Примеры. 1. Важным примером счетно-нормированного пространства служит рассмотренное выше пространство К[а, Ь] "бесконечно дифференцируемых функций на отрезке, если счи-
172 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА (ГЛ. пг тать, что норма ||-||т в этом пространстве определяется фор- мулой sup ifwm а< t < b 0< Очевидно, что все эти нормы согласованы между собой и что они определяют в Л [a, fe] ту самую топологию, которая была описана выше. 2. Пусть Soo — пространство всех бесконечно дифференцируе- мых функций на прямой, стремящихся на бесконечности к нулю вместе со всеми своими производными быстрее,'чем 1/|/| в лю- бой степени (т. е. удовлетворяющих условию при |£|->оо при любых фиксированных k и q). В этом пространстве определим счетную систему норм, положив llfllm = sup m = 0, 1, 2, ... k, q^m — oo < t < 00 Нетрудно проверить, что эти нормы согласованы между собой. Таким образом, Soo — счетно-нормированное пространство. 3. Важный частный случай счетно-нормированных про- странств— так называемые счетно-гильбертовы пространства. Пусть Н — линейное пространство, в котором задана счетная система скалярных произведений (<р, ф)п, причем предположим, что нормы ||ф||п = дЛ<Р> ф)п> отвечающие этим скалярным про- изведениям, согласованы между собой. Если такое пространство полно, то оно называется счетно-гильбертовым пространством. 4. Конкретным примером счетно-гильбертова пространства может служить следующее пространство. Пусть Ф — совокуп- ность всех таких числовых последовательностей {хп}, для кото- рых при каждом целом k 0 ряд 00 п=1 сходится. Зададим в этом пространстве счетную систему норм, положив _______ II* life = Д/ Д пкхп‘ Нетрудно проверить, что эти нормы согласованы между собой и что Ф полно в указанном выше смысле. Ясно, что каждую из норм ||-На можно задать с помощью скалярного произведения • 00 (х, y)k = S Пкхпуп, Л=1
§ 5] ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА 173 т. е. Ф есть счетно-гильбертово пространство. Оно называется пространством быстро убывающих последовательностей. Если Е— счетно-нормированное пространство, то заданные в нем. нормы || • На можно считать удовлетворяющими условию II х lit < II х ||, при k<l, (2) так как иначе мы могли бы нормы ||х]|а заменить нормами IIXlife = sup(IIX||j, IIX||2, .... IIXlife), определяющими в Е ту же самую топологию, что и исходная си- стема норм. Пополнив пространство Е по каждой из норм || • ||а, мы получим систему полных нормированных пространств Ek- При этом из соотношения (2) и согласованности норм следует, что имеются естественные вложения Ek Et при k < I. Таким образом, каждому счетно-нормированному пространству Е можно сопоставить убывающую цепочку полных нормирован- ных пространств ОО Е} =) Е2 =) ... => Ek => ...; 0 Efe => £• fe=i Можно показать, что пространство Е полно тогда и только то- ОО гда, когда Е= П Ек (докажите это!). Так, например, про- странство К[а, &] бесконечно дифференцируемых функций на от- резке [а, &] есть пересечение полных нормированных пространств Сп[а, &] (п = 0, 1,2, ...), где Сп[а, &] состоит из функций, имею- щих непрерывные производные до n-го порядка включительно, а норма в нем определяется формулой ||/||„= sup |/W(0|. 0<fe<n В 30-х годах, когда в основном в работах Банаха была построена тео- рия линейных нормированных пространств, сложилось впечатление, что этот класс пространств достаточно широк для того, чтобы обслуживать все кон- кретные нужды анализа. Впоследствии, однако, выяснилось, что это не так. Оказалось, что в ряде вопросов важны такие пространства, как пространство бесконечно дифференцируемых функций, пространство всех числовых последо- вательностей R°° и другие пространства, в которых естественная для них то- пология не может быть задана с помощью какой бы то ни было нормы. Та- ким образом, линейные пространства — топологические, но не нормируемые — это вовсе не обязательно «экзотика» или «патология». Наоборот, некоторые из этих пространств представляют собой не менее естественные и важные об- общения конечномерного евклидова пространства, чем, скажем, гильбертово пространство.
ГЛАВА IV ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ § 1. Непрерывные линейные функционалы 1. Непрерывные линейные функционалы в топологических линейных пространствах. В § 1 гл. III мы уже рассматривали функционалы, определенные на линейном пространстве. Если речь идет о функционалах, заданных на топологическом линейном пространстве, то основной интерес представляют не- прерывные функционалы; как обычно, функционал f, опреде- ленный на пространстве Е, называется непрерывным, если для всякого х0 е £ и всякого 8> 0 существует такая окрестность U элемента х0, что I f (х) — f (х0) | < е при хеU. (1) Это определение относится, в частности, и к линейным функцио- налам. Если £ — конечномерное топологическое линейное про- странство, то всякий линейный функционал на £ автоматически непрерывен. В общем случае из линейности функционала его непрерывность не вытекает. Следующее утверждение существенно для дальнейшего, хотя и почти очевидно. Если линейный функционал f непрерывен в какой-либо одной точке хе £, то он непрерывен и всюду на Е. Действительно, пусть у — произвольная точка в £ и пусть е > 0. Выберем окрестность U точки х так, чтобы выполнялось условие (1). Тогда сдвиг этой окрестности V=U + (y — x) будет искомой окрестностью точки у, так как если z е V, то zх — у U и, следовательно, I f (г) — f (у) I = 1 f (z — у + х) — f (х) | < в. Таким образом, проверять непрерывность линейного функ- ционала достаточно в одной точке, например в точке 0. Если £ — пространство с первой аксиомой счетности, то не- прерывность линейного функционала на £ можно сформулиро-
§ 1] НЕПРЕРЫВНЫЕ ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ 175 вать в терминах последовательностей: функционал f называется непрерывным в точке хе Е, если изхп—>х следует f(xn)—>-f(x). Проверка равносильности этого определения непрерывности при- веденному выше (при наличии первой аксиомы счетности) пре- доставляется читателю. Теорема 1. Для того чтобы линейный функционал f был непрерывен на Е, необходимо и достаточно, чтобы существовала такая окрестность нуля в Е, на которой функционал f ограничен. Доказательство. Если функционал f непрерывен в точке О, то для каждого е > 0 существует окрестность нуля, на кото- рой | f (х) | < е. Обратно, пусть U — такая окрестность нуля, что | f (х) | < С при х е U, и пусть е > 0. Тогда U есть та окрестность нуля, на которой |f(x) |< е. Тем самым доказана непрерывность f в точке 0, а значит, и всюду. Упражнение. Пусть Е — топологическое линейное пространство; до- кажите справедливость следующих утверждений. (а) Линейный функционал f на Е непрерывен тогда и только тогда, когда существует такое открытое множество U с: Е и такое число t, что где f (U) — множество значений f на U. (б) Линейный функционал f на Е непрерывен тогда и только тогда, когда его ядро {х: f (х) = 0} замкнуто в Е. (в) Если всякий линейный функционал иа Е непрерывен, то топология в Е совпадает с ядерно-выпуклой топологией (см. упражнение 2 на стр. 170). (г) Если Е бесконечномерно и нормируемо, то на нем существует не не- прерывный линейный функционал (воспользуйтесь существованием в Е базиса Гамеля; см. упражнение на стр. 123). (д) Пусть в Е существует определяющая система окрестностей нуля, мощность которой не превосходит алгебраической размерности пространства Е (т. е. мощности базиса Гамеля в Е; см. упражнение на стр. 123). Тогда на Е существует не непрерывный линейный функционал. (е) Для того чтобы линейный функционал f был непрерывен на Е, не- обходимо, а в случае, когда Е удовлетворяет первой аксиоме счетности, и достаточно, чтобы он был ограничен на каждом ограниченном множестве. 2. Линейные функционалы на нормированных пространствах. Пусть рассматриваемое пространство Е нормировано. По тео- реме 1 всякий непрерывный линейный функционал f ограничен в некоторой окрестности нуля. Но в нормированном простран- стве всякая окрестность нуля содержит шар и, значит, f ограни- чен на некотором шаре. В силу линейности функционала это равносильно его ограниченности на любом шаре, в частности, на единичном ||х|| 1- Обратно, из ограниченности функционала f на единичном шаре следует, в силу той же теоремы 1, его непре- рывность (ибо внутренность этого шара представляет собой окрестность нуля).
176 линейные функционалы и линейные операторы [ГЛ. IV Итак, в нормированном пространстве линейный функционал непрерывен в том и только том случае, когда его значения на единичном шаре ограничены в совокупности. Пусть f — непрерывный линейный функционал в нормирован- ном пространстве Е. Число II f II = sup | f (х) |, (2) ||х||<Х т. е. точную верхнюю грань значений |/(х)| на единичном шаре пространства Е, мы назовем нормой функционала f. Отметим следующие почти очевидные свойства ||/||: 1) ||/|| = SUpl^l; х=^=0 11*11 это сразу следует из того, что для всякого х =/= О lf(x)l |f Г х \| IWI I' к IWI Л • 2) Для любого хе Е 1Нх)К11Л1-11х||. (3) Действительно, если х =/= 0, то элемент принадлежит еди- ничному шару, следовательно, по определению нормы функцио- нала, I'kllrlJI ||х|| 11'И’ откуда следует (3). Если же х — 0, то в (3) справа и слева стоят нули. Упражнение. Пусть С Дг 0 — такое число, что И(х)|<С|И| (4) при любом х. Доказать, что Hfll = inf С, где inf берется по всем С, удовле- творяющим неравенству (4). Рассмотрим примеры линейных функционалов в нормирован- ных пространствах. 1. Пусть R” есть n-мерное евклидово пространство и а — ка- кой-либо фиксированный вектор в нем. Скалярное произведение f (х) = (х, а), где х пробегает все Rn, представляет собой, очевидно, линейный функционал на R”. В силу неравенства Коши — Буняковского I Г(х) 1 = 1 (х, а) |<||х||• Ца||; (5)
§ И НЕПРЕРЫВНЫЕ ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ 177 следовательно, этот функционал ограничен, а значит, и непреры- вен на Rn. Из неравенства (5) получаем, что <11 а ||. Так как правая часть этого неравенства не зависит от. х, то sup |f(x)l Ik II <11 а II, т. е. ||f||<||a||. Но положив х — а, получим | f(a) | = (а, а) =|| а ||2, т. е. ЯШ = ||а||. II “'ll Поэтому ||f|| = ||а||. 2. Интеграл ь / (х) = х (t)dt, где x(t)—непрерывная функция на [а, &], представляет собой линейный функционал в пространстве С [а, Ь]. Этот функционал ограничен, а его норма равна b — а. Действительно, ь |/(х)|= \x(t)dt а max | х (t) | (b — a) —1| x || (b — a), причем при x = const достигается равенство. 3. Рассмотрим более общий пример. Пусть yo(t)—фиксиро- ванная непрерывная функция на [а, &]. Положим для любой функции x(t)e С [а, &] ь F(x)=^ х (t) уо (t) dt. а Этот функционал линеен. Он ограничен, так как ь ь |F(x)| = \x{t)yo{t)dt <||x||J| y0{t)\dt. (6) В силу линейности и ограниченности он непрерывен. Из (6) сле- дует оценка его нормы: ь И1К JI y0(t)\dt. а (Докажите, что на самом деле здесь имеет место точное равен- ство!)
178 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV 4. Рассмотрим в пространстве С[а,Ь] линейный функционал б[,(х) = х(/0), уже упоминавшийся в п. 5 § 1 гл. III. Его значение на функции x(t) определяется как значение x(t) в данной точке t0. Ясно, что I Х(/о) |<Ь II, причем для х = const имеет место равенство. Отсюда сразу сле- дует, что норма функционала равна 1. 5. В любом евклидовом пространстве X можно определить линейный функционал так же, как и в R”, выбрав некоторый фиксированный элемент ае! и положив для любого хеХ F (х) = (х, а). Как в случае Rn, легко проверить, что при этом IIЕ 11 = 11 а ||. В дальнейшем мы будем рассматривать только непрерывные линейные функционалы, а слово «непрерывный» будем для крат- кости опускать. Понятию нормы линейного функционала можно дать следую- щую наглядную интерпретацию. Мы уже видели (гл. .Ill, § 1), что всякому ненулевому линейному функционалу можно сопо- ставить гиперплоскость L, определяемую уравнением f(x) = i. Найдем расстояние d от этой гиперплоскости до точки 0. По оп- ределению, d — inf ||х||. В силу оценки f(x)=l I fW КН f II • Их || на гиперплоскости f (х) = 1 будем иметь || х || 1/|| f || и, значит, d 1/11 f II- С другой стороны, в силу определения нормы f для любого 8 > 0 найдется такой элемент хе, подчиненный условию поэтому Поскольку 8 > 0 произвольно, получаем d = l/||f ||, т. е. норма линейного функционала f обратна расстоянию гипер- плоскости f(x) = 1 от точки 0.
$ 1] НЕПРЕРЫВНЫЕ ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ 179 3. Теорема Хана—Банаха в нормированном пространстве. В § 2 гл. III мы доказали общую теорему Хана — Банаха, со- гласно которой всякий линейный функционал /о, определенный на некотором подпространстве L линейного пространства Е и удовлетворяющий условию IfoWKp(x) (7) (р — фиксированный однородно-выпуклый функционал на Е), может быть продолжен на все Е с сохранением этого условия. Применительно к нормированным пространствам эту теорему можно сформулировать следующим образом: Пусть Е — действительное нормированное пространство, L — его подпространство и fa — ограниченный линейный функционал на L. Этот линейный функционал может быть продолжен до не- которого линейного функционала f на всем пространстве Е без увеличения нормы, т. е. так, что II Го Ина L = II f IL Е- Действительно, пусть II Го Ина L = k. Ясно, что k||х|| — однородно-выпуклый функционал. Взяв его в качестве р и применяя общую теорему Хана — Банаха, получим требуемый результат. Эта форма теоремы Хана — Банаха допускает следующую геометрическую интерпретацию. Уравнение foW = l (8) определяет в подпространстве L гиперплоскость, лежащую на расстоянии l/||foll от нуля. Продолжая функционал fo без увели- чения нормы до функционала на всем Е, мы проводим через эту частичную гиперплоскость «большую» гиперплоскость во всем Е, причем «не позволяем» ей приблизиться к нулю. Комплексный вариант теоремы Хана — Банаха (теорема 4а § 2 гл. III), дает нам комплексный аналог предыдущей теоремы: Пусть Е — комплексное нормированное пространство, f0 — ли- нейный ограниченный функционал, определенный на подпро- странстве LczE. Тогда существует линейный ограниченный функционал f, определенный на всем Е и удовлетворяющий ус- ловиям f(x) = f0(x), x^L, II f Ина Е ~ II /о Ина L- Укажем некоторые важные факты, вытекающие из теоремы Хана — Банаха для нормированных пространств. Предварительно
180 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ и линейные операторы [ГЛ. IV сделаем следующее замечание. Выпуклое множество в линей- ном пространстве мы назвали выпуклым телом, если оно имеет непустое ядро. Можно показать, что в нормированном простран- стве ядро множества совпадает, очевидно, с совокупностью его внутренних точек. Таким образом, в нормированном простран- стве выпуклое тело — это выпуклое множество, имеющее хотя бы одну внутреннюю точку. Отсюда и из теоремы 5 § 2 гл. III вытекает следующий факт. Следствие 1 (первая теорема отделимости). Пусть А и В — выпуклые множества в нормированном пространстве X, при- чем хотя бы одно из них, скажем Л, является выпуклым телом и его ядро не пересекается с В. Тогда существует ненулевой не- прерывный линейный функционал, разделяющий А и В. Существование ненулевого функционала, разделяющего А и В, обеспечивается самой теоремой 5 § 2 гл. III. Покажем, что соответствующий функционал обязательно непрерывен. Действи- тельно, если sup f(x)< inf f(x), (9) xe= A X<=B то функционал f ограничен на А сверху. Пусть хо — внутренняя точка множества А и U(x0)—ее шаровая окрестность, целиком лежащая в А. В силу (9) функционал f ограничен на U(xQ) сверху. Но тогда он ограничен на U(хо) и снизу (проведите до- казательство!). Так как линейный функционал, ограниченный на каком-либо шаре, непрерывен, то наше утверждение доказано. Следствие 2 (вторая теорема отделимости). Пусть А — замкнутое множество в нормированном пространстве X их0^Х— точка, не принадлежащая А. Тогда существует непрерывный ли- нейный функционал, строго разделяющий хо и А. Действительно, достаточно взять некоторую выпуклую окрест- ность U точки Хо, не пересекающуюся с Л, и рассмотреть функ- ционал, разделяющий U и А. (Проведите доказательство того, что ненулевой функционал, разделяющий U и А, непременно строго разделяет Хо и Л.) Следствие 3 (лемма об аннуляторе). Для всякого (замк- нутого) собственного подпространства L банахова пространства X существует ненулевой непрерывный линейный функционал f, равный нулю на L. Действительно, пусть x0^L и f — непрерывный линейный функционал, строго разделяющий х0 и L: f(x0)> supf(x). Тогда f(x) = O на L, так как иначе верхняя грань справа была бы равна + оо.
$ 1] НЕПРЕРЫВНЫЕ ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ 18f Совокупность функционалов, равных нулю на данном под- пространстве, называется аннулятором этого подпространства и обозначается '). Следствие 4. Если хп— ненулевой элемент в нормирован- ном пространстве X, то существует такой непрерывный линейный функционал f на X, что 11/11=1 и /(х0)=||х0||. (10} Действительно, определив сперва функционал f на одномер- ном подпространстве, состоящем из элементов вида ах0, форму- лой /(а%о) = а||хо||, а затем продолжив его без увеличения нор- мы на все X, мы и получим функционал, удовлетворяющий усло- виям (10). Замечание. Для произвольных локально-выпуклых про- странств следствия 1—3 остаются в силе без изменений, а след- ствие 4 может быть заменено утверждением: для всякого х0 =# 0 существует такой непрерывный линейный функционал /, что f (Х0) =0= 0. 4. Линейные функционалы в счетно-нормированном прост- ранстве. Пусть Е — счетно-нормированное пространство с нор- мами II IIa (k = 1, 2, . ..); не ограничивая общности, можно счи- тать (см. стр. 173), что для всякого х е Е IWhdlxlbC ... <||Х||„< ... (11) Пусть f — непрерывный линейный функционал на С; тогда в Е существует окрестность нуля U, на который / ограничен. В силу определения топологии в счетно-нормированном пространстве найдутся такое натуральное k и такое е > 0, что шар Вь, е — — {х : ||х||а < е} целиком лежит в (7; тогда функционал f ограни- чен на этом шаре и потому ограничен и непрерывен относитель- но нормы || • IIа, т. е. существует такое С >0, что | / (х) |<С|| х ||й, х<=Е. С другой стороны, очевидно, что если линейный функционал ограничен по какой-либо из норм || • ||п, то он непрерывен на Е. Таким образом, если Е*п— запас всех линейных функционалов на Е, непрерывных относительно нормы || • ||n, а Е* — запас всех линейных непрерывных функционалов на Е, то оо r = U Е*п. (12) П = 1 ') В § 4 гл. III мы обозначили так ортогональное дополнение подпро- странства в евклидовом пространстве. Как будет видно в следующем пара- графе, в евклидовом пространстве понятия ортогонального дополнения и ан- нулятора равносильны, поэтому совпадение обозначений оправдано,
182 ЛИНЕЙНЫЕ функционалы и линейные операторы [ГЛ. IV Кроме того, из условия (11) следует, что £’<=:£’ с ... с Е*п с ... Если f — непрерывный линейный функционал на Е, т. е. f^E*, то его порядком называется наименьшее из чисел п, для которых / е Е*п\ в силу равенства (12) каждый непрерывный линейный функционал на Е имеет конечный порядок. § 2. Сопряженное пространство 1. Определение сопряженного пространства. Для линейных функционалов можно определить операции сложения и умноже- ния их на числа. Пусть ft и А— Два линейных функционала на некотором линейном пространстве Е. Их суммой fi + f2 назы- вается линейный функционал / (х) = Л(х) + /2(х), хе£. Произведением aft линейного функционала fi на число а на- зывается функционал f (х) — af[ (х), хе£. Равенства, определяющие А + А и afi, можно записать и так: (fi +f2)W = fl(x) + f2W. (afi)(x) = afi (х). Ясно, что сумма fi + f2 и произведение afi представляют со- бой линейные функционалы. Кроме того, если пространство Е топологическое, то из непрерывности функционалов ft и f2 сле- дует, что ft 4- f2 и afi тоже непрерывны на Е. Легко проверить, что так определенные операции сложения функционалов и умножения их на числа удовлетворяют всем аксиомам линейного пространства. Иначе говоря, совокупность всех непрерывных линейных функционалов, определенных на не- котором топологическом линейном пространстве Е, образует ли- нейное пространство. Оно называется пространством, сопряжен- ным с Е, и обозначается Е*. Упражнение. Совокупность всех линейных функционалов на Е, не обязательно непрерывных, называется алгебраически сопряженным простран- ством и обозначается Е*. Привести пример топологического векторного про- странства Е, такого, что Е* =/= Е*. В сопряженном пространстве Е* можно различными способа- ми ввести топологию. Важнейшие из них — это сильная и сла- бая топологии. 2. Сильная топология в сопряженном пространстве. Начнем с того простейшего случая, когда исходное пространство Е нор- мировано. Для непрерывных линейных функционалов, заданных
5 21 СОПРЯЖЕННОЕ ПРОСТРАНСТВО 183 на нормированном пространстве, мы ввели понятие нормы, по- ложив Эта величина удовлетворяет всем требованиям, содержащимся в определении нормированного пространства. Действительно, 1) 1711 > 0 для любого ненулевого линейного функционала f, 2) || af || = | a| • || f ||, 3) II f, + f2 II = sup + < x^O 4*11 < sup iMjpl + sup = II f, II + II f21|. x^=0 IWI x^=0 Таким образом, пространство E*, сопряженное к нормированно- му, можно наделить естественной структурой нормированного пространства. Топология в Е*, отвечающая введенной норме, на- зывается сильной топологией в Е*. Желая подчеркнуть, что Е* рассматривается как нормированное пространство, мы будем вместо Е* писать (Е*, II-11). Установим следующее важное свойство пространства, сопря- женного к нормированному. Теорема 1. Сопряженное пространство (Е*, || • ||) полно. Доказательство. Пусть {/п} — фундаментальная после- довательность линейных функционалов. Тогда для каждого е>0 найдется такое N, что ||fn — /mil < е для всех п, m N. Отсюда для любого х е Е получаем I fn W - fm(x) |<|| fn - fm|| • ||x|| < e||x||, t. e. при любом хеЕ числовая последовательность {fn(x)} схо- дится. Положим f(x)= lim f„(x). П-»оо Проверим, что f представляет собой непрерывный линейный функционал. Линейность проверяется непосредственно: f (ах 4- $у) = lim f„ (ах + fry) = П-> оо = Ит [af„ (х) 4- pf„ (z/)] = af (х) 4- (у), tl-> ОО Для доказательства непрерывности функционала f вернемся к неравенству |/п(х)—fm(x) | < е ||х|| и перейдем в нем к пре- делу при т->оо; получим |f(x) — f„(x)|<8||x||.
184 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV Отсюда вытекает, что функционал f — fn ограничен. Но тогда ограничен, и значит, непрерывен и функционал / = fn + (f— fn)- Кроме того, отсюда же следует, что ||/ — /п|| е для всех п N, т. е., что {/„} сходится к f. Подчеркнем еще раз, что эта теорема справедлива независи- мо от того, полно или нет исходное пространство. _3 а меч а ние. Если нормированное пространство Е не полно, а Ё — его пополнение, то пространства Е* и (Ё)* изоморфны. Действительно, если Е вложено в £ в качестве всюду плотно- го подмножества, то всякий линейный непрерывный на Е функ- ционал f продолжается по непрерывности с Е на все Ё. Обозна- чим это (единственное!) продолжение f. Ясно, что /е(£)*, ||/|| = = 11/11, и что всякий функционал из (Ё)* служит продолжением некоторого функционала из (Е)* (а именно, своего сужения на Е). Следовательно, отображение f -> f представляет собой изо- морфное отображение пространства Е* на все пространство (Ё)*. Определим теперь сильную топологию в пространстве, сопря- женном к произвольному линейному топологическому. В про- странстве, сопряженном к нормированному, мы определили окрестность нуля как совокупность функционалов, удовлетво- ряющих условию 11/11 < в. Иначе говоря, за окрестность нуля в пространстве Е*, сопряжен- ном к нормированному, принимается совокупность функциона- лов, для которых |/(х) | < е, когда х пробегает в Е единичный шар ||х|| 1. Беря всевозможные е, получим определяющую си- стему окрестностей нуля. В случае, когда Е — не нормированное, а топологическое линейное пространство, вместо единичного шара в Е естественно взять произвольное ограниченное множе- ство А. Окрестность нуля Us, а в Е* определяется как совокуп- ность линейных функционалов, удовлетворяющих условию | / (х) | < е при всех х е А. Варьируя е и А, получим определяющую систему окрестностей нуля в Е. Итак, сильная топология в Е* задается совокупностью окрест- ностей нуля, зависящих от положительного числа е и ограничен- ного множества A cz Е. Мы не будем здесь проверять, хотя это и несложно (см., например, [9]), что такая система окрестностей действительно превращает Е* в линейное топологическое про- странство. Ясно, что в случае нормированного пространства Е только что описанная сильная топология в Е* совпадает с той, которая определялась с помощью нормы. Заметим, что сильная топология в Е* обязательно удовлетво- ряет аксиоме отделимости Т{ и локально выпукла (независимо от . топологии в Е). Действительно, если /о е Е* и /о ¥= 0, то
S 2] СОПРЯЖЕННОЕ ПРОСТРАНСТВО 185 найдется такой элемент х0^Е, что fo(xo) У=0; положим е = = yl fo(xo) | И Л={х0), тогда f0&Ue,A, т. е. Е* — Л-простран- ство. Для доказательства локальной выпуклости сильной топо- логии в Е* достаточно заметить, что для любого е > 0 и любого ограниченного A cz Е окрестность Ub,a выпукла в Е. Сильную топологию в Е* обозначим символом 6; желая подчеркнуть, что Е* рассматривается в сильной топологии, мы будем писать (f*, Ь) вместо Е*. 3. Примеры сопряженных пространств. 1. Пусть Е — n-мерное линейное пространство (действитель- ное или комплексное). Выберем в нем какой-нибудь базис Ci, . . . ..., еп; тогда всякий вектор х е Е однозначно представим в виде п х = Если f — линейный функционал на Е, то ясно, что »=i п Ж=Е /«Ж (I) следовательно, линейный функционал однозначно определяется своими значениями на векторах базиса eh . .., еп, причем эти значения можно задать произвольно. Определим линейные функ- ционалы gi, .. ., gn, полагая 1, если i = /, О, если i =/= j. Очевидно, что эти функционалы линейно независимы. Ясно, что gj(x) = Xj, поэтому формулу (1) можно записать в виде п Ж = Е f gi (х). i = l Таким образом, функционалы g\, ..., gn составляют базис в пространстве Е*, т. е. Е* есть n-мерное линейное пространство; базис gi, ..., gn в Е* называют двойственным по отношению к базису Ci, . .. , еп в Е. Различные нормы в пространстве Е индуцируют различные нормы в Е*. Вот несколько примеров пар соответствующих друг другу норм в Е и Е* (читателю рекомендуется аккуратно про- вести соответствующие доказательства): \'/2 / п Х'/2 LIMJ . II/11 = (El MJ ; On \l/p / n \l/<7 LIM) . 11/11 = (ElMl ; |+-7=1. =1 / \i=l / P 4 1 < P < OOJ; gj (e<) = I
186 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV п (с) ||х|| = sup | Xi |, ||/|| = £|M; 1 C i < n i=l (d) ||x||= £|xj, ||f||= SUp \fi\. i=l 1 < i < n В этих формулах хь . . ., xn — это координаты вектора х е Е в базисе et, . . ., еп, a fi, fn — координаты функционала f е Е* в двойственном базисе gi, ..., gn. Упражнение. Доказать, что все перечисленные нормы определяют в л-мерном пространстве одну и ту же топологию. 2. Рассмотрим пространство Со сходящихся к нулю последо- вательностей X — (Х1, х2, ..., хп . •) с нормой II х || = sup | хп I и п покажем, что сопряженное к нему пространство (to, || • ||) изо- морфно пространству 1\ всех абсолютно суммируемых последова- оо тельностей f — (flt f2, ..., fn, • •) с нормой || f ||= У, | fn |. Лю- п= 1 бая последовательность f еZ, определяет в пространстве с0 ли- нейный ограниченный функционал f по формуле F(x)=£f„x„; (2) оо оо ясно, что | f (х)|<||х|| £ l/п I, так что || f ||< £ | |<||f ||. п—1 Рассмотрим в с0 векторы < ?! =(1, 0, 0..О, О, .. .), < ?2 =(о, 1,0...о, о, . ..), < ?п = (0, 0, 0..1,0,.. .), n и положим xw’ = V еп (если f„=0, то считаем, что ry-i= j I 'п I V I in I =о). Тогда ||xW|l<l и п=1 так что lim f (x(N)) = £ | fn | = || f Ц. Следовательно, II f II > £ I I; ^->оо п—1 сопоставляя это с доказанным выше противоположным нера- оо венством, заключаем, что ||f||=£ lfnl = llfll-
S 2] СОПРЯЖЕННОЕ ПРОСТРАНСТВО 187 Таким образом, мы построили линейное изометриче- ское отображение f пространства Ц в пространство cq; остается проверить, что образ пространства /, при этом ото- бражении совпадает со всем Q, т. е. что всякий функционал f е cj представим в виде (2), где f = {fn} s /,. Для всякого оо х = {хп}ес0 имеем х=У хпеп, причем ряд, стоящий справа, п=1 дг сходится в с0 к элементу х, ибо |х — У, хпеп [= sup | хп | —>0 при JV —> оо. Так как функционал f^Cg непрерывен, то J(x) — оо оо = У xnJ (е„); поэтому достаточно проверить, что У, | J (е„) | < оо. П=1 ЛГ F Полагая x<JV> = V еп и замечая, что x(W) ес0, ||х(ЛГ> ||^ 1, 1Неп)1 имеем N А X I Г(е„) I = X Г(е„) = f(xW) < Ilf II, Zj I Hen) I 71=1 H=1 откуда в силу произвольности N заключаем, что У, If(en)|<oo. 3. Нетрудно доказать, что пространство I], сопряженное к пространству /1, изоморфно пространству т, состоящему из всех ограниченных последовательностей х = {хп} с нормой ||х|| = = sup|x„|. п 4. Пусть р > 1 и 1р — пространство всех последовательно- стей х — {хп}, для которых (оо X 1/р £ I Х„ |₽) < оо; п=1 / можно доказать, что сопряженное к нему пространство ГР изо- морфно пространству lq, \/р + \/q — 1. Общий вид линейного не- прерывного функционала на 1Р: оо х = {хп}е/ / = п=1 4 Доказательство основано на применении неравенства Гельдера. 5. Выясним структуру пространства, сопряженного к гиль- бертову. Теорема 2. Пусть Н — действительное гильбертово про- странство. Для всякого непрерывного линейного функционала [
188 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV на Н существует единственный элемент х0 е Н, такой, что f (х) = (х, х0), хеН, (3) причем || f || = || Хо ||. Обратно, если х0 е Н, то формула (3) опре- деляет такой непрерывный линейный функционал f, что ||/|| = = ||х0||. Таким образом, равенство (3) определяет изоморфизм f ->хй между пространствами Н* и Н. Доказательство. Очевидно, что для всякого Хо е Н фор- мула (3) определяетлинейный функционал на Н. Так как| f (х) |= = | (х, х0) | II х || • || х0||, то этот функционал непрерывен, а так как f (xq) = || Хо II2, то || f || = || Хо ||. Покажем, что всякий непре- рывный линейный функционал f на/7 представим в виде (3). Если / = 0, то полагаем х0 = 0. Пусть теперь f =£= 0 и Но = {х:/(х) = = 0} — ядро функционала /; так как f непрерывен, то Но — замкнутое линейное подпространство в Н. В п. 6 § 1 гл. III было показано, что коразмерность ядра любого линейного функ- ционала равна 1. Поэтому, учитывая следствие 3 теоремы 7 из § 4 гл. III, заключаем, что ортогональное дополнение Но к под- пространству Но одномерно, т. е. существует такой (ненулевой) вектор уо, ортогональный к Но, что всякий вектор х^Н одно- значно представим в виде х = у + Ау0, где у е На. Очевидно, можно считать, что || у0 || = 1; положим х0 = f (у0)Уо- Тогда для любого х е Н имеем х — У + Куо, У^Но, f (х) = А/ (Уо), (х, х0) = А (Уо, х0) = А/ (у0) (Уо, Уо) = hf (Уо). Таким образом, f(x) = (x, х0) для всех х е Н. Если /(х) = (х, х'о), х^Н, то (х, х0 — Хо) = 0, откуда, полагая х = х0 — х'о, полу- чаем, ЧТО Xq = Xq. Замечания. 1. Пусть Е — неполное евклидово простран- ство, а Н — гильбертово пространство, являющееся его пополне- нием. Так как пространства Е* и Н* изоморфны (см. замечание на стр. 184), а Н* изоморфно Н, то справедливо следующее утверждение: пространство Е*, сопряженное к неполному евкли- дову пространству Е, изоморфно пополнению Н пространства Е. 2. Теорема 2 справедлива и для комплексного гильбертова пространства (доказательство в точности то же, с заменой лишь Хо = }*,Уо)Уо на Xq — /(уо)уо). Единственное отличие комплексно- го случая от действительного состоит в том, что теперь отобра- жение Н в Н*, сопоставляющее элементу хоеЯ функционал f(x) = (x, х0), является сопряженно-линейным изоморфизмом, т. е. элементу Ах0 отвечает функционал АД 6. В примерах 1—5 рассматривались нормированные про- странства. Рассмотрим теперь пространство счетно-нормирован-
СОПРЯЖЕННОЕ ПРОСТРАНСТВО 189 $ 2] ное. Пусть Ф — действительное счетно-гильбертово пространство, состоящее из всех последовательностей х = {хп}, для которых \'/« £ < 00 при всех й=1, 2, ... Скалярные произведения в Ф суть (х, y)k = Е nkxnyn, Л=1, 2, ... п=1 Пространство Ф со скалярным произведением (•, -)к является евклидовым; пусть Ф&— его пополнение. Легко видеть, что Фл можно отождествить с гильбертовым пространством всех после- довательностей х = {х„}, у которых ||x||fc < 00. В силу теоремы 2 пространство Ф*, сопряженное к Фл, изоморфно пространству Фл; при этом изоморфизме каждому непрерывному линейному функционалу f е Фл сопоставляется такая последовательность 7 = {fn}, что Ш = nk\fn I2)4 < ОО f (х) = (Х, f)k = Е nkXnfn, X = {хп} СЕ Фь п=1 и обратно, каждая такая последовательность определяет элемент из Фь Определим теперь функционал f е Ф* не последова- тельностью {fn}, а последовательностью {gn}, где gn = nkfn. То- гда f(x) = ^xngn и ||f 11 = (Е • Таким образом, Ф£ можно отождествить с гильбертовым про- странством последовательностей {gn}, удовлетворяющих условию ОО X n~kg2 < 00, (4) rt=l и со скалярным произведением оо (g°>, g(2>) = I n~kg"g™ 00 Так как Ф*= U Фа, то Ф* — пространство всех последователь- &= 1 ностей {gn}, для каждой из которых существует свое k, такое, что выполняется условие (4).
190 ЛИНЕЙНЫЕ функционалы и линейные операторы [ГЛ. IV Значение каждого такого функционала определено на любом оо элементе х = {хп} еФ и равняется £ xngn. Пе=1 Итак, если пространство Ф есть пересечение убывающей цепочки гильбертовых пространств Ф= П Фй, Ф^ФгГЭ ... Фй ..., fc=i то Ф* есть сумма возрастающей цепочки гильбертовых про- странств Ф’= U Ф£, Ф^сзФгСЗ ... сзФ^с ... k=i Удобно ввести обозначение Ф* = Ф~*. Если еще обозначить про- странство 4 через Фо, то мы получим такую бесконечную в обе стороны цепочку гильбертовых пространств . . . CZ Фй CZ ... CZ ф; CZ Фо CZ Ф_, с: ... с Ф_А с . . ., в которой Фй - Ф_А при каждом k = 0, ±1, ±2, ... 4. Второе сопряженное пространство. Так как непрерывные линейные функционалы на линейном топологическом простран- стве Е сами образуют линейное топологическое пространство,— сопряженное к Е пространство (Е*,Ь), — то можно говорить о пространстве £** непрерывных линейных функционалов на Е*, т. е. о втором сопряженном к Е и т. д. Заметим, что всякий элемент х0 из Е определяет некоторый линейный функционал на Е*. Действительно, положим (f) = f W (5> где х0 — фиксированный элемент из Е, a f пробегает все Е*. Ра- венство (5) ставит в соответствие каждому f некоторое числа фх (f)> т. е. определяет функционал на Е*. Так как при этом (af 1 + = af 1 (хо) + #2 Оо) = (f j) + (f2)> то этот функционал линеен. Далее, всякий такой функционал непрерывен на Е*. В самом деле, пусть е > 0 и А — ограниченное множество в Е, содержащее х0. Рассмотрим в Е* окрестность нуля U (е, А). По определению £7(е, А), имеем I)| = И(хо) I <е ПРИ f^U(e,A). Но это означает, что функционал фХо непрерывен в точке О, а следовательно, и на всем пространстве Е*. /
$ 2] СОПРЯЖЕННОЕ ПРОСТРАНСТВО 191 Мы получили, таким образом, отображение всего простран- ства Е на некоторое подмножество пространства Е**. Это ото- бражение, очевидно, линейно. Такое отображение Е в Е** назы- вается естественным отображением пространства Е во второе сопряженное. Обозначим его л. Если на Е есть достаточно много линейных функционалов (например, если Е нормировано или хотя бы локально выпукло и отделимо), то это отображение взаимно однозначно, так как тогда для любых двух различных х', х" е Е существует такой функционал f^E*, что f(xz)y= =/= f(x"), т. е. фх, и фх„ — различные функционалы на Е*. Если к тому же л(Е) = Е**, то (отделимое локально выпуклое) про- странство Е называется полу рефлексивным. В пространстве Е** (как сопряженном к (Е*, Ь)) можно ввести сильную топологию, которую мы обозначим Ь*. Если пространство Е полурефлексив- но и отображение л: Е -> Е** непрерывно, то Е называется рефлексивным пространством. Можно показать, что отображение л'1 всегда непрерывно, поэтому если Е рефлексивно, то есте- ственное отображение л: Е-+Е** представляет собой изомор- физм между линейными топологическими пространствами Е и Е** = (Е**, Ь*}. Поскольку мы можем теперь каждый элемент из Е рассмат- ривать еще и как элемент пространства Е**, удобно для значе- ний линейного функционала f е Е* вместо записи f(x) ввести более симметричное обозначение: f(v) = (f,x). (6) При фиксированном f е Е* мы можем рассматривать (А х) как функционал на Е, а при фиксированном х — как функционал на Е* (при этом уже х выступает в роли элемента из Е**). Если Е — нормированное пространство (следовательно, нор- мированы и пространства Е*, Е** и т. д.), то естественное ото- бражение пространства Е в Е** есть изометрия. Действительно, пусть х — элемент из Е. Обозначим его норму в Е символом ||х||, а норму его образа в £‘* символом ПхПг- По- кажем, что ||х|| = ||х||2. Пусть f — произвольный ненулевой эле- мент из Е*. Тогда КА x)|<||f ll-llxll, т. е. и, поскольку левая часть последнего неравенства не зависит от А || XII > sup —1 == || х ||2. С другой стороны (следствие 4 теоремы Хана — Банаха для нормированных пространств), для каждого хое£ найдется та- кой ненулевой линейный функционал f0, что l(fo, Хо)1 = 1КоИ-llхоII, (7)
192 ЛИНЕЙНЫЕ функционалы и линейные операторы [ГЛ. IV поэтому II X ||2 = sup,1 (1’^1 > II X II, т. е. ||х|| — 11x11г, что и требовалось доказать. Таким образом, нор- мированное пространство Е изометрично (вообще говоря, не- замкнутому) линейному многообразию л(Е) в Е**; отождествляя Е с л(Е), можно считать, что Е с Е**. Из изометричности естественного отображения л: Е -> Е** для нормированных пространств следует, что понятия полуреф- лексивности и рефлексивности для нормированных пространств совпадают. Поскольку пространство, сопряженное к нормированному, пол- но, всякое рефлексивное нормированное пространство Е полно. Конечномерные евклидовы пространства и гильбертово про- странство представляют собой простейшие примеры рефлексив- ных пространств (для них даже Е = Е*). Пространство с0 сходящихся к нулю последовательностей представляет собой пример полного нерефлексивного простран- ства. Действительно, как мы показали выше (пример 2 § 2), со- пряженным к Со является пространство Е всех абсолютно сходя- щихся числовых рядов, которому в свою очередь сопряжено про- странство m всех ограниченных последовательностей. Пространство С [я, Ь] непрерывных функций на некотором от- резке [а, 6] тоже нерефлексивно. Мы, однако, не будем здесь при- водить доказательства этого утверждения1). Примером рефлексивного пространства, не совпадающего со своим сопряженным, может служить 1Р при 1 < р =/= 2 (так как Гр = 1д, где \/р+ 1/^=1, то /” = /; = /р). Упражнение. Докажите, что замкнутое подпространство рефлексив- ного пространства рефлексивно. § 3. Слабая топология и слабая сходимость 1. Слабая топология и слабая сходимость в линейном топо- логическом пространстве. Рассмотрим линейное топологическое пространство Е и совокупность всех непрерывных функционалов на нем. Если fi, . .., fn — произвольный конечный набор таких функционалов и е — положительное число, то множество {х: I fi(x) | < е; z= 1, 2, ..., п} (1) открыто в Е и содержит точку 0, т. е. представляет собой неко- торую окрестность нуля. Пересечение двух таких окрестностей ’) Можно доказать даже следующее более сильное утверждение: не су- ществует никакого нормированного пространства, для которого С[а, ft] было бы сопряженным пространством.
S3] СЛАБАЯ ТОПОЛОГИЯ И СЛАБАЯ СХОДИМОСТЬ 193 всегда содержит множество вида (1), и, следовательно, в Е можно ввести топологию, для которой совокупность множеств вида (1) будет определяющей системой окрестностей нуля. Она называется слабой топологией пространства Е. Слабая тополо- гия в Е — это самая слабая из топологий, в которой непрерывны все линейные функционалы, непрерывные в исходной топологии этого пространства. Ясно, что всякое множество в Е, открытое в смысле слабой топологии, открыто и в исходной топологии пространства Е, од- нако обратное, вообще говоря, неверно (множества вида (1) не обязаны образовывать определяющую систему окрестностей нуля в исходной топологии). По терминологии, принятой нами в § 5 гл. II, это означает, что слабая топология пространства Е слабее, чем его исходная топология. Тем самым оправды- вается принятое для нее название. Если в Е существует достаточно много непрерывных линей- ных функционалов (например, если Е нормировано), то слабая топология в Е удовлетворяет аксиоме отделимости Хаусдорфа. Легко также проверить, что операции сложения и умножения на числа, определенные в Е, непрерывны относительно слабой топологии этого пространства. Даже в случае нормированных пространств слабая топология в Е может не удовлетворять первой аксиоме счетности. Следо- вательно, эта топология, вообще говоря, не описывается на языке сходящихся последовательностей. Тем не менее сходи- мость в Е, определяемая этой топологией, представляет собой важное понятие. Она называется слабой сходимостью. В отли- чие от нее, сходимость, определяемую исходной топологией про- странства Е (нормой, если Е нормировано), называют сильной сходимостью. Понятие слабой сходимости можно сформулировать следую- щим образом: последовательность {хп} элементов из Е назы- вается слабо сходящейся к х0^Е, если для любого непрерыв- ного линейного функционала <р(х) на Е числовая последователь- ность {ф(хп)} сходится к ф(Х0). Действительно, считая для простоты Хо = 0, предположим, что <р(хп)->0 при всяком фЕЁ*. Тогда для всякой слабой окрестности U = {х: | <pf (х) | <_ в, i=l,2,..., 6} точки 0, найдется такое N, что хп е U при всех и N (для этого достаточно выбрать Ni так, что | <р» (хп) | < 8 при n^N{ и затем положить N — max Ni). Обратно, если для каждой сла- бой окрестности нуля U существует такое N, что х„е U для всех п А\ то условие <р(хп)->0 при п->оо, очевидно, выполнено для каждого фиксированного tpef*. Из того, что слабая топо-
194 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ (ГЛ. IV логия пространства Е слабее его сильной топологии, следует, что всякая сильно сходящаяся последовательность сходится и слабо. Обратное, вообще говоря, неверно (см. примеры ниже). 2. Слабая сходимость в нормированных пространствах. Рас- смотрим подробнее понятие слабой сходимости применительно к нормированным пространствам. Теорема 1. Если {хп}— слабо сходящаяся последователь- ность в нормированном пространстве, то существует такое по- стоянное число С, что Иначе говоря, всякая слабо сходящаяся последовательность в нормированном пространстве ограничена. Доказательство. Рассмотрим в Е* множества Л„ = {Л |(f,x„)|<*}, k, га=1, 2, ... Эти множества замкнуты в силу непрерывности (Д хп) как функции от f при фиксированном хп. Следовательно, замкнуты со (как пересечения замкнутых) и множества Ак = П Акп. В силу П=1 слабой сходимости {хп} последовательность (Д хп) ограничена для каждого f е Е*, поэтому £*= U Ак. А=1 Так как пространство £* полно, то по теореме Бэра (§ 3 гл. II) хоть одно из множеств Ак, скажем Ак„ должно быть плотно в некотором шаре B\f0, е], а так как Ла, замкнуто, то это означает, что B[f0, е]сД,. Но это значит, что последовательность {хп} ограничена на шаре B[fo, е], а следовательно, и на любом шаре в £*, в частно- сти на единичном шаре этого пространства. Таким образом, по- следовательность {хп} ограничена как последовательность эле- ментов из £**. Но в силу изометричности естественного вложе- ния Е в Е** это означает ограниченность {хп} и в Е. Замечание. При доказательстве ограниченности последовательности {х„} по норме мы воспользовались лишь тем, что числовая последователь- ность (/, хп) ограничена при каждом f е£'. Таким образом, если последова- тельность {х„} в Е такова, что числовая последовательность (f, хп) ограничена при каждом f s Е*, то существует такая постоянная С, что ||хп|| С. Это утверждение можно обобщить: всякое слабо ограниченное (т. е. ограниченное в слабой топологии) подмножество Q нормированного пространства Е сильно ограничено (т. е. содержится в некотором шаре). Действительно, допустим, найдется такая последовательность {xn} cz Q, что ||хп|1—► при п—>-оо. Так как Q слабо ограничено, то и множество {хп} слабо ограничено, т. е. по- глощается любой слабой окрестностью нуля; в частности, для любого fe.E* найдется такое N, что {xn)c:AZ{x: |(f, х)| < 1}, откуда |(f, xn)| < N для
«3] СЛАБАЯ ТОПОЛОГИЯ И СЛАБАЯ СХОДИМОСТИ 195 всех п. Но это в силу сделанного выше замечания противоречит предположе- нию ||Хп11—► оо. Если учесть, что слабая ограниченность множества Q озна- чает, что на нем ограничен любой непрерывный линейный функционал, то мы приходим к следующему важному результату: для того чтобы подмножество Q нормированного пространства было ограничено, необходимо и достаточно, чтобы на Q был ограничен любой функционал f е Е*. Следующая теорема часто бывает полезна для фактической проверки слабой сходимости той или иной последовательности. Теорема 2. Последовательность {хп} элементов нормиро- ванного пространства Е слабо сходится кхеЕ, если: 1) Iknll ограничены в совокупности некоторой константой М-, 2) f(xn)-*-f(x) для всякого где А — некоторое множе- ство, линейная оболочка которого всюду плотна в Е*. Доказательство. Из условия 2) и определения действий над линейными функционалами следует, что если <р — линейная комбинация элементов из А, то <р(х„)-><р(х). Пусть теперь <р — произвольный элемент из Е* и {<р4 — схо- дящаяся к <р последовательность линейных комбинаций элемен- тов из А. Покажем, что <р(х„) -> <р(х). Пусть М таково, что ||х„||<Л1(п=1, 2, ...) и ||x||<M. Оценим разность |<р(хп) — <р(х) |. Так как <рь-хр, то для лю- бого е > 0 существует такое К, что ||ф — <рь|| < 8 для всех k К. Поэтому IФ (х„) — Ф (х) КIФ М — <pfe (х„) | +1 (х„) — <pfe (х) | + +1 Фк (х) — Ф (х) I < вЛ1 4- еЛ14-1 <pft (х„) — (х) |. Но, по условию, <ph(Xn)-> фь(х) при га->оо. Следовательно, ф(хп) — <р(х)->0 при га->оо для всякого феЕ’. Примеры. Посмотрим, какой смысл имеет понятие слабой сходимости в некоторых конкретных пространствах. 1. В конечномерном евклидовом пространстве Rn слабая схо- димость совпадает с сильной. Действительно, пусть в]......еп — какой-либо ортогональный нормированный базис в R” и {х4 — последовательность в R”, слабо сходящаяся к элементу х. Пусть X = x<% 4- ... 4- х<п*е„ К я 1 1 * я п И х = х<‘> в] ... х(п’еп. Тогда 41) = (х*. е1) = х<‘>, x<k"» = (xfc, е„)->(х,еп) = хЧ
196 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ (ГЛ IV т. е. последовательность {хп} покоординатно сходится к х. Но тогда / п \'/г кч. -о, т. е. {хп} сильно сходится к х. Поскольку из сильной сходимости всегда вытекает слабая, равносильность этих сходимостей в R” доказана. 2. Слабая сходимость в 12. Для слабой сходимости ограни- ченной последовательности {х^} к х достаточно, чтобы выпол- нялись условия (xft, et) = 4° “*= (х> ei)> * — 1 > 2, .... где ^ = (1, 0, 0, ...), е2 —(О, 1, 0, Действительно, линейные комбинации элементов всюду плот- ны в пространстве 12 (совпадающем, как мы видели, со своим сопряженным). Поэтому наше утверждение вытекает из тео- ремы 2. Таким образом, слабая сходимость ограниченной последо- вательности {хй} в 12 означает, что числовая последовательность координат этих векторов сходится для каждого i— 1, 2, ... Иначе говоря, слабая сходимость совпадает с покоординатной (при условии ограниченности). Нетрудно видеть, что в 12 слабая сходимость не совпадает с сильной. Действительно, покажем, что последовательность е2, ..., еп, ... слабо сходится в 12 к 0. Всякий линейный функционал f в 12 записывается как скалярное произведение f (х) = (х, а) вектора х е 12 на некоторый фиксиро- ванный вектор а = (аь а2, ...). Поэтому f(en) = ап, и поскольку ап -> 0 при и -> оо для всякого а е 12, получаем lim f(en) = O для каждого линейного функционала в 12. В то же время в сильном смысле последовательность {еп} ни к какому пределу не сходится. Упражнения. 1. Пусть последовательность (хп) элементов гильбер- това пространства Н слабо сходится к элементу х, причем || хп || -> || х || при п-> оо. Доказать, что в этом случае последовательность (хп) сильно сходится к х, т. е. || хп — х || -> 0. 2. Доказать, что утверждение упражнения 1 сохранится, если условие II хп II II х || заменить условием || хп || || х || для всех п или условием lim ||х„||<1И1- П->о° 3. Пусть Н—(сепарабельное) гильбертово пространство и Q — его огра- ниченное подмножество’. Тогда топология в Q, индуцируемая слабой тополо- гией пространства Н, может быть задана некоторой метрикой. 4. Докажите, что всякое замкнутое выпуклое подмножество гильбер- това пространства замкнуто в слабой топологии (в частности, всякое замкну-
$ 3] СЛАБАЯ ТОПОЛОГИЯ И СЛАБАЯ СХОДИМОСТЬ 197 тое линейное подпространство гильбертова пространства слабо замкнуто). Приведите пример замкнутого множества в гильбертовом пространстве, не являющегося слабо замкнутым. 3. Слабая сходимость в пространстве С[а, &] непрерывных функций. Пусть {хп(0} — последовательность функций из С[д, &], слабо сходящаяся к функции x(t). Последовательность {хп(0} •ограничена по норме С[щ &]. Среди функционалов, определенных на С[а, &], имеются, в частности, функционалы каждый из которых есть значение функции в некоторой фиксированной точ- ке t0 (см. пример 4 п. 2 § 1). Для каждого такого функционала •6^ условие б«.(хп)-*б«,(х) •означает, что хп (t0)-+x(t0). Таким образом, если последовательность {хп(0} слабо сходит- ся, то она: 1) равномерно ограничена, т. е. |xn(0 | С при всех п = = 1,2,... и 2) сходится в каждой точке. Можно показать, что совокупность этих двух условий не только необходима, но и достаточна для слабой сходимо- сти последовательности {хп(0} в £[«,&]. Иначе говоря, слабая сходимость в С[д, Ь] совпадает с поточечной (при условии огра- диченности). Ясно, что эта сходимость не совпадает со сходимостью по норме С[д, &], т. е. равномерной сходимостью непрерывных функ- ций. (Приведите соответствующий пример.) 3. Слабая топология и слабая сходимость в сопряженном пространстве. В п. 2 предыдущего параграфа мы ввели в сопря- женном пространстве Е* топологию, названную нами сильной, приняв за систему окрестностей нуля совокупность множеств вида t/e,A = {f: If WK е, х<=А}, где А — произвольное ограниченное множество в Е, а е — произ- вольное положительное число. Если мы здесь вместо всех огра- Биченных множеств будем рассматривать все конечные под- множества /1сЕ, то мы получим так называемую слабую то- пологию в сопряженном пространстве Е*. Поскольку всякое ко- нечное множество /1сЕ ограничено (обратное, вообще говоря, не верно), ясно, что слабая топология пространства Е* слабее, чем сильная топология этого пространства. Вообще говоря, эти две топологии не совпадают. Слабая топология, введенная в Е*, определяет в этом про- странстве некоторую сходимость, называемую слабой сходи-
198 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ (ГЛ. IV мостью функционалов. Слабая сходимость линейных функцио- налов представляет собой важное понятие, играющее существен- ную роль во многих вопросах функционального анализа, в частности, в теории так называемых обобщенных функций, о которых будет идти речь в следующем параграфе. Слабая сходимость последовательности {фп} линейных функ- ционалов есть, очевидно, сходимость этой последовательности на каждом фиксированном элементе из Е. Иными словами, последовательность {фп} называется слабо сходящейся к ф е Е\ если для каждого хе£ выполнено соотношение <р„ (х) -> <р (х). Ясно, что и в сопряженном пространстве последовательность, сходящаяся в сильной топологии, сходится и слабо (но не на- оборот). Пусть Е (а следовательно, и Е*)—банахово пространство.. Имеет место следующая теорема, аналогичная теореме 1. Теорема 1*. Если {/п}— слабо сходящаяся последователь- ность линейных функционалов на банаховом пространстве, то существует такое постоянное число С, что ||fn||<C, п=1, 2, ... Иначе говоря, всякая слабо сходящаяся последовательность эле- ментов пространства, сопряженного банахову пространству*, ограничена по норме. Доказательство не отличается от доказательства теоремы L Следующая теорема вполне аналогична теореме 2. Теорема 2*. Последовательность линейных функционалов {<рп} из Е* слабо сходится к <р е£*, если: 1) эта последовательность ограничена, т. е. ||<рп|КС, п=1, 2, ...; 2) соотношение (<рп, х) -> (<р, х) выполнено для всех х, при- надлежащих некоторому множеству, линейные комбинации эле- ментов которого всюду плотны в Е. Доказательство то же, что в теореме 2. Рассмотрим пример. Пусть Е есть пространство С[а, 6] не- прерывных функций ') и Ф (х) — х (0), т. е. ф есть 6-функция (см. § 1, п. 2, пример 4). Пусть, далее, { фп(0) — последовательность непрерывных функций, удовлетво- ') Мы считаем, что 0 е [а, 6]. Можно было бы, конечно, вместо точка t = 0 взять любую другую.
S3] СЛАБАЯ ТОПОЛОГИЯ И СЛАБАЯ СХОДИМОСТЬ' 199 ряющих следующим условиям: 1) Фп(0 = 0 ПРИ И1> 1/«> Фп(0>0; ь 2) $ф„(0Л = 1. а Тогда для любой непрерывной на [а, функции x(t) с помощью теоремы о среднем получаем ь 1/п J ф„(/)х(0Л-*х(0) при и-+оо. а —1/п. Выражение $ 4>n(t)x(t)dt а представляет собой линейный функционал на С [а, 6]. Таким об- разом, б-функцию можно представить как предел в смысле сла- бой сходимости линейных функционалов на С [а, б] последова- тельности «обычных» функций. Замечание. Пространство Е* линейных функционалов на некотором пространстве Е мы можем рассматривать двояко: или как пространство, сопряженное к исходному пространству Е, или же считать само Е* основным пространством и связывать с ним сопряженное к нему пространство Е**. В соответствии с этим мы можем в Е* вводить слабую топологию двумя спосо- бами: либо как в пространстве функционалов, определяя окрест- ности в Е* с помощью всевозможных конечных наборов элемен- тов из Е, либо как в основном пространстве, с помощью про- странства Е**. В случае рефлексивного пространства это, разу- меется, одно и то же. Если же Е не рефлексивно, то это — две различные топологии в Е*. Чтобы избежать возможной здесь путаницы, будем слабую топологию, определяемую в основном пространстве (т. е. топологию в Е*, определяемую с помощью _Е**) называть просто слабой топологией, а слабую топологию в пространстве функционалов (т. е. топологию в Е*, определяе- мую с помощью Е) называть «-слабой топологией. Очевидно, что «-слабая топология в Е* слабее, чем слабая топология про- странства Е (т. е. в слабой топологии не меньше открытых мно- жеств, чем в «-слабой топологии). 4. Ограниченные множества в сопряженном пространстве. В различных применениях понятия слабой сходимости линейных •функционалов важную роль играет следующая теорема. Теорема 3. Если Ё — сепарабельное линейное нормирован- ное пространство, то в любой ограниченной последовательности
200 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV непрерывных линейных функционалов на Е содержится слабо сходящаяся подпоследовательность. Доказательство. Выберем в Е счетное всюду плотное множество (xi,x2) . .., хп, ...). Если {ф„}— ограниченная (по норме) последовательность линейных функционалов на Е, то числовая последовательность Ф1 U1), Ф2(*1)» •••> Фп(*1), ••• ограничена. Поэтому из {<рп} можно так выбрать подпоследова- тельность Ф(1'’> Фг*..Фп*...... чтобы числовая последовательность ф(Р (х^, фР(Х]),..., ф*,1’^), • сходилась. Далее, из {ф^} можно так выбрать подпоследова- тельность Ф(Л Ф<22>...Ф<„2>.... чтобы сходилась последовательность ф)2' (х2), ф® (х2),ф®(х2)’ Продолжая этот процесс, получим такую систему последова- тельностей ф?*, Фр.....Фр....... Ф(Д Ф?>, Ф<2)..... (каждая из которых содержится в предыдущей), что {ф„4)} схо- дится в точках X], х2, ..., х&. Тогда, взяв «диагональ» Фр> Фг2)....Фр’> • • • мы получим такую подпоследовательность линейных функциона- лов, что фР(хп), фР(хп), ... сходится для всех п. Но тогда (в силу теоремы 2*) последовательность фр(х), фР(х), ... схо- дится и для любого х е Е. Эта теорема вместе с теоремой 1* означает, что в простран- стве Е*, сопряженном сепарабельному банахову пространству, ограниченные подмножества, и только они, являются счетно- предкомпактными в «-слабой топологии. Покажем, что на самом деле здесь имеет место предкомпактность, а не только счетная предкомпактность. Докажем прежде всего следующую теорему. Теорема 4. Пусть S* — замкнутый единичный шар про- странства Е*, сопряженного к сепарабельному нормированному пространству Е. Топологию, индуцированную в S* *-с лабой то- пологией пространства Е*, можно задать при помощи метрики Р(Л g) = E2"nl (/-£>*")!> (2>
S 3] СЛАБАЯ ТОПОЛОГИЯ И СЛАБАЯ СХОДИМОСТЬ' 201 где {хп} — некоторое фиксированное счетное всюду плотное мно- жество в единичном шаре S пространства Е. Доказательство. Ясно, что функция p(f, g) обладает всеми свойствами расстояния; кроме того, она инвариантна от- носительно сдвигов: P(f + h,g + h) = p(f,g). Поэтому достаточно проверить, что система окрестностей нуля, определяемая в S* слабой топологией пространства Е*, эквивалентна системе окрестностей нуля, определяемой в S* расстоянием (2), т. е. что а) любой «шар» Qe = {f: p(f.O)<e} содержит пересечение S* с некоторой слабой окрестностью нуля в Е* и что б) всякая слабая окрестность нуля в Е* содержит пересечение S* с некоторым Qe. Выберем N так, что 2~N < е/2 и рассмотрим слабую окрест- ность нуля V = VX х e/2 = tf: I (f, Xk) | < e/2, 6=1, 2, ..., N}. 1 N Тогда, если feS'Dl7, то N оо p(f,O) = £ 2-"|tf, X„)|+ £ 2-"|(f, x„)|< n₽=l п==У+! N OO <1Z2’“+ Ё 2’"<e' n=l п=У+1 t. e. S‘HVczQe. Тем самым утверждение а) доказано. Дока- жем утверждение б). Пусть U = UVl..Vm;6 = {f: \(f,yk)\<t>, 6=1, 2, ..., пг} — некоторая «-слабая окрестность нуля в Е*. Можно считать, что II ул II I, 6= 1,2, ..., пг\ так как множество {хп} всюду плотно в S, то найдутся такие номера nlt ..., nm, что ||Ул “ < 6/2- k = 2, ..., tn. Пусть N = max(ni..nm) и е = 2-(У+1|д. Тогда при /eS‘DQe из неравенств оо I 2~п| (/, х„)|<8 п=1
202 линейные функционалы и линейные операторы [ГЛ. IV получаем, что | (f, хп) | < 2пе; в частности, |(f, X„t)| <2n‘e<2ye = d/2. Следовательно, для всех £=1,2, ..., т получаем l(f, ^)|<|(лм+1С’ ^-М<д/2+1|/Н^~М<б- Таким образом, S* П Qe cz U. Теорема доказана. Ясно, что этот результат автоматически распространяется на любой шар, а значит, и на любое ограниченное подмножество- М cz Е*. Мы показали (теорема 3), что из каждой ограниченной по- следовательности в Е* можно выбрать «-слабо сходящуюся под- последовательность. Иначе говоря, в пространстве Е*, сопря- женном сепарабельному линейному нормированному и снабжен- ном «-слабой топологией, каждое ограниченное подмножество М счетно-предкомпактно. Но в силу последней теоремы каждое такое множество есть метризуемое топологическое пространство, а для метрических пространств компактность и счетная компакт- ность совпадают. Таким образом, мы получаем следующий ре- зультат. Теорема 3*. Всякое ограниченное множество М в простран- стве Е*, сопряженном сепарабельному нормированному про- странству, предкомпактно в смысле «-слабой топологии про- странства Е*. Покажем теперь, что если Е — сепарабельное линейное нор- мированное пространство, то всякий замкнутый шар в простран- стве (£*, Ь) замкнут в «-слабой топологии пространства Е*. Так как сдвиг в пространстве Е* переводит класс замкнутых (в «-слабой топологии) множеств в себя, то достаточно дока- зать, что в «-слабой топологии замкнут всякий шар вида S’ = = {f: II f II с}. Пусть f0 S*. По определению нормы функцио- нала найдется такой вектор хе£, что ||х||= 1, fo(x) = а > с. Тогда множество = f(x) > —y-j будет «-слабой окрест- ностью функционала fo, не содержащей ни одного элемента из шара следовательно, шар замкнут в «-слабой топологии. Из доказанного утверждения и теоремы 3* вытекает следую- щая теорема. Теорема 5. Всякий замкнутый шар в пространстве, сопря- женном сепарабельному нормированному пространству, компак- тен в «-слабой топологии. Изложенные выше результаты об ограниченных множествах в сопряжен- ных пространствах могут быть перенесены с нормированных пространств на> Произвольные локально выпуклые. См. по этому поводу, например, [42].
5 4] ОБОБЩЕННЫЕ ФУНКЦИИ 203 § 4. Обобщенные функции 1. Расширение понятия функции. В различных вопросах ана- лиза термин «функция» приходится понимать с разной степенью общности. Иногда рассматриваются непрерывные функции, в других вопросах приходится предполагать, что речь идет о функ- циях, дифференцируемых один или несколько раз, и т. д. Однако в ряде случаев классическое понятие функции, даже трактуемое в самом широком смысле, т. е. как произвольное правило, от- носящее каждому значению х из области определения этой функции некоторое число у = ?(х)> оказывается недостаточным. Вот два важных примера. 1) Распределение масс вдоль прямой удобно задавать плот- ностью этого распределения. Однако, если на прямой суще- ствуют точки, несущие положительную массу, то плотность та- лого распределения заведомо не может быть описана никакой -«обычной» функцией. 2) Применяя аппарат математического анализа к тем или иным задачам, мы сталкиваемся с невыполнимостью некоторых •операций; например, функцию, не имеющую производной (в не- которых точках или даже всюду), нельзя дифференцировать, если производную понимать как «обычную» функцию. Конечно, .затруднений такого типа можно было бы избежать, ограничив- шись, скажем, рассмотрением одних только аналитических функ- ций. Однако такое сужение запаса допустимых функций во мно- гих случаях весьма нежелательно. Оказывается, однако, что подобные затруднения можно преодолеть путем не сужения, а существенного расширения понятия функции, вводя так называемые обобщенные функ- ции. Основой для введения соответствующих определений нам послужит понятие сопряженного пространства, рассмотренное выше. Подчеркнем еще раз, что введение обобщенных функций «было вызвано вовсе не стремлением к возможно большему расширению понятий анализа, а совершенно конкретными .задачами. По существу, в физике обобщенные функции ис- пользовались уже довольно давно, во всяком случае раньше, чем была построена строгая математическая теория обобщенных функций. Прежде чем переходить к точным определениям, изложим основную идею построения. Пусть f — фиксированная функция на прямой, интегрируемая на каждом конечном интервале, и пусть ср — непрерывная функ- ция, обращающаяся в нуль вне некоторого конечного интервала Хтакие функции мы в дальнейшем будем называть финитными).
204 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV Каждой такой функции ср можно с помощью фиксированной функции f сопоставить число ОО (f, ф) = 5 Н*)ф (*)</* (1> — оо (фактически, в силу финитности <р(х) интеграл берется по не- которому конечному интервалу). Иначе говоря, функцию f мож- но рассматривать как функционал (линейный, в силу основных свойств интеграла) на некотором пространстве финитных функ- ций. Однако функционалами вида (1) не исчерпываются все функционалы, которые можно ввести на таком пространстве; со- поставляя, например, каждой функции ср ее значение в точке х = 0, мы получим линейный функционал, не представимый в виде (1). Таким образом, функции f(x) естественным образом включаются в некоторое более широкое множество — совокуп- ность всех линейных функционалов на финитных функциях. Запас функций ф можно выбирать различным образом; на- пример, можно было бы взять все непрерывные финитные функ- ции. Однако, как будет ясно из дальнейшего, разумно подчинить допустимые функции ср, помимо непрерывности и финитности, еще и достаточно жестким условиям гладкости. 2. Пространство основных функций. Перейдем теперь к точ- ным определениям. Рассмотрим на прямой совокупность К всех финитных функций ф, имеющих непрерывные производные всех порядков1)- Функции, принадлежащие К, образуют линейное пространство (с обычными операциями сложения функций и умножения их на числа). В этом пространстве нельзя ввести норму, которая отвечала бы излагаемой ниже теории, однако в нем естественным способом вводится понятие сходимости. Последовательность {ср„} элементов из К называется сходя- щейся к функции сре/(; если: 1) существует интервал, вне ко- торого все срп равны нулю1); 2) последовательность производ- ных2) {ф1;*1} порядка k (k — 0, 1, 2, ...) сходится на этом ин- тервале равномерно к ср(Ч (Равномерность сходимости по раз- личным k не предполагается.) Линейное пространство К с той сходимостью, которую мы в нем определили, мы будем называть основным пространством, а его элементы — основными функциями. Нетрудно описать топологию в К, которой подчиняется заданная в К схо- димость. Такая топология порождается системой окрестностей нуля, каждая из которых задается конечным набором у0> • • • > Ym непрерывных положитель- !) Интервал, вне которого функция ср равна 0, может быть различным для различных <р s К. ’) Под производной нулевого порядка понимается, как обычно, сама функция.
ОБОБЩЕННЫЕ ФУНКЦИИ 205 § 41 вых функций и состоит нз тех принадлежащих К функций, которые при всех х удовлетворяют неравенствам I ф (-*) 1 < Vo (х).I ф<т) (х) | < Ym (х). Проверка того, что этой топологии действительно подчиняется описанная вы- ше сходимость в К, предоставляется читателю. Упражнение. Обозначим через Кт подпространство пространства К, состоящее из всех функций <р е К, равных 0 вне отрезка [—т, т]. В про- страстве Кт можно ввести структуру счетно-нормированного пространства, полагая ||ф||п= sup I Ф<й) (х) |, п = 0, 1, 2, ... 0< k < п I X |<т Проверьте, что топология (соответственно сходимость последовательностей) в пространстве Кт, порождаемая этой системой норм, совпадает с топологией (соответственно сходимостью), индуцированной в Кт описанной выше топо- логией (сходимостью) в пространстве К. Ясно, что X, сХ2с...с Кт cz ..., ОО причем К = |J Кт- Покажите, что множество Q с. К тогда и только тогда т=1 ограничено относительно введенной в К топологии, когда существует такое т, что Q является ограниченным подмножеством счетно-нормированного про- странства Кт- Пусть Т — линейный функционал на пространстве X; докажите, что следующие четыре условия равносильны: (а) функционал Т непрерывен относительно топологии пространства К', (б) функционал Т ограничен на ка- ждом ограниченном множестве Q cz К', (в) если <рп е К и <рп —> 0 (в смысле введенной в К сходимости последовательностей), то 7"(фп) —>- 0; (г) для ка- ждого m сужение Тт функционала Т на подпространство Кт К есть непре- рывный функционал на Кт- S. Обобщенные функции. Определение. 1. Обобщенной функцией (заданной на пря- мой —оо < х < оо) называется всякий непрерывный функцио- нал Т'(ф) на основном пространстве К. При этом непрерывность функционала понимается в том смысле, что 7'((рп)-> Т'(ф), если последовательность фп сходится к ф в основном пространстве К. Заметим, прежде всего, что всякая интегрируемая на любом конечном интервале функция f(x) порождает некоторую обоб- щенную функцию. Действительно, выражение СО Л (ф) = 5 f (*) <₽ (*)dx (2) — со есть непрерывный линейный функционал на /С. Такие обобщен- ные функции мы в дальнейшем будем называть регулярными, а все остальные, г. е. не представимые в виде (2), — сингуляр- ными. Приведем некоторые примеры сингулярных обобщенных функций. 1. «6-функция»: Т (ф) = Ф (0).
206 линейные функционалы и линейные операторы [ГЛ. IV Это — непрерывный линейный функционал на К, т. е., по вве- денной выше терминологии, обобщенная функция. Этот функ- ционал обычно записывают в виде оо б (х) ф (х) dx, (3) — оо понимая по б(х) «функцию», равную нулю при всех х =/= 0 и обращающуюся в точке х = 0 в бесконечность так, что оо б (х) dx = 1. — оо Мы рассматривали уже б-функцию в § 1 как функционал на пространстве всех непрерывных функций, определенных на не- котором отрезке. Однако рассмотрение б-функции как функцио- нала на К имеет определенные преимущества, например, позво- ляет ввести для нее понятие производной. 2. «Смещенная б-функция». Пусть Т (ф) = <р (а). Этот функционал естественно записать по аналогии с обозна- чением (3) в виде оо б (х — а) ф (х) dx. (4) —оо 3. «Производная б-функции». Каждой ф е К ставится в со- ответствие число — <р'(0). Несколько ниже мы выясним, почему этот функционал естественно считать производной функционала, указанного в первом примере. 4. Рассмотрим функцию 1/х. Она не интегрируема ни на ка- ком интервале, содержащем точку нуль. Однако для каждой Ф е К интеграл оо j ф w 4dx — оо существует и конечен в смысле главного значения по Коши. Действительно, оо д д r j ф(х)у(/х= ф (х)У dx = j ) ~ ?(0-^ dx + j -^-dx. -оо —R -R -R Здесь (—R, R)—интервал, вне которого ф обращается в нуль. Первый из стоящих справа интегралов существует в обычном
ОБОБЩЕННЫЕ ФУНКЦИИ 207 «4 смысле (под знаком интеграла стоит непрерывная функция), а второй интеграл равен нулю в смысле главного значения. Та- ким образом, 1/х определяет некоторый функционал на /С, т. е. обобщенную функцию. Можно доказать, что ни одна из обоб- щенных функций, приведенных в примерах 1—4, не является регулярной (т. е. не представляется в виде (2) ни с какой ло- кально интегрируемой функцией f). 4. Действия над обобщенными функциями. Для обобщенных функций, т. е. непрерывных линейных функционалов на К, опре- делены операции сложения и умножения на числа. При этом, очевидно, для регулярных обобщенных функций (т. е. «обычных» функций на прямой) сложение их как обобщенных функций (т. е. линейных функционалов) совпадает с обычной операцией сложения функций. То же самое относится и к умножению на числа. Введем в пространстве обобщенных функций операцию пре- дельного перехода. Мы скажем, что последовательность обоб- щенных функций {fn} сходится к f, если для каждого ф е К выполнено соотношение (fn, ф) —> (f, ф)- Иначе говоря, сходимость последовательности обобщенных функций мы определяем как ее сходимость на каждом элементе из К. Пространство обобщенных функций с этой сходимостью будем обозначать /С*. Если а — бесконечно дифференцируемая функция, то есте- ственно определить произведение а на обобщенную функцию f формулой (af, ф) = (f, аф) (выражение, стоящее здесь справа, имеет смысл, так как atpe Все эти операции — сложение, умножение на числа и на бесконечно дифференцируемые функции, — непрерывны. Произведение двух обобщенных функций мы не вводим. Можно показать, что определить такое произведение невозмож- но, если потребовать, чтобы эта операция была непрерывна, а для регулярных обобщенных функций совпадала бы с обыч- ным умножением функций. Определим теперь для обобщенных функций операцию диф- ференцирования и рассмотрим ее свойства. Пусть сначала Т — функционал на К, определяемый некото- рой непрерывно дифференцируемой функцией f: ОО 7'(ф)= $ f (х) ф(х)4/х.
208 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV Его производной естественно назвать функционал dT/dx, опре- деляемый формулой оо -^-(ф) = $Г(*)ф(*Мх. — оо Интегрируя по частям и учитывая, что каждая основная функ- ция <р обращается в нуль вне некоторого конечного интервала, имеем оо оо 57(ф)== $ Г (x)q>(x)dx = — J f (х) ф' (х) dx; — 00 —оо таким образом, мы получили для dT/dx выражение, в котором производная функции f не участвует. Эти соображения под- сказывают следующее определение: Определение 2. Производной dT/dx обобщенной функ- ции Т называется функционал, определяемый формулой ^(Ф)------7(ф'). Ясно, что функционал, определяемый этой формулой, линеен и непрерывен, т. е. представляет собой обобщенную функцию. Ана- логично определяются вторая, третья и дальнейшие производ- ные. Обозначая обобщенную функцию символом f, мы будем обо- значать ее производную (понимаемую в определенном только что смысле) обычным символом f'. Непосредственно из определения производной обобщенной функции вытекает справедливость следующих утверждений: 1. Всякая обобщенная функция имеет производные всех по- рядков. 2. Если последовательность обобщенных функций {fn} схо- дится к обобщенной функции f (в смысле определения сходи- мости обобщенных функций), то последовательность производ- ных {f'} сходится к производной f' предельной функции. То же самое верно и для производных любого порядка. Это равносильно тому, что всякий сходящийся ряд, состав- ленный из обобщенных функций, можно дифференцировать по- членно любое число раз. Рассмотрим некоторые примеры. 1. Из сказанного выше ясно, что если f — регулярная (т. е. «настоящая») функция, производная которой существует и не- прерывна (или кусочно-непрерывна), то производная от нее как от обобщенной функции совпадает с ее производной в обыч- ном смысле.
§ 4) ОБОБЩЕННЫЕ ФУНКЦИИ 209 2. Пусть ( 1 при х > 0, ' Х t 0 при х^О. (5) Эта функция, называемая функцией Хевисайда, определяет ли- нейный функционал ОО (F, ф)= ^dx- о В соответствии с определением производной обобщенной функ- ции имеем оо (Г, ф) = — (f, ф') = — J ф' (*) dx = ф (0) о (поскольку ф обращается в 0 на бесконечности). Таким обра- зом, производная функции Хевисайда (5) есть б-функция. 3. Из примеров 1 и 2 ясно, что если f — функция, имеющая в точках хь х2, ... скачки, равные h\, h2, ... и дифференцируе- мая (в обычном смысле) в остальных точках, то производная от нее (как от обобщенной функции) представляет собой сумму обычной производной f' (в тех точках, где она существует) и выражения вида 52 Л£д (х — Xi). 4. Применив определение производной к б-функции, получим, что эта производная представляет собой функционал, принимаю- щий на каждой функции из К значение —ф'(0). А это и есть тот самый функционал, который мы уже назвали «производной от б-функции». 5. Рассмотрим ряд sin пх п (6) Его суммой служит функция, имеющая период 2л и определяе- мая на отрезке [—л, л] формулами Я — X 2 Я + X 2 0 f(x) = j при 0 < х л, при — л^х<0, при х —0.
210 линейные функционалы и линейные операторы [ГЛ. IV Обобщенная производная от нее равна ОО “4 + я Е t>(x-2kn). (7> £= —ОО Это — некоторая обобщенная функция (применяя ее к любой финитной функции <р(х), мы всегда будем получать лишь ко- нечное число отличных от нуля слагаемых). С другой стороны, 00 Esin пх —-— почленно, мы получаем расхо- дящийся ряд оо У, cosnx. П=1 Однако в смысле сходимости обобщенных функций этот ряд сходится [а именно, к выражению (7)]. Таким образом, понятие обобщенной функции позволяет приписать некоторый вполне определенный смысл сумме ряда, который в обычном смысле расходится. То же самое относится и ко многим расходящимся интегралам. С этим обстоятельством приходится часто встре- чаться в квантовой теории поля и ряде других областей теоре- тической физики. Впрочем, такая ситуация возникает уже при решении элементарных задач математической физики с помощыо метода Фурье. Например, при решении уравнения колебаний д2и о д2“ струны ~g^ — a возникают тригонометрические ряды, имею- щие вторые производные по х и по t только в смысле теории обобщенных функций, и значит, удовлетворяющие этому урав- нению тоже только в смысле этой теории. 5. Достаточность запаса основных функций. Мы определили обобщенные функции как линейные функционалы на некотором пространстве — пространстве К финитных бесконечно дифферен- цируемых функций. Можно было бы основное пространство вы- брать и как-либо иначе. Рассмотрим соображения, которые определили выбор К в качестве пространства основных функций. Они применимы и в других случаях. Наложив на элементы из К жесткие требования финитности и бесконечной дифференцируе- мости, мы получили, во-первых, большой запас обобщенных функций (сужение основного пространства приводит, очевидно, к расширению сопряженного пространства), а во-вторых, боль- шую свободу в применении к обобщенным функциям основных операций анализа (предельный переход, дифференцирование). Но вместе с тем пространство основных функций К является не слишком узким. В нем достаточно много элементов для того, чтобы с их помощью можно было различать непрерывные функ-
5 4] ОБОБЩЕННЫЕ ФУНКЦИИ 211 ции. Точнее говоря, пусть fi и — две различные непрерывные (а следовательно, и локально интегрируемые) функции на пря- мой. Тогда существует такая функция <р е К, что оо оо $ f J (х) ср (х) dx ф f2 (х) ср (х) dx. (8) — оо —оо Действительно, положим f(x)=fi(x)—f2(x). Если f(x)^O, то существует такая точка Хо, что f(xo)=/=O. Тогда f(x) сохра- няет знак в некотором интервале (а, 0), содержащем точку Хо- Рассмотрим функцию ф _ J е <P_J£) <*-а) при а < х < 0, ’ 0 при остальных х; эта функция равна нулю вне (а, 0) и положительна внутри это- го интервала; кроме того, она имеет производные всех порядков, так что ср е К (проверьте существование производных в точках х — а и х = 0!). При этом, очевидно, ОО Р f (х) ср (x)dx = f (х) ср (х) dx =/= 0. — оо а Мы показали, таким образом, что пространство К достаточно для различения любых двух непрерывных функций ’). 6. Восстановление функции по производной. Дифференци- альные уравнения в классе обобщенных функций. Дифферен- циальные уравнения — одна из основных областей, где приме- няется теория обобщенных функций. Именно задачи, связанные с уравнениями, в значительной мере и стимулировали развитие этой теории. В основном она применяется к уравнениям в част- ных производных, которые мы здесь не рассматриваем. Однако мы коснемся здесь некоторых простейших вопросов, относящихся к решению (обыкновенных) дифференциальных уравнений с обобщенными функциями. Начнем с простейшего уравнения вида У' = f (к) (f(x)—обобщенная, или «обычная», функция), т. е. с задачи о восстановлении функции по ее производной. Начнем со случая f(x)=O. Теорема 1. Только константы служат решениями (в классе обобщенных функций) уравнения / = 0. (9) ’) Это утверждение можно распространить и на функции, существенно более общие, чем непрерывные, но для этого нужно пользоваться понятием интегрируемости по Лебегу, о чем речь будет идти в следующей главе.
212 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV Доказательство. Уравнение (9) означает, что (/, ф) = (у, — ф') == О (Ю) для любой основной функции <р К. Рассмотрим совокупность /СО) тех основных функций, каждая из которых может быть пред- ставлена как производная какой-то основной функции. Оче- видно, что К<‘) есть линейное подпространство в К. Положим ф!(х)== —ф'(х); функция ф) пробегает К{Г>, когда ф пробегает /С. Равенство (10) определяет функционал у на Заметим теперь, что основная функция ф принадлежит в том и только том случае, если оо ф(х)(/х = 0, (11) — оо оо т. е. есть ядро функционала ф(х)(/х. Действительно, если ф(х) = ф'(х), то оо Ф (х) dx = ф (х) I — 0. (12) -оо “°° Обратно, выражение X ф(х)= ф (f)dt (13) — со есть бесконечно дифференцируемая функция. Если (11) выпол- нено, то ф(х) —финитная функция. Ее производная равна ф(х). В соответствии с результатами п. 6 § 1 гл. III любую основную функцию ф ее /С можно представить в виде Ф = Ф1 + сфо (ф1 <= А’(П), где фо — фиксированная основная функция, не принадлежащая /С*1’ и удовлетворяющая условию ОО Фо(х)б/х = 1. — оо Для этого достаточно положить ОО с — ф (х) dx и ф] (х) = ф (х) — Сф0 (х). — ОО Таким образом, если задать значение функционала у на основной функции фо(х), то тем самым он будет однозначно
ОБОБЩЕННЫЕ ФУНКЦИИ 213- § 4] определен на всем К.. Положив {у, ф0) = а, получим оо оо {у, ф) = {у, Ф1) + с (у, Фо) = а ф (х) dx = аф (х) dx, — оо —оо т. е. обобщенная функция у есть постоянная а, что и. требова- лось доказать. Отсюда следует, что если для двух обобщенных функций f и g выполнено равенство f' = g', то f — g = const. Рассмотрим теперь уравнение y' = f(x\ (14) где f(x) — произвольная обобщенная функция. Теорема 2. Уравнение (14) при каждом f Е К* имеет ре- шение, принадлежащее К*. Это решение естественно назвать первообразной обобщенной функции f. Доказательство. Уравнение (14) означает, что (/, ф) = (У, — ф') = (Л ф) (15) для любой основной функции ф Е К- Это равенство определяет значение функционала у на всех основных функциях ф1 из (X \ f, — J Ф1 Q)rfd. — оо ' Используем теперь полученное выше представление Ф = Ф1 Н- сФо, элементов из К. Положив (у, ф0) = 0, мы доопределим тем са- мым функционал у на всем X; именно, / X Ч 0/, ф) = 0л Ф1) = ( Л — $Ф1(1НИ. X —оо ' Этот функционал, как легко проверить, линеен и непрерывен. Кроме того, он удовлетворяет уравнению (14). Действительно, для всякого ф Е К , X ч (/> ф) = (у, — ф') = (а $ ф' Q) dt,) = (f, ф). X — оо ' Итак, для каждой обобщенной функции f(x) существует реше- ние уравнения У' = f (х),
214 ЛИНЕЙНЫЕ функционалы и линейные операторы [ГЛ. IV т. е. каждая обобщенная функция имеет первообразную. В силу теоремы 1 эта первообразная определяется функцией f(x) одно- значно с точностью до постоянного слагаемого. Полученные результаты легко переносятся на системы ли- нейных уравнений. Ограничимся здесь соответствующими фор- мулировками, опуская доказательства. Рассмотрим однородную систему п линейных дифференциаль- ных уравнений с п неизвестными функциями y'i = S aik (*) У» i=l,2,...,n, (16) £=1 тде atk — бесконечно дифференцируемые функции. Такая систе- ма имеет некоторое количество «классических» решений (т. е. решений, представляющих собой «обычные», причем бесконечно дифференцируемые функции). Можно показать, что никаких но- вых решений в классе обобщенных функций система (16) не имеет. Для неоднородной системы вида У( = а1Ъ.Уь "Ь h* (17) где fi — обобщенные, a aik — «обычные» бесконечно дифферен- цируемые функции, решение существует в классе обобщенных функций и определяется с точностью до произвольного решения однородной системы (16). Если в системе (17) не только а^, но и fi — «обычные» функ- ции, то все решения этой системы, существующие в /<*, также оказываются обычными функциями. 7. Некоторые обобщения. Выше мы рассматривали обобщен- ные функции «одного действительного переменного», т. е. обоб- щенные функции на прямой. Можно, на основе тех же идей, ввести обобщенные функции на ограниченном множестве, ска-, жем, на отрезке или окружности, обобщенные функции несколь- ких переменных, обобщенные функции комплексного аргумента и т. д. Наконец, и для обобщенных функций на прямой то опре- деление, которое было дано выше,—далеко не единственно возможное. Рассмотрим вкратце некоторые из указанных типов обобщенных функций. а) Функции нескольких переменных. Рассмотрим в п-мерном пространстве совокупность Кп функций ф(хь х2, ..., хп), имею- щих частные производные всех порядков по всем аргументам, и таких, что каждая из этих функций равна нулю вне некото- рого параллелепипеда <h^xi^bi, i== I, 2, ..п.
ОБОБЩЕННЫЕ ФУНКЦИИ 215 « <1 Совокупность Кп представляет собой линейное пространство (с обычными операциями сложения функций и умножения их на числа), в котором можно ввести сходимость следующим об- разом: фь-хр, если существует такой параллелепипед а, х, i — 1, 2, ..., п, вне которого каждая из функций <ph равна нулю, а в этом параллелепипеде имеет место равномерная схо- димость: dr<fk дгЧ (v А dxt‘...dxnn dxt‘ ...дхпа Kfz'i / для каждого фиксированного набора целых неотрицательных чисел ои, ..., ап. Обобщенной функцией п переменных называется любой не- прерывный линейный функционал на Кп. Всякая «обычная? функция п переменных Цх), интегрируемая в любой ограничен- ной области «-мерного пространства, есть в то же время и обоб- щенная функция. Значения отвечающего ей функционала опре- деляются формулой (f, ф) = $ f (х) Ф W dx (х = (х,, ..., х„), dx = dxi ... dxn). Как и в случае п — 1 различные непрерывные функции опре- деляют различные функционалы (т. е. представляют собой раз- личные обобщенные функции). Для обобщенных функций п переменных понятия предель- ного перехода, производной и т. д. вводятся с помощью тех же методов, что и в случае одного переменного. Например, частные производные обобщенной функции вводятся формулой Vx,1 ...дхпп ) дх"‘ ...дхпп J Отсюда видно, что каждая обобщенная функция п переменных имеет частные производные всех порядков. б) Комплексные обобщенные функции. Возьмем теперь в ка- честве основных функций бесконечно дифференцируемые финит- ные функции на прямой, принимающие комплексные значения. Линейные функционалы на пространстве К таких функций есте- ственно назвать комплексными обобщенными функциями. На- помним, что в комплексном линейном пространстве существуют линейные и сопряженно-линейные функционалы. Первые удов- летворяют условию (а — число) (А аф) = а(/, ср), а вторые — условию (/, аф) = а (f, ф).
-216 линейные функционалы и линейные операторы [ГЛ. IV Если f(x)—обычная комплекснозначная функция на прямой, то ей можно сопоставить линейный функционал на К двумя способами: ОО (f. ф)|= $ f(x)q>(x)dx — 00 и оо (f, Ф>2 === J f (х)ф(х)</Х. — 00 (18.) (182) Этой же функции f(x) можно сопоставить два сопряженно-ли- нейных функционала, а именно: оо i(f, ф)= J f(x)<p(x)dx — оо и 00 2(Л ф)= $ Г(х)ф(х)</х. — оо (18,) (184) Выбор одной из этих четырех возможностей означает опреде- ленный способ вложения пространства «обычных» функций в пространство обобщенных функций. Операции над комплекс- ными обобщенными функциями определяются аналогично тому, как это было описано выше для действительных функций. в) Обобщенные функции на окружности. Иногда полезно рассматривать обобщенные функции, заданные на некотором ограниченном множестве. В качестве простейшего примера рас- смотрим функции на окружности. За пространство основных функций примем совокупность всех бесконечно дифференцируе- мых функций на окружности, определив для них операции сло- жения и умножения на числа обычным образом. Последователь- ность функций {фп(х)} в этом пространстве мы назовем сходя- щейся, если для каждого k = О, 1, 2, ... последовательность производных {ф(пА) (х)} сходится на всей окружности равномерно. Поскольку здесь все множество аргументов (окружность) огра- ничено, условие финитности основных функций автоматически отпадает. Линейные функционалы на этом пространстве мы на- зовем обобщенными функциями на окружности. Всякую обычную функцию на окружности можно рассматри- вать как периодическую функцию, заданную на всей прямой. Перенося это соображение на обобщенные функции, можно свя- зать обобщенные функции на окружности с периодическими •обобщенными функциями. При этом периодической обобщенной
ОБОБЩЕННЫЕ ФУНКЦИИ 217 5-»] функцией (с периодом а) естественно называть функционал f, удовлетворяющий условию (f(x), ф(х —a)) = (f(x), Ф(х)) для всякой основной функции ф. Примером периодической обоб- щенной функции может служить функция ОО 00 У cos их =— у + л Уд д(х— 2kn), п=1 А=-оо которая уже упоминалась выше. г) Другие основные пространства. Мы определили выше обобщенные функции на прямой как линейные функционалы на пространстве К. бесконечно дифференцируемых финитных функ- ций. Однако такой выбор основного пространства — не един- ственно возможный. Например, вместо пространства финитных функций К можно было бы взять более широкое пространство всех бесконечно дифференцируемых функций <р(х) на прямой, убывающих вместе со своими производными быстрее, чем любая степень 1/|х|. Точнее говоря, будем считать, что ф(х) принад- лежит основному пространству, которое мы обозначим Soo, если для любых фиксированных р, q = О, 1, 2, ... существует такая постоянная Cp,q (зависящая от р, q и ф), что I xV"’ (х) I < Ср, q, — оо<х<оо. (19} Сходимость в STO определяется таким образом: последователь- ность {фп(х)} называется сходящейся к ф(х), если для каждого <7 = 0, 1, ... последовательность {ф^(х)} сходится равномерно на любом конечном интервале и если в неравенствах |хРф(4>(х)| <Ср q постоянные СР, q можно выбрать не зависящими от п. При этом получается запас обобщенных функций несколько более узкий, чем в случае пространства К. Например, функция есть непрерывный линейный функционал на К, но не на S^. Вы- бор Soo в качестве основного пространства удобен, например, при рассмотрении преобразования Фурье обобщенных функций. Вообще, как показало развитие теории обобщенных функций, нет необходимости связывать себя раз и навсегда каким-то определенным выбором основного пространства, а целесообраз- но варьировать его в зависимости от рассматриваемого круга задач. При этом, однако, существенное требование состоит в том, чтобы, с одной стороны, основных функций было «доста- точно много» (чтобы с их помощью можно было различать
218 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV «обычные» функции, а точнее, регулярные функционалы), а с другой, — чтобы эти основные функции обладали достаточной гладкостью. Упражнение. Проверьте, что в пространстве можно ввести струк- туру счетно-нормнрованного пространства, положив, например, II Ф 11л = У, sup I (1 4-1 г |f) Ф(/) (х) I, ₽+«=« и р и что последовательность, сходящаяся в 5<» в определенном выше смысле, сходится и в топологии, определяемой этими нормами. § 5. Линейные операторы 1. Определение и примеры линейных операторов. Пусть Е и Е]—два линейных топологических пространства. Линейным оператором, действующим из £ в Е\, называется отображение у = Ах (х^Е, y^Ei), удовлетворяющее условию А (а*! + 0х2) — a^xi + $Ах2. Совокупность Da всех тех xs Е, для которых отображение А определено, называется областью определения оператора Л; во- обще говоря, не предполагается, что DA = Е, однако мы всегда будем считать, что DA есть линейное многообразие, т. е. если х, у е Da, то ах + pz/ е Da при всех а, р. Оператор А называется непрерывным в точке х0 е DA, если для любой окрестности V точки уо = Ахо существует такая окрестность U точки хо, что Ах е V, как только х е U П DA. Оператор А называется непрерывным, если он непрерывен в ка- ждой точке х е Da- Когда Е и £i — нормированные пространства, это определе- ние равносильно следующему: оператор А называется непре- рывным, если для любого е > 0 существует такое б > 0, что из неравенства ||х' —х"||<6 (x',x"^Da) следует || Ах' — Ах" || < в. Множество тех х е £, для которых Ах = 0, называется ядром линейного оператора А и обозначается КегА. Множество тех у^Е\, для которых у = Ах при некотором хеОд, назы- вается образом линейного оператора А и обозначается 1mA. Как ядро, так и образ линейного оператора, являются линей- ными многообразиями. Если оператор непрерывен и DA = Е, то Кег А является подпространством, т. е. замкнуто. Что же ка-
ЛИНЕЙНЫЕ ОПЕРАТОРЫ 2191 в 51 сается образа непрерывного линейного оператора, то он не обя- зательно будет подпространством в Е\, даже если DA = Е. Понятие линейного функционала, введенное в начале этой главы, есть частный случай линейного оператора. Именно, ли- нейный функционал — это линейный оператор, переводящий дан- ное пространство Е в числовую прямую R1. Определения линей- ности и непрерывности оператора переходят при Ei — R1 в со- ответствующие определения, введенные ранее для функционалов. Точно так же и ряд дальнейших понятий и фактов, излагае- мых ниже для линейных операторов, представляет собой до- вольно автоматическое обобщение результатов, уже изложенных в § 1 этой главы применительно к линейным функционалам. Примеры линейных операторов. 1. Пусть Е — ли- нейное топологическое пространство. Положим 1х = х для всех х е Е. Такой оператор, переводящий каждый элемент пространства в себя, называется единичным оператором. 2. Пусть Е и Е\ — произвольные линейные топологические пространства и пусть Ох = 0 для всех х^Е (здесь 0 — нулевой элемент пространства Ei). Тогда О назы- вается нулевым оператором. 3. Общий вид линейного оператора, переводящего конечно- мерное пространство в конечномерное. Пусть А — линейный опе- ратор, отображающий n-мерное пространство Rn с базисом €i, ..., еп в m-мерное пространство R"1 с базисом fi> • ••, fm- Если х — произвольный вектор из Rn, то х= X xiei, i=l й в силу линейности оператора А п Ах — X XiAet, i=i Таким образом, оператор А задан, если известно, во что он пе- реводит базисные векторы еь ..., еп. Рассмотрим разложения векторов Aei по базису fi, ..., fm. Имеем Aei — S akifk- k=i Отсюда ясно, что оператор А определяется матрицей коэффи- циентов ||ahi||. Образ пространства Rn в Rm представляет собой
220 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV линейное подпространство, размерность которого равна, очевид- но, рангу матрицы ||«Atll, т. е. во всяком случае не превосхо- дит п. Отметим, что всякий линейный оператор, заданный в ко- нечномерном пространстве, автоматически непрерывен. 4. Рассмотрим гильбертово пространство Нив нем некото- рое подпространство Н{. Разложив Н в прямую сумму подпро- странства Н\ и его ортогонального дополнения, т. е. представив каждый элемент h е Н в виде Л==Л1 + Л2 (А, е Я,, h2 ± Я,), положим Ph — h\. Этот оператор Р естественно назвать опера- тором ортогонального проектирования, или ортопроектором Н на Н\. Линейность и непрерывность проверяются без труда. 5. Рассмотрим в пространстве непрерывных функций на от- резке [а, Ь] оператор, определяемый формулой ь Ф (•$) = §/С (•$• О Ф (0 (1) а где K(s, t)—некоторая фиксированная непрерывная функция двух переменных. Функция ф($) непрерывна для любой непре- рывной функции ф(0, так что оператор (1) действительно пере- водит пространство непрерывных функций в себя. Его линей- ность очевидна. Для того чтобы говорить о его непрерывности, необходимо предварительно указать, какая топология рассмат- ривается в нашем пространстве непрерывных функций. Чита- телю предлагается доказать непрерывность оператора в слу- чаях, когда: а) рассматривается пространство С [а, Ь], т. е. про- странство непрерывных функций с нормой || ф || = max | ф (/) |; Г с А7’ б) когда рассматривается Сг[а, А], т. е. ||ф||=| \ф2 (/)(#) • 6. В том же пространстве непрерывных функций рассмотрим оператор Ф (0 = Фо (О Ф (О, где фо(О—фиксированная непрерывная функция. Линейность этого оператора очевидна. (Докажите его непрерывность при нормировках, указанных в предыдущем примере.) 7. Один из важнейших для анализа примеров линейных опе- раторов— это оператор дифференцирования. Его можно рас- сматривать в различных пространствах. а) Рассмотрим пространство непрерывных функций С [а, А] и оператор Df (0 = Г (О,
ЛИНЕЙНЫЕ ОПЕРАТОРЫ 221 5 5] действующий в нем. Этот оператор (который мы считаем дей- ствующим из С [а, Ь] опять-таки в С [а, Ь]) определен, очевидно, не на всем пространстве непрерывных функций, а лишь на ли- нейном многообразии функций, имеющих непрерывную произ- водную. Оператор D линеен, но не непрерывен. Это видно, на- пример, из того, что последовательность сходится к 0 (в метрике С[а, Ь]), а последовательность Z)qp„ (0 = cos и/ не сходится. б) Оператор дифференцирования можно рассматривать как оператор, действующий из пространства С1 непрерывно диф- ференцируемых функций на [а, Ь] с нормой || <р ||, = шах | <р (t) | + max | <р' (t) | в пространство С [а, &]. В этом случае оператор D линеен и не- прерывен и отображает все С1 на все С [а, Ь]. в) Рассмотрение оператора дифференцирования как опера- тора, действующего из С1 в С [а, &], не вполне удобно, так как хотя при этом мы и получаем непрерывный оператор, опреде- ленный на всем пространстве, но не к любой функции из С* можно применить этот оператор дважды. Удобнее рассматри- вать оператор дифференцирования в еще более узком простран- стве, чем С1, а именно, в пространстве С00 бесконечно диффе- ренцируемых функций на отрезке [а, &], в котором топология задается счетной системой норм ||<р||„= sup | ф<*> (f) |. п Оператор дифференцирования переводит все это пространство в себя, и, как легко проверить, непрерывен на нем. г) Бесконечно дифференцируемые функции составляют весь- ма узкий класс. Возможность рассматривать оператор диффе- ренцирования в существенно более широком пространстве и вместе с тем как непрерывный оператор дают обобщенные функции. В предыдущем параграфе мы уже говорили о том, как определяется дифференцирование обобщенных функций. Из сказанного там ясно, что дифференцирование есть линейный оператор в пространстве обобщенных функций, притом непре- рывный в том смысле, что из сходимости последовательности обобщенных функций {fn(0} к НО следует сходимость после- довательности их производных к производной обобщенной функции f(t).
222 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ (ГЛ. IV 2. Непрерывность и ограниченность. Линейный оператор, действующий из Е в Е\, называется ограниченным, если он определен на всем Е и каждое ограниченное множество перево- дит снова в ограниченное. Между ограниченностью и непрерыв- ностью линейного оператора существует тесная связь, а именно, справедливы следующие утверждения. I. Всякий непрерывный линейный оператор ограничен. Действительно, пусть М с Е — ограниченное множество, а множество AMc^Ei не ограничено. Тогда в Е\ найдется такая окрестность нуля V, что ни одно из множеств — AM не содер- жится в V. Но тогда существует такая последовательность хп е М, что ни один из элементов — Ахп не принадлежит V, и мы получаем1), что -±-хп-*0 в Е, но последовательность Ахп } не сходится к 0 в Ef, это противоречит непрерывности оператора А. II. Если А — ограниченный линейный оператор, действующий из Е в Е], и в пространстве Е выполнена первая аксиома счет- ности, то оператор А непрерывен. Действительно, если А не непрерывен, то найдется такая окрестность нуля V в Е\ и такая определяющая система {t/n} окрестностей нуля в Е, что t/n+i cr Un и для каждого п суще- ствует такое х„е-^-Дп, что Axn^nV. Последовательность хп в Е ограничена (и даже стремится к 0), а последовательность Ахп не ограничена в fj (поскольку она не содержится ни в од- ном из множеств nV). Итак, если оператор А не непрерывен, а в Е имеет место первая аксиома счетности, то А и не огра- ничен. Наше утверждение доказано. Итак, для оператора, заданного на пространстве с первой аксиомой счетности (к которым, в частности, относятся все нор- мированные и счетно-нормированные пространства), ограничен- ность равносильна непрерывности. Все операторы, приведенные в примерах 1—6 в предыдущем пункте, непрерывны. В силу только что доказанного утвержде- ния I все перечисленные там операторы ограничены. Если Е и Ei — нормированные пространства, то условие огра- ниченности оператора А, действующего из Е в Е\, можно сфор- мулировать так: оператор А называется ограниченным, если он переводит всякий шар в ограниченное множество. В силу ли- нейности А это условие можно сформулировать так: оператор А >) См. упражнение 1 в п. 1, § 5, гл. III.
4 5) ЛИНЕЙНЫЕ ОПЕРАТОРЫ 223 ограничен, если существует такая постоянная С, что для вся- кого f Е II Af || < С || f И. Наименьшее из чисел С, удовлетворяющих этому неравенству, называется нормой оператора А и обозначается ||Д||. Теорема 1. Для любого ограниченного оператора А, дей- ствующего из нормированного пространства в нормированное, ||Д||= sup || Дх ||= sup ‘Lyi,-. (2) Л х л<1 Х-»ЬО II х II Доказательство. Введем обозначение а = sup ||Ах||. 1*10 В силу линейности А справедливо равенство Поэтому для любого элемента х II Дх ||/|| х || ^ а, т. е. II Дх||<а||х||, откуда следует, что || Д || = inf С<а. Далее, для любого е > О существует такой элемент хе =#= 0, что а —в<|| Дхе ||/|| хе || или (а-8)||хе||<||Дхе||<С||хе||. Поэтому а — в С inf С = || А ||, и, в силу произвольности 8, а ^ || Д ||. Следовательно, || А || = а. 3. Сумма и произведение операторов. Определение 1. Пусть А и В — два линейных оператора, действующих из линейного пространства Е в пространство Et. Назовем их суммой А + В оператор С, ставящий в соответствие элементу хеЕ элемент у = Ах + Вх е Е{. Он определен на всех элементах, принадлежащих пересечению Da П Db областей определения операторов А и В. Легко проверить, что С = АВ— линейный оператор, не- прерывный, если А и В непрерывны. Если Е и Е\—нормированные пространства, а операторы А и В ограничены, то Д + В тоже ограничен, причем ||Д + BIKII Д|| + 1|В||. (3)
224 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV Действительно, для всякого х || (Л + В)х|| = || Ах + Вх || < || Ах || +1| Вх||<(|| А || + 1|В ||)||х||, откуда и следует (3). Определение 2. Пусть А и В — линейные операторы, при- чем А действует из пространства Е в Е{, а В действует из Ej в Е2. Произведением ВА операторов А и В называется оператор С, ставящий в соответствие элементу хеЕ элемент z = B(Ax) из Е2. Область определения Dc оператора С = ВА состоит из тех хеОд, для которых Ax^DB. Ясно, что оператор ВА ли- неен. Он непрерывен, если А и В непрерывны. Упражнение. Доказать, что Dc — линейное многообразие, если DA и Db линейные многообразия. Если А и В — ограниченные операторы, действующие в нор- мированных пространствах, то и оператор ВА ограничен, при- чем ЦВЛ1КЦВ11-||Л||. (4) Действительно, || В (Лх) || < || В || || Ах || < || В || • || Л || • || х ||, (5) откуда следует (4). Сумма и произведение трех и более операторов определяют- ся последовательно. Обе эти операции ассоциативны. Произведение kA оператора Л на число k определяется как оператор, который элементу х ставит в соответствие эле- мент kAx. Совокупность 2?(Е,Е\) всех непрерывных линейных опера- торов, определенных на всем Е и отображающих Е в Ei (где Е и Е\ — фиксированные линейные топологические пространства), образует, по отношению к введенным выше операциям сложе- ния и умножения на числа, линейное пространство. Если Е и Е} — нормированные пространства, то ^(Е, Е})—нормирован- ное пространство (с тем определением нормы оператора, кото- рое было дано выше). Упражнение. Пусть Е—нормированное, а Et— полное нормирован- ное пространства. Тогда: а) нормированное пространство S?(E, £,) полно; ОО оо б) если Ake2(E, Е ) и У || Ak || < со, то ряд £ Ak сходится к некото- к=\ рому оператору А е 2 (Е, Е^ и || Л=1 II л=1 4. Обратный оператор, обратимость. Пусть Л — оператор, действующий из Е в Е\, и DA — область определения, a Im Л — образ этого оператора.
§5] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 225 Определение 3. Оператор А называется обратимым, если для любого уе1тД уравнение Ах = у имеет единственное решение. Если А обратим, то каждому t/elm/l можно поставить в соответствие единственный элемент х е Da, являющийся реше- нием уравнения Ах = у. Оператор, осуществляющий это соот- ветствие, называется обратным к А и обозначается Д-1. Теорема 2. Оператор Д-1, обратный линейному опера- тору А, также линеен. Доказательство. Заметим прежде всего, что образ 1тД оператора Д, т. е. Дл-ь есть линейное многообразие. Пусть yi„ i/jElm/t Достаточно проверить выполнение равенства Д-1 («1//1 + а2у2) = aiA~'y1 + а2А~'у2. (7> Пусть Д%1 — у\ и Ах2 — у2. В силу линейности А имеем А (ал + а2х2) = а^! + а2у2. (8} По определению обратного оператора, A~'yi=Xi, А~1у2 = х2, откуда, умножая эти равенства на ai и а2 соответственно и складывая, получим «1Д-1//1 + а2А~1у2 — сцХ] + а2х2. С другой стороны, из (8) и из определения обратного опера- тора следует, что а,Х! + а2х2 = А~1 (а^ + а2у2), что вместе с предыдущим равенством дает Д-1(а1У1 + а2г/2) = а1Д-11/1 + а2А~1у2. Теорема 3 (теорема Банаха об обратном опера- торе). Пусть А — линейный ограниченный оператор, взаимно однозначно отображающий банахово пространство Е на бана- хово пространство Ei. Тогда обратный оператор Д-1 ограничен. Для доказательства нужна следующая лемма. Лемма. Пусть М — всюду плотное множество в банаховом пространстве Е. Тогда любой ненулевой элемент у^Е можно разложить в ряд У = У\ + У 2 + • • • + Уп, + • • •, где ykf=M и ||ук||<31|у||/2*.
226 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ {ГЛ. (V Доказательство. Элементы ук будем строить последо- вательно: у\ выберем так, чтобы IIУ-Ух II <11 У\№- (9) Это возможно, так как неравенство (9) определяет сферу ра- диуса ||у||/2 с центром в точке у, внутри которой должен най- тись элемент из М (М всюду плотно в Е). Выберем уч е М так, чтобы ||у — ух — у2||IIif 11/4, у3 — так, чтобы ||у — ух — уч — у311 < ||у||/8 и вообще уп выберем так, чтобы ||у— ух — ... —уп|| <11у11/2п. Такой выбор всегда возможен, так как М всюду плот- но в Е. В силу выбора элементов ук п II при п->оо, fe=i II т. е. ряд У, yk сходится к у. Оценим нормы элементов ук-. fe==l II Ух II = II Ух~ У + УII <11 Ух ~ УII + IIУII < 31| у Ц/2, IIУ2II = II У2 + Ух — У + у — Ух II<Н У — Ух — У 2II + IIУ — Ух II< 31| у ||/4. Наконец, II II = II +#п-1 + Л-Ух~ У + У — Ух~ ••• — Уп-1И< <U — Ух— ••• — Уп ll + llif — Ух— ••• —Уп-х II <3||у||/2". Лемма доказана. Доказательство теоремы 3. В пространстве Ех рас- смотрим множество Мк — совокупность тех у, для которых вы- полняется неравенство ||Л-1у||^ &||у||. Всякий элемент простран- оо ства Ех попадает в некоторое Мк, т. е. Et = U Mk. По теореме £=1 Бэра (теорема 2 из п. 3 § 3, гл. II) хотя бы одно из множеств Мк, скажем, Мп, плотно в некотором шаре В. Внутри шара В выберем шаровой слой Р с центром в точке из Мп\ слой Р— это совокупность точек г, для которых справедливо неравенство Р < ||z — yo'll < а, где 0 < р < а, уо е Мп. Перенеся слой Р так, чтобы его центр попал в начало коор- динат, получим шаровой слой Ро — {z :0 -< р <||z||< а}. Покажем, что в Ро плотно некоторое множество MN. Пусть z е Р П Мп-, тогда z — уо е Ро и II Л’1 (z - уо) || < || А~lz I +1| А~ *уо | < п (||г || +1| уо ||) < <n(l|z-yoll + 2||yo||) = n||z-yo||(l + < <л||г-уо1|(1+2||уо||/р), (10)
S 5] ЛИНЕЙНЫЕ ОПЕРАТОРЫ 227 Величина п (1 + 2|| «/о Il/Р) не зависит от z. Положим1) АГ= 1 + и [1 + 2|| уо||/0]. Тогда в силу (10) z — уо^ MN, а из того, что А4П плотно в Р, следует, что A4n плотно в Pq. Рассмотрим произвольный ненулевой элемент у из Е^. Все- гда можно подобрать % так, чтобы было 0 < ||Ху|1 < а, т. е. ХуеРо- Так как плотно в Ро, можно построить последова- тельность yk^MN, сходящуюся к Ьу. Тогда последовательность 4- ук сходится к у. Очевидно, что если yt то и Л ук^ MN при любом действительном Л, =#= 0; таким образом, MN плотно в £iZ{0), а потому и в Рассмотрим ненулевой элемент уеЕь по доказанной лемме его можно разложить в ряд по элементам из Mn: У — У\ + У 2 + • • • + Ук + • • • > причем || ук || < 31| у ||/2*. Рассмотрим в пространстве Е ряд, составленный из прооб- разов элементов ук, т. е. элементов хк = А~1ук- Этот ряд сходится к некоторому элементу х, так как имеет место неравенство 1|х*||=||АЛ*11<ЛГ||у* || < ЗЛГ|| д/11/2*; при этом оо оо 1|х||<£ IIII<ЗЛГ||1/1|£ -Л-= ЗЛГ || у ||. А=1 А=1 2 ОО В силу сходимости ряда У, хп и непрерывности оператора А п=1 можно применить почленно А к этому ряду. Получим Ах = Ах} А-Ах2 А- ••• —У1А~У2~1- • •• — у, откуда х = А~ху. Кроме того, 1|А~'1/11 = 11х||<ЗЛГ||1/||, и так как оценка верна для любого у =/= 0, то с оатор А*г ограничен. Приведем некоторые важные следствия этой теореь. Пре- жде всего дадим ее естественное обобщение на случай, когда отображение А не взаимно однозначно. Следствие 1 (теорема об открытом отображении). Ли- нейное непрерывное отображение А банахова пространства Е 1) Скобки [ ] означают целую часть числа.
228 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV на (все) банахово пространство Е\ открыто. Это вытекает из доказанной теоремы и следующей леммы. Лемма. Пусть Е — банахово пространство и L — некоторое его замкнутое подпространство. Отображение В пространства Е на фактор-пространство Е/L, ставящее в соответствие каждому х Е класс смежности, содержащий х, открыто. Действительно, пусть Z = £/£, a G — открытое множество в £ и Г = BG. Пусть 20еГ. Тогда найдется элемент х0, при- надлежащий B~'z0 П G. Пусть теперь U (х0)— е-окрестность точ- ки Хо, целиком лежащая в G, и пусть z— произвольный элемент Е-окрестности точки 20еГ, т. е. ||z — Zoll< е. В соответствии с определением нормы в фактор-пространстве это означает су- ществование такого элемента xeB-1z, что ||х — х0|| < е, т. е. хе С;(хо)с G. Но тогда z^BG = T, т. е. Е-окрестность точки z0 содержится в Г. Следовательно, Г открыто. Лемма доказана. Представив отображение А пространства £ на Е{ как супер- позицию отображения В пространства £ на £/Ker4 = Z (от- крытого в силу леммы) и взаимно однозначного отображения С пространства Z на Et (открытого в силу теоремы 3), полу- чаем, что А открыто. Следствие 2 (лемма о тройке). Пусть Е, Е\, Е2— бана- ховы пространства и А, В — непрерывные линейные операторы, из Е в Е[ и из Е в Е2 соответственно, причем В отображает Е на все Е2 (т. е. Im В = Е2). Если при этом Кег Л => Кег В, (11) то существует такой непрерывный линейный оператор С, ото- бражающий Ег в Е], что А = СВ. Символически это удобно изобразить такой схемой: в Кег В—>Е —► £2 П II Кег А —> £ —£i Действительно, рассмотрим для каждого элемента ze£2 его полный прообраз B-1ze£. Из условия (11) следует, что все. элементы х, принадлежащие B~lz, переводятся оператором А в один и тот же элемент у. Этот элемент у мы и поставим в со- ответствие элементу z. Полученный оператор С отображает £2 в £i и, очевидно, линеен. Он непрерывен (а следовательно, и ограничен). Действительно, если G — открытое множество в £ь то его полный прообраз C~lG при отображении С может быть яаписан как B(A~1G). Но A'lG открыто в силу непрерывности оператора А, а тогда и В(А~'О) открыто в силу следствия 1.
ЛИНЕЙНЫЕ ОПЕРАТОРЫ 229 $ 5] Упражнения. 1. Пусть Е, Ei— нормированные пространства; линей- ный оператор А, действующий из £ в £,, с областью определения Da cz Е, представляющей собой линейное многообразие, называется замкнутым, если из условий хпеОл, хп->-х, Ахп-*у следует, что xeDa и Ах — у. Про- верьте, что всякий ограниченный оператор замкнут. 2. Рассмотрим прямое произведение £Х£| пространств Е и Еи т. е. ли- нейное нормированное пространство, состоящее из всевозможных пар [х, у], хеЕ, ye=-Et, с нормой || [х, у] || = || х || Д- || у Hi (|| • || и || • II, — нормы в Е, £ соответственно). Оператору А можно сопоставить множество G^={[x, у] xeDA, у — Ах) cz Е X Е}, называемое его графиком. Проверьте, что Ga — линейное многообразие в Е X Elt замкнутое тогда и только тогда, когда опе- ратор А замкнут. Докажите, что если Е, Е,—банаховы пространства, а опе- ратор А определен на всем Е и замкнут, то он ограничен (теорема Банаха о замкнутом графике). Указание. Примените теорему 3 к оператору Р: [х, Лх]->х, действующему из Ga в Е. 3. Пусть Е и £,— полные счетно-нормированные пространства. Докажите, что если А — непрерывный линейный оператор, взаимно однозначно отобра- жающий Е на £ь то обратный оператор А~1 непрерывен. Сформулируйте и докажите теорему о замкнутом графике для счетно-нормированных про- странств. Рассмотрим множество S (Е, Е\) ограниченных линейных •операторов А, отображающих банахово пространство Е в бана- хово пространство Е;. Это — банахово пространство. Выделим в нем множество ^^(Е, £,) операторов, отображающих Е на все Е[ и имеющих ограниченный обратный. Это множество от- крыто в 3?(Е, Е^. Именно, справедлива следующая теорема. Теорема 4. Пусть До е % 2? (Е, ЕД и пусть АД — произволь- ный оператор из S(E,E\) такой, что || АД || < 1/|| Д^1||. Тогда оператор (ДоД-АД)-1 существует и ограничен, т. е. Д = = До Д- АД 6= ЗЗ? (Е, Е^. Доказательство. Фиксируем произвольный элемент y^Ei и рассмотрим отображение В пространства Е в себя, •определяемое формулой Вх = Ао^у — До"1 АДх. Из условия || АД || < || Д711| следует, что отображение В сжи- мающее. Так как Е полно, то существует единственная непо- движная точка х отображения В: х = Вх = Ао'у — Д£' АДх, откуда Дх = Аох Д- АДх = у. Если Ах' = у, то х' — тоже неподвижная точка отображения В, так что х' = х. Таким образом, для всякого у^Е{ уравнение Ах — у имеет в Е единственное решение, т. е. оператор А обла- дает обратным Д'1, определенным на всем Ег. По теореме 3 •оператор Д'1 ограничен, что и требовалось доказать.
239 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV Теорема 5. Пусть Е — банахово пространство, I — тожде- ственный оператор в Е, а А — такой ограниченный линейный, оператор, отображающий Е в себя, что ||Л||< 1. Тогда оператор (/ — Л)-1 существует, ограничен и представляется в виде (1-АГ'^Ак. (12) Доказательство. Существование и ограниченность опе- ратора (/ — Л)'1 вытекает из теоремы 4 (впрочем, это следует также и из приводимого ниже рассуждения). Так как || А || < 1, то Е || Ak ||^ Е || A ||ft < оо. Пространство Е 4=0 4=0 со полно, поэтому из сходимости ряда II Ak II вытекает, что сумма А=0 со ряда Ak представляет собой ограниченный линейный опера- тор. Для любого п имеем (I-А) Е Аь=ХАк(1-А) = /-Ап+‘; k=0 к=0 переходя к пределу при п->оо и учитывая, что ||Дп+1||^ ||Л ||п+1-> 0, получаем (1-А)Е Ak=E Ak(I — A) — I, fe==0 fe=O откуда (I-A)~l=E Ak, 4=0 что и требовалось доказать. Упражнение. Пусть А — ограниченный линейный оператор, отобра- жающий банахово пространство Е на банахово пространство Е\. Докажите, что существует такая постоянная а > 0, что если В ^2?(Е, £|) и Ц4 —ВЦ < < а, то В отображает Е на все Е\ (Банах). 5. Сопряженные операторы. Рассмотрим непрерывный ли- нейный оператор у = Ах, отображающий линейное топологиче- ское пространство Е в такое же пространство Е[. Пусть g— линейный функционал, определенный на Ei, т. е. g^E*. При- меним функционал g к элементу у = Ах; как легко проверить, g(Xx) есть непрерывный линейный функционал, определенный на Е; обозначим его f. Функционал f есть, таким образом, эле- мент пространства Е*. Каждому функционалу g^ Ei мы поста- вили в соответствие функционал f е Е*, т. е. получили некото-
4 5] линейные операторы 231 рый оператор, отображающий Ei в Е*. Этот оператор назы- вается сопряженным к оператору А и обозначается А*. Обозначив значение функционала f на элементе х символом (f, х), получим, что (g, Ах) = (f, х), или (g, Ax) = (A*g, х). Это соотношение можно принять за определение сопряжен- ного оператора. Пример. Сопряженный оператор в конечномерном про- странстве. Пусть действительное «-мерное пространство Rn ото- бражается в пространство Rm (m-мерно'е) оператором А и пусть llajjll—матрица этого оператора. Отображение у = Ах можно записать в виде системы ра- венств п yi=Yailxi, i=i а функционал f(x) —в виде f (*) = Е f/Xj. Из равенства f (*) = g (Лх) = Е giVi = E E gia-ii*! = E E gtait Hl z=l /=1 /=1 Z=1 m получим, что fi = Yi giaih Так как f = A*g, отсюда следует, что оператор А* задается матрицей, транспонированной по отно- шению к матрице оператора А. Следующие свойства сопряженных операторов вытекают сразу из определения. 1. Оператор А* линеен. 2. (Л + В)* = Л* + В*. 3. Если k — число, то (kA) * — kA*. Если А — непрерывный оператор из Е в Еь то А* есть не- прерывный оператор из (Е*,Ь) в (Е*,Ь) (проверьте это!). Если Е и Ei — банаховы пространства, то это утверждение может быть уточнено следующим образом: Теорема 6. Если А — ограниченный линейный оператор, отображающий банахово пространство Е в банахово простран- ство Е], то II л-ц=и и. Доказательство. В силу свойств нормы оператора имеем l№ *)|=H(g, Ах) I<||g||.|| Л||• ||х||,
232 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ и линейные операторы [ГЛ. IV откуда || Д*£|| <|| А || • || g||; следовательно, II А* || <|| А ||. (13) А х Пусть х^Е и Дх =/= 0; положим Уо = 'ц дх ц ^Ер, очевидно, что ||уо||= 1. По следствию из теоремы Хана-Банаха существует такой функционал g, что ||g||= 1 и (g, уо) = 1, т. е. (g,Ax) = = ||Дх||. Из соотношений ||Дх|| = (я, Дх) = |(Д*£, х)|< <1|Д*Я1Ы|х||<11 Д‘||-Ш-||х|| = || Д‘1Ы|х|[ получаем || А ||<|| А* ||, что вместе с неравенством (13) дает II 4*11 = 11 А ||. Теорема доказана. Упражнение. Пусть Е и £, — рефлексивные банаховы пространства и А е S?(E, Ei). Докажите, что А** — А. Следующее утверждение представляет собой еще одно по- лезное следствие теоремы Банаха об обратном операторе. Лемма (об аннуляторе ядра оператора). Пусть А — непре- рывный линейный оператор, отображающий Е на все Elt где Е, Ei — банаховы пространства. Тогда (Ker Д)х = 1т Д*. (14) Действительно, проверим сначала включение (КегД)х дэ1ш Д*. (15) Если /е!тД*, то существует такой элемент g^E], что f = A*g, и для всех х е Кег А имеем: (f, х) = (Д*£, х) = (g, Ах) =0, т. е. /е(КегД)х. Докажем теперь обратное включение: (Кег Д)х<=1шД’. (16) Пусть f е (Кег Д)1. Тогда для отображений f: E->R и A: E->Et выполнены условия леммы о тройке (следствие 2). Поэтому существует такой элемент g <= Е*1г что (f, х) = (g, Ах), т. е. f = A*g. Тем самым включение (16), а значит, и равенства (14) доказаны. 6. Сопряженный оператор в евклидовом пространстве. Само- сопряженные операторы. Рассмотрим случай, когда А — ограни- ченный оператор в гильбертовом пространстве Н (действитель- ном или комплексном). Согласно теореме об общем виде линей-
линейные операторы 233 § 5) кого непрерывного функционала в гильбертовом пространстве отображение т, сопоставляющее каждому у е Н линейный функ- ционал (ту) (х) = (х, у), есть изоморфизм (или сопряженный изоморфизм, если Н ком- плексно) пространства Н на все сопряженное пространство И*. Пусть А*— оператор, сопряженный оператору А. Ясно, что ото- бражение А* — т-1А*т представляет собой ограниченный линей- ный оператор, действующий в Н; легко видеть, что для любых х.у^Н (Ах, у) = (х, А*у). Так как || А* || = || А ||, а отображения т и т-1 изометричны, то II А* II = 11А ||. Все сказанное справедливо, разумеется, и для конечно- мерного евклидова пространства, действительного или ком- плексного. Примем следующее соглашение. Если R — евклидово про- странство (конечной или бесконечной размерности), то опера- тором, сопряженным к действующему в R оператору А, мы на- зовем определенный выше оператор А*, действующий в том ж е пространстве R. Следует подчеркнуть, что это определение отличается от определения сопряженного оператора в произвольном банахо- вом пространстве Е, согласно которому сопряженный оператор А* действует в сопряженном пространстве Е*. Иногда оператор А*, в отличие от А*, называют эрмитово-сопряженным. Чтобы не усложнять терминологии и обозначений, мы будем писать А* вместо А* и говорить о сопряженном операторе, помня, однако, что в евклидовом случае сопряженный оператор всегда по- нимается в смысле, указанном в этом пункте. Ясно, что в евклидовом пространстве R оператор, сопряжен- ный к А, можно определить как такой оператор, который при всех х, у е R удовлетворяет равенству (Ах, у) — (х, А'у). Поскольку операторы А и А* действуют теперь в одном и том же пространстве, возможно равенство А — А*. Выделим важ- ный класс операторов в евклидовом (в частности, гильберто- вом) пространстве. Определение. 4. Ограниченный линейный оператор А, действующий в евклидовом пространстве R, называется само- сопряженным, если А — А*, т. е. если (Ах, у) = (х, Ау) для всех х, у R.
234 линейные функционалы и линейные операторы (ГЛ. IV Отметим следующее важное свойство оператора Д* сопря- женного к оператору Д. Подпространство /?] евклидова про- странства /? называется инвариантным относительно оператора Д, если из вытекает Лхей|. Если подпространство Ri инвариантно относительно А, то его ортогональное дополнение Ri~ инвариантно относительно Д*. Действительно, если у е Ri\ то для всех х <= Ri имеем (х, Д’у) = (Дх, у) = 0, поскольку Дхей|. В частности, если А — самосопряженный оператор, то ортогональное дополнение к любому его инвариант- ному подпространству само инвариантно относительно А. Упражнение. Докажите, что если А и В — ограниченные линейные операторы в евклидовом пространстве, то справедливы равенства: (аД + РВ)’ = аД* + рВ*. (ДВ)’ = В’Д’, (Д’)* = Д, /* = /(/ —единичный оператор). 7. Спектр оператора. Резольвента1). Вряд ли можно указать более важное понятие в теории операторов, чем понятие спектра. Напомним прежде это понятие для конечномерного случая. Пусть А — линейный оператор в n-мерном пространстве Сп. Число X называется собственным значением оператора Д, если уравнение Дх = Лх имеет ненулевые решения. Совокупность всех собственных зна- чений называется спектром оператора А, а все остальные зна- чения Л — регулярными. Иначе говоря, X есть регулярная точка, если оператор А — X/ обратим. При этом (Д—А/)*1 определен на всем Сп и, как и всякий оператор в конечномерном простран- стве, ограничен. Итак, в конечномерном пространстве суще- ствуют две возможности: 1) уравнение Ах — 'Лх имеет ненулевое решение, т. е. X есть собственное значение для Д; оператор (Д — X/)'1 при этом не существует; 2) существует ограниченный оператор (Д — X/)"1, определен- ный на всем пространстве, т. е. X есть регулярная точка. Но если А—оператор, заданный в бесконечномерном про- странстве Е, то имеется еще и третья возможность, а именно: 3) оператор (Д — V)-1 существует, т. е. уравнение Дх = Хх имеет лишь нулевое решение, но этот оператор определен не на всем Е (и, возможно, неограничен). *) Всюду, где речь идет о спектре оператора, мы считаем, что оператор действует в комплексном пространстве.
$5] ЛИНЕЙНЫЕ операторы 235 Введем следующую терминологию. Число X мы назовем регулярным для оператора А, действующего в (комплексном) банаховом пространстве Е, если оператор Ry. = (Д— X/)-,1, называемый резольвентой оператора А, определен на всем Ё и, следовательно (теорема 3), ограничен. Совокупность всех ос- тальных значений X называется спектром оператора А. Спектру принадлежат все собственные значения оператора А, так как если (Д— Х/)х = 0 при некотором х =/= 0, то (Д — X/)-1 не существует. Их совокупность называется точечным спектром. Остальная часть спектра, т. е. совокупность тех X, для которых (Д — V)-1 существует, но определен не на всем Е, называется непрерывным спектром. Итак, каждое значение является для оператора X или регулярным или собственным значением, или точкой непрерывного спектра. Возможность наличия у опера- тора непрерывного спектра — существенное отличие теории опе- раторов в бесконечномерном пространстве от конечномерного случая. Пусть А — ограниченный оператор, действующий в банахо- вом пространстве Е. Если точка X регулярна, т. е. оператор (Д — Й)"1 определен на всем Е и ограничен, то при достаточно малом б оператор (Д—(ХД-б)/)'1 тоже определен на всем Е и ограничен (теорема 4), т. е. точка X Д- б тоже регулярна. Та- ким образом, регулярные точки образуют открытое множество. Следовательно, спектр, т. е. дополнение этого множества, — замкнутое множество. Теорема 7. Если А — ограниченный линейный оператор в банаховом пространстве Е и |Х| >||Д||, то X — регулярная точка. Доказательство. Так как, очевидно, д_ (у_±д), ТО оо ^и-*о-'--4('-4) =-4Е-£- При 11Д1К1М этот ряд сходится и задает определенный на всем Е ограниченный оператор (теорема 5). Иначе говоря, спектр оператора А содержится в круге радиуса ||Д|| с центром в нуле. Примеры. 1. В пространстве С [а, б] рассмотрим опера- тор Д, определяемый формулой Ax(t) = tx(t). (17) Тогда (Д — X/) х (/) = (/ — Л) х (/). Оператор (17) обратим при любом X, так как из равенства (/-Л)х(0 = 0
236 ЛИНЕЙНЫЕ функционалы и линейные операторы 1ГЛ. IV следует, что непрерывная функция x(t) тождественно равна нулю. Однако при X е [а, 6] обратный оператор, задаваемый формулой (Д-Л/)-1х(0 = 7^тх(0 определен не на всем С[а, 6] и неограничен. (Докажите это!) Таким образом, спектр оператора (17) представляет собой отре- зок [а, Ь], причем собственные значения отсутствуют, т. е. имеет- ся лишь непрерывный спектр. 2. Рассмотрим в пространстве /г оператор А, определяемый следующим образом: А: (хь х2, (О, хь х2, ...). (18) Этот оператор не имеет собственных значений. (Докажите это!) Оператор А~' ограничен, но определен в /2 лишь на подпро- странстве Х| = 0, т. е. X = 0 есть точка спектра оператора. Упражнения. Содержит ли спектр оператора (18) какие-либо точки, кроме X = О? Замечания. (1) Всякий ограниченный линейный оператор, опреде- ленный в комплексном банаховом пространстве, имеющем хотя бы один от- личный от нуля элемент, имеет непустой спектр. Существуют операторы, у которых спектр состоит из единственной точки (например, оператор умно- жения на число). (2) Теорема 7 может быть уточнена следующим образом. Пусть п____________________________________ г = lim V|| Ап || П-»о° (можно доказать, что этот предел существует для любого ограниченного оператора А), тогда спектр оператора А целиком лежит в круге радиуса г с центром в нуле. Величина г называется спектральным радиусом опера- тора А. (3) Резольвентные операторы и /?х, отвечающие точкам ц и X, пере- становочны между собой и удовлетворяют соотношению которое легко проверить, умножив обе части этого равенства на (А — XZ) (А — р7). Отсюда вытекает, что если Хо— регулярная точка для А, то производная от по X при X = Хо, т. е. предел lim 7?x»+ax-T_^j_[ ДХ->О ДХ существует (в смысле сходимости по операторной норме) и равна Rlo. Упражнение. Пусть А — ограниченный самосопряженный оператор’ в комплексном гильбертовом пространстве Н. Докажите, что его спектр есть замкнутое ограниченное подмножество действительной оси.
КОМПАКТНЫЕ ОПЕРАТОРЫ 237 § 6] § 6. Компактные операторы 1. Определение и примеры компактных операторов. В отли- чие от линейных операторов в конечномерных пространствах, для которых имеется исчерпывающее описание, изучение произ- вольных линейных операторов в бесконечномерных простран- ствах представляет собой весьма сложную и, по существу, не- обозримую задачу. Однако некоторые важные классы таких опе- раторов могут быть описаны полностью. Среди них один из важнейших образуют так называемые компактные опера- торы. Эти операторы, с одной стороны, близки по своим свой- ствам к конечномерным (т. е. ограниченным операторам, пере- водящим данное пространство в конечномерное) и допускают достаточно детальное описание, а с другой, играют важную роль в различных приложениях, в первую очередь в теории ин- тегральных уравнений, которым будет посвящена гл. IX. Определение 1. Оператор А, отображающий банахово пространство Е в себя (или другое банахово пространство ЕД, называется компактным, или вполне непрерывным, если он ка- ждое ограниченное множество переводит в предкомпактное. В конечномерном нормированном пространстве всякий линей- ный оператор компактен, поскольку он переводит любое огра- ниченное множество в ограниченное, а в конечномерном про- странстве всякое ограниченное множество предкомпактно. В бесконечномерном пространстве компактность оператора есть требование существенно более сильное, чем просто его не- прерывность (т. е. ограниченность). Например, единичный опе- ратор в гильбертовом пространстве непрерывен, но отнюдь не компактен. (Докажите это независимо от рассматриваемого ниже примера 1.) Рассмотрим некоторые примеры. 1. Пусть / — единичный оператор в банаховом пространстве Е. Покажем, что если Е бесконечномерно, то оператор / не ком- пактен. Для этого достаточно, очевидно, показать, что единич- ный шар в Е (который, разумеется, переводится оператором I в себя) не предкомпактен. Это в свою очередь вытекает из следующей леммы, которая нам понадобится и в дальнейшем. Лемма 1. Пусть xly хг, ... линейно независимые векторы в нормированном пространстве Е и пусть Еп — подпространство, порожденное векторами Xj, ..., хп. Тогда существует последо- вательность векторов у\, у %, . . ., удовлетворяющая следующим условиям: 1) Un 11=1; 2) ;/„e£rt; 3) р(уп, Е„_,) > 1/2, где р(уп, Еп-[)—расстояние вектора уп от En-i, т. е. inf \\уп — х ||. х е £п-1
238 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ ГГЛ. IV Доказательство. Действительно, так как векторы хц Х2, ... линейно независимы, то xn^En-i и p(xn, En-i) = а > 0. Пусть х*— такой вектор из En-ь что ||хп — х*|| < 2а. Тогда, по- скольку а = р(хп, Еп-1) = р(*п — х*, En-i), вектор удовлетворяет всем условиям 1)—3). За у\ при этом можно взять Xi/llxJI. Лемма доказана. Пользуясь этой леммой, в единичном шаре всякого бесконеч- номерного нормированного пространства можно построить по- следовательность векторов {уп}, для которой p(yn-i, уп) > 1/2. Ясно, что такая последовательность не может содержать ника- кой сходящейся подпоследовательности. А это и означает отсут- ствие предкомпактности. 2. Пусть А — непрерывный линейный оператор, переводящий банахово пространство Е в некоторое его конечномерное под- пространство. Такой оператор компактен, поскольку он перево- дит всякое ограниченное подмножество М с: Е в ограниченное подмножество конечномерного пространства, т. е. в предком- пактное множество. В частности, в гильбертовом пространстве оператор ортого- нального проектирования на подпространство компактен в том и только том случае, если это подпространство имеет конечную размерность. 3. Рассмотрим в пространстве /2 оператор А, определенный следующим образом: если х = (хь х2, .... хп, ...), то Ах = (хь |х2, ..., ^хв> (1) Этот оператор компактен. Действительно, поскольку всякое ограниченное множество из /г содержится в некотором шаре этого пространства, достаточно доказать, что образы шаров предкомпактны, а в силу линейности оператора достаточно про- верить это для единичного шара. Но оператор (1) переводит единичный шар пространства /г в множество точек, содержа- щееся в основном параллелепипеде (см. гл. II, § 7, п. 1). Следо- вательно, это множество вполне ограничено, а значит, и пред- компактно. Упражнение. Пусть Ах = (щх;, a2Xi, .... апхп, • • •); при каких ус- ловиях на последовательность чисел {ап} этот оператор в /2 компактен? 4. В пространстве непрерывных функций С [а, 6] важный класс компактных операторов образуют операторы, представимые
S 61 КОМПАКТНЫЕ ОПЕРАТОРЫ 239 в виде Ах = у (s) = (s, t)x (t) dt. (2) a Покажем справедливость следующего утверждения: если функция K(s,t) ограничена на квадрате a^s^b, a^.t^.b и все ее точки разрыва лежат на конечном числе кривых t — ((>k(s), k—l, 2, ..., п, где <pft — непрерывные функции, то формула (2) определяет в пространстве С [а, Ь] компактный оператор. Действительно, заметим, прежде всего, что в указанных ус- ловиях интеграл (2) существует для любого s из отрезка [а, Ь], т. е. функция y(s) определена. Далее, пусть М— sup | (s, t) | а С s, t < Ь и пусть G — множество тех точек (s, t), для которых хотя бы при одном k — 1, 2, ..., п выполняется неравенство Следом G(s) этого множества на каждой прямой s = const слу- жит объединение интервалов п . G (s) = Д {11 — <р4 (s) | < . Пусть F — дополнение множества G до квадрата а s, t b. Так как F компактно, а функция /Cfs, t) непрерывна на F, то существует такое б > 0, что для любых точек (s', t'), (s", t") из F, удовлетворяющих усло- вию |s'-s"| + |f— f'|<6. (3) Оценим теперь разность y(s')—y(s") в предположении, что | s' — s" | < 6. Имеем ь | у (s')-y(s")K $ I /С (s', t) || x(t)\df, a для оценки стоящего справа интеграла разобьем промежуток интегрирования [а, б] на объединение интервалов G(s')U G(s"), которое обозначим Р, и остальную часть отрезка [а, б], которую
240 линейные функционалы и линейные операторы [ГЛ. IV обозначим Q. Заметив, что Р есть объединение интервалов, сум- марная длина которых не превосходит е/(ЗА1), получаем 0-K(s", 011х(01Л <-у1И|. р Интеграл по Q допускает, очевидно, оценку ?IK(s', 0-K(s", 0 || x(t)\dt < |||х||. Q Таким образом, If/(s') — f/(s")l<e||x||. (4) Неравенство (4) показывает, что функция y(s) непрерывна, т. е. формула (2) действительно определяет оператор, переводя- щий пространство С [а, 6] в себя. Далее, из того же неравенства видно, что если {х(£)} — ограниченное множество в С[а, 6], то соответствующее множество {«/(«)} равностепенно непрерывно. Наконец, если ||х|| С, то ъ II у\\ = sup | t/(s) |<sup ^| К(s, t) II x(t)\dt^M(b — a) ||x||. a Таким образом, оператор (2) переводит всякое ограниченное множество из С [а, 6] в множество функций, равномерно ограни- ченное и равностепенно непрерывное, т. е. предкомпактное. 4а. Расположение точек разрыва функции K(s,t) на конеч- ном числе кривых, пересекающих прямые s = const лишь в од- ной точке, существенно. Пусть, например, ( 1 при $ < 1/2, K(s, 0 = 1 п '/0 (.0 при s^l/2; оператор (2) с таким ядром, заданным на квадрате 0 s, t 1 и имеющим точками разрыва весь отрезок s — 1/2, 0 t 1, переводит функцию х(/)= 1 в разрывную функцию. 46. Если положить A(s, t) = 0 при t > s, то оператор (2) примет вид S y(s)= t)x(t)dt. (5) а Будем считать, что функция /<(«,/) непрерывна при / < s; то- гда из сказанного в примере 4 следует, что оператор (5) вполне непрерывен в С [а, 6].
5 6] КОМПАКТНЫЕ ОПЕРАТОРЫ 241 Этот оператор называется оператором типа Вольтерра1). Замечание. При принятом нами определении компактного оператора может оказаться, что образ замкнутого единичного шара некомпактен (хотя он предкомпактен). Действительно, рассмотрим в пространстве С[—1, 1] оператор интегрирования S Jx(s)= x(f)dt\ -1 по доказанному выше, J — вполне непрерывный оператор в С[—1, 1]. Положим ' о, если - 1 =S Xn(t) = ' nt, если 0 <t 1/«> 1, если 1/п < Тогда хп е С[—1, 1], ||хп|| = 1 для всех п и ' 0, если — 1 <0, уп (/) = Jxn (t) = - nt2!?., если 0</^l/n, . t—l/(2n), если l/n<f<l. Ясно, что последовательность уп сходится в С[—1, 1] к функции ( 0, если — t t, если 0 < t 1, которая не является образом (при отображении J) никакой функции из С[—1, 1], ибо функция y'(t) разрывна. Однако можно доказать, что если пространство рефлексивно (например, гильбертово), то образ замкнутого единичного шара при компактном линейном отображении компактен. 2. Основные свойства компактных операторов. Теорема 1. Если {Дп}—последовательность компактных операторов в банаховом пространстве Е, сходящаяся по норме к некоторому оператору А, то оператор А тоже компактен. Доказательство. Для установления компактности опе- ратора А достаточно показать, что, какова бы ни была ограни- ченная последовательность Xi, х2, ..., хп, ... элементов из Е, из последовательности {Дхп} можно выделить сходящуюся под- последовательность. Так как оператор Xi компактен, то из последовательности {Д]ХП} можно выбрать сходящуюся подпоследовательность. Пусть я?’, Ч”....• • • (6) ]) Вито Вольтерра — итальянский математик, автор ряда работ по функ- циональному анализу и интегральным уравнениям.
242 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ 1ГЛ. IV — такая подпоследовательность, что {^х®} сходится. Рассмот- рим теперь последовательность Из нее опять-таки мож- но выбрать сходящуюся подпоследовательность. Пусть х®, х®, .... х®, ... — такая подпоследовательность, выбранная из (6), что сходится. При этом, очевидно, {Л*®} тоже сходится. Рассуждая аналогично, выберем из последовательности {х®} такую под- последовательность X®, х®, ..., х®, что {Л3х®} сходится, и т. д. Возьмем затем диагональную после- довательность х®, х®, ..., х£>, .... Каждый из операторов А1г А2, ..., Ап, ... переводит ее в сходя- щуюся. Покажем, что и оператор А тоже переводит ее в сходя- щуюся. Тем самым компактность А будет установлена. Так как пространство Е полно, то достаточно показать, что {Лх^}— фундаментальная последовательность. Имеем | АхМ - Ах^ || < || Ах<*> - Akx™ || + + II ~ II + IIW ~ II- (П Пусть ||хп|| С; выберем сначала k так, что ||Л—Дй|| < е/(ЗС), а потом выберем такое N, чтобы при всех п> N и т> N вы- полнялось неравенство Il II <8/з (это возможно, так как последовательность {A^x^j сходится). При этих условиях из (7) получаем, что || Ах<»>-Ах™ || <8 для всех достаточно больших п и т. Теорема доказана. Легко проверить, что линейная комбинация компактных опе- раторов компактна. Следовательно, в пространстве 3? (Е, Е) всех ограниченных линейных операторов, определенных на Е, компактные операторы образуют замкнутое линейное подпро- странство. Посмотрим теперь, будет ли совокупность компактных опе- раторов замкнута относительно операции перемножения опера- торов. На самом деле здесь справедливо даже существенно бо- лее сильное утверждение.
9 61 КОМПАКТНЫЕ ОПЕРАТОРЫ 243 Теорема 2. Если А — компактный оператор, а В — ограни- ченный, то операторы АВ и ВА компактны. Доказательство. Если множество М а Е ограничено, то ВМ тоже ограничено. Следовательно, АВМ предкомпактно, а это и означает, что оператор АВ компактен. Далее, если М огра- ничено, то AM предкомпактно, а тогда, в силу непрерывности В, множество ВАМ тоже предкомпактно, т. е. оператор ВА ком- пактен. Теорема доказана. Следствие. В бесконечномерном пространстве Е компакт- ный оператор не может иметь ограниченного обратного. Действительно, иначе единичный оператор I — А~'А был бы компактен в Е, что невозможно (см. пример 1). Замечание. Теорема 2 показывает, что компактные операторы образуют в кольце всех ограниченных операторов SE (Е, Е) двусторонний идеал '). Теорема 3. Оператор, сопряженный компактному, ком- пактен. Доказательство. Пусть А—компактный оператор в банаховом пространстве Е. Покажем, что сопряженный опера- тор А*, действующий в Е*, переводит каждое ограниченное под- множество из Е* в предкомпактное. Поскольку всякое ограни- ченное подмножество нормированного пространства содержится в некотором шаре, достаточно показать, что А* переводит ка- ждый шар в предкомпактное множество. В силу линейности опе- ратора А* достаточно показать, что образ A*S* замкнутого еди- ничного шара S*aE* предкомпактен. Будем рассматривать элементы из Е* как функции не на всем пространстве Е, а лишь на компакте AS— замыкании об- раза единичного шара при отображении А. При этом множе- ство Ф функций, отвечающих функционалам из 5*, будет равно- мерно ограничено и равностепенно непрерывно. Действительно, если ||<р|| 1, то sup | <р (х) [ == sup | <р (х) КII <р II sup || Ах||<|| А|| х s AS х е AS х е S И | ф (х') - ф (х") |< II ф || • || х' - х" II < II х' - х" II. Следовательно, это множество Ф предкомпактно в простран- стве С[Д5] (в силу теоремы Арцела). Но множество Ф с метри- кой, индуцированной обычной метрикой пространства непрерыв- ных функций С [AS], изометрично множеству A*S* (с метрикой, ) Идеалом (двусторонним) в некотором кольце R называется такое под- кольцо Ц, что если ае Ц, г е R, то аге U и гаеЦ.
244 ЛИНЕЙНЫЕ функционалы и линейные ОПЕРАТОРЫ [ГЛ. IV индуцированной нормой пространства £*). Действительно, если gi,g2eS*, то II A'g\ — A'g21|= sup | (Д*^ — A*g2, x) | = xeS = sup | (gt — g2, Ax) |= sup | (gt — g2, z)\ = x S z e AS = sup_| (gt - g2, z)| = p(gb g2). z <= AS Поскольку Ф предкомпактно, то оно вполне ограничено; следо- вательно, вполне ограничено и изометричное ему множество Д*5*. Поэтому Д*5* предкомпактно в Е*. Теорема доказана. Замечание. Нетрудно проверить, что множество Ф замк- нуто в С[XS], так что оно компактно, поэтому компактно и мно- жество Д*5*, хотя (как это видно из замечания на стр. 241) образ замкнутого единичного шара при произвольном вполне непрерывном отображении может не быть компактом. Ситуация в только что доказанной теореме отличается от общей тем, что замкнутый единичный шар 5* в Е* компактен в «-слабой топо- логии пространства Е* (см. теорему 5 § 3). Отсюда и следует компактность (в метрике пространства £*) образа множества 5* для любого компактного оператора. Упражнения. 1. Пусть А — ограниченный линейный оператор в ба- наховом пространстве. Докажите, что если оператор А* компактен, то и Л компактен. 2. Для того чтобы линейный оператор А в гильбертовом пространстве Н был компактен, необходимо и достаточно, чтобы (эрмитово) сопряженный к нему оператор Л* был компактен. 3. Собственные значения компактного оператора. Теорема 4. Всякий компактный оператор А в банаховом пространстве Е имеет при любом 6 > 0 лишь конечное число линейно независимых собственных векторов, отвечающих соб- ственным значениям, по модулю превосходящим 6. Доказательство. Пусть А], А2, ..., Ап, ... какая-либо по- следовательность собственных значений операторах (различных или с повторениями) таких, что |А„| > б; Xi, х2, ..., хп, ...— отвечающая им последовательность собственных векторов, и пусть эти векторы линейно независимы. Воспользуемся леммой 1 (стр. 237) и построим такую после- довательность векторов yi, у2, ..., уп, .. что 1) уп^Еп, 2) || уп ||=1; 3)р (уп, Еп—Х) — inf || уп - х || > 1/2, х е Еп-1 где Еп — подпространство, порожденное Xi, х2, .. ., хп.
5 6] КОМПАКТНЫЕ ОПЕРАТОРЫ 245- Последовательность {} ограничена в силу неравенства Хп|>6. Мы утверждаем, что из последовательности образов ' ^(х-)} нельзя выбрать сходящуюся. Действительно, пусть- п, Уп — Е “Л тогда fe=l л(4г)=Е ~хгXk+=Уп+Znt fe=l где п—1 гп=Еа* k=! 1) xk <= к Поэтому при любых р> q IЛ (77) — А (77) I= 'I Ур + Zp ~ "1“ Zp) II = II УР — (yq + zq — zp} || > 1/2, поскольку yq + Zq — Zp Ep-{. Это противоречит компактности оператора А. Из доказанной теоремы, в частности, вытекает, что число- линейно независимых собственных векторов, отвечающих дан- ному собственному значению X #= О компактного оператора Д, конечно. Из этой теоремы следует также, что число собственных зна- чений Хп компактного оператора А во внешности круга |Х| > > 6 > 0 всегда конечно, и что все собственные значения опера- тора А можно перенумеровать в порядке невозрастания моду- лей: | Xi | | Хг| • • • 4. Компактные операторы в гильбертовом пространстве. Выше мы говорили о компактных операторах в произвольном банаховом пространстве. Сейчас мы дополним эти сведения не- которыми фактами, относящимися к компактным операторам в- гильбертовом пространстве. Мы назвали оператор А компактным, если он переводит вся- кое ограниченное множество в предкомпактное. Поскольку Н — Н*, т. е. Н есть пространство, сопряженное к сепарабель- ному, в нем все ограниченные множества (и только они) слабо предкомпактны. Следовательно, в гильбертовом пространстве компактный оператор можно определить как оператор, перево- дящий всякое слабо предкомпактное множество в множество, предкомпактное в сильной топологии.
246 ЛИНЕЙНЫЕ функционалы и линейные операторы (ГЛ. IV Наконец, в некоторых случаях удобно еще и такое определе- ние компактности оператора в гильбертовом пространстве: опе- ратор А называется компактным в И, если он всякую слабо сходящуюся последовательность переводит в сильно сходящую- ся. Действительно, пусть это последнее условие выполнено и пусть М — ограниченное множество в И. Каждое бесконечное подмножество множества М содержит слабо сходящуюся после- довательность. Если она переводится в сильно сходящуюся по- следовательность, то AM предкомпактно. Обратно, пусть А — компактный оператор, {хп} — слабо сходящаяся последователь- ность и х — ее слабый предел. Тогда {Дхп} содержит подпосле- довательность, сходящуюся сильно. В то же время {Дхп} схо- дится слабо, в силу непрерывности А, к Ах, откуда следует, что {Ахп} не может иметь более одной предельной точки. Следова- тельно, {Ахп} —сходящаяся последовательность. 5. Самосопряженные компактные операторы в Н. Для само- сопряженных линейных операторов в конечномерном евклидо- вом пространстве известна теорема о приведении матрицы та- кого оператора к диагональной форме в некотором ортогональ- ном нормированном базисе. В этом пункте мы распространим эту теорему на компактные самосопряженные операторы в гиль- бертовом пространстве. Результаты этого пункта справедливы как для действительного, так и для комплексного гильбертова пространства. Для определенности будем считать, что Н ком- плексно. Установим прежде всего некоторые свойства собственных векторов и собственных значений самосопряженных операторов в Н, вполне аналогичные, впрочем, соответствующим свойствам конечномерных самосопряженных операторов. I. Все собственные значения самосопряженного оператора А в Н действительны. В самом деле, пусть Ах = Кх, ||х|| =/= 0, тогда Х(х, х)==(Дх, х) = (х, Ах) = (х, Хх) = Х(х, х), -откуда X = X. II. Собственные векторы самосопряженного оператора, отве- чающие различным собственным значениям, ортогональны. Действительно, если Ах — Хх и Ау = ру, причем X =/= ц, то Ь (х, у) = (Ах, у) == (х, Ау) = (х, ру) = и (х, у), откуда (х, у) = 0. Докажем теперь следующую фундаментальную теорему. Теорема 5 (Гильберт — Шмидт). Для любого ком- пактного самосопряженного линейного оператора А в гильберто- вом пространстве Н существует ортогональная нормированная еистема {фп} собственных векторов, отвечающих собственным
«6} КОМПАКТНЫЕ ОПЕРАТОРЫ 24Г значениям {Хп} (Хп =£ 0), такая, что каждый элемент запи- сывается единственным образом в виде 5 = S ck4>k + &'> А где вектор Кег-А, т. е. удовлетворяет условию А£'.— 0; при- этом S ^асаФа k и если система {q>n} бесконечна, то limXn = 0 (п->оо). Для доказательства этой основной теоремы нам понадобятся» следующие вспомогательные утверждения. Лемма 2. Если {£п} слабо сходится к £ и линейный опера- тор А компактен, то Q(U = (^„, U ->« $ = Q®. ' Доказательство. Для всякого п I (Aln, & - (А1-, I) |<| (Aln, U - (Л£, у | +1« Ы - (Al, I) |, Но I (А1-п, Е„) - « 1п) |< || £„ || || Л (£„ - g) || и I (Aln, 1) - (А1-, g) | = | (g, А (£„ - £)) |< || £ || • || А (£„ - g) И, и так как числа ||£га|| ограничены, а || Л(£п — £) ||-*0, то 1(л?„, и-(Д, Ю1-*о, что и требовалось доказать. Лемма 3. Если функционал । Qa) i=i ns, g)i, где А — ограниченный самосопряженный линейный оператор, достигает на единичном шаре максимума в точке go, то из (go, tj) = 0 вытекает, что И5о, n) = (U ЛП) = 0. Доказательство. Очевидно, llgoll = 1. Положим t— Ео + дп V1 + I « I2 II nil2 ’ где а — произвольное комплексное число. Из ||g0|| = 1 следует, что 11111=1. Далее Q(?) = 1 + |Л~йн2 IQ(5о) + 5+ а+1аWL
248 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV Число а можно взять сколь угодно малым по модулю и таким, что а(А%о, и) —действительная величина. Тогда a(Ago, л) = = a (Ago, л) и Qm = Q(y + 2a(AU л) + О (а2). Из последнего равенства ясно, что если (Ago, л) =#= 0, то а можно выбрать так, что | Q(£) | > | Q(£o) |, а это противоречит условию леммы. Из леммы 3 непосредственно вытекает, что если |Q(g) | до- стигает максимума при g = go, то go есть собственный вектор оператора. Доказательство теоремы 5. Будем строить элементы <рь по индукции, в порядке убывания абсолютных величин соот- ветствующих им собственных значений: | %11 | %2 I I I • • • Для построения элемента tpi рассмотрим выражение/|Ф(Ю! — — | (Ag, g) | и докажем, что оно на единичном шаре достигает максимума. Пусть S= sup | (Ag, g)| I J I < 1 и g], g2, — такая последовательность, что ||gn|| = 1 и I (А£л, UI-*S при n-»oo. Так как единичный шар в Н слабо компактен, то из {gn} можно выбрать подпоследовательность, слабо сходящуюся к некоторо- му элементу ц. При этом ||т]|| 1 и в силу леммы 2 | (Ац, т]) 1 = 5. Элемент i] мы и примем за <р|. Ясно, что || л II в точности рав- няется 1. (Действительно, пусть ||ц||<1; положим Л| = л/11л11; тогда ||т]|||—1 и | (Ат),, Л1) | > S, что противоречит определе- нию S.) При этом Aq^^cpi, откуда Пусть теперь собственные векторы <Р1, <р2, • • •, фп, отвечающие собственным значениям Aq, ^-2, • • • 1 уже построены, Пусть M(q>i, <р2, Фп) — подпространство натянутое на <рь <р2> •••> фп- Рассмотрим функционал I (AL £) I
КОМПАКТНЫЕ ОПЕРАТОРЫ 249 «6] на совокупности элементов, принадлежащих <р2, .... <рп) (т. е. ортогональных фь ф2, . • •, фп) и удовлетворяющих усло- вию Ш<1. Множество Мп есть подпространство, инвариант- ное относительно А (так как подпространство М(фь.ф2..фп) инвариантно и А самосопряжен). Применяя к М„ проведенные выше рассуждения, получим, что в М„ найдется вектор (обо- значим его фп+i), собственный для оператора А. Возможны два случая: 1) после конечного числа шагов мы получим подпространством^,, в котором (Л£, £) =0; 2) (Д£, £) 0 на Мп при всех п. В первом случае из леммы 3 вытекает, что переводится оператором А в нуль (положите т] = Л£0), т. е. целиком состоит из собственных векторов, отвечающих X = 0. Система построен- ных векторов {фп} состоит из конечного числа элементов. Во втором случае получаем последовательность {фп} соб- ственных векторов, для каждого из которых Хп =# 0. Покажем, что Хп-> 0. Последовательность {фп} (как и всякая ортогональ- ная нормированная последовательность) слабо сходится к нулю, поэтому элементы Дфп = Хпфп должны сходиться к нулю по норме, откуда | Xn | = IIА<рп II -> 0. Пусть М^яеАЦфь <р2, •••, <Р„, ...)=п^ =#0. п Если и £ =#= 0, то (Л£, УСХпНЦ2 для всех п, т. е. (Л£, £) = 0. Отсюда в силу леммы 3 (при тах| (Д£, £) | =0), при- мененной к М1 получаем At, = 0, т. е. подпространство М1 пе- реводится оператором А в нуль. Из построения системы {фп} ясно, что всякий вектор можно представить в виде £ = Е СаФа + I', где А£' = 0 откуда вытекает, что А%> Е ^г^ф^. Теорема доказана. Эта теорема играет фундаментальную роль в теории интегральных уравнений, о которых будет идти речь в гл. IX. Замечание. Доказанная теорема означает, что для вся- кого компактного самосопряженного оператора А в Н суще- ствует ортогональный базис пространства Н, состоящий из соб- ственных векторов этого оператора. Действительно, для получе-
~2б0 ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV ния такого базиса достаточно дополнить построенную в доказа- тельстве теоремы систему собственных векторов {<рп} произволь- ным ортогональным базисом подпространства Af1 переводимого оператором А в нуль. Иными словами, здесь получается резуль- тат, вполне аналогичный теореме о приведении матрицы конеч- номерного самосопряженного оператора к диагональному виду в ортогональном базисе. Для несамосопряженных операторов в n-мерном простран- стве такое приведение, вообще говоря, невозможно, однако вер- на следующая теорема: всякое линейное преобразование в п-мер~ лом пространстве имеет хотя бы один собственный вектор. Не- трудно убедиться, что это утверждение не переносится на ком- пактные операторы в Н. Действительно, пусть оператор А задан в /2 формулой Ax = A(xlt х2...ха, = х„ ......................•)• (8) Этот оператор компактен (проверьте!), но не имеет йи одного собственного вектора (докажите это). Упражнение. Найдите спектр оператора (8).
ГЛАВА V МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ Понятие меры р(А) множества А является естественным' обобщением понятий: 1) длины Z(A) отрезка Д, 2) площади S (F) плоской фигуры F, 3) объема У(б) пространственной фигуры G, 4) приращения <р(&)—<р(а) неубывающей функции <р(/) на- полуинтервале[а, &), 5) интеграла от неотрицательной функции, взятого по неко- торой линейной, плоской или пространственной области, и т. п. Это понятие возникло в теории функций действительного пе- ременного, а оттуда перешло в теорию вероятностей, теорию ди- намических систем, функциональный анализ и многие другие области математики. В § 1 этой главы мы изложим теорию меры для множеств на плоскости, отправляясь от понятия площади прямоугольника. Общая теория меры будет изложена в §§ 2 и 3. Читатель легко заметит, что все рассуждения, проведенные в § 1, имеют общий, характер и в абстрактной теории повторяются без существенных изменений. § 1. Мера плоских множеств 1. Мера элементарных множеств. Рассмотрим систему & множеств на плоскости (х, у), каждое из которых определяете»; одним из неравенств вида а^х^б, а^х < Ь, а <х^Ь, а<х <Ь и одним из неравенств вида с с < У < d, с^у <d с < у <d где а, Ь, с и d — произвольные числа. Множества, принадлежа-, щие этой системе, мы будем называть прямоугольниками. Замк-. нутый прямоугольник, определяемый неравенствами а^х^б, суd,
•252 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ (ГЛ. V представляет собой прямоугольник в обычном смысле (вместе с границей), если а < b и с <Zd, отрезок (если а = Ь и с <Zd или а < b и c = d), точку (при а = b, с = d) и, наконец, пу- стое множество (если а > b или с > d). Открытый прямоуголь- ник а <х <Ь, с < у <d •будет в зависимости от соотношения между а, Ь, с и d прямо- угольником без границы или пустым множеством. Каждый из прямоугольников остальных типов (назовем их полуоткрытыми) представляет собой настоящий прямоугольник, без одной, двух или трех сторон, интервал, полуинтервал, либо, наконец, пустое множество. Класс всех прямоугольников на плоскости обозначим S. Для каждого из прямоугольников определим его меру, в со- ответствии с известным из элементарной геометрии понятием площади. Именно: а) мера пустого множества равна 0; б) мера непустого прямоугольника (замкнутого, открытого или полуоткрытого), определяемого числами а, Ь, с и d, равна (b — a)(d — с). Таким образом, каждому прямоугольнику Р из ® поставлено в соответствие число т(Р) — его мера; при этом выполнены сле- дующие условия: 1) мера т{Р) принимает действительные неотрицательные значения; п 2) мера т(Р) аддитивна, т. е. если Р— IJ Р^ и Рь — 0 при i ф k, то т (Р) = Z т (Рд- 4=1 Наша задача — распространить, с сохранением свойств 1) и 2), меру т(Р), определенную пока для прямоугольников, на более широкий класс множеств. Сначала мы распространим меру на так называемые элемен- тарные множества. Назовем плоское множество элементарным, если его можно представить хотя бы одним способом как объ- единение конечного числа попарно непересекающихся прямо- угольников. Для дальнейшего нам понадобится следующая теорема: Теорема 1. Объединение, пересечение, разность и симмет- рическая разность двух элементарных множеств также являются элементарными множествами.
$ 1] МЕРА ПЛОСКИХ МНОЖЕСТВ 253 Таким образом, по терминологии, введенной в § 5 гл. I, эле- ментарные множества образуют кольцо. Доказательство. Ясно, что пересечение двух прямо- угольников есть снова прямоугольник. Поэтому, если д = урА и B = UQ/ — два элементарных множества, то и их пересечение AflB=U(^nQ/) k, / — элементарное множество. Разность двух прямоугольников есть, как легко проверить элементарное множество. Следовательно, вычитая из прямо- угольника некоторое элементарное множество, мы снова полу- чим элементарное множество (как пересечение элементарных). Пусть теперь множества А и В — элементарные. Найдется, оче- видно, прямоугольник Р, содержащий каждое из них. Тогда множество AUB = P\[(P\А)П(Р\В)] в силу сказанного выше будет элементарным. Отсюда и из ра- венств А\В = АП(Р\В) и А А В = (A U В) \ (А П В) следует, что разность и симметрическая разность элементарных множеств являются элементарными множествами. Теорема до- казана. Определим теперь меру т'(А) для элементарных множеств следующим образом: если где Рь — попарно непересекающиеся прямоугольники, то т' (А) = £ т (Рк). k Покажем, что т'(А) не зависит от способа разложения А в сум- му конечного числа прямоугольников. Пусть A=[^Pk = ^Qh где Ph и Q, — прямоугольники, и PiC\Pk=:0, Q,C\Qk~ 0 при i =/= k. Так как пересечение Q, двух прямоугольников есть
254 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V прямоугольник, то, в силу аддитивности меры для прямоуголь- ников, S т (Pk) =Xm(Pk0Q/)=Xm (Qz). * ft, I i В частности, для прямоугольников мера т' совпадает с исход- ной мерой т. Легко видеть, что определенная таким образом мера элемен- тарных множеств неотрицательна и аддитивна. Установим следующее важное свойство меры элементарных множеств. Теорема 2, Если А — элементарное множество и {Лп} — конечная или счетная система элементарных множеств такая, что »<= U л„, п ТО т' (Л)< £ т' (Л„). (1) п, Доказательство. Для любого е > 0 и данного А можно, очевидно, найти такое замкнутое элементарное множество А, которое содержится в Л и удовлетворяет условию т' (Л) т' (Л) — е/2. (Достаточно каждый из k составляющих А прямоугольников Pt заменить лежащим внутри него замкнутым прямоугольником с площадью большей, чем m(Pt)—е/(2Л).) Далее, для каждого Ап можно найти открытое элементар- ное множество Ап, содержащее Ап и удовлетворяющее условию т'(Ап)^т'(Ап) + -^, Ясно, что _ А с= U Ап- п Из {Лга} можно (по лемме Гейне — Бореля) выбрать конечную систему Х,, Лп5, покрывающую А. При этом, очевидно, 3 т' (Л) < S т' (Л,) (так как иначе А оказалось бы покрытым конечным числом пря- моугольников, суммарной площади меньшей, чем tn'{А), что не-
МЕРА ПЛОСКИХ МНОЖЕСТВ 255 $ И возможно). Поэтому т' (А)< т' (Л) + у < т' (АП1) + у < £ т' (Л„) + < 1=1 п < S т' (Ап)+S + f=Z т' +е’ п п п откуда в силу произвольности е > 0 вытекает (1). Свойство меры т', устанавливаемое теоремой 2 (мера мно- жества не превосходит суммы мер покрывающих его множеств, взятых в конечном или счетном числе), называется полуадди- тивностью. Из него вытекает свойство так называемой счетной аддитивности, или о-аддитивности, состоящее в следующем. Пусть элементарное множество А представлено как сумма счетного числа непересекающихся элементарных мно- жеств Ап (п = 1, 2, ...): А= U Л; П=1 тогда т' (4 = Е >п' (4) Я=1 (т. е. мера суммы счетного числа непересекающихся слагаемых равна сумме мер). Действительно, в силу аддитивности при любом У имеем: / N \ N m' (А) > т' I (J А„ 1 = £ т' (А„). \п=1 / п=1 Переходя к пределу при У -> оо, получаем т' (А) (Ап). В силу теоремы 2 имеет место и противоположное неравенство. Таким образом, а-аддитивность меры т' доказана. Замечание. У читателя может сложиться впечатление, .что а-аддитивность меры на плоскости получается автоматически из её аддитивности, путем предельного перехода. На самом деле это не так (в доказательстве теоремы 2 мы, используя лемму Гейне — Бореля, существенно опирались на связь между метри- ческими и топологическими свойствами плоских множеств). В § 2 при изучении мер на произвольных абстрактных множе- ствах мы увидим, что из аддитивности меры, вообще говоря, ее а-аддитивность не следует.
256 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V 2. Лебегова мера плоских множеств. Элементарные множе- ства не исчерпывают всех множеств, которые встречаются в гео- метрии и в классическом анализе. Поэтому естественно попы- таться распространить понятие меры, с сохранением ее основ- ных свойств, на класс множеств более широкий, чем конечные объединения прямоугольников со сторонами, параллельными осям координат. Решение этой задачи, в известном смысле окончательное, было дано А. Лебегом в начале XX века. При изложении теории меры Лебега нам придется рассмат- ривать не только конечные, но и бесконечные объединения пря- моугольников. Для того чтобы при этом сразу же не столкнуть- ся с множествами «бесконечной меры», ограничимся сперва множествами, целиком принадлежащими квадрату Е = {0^х 1; 1}. На совокупности всех таких множеств определим функцию ц*(Д) следующим образом. Определение 1. Внешней мерой множества А называется число Н*(А) = inf (О A<=UPft * где нижняя грань берется по всевозможным покрытиям множе- ства А конечными или счетными системами прямоугольников. Замечания. Если бы мы в определении внешней меры рас- сматривали покрытия, состоящие не только из прямоугольников, но из любых элементарных множеств (взятых в конечном или счетном числе), то мы получили бы, очевидно, то же самое зна- чение ц*(Д), поскольку всякое элементарное множество есть сумма конечного числа прямоугольников. 2. Если А — элементарное множество, то ц*(Д) = т'(А). Действительно, пусть Р], .,,, Рп — составляющие А прямоуголь- ники. Тогда, по определению, т' (А) - Е т (Pi). i=l п Так как прямоугольники Pt покрывают А, то цДА)^ 2 ш(Д) = = т'(А). Но если {QJ— произвольная конечная или счетная система прямоугольников, покрывающая А, то в силу теоремы 2 т'(Д)^ У, m(Qj), поэтому ц*(Д) = т'(А). i Теорема 3. Если А cz U Ап,
§ 1] МЕРА ПЛОСКИХ МНОЖЕСТВ 257 где Ап — конечная или счетная система множеств, то р* (АХ Ен* (4). (2) п В частности, если A cz В, то р*(А) р*(В). Доказательство. По определению внешней меры, для каждого Ап найдется такая система прямоугольников’{Рпа}, ко- нечная или счетная, что Aracz |J Pnk и k У m (Pnk) < p* (An) + , k где e > 0 выбрано произвольно. Тогда Ac= U U Pnk п k И И* (АХ £ £ пг (Рпк)< £ р* (А„) -|- е. п k п Поскольку е > 0 произвольно, отсюда вытекает утверждение теоремы. Так как на элементарных множествах пг' и р* совпадают, го теорема 2 представляет собой частный случай теоремы 3. Определение 2. Множество А называется измеримым (в смысле Лебега), если для любого е > 0 найдется такое эле- ментарное множество В, что р* (А Д В) < е. (3} Функция р*, рассматриваемая только на измеримых множе- ствах, называется лебеговой мерой. Будем обозначать ее че- рез р. Замечание. Введенное нами определение измеримости имеет достаточно наглядный смысл. Оно означает, что множе- ство измеримо, если его можно «сколь угодно точно приблизить» элементарными множествами. Итак, мы определили некоторый класс 2Ия множеств, назы- ваемых измеримыми, и функцию р, меру Лебега, на этом классе. Наша ближайшая цель — установить следующие факты: 1. Совокупность ЯЯе измеримых множеств замкнута относи- тельно операций взятия конечных или счетных сумм и пересе- чений (т. е. представляет собой а-алгебру, см. определение в п. 4 § 5 гл. I). 2. Функция р cs-аддитивна на 2)?я. Нижеследующие теоремы представляют собой этапы доказа- тельства этих утверждений.
258 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V Теорема 4. Дополнение измеримого множества измеримо. Это сразу следует из равенства (Е \ А) Д (Е \ В) = А Л В, которое проверяется непосредственно. Теорема 5, Сумма и пересечение конечного числа измери- мых множеств суть измеримые множества. Доказательство. Достаточно, очевидно, провести дока- зательство для двух множеств. Пусть А, и А2 — измеримые мно- жества. Это значит, что для любого е > 0 найдутся такие эле- ментарные множества Bi и В2, что ц* (А1 Д BJ < е/2, ц* (Д2 Д В2) < е/2. Так как (A! U А) Д (Bl U В2) с (А, Д BJ U (А2 Д В2), то н* КА U а2) а (В[ и в2)] ц (А] д в,) + р, (А2 д в2)< е. Но B]UB2 — элементарное множество, поэтому множество A! U А2 измеримо. Измеримость пересечения двух измеримых множеств выте- кает из теоремы 4 и соотношения А1ПА2 = Е\[(Е\А1)и(Д\ А)]- (4) Следствие. Разность и симметрическая разность двух из- меримых множеств измеримы. Это вытекает из теорем 4 и 5 и равенств Aj \ А = А П (Е \ А2), А, Д А2 = (Aj \ А2) U (А2 \ AJ. Теорема 6. Если Aj, Ап — попарно непересекающиеся измеримые множества, то / п \ п н( U a) = Sh(A). (5) \fe=l / fe=l Для доказательства этой теоремы нам понадобится следую- щая лемма. Лемма. Для любых двух множеств А и В |ц*(А)-ц’ (В) Ц* ИД В). Доказательство леммы. Так как А с В U (А Д В), то в силу теоремы 3 ' ц*(А)<ц’(В) + ц’(А ДВ).
§ 1] МЕРА ПЛОСКИХ МНОЖЕСТВ 259 Отсюда вытекает утверждение леммы в случае р*(В). Если же р*(А) р,*(В), то утверждение леммы вытекает из не- равенства р,* (В) С И* (А) 4-Н* (А Д В), устанавливаемого аналогично. Доказательство теоремы 6. Как и в теореме 5, до- статочно рассмотреть случай двух множеств. Выберем произ- вольное е > 0 и такие элементарные множества Bi и В2, что HAjABjXb, (б> р*(А2ДВ2)<е. (7) Положим А=А1[]А2 и B = B[UB2. Множество А измеримо в силу теоремы 5. Так как множества Ai и А2 не пересекаются, то B1DB2<=(Ai ДВЛ1)(А2Д В2) и, следовательно, т'(В,ЛВ2Х2е. (8> В силу леммы из (6) и (7) вытекает, что |т'(В1)-ц*(А,)|<е, (9) | т'(В2) — р,* (А2) | < е. (10) Так как на совокупности элементарных множеств мера адди- тивна, то из (8)—(10) получаем т' (В) = т' (BJ + т' (В2) — т' (В{ Л В2) > p* (АЛ + р* (А2) — 4е. Заметив еще, что А Д В <= (Aj Д ВЛ U (А2 Д В2) имеем, наконец, р.* (А) т' (В) — р* (А Д В) т' (В) — 2е р* (А,) 4- р* (А2) — бе. Так как е > 0 может быть выбрано произвольно малым, то Р* (А) > р* (АЛ 4- р* (А2). Поскольку противоположное неравенство р*(А)<р*(АЛ4-Ц*(А2) справедливо (в силу теоремы 3) всегда, окончательно получаем р‘(А) = р.* (АЛ 4-Р-* (А2); так как Аь А2 и А измеримы, то здесь р* можно заменить на р. Теорема доказана. Из этой теоремы, в частности, следует, что для всякого изме- римого А р (В \ А) = 1 — р(А). Теорема 7. Сумма и пересечение счетного числа измеримых, множеств суть измеримые множества.
260 МЕРА. ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V Доказательство. Пусть Л], А2, ..., Ап, ... оо — счетная система измеримых множеств и A— J Ап. Положим П=1 п—1 оо Л^ = Л„\ U Ак. Ясно, что А — IJ А'п, причем множества А'п п=1 попарно не пересекаются. В силу теоремы 5 и следствия из нее все множества А'п измеримы. В силу теоремы 6 и определения внешней меры при любом конечном п п / п \ £ и(ЛЬ) = J U лЯСм’И), fe=l \А=1 / поэтому ряд оо Z р-(Лп) п=1 сходится и, следовательно, для любого е > 0 найдется такое У, что £н(4»)<-|-. (11) п> N N Так как множество С= U Л„ измеримо (как сумма конечного п=1 числа измеримых множеств), то для него найдется такое эле- ментарное множество В, что Н* (С А В) < е/2. (12) Поскольку а а в с (с д в) и ( U л;), \п> N / то из (11) и (12) вытекает р,*(Л А В) < е, т. е. А измеримо. Так как дополнения измеримых множеств измеримы, то утверждение теоремы относительно пересечений вытекает из ра- венства rM„ = £\U(£\4,). п п Теорема 7 усиливает теорему 5. Следующая теорема пред- ставляет собой аналогичное усиление теоремы 6.
$ I] МЕРА ПЛОСКИХ МНОЖЕСТВ 261 Теорема 8. Если {4п) — последовательность попарно непе- ресекающихся измеримых множеств и 4 = (J Ап, то Я н (А = Е и (АА п Доказательство. В силу теоремы 6 при любом N (N \ N U Aj = E и(А.)<Ш Переходя к пределу при N -* оо, получаем и (А > Ен (А)- (13) п=1 С другой стороны, согласно теореме 3 и (А < Е и (АА (14) П=1 Из (13) и (14) вытекает утверждение теоремы. Установленное в теореме 8 свойство меры было названо ее счетной аддитивностью, или о-аддитивностью. Из а-аддитивно- сти вытекает следующее свойство меры, называемое непрерыв- ностью. Теорема 9. Если A i о А 2 о ... — последовательность вло- женных друг в друга измеримых множеств и А = П Ап, то Н(А = lim ц(АА Доказательство. Достаточно рассмотреть случай А = = 0; общий случай сводится к этому заменой Ап на ДП\А Имеем A = (A\A)U(A\A)U (И А» = (А \ Аж) U (Аж \ Аж) U • • •. причем слагаемые не пересекаются. Поэтому, в силу а-аддитив- «ости ц и (А) =Дн(А \ Аж) (15) и н(А)=Е н(А\А+А (16)
262 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ (ГЛ. V так как ряд (15) сходится, то его остаток (16) стремится к О при п->оо. Таким образом; р. (/!„);-> О при п->оо, что и требовалось доказать. Следствие. Если ... — возрастающая последо- вательность измеримых множеств и л = ил, п ТО ц (Л) = lim И (Л„). Для доказательства достаточно перейти от множеств Ап к их дополнениям и воспользоваться теоремой 9. Отметим в заключение еще одно очевидное, но. важное об- стоятельство. Всякое множество А, внешняя мера которого рав- на 0, измеримо. Достаточно положить В = 0; тогда ц* (Л А В) — ц* (Л А 0) = ц* (Л) = 0 < е. Итак, мы распространили меру с элементарных множеств на более широкий класс 9ЛЕ, замкнутый относительно операций взятия счетных сумм и пересечений, т. е. представляющий собой о-алгебру. Построенная мера о-аддитивна на этом классе. Уста- новленные выше теоремы позволяют составить следующее пред- ставление о совокупности измеримых по Лебегу множеств. Всякое открытое множество, принадлежащее Е, можно пред- ставить как объединение конечного или счетного числа от- крытых прямоугольников, т. е. измеримых множеств, и в силу теоремы 7 все открытые множества измеримы. Замкнутые мно- жества суть дополнения открытых, следовательно, они тоже из- меримы. Согласно теореме 7 измеримыми должны быть и все те множества, которые могут быть получены из открытых и замк- нутых с помощью конечного или счетного числа операций взя- тия счетных сумм и пересечений. Можно показать, однако, что этими множествами все измеримые множества еще не исчерпы- ваются. 3. Некоторые дополнения и обобщения. Выше мы рассматри- вали только те множества, которые содержатся в единичном квадрате Е = {0 х, у 1}. Нетрудно освободиться от этого ограничения, например, следующим образом. Представив всю плоскость как сумму полуоткрытых квадратов Enm = {п <Z х ^«+1, m < у m + 1} (п, т — целые), мы будем говорить, что плоское множество А измеримо, если его пересечение Апт — АПЕпт с каждым из этих квадратов измеримо. При
§ 1] МЕРА ПЛОСКИХ МНОЖЕСТВ 263 этом мы положим, по определению, н И) = Е н Ипш). л, т Ряд, стоящий справа, либо сходится к конечному значению, либо расходится к 4- оо. Поэтому мера ц может принимать и беско- нечные значения. Все свойства меры и измеримых множеств, установленные выше, очевидным образом переносятся на этот случай '). Надо отметить лишь, что сумма счетного числа изме- римых множеств конечной меры может иметь бесконечную меру. Класс измеримых множеств на всей плоскости обозначим ЭД. Мы изложили в этом параграфе построение меры Лебега для плоских множеств.. Аналогично может быть построена лебегова мера на прямой, в трехмерном пространстве или, вообще, в ев- клидовом пространстве любой размерности п. В каждом из этих случаев мера строится по одному и тому же образцу: исходя из меры, определенной заранее для некоторой системы простейших множеств (прямоугольников в случае плоскости, интервалов '(а, Ь), отрезков [а, й] и полуинтервалов (а, Ь], [а, Ь) в случае прямой, и т. п.), мы определяем меру вначале для конечных объединений таких множеств, а потом распространяем ее на го- раздо более широкий класс множеств — на множества, измери- мые по Лебегу. Само определение измеримости дословно пере- носится на множества в пространстве любой размерности. Вводя понятие меры Лебега, мы исходили из обычного опре- деления площади. Аналогичное построение для одномерного случая опирается на понятие длины интервала (отрезка, полу- интервала). Здесь, однако, можно ввести понятие меры и иным, более общим способом. Пусть F(t)—некоторая неубывающая, непрерывная слева функция на прямой. Положим т(a, b) = F(й) — F(а 4- 0), т[а, b] = F(й 4~0) — F(а), т(а, й] = F(й 4-0) — F(а 4-0), т[а, b) — F(b) — F(а). Легко видеть, что так определенная функция интервала т неотрицательна и аддитивна. Применяя к ней рассуждения, аналогичные проведенным в настоящем параграфе, мы можем построить некоторую меру ц^(А). При этом совокупность ЭДр множеств, измеримых относительно данной меры, замкнута от- носительно операций взятия счетных сумм и пересечений, а мера цк будет а-аддитивна. Класс ЭДк множеств, измеримых относи- тельно цк, будет, вообще говоря, зависеть от выбора функции F. ’) Однако в теореме 9 нужно добавить условие |i£j < + оо, чтобы схо- дился ряд (15). Приведите пример, показывающий, что без этого условия теорема может стать неверной.
264 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V Однако при любом выборе F открытые и замкнутые множества, а следовательно, и все их счетные суммы и пересечения заведо- мо будут измеримы. Меры, получаемые с помощью той или иной функции F, называются мерами Лебега — Стилтьеса. В частно- сти, функции F(t)= t отвечает обычная мера Лебега на прямой. Если мера цк такова, что она равна 0 для любого множе- ства, обычная лебегова мера ц которого равна 0, то мера ц^ называется абсолютно непрерывной (относительно ц). Если мера це целиком сосредоточена на конечном или счетном мно- жестве точек (это будет в том случае, когда множество значе- ний функции F конечно или счетно), то она называется дис- кретной. Мера цк называется сингулярной, если она равна О для любого одноточечного множества, но имеется такое множе- ство М лебеговой меры 0, что мера цк его дополнения равна 0. Можно показать, что всякая мера цк представима как сумма абсолютно непрерывной, дискретной и сингулярной мер. К ме- рам Лебега — Стилтьеса мы еще вернемся в следующей главе. Существование неизмеримых множеств. Мы видели, что класс измеримых по Лебегу множеств весьма широк. Естествен- но спросить, существуют ли вообще неизмеримые множества? Покажем, что этот вопрос решается положительно. Проще все- го неизмеримые множества строятся на окружности, на которой введена линейная мера Лебега. Пусть С — окружность, длина которой равна 1, и а — неко- торое иррациональное число. Отнесем к одному классу те точки окружности С, которые могут быть переведены одна в другую поворотом окружности С на угол пал (п— целое). Каждый из этих классов будет, очевидно, состоять из счетного множества точек. Выберем из каждого такого класса по одной точке. По- кажем, что полученное таким образом множество (обозначим его Фо) неизмеримо. Обозначим через Фп множество, получае- мое из Фо поворотом на угол пал. Легко видеть, что все множе- ства Фп попарно не пересекаются и в сумме составляют всю окружность С. Если бы множество Фо было измеримо, то были измеримы и конгруэнтные ему множества Фп- Так как С = U Ф„. (1 Фт = 0 при га ¥= пг, Л= —оо то в силу о-аддитивности меры отсюда следовало бы, что 1= £ Р(Ф„). (П> п=-» Но конгруэнтные множества должны иметь одну и ту же меру, так что если Фо измеримо, то И (Фп) = И (фо).
$21 ОБЩЕЕ ПОНЯТИЕ МЕРЫ 265 Отсюда видно, что равенство (17) невозможно, так как сумма ряда, стоящего в его правой части, равна 0, если ц(Фо) = О, и бесконечности, если ц(Фо)>О. Итак, множество Фо (а следо- вательно, и каждое Фп) неизмеримо. § 2. Общее понятие меры. Продолжение меры с полукольца на кольцо. Аддитивность и о-аддитивность1) 1. Определение меры. Мы строили меру плоских множеств, отправляясь от меры (площади) прямоугольника и распростра- няя ее на более широкий класс множеств. Для наших построе- ний существенно было вовсе не конкретное выражение площади прямоугольника, а лишь ее общие свойства. Именно, при про- должении плоской меры с прямоугольников на элементарные множества мы пользовались лишь тем, что площадь — это не- отрицательная аддитивная функция множества, и тем, что сово- купность прямоугольников есть полукольцо. При построении ле- бегова продолжения плоской меры была, кроме того, важна ее сг-аддитивность. В силу только что сказанного, конструкции, изложенной в § 1 применительно к плоским множествам, можно придать вполне -общую абстрактную форму. Тем самым ее применимость будет существенно расширена. Этому и посвящены ближайшие два параграфа. Введем прежде всего следующее основное определение. Определение 1. Функция множества ц(А) называется мерой, если: 1) область определения функции ц(А) есть полукольцо множеств, 2) значения функции ц(А) действительны и неотрицательны, 3) ц(А) аддитивна, т. е. для любого конечного разложения A = A!U ... 1М„ множества А е на (попарно непересекающиеся) множества А/, е выполнено равенство И (А) = £ р (А*). fe=l Замечание. Из разложения 0 = 01)0 вытекает, что Н0) = 2ц(0), т. е. ц(0)=о. *) В этом параграфе и дальше мы будем систематически пользоваться понятиями и фактами, изложенными в § 5 гл. I.
266 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V 2. Продолжение меры с полукольца на порожденное им кольцо. При построении меры плоских множеств: первым шагом было распространение меры с прямоугольников на элементар- ные множества, т. е. на конечные суммы попарно непересекаю- щихся прямоугольников. Сейчас мы рассмотрим абстрактный аналог этой конструкции. Сформулируем прежде всего следую- щее определение. Опр еделение 2. Мера ц называется продолжением меры т, если с и для каждого А<^&т имеет место равенство ц(Л) = т(Л). Цель этого пункта состоит в доказательстве следующего предложения. Теорема 1. Для каждой меры пг(А), заданной на некото- ром полукольце ®т, существует одно и только одно продолже- ние пг'(А), имеющее своей областью определения кольцо 9t(®m) (т. е. минимальное кольцо над <Sm). Доказательство. Для каждого множества Ле9!(6т) существует разложение А=[) Bk (Bk(=<5m, Bk(]Bt = 0 при k^t) (1) k=*\ (теорема 3 § 5 гл. I). Положим, по определению, т' (Л) = £ m (В*)- (2} fc=i Легко видеть, что величина т'(Л), определенная равенством (2), не зависит от выбора разложения (1). Действительно, рас- смотрим два разложения п г X=|jB/=UC/, й;е'5та, С(е ®та. «=1 /=1 Так как все пересечения В, ПС; принадлежат ®т, то в силу ад- дитивности меры т >=i /=1 /=i /=1 что и требовалось доказать. Неотрицательность и аддитивность функции т'(А), опреде- ляемой равенством (2), очевидны. Итак, существование про- должения т' меры т на кольцо 91 (®т) доказано. Для доказательства его единственности заметим, что, по он- п ределению продолжения, если А— || Bk, где В к — непересекаю- а=1
ОБЩЕЕ ПОНЯТИЕ МЕРЫ 267 § 2] щпеся множества из ®т, то для любого продолжения т меры т на кольцо Ш(©т) т(Л)= X й (Вk) = £ m (Вк) = т' (Л), k k т. е. мера т совпадает с мерой т', определенной равенством (2). Теорема доказана. По существу, мы повторили здесь, в абстрактных терминах, прием, которым мы в § 1 продолжили меру с прямоугольников на элементарные множества. Класс элементарных множеств как раз и представляет собой минимальное кольцо над полукольцом прямоугольников. Из аддитивности и неотрицательности меры вытекают сле- дующие почти очевидные, но важные свойства. Теорема 2. Пусть т — мера, заданная на некотором коль- це 9?т, и множества A, Ah ..., Ап принадлежат 9?т. Тогда п I. если U ,Ak cz А и Ai(]Ai=0 при i =^= j, то k—1 Е m (Ak) m (Л); II. если U Ak Z5 А, то fe=i X т(Л)>т(Л); fe=i в частности, если Ас А' и А, А' с 91, то т(А) ^.т(А'). Действительно, если Ль ..., Ап попарно не пересекаются и содержатся в А, то в силу аддитивности меры п ( п \ т(Л) = Е т (ДО + т ( А \ J A J. А=1 X к=1 / Поскольку т \ (J д/)^>0, отсюда получаем свойство I. Далее, для любых At, A2c9tm имеем т (Л! U ДО = т (Л0 + т (Д2) — /п (Д П ДО < т (Д) + т (Д ). По индукции отсюда получаем, что ( Ц л) < X т (Д). \£=1 / feel
268 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ (ГЛ. V Наконец, опять-таки в силу аддитивности меры из ЛсН Ак А=1 следует, что т (Л) — т (Д /Q — т Qj( Ak \ д) < т (Д /Q , откуда в силу предыдущего неравенства и вытекает свойство IL Мы доказали свойства I и II для меры, заданной на кольце множеств. Но если мера первоначально была задана на полу- кольце, то при продолжении ее на кольцо меры множеств, при- надлежащих исходному полукольцу, не меняются. Поэтому свой- ства I и II справедливы и для мер на полукольцах. 3. а-аддитивность. В различных вопросах анализа прихо- дится рассматривать объединения не только конечного, но и счетного числа множеств. В связи с этим условие аддитивности, которое мы наложили на меры (определение 1), естественно за- менить более сильным требованием о-аддитивности. Определение 3. Мера т называется счетно-аддитивной, или с-аддитивной, если для любых множеств A, At, А2, ... ..., Ап, ..., принадлежащих ее области определения и. удовлетворяющих условиям Д=11л, АПЛ/ = 0 при i=£j, П=1 имеет место равенство со m (Л) = Z пг (Ап). Плоская мера Лебега, построенная нами в § 1, а-аддитивна (теорема 8). Пример а-аддитивной меры совсем иной природы можно построить следующим образом. Пусть Х = х2, ...} — произвольное счетное множество и числа рп > 0 таковы, что оо >2ipn=I’ Соответствующий класс измеримых множеств состоит из всех подмножеств множества X. Для каждого А с: X положим m(A)= X рп- хпеА Легко проверить, что т(Д) будет о-аддитивной мерой, при- чем m(X)= 1. Этот пример естественно появляется в связи со многими вопросами теории вероятностей.
ОБЩЕЕ ПОНЯТИЕ МЕРЫ 269 $ 2) Укажем пример меры аддитивной, но не о-аддитивной. Пусть X — множество всех рациональных точек отрезка [0, 1], а со- стоит из пересечений множества X с произвольными интерва- лами (а, Ь), отрезками [а, Ь] или полуинтервалами (а, Ь], [а, Ь) из [0, 1]. Легко видеть, что представляет собой полукольцо. Для каждого такого множества Ааъ е <эт положим т(АаЬ) = Ь — а. Эта мера аддитивна, однако она не о-аддитивна, так как т{Х) = 1, и в то же время X есть сумма счетного числа точек, каждая из которых имеет меру 0. Меры, которые будут рассматриваться здесь и в следующем параграфе, мы будем предполагать а-аддитивными. Теорема 3. Если мера т, определенная на некотором полу- кольце Sm, в-аддитивна, то и мера ц, получающаяся ее прсдол- окением на кольцо fR(Sm), в-аддитивна. Доказательство. Пусть 4<=Я(®т), fi„e9l(Sm), л =1,2, ... и оо А = U Вп, п=>1 причем Bs[\Br = <Z при s=f=r. Тогда существуют такие множе- ства Aj и Bni из что 4= (J Вп=уВп;, п=1,2.............. причем множества в правых частях каждого из этих равенств попарно не пересекаются, а суммы по i и / конечны (теорема 3 § 5, гл. I). Пусть Спц — Bni Р Aj. Легко видеть, что множества Спц попарно не пересекаются, и притом ОО 4/=UUC„(/> Bni=UcnZ/. п= I i / Поэтому в силу а-аддитивности меры пг на и» ем "I И/) = X X m (3) Л=1 i m(Bni)=X m{Cnt!), (4) / о в силу определения меры ц на Ц (4) = X пг {Aj), (5) / н(Вп)= £ tn (Bni). (6)
270 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V Из (3) — (6) вытекает, что ц.(А) = „). (Суммы по i и по / П —1 здесь конечны, ряды по п сходятся.) Докажем теперь следующие основные свойства а-аддитивных мер, представляющие собой обобщения на счетные суммы свойств, сформулированных в теореме 2. Поскольку, как мы установили, а-аддитивность меры сохраняется при продолже- нии меры на кольцо, можно с самого начала считать, что мера задана на некотором кольце St. Теорема 4. Пусть мера пг ^-аддитивна и множества А, А1( ..., Ап, ... принадлежат кольцу 91. Тогда оо Iсг. Если (J Akcz. А и Л, Г!Л/ = 0 при i #= /, то й=1 оо £ т(А*)<т(А); Й=1 оо Па (счетная полуаддитивность). Если J Ak о А, то fe=l оо £ m(Ak)^m(A). Доказательство. Если все Ak не пересекаются и со- держатся в А, то, в силу свойства I (теорема 2), при любом п имеем X т(А4)</и(А). а=1 Переходя здесь к пределу при га->оо, получаем первое утвер- ждение теоремы. Докажем второе утверждение. Поскольку 91 есть кольцо, мно- жества П—1 Ва = (А„ПА)\ U Ak k=i принадлежат 91. Так как со А= U Вп, ВпаАп и множества Вп попарно не пересекаются, то оо оо m (А) = £ m (Вп) < £ m (А„). п=1 п—1 Замечание. Утверждение 1а доказанной только что тео- ремы не опирается, очевидно, на а-аддитивность рассматривае- мой меры; оно остается справедливым и для любых аддитивных
§ 3] ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ 271 мер. Наоборот, утверждение Па существенно использует о-ад- дитивность меры. Действительно, в приведенном выше примере аддитивной, но не о-аддитивной меры все пространство X, имею- щее меру 1, покрывается счетной суммой одноточечных мно- жеств, каждое из которых имеет меру 0. Более того, нетрудно убедиться, что свойство 11а на самом деле равносильно о-адди- тивности. Действительно, пусть ц— некоторая мера, определен- ная на полукольце ©. Пусть множества А, Ль Л2, ..., Ап, ... принадлежат ©, А = U Ak и все Ak попарно не пересекаются. k Тогда в силу свойства 1а (которым, как мы видели, обладает любая мера) оо Если же ц обладает и свойством Па, то (поскольку Ak в сово- купности покрывают Л) f ц(ЛД>ц(Л) Й=1 и, таким образом, оо S Н (Лй) = р (Д). Проверить счетную полуаддитивность меры (свойство Па) бы- вает часто проще, чем прямо установить ее о-аддитивность. § 3. Лебегово продолжение меры 1. Лебегово продолжение меры, определенной на полукольце с единицей. Если мера т, заданная на полукольце ©т, обладает лишь свойством аддитивности (но не о-аддитивности), то ее продолжением на 9?(®т) исчерпываются в значительной сте- пени все возможности распространения такой меры с исходного полукольца на более широкий класс множеств. Если же рас- сматриваемая мера о-аддитивна, то она может быть рас- пространена с ®т на класс множеств значительно более обшир- ный, чем кольцо 9i(®m), и в некотором смысле максимальный. Это можно сделать с помощью так называемого лебегова продолжения. Сначала мы рассмотрим лебегово продолже- ние меры, заданной на полукольце с единицей. Общий случай будет рассмотрен в следующем пункте. Пусть на некотором полукольце множеств <5т с единицей Е задана о-аддитивная мера т. Определим на системе 21 всех подмножеств множества Е функцию ц*(Д)—внешнюю меру следующим образом.
272 МЕРА. ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ (ГЛ. V Определение 1. Внешней мерой множества А<=Е назы- вается число ц*(Л)= inf £ т(Вп), (1) Л где нижняя грань берется по всем покрытиям множества А ко- нечными или счетными системами множеств Вп е ®т. Следующее свойство внешней меры играет основную роль во всем дальнейшем построении. Теорема 1 (счетная полуаддитивность). Если А cz U А, п где {Лп} — конечная или счетная система множеств, то н*(А<Ен*(А). п Доказательство этого утверждения совпадает с доказатель- ством теоремы 3 § 1 и мы не будем его повторять. Определение 2. Множество А называется измеримым (по Лебегу), если, каково бы ни было е > 0, найдется такое Be е 9t(®m), что ц‘(Д Д В) < в. Функция ц*, рассматриваемая только на измеримых множе- ствах, называется лебеговой мерой (или просто мерой) и обозна- чается ц. Ясно, что все множества из ®т и из 91 (®т) измеримы. При этом, если А е ®т, то ц(Д) = т(Д). Это равенство доказывается точно так же, как и его аналог для множеств на плоскости. Из равенства Д Д А2 = (Е \ Д) Д (£ \ А2) следует, что если А измеримо, то его дополнение тоже изме- римо. Установим теперь основные свойства измеримых множеств и определенной на них лебеговой меры. Теорема 2. Система 9ft всех измеримых множеств есть кольцо. Доказательство. Так как всегда А П А2 — А[ \ (Д \ Д) и ДиД = £\[(£\Д)П(£\А)1, то достаточно показать следующее. Если Де ЭИ, Де ЭИ, то и Д = Д \ Д е ЭИ.
S3] ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ 273 Пусть At и А2 измеримы; тогда существуют B^StfSn,) и В2^(Я(&т) такие, что ц* (4] Д Bt) < е/2 и ц* (42 А В2) < е/2. Полагая В = В1 \ В2 е 9t(Sm) и пользуясь соотношением (4] \ 42) Д (Bj \ В2) cz (4[ Д Bt) U (42 Д В2), получаем ц* (4 Д В) < е. В силу произвольности е > 0 отсюда вытекает измеримость мно- жества 4. Замечание. Очевидно, что Е есть единица кольца ЭЯ, ко- торое, таким образом, является алгеброй множеств. Теорема 3. На системе ЭЯ измеримых множеств функция ц(4) аддитивна. Доказательство этой теоремы представляет собой дословное повторение доказательства теоремы 6 § 1. Теорема 4. На системе ЭЯ измеримых множеств функция р(4) о-аддитивна. Доказательство. Пусть 4=0 4„, 4, 4Ь 42, ... е ЭЯ, 4,- П 4, = 0 при / =/= /. П=1 В силу теоремы 1 И (4) <2 И(4„), (2) п а в силу теоремы 3 при любом N (N \ N U Ап 1= S н(4„), 71= 1 / П— 1 откуда И (4) > S И (4„). (3) п Из (2) и (3) следует утверждение теоремы. В § 1, рассматривая плоскую меру Лебега, мы показали, что не только конечные, но и счетные суммы и пересечения изме- римых множеств также измеримы. Это верно и в общем случае, т. е. справедлива следующая теорема: Теорема 5. Система ЭЯ измеримых по Лебегу множеств является о-алгеброй с единицей Е. Доказательство. Так как П 4„ = B\U (£\4„) п п
274 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V и так как дополнение измеримого множества измеримо, то до- статочно показать следующее. Если А2, ..., Ап, ... принад- лежат ЗЯ, то А = (J Ап также принадлежит ЗЯ. Доказательство п этого утверждения, проведенное в теореме 7 § 1 для плоских множеств, дословно сохраняется и в общем случае. Так же как и в случае плоской меры Лебега, из о-аддитив- ности меры следует ее непрерывность, т. е. если ц — о-аддитив- ная мера, определенная на о-алгебре, Д[ щ> А2 щ> ... щ> Ап щ> ... —• убывающая цепочка измеримых множеств и а= Ал, п ТО ц(Д)= lim ц(Д„), П->оо а если Д1 сг А2 сг ... с Ап с ... — возрастающая цепочка измеримых множеств и A=U Ап, п ТО цЛ — lim ц (Д„). Л->оо Доказательство, проведенное в § 1 для плоской меры (тео- рема 9), дословно переносится на общий случай. Итак, мы установили, что система ЗЯ представляет собой о-алгебру, а определенная на ней функция ц(Д) обладает всеми свойствами о-аддитивной меры. Тем самым оправдано следую- щее определение. Определение 3. Лебеговым продолжением ix = L(tn) меры m называется функция ц(Д), определенная на системе из- меримых множеств ЗЯ и совпадающая на ЗЯ с внешней мерой ц*(Д). 2. Продолжение меры, заданной на полукольце без единицы. Если полукольцо ®т, на котором определена исходная мера tn, не имеет единицы, то построение лебегова продолжения, изло- женное в предыдущем пункте, претерпевает некоторые, впро- чем, незначительные, изменения. Определение 1 внешней меры сохраняется, но внешняя мера ц* оказывается определенной только на системе таких множеств А, для каждого из кото- рых существует покрытие U Вп множествами из ®т с конечной п суммой ^пг(Вп). Определение измеримости сохраняется без п всяких изменений. Теоремы 2—4 и заключительное определение 3 сохраняют силу. Предположение о существовании единицы использовалось
ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ 275 § 3] лишь в доказательстве теоремы 2. Чтобы дать доказательство теоремы 2 в общем случае, надо установить независимо, что из вытекает U А2 е ЯП. Но это следует из вклю- чения (4, и л2) Д (В1 и В2) с (Д, Д В,) и (А2 Д В2). В случае, когда не имеет единицы, теорема 5 заменяется следующей теоремой: Теорема 6. При любой исходной мере т система мно- жеств ЯП, измеримых по Лебегу, является 6-кольцом; измери- оо мость множества А= J Ап при измеримых Ап имеет место П=1 z \ в том и только том случае, если меры ц (J АпJ ограничены некоторой константой, не зависящей от N. Доказательство этого утверждения предоставляется чита- телю. Замечание. Поскольку сейчас речь идет о мерах, при- нимающих лишь конечные значения, необходимость послед- него условия очевидна. Из теоремы 6 вытекает следующий факт. Следствие. Система ЯП а всех множеств В^ЗЯ, являю- щихся подмножествами фиксированного множества А е ЯП, об- разует а-алгебру. Например, система всех измеримых по Лебегу (в смысле обычной лебеговой меры на прямой) подмножеств любого от- резка [а, Ь] есть о-алгебра множеств. В заключение отметим еще одно свойство лебеговых мер. Определение 4. Мера ц называется полной, если из р(Л) — 0 и A' czA вытекает, что А' измеримо. Очевидно, что при этом ц(Д')=0. Без труда доказывается, что лебегово продолжение любой меры полно. Это вытекает из того, что при A'cz А и ц(Д) — 0 неизбежно ц*(Д')=0, а любое множество С, для которого ц*(С) = 0, измеримо, так как 0 е Я (<5т) и ц* (С Д 0) — (С) = 0. Всякую а-аддитивную меру на а-алгебре можно продолжить до полной, положив ее равной нулю для любого подмножества каждого множества нулевой меры. Дополнительные замечания. I. Предположение о том, что ис- ходная мера m задана на полукольце (а не на некоторой произвольной си- стеме множеств), существенно для однозначности ее продолжения. Рассмот- рим в единичном квадрате систему вертикальных и горизонтальных прямо- угольников, т. е. таких прямоугольников, у которых или длина или ширина равна 1 (рис. 18), и припишем каждому такому прямоугольнику меру, рав- ную его площади. На порожденную этими прямоугольниками алгебру (а тем
276 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V более а-алгебру) такая мера может быть продолжена неоднозначно (ука- жите хотя бы два различных продолжения). 2. Укажем на связь между процессом продолжения меры по Лебегу и процессом пополнения метрического пространства. Заметим для этого, что т'(АДВ) можно принять за расстояние между элементами А и В кольца й(@т). Тогда й(@щ) становится метрическим (вообще говоря, неполным) пространством и его пополнение состоит как раз из всех измеримых мно- жеств (при этом, однако, с метрической точки зрения множества А и В не- различимы, если ц(Л Д В) — 0). Упражнения. 1. Пусть мера т задана на полукольце (с единицей) &т множеств из X жество А измеримо ладает следующим Рис. 18. и ц* — отвечающая ей верхняя мера. Доказать, что мно- (по Лебегу) в том и только том случае, если оно об- свойством, называемым измеримостью по Каратеодори: для любого подмножества Z с X имеет место ра- венство ц-(/) = 11*(2ПЛ) + и* (г\Л). 2. Пусть а-аддитивная мера пг задана на кольце 8? с единицей X и m(X) = 1. Введем для каждого А с X наряду с внешней мерой р* внутреннюю меру ц», положив ц.(Л) = 1-ц* (Х\Л). В случае, когда Легко видеть, что всегда ц. (Л) ц*(Л). Дока- х зать, что р.(Л)==р*(Л) (») в том и только том случае, если множество А изме- римо (в смысле определения 2). мера задана на кольце с единицей, равенство (*) часто принимается за определение измеримости множества. 3. Расширение понятия измеримости в случае о-конечной меры. Если исходная мера пг задана в пространстве X на неко- тором полукольце без единицы, то введенное выше определение измеримости множества оказывается слишком узким. Напри- мер, если X— это плоскость, то такие множества, как вся пло- скость, полоса, внешность круга и т. п„ имеющие бесконечную площадь, при таком определении не попадают в число измери- мых. Естественно расширить понятие измеримости, допуская для меры и бесконечные значения, с тем, чтобы совокупность измеримых множеств была, как и в случае, когда исходная мера задана на полукольце с единицей, а-алгеброй (а не только 6-кольцом). Мы ограничимся при этом практически наиболее важным случаем так называемой a-конечной меры, хотя соответствующее построение можно провести и в общем случае. Пусть а-аддитивная мера m задана на некотором полукольце подмножеств множества X. Мы скажем, что эта мера ^-ко- нечна, если все X может быть представлено как сумма счет- ного числа множеств из ®т (но не как сумма конечного числа множеств из ®т). Примером a-конечной меры может слу- жить площадь, определенная на всех прямоугольниках на пло-
5 3] ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ ЧТТ скости. Простой пример не о-конечной меры можно получить следующим образом. Пусть на отрезке [0, 1] задана некоторая функция f(x). Для каждого конечного подмножества А = = Ui, ..., хп) отрезка положим ц (4) — У, f (хг). Если множе- ство точек х, в которых /(%)#= О, несчетно, то такая мера на [О, 1] не будет о-конечной. Итак, пусть т есть о-аддитивная и о-конечная мера в X, СО определенная на полукольце S>m. Пусть X — IJ В,-, Bt е Sm. i=l Перейдя от полукольца к порожденному им кольцу 91 (®т) fc-i и заменяя Вй на Bk \ Н В{, можно считать, что X представлено /=1 как сумма счетного числа попарно непересекающихся из- меримых множеств, которые мы по-прежнему обозначим В>, В2, ... Применив к т описанную в предыдущем пункте про- цедуру лебегова продолжения, мы получим меру ц, определен- ную на б-кольце ЯП. Пусть Be® и ЯНВ — система всех мно- жеств из ЯП, содержащихся в В: 3RB — {C: Се ЭИ, ВсС}. Тогда ЯИв есть о-алгебра с единицей В (см. следствие из тео- ремы 6). Рассмотрим теперь совокупность ЭД множеств А, имеющих измеримое пересечение с каждым В{: АПВ^ЗЯв.. Иначе говоря, Ле ЭД означает, что А представимо в виде оо Д=ЦЛ£, где Д£еЯИВ(. (4> Система ЭД представляет собой о-алгебру (проверьте!), которую мы назовем прямой суммой о-алгебр ЯИВ.. Множества (4), со- ставляющие о-алгебру ЭД, мы назовем измеримыми и определим, меру ц каждого такого А следующим образом: если оо Л=Цд£, Д£еЯИВ/, то Й И) = 2 и (4г). г=| Поскольку мера всякого множества неотрицательна, стоящий здесь справа ряд сходится к некоторому неотрицательному зна- чению или к -роо.
278 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V Теорема 7. В сделанных выше предположениях справед- ливы следующие утверждения-. 1) c-алгебра 91 и мера р не зависят от выбора системы мепересекающихся множеств В[ из ЗЯ, удовлетворяющих условию оо и Bt = x-, 2 = 1 2) мера Д о-аддитивна на 91; 3) совокупность множеств А е 91, для которых у, (Л) < оо, сов- падает с б-кольцом ЗЯ и на этом б-кольце у = у. Доказательство. 1) Заметим прежде всего, что А е91 в том и только том случае, если А П С <= ЗЯ для любого С е ЗЯ. Достаточность этого условия ясна, поскольку оно означает, в частности, что А П Bt е ЗЯ (I = 1, 2, ...); проверим его необ- ходимость. Пусть А е 91 и С е Эй. Положим Сг = С П Bz; тогда дпс=0ипс,). 1=1 Так как при всяком W ц ( Д И П С,)) < Н (U Cz) < у (С), то в силу теоремы 6 множество Л ПС измеримо. Пусть {Bz} и {В/} — две системы непересекающихся множеств из ЗЯ, такие, что UBZ = U В) — X. Если Ле 91, то, поскольку мера у каждого множества из ЗЯ неотрицательна, выполнены равенства . X Н (Л П В,) = £ н (Л n Bt П В,) = £ У (Л П В)), I i. I i т. e. определяя у (Л) по системе {Bz} или {В/}, мы получим один и тот же результат. 2) Пусть Л(1), Л(2), ... (= 91, Л,й) П Л(/) = 0, k^=l и Л = (J Л(А). * Тогда в силу а-аддитивности меры у на ЗЯ: Д(Л)=Хи(ЛПВ;)= f и(д(*>пв,) = I, £=1 = f (2н(л(й)пв(.)) = £ й(^), а=1 \;=1 / л=1 т. е. у а-аддитивна. Наконец, 3) непосредственно следует из теоремы 6. Замечание. Описанное выше расширение понятия измеримости (с до- пущением для меры бесконечных значений) возможно и без предположения л-конечностн исходной меры, например, по следующей схеме.
ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ 27» '§ 3] Пусть % — некоторое пространство и ЭЛ — какое-то 6-кольцо его под- множеств. Множество A cz X называется измеримым относительно ЭЛ, если’ ЛГ|В<еЭЛ для любого В е ЭЛ. Нетрудно проверить, что система 21 измери- мых относительно ЭЛ множеств есть о-алгебра с единицей X, причем, если само ЭЛ есть о-алгебра с той же единицей X, то 21 = ЭЛ. Пусть теперь в X задана некоторая j-аддитивная мера р, которую мы в силу п. 2 можем считать уже продолженной на некоторое 6-кольцо ЭЛ в> пусть 21 — совокупность измеримых относительно ЭЛ множеств из X. Множе- ство А е 21 называется нуль-множеством, если р(ЛПб)—О Для любого В е ЭЛ. Теперь на 21 определяется мера р (принимающая, вообще говоря, и. бесконечные значения) следующим образом: если для данного А е 21 суще- ствует такое В е ЭЛ, что Л АВ есть нуль-множество, то полагаем й(Л) = р(В). Для всех остальных А е 21 полагаем р (Л) = оо. Нетрудно проверить, что мера р о-аддитивна и на 6-кольце ЭЛ cz 21 совпа- дает с р. 4. Продолжение меры по Жордану. Рассматривая в § 2 этой главы меры, удовлетворяющие лишь условию аддитивности, мы показали, что каждая такая мера m может быть продолжена с полукольца на минимальное кольцо Л(@т), порожденное этим полукольцом. Однако возможно и рас- пространение меры на некоторое кольцо, более обширное, чем Л(@т). Соот- ветствующее построение называется продолжением меры по Жордану '). Идея этого построения, применявшегося в ряде частных случаев еще математиками Древней Греции, состоит в приближении «измеряемого» множества Л мно- жествами Л' И Л", которым мера уже приписана, изнутри и снаружи, т. е. так, что Л'с Лс А". Пусть m — мера, заданная на некотором кольце Л. Определение 5. Будем называть множество Л измеримым по Жор- дану, если при любом е > 0 в кольце Л имеются множества А' и Л", удо- влетворяющие условиям А' <= A czА", т(Л"\Л')<е. Справедливо следующее утверждение. Теорема 8. Система Л* измеримых по Жордану множеств является: кольцом. Пусть Я—система таких множеств Л, для которых существует множе- ство В zz) А из Л. Для любого Л из Л положим, по определению, р, (Л) = inf m (В), В=>А ji (Л) = sup m (В). ~ Вс А Функция р(Л) и pi (Л) называются соответственно «внешней» и «внутрен- ней» жордановой мерой множества Л. Очевидно, что всегда ц(Л)<Д(Л). Теорема 9. Кольцо Л* совпадает с системой тех множеств А е для которых р_(Л) = р (Л). Для множеств из 21 имеют место следующие теоремы: ’) Камилл Жордан, французский математик (1838—1922),
280 МЕРА. ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ (ГЛ. V п и Теорема 10. Если А <= Н Ак, то Д (Л) V Д (Ак). л=| jfi Теорема 11. Если А к с: A (k = 1, 2..п) и А/ П А/ = 0, то НМ) > £ нМ). л=1 Определим теперь функцию ц на области ©ц = й’ как общее значение внешней и внутренней меры: р(Л) = ц(Л) = Д(Л). Из теорем 10 и 11 и из того очевидного обстоятельства, что для Лей Д(Л) = р(Л) = т(Л) вытекает следующее утверждение: Теорема 12. Функция р(Л) является мерой и продолжением меры tn. Изложенное построение применимо к любой мере ш, определенной на кольце. В частности, его можно применить к множествам на плоскости. При этом за исходное кольцо принимается, совокупность элементарных множеств (т. е. конечных сумм прямоугольников). Кольцо элементарных множеств за- висит, очевидно, от выбора системы координат на плоскости (берутся прямо- угольники со сторонами, параллельными осям координат). При переходе к плоской мере Жордана эта зависимость ог выбора системы координат ис- чезает: отправляясь от любой системы координат {xh х2), связанной с перво- начальной системой {Х|, х2} ортогональным преобразованием Xi = cos а • Xi + sin а х2 + П|, х2 — — sin а • Х| + cos а • х2 + а2, мы получим одну и ту же меру Жордана. Этот факт вытекает из следующей общей теоремы. Теорема 13. Для того чтобы жордановы продолжения щ = /(mi) и ц2 = j(m2) мер mi “ m2, определенных на кольцах й( и й2 совпадали, необ- ходимо и достаточно выполнения условий: mi (Л)==И2<Л) на й2с:®Ц(, т2(Л) = Р! (Л) на й2. Если исходная мера m определена не на кольце, а на полукольце го «е жордановым продолжением естественно назвать меру i(m)= j(r (m)), получающуюся в результате продолжения m на кольцо й(®т) и дальнейшего продолжения по Жордану. 5. Однозначность продолжения меры. Если множество Л измеримо по Жордану относительно меры ц, т. е. принадлежит й* = й*(©т), то для лю- бой меры Д, продолжающей m и определенной на й*. значение Д(Л) совпа- дает со значением /(Л) жорданова продолжения J = 1(ш). Можно пока- зать, что продолжение меры m за пределы системы £Н* множеств, измеримых по Жордану, не будет однозначно. Более точно это значит следующее. На- зовем множество А множеством однозначности для меры т, если: 1) существует мера, являющаяся продолжением меры т, определенная для множества А;
5 3] ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ 28 Г 2) для любых двух такого рода мер pi и р2 Pi (А) = р2 (Л). Имеет место теорема: система множеств однозначности для меры m сов- падает с системой множеств, измеримых по Жордану относительно меры т_ г. е. с кольцом 91*. Однако если рассматривать только о-аддитивные меры и их продолжения (о-аддитивные), то система множеств однозначности будет, вообще говоря,, обширнее. Так как именно случай о-аддитивных мер наиболее важен, то введем» следующее определение. Определение 6. Множество А называется множеством а-однознач- ности для о-аддитивной меры т, если: 1) существует о-аддитивное продолжение Л меры т, определенное для А (т. е. такое, что А е= @х); 2) для всяких двух таких о-аддитивных продолжений Ai и А2 справед- ливо равенство Л, (Л) = А2 (Л). Если Л есть множество о-однозначности для о-аддитивной меры р, то в силу нашего определения существует единственно возможное значение А(Л) для любого о-аддитивного продолжения меры р, определенного на Л. Легко видеть, что каждое множество Л, измеримое по Жордану, изме- римо и по Лебегу (но не наоборот! приведите пример), причем его жорда- нова и лебегова меры одинаковы. Отсюда непосредственно вытекает, что жорданово продолжение о-аддитивнон меры о-аддитивно. Каждое множество Л, измеримое по Лебегу, является множеством о-од- нозначности для исходной меры т. Действительно, при любом е > 0 для Л существует такое В е SR, что р* (ЛАВ) < е. Каково бы ни было опре- деленное для Л продолжение А меры т, А(В) = ш'(В), так как продолжение т' меры т на 3t = 3t (©ш) однозначно. Далее, А(ЛДВ)<р'(ЛДВ)<е и, следовательно, |А(Л)-т'(В)| <е. Таким образом, для любых двух о-аддитивных продолжений Aj и А2 меры nt имеем |А,(Л)-А2(Л)| < 2е, откуда в силу произвольности е > О А,(Л) = А2(Л). Можно показать, что система множеств, измеримых по Лебегу, исчерпывает всю систему множеств о-однозначностн для исходной меры т. Пусть т — некоторая а-аддитивная мера с областью определения © и Яй = £(©) —область определения ее лебегова продолжения. Легко убедиться в том, что, каково бы ни было полукольцо ®ь удовлетворяющее условию всегда © с: ©) с 2Л, £(©,) = £(©).
•282 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ, V- § 4. Измеримые функции 1. Определение и основные свойства измеримых функций. Пусть X и У— два произвольных множества и пусть в них вы- делены две системы подмножеств ©х и ©у соответственно. Аб- страктная функция y = f(x) с областью определения X, прини- мающая значения на У, называется (®х, ©у) -измеримой, если из А сп ©у вытекает, что (А) е бх. Например, если и за X и за У взять числовую прямую (т. е. рассматривать действительные функции действительного пере- менного), а за ®х и ®у взять систему всех открытых (или всех замкнутых) подмножеств из R1, то сформулированное опре- деление измеримости сведется к определению непрерывности.. Взяв за ©х и ©у систему всех борелевских множеств, мы при- дем к так называемым В-измеримым (или измеримым по Во- релю) функциям. В дальнейшем мы будем интересоваться понятием измеримо- сти главным образом с точки зрения теории интегрирования. В этом плане основное значение имеет понятие измеримости числовых функций, определенных на некотором множестве X, с заданной на нем о-аддитивной мерой ц. При этом за ®х при- нимается совокупность всех измеримых относительно ц мно- жеств из X, а за ®у — совокупность всех S-множеств на прямой. Поскольку всякая о-аддитивная мера может быть продолжена на некоторую о-алгебру, естественно с самого начала считать, что есть о-алгебра. Таким образом, для числовых функций мы приходим к следующему определению измеримости: Определение 1. Пусть X — множество, в котором задана о-аддитивная мера ц, определенная на о-алгебре Действи- тельная функция f(x) на X называется ^-измеримой, если для всякого борелевского множества А числовой прямой Г1И)е®и- Аналогично, комплексная функция <р(х), определенная на X, называется ^-измеримой, если <р-1(А)е®и для всякого борелев- ского подмножества комплексной плоскости. Легко проверить, что это равносильно ц-измеримости действительной и мнимой частей этой функции по отдельности. Числовая функция, заданная на.прямой, называется борелев- ской (или В-измеримой), если прообраз каждого борелевского множества есть борелевское множество. Теорема 1. Пусть X, У и Z — произвольные множества с выделенными в них системами подмножеств ®х, Sy и соот~ ветственно и пусть определенная на X функция
ИЗМЕРИМЫЕ ФУНКЦИИ 283 »4] (<5х, ®у) -измерима, а определенная на У функция z — g(y) (®у, ®z) -измерима. Тогда функция z = <p(x) = g(f (х)) (®х, <52)-измерйма. Коротко: измеримая функция от измеримой функции есть измеримая функция. Доказательство. Если А е Sz> то в силу (Sy, ^-изме- римости функции g имеем; (Л) = Ве2г. В свою очередь в силу (®х, ©^-измеримости функции f множество f~l (В) при- надлежит <S>X, т. е. /-1 (g-1 (Л)) = ф-1 (Л) ен <SX, т. е. функция ср (<SX, ©2)‘измеРима- Следствие. Борелевская функция от ц-измеримой число- вой функции ц-измерима. В частности, непрерывная функция от ц-измеримой ц-измерима. В дальнейшем, в случаях, когда это не может вызвать недо- разумения, мы вместо «ц-измеримости» будем писать просто «измеримость». Теорема 2. Для того чтобы действительная функция f(x) была измерима, необходимо и достаточно, чтобы при любом дей- ствительном с множество {х:[(х) <С с} было измеримо. Доказательство. Необходимость условия ясна, так как полупрямая (—оо, с) есть борелевское множество. Для доказа- тельства достаточности заметим прежде всего, что о-алгебра, порожденная системой 2 всех полупрямых (—оо, с) совпадает с о-алгеброй всех борелевских множеств на прямой. Но, со- гласно п. 5 § 5 гл. I отсюда следует, что прообраз каждого бо- релевского множества принадлежит о-алгебре, порожденной прообразами полупрямых, принадлежащих 2, т. е. измерим. Доказанное условие часто принимают за определение изме- римости, т. е. называют функцию f(x) измеримой, если все мно- жества {х : f(x) с с} измеримы. 2. Действия над измеримыми функциями. Покажем, что со- вокупность измеримых функций, заданных на некотором мно- жестве, замкнута относительно арифметических операций. Теорема 3. Сумма, разность и произведение двух измери- мых функций измеримы. Частное двух измеримых функций, при условии, что знаменатель не обращается в нуль, тоже измеримо. Доказательство этой теоремы проведем в несколько шагов. 1) Если f измерима, то, очевидно, измеримы и функции kf и а + f при любых постоянных k и а. 2) Далее, если f и g — измеримые функции, то множество {х: / (х) > g (х)}
"284 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ (ГЛ. V измеримо. Действительно, ОО {х: f (х) > g (х)} = U ({х: f (х) > г*} f| {х: g (х) < г*}), тде сумма берется по всем рациональным числам гк, занумеро- ванным в любом порядке. Отсюда получаем, что {х: f (х) > а — g(x)} = {х: f (х) + g(x) > а} измеримо, т. е. сумма измеримых функций измерима. 3) Из 1) и 2) следует измеримость разности f — g. 4) Произведение измеримых функций измеримо. Действи- тельно, воспользуемся тождеством fe=TKf + s)2-(f-s)2l‘ Стоящее справа выражение есть измеримая функция. Это вы- текает из 1)—3) и следствия из теоремы 1, в силу которого квадрат измеримой функции измерим. 5) Если f(x) измерима и /(х)=й=О, то и 1//(х) измерима. Дей- ствительно, если с > 0, то {х: 1// (х) < с) = {х: f (х) > 1 /с} (J {х: f (х) < 0}, если с < 0, то {х: 1//(х) < с) = {х: 0 > f (х) > 1/с), а если с = 0, то {х: 1//(х) < с} = {х: f(x) < с}. Каждый раз справа мы получаем измеримое множество. Из 4) и 5) следует измеримость частного (при условии g(x)=/> ¥= 0). Итак, мы показали, что арифметические действия над изме- римыми функциями снова приводят к измеримым функциям. Покажем теперь, что совокупность измеримых функций зам- кнута по отношению не только к арифметическим операциям, но и к операции предельного перехода. Теорема 4. Предел сходящейся при каждом х е X после- довательности измеримых функций измерим. Доказательство. Пусть /п(х)->/(х); тогда {х: f(x)<C) = UU А {х: fm(x)<c-\/k}. (1) k п m>n Действительно, если f(x)<c, то существует такое ч k, что /(х)< с — 2/k; далее, при этом k можно найти столь большое п.
•5 41 ИЗМЕРИМЫЕ ФУНКЦИИ 285 что при т п выполнено неравенство fm(x)<C— 1/fe, а это и означает, что х войдет в правую часть (1). Обратно, если х принадлежит правой части равенства (1), то существует такое k, что при всех достаточно больших, т fm(x)<C— \/k, но тогда f(x)<Z. с, т. е. х входит в левую часть равенства (1). Если функции fn(x) измеримы, то множества {*: L(x) <с — 1/fe) измеримы. Так как совокупность измеримых множеств есть <т-алгебра, то в силу (1) множества {Х-. f (х) < с} тоже измеримы, что и доказывает измеримость f(x). Замечание. Как видно из сказанного, понятие измеримо- сти функции не связано с наличием в рассматриваемых про- странствах какой-либо меры. Должны лишь быть выделены си- стемы множеств, называемых измеримыми. Однако фактически понятие измеримости используется, как правило, для функций, определенных на некотором пространстве X с фиксированной мерой, заданной на какой-либо о-алгебре его подмножеств. Именно эта ситуация и будет рассматриваться в дальнейшем. Как уже было отмечено, о-аддитивную меру, определенную на о-алгебре ® подмножеств некоторого множества X, можно без ограничения общности считать полной, т. е. считать, что если А— измеримое множество меры нуль, то всякое его под- множество А' измеримо (и, конечно, ц(Д')—0). Это условие полноты меры мы всюду в дальнейшем будем предполагать вы- полненным. 3. Эквивалентность. При изучении измеримых функций часто можно пренебречь их значениями на множестве меры нуль. В связи с этим возникает следующее определение. Определение 2. Две функции, f и g, заданные на одном и том же измеримом множестве Е, называются эквивалентными (обозначение: f ~ g), если Н{х: f(x)^g(x)}=0. Введем еще следующую терминологию. Говорят, что некото- рое свойство выполнено почти всюду на Е, если оно выполнено на Е всюду, кроме, быть может, точек, образующих множество керы нуль. Таким образом, две функции называются эквива- лентными, если они совпадают почти всюду.
286 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V Теорема 5. Функция f(x), определенная на некотором из- меримом множестве Е и эквивалентная на нем некоторой изме- римой функции g(x), тоже измерима. Доказательство. Из определения эквивалентности сле- дует, что множества {х :f(x)< а} и {x:g(x)<a} могут отличаться друг от друга только на некоторое множество меры нуль, следовательно (поскольку мера предположена пол- ной), если второе из них измеримо, то измеримо и первое. Замечание. В классическом анализе понятие эквивалент- ности функций не играет существенной роли, так как там в основном рассматриваются непрерывные функции одного или нескольких переменных, а для них эквивалентность равносильна тождественности. Точнее, если две функции, fug, непрерывные на некотором сегменте Е, эквивалентны (относительно меры Ле- бега), то они совпадают. Действительно, если f(x0) =# g(x0) в какой-либо точке х0, то в силу непрерывности f и g найдется окрестность точки х0, во всех точках которой f(x) =/= g(x). Мера такой окрестности положительна, поэтому непрерывные функ- ции не могут быть эквивалентны, если они не совпадают. Для произвольных измеримых функций эквивалентность во- все не означает совпадения. Например, функция на прямой, рав- ная единице в рациональных точках и нулю в иррациональных, эквивалентна функции, тождественно равной нулю. 4. Сходимость почти всюду. Поскольку во многих случаях поведение измеримой функции на том или ином множестве меры нуль для нас несущественно, будет естественно ввести следую- щее обобщение обычного понятия поточечной сходимости. Определение 3. Последовательность {fn(x)} функций, определенных на некотором пространстве X с заданной на нем мерой, называется сходящейся почти всюду к функции f(x), если lim fn (х) = f (х) (2) для почти всех хе X (т. е. множество тех точек х, в которых (2) не выполняется, имеет меру нуль). Пример. Последовательность функций fn(x) = (—х)п опре- деленных на отрезке [0,1], при п->оо сходится к функции f(x)s 0 почти всюду (а именно, всюду, кроме точки х = 1). Теорема 4 допускает следующее обобщение. Теорема 4'. Если последовательность измеримых функций fn(x) сходится к функции f(x) почти всюду на X, то f(x) также измерима. Доказательство. Пусть А — то множество, на котором lim f„(x) = f(x). n->“>
ИЗМЕРИМЫЕ ФУНКЦИИ 287 § fl По условию, ц(Х\Л) = 0. Функция f(x) измерима на А, а так как на множестве меры нуль, очевидно, вообще всякая функция измерима, то f(x) измерима на Х\4, следовательно, она из- мерима и на множестве X. Упражнение. Пусть последовательность измеримых функций 1п(х) сходится почти всюду к некоторой предельной функции f(x). Доказать, что последовательность fn(x) сходится почти всюду к g(x) в том и только том случае, если g(x) эквивалентна f(x). 5. Теорема Егорова. В 1911 г. Д. Ф. Егоровым была дока- зана следующая важная теорема, устанавливающая связь ме- жду понятиями сходимости почти всюду и равномерной сходи- мости. Теорема 6. Пусть Е— множество конечной меры и после- довательность измеримых функций fn(x) сходится на Е почти всюду к f(x). Тогда для любого б>0 существует такое изме- римое множество Е& cz Е, что О Н(£е)> н(£) —6; 2) на множестве Е& последовательность fn(x) сходится к f(x) равномерно. Доказательство. Согласно теореме 4' функция f(x) из- мерима. Положим Еп = А {Х-. I f 1 (*) - f(x) | < \jm}. i~^n Таким образом, Е™ при фиксированных тип означает мно- жество всех тех точек х, для которых 1Л(х) — f(x)|< 1/щ при всех i п. Пусть Ет = U Е™. 72—1 Из определения множеств Е™ ясно, что при фиксированном т ЕГ azE^az... azE™ az ... В силу того, что о-аддитивная мера непрерывна, для любого т и любого б> 0 найдется такое п0(пТ), что р(Ет\Е^т})<б/2т. Положим оо Е& = A Еп,(т)> m=l и покажем, что так построенное Е& удовлетворяет требованиям теоремы.
288 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ (ГЛ, V Докажем сначала, что на Е6 последовательность {А(х)} схо- дится равномерно к функции f(x). Это сразу вытекает из того, что если х е Е6, то для любого т I fi (х) — f (х) | < \/т при i > п0 (т). Оценим теперь меру множества Е\Ев. Для этого заметим, что при всяком т имеем ц (Е\Ет) = 0. Действительно, если х0 е е£ \Ет, то существуют сколь угодно большие значения при которых 1Л(*о) — f (Xq) 1> 1М, т. е. последовательность {fn(x)} в точке х0 не сходится к f(x). Так как, по условию, {fn(x)} сходится к f(x) почти всюду, то |1(Е\Егп)=0. Отсюда следует, что Н (Е \ Е£ (т)) = И (Em \ EZ (т)) < 6/2m. Поэтому (оо \ Z оо \ Е\ П £”.(т)) = Л J (E\E£m)J< < £ М-(Е\ ££(„.)) < f 2^ = 6. Теорема доказана. 6. Сходимость по мере. Определение 4. Говорят, что последовательность измери- мых функций fn(x) сходится по мере к функции f(x), если для любого о > 0 lim ц{х: IM*) —f(x)|>o} = 0. П->«> Нижеследующие теоремы 7 и 8 устанавливают связь между понятиями сходимости почти всюду и сходимости по мере. Как и в предыдущем пункте рассматриваемая мера предполагается конечной. Теорема 7. Если последовательность измеримых функций {fn(x)} сходится почти всюду к некоторой функции f(x), то она сходится к той же самой предельной функции f(x) по мере. Доказательство. Из теоремы 4' следует, что предель- ная функция f(x) измерима. Пусть А — то множество (меры нуль), на котором fn(x) не стремятся к f(x). Пусть, далее, Ek (о) = {х: I fk (х) — f (х) |> о), 00 оо (о) = U Ek (о), Л4=П^п(о). k=fl
5 4] ИЗМЕРИМЫЕ ФУНКЦИИ 289 Ясно, что все эти множества измеримы. Так как /?, (or) ZD R2 (or) ZD то в силу свойства непрерывности меры I*(/?Я(а))-*I*(Л!) при п—>оо. Проверим теперь, что М с А. (3) Действительно, если х0^А, т. е. если lim fa (х0) = f W, П->оо то для данного о > 0 найдется такое п, что I fk (*о) — f (*о) | < о, при k>n, т. е. Хо^^п(ог) и, тем более, х0<£ М. Но ц(Л) = 0, и поэтому из (3) вытекает, что ц(Л4) = 0, и, следовательно, Ц (Rn (ц)>—* 0 при п—>оо; так как Еп(о) <=/?п(<т), то теорема доказана. Нетрудно убедиться, что из сходимости последовательности функций по мере, вообще говоря, не следует ее сходимость почти всюду. Действительно, определим для каждого натураль- ного k на полуинтервале (0, 1] функции ..... следующим образом: при при остальных значениях х. Занумеровав все эти функции подряд, мы получим последо- вательность, которая, как легко проверить, сходится по мере к нулю, но в то же время не сходится ни в одной точке (дока- жите это!). Упражнение. Пусть последовательность измеримых функций {f„(x)} сходится по мере к некоторой предельной функции Цх). Доказать, что после- довательность {fn (х)} будет сходиться по мере к функции g(x) в том и только в том случае, если g(x) эквивалентна f(x). Хотя приведенный выше пример показывает, что теорема 7 не может быть обращена в полной мере, тем не менее справед- лива следующая теорема: Теорема 8. Пусть последовательность измеримых функций {fn(x)} сходится по мере к f(x). Тогда из этой последовательно- сти можно выбрать подпоследовательность {/пА(х)}, сходящуюся к f(x) почти всюду.
290 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V Доказательство. Пусть еь 82, ... — некоторая последо- вательность положительных чисел, стремящихся к нулю, lim 8rt = 0, п->оо и пусть положительные числа ль т]2...Лп, ••• таковы, что ряд Т]1 + Т]2 + • • • сходится. Построим последовательность индексов < «2 < • • • следующим образом: выберем пх так, чтобы ц{х: lk(x) — f (х)|>8,} < ти (такое «1 обязательно существует); далее выберем «2>^i так, чтобы Н {*: I fn, (х) — f (х) | > е2) < т]2. Вообще, выберем «а > tik-i так, чтобы Н {х; I f"k W — f (*) | > в,} < ла- Покажем, что построенная последовательность сходится к f(x) почти всюду. Действительно, пусть Ri=Я ।(х) “f(x) । Q=ДRt- Так как Ri zz> R2 zd /?3 => ... zd Rn => ..., то в силу непрерывности меры ц (/?,)-> p(Q). ио С другой стороны, ясно, что ц(/?;)< У, ла, откуда k^i ->0 при i->oo, т. е. p(Q) = 0. Остается проверить, что во всех точках множества Е \ Q имеет место сходимость ЦхНЮ. Пусть x0^E\Q. Тогда найдется такое i0, что Это означает, что для всех k io Хо Ф {*: | fnk (х) — f (х) | > еА}, т. е. I fn^ (Xfl) f (Xq) I < 84. Так как, по условию, 8j;->0, то •im fn (х0) = f (х0). й->оо я Теорема доказана.
§5) ИНТЕГРАЛ ЛЕБЕГА 291 7. Теорема Лузина. С-свойство. Определение измеримой функции, данное в самом начале этого параграфа, относится к функциям на произвольных множествах и в общем случае никак не связано с понятием непрерывной функции. Однако, если речь идет о функциях на отрезке, то имеет место сле- дующая важная теорема, установленная в 1913 г. Н. Н. Лузиным. Теорема 9. Для того чтобы функция f(x), заданная на отрезке [a, ft], была измерима, необходимо и достаточно, чтобы для любого е > 0 существо- вала такая непрерывная на [а, ft] функция <р(х), что ц{х: f (х) <р(х)} < е. Иначе говоря, измеримая функция может быть сделана непрерывной на [a, ft] путем ее изменения на множестве сколь угодно малой меры. Про функ- цию на отрезке, которая может быть сделана непрерывной с помощью такой «малой деформации», говорят, что она обладает С-свойством (термин Н. Н. Лузина). Как показывает теорема Лузина, для функций числового аргумента С-свойство можно положить в основу самого определения измери- мости. Доказательство теоремы Лузина можно получить, воспользовавшись теоремой Егорова (проведите это доказательство!). Упражнение. Доказать, что если А — измеримое множество на от- резке [a, ft], то для любого е > 0 найдутся такое открытое множество G А и такое замкнутое множество F cz А, что ц(С\4)<е и р(Д\Е)<е. § 5. Интеграл Лебега Понятие интеграла Римана, известное из элементарного курса анализа, применимо лишь к таким функциям, которые или непрерывны или имеют «не слишком много» точек разрыва. Для измеримых функций, которые могут быть разрывны всюду, где они определены (или же вообще могут быть заданы на аб- страктном множестве, так что Для них понятие непрерывности просто не имеет смысла), римановская конструкция интеграла становится непригодной. Вместе с тем для таких функций имеется весьма совершенное и гибкое понятие интеграла, вве- денное Лебегом. Основная идея построения интеграла Лебега состоит в том, что здесь, в отличие от интеграла Римана, точки х группируют- ся не по признаку их близости на оси х, а по признаку близости значений функции в этих точках. Это сразу же позволяет рас- пространить понятие интеграла на весьма широкий класс функций. Кроме того, интеграл Лебега определяется совершенно оди- наково для функций, заданных на любых пространствах с ме- рой, в то время как интеграл Римана вводится сначала для функций одного переменного, а затем уже с соответствующими изменениями переносится на случай нескольких переменных. Для функций же на абстрактных пространствах с мерой инте- грал Римана вообще не имеет смысла. Всюду, где не оговорено противное, будет рассматриваться некоторая полная ст-аддитивная мера ц, определенная на ст-ал- гебре множеств с единицей X. Все рассматриваемые множества
292 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ [ГЛ. V А ci X будут предполагаться измеримыми, а функции f (х)—> определенными для хеХи измеримыми. Нам удобно будет определить интеграл Лебега вначале для так называемых простых функций, а затем распространить его на существенно более широкий класс функций. Пункты 2—5 содержат построение интеграла Лебега для случая, когда мера всего пространства конечна. Случай бесконечной меры рассмат- ривается в п. 6 этого параграфа. 1. Простые функции. Определение 1. Функция f(x), определенная на некото- ром пространстве X с заданной на нем мерой, называется про- стой, если она измерима и принимает не более, чем счётное число значений. Структура простых функций характеризуется следующей теоремой. Теорема 1. Функция f(x), принимающая не более чем счет- ное число различных значений Уь Уг, • • •, Уп. измерима в том и только том случае, если все множества An = {x:f (х) =-- уп} измеримы. Доказательство. Необходимость условия ясна, так как каждое Ап есть прообраз одноточечного множества {уп}, а вся- кое одноточечное множество является борелевским. Достаточ- ность следует из того, что в условиях теоремы прообраз /-1(В) любого борелевского множества есть объединение U Ап не более чем счетного числа измеримых множеств Ап, т. е. измерим. Использование простых функций в построении интеграла Ле- бега будет основано на следующей теореме. Теорема 2. Для измеримости функции f(x) необходимо и достаточно, чтобы она могла быть представлена в виде предела равномерно сходящейся последовательности простых измеримых функций. Доказательство. Достаточность ясна из теоремы 4 пре- дыдущего параграфа. Для доказательства необходимости рас- смотрим произвольную измеримую функцию f(x) и положим fu(x)=mln, если m/n f(х) < (т + 1)/п (здесь m — целые, а п — целые положительные). Ясно, что функции fn(x) простые; при п -> оо они равномерно сходятся к f(x), так как Ц(х) — — fn(x) | С 1/и. 2. Интеграл Лебега для простых функций. Мы введем поня- тие интеграла Лебега сначала для функций, названных выше простыми, т. е. для измеримых функций, принимающих конечное или счетное число значений.
ИНТЕГРАЛ ЛЕБЕГА 293 § 5] Пусть f — некоторая простая функция, принимающая зна- чения Уо У г...Уп, • • •; У, У) при i Ф j, и пусть А — некоторое измеримое подмножество X. Естественно определить интеграл от функции f по множе- ству А равенством J f (х) dp = УпИ (Л), где Ап = {х: х 6= A, f (х) = уп}, (1) А п если ряд справа сходится. Мы приходим к следующему опре- делению (в котором по понятным причинам заранее постули- руется абсолютная сходимость ряда). Определение 2. Простая функция f называется интегри- руемой или суммируемой (по мере ц) на множестве А, если ряд (1) абсолютно сходится. Если f интегрируема, то сумма ряда (I) называется интегралом от f по множеству А. В этом определении предполагается, что все уп различны. Можно, однако, представить значение интеграла от простой функции в виде суммы произведений вида Ckp(Bk) и не предпо- лагая, что все Ch различны. Это позволяет сделать следующая лемма. Лемма. Пусть А = Bk, В/ Г) В, — 0 при i =/= j и пусть на каждом множестве Вь функция f принимает только одно значе- ние Ch\ тогда (x)dp. = ^Qp.(Bfe), (2) A k причем функция f интегрируема на А в том и только том слу- чае, когда ряд (2) абсолютно сходится. Доказательство. Легко видеть, что каждое множество Ап = (х:х^А, f(x) = yn} является объединением тех Bk, для которых Ch = уп. Поэтому 2 ynv (А„) = 22 уп 22 и (Bk) = £ ckp (Bk). п п ck=yn k Так как мера неотрицательна, то 12 I Уп. IН (4>)= 22 I Уп I 22 М- (Bk) — I ck IН (Bk), п п ck=yn k т. е. ряды X УпР (Ai) и 12 ckp (Bk) абсолютно сходятся или рас- п k ходится одновременно. Лемма доказана.
294 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V Установим некоторые свойства интеграла Лебега от простых функций: A) $[f(x) + g(x)]dp==^ f(x)dp + ^g(x)dp, А А А причем из существования интегралов в правой части равенства следует существование интеграла в левой. Для доказательства предположим, что f принимает значения- ft на множествах Л с Л, a g — значения g} на множествах Gj <=Л, так что /1 = $f(x)dp = ^fip(Fi), (3> A i J2=\g(x)dii = £gjn(G/). (4> A j Тогда в силу леммы / = J [f (х) + g (х)] dy = £ Е (f‘ + Si) Р (Fi П Gy); (5> A i i HO P (Fi) = Gj), p (Gj) - x p (Л n Gj), так что из абсолютной сходимости рядов (3) и (4) следует № абсолютная сходимость ряда (5); при этом J — Ji +/2. Б) Для любого постоянного k ^kf (х) dx — k f (х) dx, А А причем из существования интеграла в правой части следует су- ществование интеграла в левой части. (Проверяется непосред- ственно.) В) Ограниченная на множестве А простая функция f инте- грируема на А, причем, если | f (х) | М на А, то J f (х) dp А < Мр (Л). (Проверяется непосредственно.) 3. Общее определение интеграла Лебега на множестве ко- нечной меры. Определение 3. Назовем функцию f интегрируемой (сум- мируемой) на множестве А, если существует последовательность.
* 5] ИНТЕГРАЛ ЛЕБЕГА 295 простых интегрируемых на А функций {fn}, сходящаяся равномерно к/. Предел I = lim ( fn (х) du (6) «-►оо * А обозначим $ f (*) dp А и назовем интегралом функции f по множеству А. Это определение корректно, если выполнены следующие условия: 1. Предел (6) для любой равномерно сходящейся последо- вательности простых интегрируемых на А функций существует. 2. Этот предел при заданной функции f не зависит от вы- бора последовательности {/п}. 3. Для простых функций определение интегрируемости и ин- теграла равносильно данному в п. 2. Все эти условия действительно выполнены. Для доказательства первого достаточно заметить, что в силу свойств А), Б) и В) интеграла от простых функций, {fn(x)dp — \fm(x)dp (A)sup |f„(x) —fm(x)|. (7) А 1 ХеА Для доказательства второго условия надо рассмотреть две последовательности, {/«} и {/"„}, сходящиеся к f. Если бы пре- дел (6) для этих двух последовательностей принимал различные значения, то для последовательности, полученной объединением этих двух, предел (6) не существовал бы, что противоречит пер- вому условию. Наконец, для доказательства справедливости третьего условия достаточно рассмотреть последовательность, в которой [п равняется f для всех п. Замечание. Мы видим, что в построении интеграла Ле- бега имеются два существенных этапа. Первый — непосредствен- ное определение интеграла (как суммы ряда) для некоторого класса функций (простых суммируемых функций), достаточно простого и в то же время достаточно обширного, второй — рас- пространение определения интеграла на существенно более ши- рокий класс функций с помощью предельного перехода. По су- ществу, сочетание этих приемов — непосредственного конструк- тивного, но узкого определения и последующего предельного пе- рехода присутствует в любом построении интеграла. Установим основные свойства интеграла Лебега. Непосред- ственно из определения следует, что: I. J 1 • dp = ц (А). (8)
296 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [Гл.-У II. Для любого постоянного k ^kf (x)dn^k^f (x)dn, (9) A A причем из существования интеграла в правой части вытекает существование интеграла в левой. Это свойство выводится при помощи предельного перехода из свойства Б) для интеграла от простых функций. III. Аддитивность: 5 If (*) + g (*)Иц = f (x)dp + jj g (х)Др, (10) A A A причем из существования интегралов в правой части вытекает существование интеграла в левой. Доказательство получается. предельным переходом из свой- ства А) интеграла от простых функций. IV. Ограниченная на множестве А функция f интегрируема на А. Доказательство получается предельным переходом из свой- ства В) интеграла от простых функций, с использованием тео- ремы 2. V. Монотонность: если f(x)^ 0, то f (х) йц О А (И) (в предположении, что интеграл существует). Для простых функций это утверждение следует прямо .из- определения, а в общем случае его можно вывести, заметив, что если f измерима и неотрицательна, то найдется равномерно схо- дящаяся к ней последовательность (см. теорему 2) неотрица-г т е л ь н ы х, простых функций. Из последнего свойства сразу следует, что если f(x)^g(x)t то $ f (x)rfp> g(x)d[i, (12) А А а поэтому, если m f(x)^M для всех (или почти всех) х е А, то пц1 (А) А f (х) du (А). (13)
§ 5] ИНТЕГРАЛ ЛЕБЕГА 297 VI. Если ц(Л) = О, то J f (x)dp =0. А VI'. Если f(x) == g(x) почти всюду, то J f (x)dp = J g(x)dp, А А причем оба интеграла существуют или не существуют одновре- менно. Эти два утверждения непосредственно вытекают из опреде- ления интеграла Лебега. VII. Если функция <р интегрируема на А и почти всюду Ц(х) | ф(х), то f также интегрируема на А. Действительно, если f и ф — простые функции, то удалив из множества А некоторое множество меры нуль, оставшееся мно- жество А' можно представить как объединение конечного или счетного числа множеств, на каждом из которых f и ф постоян- ны: f(x)=an, q>(x)=bn, причем Из интегрируемо- сти ф вытекает, что X । । Н (Аг) < X (Аг) = Ф (*) dp = $ Ф (х) dp. п п А' А Поэтому f тоже интегрируема, и fMdp А f(x)dp = < п । f (*) $q>(x)dp. n A' A В общем случае это утверждение доказывается предельным пе- реходом с использованием теоремы 2. VIII. Интегралы Ii = \f(x)dp., /2 = J | f (х) |dp (14) А А существуют или не существуют одновременно. В самом деле, из существования интеграла /2 вытекает су- ществование /1 в силу свойства VII. Обратное для случая простой функции вытекает из опреде- ления интеграла, а для общего случая доказывается предельным переходом с использованием теоремы 2; при этом нужно вос- пользоваться неравенством I а |-| b |<| a-b I.
298 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V 4. о-аддитивность и абсолютная непрерывность интеграла. Лебега. В предыдущем пункте были сформулированы свойства интеграла Лебега по фиксированному множеству. Сейчас мь» установим некоторые свойства интеграла Лебега, рассматривая выражение F(A) — \f(x)dp. А как функцию множества, определенную на совокупности изме- римых множеств. Установим, прежде всего, следующее свойство: Теорема 3. Если А = U Ап; ЛгП А/ = 0 при i =/= j, то п Jf(r)dp = ^ Jf(r)dp, (15> А п Ап причем из существования интеграла в левой части вытекает су- ществование интегралов и абсолютная сходимость ряда в пра- вой части. Доказательство. Сначала проверим утверждение тео- ремы для простой функции f, принимающей значения У\, У2...Уп, • • • Пусть Bk = {x-. х<=А, f(x) = yk}, Впк = {х: х(=Ап, f(x) = yk}. Тогда J f (х)дц = £ ykn (Bk) = £ = A A An = ££уаН(Впа)==£ (16> n k n An Так как ряд в предположении интегрируемости f на А, абсолютно сходится, а меры всех множеств неотрицатель- ны, то сходятся абсолютно и все остальные ряды в цепочке равенств (16). В случае произвольной функции f из ее интегрируемости на А вытекает, что для любого е > 0 существует простая инте- грируемая на А функция g, удовлетворяющая условию lf(x)-g(r)|<8. (17> Для g имеем $g(x)4i = £ $ g(x)dn, (18> л п ап
Л 5] ИНТЕГРАЛ ЛЕБЕГА 299 причем g интегрируема на каждом множестве Ап и ряд (18) абсолютно сходится. Из этого последнего обстоятельства и из оценки (17) вытекает, что f тоже интегрируема на каждом Ап и f (х) du — ^g (х) dp < У ер (Л„) = ер (Л), $ f (х) dp — А А g(x)dp <ер(Л), что вместе с У Jf(x)dH И п Ап (18) приводит к абсолютной сходимости ряда к оценке У Jf(x)dp —Jf(x)dp <2ер(Л). п Ап А "Так как е > 0 произвольно, то У Jf(x)dp = Jf (x)dp. п Ап А Следствие. Если f интегрируема на А, то f интегрируема и на любом измеримом множестве A' cz А. Мы показали, что из интегрируемости функции f по мно- жеству А следует, что если А = U Ап и А{ П Aj = 0, то f интегрируема по каждому Ап и интеграл по А равен сумме интегралов по множествам Ап. Это утверждение может быть обращено в следующем смысле. Теорема 4. Если А = U Ап, Ai(}Al — 0 при I =/= / и ряд п У JiЦх)|</р (19) п Ап сходится, то функция f интегрируема на А и \f(x)dp = Yj А п Ап Доказательство. Новым по сравнению с предыдущей теоремой здесь является утверждение, что из сходимости ряда (19) вытекает интегрируемость f на А. Сначала проведем доказательство для случая простой функ- ции f, принимающей значения Положив Bt = {х: х е A, f (х) = fj, Anl = Ап f|
300 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V имеем " Ап ' Из сходимости ряда (19) вытекает, что сходятся ряды S Si Мн(лп<)=Е гш(в.). п i i Сходимость последнего ряда означает, что существует инте- грал f W du == У fiH (Bi). A I В общем случае аппроксимируем f простой функцией f так, что lfW-f(x)|<8. (20) Тогда §lf (х) |dp< ^|f(x)|dp + e^(4„), Ап Ап и так как ряд Е Н (А>) — Н И) сходится, из сходимости ряда (19) п вытекает сходимость ряда п Ап т. е. по только что доказанному, интегрируемость на А простой функции f. Но тогда в силу (20) исходная функция f тоже ин- тегрируема на А. Теорема доказана. Неравенство Чебышева. Если ф(х)0 на А и с > 0, го ц{х: х е А, ф (х) >с} ф (x)dp. (21) А Действительно, пусть А' = {х: х е А, ф (х) с). Тогда ? Ф (х) du = \ ф (х) dp 4- \ ф (х) du > \ ф (х) du ср (Д'). А А- А\А' А' Следствие. Если ^|f(x)|dp = 0, А то f (х) = 0 почти всюду.
§ 5У ИНТЕГРАЛ ЛЕБЕГА 301 В самом деле, в силу неравенства Чебышева, имеем А для всех п. Поэтому оо : х е Л, f (х) #= 0} У ц | х-. х е Л, п=1 В предыдущем пункте было указано, что интеграл Лебега по множеству нулевой меры равен нулю для любой функции f. Это утверждение можно рассматривать как предельный слу- чай следующей важной теоремы. Теорема 5 (абсолютная непрерывность инте- грала Лебега). Если f(x)—суммируемая на множестве А функция, то для каждого е > 0 существует такое б > 0, что \f(x}dp <е е для всякого измеримого е cz А такого, что р(е) < б. Доказательство. Заметим прежде всего, что наше утвер- ждение очевидно, если / ограничена. Пусть теперь f — произ- вольная суммируемая на А функция. Положим A„ = {x: х^А, n<| f(x) | < п-ф 1} и N &N — U Л1я, л=0 CN — А \ BN. Тогда в силу теоремы 3 ОО А л=0 Ап Выберем N так, что оо У I f (х) |dg = | f (х) |du < ~, n=N + i Cft и пусть А Д ______________£______ 0 2 (/V ч- 1) ' Если теперь р(е) < б, то е ^|f(x)|dp= $ | f (х) | dp + |f(x)|dp. « eflCjy
302 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ |ГЛ. V Первый из стоящих справа интегралов не превосходит е/2 (свойство V), а второй — не больше, чем интеграл, взятый по всему множеству Ск, т. е. также не превосходит е/2; таким об- разом, получаем $ | f(x) |dp < е. е Установленные свойства интеграла как функции множества при- водят к следующему результату. Пусть f — неотрицательная функция, суммируемая на пространстве X по мере ц. Тогда функция F (А}=^ f (х) dp. А определена для всех измеримых множеств A cz X, неотрицатель- на и о-аддитивна, т. е. удовлетворяет условию-, если А = J Ап и п Ai П А, — 0, го F (Д) — 2 F (Дп). Иными словами, интеграл от п неотрицательной функции обладает как функция множества все- ми свойствами а-аддитивной меры. Эта мера определена на той же о-алгебре, что и исходная мера ц, и связана с ц условием: если ц(Д) = 0, то и ^(Д) = 0. 5. Предельный переход под знаком интеграла Лебега. Вопрос о предельном переходе под знаком интеграла, или, что то же самое, о почленном интегрировании сходящегося ряда, часто возникает в различных задачах. В классическом анализе устанавливается, что достаточным условием возможности такого предельного перехода является равномерная сходимость соответствующей последовательности (ряда). Сейчас мы установим некоторые теоремы о предельном пе- реходе под знаком интеграла Лебега, представляющие собой далеко идущие обобщения соответствующих теорем классиче- ского анализа. Теорема 6 (Лебег). Если последовательность {/п} на А сходится к f и при всех п I fn to К Ф (х), где <р интегрируема на А, то предельная функция f интегрируема на А и fn (x)dp-+ f (x)dg. A A Доказательство. Из условия теоремы легко следует, что |/(х)|^ф(х). Поэтому f (п. 3, свойство VII) интегрируема.
§ 51 ИНТЕГРАЛ ЛЕБЕГА ЗЭЗ Пусть е > 0 произвольно. По теореме 5 (об абсолютной непре- рывности интеграла) найдется такое б > 0, что если р(В) •< б, то ) Ф (х) dp < . в (22) В силу теоремы Егорова множество В, удовлетворяющее усло- вию р(В) < б, можно выбрать так, что последовательность {fn} сходится на С = А \ В равномерно. Следовательно, най- дется такое N, что при и А' и хе С выполнено неравенство I f ('*') fn(x)\ < 2fl (Q • Тогда ^f(x)dp — fn(x)dp = [f (x) — fn(x)]dp + ^f(x)dp — fn(x)dp, Л А С В В и так как |f(x) | ф(х) и |fn(x) | ф(х), то в силу (22) по- лучаем J f W dp — j fn (x) dp A A Следствие. Если == const и то \fn(x)dp-^^f(x) dp. А А Замечание. Поскольку значения, принимаемые функцией на множестве меры 0, не влияют на величину интеграла, в тео- реме 6 достаточно предположить, что {fn} сходится к f почти всюду и что каждое из неравенств |fn(*) I ф(х) также вы- полняется лишь почти всюду. Теорема 7 (Б. Леви). Пусть на множестве А fi (*)<f2(x)^...^fn(x)^..., причем функции fn интегрируемы и их интегралы ограничены в совокупности 5 fn (х) dp < к. А Тогда почти всюду на А существует (конечный) предел f (х)— Um fn(x), (23) Л->оо функция f интегрируема на А и \fn{x)dp-^^f(x)dp.
304 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V При этом на множестве, на котором предел (23) не суще’ ствует, функцию f можно задать произвольно, например, поло-* жив на этом множестве f(x) = 0. Доказательство. Будем предполагать f i (х) 0, так как общий случай легко сводится к этому путем перехода к функ- циям Рассмотрим множество й = {х: х е A, fn(x)-+ оо). Легко видеть, что й = Q J ', где й„г) = {х: xs.4, fn(x)>r}. В силу неравенства Чебышева (21) pW^K/r. Так как йГcz oJPcz ... cz й'Р cz ..то ц (U </C/r; но при любом г Й <=. J Й^, п поэтому ц(й)^/</г. Ввиду произвольности г отсюда следует, что И (й) == 0. Тем самым доказано, что монотонная последовательность {/„ (х)} почти всюду на А имеет конечный предел f(x). Обозначим через Аг множество тех точек хе.4, для которых г-К/(х)<г, г=1, 2..... и положим ср(х) = г на Аг. Если будет доказана интегрируемость ср(х) на А, то утвер- ждение нашей теоремы сделается непосредственным следствием теоремы 6. Положим bs= U 4- Г=! Так как на Bs функции fn и f ограничены и всегда ср(х)^ f(x)-f- 1, то \ Ф (х) dp < f (х) dp + pi (А) = lim fn (х) dp + ц. (А)<К + ц (Д). в3 . "“>0° bs
ИНТЕГРАЛ ЛЕБЕГА 395 $5] Но ( Ф (х) dp = £ гц (ЛД bs ' г=‘ Ограниченность же этих сумм означает сходимость ряда оо У гр (Лг) = J ф (х) dp. г=1 А Таким образом, интегрируемость ф на А доказана. Условие мо- нотонного неубывания функций fn(x) можно, очевидно, за- менить в доказанной теореме условием их монотонного невоз- растания. Следствие. Если фп (х) 0 и оо X 5 < °°> п=1 А оо то почти всюду на А ряд У, (х) сходится и п=1 / оо \ по и У w) =У (*)d^- А 4=1 ' п=1 А Теорема 8 (Фату),. Если последовательность измеримых неотрицательных функций {Д} сходится почти всюду на А к f и \fn(x)dp^K, А то f интегрируема на А и dy- К' А Доказательство. Положим фп (х) = inf Д(х); k > п <рп измерима, так как {х: ф„ (х) < с) = J {x: f Дх) < с}. Далее, 0 «^ф„ (хХМх), поэтому ф„ интегрируемы, и $ ф™ W < jj fn (х) dp < К; А А
306 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ (ГЛ. V наконец, Ф1 (х) <ф2(х)< ... <ф„(х)< ... и lim фп (x) = f(x) п-*оо почти всюду. Поэтому, применяя предыдущую теорему к {ср«}, получаем требуемый результат. 6. Интеграл Лебега по множеству бесконечной меры. До сих пор, говоря об интеграле и его свойствах, мы считали, что рас- сматриваются функции, заданные на том или ином измеримом множестве конечной меры. Однако часто приходится иметь дело с функциями, заданными на множестве, мера которого беско- нечна, например, на прямой с лебеговой мерой на ней. Поэтому важно распространить понятие интеграла и на этот случай. Мы ограничимся при этом тем практически наиболее существенным случаем, когда рассматриваемое множество X может быть пред- ставлено как сумма счетного числа множеств конечной меры: М*п)<оо. (24) п Если пространство X, в котором задана мера ц, представимо как сумма счетного числа множеств конечной меры, то мера ц на X называется о-конечной (см. п. 3 § 3). Примерами о-конеч- ных мер служат меры Лебега на прямой, плоскости, в л-мерном. пространстве. Меру, не удовлетворяющую условию о-конечности, можно получить, например, приписав каждой точке на прямой вес 1. Тогда все подмножества прямой можно считать измери- мыми, причем конечные множества будут иметь конечную меру,, а остальные — бесконечную. Назовем исчерпывающей последовательностью всякую моно- тонно возрастающую последовательность {Хп} измеримых под- множеств множества X, удовлетворяющую условию (24). Вве- дем теперь следующее определение. Определение 4. Измеримая функция f, определенная на множестве X с о-конечной мерой ц, называется суммируемой на X, если она суммируема на каждом измеримом подмножестве А сд X конечной меры и если для каждой исчерпывающей после- довательности {Хп} предел lim ( f (х) dp (25) n-*°o J Лп существует и не зависит от выбора этой последовательности. Этот предел называется интегралом от f по множеству X и обозначается символом f (*) х
$ 5] ИНТЕГРАЛ ЛЕВЕГА 307 Ясно также, что если функция f равна нулю вне некоторого множества конечной меры, то для нее только что сформулиро- ванное определение интеграла равносильно тому, которое было дано в п. 3. Замечание. Определение интеграла от простой функции, данное в п. 2, можно дословно перенести на случай бесконечной меры. Ясно при этом, что для суммируемости простой функции необходимо, чтобы каждое отличное от нуля значение она при- нимала только на множестве конечной меры. Определение сум- мируемости, данное в п. 3, существенно связано с предположе- нием конечности меры множества X. Действительно, если g(X)=oo, то из равномерной сходимости последовательности простых суммируемых функций {<рп} не следует, вообще говоря, сходимость последовательности их интегралов (приведите при- мер!). Результаты, изложенные в пп. 3 и 4 для случая конечной меры, в основном переносятся на интегралы по множеству бес- конечной меры. Существенное отличие состоит в том, что в случае р(Х) = оо ограниченная измеримая функция на X не обязана быть сум- мируемой. В частности, если р(Х)=оо, то никакая отличная от нуля константа не интегрируема на X. Читатель без труда проверит, что теоремы Лебега, Б. Леви и Фату остаются справедливыми в случае бесконечной меры. 7. Сравнение интеграла Лебега с интегралом Римана. Выяс- ним связь между интегралами Лебега и Римана. При этом мы ограничимся простейшим случаем линейной меры Лебега на прямой. Теорема 9. Если существует интеграл Римана ъ I = \ f W dx, а, то f интегрируема на [а, Ь] по Лебегу и 5 f(x)dn = Z. [а. И Доказательство. Рассмотрим разбиение отрезка fa, b] на 2п частей точками хк = а + ~ (Ь — а) и соответствующие этому разбиению суммы Дарбу: 2П 2П Qn = ^r-XMnk’ ап = -^г-'^ГПпк’ к=1 А=1
308 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ [ГЛ. V где Mnk — верхняя грань f на отрезке xfe_, a тпк— нижняя грань f на том же отрезке. По определению интеграла Римана, / = ПтЙп = Птип- П->ОО И->ОО Положим fn (х) = Мпк при Xfe-J < X < хк, 1п(,х) = тпь при xi_1<x<xJi,. В точке х = b функции fn и fn можно доопределить произволь- но. Легко вычислить, что j fn(x)dii = Qn, $ f_n(x)dii = an. [a, b] [a, 6] Так как последовательность {fn} не возрастает, а последова- тельность {fn} не убывает, то почти всюду L (*) - f (х) > f (х), _fn (X) -_f (X) < f (X). По теореме Б. Леви \ f (x)dp = lim Q„ = I = lim con = \ f(x)dp. . ti n->OO J la, Ы [a, 6] Поэтому J I f (x) —£(x) = J (f (x) — f_(x)) dp = 0 la, b] la, b] и, следовательно, почти всюду f(x) -f(x) = O, т. e. f (x) =/(x)=f(x) и jj f(x)dp = /. [a, 6] Теорема доказана. ₽ Легко указать примеры ограниченных функций на некото- ром отрезке, интегрируемых по Лебегу, но не интегрируемых по Риману (например, уже упоминавшаяся функция Дирихле на отрезке [0, 1], равная 1 для рациональных и 0 для иррациональ- ных х). Неограниченные функции вообще не могут быть инте- грируемы по Риману, но многие из них интегрируемы по Лебегу.
§ 5] ИНТЕГРАЛ ЛЕБЕГА 30» В частности, любая функция f(x)^O, для которой интеграл Римана ь f (х) dx а+8 существует при каждом е> 0 и имеет конечный предел / при е->0, интегрируема по Лебегу на [а, Ь], причем ь f(x)dp = lim f(x)dx. [а, 6] 8->° а+е Несобственный интеграл ъ lim \ f (х) dx е-»0 J а+е в случае, когда lim е->0 Jj |f(x)ldx = а+е оо, не существует в лебеговом смысле, поскольку, согласно свой- ству VIII п. 3, из суммируемости функции /(х) следует, что и функция |^(х) I тоже суммируема. Например, интеграл 1 1 . 1 , — sin —dx X X о существует как (условно сходящийся) несобственный интеграл Римана, но не существует как интеграл Лебега. Если рассматривается функция на всей прямой (или полу- прямой), то интеграл Римана для такой функции может суще- ствовать лишь в несобственном смысле. Опять-таки, если такой интеграл сходится абсолютно, то соответствующий лебегов ин- теграл существует и имеет то же самое значение. Если же этот интеграл сходится лишь условно, то в лебеговом смысле функ- цня не интегрируема. Например, функция —-—не интегрируема по Лебегу на всей прямой, поскольку — ОО
310 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ ГГЛ. V Однако несобственный интеграл оо Ssin X . -----ах, X ’ — оо как известно, существует, и равен л. § 6. Прямые произведения систем множеств и мер. Теорема Фубини В анализе важную роль играют теоремы о сведении двой- ного (или вообще многократного) интеграла к повторному. В теории кратных интегралов Лебега основным результатом яв- ляется так называемая теорема Фубини, которая будет до- казана в конце этого параграфа. Предварительно мы установим некоторые вспомогательные понятия и факты, имеющие, впро- чем, и самостоятельный интерес. 1. Произведения систем множеств. Множество Z упорядочен- ных пар (х, у), где хеХ, у^¥, называется прямым произве- дением множеств X и У и обозначается X X У. Аналогично, множество Z упорядоченных конечных последовательностей (хь х2, ..., хп), где xh^Xh, называется прямым произведением множеств Xj, Х2, ..., Хп и обозначается z=x,xx2x ••• xx„=lx|xt. В частном случае, когда Х1 = Х2 = ... = хп = х, множество Z есть п-я степень множества X: Z = X\ Например, координатное n-мерное пространство Rn есть п-я •степень числовой прямой R1. Единичный куб 1п, т. е. множество элементов из Rn с координатами, подчиненными условию 0^xft^l, k=l, 2.........п, является n-й степенью единичного сегмента Z1 = [0, 1]. Если 6^ <э2, •••• —системы подмножеств множеств Хь Х2, .... Хп, то ... обозначает систему подмножеств множества X — |xl X*, пред- ставимых в виде А-АХЛХ ••• ХЛ, где
5 61 ПРЯМЫЕ ПРОИЗВЕДЕНИЯ СИСТЕМ МНОЖЕСТВ И МЕР 311 Если <э1 = <э2= ... = <®п = ®, то 91 есть n-я степень си- стемы ®: й = @я. Например, система параллелепипедов в R” есть п-я степень системы отрезков в R*. Теорема 1. Если <эь <э2........®п — полукольца, то и = 1x1®* есть полукольцо. Доказательство. Согласно определению полукольца нам нужно проверить, что если А, Вей, то Л f) Be да, и если, m кроме того, BczA, то А= J С{, где С[ = В, С/ПС/= 0 при /=#/ и С\еда (Z=l, 2....п). Проведем доказательство для случая п = 2. , I. Пусть Ле<э1Х®2. Be(5|XS2; это значит, что д=Л1ХД2, Л,е®1, Л2е®2, B = BiXB2, Bi^&lt В2е®2. Тогда АПВ = (Д1ПВ1)Х(Д2ПВ2), и так как Л1ПВ1е®1, Д2Г1В2е®2, то ДПВе®| Х®2- II. Предположим теперь, дополнительно, что В! с: Л, В2сА2; в силу того, что ®i и ®2 — полукольца, имеют место разложе- ния: Д^В.ивР’и ... ив?’, л2 = в2ивУ’и ... ив?’. Но тогда д = д1ХД2 = (В1ХВ2)и(в1 ХВ?’) U ... U(BiXB?’)U и (Bi1’ X в2) и (Bi1’ х в?’) и ... и (Bi1’ X в?’) и и (В?’ х в2) и (в?’ х В<2”) и ... и (в?’ х в?’). Первым членом этого разложения служит В] X В2 = В, и все члены принадлежат системе ®] X ®2- Теорема доказана. Однако из предположения, что системы суть кольца (или о-алгебры), еще не вытекает, вообще говоря, что произведение 1х!®* будет кольцом (соответственно о-алгеброй). ь
312 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ [ГЛ V 2. Прэизведения мер. Пусть на полукольцах <5Ь <э2, ..., заданы меры Hi (А), Нг(Л2), • ••, m(Ai), AeSj. Для простоты будем считать эти меры конечными, хотя изла- гаемые ниже рассуждения и факты переносятся, без существен- ных изменений, на случай о-конечных мер (см., например, [21]). Определим на полукольце «л=е,х@2Х... х®я (1) меру и = Hi X р2 X • • • X (2) формулой И (Л) = Р1 (А) р2 (Л2) ... р„ (Л„), (3) где • Л = л, X А X • • X Л- Следует еще доказать, что р(Л) —действительно мера, т. е. что эта функция множества аддитивна. Сделаем это для случая п — 2. Пусть дано разложение Л = Л1ХЛ,= иЯ(*’. B(i)OB(/) = 0 при £=#=/, k Bw = B\k} x В?\ В силу леммы 2 § 5 гл. I существуют такие разложения л, = исГ, л2=1М\ т п что множества В\к} являются объединениями некоторых C(im), и множества — объединениями некоторых С2п). Очевидно, что и (Л) = И! (А) ц2 (Л2) = Е Е m (сГ) И2 (сП (4) п т ц = Ц1 (s!fe)) Ц2 ($*>) = Е Е (с!т)) (с^), (5) т п причем в (5) справа сумма берется по всем с\т} с: В^ и cz cz В^, а в правой части равенства (4) стоят по одному разу все члены, появляющиеся в правых частях равенств (5). По- этому и(Л)=Ен(йД k что и требовалось доказать. Таким образом, в частности, аддитивность элементарных мер в n-мерном евклидовом пространстве следует из аддитивности линейной меры на прямой.
§6] ПРЯМЫЕ ПРОИЗВЕДЕНИЯ СИСТЕМ МНОЖЕСТВ И МЕР 313 Меру (2), заданную на полукольце (1) формулой (3), мы будем называть произведением мер pb ..., цп. Теорема 2. Если меры ц2, • • •, Нп а-аддитивны, то с-ад- дитивна и мера ц = щ X Иг X • • • X Доказательство проведем для случая п = 2. Обозначим оо через Xi лебегово продолжение меры ць Пусть C=U С„, где п=1 Сп П Ст = 0 при п =# т, причем С и Сп входят в ®i X ®2, т. е. С=ДХВ, AeSb Сп = АпХВп, Вп^02, Пусть множества А и Ah А2, ... лежат в пространстве X. По- ложим для хе X _ ( Ц2(В„), если х <= А„, In W | Q, если х ф Д* Легко видеть, что для х е А Ег„(х) = р2(в), п поэтому в силу следствия из теоремы Б. Леви (см. стр. 305) У J fn (х) dkx = J ц2 (В) dkx = Aj (А) ц2 (В) = Pi (А) ц2 (В), п А А НО jj fn(x) dkl = ц2(В„) pi (An) = р (С„) А и, следовательно, 1и(С„) = р(С). п Если Ц], ..., о-аддитивные меры, заданные соответственно на <т-алгебрах ..., 0п, то их произведением мы назовем ле- бегово продолжение меры щ X М-2 X • • • X Будем обозначать его символом И! ® Ц2 ® ® Ц„ или ® |Xfe- В частности, при И1 = И2= ... = [!„==[! получаем п-ю степень меры ц: Например, n-мерная мера Лебега рп есть ц-я степень линейной меры Лебега ц.
314 МЕРА. ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ (ГЛ. V Заметим, что произведение мер автоматически оказывается полным (даже если меры рь ..., цп были неполны). 3. Выражение плоской меры через интеграл линейной меры сечений и геометрическое определение интеграла Лебега. Пусть область G на плоскости (х, у) ограничена вертикалями х = а, у = b и кривыми у = ф (х), у = ф (х). Как известно, площадь области G выражается интегралом ь V (G) = {<Р W— t (*)} dx. а При этом разность ф(х0) —ф(хо) равна длине сечения обла- сти G вертикалью х = х0. Нашей задачей является перенести такой способ измерения площадей на произвольные меры-про- изведения Ц = Рх ® Ру В дальнейшем будет предполагаться, что меры рх и опреде- лены на о-алгебрах, о-аддитивны и обладают свойством полноты (если В cz А и р(Л) = 0, то В измеримо), которым, как указы- валось ранее, обладают все лебеговы продолжения. Введем обозначения: Лх == {у : (х, у) е Л} (х фиксировано), Ау — {* : (х> У) s Л} (у фиксировано). Если X и Y — числовые прямые (а XX Y— плоскость), то ЛХо есть проекция на ось У сечения множества Л вертикальной прямой X = х0. Теорема 3. В перечисленных выше предположениях для любого ^-измеримого множества1) А Ц И) = J (Лх) dpx = $ цх (Ay) dp.у. X Y Доказательство. Достаточно доказать равенство И (Л) = фл (х) dux, где фд (х) = ру (Лх), (6) х так как второе утверждение теоремы вполне аналогично пер- ') Заметим, что интегрирование по X фактически сводится к интегриро- ванию по множеству А у с: X, вне которого подынтегральная функция У г г равна нулю. Аналогично, \ == \ .
§ 61 ПРЯМЫЕ ПРОИЗВЕДЕНИЯ СИСТЕМ МНОЖЕСТВ И МЕР 315 вому. Заметим, что теорема автоматически включает в себя утверждение, что при почти всех х (в смысле меры цж) множе- ства Ах измеримы относительно меры pv и что функция <ра(*) измерима относительно меры цх. Без этого формула (6) не име- ла бы смысла. Мера ц — это лебегово продолжение меры m — цх X Цу. определенной на системе множеств вида А — ДУлХЛХ1. Для таких множеств равенство (6) очевидно, так как для них . . ( Ру (At,) При X Е= фд (X) = S Л . ™ (. 0 при х ф Ау,. Без труда переносится равенство (6) и на множества из 9?(®т), разложимые в конечную сумму попарно непересекаю- щихся множеств из Доказательство равенства (6) в общем случае опирается на следующую лемму, которая имеет и самостоятельный интерес для теории лебеговых продолжений. Лемма. Для любого ц-измеримого множества А существует множество В вида В = П Вп, Bi=> В2=> . .. гэ Вп=> ..., п Вп = у Bnh, Вп\ се Вп2 ... се Bnk се •. , где множества Впн принадлежат 9?(®т), причем A cz В и ц(Л) = ц(В). (7) Доказательство. По определению измеримости при лю- бом п множество А можно погрузить во множество Сп = IJ Д„г — г объединение множеств Дпг из так, что р(С„)<р(Л) + 1/п. п Положим В„ = П Cft и заметим, что множества Вп имеют fe=i вид Вп — U &ns> где &ns принадлежат ®т. Положив, наконец, S k = U Ai.s> МЫ получим СИСТвМу множеств Bnk с нужными свойствами. Лемма доказана. Равенство (6) легко переносится с множеств на множества Вп и В при помощи теоремы Б. Леви (теорема 7
316 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ [ГЛ. V § 5), так как Фвп(х) = Птфв ft(x), Фз <ф3 П fe->00 Пл nt ф3(х) = НпГф3 (х), Фв, > Фв2 > • • • п->°° В силу непрерывности меры эти равенства имеют место .в ка- ждой точке х. Если ц(Д) = 0, то ц(В) = 0 и почти всюду Фв (х) = Цу(Вх) = 0. Так как Ах с Вх, то для почти всех х множество Ах измеримо и Фа М = Ру(Лх)=0, Фа (хМцх = 0 = ц(Л). Следовательно, для множеств А меры нуль формула (6) верна. В общем случае представим А в виде В \ С, где в силу (7), ц(С) = 0. Так как формула (6) верна для множеств В и С, то легко видеть, что она верна и для самого множества А. Дока- зательство теоремы 3 закончено. Пусть теперь У — числовая прямая, цу— линейная мера Ле- бега, а множество А есть множество точек (х, у) вида {(х, у)-. х^М, 0<у</(х)}, (8) где М — какое-то цж-измеримое множество, а /(х)—интегри- руемая неотрицательная функция. В этом случае ( f (х) при х е М, | 0 ПрИ и Р И) = 5 f М dp.x. м Таким образом, доказана следующая теорема. Теорема 4. Интеграл Лебега неотрицательной функции f(x) равен мере ц = X ру множества А, определенного соот- ношением (8). Когда X — числовая прямая, множество М — отрезок, а функ- ция /(х) интегрируема по Риману, эта теорема сводится к из- вестному выражению интеграла через площадь, расположенную под графиком функции. 4. Теорема Фубини. Рассмотрим тройное произведение U — = XX УXX; если на X, У, Z заданы меры Цх. цу, цг, то меру Р« = Их ® Ру ®
ПРЯМЫЕ ПРОИЗВЕДЕНИЯ СИСТЕМ МНОЖЕСТВ И МЕР 317 можно определить как (Нх ® И») ® Иг, или же как Нх ® (Ну ® Иг). В действительности, как легко проверить, эти определения равносильны. Следующая т-еорема является основной в теории кратных интегралов. Теорема 5 (Фубини). Пусть меры рх и ру определены на c-алгебрах, о-аддитивны и полны; пусть, далее, р = Их ® Ну и функция f(x, у) интегрируема по мере р на множестве A^XXY- (9) Тогда ’) \f(x, у) dp. = М f (х, у) с/рЛ dp* = М f (х, у) г/рЛ dpy. (10) Л X \лх / Y \Лу / Утверждение теоремы включает в себя существование вну- тренних интегралов в скобках при почти всех значениях пере- менного, по которому берутся внешние интегралы. Доказательство. Проведем сначала доказательство для случая f(x, у)^0. С этой целью рассмотрим тройное произве- дение u = xxrxz, где третий множитель есть числовая прямая, и произведение мер Л = рх ® Pj, ® р1 = р ® р1, где р1 есть линейная лебегова мера. В U определим подмножество W условием: (х, у, W, если (х, у) е А, 0 z f (х, у). В силу теоремы 4 Л(№)= \f(x, y)dp. (11) л С другой стороны, по теореме 3 Л(Г)= JlOFxMPx, (12) х ') См. сноску на стр. 314.
318 МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ (ГЛ. V где £ = Цу X ц1 и Wx обозначает множество пар (у, z), для ко- торых (х, у, z)e W. При этом, снова по теореме 4, l(Wx)= \f(x, y)dpy. (13) Ах Сопоставляя (И), (12) и (13), получаем § / (х, у) dp = $ Н f (х, у) г/рЛ dpx, А X \ЛЖ / что и требовалось доказать. Общий случай сводится к разобранному при помощи ра- венств f(x, y) = f+(x, y)—f~(x, у), f(x, + Г(х, у)=И(х’ у). Замечание. Как показывают приводимые ниже примеры, из существования повторных интегралов и JMfdpx'jdPtf (14) X \Лл / У \Ау J не следуют, вообще говоря, ни равенства (10), ни интегрируе- мость функции f(x,y) на А. Однако, если существует хотя бы один из интегралов Ши (х, у) | dp у') dpx или $ Н | f(x, у) It/Px'jdpy, (15) х 7 Y \Ау / то f(x,y) интегрируема на А и справедливы равенства (10). Действительно, пусть, например, первый из интегралов (15) существует и равен Af. Функция fn(x, у) = min{ | f (х, у) |, п} из- мерима, ограничена, а значит, и суммируема на А. По теореме Фубини j \п (х, у) dp = $ f J f„ (x, у) dpy'j dpx < M. (16) A X \Лл 7 Функции fn образуют монотонно неубывающую последователь- ность, почти всюду сходящуюся к |f(x, у) |. По теореме Б. Леви отсюда и из неравенства (16) следует, что функция |f(x, z/) | суммируема на А. Но тогда и f(x,y) суммируема и для нее верна теорема Фубини. Отсюда вытекает наше утверждение. Мы доказали теорему Фубини в предположении, что меры р» и ру (а значит, и р) конечны. Однако, она остается справедли- вой и в случае о-конечных мер (см., например, [21], стр. 208).
§ 6] ПРЯМЫЕ ПРОИЗВЕДЕНИЯ СИСТЕМ МНОЖЕСТВ И МЕР 319 Приведем примеры функций, для которых существуют повторные интег- ралы (14), но равенство (10) не имеет места. 1. Пусть Л = [—1, I}2, f У} = (х2 + уг)2~ при х2 + у2 > 0 и f (0, 0) = 0: тогда f (х, у) dx — 0 при всех у и при всех х. Поэтому 1 f (х, у} dy = 0 -1 f (х, у) dx но интеграл в смысле двойного интеграла Лебега по квадрату ие существует, так как 11 1 2л 1 Sf . ., . , . . _ С . f | sin <р cos <р I . „ f dr \\f(x,y}\dxdy^\ dr \ -----у-2-!- dtp = 2 \ — = оо, -1-1 00 о 2- Пусть А = (0, 1 ]2, 22П ПРИ Цр < X <------------------Ц_; --L_ 2 2"“' 2 2П~ О в остальных случаях. Можно подсчитать, что а
ГЛ AB A VI НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА. ТЕОРИЯ ДИФФЕРЕНЦИРОВАНИЯ В этой главе мы будем рассматривать интеграл Лебега в основном для функций на прямой, считая, что мера, по которой этот интеграл берется, есть обычная линейная мера Лебега. Если f — суммируемая функция, определенная на измеримом пространстве X с мерой ц, то интеграл f (XW (*) А существует для каждого измеримого А ед X и при фиксирован- ной f представляет собой функцию множества, определенную для всех измеримых подмножеств А сд X. Такой интеграл назы- вается неопределенным интегралом Лебега. Пространством X может, в частности, служить отрезок числовой прямой. Если при этом А — тоже некоторый отрезок, то интеграл (*) будет функцией пары точек — концов отрезка А'. Будем считать, что в этом случае мерой ц является обычная мера Лебега и писать dt вместо dp. Зафиксировав один из концов промежутка инте- грирования, скажем, левый, мы можем изучать свойства инте- X грала ^f(t)dt, взятого по отрезку [а, х], как функции одного а переменного х. Эта задача приведет нас к рассмотрению неко- торых важных классов, функций на прямой. Общей задаче изу- чения интеграла Лебега от фиксированной функции f как функ- ции множества посвящен § 5. Из элементарного курса анализа известны следующие основ- ные равенства, дающие связь между операциями дифференциро- вания и интегрирования: если f — непрерывная функция, a F — функция, имеющая непрерывную производную, то X 1) -^\f(t)dt=~-f(x), а b 2) \F'(t)dt = F(b)- F(a). а
МОНОТОННЫЕ ФУНКЦИИ 321 § и Спрашивается: верно ли равенство 1) для функций, суммируе- мых в смысле Лебега? Каков класс функций (возможно, более широкий), для которого выполняется равенство 2)? Этим вопросам посвящены следующие параграфы данной главы. § 1. Монотонные функции. Дифференцируемость интеграла по верхнему пределу 1. Основные свойства монотонных функций. Изучение свойств интеграла Лебега X Ф(х)=ф(0^ (1) а как функции верхнего предела мы начнем со следующего оче- видного, но важного замечания: если функция f неотрицатель- на, то Ф(х)—монотонно неубывающая функция. Далее, всякая суммируемая функция есть разность двух неотрицательных сум- мируемых: / (0 = /+(0-L(/). (2) Поэтому интеграл (1) разлагается в разность двух монотонно неубывающих функций. Следовательно, изучение интеграла Ле- бега как функции верхнего предела можно свести к изучению монотонных функций того же типа. Монотонные функции (неза- висимо от их происхождения) обладают рядом простых и важ- ных свойств, которые сейчас будут изложены. Напомним некоторые понятия. Всюду, где не оговорено про- тивное, будут рассматриваться функции, заданные на некотором отрезке. Функция f называется монотонно неубывающей, если из Xi Х2 следует f(xi)<f(x2); аналогично определяются монотонно невозрастающие функции. Пусть /—-произвольная функция на прямой. Предел1) lim f(x0 + h) h->0 + (если он существует) называется пределом справа функции f в точке хо и обозначается /(хо + О). Аналогично определяется f(x0 — 0)—предел слева функции f в точке х0- Равенство /(%о + О) = f(x0 — 0) означает, очевидно, что в точке х0 функция ‘) Символ h —► 0 + означает, что h стремится к нулю, принимая только положительные значения.
322 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. vr f или непрерывна, или имеет устранимый разрыв. Точка, в кото- рой оба эти предела существуют, но не равны между собой, называется точкой разрыва первого рода, а разность f(*o + O)— — f(x0— 0) называется скачком функции f в этой точке. Если f(x0) = f(x0 — 0), то f называется непрерывной слева в точке хо, а если f(х0) = f(х0 + 0), то f непрерывна справа в этой точке. Установим основные свойства монотонных функций. Для оп- ределенности мы будем говорить о монотонно неубывающих функциях, хотя ясно, что все сказанное ниже автоматически переносится на функции, монотонно невозрастающие. 1. Всякая монотонно неубывающая на [а, Ь] функция f изме- рима и ограничена, а следовательно, суммируема. Действительно, по определению монотонности, f(a)<f(x)<[(&) на [а, &]. Далее, для любого постоянного с множество Ае = {х: f(x)<c} есть либо отрезок, либо полуинтервал (либо пусто). В самом деле, пусть точки, в которых f(x)<_c, существуют, и пусть d есть точная верхняя грань таких х. Тогда Ас есть или отрезок [a, d\ или полуинтервал [a, d). 2. Монотонная функция может иметь разрывы только пер- вого рода. Действительно, пусть х0 — произвольная точка на [а, Ь] и хп -> х0, причем хп < Хо. Тогда последовательность {/(хп)} огра- ничена снизу и сверху [например, величинами f(a) и /(£)]• Сле- довательно, она имеет хотя бы одну предельную точку. Но нали- чие у любой такой последовательности нескольких предельных точек противоречило бы, очевидно, монотонности функции f. Та- ким образом, f(x0 — 0) существует. Аналогично устанавливается существование f(x0 + 0). Монотонная функция не обязана быт!> непрерывной. Однако верно следующее утверждение. 3. Множество точек разрыва монотонной функции не более чем счетно. Действительно, сумма любого конечного числа скачков моно- тонной функции f на отрезке [а, 6] не превосходит f(b)—f(a). Следовательно, для каждого п число скачков, величина которых больше, чем 1/п, конечно. Суммируя по всем п= 1, 2, ..., по- лучаем, что общее число скачков конечно или счетно. Среди монотонных функций простейшими являются так на- зываемые функции скачков. Они строятся следующим образом. Пусть на отрезке [а, Ь] задано конечное или счетное число точек X], х2, ..., хп, ...
МОНОТОННЫЕ ФУНКЦИИ 323 § 1] и пусть каждой из них поставлено в соответствие положитель- ное число hn, причем У, hn < °°. Определим функцию f на [a, fe], п положив (3) хп<х Ясно, что эта функция монотонно неубывающая. Кроме того, она непрерывна слева1) в каждой точке, а совокупность ее точек разрыва совпадает с множеством {хп}2), причем скачок в точке хп равен hn. Действительно, f (х — 0) = lim f (х — е) = lim У, hn, е->0+ в->0+ хп<х-е но так как каждое хп, удовлетворяющее условию хп < х, удо- влетворяет и условию хп < х — е при достаточно малом е, то последний предел равен У hn=f (х). Таким образом, f(x — 0) = хп<* * х = f(x). Если точка х совпадает с одной из точек хп, скажем,, х = х„„, то f (хп„ 4- 0) = lim f (xn, + е) = lim £ hn = £ hn, e^°+ e->0+ xrl<xrUl+a xn<xni t. e. f (xn, 4- 0) — f (x„, — 0) = hna. Наконец, если x не совпадает ни с одной из точек хп, то в ней функция скачков непрерывна (проведите доказательство!). Простейший тип функций скачков — ступенчатые функции, у которых точки разрыва можно расположить в монотонную по- следовательность xt < х2 < ... < хп < ... В общем случае функция скачков может иметь и более слож- ную структуру, например, если {хД — множество всех рацио- нальных точек на отрезке [a, b], a hn = 1/2”, то формула (3) определяет функцию скачков, разрывную в рациональных точ- ках и непрерывную в иррациональных. Другой тип монотонных функций, в некотором смысле про- тивоположный функциям скачков, — непрерывные монотонные функции. Имеет место следующее утверждение. ’) Если бы мы определили f формулой /<х) = У hn, хп<х то получили бы функцию, непрерывную справа. 2) Если ни одна из точек хп не совпадает с Ь, поскольку хп = b не участвует в сумме (3). Чтобы учесть скачок в точке Ь, надо вместо [а,Ь] рассматривать полуинтервал [а, b + е), е >• 0.
324 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI 4. Всякую монотонную функцию, непрерывную слева, можно представить как сумму непрерывной монотонной функции и функции скачков (непрерывной слева) и притом единственным образом. Действительно, пусть f — неубывающая непрерывная слева функция и %1, х2, ... — все ее точки разрыва, a hlt h2, ... — ее скачки в этих точках. Положим //(%)= hn. хп<х Разность <р = f — Н есть неубывающая непрерывная функ- ция. Для доказательства рассмотрим разность ф (х") - ф (х') = (х") - f (х')] - [Н (х") - Н (х')1, где х' < х". Здесь справа стоит разность между полным при- ращением функции f на отрезке [х', х"] и суммой ее скачков на этом отрезке. Ясно, что эта величина неотрицательна, т. е. ф — неубывающая функция. Далее, для произвольной точки х* имеем <р(х*-0) = /(х*-0)-Я(х*-0) = /(х*-0)- Е hn, хп<х‘ ф(х* + 0) = /(х’ + 0)-Д(х‘ + 0) = Нх* + 0)- Е hn, Хп<х* откуда Ф (х* + 0) — ф (х* — 0) = f (х* + 0) — f (х* — 0) — h* = 0 (где h* — скачок функции Н в точке х*). Отсюда и из непрерыв- ности f и Н слева вытекает, что ф действительно непрерывна. 2. Дифференцируемость монотонной функции. Перейдем те- перь к вопросу о существовании производной у монотонной функции. Теорема 1 (Лебег), Монотонная функция f, определен- ная на отрезке [а, &], имеет почти всюду на этом отрезке конеч- ную производную. Прежде всего введем некоторые понятия, которые будут нужны для доказательства этой теоремы. Как известно, производной функции / в точке хо называется предел отношения f(x) - f(*о) X Xq при х-> х0. Этот предел может, конечно, и не существовать, од- нако всегда имеют смысл следующие четыре величины (которые могут принимать и бесконечные значения): Апр — верхний предел отношения (4) при х, стремящемся к х0 справа (т. е. так, что х — Хо>О). Эта величина называется верхним правым производным числом.
§ 1] МОНОТОННЫЕ ФУНКЦИИ 325 Хпр (нижнее правое производное число) — нижний предел от- ношения (4) при х->хо справа. Алев (верхнее левое производное число) — верхний предел от- ношения (4) при х->хо слева. ХЛев (нижнее левое производное число) — нижний предел от- ношения (4) при х-*х0 слева. На рис. 19 показаны пря- мые с угловыми коэффи- циентами Апр, Хпр, Алев, Хлев соответственно. Ясно, что всегда Хпр Апр И Хлев Алев. Если Апр и ХПр конечны и равны между собой, то это общее их значение есть правая производная функ- ции f(x) в точке х0. Анало- гично, если Алев = Хлев, ТО их общее значение есть ле- вая производная. Существо- вание у f в точке %о конеч- ной производной равносиль- но тому, что в этой точке все производные числа функции / конечны и равны между собой. Поэтому утверждение теоремы Лебега можно сформулировать следующим функции соотношения Рис. 20. образом: для монотонной на [а, ft] 00 < Хлев ХПр Алев-----------Апр ОО выполнены почти всюду на [а, 6]. Упражнение. Пусть f* (х) =—f(x). Как связаны производные числа для f* с производными числами f? Ответьте на такой же вопрос при переходе от f(x) к f(—х). Доказательство теоремы Лебега опирается на приводимую ниже лемму, которой мы будем пользоваться и в дальнейшем. Введем следующее определение. Пусть g(x)— непрерывная функция, заданная на отрезке а х Ь. Точку х0 этого отрезка мы назовем точкой, невидимой справа для функции g, если су- ществует такая точка g (х0 < g Ь), что g(x0)< g(%) (рис. 20). Лемма (Ф. Рисе). Для любой непрерывной функции g множество точек, невидимых справа, открыто на отрезке [a, ft] и,
326 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VT следовательно, представляется в виде суммы конечного или. счетного числа попарно непересекающихся интервалов (ak, bk) (и, возможно, полуинтервала, содержащего точку а). В конце- вых точках этих интервалов выполнены неравенства g(ak)^g(bk). (5> Доказательство леммы. Если хо — точка, невидимая справа для g, то тем же свойством будет обладать, в силу не- прерывности g, и любая точка, достаточно близкая к Хо. Следо- вательно, множество таких точек открыто на [а, &]. Пусть (ak, bk)—один из составляющих его интервалов. Предположим,, что g(ak)> g(bk); (6)- тогда в интервале (ak, bk) найдется внутренняя точка Хо, в ко- торой g(xa)>g(bk). Пусть х* — самая правая из всех точек х на (ak, bk), в которых g(x) = g(x0). Поскольку х* е(ak, bk), существует такая точка £ > х*, что- g(£) > g(x*) Точка £ не может лежать на интервале (ан, bk), так как х* — самая правая точка на этом интервале, в которой g(x) = g(xo), тогда как g(bh) < g(xo) С другой стороны, не- равенство | > bk также невозможно, так как мы имели бы g(bk)< g(xo)< g(s), а Ьь не является точкой, невидимой спра- ва. Полученное противоречие показывает, что неравенство (6) не имеет места, т. е. g(ak) g(bk), и лемма доказана. Читатель без труда проверит, что фактически g(ak) = g(bk), если только а. Замечание. Назовем точку Хо невидимой слева для непре- рывной функции g(x), если существует такое | < х0, что g(£) > >g(x0). Такие же рассуждения показывают, что множество не- видимых слева точек есть сумма конечного или счетного числа попарно неперекрывающихся интервалов (ak, bh) (и, возможно,, полуинтервала, включающего точку Ь), причем g(ak)^g(bk). Перейдем теперь к доказательству самой теоремы Лебега. Докажем ее сначала в предположении, что f — непрерывная мо- нотонно неубывающая функция. Для доказательства теоремы достаточно установить, что почти всюду 1) АПр оо, 2) Л^ев Апр- Действительно, если мы положим f*(x)~—f(—х), то f* бу- дет тоже монотонно неубывающей непрерывной функцией, опре- деленной на отрезке [—Ь, —а]. Если Л„р и Z.,en — верхнее пра- вое и нижнее левое производные числа для f*, то, как легко про- верить (см. упражнение на стр. 325), производные числа функ-г
3 и МОНОТОННЫЕ ФУНКЦИИ 32/ ций f и f* в соответствующих точках связаны равенствами Л1'!р = ЛЛев, А,лев = А,пр. Поэтому, применив неравенство 2) к f*(x), получим Ацр Ллев- (7) Соединив полученные неравенства в одну цепочку и используя определение производных чисел, будем иметь АПр Алев Л-лев АПр АПр, а это и означает, что Алев == АПр == Алев ’ АПр. Покажем вначале, что Лпр < оо почти всюду. Если ЛПр = оо в некоторой точке х0, то для любого постоянного С > 0 справа от точки х0 найдется такая точка что г а)-г(хо) > с £ — *0 т. е. fa)-f(x0)>ca-x0), или f®-C£>f(x0)-Cx0. Иначе говоря, точка х0 оказывается точкой, невидимой справа для функции g W = f W — Сх. В силу леммы Ф. Рисса множество таких точек открыто, и на концах составляющих его интервалов (ак, &й) выполнены нера- венства f(ak)-Cak^f(bk) — Cbk, т. е. f(bJ-f(ak)^C(bk-ak). Деля на С и суммируя полученные неравенства по всем интер- валам (а^ bk), получим f(bk)~f(ak) f(b)~f(a) L (bk -ak)^---------c----c------c----- k k Здесь С можно было взять как угодно большим. Таким об- разом, множество тех точек, в которых Лпр = оо, можно по- крыть интервалами, сумма длин которых сколь угодно мала. Следовательно, мера этого множества равна 0. Тот же прием, связанный с леммой Ф. Рисса, позволяет до- казать, что почти всюду Алев Л[1р, но теперь этот прием при- дется применить дважды. Рассмотрим пару рациональных чисел г? и С, для которых 0 <Z с <Z С < оо и положим р = с/С. Обо- значим через Д, с совокупность тех х, для которых Лпр > С,
328 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI а Хлев < с. Если мы докажем, что цЕс, с = 0, то отсюда будет следовать, что почти всюду ХЛев АПр, так как множество тех точек, где Хлев < АПр, очевидно, представимо в виде суммы не более чем счетного числа множеств вида Ес, с- Установим теперь основное неравенство. Для любого интервала (а, 0)с: [а, Ь] имеем Н(Ес,сП(а> ₽)Хр(₽ —а). Действительно, прежде рассмотрим множество тех хе (а, 0), для которых Хлев < с. Для всякой такой точки х найдется такое | < х, что < с, т. е. /(£)— Cg > f(x)— сх. Поэтому х ъ Х невидима слева для функции f(x)— сх и по лемме Ф. Рисса (см. замечание на стр. 326) множество таких х представимо в виде суммы не более чем счетного числа непересекающихся интерва- лов (aft, 0h)c:(a, 0), причем f (ah)— cah f(0а)— c0h, т. е. f (М — f (aj С с (0* — aj. (8) На каждом из интервалов (а&, 0а) рассмотрим множество G* тех х, для которых Апр > С. Снова применяя лемму Ф. Рисса (теперь, как и при доказательстве неравенства Апр < оо, для то- чек, невидимых справа), мы получим, что Gh представимо в виде суммы не более чем счетного числа непересекающихся интерва- лов (ahj, и Ph/-aft/<-^[f(Pft/)-f(aft/)]. (9) Ясно, что множество Ес, сП (а, 0) покрывается системой ин- тервалов (ahj, 0м), причем в силу (8) и (9) имеем 2 (₽*,- - «а/) < 4- Е - f k, j к, ! < £ [f (Ph) - f (“h)] < £ (Ph - aft) (0 - a), h k и основное неравенство доказано. Теперь легко доказать, что цЕс, с = 0. При этом достаточно использовать только то свойство мно- жества Ес,с, которое описывается основным неравенством. Лемма. Пусть измеримое множество А на отрезке [а, Ь] та- ково, что для любого интервала (а, 0)с:[а, выполняется не- равенство ц(.4 П (а, 0)) ^ р(0 — а), где 0<р<1. Тогда цА == 0. Доказател ьство. Пусть цА == t. Для любого е > 0 су» ществует такое открытое множество G, равное сумме счетного числа непересекающихся интервалов (ат, Ьт), что A cz G и
МОНОТОННЫЕ ФУНКЦИИ 329 § 11 У, (Ьт— ат) < t + е (см. упражнение на стр. 291). Положим т tm— р [Л Г) (ат, Ьт)]. Ясно, что По условию леммы, т — ат). Следовательно, t С р У (bm — ат) < р (/ + е), и т так как е>0 произвольно, то t pt. Но 0<р< 1 и поэтому t =-- 0. Лемма доказана, и тем самым завершено доказательство теоремы 1 в предположении непрерывности функции f. Те же рассуждения переносятся и на случай разрывной мо- нотонной функции, если воспользоваться обобщением леммы Ф. Рисса на функции с разрывами первого рода. Пусть g— функция на отрезке [а, Ь], имеющая разрывы толь- ко первого рода. Назовем точку хое)а, Ь] невидимой справа для g(x), если существует такое g > х0, что max [g (х0 — 0), g(x0), g(x0 + 0)] < g(^). Тогда, как и в случае непрерывной g, множество точек, невиди- мых справа для g, открыто, и в концах составляющих его интер- валов (ak, bh) выполняются неравенства g(ak)^g(bk). Хотя доказательство теоремы 1 довольно длинно, сама она имеет простой наглядный смысл. Поясним, например, почему Апр (и ЛЛев) обязано быть конечным почти всюду. Отношение А/7Ах — это «коэффициент растяжения» отрезка [а, Ь] в данной точке х при отображении f. Так как при этом отображении ко- нечный отрезок [а, Ь] превращается в конечный отрезок [f(a),f(b)], то «растяжение» не может быть бесконечным на множестве положительной меры. Иногда бывает полезна следующая теорема о почленном дифференцировании ряда из монотонных функций, называемая иногда «малой теоремой Фубини». Теорема 2. Всюду сходящийся ряд ОО TJFn(x) = F(x), (10) где Fn — монотонно неубывающие функции на [а, Ь], почти всюду допускает почленное дифференцирование-. оо Е F'n(x) = F' (х). гг=1 Доказательство. Заменив Fn(x) на Fn(x) — Fn(a), мож- но считать, что все Fn(x) неотрицательны и обращаются в нуль при х = а.
330 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ vr В силу теоремы 1 существует множество полной меры Ecz[a, b], на котором существуют все F„(x) и F' (х). Пусть хе£, а £ е [а, &] произвольно. Имеем £ {Fn - Fn (х)} . F^)-F(x) 1~х 1-х Так как %— х и Fn(£,)—Fn(x) имеют одинаковый знак (моно- тонность!), то при любом /V х 2 ’Fn (У - Fn (х)} &FU)-F(x) Z-x g-х Переходя к пределу при 1,-^х, получаем Е^'(х)<Г(х). fl=l Поскольку все /^(х) ^0, отсюда следует, что (ii> n=l Итак, ряд из производных F'n{x') сходится всюду на Е. Пока- жем, что при почти всех х в (11) имеет место знак равенства. Для каждого k найдется такая частичная сумма Snk(x) ряда (10), что 0<F(ft)-$„,(&) <1/2*. Так как функция F (х) — Sn. (х) = У, Fm(x) — неубывающая, s m>nk то и при любом X 0<r(x)-S„fc(x)<l/2*, откуда следует, что ряд <12> состоящий из неубывающих функций, сходится (даже равно- мерно) на всем отрезке [а, 6]. Тогда, по уже доказанному, ряд (13} полученный из (12) почленным дифференцированием, сходится почти всюду. Следовательно, общий член ряда (13) почти всюду
§ 1] МОНОТОННЫЕ ФУНКЦИИ 331 стремится к нулю, т. е. S'nk(x) — F'(x) —>0 почти всюду. Но если бы в неравенстве (11) стоял знак <, то никакая последо- вательность частичных сумм не могла бы сходиться к F'(x). Следовательно, оо Л F'n(x) = F'(х) п=1 почти всюду. Теорема доказана. Следствие. Функция скачков имеет почти всюду произ- водную, равную нулю. Действительно, такая функция есть сумма сходящегося ряда неубывающих «ступеней»: ( 0 при х<х„, Fn (х> ~ 1 I. I при х > хп, каждая из которых имеет почти всюду равную нулю произ- водную. 3. Производная интеграла по верхнему пределу. Поскольку интеграл зс <р (/) dt от любой суммируемой функции можно представить в виде раз- ности двух монотонных функций, из теоремы 1 сразу вытекает следующий результат. Теорема 3. Для каждой суммируемой функции <р произ- водная зс -^\<v(t)dt а (14) существует при почти всех х. Необходимо подчеркнуть, что, хотя мы и установили суще- ствование производной (14) почти всюду, вопрос о равенстве зс 5 <р (0 dt = <р (х) а пока не обсуждался. В действительности (см. § 3) это равенство оказывается верным почти всюду для любой суммируемой функ- ции ср.
332 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [гл. vr § 2. Функции с ограниченным изменением Вопрос о дифференцируемости интеграла Лебега по верхне- му пределу привел нас к рассмотрению класса функций, пред- ставимых в виде разностей монотонных функций. В этом пара- графе мы дадим для этих функций другое описание, не опираю- щееся на понятие монотонности, и рассмотрим основные их свойства. Начнем с необходимых определений. Определение 1. Функция f, заданная на отрезке [а, Ь[, называется функцией с ограниченным изменением, если суще- ствует такая постоянная С, что, каково бы ни было разбиение отрезка [а, Ь] точками а = х0 < %] < ... < хп = Ь, выполнено неравенство п ZifUJ-ffe-jKc. о) А=1 Всякая монотонная функция имеет ограниченное изменение, так как для нее сумма, стоящая в (1) слева, не зависит от вы- бора разбиения и всегда равна |f(6)— f(a) |. Определение 2. Пусть f — функция с ограниченным изме- нением. Точная верхняя грань сумм (1) по всевозможным ко- нечным разбиениям отрезка [а, Ь] называется полным измене- нием (или полной вариацией) функции f на отрезке [а, Ь] и обо- значается Va [/]• Таким образом, Va[fl = SUP£|f(x4)-f(xfc_1)|. Л=1 Замечание. Функция f, заданная на всей прямой, назы- вается функцией с ограниченным изменением, если величины ^[Л ограничены в совокупности. При этом lim У*[Л b “> оо д-> —оо называется полным изменением функции f на прямой — оо < < х < оо и обозначается [Л- Установим основные свойства полного изменения функции. 1. Если а — постоянное число, то У*1аЛ = |а|Уа1Л- Это сразу следует из определения Уьа [/].
§21 ФУНКЦИИ С ОГРАНИЧЕННЫМ ИЗМЕНЕНИЕМ 333 2. Если f и g— функции с ограниченным изменением, то f -ф g тоже имеет ограниченное изменение и + + (2) Действительно, для каждого разбиения отрезка [а, 6].имеем £ I f Ы + g (xk) — f — g | < k < £ l f W — f Ua-i) 1 + £ l g (xk) — g (xfe_,) i, k k откуда, поскольку всегда sup (Л + В) sup А + sup В, получаем требуемое неравенство. Свойства 1 и 2 означают, что линейная комбинация функций с ограниченным изменением (определенных на данном отрезке [а, 6]) есть снова функция с ограниченным изменением. Иными словами, функции с ограниченным изменением образуют линей- ное пространство (в отличие от множества монотонных функций, которые линейного пространства не образуют). 3. Если а < Ь < с, то УЬа IЛ + УИЛ = V‘a [/]. (3) Действительно, рассмотрим сначала такое разбиение отрезка [а, с], в котором b служит одной из точек деления, скажем, хт — — Ь. Тогда £ I f (Xk) — f (Xfe—j) | = £ | f (xk) — f (xk^) | + n + £ |/(ХА)-/(ХА-1)|<Га[Л + УИЛ. (4) fe=r+ 1 Возьмем теперь произвольное разбиение отрезка [а, с] Ясно, что если к его точкам деления добавить еще одну, именно точку Ь, то сумма п £ I Н*а) - I Я=1 от такого добавления не уменьшится. Следовательно, неравен- ство (4) выполнено для любого разбиения отрезка [а, с], по- этому Г1Л<Уа[Л + Г[Л. (4')
334 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI С другой стороны, для всякого е> О найдутся такие разбиения отрезков [а, б] и [Ь, с], что oi-f i И i Соединив эти два разбиения, мы получим разбиение отрезка [а, с], для которого = SI f (<)-[(<_,) |+11 f («;')-[| > v; [fi + V‘t 1Л - s. I 1 В силу произвольности e > 0 отсюда следует, что + (5) Из (4') и (5) следует (3). Так как полное изменение любой функции на любом отрезке неотрицательно, то из свойства 3 сразу следует свойство 4: 4. Функция v (х) = VXa[f] монотонно неубывающая. 5. Если f непрерывна в точке х* слева, то и v непрерывна в этой точке слева. Действительно, пусть е>0 задано. Выберем б>0 так, что |/(х*)—f(x) | < е/2, как только х* — б < х х*. Далее, выбе- рем разбиение а = х0 < х{ < ... < хп — х* так, что п ь=1 При этом мы можем считать, что X* — Хп-у < б (иначе мы добавили бы еще одну точку разбиения, отчего раз- ность, стоящая в (6) слева, могла бы только уменьшиться), по- этому I fix*) — f(xn-y) | < е/2
§ 2] ФУНКЦИИ С ОГРАНИЧЕННЫМ ИЗМЕНЕНИЕМ 335 и, следовательно, ИГ[Л~ fe=l Но тогда, тем более, Va [Л — У1”-1[Л < 8, Т. е. и(х*) — и (%„-]) < е. Так как v — монотонно неубывающая функция, то отсюда сле- дует, что v(x*)— v(x) < е для всех х таких, что xn-i х х*. А это и означает непрерывность функции о в точке х* слева. Если f непрерывна в точке х* справа, то, как показывают аналогичные рассуждения, и v непрерывна в этой точке справа. Следовательно, если f непрерывна в некоторой точке {или на всем отрезке [а, Ь]), то непрерывна и и. Пусть f — произвольная функция на [а, Ь] с ограниченным изменением ио — ее полное изменение на [а, х]. Рассмотрим раз- ность (p = v — f. Эта разность представляет собой монотонно неубывающую функцию. Действительно, пусть х' х". Тогда <р (х") - <р (%') = [и (х") - V (х')] - [/= (х") - f (х')]. (7) Но всегда | f (х") - f (х') I < v (х") - v (х') = [Л, поэтому правая, а значит, и левая части равенства (7) неотри- цательны. Итак, поскольку f = v — ф, мы получили следующий результат: Теорема 1. Всякая функция с ограниченным изменением может быть представлена как разность двух монотонно неубы- вающих функций. Обратное утверждение очевидно: всякая функция, предста- вимая в виде разности двух монотонных, имеет ограниченное изменение. Поэтому совокупность функций, представимых в виде разности монотонных функций, рассмотренная нами еще в пре- дыдущем параграфе, это и есть совокупность функций с огра- ниченным изменением. Из теоремы 1 и установленной в предыдущем параграфе тео- ремы Лебега о существовании производной у монотонной функ- ции сразу следует, что всякая функция с ограниченным изме- нением имеет почти всюду конечную производную.
336 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI Перейдя от монотонных функций к функциям с ограничен- ным изменением, полезно следующим образом обобщить введен- ное выше понятие функции скачков. Пусть xt, х2, . . . , хп, • • — конечное или счетное множество точек на [а, 6]. Поставим в соответствие каждой из этих точек хп два числа gn и hn так, что Е (I gn 1 + 1 hn\) < оо. п Предположим, кроме того, что если хп = а, то gn — 0, а если хп = Ь, то hn = 0. Положим Ф(х) = Е £n+ Е hn. (8) хп<х хп<х Мы будем называть теперь функциями скачков любые функ- ции вида (8). Полное изменение функции ф(х) равно, очевидно, Е (I gn l + l hn I). п Точками разрыва функции (8) служат те хп, для которых хотя бы одно из чисел gn, hn отлично от нуля; при этом ф(х„)- t(x„-0) = g„, Ф(хп + 0)-ф(х„) = /г„. Теперь легко получается следующее утверждение, обобщающее утверждение 4 п. 1 предыдущего параграфа. Всякая функция f с ограниченным изменением, определенная на [а, Ь], может быть представлена и притом единственным об- разом в виде f — <р + ф, где <р непрерывна, а ф— функция скачков. Упражнения. 1. Если f имеет на [а, Ь] ограниченную производную (т. е. f'(x) существует всюду и |f'(x) | < С), то f — функция с ограниченным изменением, причем 2, Пусть f (х) = х sin Е при х 0 и ЦО) = 0. Показать, что изменение функции f на [0, 1] бесконечно. Постоянные, и только они, представляют собой функции, пол- ное изменение которых равно 0. Положим II/11= На И- Величина Vba [/] обладает свойствами 2) и 3) нормы (см. стр. 139), но не свойством 1). Если рассмотреть только функ- ции, удовлетворяющие дополнительному условию [(a) = 0, то
§ 3] ПРОИЗВОДНАЯ НЕОПРЕДЕЛЕННОГО ИНТЕГРАЛА ЛЕБЕГА 337 они также образуют линейное пространство, в котором величина Va[f] обладает уже всеми свойствами нормы. Пространство V°[a, Ь] функций с ограниченным изменением на [а, Н удовле- творяющих условию f(a) = O, с обычными определениями сло- жения и умножения на числа и с нормой 11/11= УаШ, называется пространством функций с ограниченным изменением. (Докажите полноту этого пространства.) Упражнение. Докажите, что II f II = I f (а) I + [Л является нор- мой в пространстве всех функций с ограниченным изменением на отрезке [а, Ь] и докажите полноту этого пространства. § 3. Производная неопределенного интеграла Лебега В § 1 мы показали, что интеграл Лебега J f (t) dt а как функция от х имеет почти всюду конечную производную. Однако мы пока еще не выясняли, как связана эта производная с подынтегральной функцией. Сейчас мы установим следующий результат, упомянутый в конце § 1. Теорема 1. Для всякой суммируемой функции f почти всю- ду имеет место равенство X dt = f(x). а Доказательство. Положим Ф (х) = f (/) dt. а Покажем вначале, что почти всюду Г(х)>ф'(х). Если f(x)< Ф'(х), то найдутся такие рациональные числа а и р, что / (х) < а < 0 < Ф'(х). (1) Пусть Еа$— множество тех точек, в которых выполнено нера- венство (1). Оно измеримо, поскольку f и Ф' измеримы. Пока- жем, что мера каждого из множеств равна нулю. Так как
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI зав число этих множеств счетно, то отсюда будет следовать, что Н {х : f (х) < Ф' (х)} = 0. Пусть е > 0 произвольно и пусть б > 0 таково, что \f(t)dt <6, е как только р(е)< б (такое б существует для любого е в силу абсолютной непрерывности интеграла; см. гл. V, § 5, теоре- ма 5). Выберем теперь открытое множество G cz [а, б] так, что G => Еа(1 и р (G) < р (Еар) + б (см. упражнение на стр. 291). Если то ф(£) —Ф(х) . -----------> 0 (2) для всех £ > х, достаточно близких к х. Записав неравенство (2) в виде Ф(?)-Га>Ф(х)-рх, получаем, что точка х — невидимая справа для функции Ф(х) — — 0х на любом из составляющих интервалов множества G. Ис- пользуя лемму Ф. Рисса, мы можем поэтому указать такое от- крытое множество S = (J (ак, 6*), состоящее из непересекающихся к интервалов, что cz S cz G и Ф(М —₽^>Ф(Ой) —т. е. Ф (6J — Ф (afe) > Р (6fe — aj, или Ьк $ /(/)<#> Р (6* — ak). ak Суммируя такие неравенства по всем интервалам (ак, bh), составляющим S, получаем J f (/) dt рр (S). (3) з В то же время / (/) dt = f(t) dt-j- $ f (/) dt < ар (Eaf}) + e s £ap £ap < ap (S) + e +1 a 16. (4)
§ 4] ВОССТАНОВЛЕНИЕ ФУНКЦИИ ПО ЕЕ ПРОИЗВОДНОЙ 339 Сравнивая (3) и (4), получаем аИ (S) + е 4- | а 16(S), Таким образом, множество Еар можно заключить в открытое множество сколь угодно малой меры (мы можем считать, на- пример, что |а|6<: е), а это и означает, что ц(Еар) = 0. Итак, мы показали, что ^(х)>Ф'(х) почти всюду. Заменив f(x) на — f(x), мы таким же путем полу- чим, что почти всюду — / (х) > — Ф'(х), т. е. [(х)^.Ф'(х) и, следовательно, почти всюду X f(x)=-.0'(x) = -^\f(t)dt. а § 4. Восстановление функции по ее производной. Абсолютно непрерывные функции Итак, мы решили первый из поставленных в начале этой главы вопросов, установив равенство X dt = f W (почти вс юду) а для любой суммируемой на [а, Ь] функции f. Рассмотрим теперь второй из сформулированных там вопросов, т. е. выясним, как обобщается на случай интеграла Лебега формула Ньютона — Лейбница X F(x) = F(a)+ J F'(t)dt, (1) а хорошо известная в случае непрерывно дифференцируемых функций из элементарного анализа. Естественно ограничиться рассмотрением функций F, заве- домо дифференцируемых почти всюду (иначе равенство (1) просто не имеет смысла). Как мы уже знаем, такими, в частно- сти, являются функции с ограниченным изменением. С другой стороны, интеграл, стоящий в (1) справа, есть функция с ограниченным изменением. Поэтому равенство (I) не
340 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. vr может быть верно для более широкого класса функций. По- скольку всякая функция с ограниченным изменением есть раз- ность двух монотонно неубывающих, то именно монотонные функции и нужно рассмотреть в первую очередь. Однако для произвольных монотонных функций равенство (1), вообще говоря, не имеет места. Вместе с тем справедлива следующая теорема. Теорема 1. Производная f' монотонно неубывающей функ- ции f суммируема и ь \f'(x)dx^f(b)-f(a). а Доказательство. По определению, производная функ- ции f в точке х есть предел отношения ’) (2) при й->0. Из монотонности f вытекает ее суммируемость, а зна- чит, и суммируемость каждой из функций фл. Поэтому равен- ство (2) можно проинтегрировать. Получаем b b ь <pA(x)*Zx==-Jr J f (x + h)dx— 1 J f(x)dx = a a a b+h a+h —4 J f(x)dx. b a Стоящее справа выражение при стремится к f(b) — — f(a-}-0). (Докажите!) Поэтому, применив теорему Фату (гл. V, § 5, теорема 8), мы получаем ь ь ( f' (х) dx lim ( фл (х) dx — f (b) — f (a -f- 0)< f (b) — f (a) aJ л-*° aJ (само существование интеграла от f' также обеспечивается тео- ремой Фату). Теорема доказана. Нетрудно привести пример монотонной функции, для кото- рой имеет место строгое неравенство ь ^f'(x)dx <f(b) — f(a). а ') Чтобы выражение Дх + Л) имело смысл при любом х s [a, Z>], можно считать, что Дх) = f(b) при х > b и Д<) = Да) при х < а.
§ 4] ВОССТАНОВЛЕНИЕ ФУНКЦИИ ПО ЕЕ ПРОИЗВОДНОЙ 341 Достаточно положить Г о f(x) = ( ! при 0<х< 1/2. при 1/2 <х 1. Интересно, однако, что существуют непрерывные монотон- ные функции, для которых строгое неравенство $ f' (/) dt < f (х) — f (а) а выполнено при всех х > а. Вот один из простейших примеров. Рассмотрим на отрезке [0, 1] канторово множество и опреде- лим f сначала на его смежных интервалах, положив " _ А> = 1, 2, 3..2"-1 на fc-м смежном интервале n-го ранга (включая и его кон- цы). (Интервалы нумеруются слева направо). Следовательно, f(/)=l/2 при 1/3 </<2/3, О при 1/9 </<2/9, /(0 = 3/4 при 7/9 </<8/9 —1---------1__________L 2 Л f з з Рис. 21. и т. д. (рис. 21). Таким образом, / определена на отрезке [0, 1] всюду, кроме точек второго рода канторова множества (т. е. то- чек, не принадлежащих ни смежным интервалам, ни совокуп- ности их концов). Доопределим теперь f в этих оставшихся точ- ках следующим образом. Пусть /*— одна из таких точек и пусть (/п) — сходящаяся к ней возрастающая последовательность точек первого рода (т. е. концов смежных интервалов). Тогда существует предел Нт / (/„); (3) П->оо аналогично, существует и предел lim/(/'), (4) П->оо если {/„}—убывающая последовательность точек первого рода, сходящаяся к /*, причем пределы (3) и (4) равны между собой. Приняв это общее значение за /(/*), мы получим монотонную функцию, определенную и непрерывную на всем отрезке [0, 1), называемую «канторовой лестницей». Ее производная равна^
342 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА (ГЛ. VI очевидно, нулю в каждой точке любого смежного интервала, т. е. почти всюду. Следовательно, для этой функции имеем X O=\f'(t)dt<f(x)-f(O) = f(x) & при любом х из полуинтервала 0 < х 1. Отметим попутно, что в случае монотонной f(x) равенство Ь х j f' (/) dt = f (б) — f (а) влечет равенство f' (t) dt= f (x) — f (a) a a при любом x из полуинтервала а < х Ь. Чтобы описать класс функций, для которых имеет место ра- венство ь введем следующее определение. Определение 1. Функция f, заданная на некотором от- резке |а, 6], называется абсолютно непрерывной на нем, если для любого е > 0 найдется такое б > О, что, какова бы ни была ко- нечная система попарно непересекающихся интервалов (ak, Ьк), k=l, 2, п с суммой длин, меньшей б, S (!>к — ак) < б, ы выполнено неравенство п S I f - f (ак) | < e. k=t Ясно, что всякая абсолютно непрерывная функция равномерно непрерывна. Обратное, вообще говоря, неверно, например: опи- санная выше «канторова лестница» непрерывна (а значит, и равномерно непрерывна) на отрезке [0,1], однако она не абсо- лютно непрерывна. Действительно, канторово множество можно покрыть конечной системой интервалов (а*, &а), k = 1, 2, . . . , п, сумма длин которых сколь угодно мала. Зместе с тем для ка- ждой такой системы интервалов выполнено, очевидно, равенство п fe=l
§ 41 ВОССТАНОВЛЕНИЕ ФУНКЦИИ ПО ЕЕ ПРОИЗВОДНОЙ 343 Укажем основные свойства абсолютно непрерывных функций. 1. Заметим прежде всего, что в определении 1 можно вместо любой конечной системы интервалов с суммой длин < 6 рас- сматривать любую конечную или счетную систему интер- валов, сумма длин которых <6. Действительно, пусть для дан- ного е > 0 мы выбрали б > О так, что t I f(bk) - f(ak) | < в *=•-1 для любой конечной системы интервалов (ак, Ьк), удовлетворяю- щей условию Е (Ьк — ак) < б, k=\ и пусть (ось, рй) — счетная система интервалов с суммой длин, не превосходящей б. Тогда при любом п имеем t IHPJ - f(afe) I < е; переходя здесь к пределу при п->оо, получаем оо Е I f (М - f Ы К е. *=| 2. Всякая абсолютно непрерывная функция имеет ограничен- ное изменение. Действительно, абсолютная непрерывность функции f на от- резке [а, б] означает, в частности, что для каждого е > 0 можно б > 0 выбрать так, что полное изменение функции f на отрезке длины < б будет не больше, чем е. Поскольку отрезок [а, Ь] можно разбить на конечное число отрезков длины <б, то и полное изменение функции f на [а, Ь\ конечно. 3. Сумма абсолютно непрерывных функций и произведение такой функции на число суть абсолютно непрерывные функции. Это сразу вытекает из определения абсолютной непрерывно- сти и свойств модуля суммы и произведения. Свойства 2 и 3 означают, что абсолютно непрерывные функ- ции в пространстве всех') функций с ограниченным изменением образуют линейное многообразие. 4. Всякая абсолютно непрерывная функция может быть представлена как разность двух абсолютно непрерывных неубы- вающих функций. >) См. упражнение на стр. 337.
344 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI Действительно, абсолютно непрерывная функция, как всякая функция с ограниченным изменением, может быть представлена в виде f — v — g, где vW=Va[f] И g (х) = V (х) — f (х) — неубывающие функции. Покажем, что каждая из этих двух функций абсолютно непрерывна. Достаточно проверить это для V. Пусть е > 0 задано. Выберем б > О для этого е так, как это диктуется абсолютной непрерывностью функции f. Возьмем си- стему п интервалов (a*, bk) с суммарной длиной меньше, чем б, и рассмотрим сумму Е (v(bk)-v(ak)). fe=i (5) Эта сумма представляет собой точную верхнюю грань чисел п mk Е ElffeJ-/(**./-1)1 (6) k=l 1=1 по всевозможным конечным разбиениям Й1 — Х1>0 <Х[, j <Х),2 < • •• < X|.mi = bh й2 --х2, 0 < Х2, 1 < Х2, 2 <'- &п Хп, 0 < хп, 1 < Хп, 2 < < х2, mi — Ь2, <" п, тп ип интервалов (ai,&i), ..., (ап, Ьп). Так как сумма длин всех ин- тервалов (Xk, i-i, xk, i), по которым берется сумма (6), не превос- ходит б > 0, то каждая из сумм (6) не больше, чем е. Следова- тельно, и сумма (5), — их точная верхняя грань, — не больше, чем е. Следующие две теоремы устанавливают тесную связь между понятием абсолютной непрерывности и неопределенным инте- гралом Лебега. Теорема 2. Функция X F(x)=\f(t)dt, а представляющая собой неопределенный интеграл суммируемой функции, абсолютно непрерывна.
§ 4] ВОССТАНОВЛЕНИЕ ФУНКЦИИ ПО ЕЕ ПРОИЗВОДНОЙ 345 Доказательство. Если {(а*, б*)}— какая-либо система непересекающихся интервалов, то п п bk k bk ^|Е(бА)-Е(аД| = £ \f(t)dt \ = k=l £=1 k~l = J U (ak' bk) k в силу абсолютной непрерывности интеграла Лебега последнее выражение стремится к нулю, когда суммарная длина интерва- лов (as, bk) стремится к нулю. Теорема 3 (Лебег). Производная f — F' абсолютно не- прерывной функции, заданной на отрезке [а, 6], суммируема на этом отрезке и для каждого х (а х Ь) X \f(t)dt = F(x)-F(a). а Теоремы 2 и 3 показывают, что абсолютно непрерывные функции, и только они, восстанавливаются с точностью до по- стоянного слагаемого по своей производной с помощью опера- ции интегрирования. Для доказательства теоремы 3 нам понадобится следующая лемма. Лемма. Если производная абсолютно непрерывной моно- тонно неубывающей функции f равна 0 почти всюду, то эта функция — постоянная. Доказательство леммы. Пусть f задана на [а, Ь]. Так как f — непрерывная монотонная функция, то ее область значе- ний есть отрезок [f (а), f (b)]. Покажем, что длина этого отрезка равна нулю, если f (х) = О почти всюду. Тем самым лемма бу- дет доказана. Разобьем множество точек отрезка (а, Ь] на два класса: множество Е тех точек, в которых f'(x)=O, и Z— его дополнение. По условию леммы ц(2) = 0. Выберем некоторое е > 0, найдем то б > О, которое отвечает этому е в силу абсо- лютной непрерывности функции f, и заключим Z в открытое множество, мера которого меньше б (это возможно, поскольку |i(Z) = 0). Иначе говоря, Z покрывается конечной или счетной системой интервалов (a*, bk), сумма длин которых меньше б. В соответствии с выбором б получаем 11Ж)-/Ю1<8. k Следовательно, вся система интервалов (а^, bk) (а тем более, и заключенное в их сумме множество Z) переводится функцией f
316 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI з множество, мера которого меньше е. Таким образом, |x(/(Z)) = 0. Рассмотрим теперь множество Е = [а, &] \ Z. Пусть Хо е Е. Тогда, поскольку Г(х0) = 0, для всех х, достаточно близких к х0, выполнено неравенство f (х) — f (х0) х — х0 т. е. (мы считаем для определенности, что х > х0) f(x) — f(x0) < е(х — х0) или ex0 — f(x0) < ex — f(x); таким образом, х0 есть точка, невидимая справа для функции g(x)= ex— f(x). Следовательно, по лемме Ф. Рисса, множество Е содержится в конечной или счетной системе непересекающих- ся интервалов (а*, Р/г), в концах которых выполняются условия efc — f (Pt) > eak — f (aft), т. e. f (PJ — f (aJC e — aft), откуда E (f (PJ — f (aJ) < eE (Pi ~ e(& — a). k k Иначе говоря, множество E переводится функцией f в множе- ство, покрывающееся системой интервалов, сумма длин которых меньше е(Ь — а). Ввиду произвольности е отсюда следует, что И(/(£)) = О. Итак, и f(E) и f(Z) имеют меру нуль. Но в сумме эти два множества составляют отрезок [f(a),f(&)]. Тем самым доказано, что длина этого отрезка есть нуль, т. е. что f(x) — const. Теперь уже легко доказывается и сама теорема 3. Достаточ- но ограничиться случаем, когда функция F(x) не убывает. В этом случае X Ф(х) = К(х) — \f(t)dt (7) а представляет собой функцию, тоже монотонно неубывающую. Действительно, если х" > х', то по теореме 1 х" Ф (х") - Ф (х') = F (х") - F (х') - j f(t) dt > 0. Кроме того, Ф абсолютно непрерывна (как разность двух абсо- лютно непрерывных функций) и Ф'(х) = 0 почти всюду (соглас-
§ 41 ВОССТАНОВЛЕНИЕ ФУНКЦИИ ПО ЕЕ ПРОИЗВОДНОЙ 347 но теореме 1 § 3). Поэтому в силу леммы Ф есть константа. По- ложив в (7) х = а, получаем, что эта константа равна F(a). Теорема доказана. Мы видели выше, что всякую функцию f с ограниченным из- менением можно представить как сумму функции скачков Н и непрерывной функции <р с ограниченным изменением (стр. 336), f = Н +<р. Рассмотрим теперь непрерывную, но не абсолютно непрерыв- ную функцию с ограниченным изменением и положим X ф (х) = j q/ (/) dt. а Разность Х = Ф представляет собой непрерывную функцию с ограниченным из- менением. При этом ^х(*) = ф' (*) — л==0 а почти всюду. Назовем непрерывную функцию с ограниченным изменением сингулярной, если ее производная равна нулю почти всюду. Мы можем теперь сформулировать следующий результат: всякая функция с ограниченным изменением может быть представлена в виде суммы трех компонент f = H + + x (8) — функции скачков, абсолютно непрерывной функции и сингу- лярной функции. Нетрудно показать, что каждое из слагаемых в разложении (8) определяется самой функцией f однозначно с точностью до константы. Если функции, входящие в равенство (8), нормиро- вать, потребовав обращения двух из них в нуль в точке х = а, то разложение (8) будет уже в точности единственным. Про- дифференцировав равенство (8), мы получим, что почти всюду Г (х) = ф' (х) (поскольку Н' и х' равны нулю почти всюду). Следовательно,, при интегрировании производной от функции с ограниченным изменением восстанавливается не сама эта функция, а только ее абсолютно непрерывная компонента. Две другие компоненты (функция скачков и сингулярная) при этом «бесследно исче- зают».
348 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI Поучительно сравнить результаты этого параграфа с тем, что дает теория обобщенных функций. Как и в гл. IV, будем понимать под обобщенной функцией линейный непрерывный функционал над пространством К финитных бесконечно диффе- ренцируемых функций. При этом обычной локально суммируе- мой функции f сопоставляется функционал, действующий на ОО элементы по формуле (f, ф)= f(x)q>(x)dx. Обобщен- ной производной от этого функционала служит функционал, ставящий в соответствие элементу (ре К число (f', ср) = со = — j f (х) ф' (х) dx. Так как в классе обобщенных функций уравнение у' == 0 имеет только обычные решения (константы), то всякая обобщенная функция с точностью до константы вос- станавливается по своей производной. В частности, всякая ло- кально суммируемая функция f с точностью до константы почти всюду восстанавливается по своей обобщенной производ- ной f'. Предположим теперь, что функция f почти всюду имеет производную, например, f—монотонная функция. Обозначим через fi = df/dx обычную производную функции f. (Мы уже ви- дели, что df/dx может равняться 0 почти всюду, хотя f(x)^ const!) Функция df/dx является локально суммируемой (мы предполагаем, что f монотонна) и, следовательно, мы можем сопоставить этой функции функционал (обобщенную функцию) ОО (f1,<p)= -^-(p(x)dx. Существенный факт состоит в том, что обобщенная функция fi, вообще говоря, не совпадает с обобщен- ной функцией f'. Например, если ( 1 при х > О, (0 при х ^0, то fi = 0, a f' = 6 (см. пример 1 стр. 205—206). Теорема 3, собственно говоря, и означает, что среди всех функций с ограниченным изменением для абсолютно непрерыв- ных функций (и только для них!) производная, понимаемая в обычном смысле, совпадает с обобщенной производной той же функции. Здесь мы снова сталкиваемся с тем положением, о котором уже говорилось в § 4 гл. IV: для выполнимости основных опера- ций анализа (в данном случае речь идет о восстановлении функ- ции по ее производной) нужно или, оставаясь в рамках класси- ческих определений, ограничиться достаточно узким запасом
§ 5] ИНТЕГРАЛ ЛЕБЕГА КАК ФУНКЦИЯ МНОЖЕСТВА 349 функций (абсолютно непрерывными), или же, наоборот, суще- ственно расширить понятие функции (расширив при этом и оп- ределение производной). Упражнения. 1. Показать, что определение абсолютной непрерывно- сти, сформулированное выше, равносильно следующему: f абсолютно непре- рывна на [а, &], если она каждое подмножество меры нуль этого отрезка переводит снова в множество меры нуль. 2. Найти обобщенную производную «канторовой лестницы». 3. Пусть f — функция с ограниченным изменением, /' — ее обобщенная производная и f\— функционал (обобщенная функция), определяемый «обыч- ной» производной — функции f. Доказать, что а) если f абсолютно непрерывна, то /' = /г, б) если f = fi, то f(x) эквивалентна абсолютно непрерывной функции, т. е. совпадает с такой функцией почти всюду. В частности, если f' = f\ и f непрерывна, то и f абсолютно непрерывна. § 5. Интеграл Лебега как функция множества. Теорема Радона—Никодима 1. Заряды. Разложение Хана и разложение Жордана. Поня- тия и факты, изложенные в предыдущих параграфах для функ- ций на прямой, распространяются в значительной степени и на функции, заданные на произвольном пространстве с мерой. Пусть X— некоторое пространство с (конечной) мерой ц и /" — суммируемая по ц функция на X. При этом / будет сумми- руема на каждом измеримом подмножестве А множества X и, следовательно, интеграл Ф(Д)=$/(хНи (1) А (с фиксированной /) представляет собой функцию множества, определенную и о-аддитивную на о-алгебре всех измеримых множеств пространства X. Таким образом, для любого разложе- ния А = U 4 k измеримого множества А в конечную или счетную сумму попар- но непересекающихся измеримых множеств выполнено равенство Ф(А) = £ф(4). k Иначе говоря, функции Ф, определенная равенством (1), обла- дает всеми свойствами о-аддитивной меры, за исключением, быть может, неотрицательности. (При неотрицательной / неот- рицательна и Ф.) Определение I. Произвольная (конечная) о-аддитивная функция множества Ф, определенная на некоторой о-алгебре
350 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI подмножеств данного пространства X, называется знакоперемен- ной мерой, или, короче, зарядом. Понятие заряда служит естественным обобщением понятия о-аддитивной меры и, как мы увидим ниже, сводится в опреде- ленном смысле к этому понятию. Упражнение. Доказать, что для любого (конечного) заряда Ф, за- данного на а-алгебре множеств существует такая константа с, что |Ф(Д) | с при всех .4 ей. Если рассматривается реальный электрический заряд, распо- ложенный, скажем, на некоторой поверхности, то эту поверх- ность можно разделить на две области: несущую положитель- ный заряд (т. е. такую, что любая ее часть заряжена положи- тельно) и несущую отрицательный заряд. Математическим эквивалентом этого факта служит приводимая ниже теорема 1. Введем предварительно следующую терминологию. Пусть Ф — заряд, определенный на о-алгебре <5 подмножеств про- странства X. Множество Ее® называется отрицательным от- носительно Ф, если Ф(ЕПЕ)^0 для любого Ее®; аналогично Е называется положительным, если Ф(ЕГ\ F)^ 0 для всех FeS. Теорема 1. Если Ф — заряд, определенный на X, то суще- ствует такое измеримое множество A~czX, что А~ отрицательно и А+ — X \ А~ положительно (относительно Ф). Доказательство. Положим а = inf Ф(Л), где нижняя грань берется по всем отрицательным множествам А. Пусть {Л„}—такая последовательность отрицательных мно- жеств, что lim Ф (Л„) = а. п-> 00 Тогда А~ = J Ап представляет собой, как легко видеть, такое п отрицательное множество, что ф(Л") = а. Покажем, что А~ и есть искомое множество, т. е. покажем, что Л+ = Х \ А~ положительно. Пусть это не так, т. е. пусть Л + содержит такое измеримое подмножество Со, что Ф(С0)<0. При этом множе- ство Со не может быть отрицательным, так как иначе мы при- соединили бы его к Л" и получили бы отрицательное множество А, для которого Ф (Л) < а,
ИНТЕГРАЛ ЛЕБЕГА КАК ФУНКЦИЯ МНОЖЕСТВА 351 § 51 что невозможно. Поэтому существует такое наименьшее целое число k{, для которого в Со найдется подмножество Сь удовле- творяющее условию Ф(С,)> I/fe,. Разумеется, Ci =И= Со. Для множества С0\С! можно повторить рассуждение, проведенное для Со; мы получим множество С2, удовлетворяющее условию Ф(С2)>1/62 (62>М и т. д. Наконец, положим £о = Со \ U Cz. 1=1 Множество Со не пусто, так как Ф(Со)<0, а Ф(Сг)>0 при Из построения следует, что Со отрицательно. Поэтому, присоединив его к А~, мы снова приходим к противоречию с оп- ределением а. Следовательно, для всех измеримых £czX\H" имеем Ф(£)>0, т. е. Х\ А~ положительно. Теорема доказана. Разбиение пространства X на отрицательную часть А~ и по- ложительную А+ называется разложением Хана. Разложение Хана, вообще говоря, не единственно, однако если X = Ai U Л|+ и X = А2 U Аг” — два таких разложения, то для всякого Ф(СПАГ) = Ф(£П <) и Ф(сПАО = Ф(£ПА2+). (2) Действительно, СП(АГ\А2“)<=£П4Г, (3) откуда следует, что Ф(£П (АГ \ АГ)) <0. В то же время СП(АГ\А2-)<=£ПА2+, (4) откуда ф(£ П (АГ\АГ))^0. Таким образом, ф(£ П (АГ\АГ))=0. Аналогично получаем Ф(£П(АГ \ АГ))=0. Отсюда следует, что Ф(£ПАГ) = Ф(£ПА2-).
352 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI Точно так же доказывается и второе из равенств (2). Таким образом, на S заряд Ф однозначно определяет две неотрицательные функции множества, а именно: Ф+ (£) = ф(£ П Л+), Ф"(£) = - Ф(£П/Г), называемые соответственно верхней вариацией и нижней вариа- цией заряда Ф. При этом, очевидно, 1) ф = ф+ — ф-, 2) Ф+ и Ф_ представляют собой неотрицательные о-аддитиз- ные функции множества, т. е. меры. Мерой будет, очевидно, и функция |Ф| = Ф+4- Ф"; она назы- вается полной вариацией заряда Ф, а представление Ф в виде разности верхней и нижней вариаций называется разложением Жордана этого заряда Ф. Замечание. Мы рассматривали сейчас конечные заряды, т. е. такие функции Ф, значения которых ограничены как сверху, так и снизу (см. упражнение на стр. 350). При этом Ф+ и Ф' — конечные меры. Сказанное выше можно обобщить на заряды, ограниченные лишь с одной стороны, т. е. такие, для которых хотя бы одна из величин зирФ(Л) и т!Ф(Л) конечна. 2. Основные типы зарядов. Пусть р. — некоторая « аддитив- ная мера, определенная в пространстве X на некоторой «-алгеб- ре S. Множества, входящие в S, мы будем называть измери- мыми. Введем следующие понятия. Мы скажем, что заряд Ф, определенный на множествах £eS, сосредоточен на измеримом множестве Ао, если Ф(£) =0 для каждого £c.Y\/1o. Множество Ао называется при этом носителем заряда Ф. Заряд Ф называется непрерывным, если Ф(£)=0 для лю- бого одноточечного множества £. Заряд Ф называется дискрет- ным, если он сосредоточен на некотором конечном или счетном множестве. Иными словами, дискретность заряда означает су- ществование такого конечного или счетного множества точек <?!, с2..сп, что для каждого £ cz X Ф(£)= Z Ф(^). Заряд Ф называется абсолютно непрерывным (относительно данной меры ц), если Ф(Л)= 0 для всякого измеримого А, для которого ц(Л) = 0. Заряд Ф называется сингулярным (относительно меры ц), если он сосредоточен на некотором множестве нулевой ц-меры. Ясно, что если заряд одновременно абсолютно непрерывен и син- гулярен относительно ц, то он нулевой.
ИНТЕГРАЛ ЛЕБЕГА КАК ФУНКЦИЯ МНОЖЕСТВА 353 § q 3. Абсолютно непрерывные заряды. Теорема Радона—Ни- кодима. Примером заряда, абсолютно непрерывного относи- тельно данной меры ц, может служить интеграл Лебега Ф(А)= \f(x)dn А от фиксированной суммируемой функции f, рассматриваемый как функция множества. Оказывается, что этим и исчерпывают- ся все абсолютно непрерывные заряды. Иначе говоря, справед- лива следующая теорема. Теорема 2 (Радон —Никодим). Пусть ц— некоторая конечная о-аддитивная мера, определенная на о-алгебре S под- множеств из X, а Ф — заряд, определенный на той же о-алгебре и абсолютно непрерывный относительно ц. Тогда существует та- кая суммируемая по ц функция f на X, что Ф(А)= \f(x)dn А для каждого измеримого А. Эта функция, называемая производ- ной заряда Ф по мере ц, определяется однозначно, с точностью до ^-эквивалентности. (Две функции называются ^-эквивалентными, если они сов- падают почти всюду относительно меры ц). Доказательство. Каждый заряд можно представить как разность двух неотрицательных (см. п. 1), при этом абсолютно непрерывный заряд представляется как разность абсолютно не- прерывных. Поэтому доказательство теоремы достаточно про- вести для неотрицательных зарядов, т. е. для мер. Итак, пусть Ф — мера, абсолютно непрерывная относительно данной меры ц. Докажем следующую лемму. Лемма. Пусть мера Ф абсолютно непрерывна относительно ц и не равна нулю тождественно. Тогда существуют такое п и такое измеримое множество В, что р(В)>0 и В положительно по отношению к заряду Ф — Доказательство леммы. Пусть X = U А„ — разло- жение Хана, отвечающее заряду Ф — ц, п = 1, 2...и пусть Ао == А До+ - U At п=1 П=1 Тогда ф(А0-)^ц(А0-) при всех п,
354 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI т. е. ф(Ло")==О и, следовательно, Ф(Л<?')>0, а значит, и ц(Ло")>О(в силу абсолютной непрерывности Ф по ц). Поэтому найдется такое п, что ц(Л^)>0. Это п и множество В = А„ удовлетворяют условиям леммы. Перейдем теперь непосредственно к доказательству ремы. Пусть К. — множество функций f на X, обладающих дующими свойствами: f неотрицательны, интегрируемы по \ f (х) dii Ф (Л) для всякого измеримого А. Пусть f(x)dn по всем fe/C (. тео- сле- ц и Возьмем последовательность функций {fn} из К такую, что lim \fn(x)dn = M. Положим g„(x) = max(f1(x), f2(x), Покажем, что gn е К, т. е., что для всякого измеримого Е Е Действительно, Е можно представить в виде пересекаются и gn{x) = fk(x) на Ek; поэтому п и Ek, где Elt не А=1 п п Е k=l Ek fe=I Положим f (X) = sup{f„ (x)J. Ясно, что при этом f(x)= lim gn(x) и, следовательно, по тео п->°° реме Б. Леви, \ f (х) d[i — lim \ gn (х) du = М. J Л->оо J Покажем теперь, что Ф(£)- J /(х)с?ц = 0. Е
§ 5] ИНТЕГРАЛ ЛЕБЕГА КАК ФУНКЦИЯ МНОЖЕСТВА 355 По построению, функция множества Х(£) = Ф(£)- \ Е неотрицательна и обладает всеми свойствами меры. Кроме того, она абсолютно непрерывна относительно ц. Если А.^0, то в силу леммы найдутся такое е>0 и такое В, ц(В)>0, что е.и(£ПВ)^Х(ЕПВ) для любого измеримого Е. Тогда, положив h(x) = f(x) + ехв(х), где хв — индикатор множества В, мы получили бы для любого измеримого Е h(x)dp = $ f(x)cU + e.i(£DB)^ J f(x)dp. + Ф(£рВ)^Ф(£). E E E\B Это означало бы, что функция h принадлежит определенному выше множеству К. Но в то же время h (х) dp = f (х) dp + е i (В) > М, х х а это противоречит определению М. Итак, существование такой функции f, что Ф(Л)=ф(х)г/И, А доказано. Покажем ее единственность. Если для всех Ле® ФИ) = fi (х) dp = f2(x) dp, А А то при любом п для множеств Л„ = {х : f2(x) — (х)> !/«} имеем ц (Л„) П $ (f, (х) — f2 (х)) dp = 0. Ап Аналогично, для Вт — {х : (х) — f2 (х) > Цт} имеем ц(Вт) = 0. Так как {х:Л(х)=#^2(х)} = (уЛ)и(У Вт), то n{x:fi(x)=#f2(x)} = 0, т. е. fj (X) = f2(x) почти всюду. Доказательство закончено.
356 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI Замечание. Теорема Радона — Никодима представляет со- бой, очевидно, естественное обобщение теоремы Лебега о том, что абсолютно непрерывная функция есть интеграл от своей производной. Однако, в то время как при рассмотрении функ- ций на прямой у нас есть эффективный способ нахождения про- изводной— вычисление предела отношения Д/ к Дх, теорема Радона — Никодима лишь устанавливает существование произ- водной г/Ф/б/ц абсолютно непрерывного заряда Ф по мере р, по не дает способа для ее вычисления. Такой способ можно ука- зать, но мы не будем на этом останавливаться. В Общих чертах он состоит в вычислении предела отношения Ф(4)/ц(Д) по не- которой системе множеств, «стягивающихся» в определенном смысле к данной точке. Детально эти вопросы рассмотрены, на- пример, в [53]. § 6. Интеграл Стилтьеса 1. Меры Стилтьеса. В § 1 предыдущей главы, говоря о по- строении меры Лебега на прямой, мы уже упоминали о следую- щей конструкции. Пусть на некотором отрезке [а, 6] задана мо- нотонно неубывающая функция F, которую мы для определенно- сти будем считать непрерывной слева. Определив меры всех отрезков, интервалов и полуинтервалов, принадлежащих основ- ному отрезку [а, 6], равенствами т (а, 0) = F (0) — F (а + 0), т[а, 0] = F(0 + O)-F(a), т(а, 0] = F(0 + O)-F(a + O), (1) т [а, 0) = F (0) — F (а), мы можем затем распространить эту меру с помощью лебеговой процедуры продолжения меры на некоторую о-алгебру а.?, со- держащую все открытые и все замкнутые (а значит, и все боре- левские) подмножества отрезка [а, 6]. Меру рр, полученную с помощью такого построения, называют мерой Лебега — Стилтьеса, отвечающей функции F, а саму функцию F называют производящей функцией этой меры1). Рассмотрим некоторые частные случаи мер Лебега — Стилтьеса. 1. Пусть F — функция скачков, Хь х2, — ее точки разрыва, а hb h2, ... — величины ее скачков в этих точках. Тогда мера отвечающая этой функции, устроена следующим образом: ’) Если монотонно неубывающая функция F не непрерывна слева, то по ней тоже можно определить меру, внеся в формулы (1) очевидные измене- ния; например, надо положить m [a, 0] — F(|3 + 0)—F(a— 0) и т. д.
§ 6] ИНТЕГРАЛ СТИЛТЬЕСА 357 все подмножества отрезка [а, 6] измеримы и мера множества А равна Нд(А) = £ ht. (2) Xt е= А Действительно, из определения меры Лебега — Стилтьеса сразу же видно, что мера каждой точки х,- равна hi, а мера до- полнения множества {х;}.=1 равна нулю. Равенство (2) для лю- бого А ст [а, Ь] вытекает отсюда в силу о-аддитивности меры рр. Мера цг, построенная по какой-либо функции скачков, назы- вается дискретной мерой. 2. Пусть F — абсолютно непрерывная неубывающая функ- ция на [а, 6] и f = F'—ее производная. Тогда соответствующая мера pF заведомо определена на всех измеримых по Лебегу под- множествах отрезков [а, 6], причем для каждого такого множе- ства .4 Pf(A)= \f(x)dx. (3) А Действительно, в силу теоремы Лебега для каждого полуинтер- вала [а, 8) В Pf [а, Р) = F (Р) — F (а) = f (х) dx. а Поскольку лебегово продолжение всякой о-аддитивной меры однозначно определяется своими значениями на исходном полу- кольце, отсюда следует равенство (3) для всех измеримых по Лебегу А с: [а, 6]. Мера pf, отвечающая абсолютно непрерывной функции F, называется абсолютно непрерывной мерой. 3. Если F — сингулярная непрерывная функция, то отвечаю- щая ей мера рг целиком сосредоточена на том множестве лебе- говой меры нуль, на котором F' отлична от нуля или не суще- ствует. Сама мера рр называется при этом сингулярной мерой. Ясно, что если F = F[ -f- F2, то pF = рл + pFz; поэтому из разложимости монотонной функции в сумму функции скачков, абсолютно непрерывной и сингулярной компонент следует, что всякую меру Лебега — Стилтьеса можно представить в виде суммы дискретной, абсолютно непрерывной и сингулярной ком- понент. Разложение монотонной функции на три составляющие определяется с точностью до постоянных слагаемых. Поэтому разложение каждой меры Лебега — Стилтьеса на дискретную, абсолютно непрерывную и сингулярную компоненты одно- значно. Сказанное выше относится к мерам Лебега — Стилтьеса на отрезке. Если теперь F — ограниченная (сверху и снизу)
358 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА ГГЛ. VF монотонно неубывающая функция на всей прямой, то, опреде- лив меру любого отрезка, интервала и полуинтервала на пря- мой с помощью формул, аналогичных (1), мы получим конечную- меру на всей прямой, которую мы тоже будем называть мерой Лебега — Стилтьеса. В частности, мера всей прямой при этом будет равна F (оо) — F (— оо), где F(oo)= lim F(x), F(—oo) = lim F(x) X->oo X-> — oo (существование пределов следует из монотонности и ограничен- ности F). Понятие меры Лебега — Стилтьеса на самом деле исчерпы- вает все меры (т. е. все конечные о-аддитивные неотрицатель- ные функции множеств) на прямой. Действительно, пусть ц— любая из таких мер. Положив F (х) = ц (— оо, х), мы получим монотонную функцию, такую, что отвечающая ей мера Лебега — Стилтьеса совпадает с исходной мерой ц. Таким образом, термин «меры Лебега — Стилтьеса» на самом деле не выделяет какого-либо специального класса мер на прямой, а указывает лишь на определенный способ построения таких: мер — по заданной производящей функции. 2. Интеграл Лебега — Стилтьеса. Пусть pF — мера на от- резке [а, Ь], порожденная монотонной функцией F. Для этой меры обычным образом определяется класс суммируемых функ- ций и вводится понятие интеграла Лебега ь f W dup. a Такой интеграл, взятый по мере pF, отвечающей функции F, на- зывается интегралом Лебега — Стилтьеса и обозначается симво- лом ь \f(x)dF(x). а Рассмотрим некоторые частные случаи. 1. Если F — функция скачков (т. е. если iiF— дискретная! ь мера), то интеграл ^f(x)dF(x) сводится, очевидно, к сумме- а где Xi — точки разрыва функции F, a hi — скачки р i В точках Хг.
•§6] ИНТЕГРАЛ СТИЛТЬЕСА 359 2. Если F — абсолютно непрерывная функция, то интеграл ь ь Лебега — Стилтьеса (х) dF (х) равен f (х) F' (х) dx, т. е. ин- а а тегралу от f(x)F'(x), взятому по обычной лебеговой мере. Дей- ствительно, если /(х) = const на некотором измеримой множе- стве A cz [а, Ь] и f (х) = 0 вне А, то равенство ь ь f (х) dF (х) = f (х) F' (х) dx (4) а а следует из (3). В силу о-аддитивности интегралов равенство (4) распространяется и на простые функции, суммируемые по мере |Xf. Пусть теперь {fn} — последовательность простых функций, равномерно сходящаяся к f. Можно при этом считать, что по- следовательность {f„} неубывающая. Тогда {fn(^)F'(x)} — не- убывающая последовательность, почти всюду сходящаяся к f(x)F'(x), и в силу теоремы Б. Леви, в равенстве ь ь fn WdF W = $ fn W F' (x) dx a a можно перейти к пределу при оо. Из сказанного ясно, что если F есть сумма функции скачков ъ абсолютно непрерывной функции, то интеграл Лебега — Стилтьеса по мере сводится к ряду (или конечной сумме) и интегралу по обычной мере Лебега. Если же F содержит и син- гулярную компоненту, то такое сведение невозможно. Понятие интеграла Лебега — Стилтьеса можно естественным •образом расширить, перейдя от монотонных функций к произ- вольным функциям с ограниченным изменением. Пусть Ф — та- кая функция. Представим ее в виде разности двух монотонных •функций Ф = v — g, где v — полное изменение функции Ф на отрезке [а, х]. Введем теперь интеграл Лебега — Стилтьеса по Ф, положив, по опре- делению, ь ь ь $ f (х) dA> (х) = f (х) dv (х) — f (х) dg (х). а а а Нетрудно проверить, что если Ф представлена каким-либо иным способом как разность двух монотонных функций, скажем, Ф = w — h,
360 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. vr то ь ь ь ь f (х) dv (х) dg (x)=^f (х) dw (x)—^f (x) dh (x), a a a a т. e. для вычисления интеграла Лебега — Стилтьеса по данной функции Ф можно пользоваться любым представлением этой функции в виде разности двух монотонных. 3. Некоторые применения интеграла Лебега — Стилтьеса в теории вероятностей. Интеграл Лебега — Стилтьеса находит применение как в анализе, так и во многих прикладных вопро- сах. В частности, это понятие широко используется в теории ве- роятностей. Напомним, что функцией распределения случайной величины £ называется функция F, определяемая для каждого х равенством F(x) = P(g<x), т. е. F(x) есть вероятность того, что случайная величина g при- мет значение, меньшее х. Очевидно, каждая функция распреде- ления монотонно не убывает, непрерывна слева и удовлетворяет условиям F(-oo) = 0, F(4-oo)=l. Обратно, каждую такую функцию можно считать функцией рас- пределения некоторой случайной величины. Существенными характеристиками случайной величины яв- ляются ее математическое ожидание СО М$ = J xdF(x) (5) и дисперсия ОО Dl= j (x-MtfdF(x). (6) — со Среди случайных величин выделяют обычно так называемые дискретные и непрерывные случайные величины. Случайная ве- личина называется дискретной, если она может принимать лишь, некоторое конечное или счетное число значений Xj, х2, х„, ... (например, число вызовов на телефонной станции за некоторый промежуток времени есть дискретная случайная величина). Если pi, рг, > Рп, ... — вероятности, с которыми величина | принимает значения хь х2, ..., хп, ..., то функцией распреде-
6] ИНТЕГРАЛ СТИЛТЬЕСА 361 ления £ служит, очевидно, функция скачков. Для нее интегралы (5) и (6) сводятся соответственно к суммам Alg = Е xtpt i Й Di, = £ (Xi — a)2 Pl (а = М). i Случайная величина £ называется непрерывной, если ее функ- ция распределения F абсолютно непрерывна. Производная F' этой функции распределения называется плотностью распреде- ления вероятностей случайной величины В соответствии со сказанным в предыдущем пункте, для непрерывной случайной величины стилтьесовские интегралы, выражающие ее математи- ческое ожидание и дисперсию, сводятся к интегралам по обыч- ной лебеговой мере: оо оо = xp(x)dx, D;= (х — а)2 р(х) dx, —оо —оо где р = F' — плотность распределения вероятностей для £ и а = М£. В элементарных курсах теории вероятностей ограничиваются обычно рассмотрением дискретных и непрерывных случайных величин, которые в основном только и встречаются в приклад- ных вопросах. Однако, вообще говоря, функция распределения случайной величины может содержать и сингулярную компонен- ту, так что не всякую случайную величину можно представить как комбинацию дискретной и непрерывной. Пусть В — случайная величина, F— ее функция распределения и ц = — ф(£)—другая случайная величина, представляющая собой борелевскую функцию от Математическое ожидание Мц величины ц можно, по опре- делению, записать как ОО х с1Ф (х), — ОО где Ф — функция распределения для ц. Существенно, однако, что если ф суммируема по мере, порождаемой на прямой функцией F, то математиче- ское ожидание величины ц можно записать и через функцию распределения F величины g, а именно: ОО Мд = Мф (Ej) = <f(x)dF(x). — ОО Действительно, функция y=tf (х) определяет отображение прямой (—оэ < < х < со) с заданной на ней мерой (порожденной F) в прямую (— со < у < со) с мерой цф, в которую переводится отображением ^ = <р(х). Но из результатов гл. V следует, что если (Л, ц) и (К, v) — два
362 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI Пространства с мерой, ф — сохраняющее меру (т. е. такое, что у(Д) = = ц(ф-*(4))) отображение, переводящее (X, р) в (У, v), а / — суммируема® функция на (У, V), то jj f (у) dv = f (<p (x)) dy. Y X (замена переменных в интеграле Лебега). Положив здесь f (у) = у и ц — Цг, v = р, мы и получим требуемое равенство. Таким образом, для вычисления математического ожидания (а также, конечно, и дисперсии) функции от величины g достаточно знать лишь функцию распределения самой вели- чины 4. Интеграл Римана—Стилтьеса. Наряду с интегралом Ле- бега— Стилтьеса, рассмотренным выше и представляющим со- бой фактически разность лебеговых интегралов от данной функ- ции f по двум мерам, заданным на прямой, можно определить- еще и так называемый интеграл Римана — Стилтьеса. Он вво- дится как предел интегральных сумм, аналогичных обычным ин- тегральным суммам Римана. Пусть снова Ф — некоторая непрерывная слева функция с ограниченным изменением, заданная на полуинтервале [а, Ь) к f — произвольная функция на этом же полуинтервале. Рассмот- рим некоторое разбиение ’) а = х0 < х, < х2 < ••• <хп = Ь полуинтервала [а, Ь) на элементы [xi-i, Xi) и, выбрав в каждом из них произвольную точку g,-, составим сумму Ь(^[ФМ-ФЫ] (7> i=i (под Ф(х„) при этом понимается Ф(й— 0)). Если при тах(х< — эти суммы стремятся к некоторому пределу (не зависящему ни от способа дробления промежутка [а, Ь), ни от выбора точек gi, в каждом из элементов разбиения), то этот предел называется интегралом Римана — Стилтьеса от функ- ции f по функции Ф по [а, Ь) и обозначается символом ь f (х) йФ(х). (8) а Теорема 1. Если функция f непрерывна на отрезке [с, ij, то ее интеграл Римана — Стилтьеса (8) существует и совпадает с соответствующим интегралом Лебега — Стилтьеса. 1) Поскольку в интеграле Стилтьеса вклад отдельных точек может быть, отличен от нуля, элементы разбиения не должны иметь общих точек. По- этому мы везде берем здесь полуинтервалы.
‘§ 6] ИНТЕГРАЛ СТИЛТЬЕСА 363 Доказательство. Сумму (7) можно рассматривать как интеграл Лебега — Стилтьеса от ступенчатой функции fn(x) = f(h) при x,_1<x<xi. При измельчении разбиения промежутка [а,Ь) последователь- ность таких функций равномерно сходится к f. Поэтому предел этих сумм существует и представляет собой интеграл Лебега — Стилтьеса от предельной функции f (теорема о предельном пе- реходе под знаком интеграла). Вместе с тем именно этот пре- дел мы и назвали интегралом Римана — Стилтьеса (8). Установим некоторые элементарные свойства интеграла Ри- мана — Стилтьеса. 1. Справедлива оценка (теорема о среднем) j f (х) с1Ф (х) max | f (х) | Vba [Ф] (9) О* [Ф] — полное изменение функции Ф на [a, ft]). Действительно, при любом разбиении промежутка [а, Ь) вы- полнено неравенство Z f (L) (Ф (х.) - ф (xz_,)) < 11 f &) I • | Ф (хг) - Ф (X'-J I < г=1 i=l < max | f (х) | • I Ф (хг) — Ф (хг-j) | < max | f(x) | Vba [Ф]. i = l Переходя в этом неравенстве к пределу, мы и получим оценку {9). При Ф(х) = х она переходит в известную оценку f (х) dx (b — a) max | f (х) | для интеграла Римана. 2. Если Ф = Ф, + Ф2, то $ f (х) г/Ф (х) = р (х) dtby (х) + J f (х) </Ф2 (х). Действительно, при всяком разбиении промежутка [а, Ь) со- ответствующее равенство выполнено для интегральных сумм, следовательно, оно сохраняется и в пределе, т. е. для интег- ралов. Замечание I. Мы определили интеграл Римана — Стилтье- са (8), считая, что функция Ф(х) непрерывна слева. Однако определение этого интеграла как предела сумм (7) сохраняет.
364 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI очевидно, смысл и для любой функции Ф(х) с ограниченным изменением. Замечание 2. Все сказанное об интеграле Римана — Стилтьеса по конечному промежутку легко переносится на слу- чай, когда интеграл берется по всей прямой или по полупрямой. Кроме того, мы определили интеграл Стилтьеса по полу- интервалу [а, Ь). Аналогично можно определить интеграл по (п, &], а также интегралы по [а, й] и (а, Ь). В случае интеграла Стилтьеса, в отличие от обычного риманова интеграла, значения интеграла по интервалу (а, Ь), отрезку [а, Ь] и полуинтервалам (а, Ь] и [а, Ь), вообще говоря, не совпадают между собой. На- пример, если а — точка разрыва функции Ф, то интеграл по [а, Ь] равен интегралу, взятому по (а, Ь] плюс член вида f(a)h, где h = Ф(а -ф- 0) — Ф(а). Приведенные свойства 1 и 2 выполнены для любой функ- ции [, для которой входящие в их формулировки выраженйя имеют смысл. Если предположить, что f(x) непрерывна на отрезке [а, 6], то соответствующий интеграл обладает еще сле- дующими существенными свойствами (при этом интеграл можно понимать как интеграл по отрезку [a, ft] или по любому из по- луинтервалов (а, 6] и [а, Ь)). 3. Если Ф1 и Ф2 — две функции с ограниченным изменением на [а, Ь), совпадающие всюду, кроме конечного или счетного числа внутренних точек этого промежутка, то ь ь f (х) (х) = f (х) </Ф2(х) а а для любой непрерывной на [а, Ь] функции f. Для доказательства рассмотрим сперва случай, когда Ф2=0, т. е. установим справедливость следующего утверждения. 3'. Если ф — функция с ограниченным изменением, отличная от нуля лишь в конечном или счетном числе точек, лежащих внутри (а, Ь), то ъ j f (х) dip (х) — 0 а для любой непрерывной на [а, 6] функции f. Действительно, это очевидно для функции, отличной от нуля в одной точке хо (если брать сколь угодно мелкие разбиения промежутка [а, Ь), не включая х0 в число точек деления, то бу- дут получаться интегральные суммы, равные нулю), следова- тельно, по аддитивности это верно и для любой функции, от- личной от нуля в конечном числе точек. Пусть теперь ф отлична от нуля в точках rh г2, ..., гп, ... и ylt у2, ..., уп, ... — ее зна-
§ 6] ИНТЕГРАЛ СТИЛТЬЕСА 365 чения в этих точках. Поскольку тр имеет ограниченное измене- ние, то X I Уп I < 00• Выберем номер N так, что X I Уп К 8, и п п> н представим гр в виде суммы Ф = 'P.v + Ф’ где rpw принимает значения у\, ..., у и в точках ri, ..., гк и равна 0 во всех остальных, а ф отлична от 0 только в точках rN+i, rN+2, ... В силу свойства 2 b b ь jj f (х) dip (х) = jj f W dip A, (x) + jj f (x) dip (x). a a a Первый из этих интегралов по уже доказанному равен нулю, а второй, по свойству I, допускает оценку ь jj fWdip(x) а < max | f (x) | 2e (поскольку, очевидно, РаГФ] — 2 X l#nl<2e). В силу произ- п > N вольности е отсюда вытекает наше утверждение. Теперь для доказательства свойства 3 рассмотрим разность гр — Ф] — Ф2. Она отлична от нуля лишь в конечном или счет- ном числе точек, принадлежащих (а, Ь). Остается применить 2 и 3'. В частности, поскольку функция с ограниченным измене- нием имеет не более чем счетное число точек разрыва, получаем следующее свойство. 4. Если функция f непрерывна, то интеграл Римана — ь Стилтьеса j f (х) йФ (х) не зависит от значений, принимаемых а функцией Ф в ее точках разрыва, лежащих внутри (а, Ь). Поскольку интеграл Римана — Стилтьеса от непрерывной функции совпадает с соответствующим интегралом Лебега — Стилтьеса, для интеграла Римана — Стилтьеса от непрерывной функции f(x) справедливы равенства ь jj f (х) йФ (х) = £ f(Xi)h{, a i если Ф — функция скачков, и b ь j f (х) йФ (х) = j f (х) Ф' (х) dx, (10) а а
366 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI если Ф — абсолютно непрерывная функция. Если при этом Фг интегрируема по Риману, то интеграл в (10) справа можно по- нимать в римановом смысле. 5. Предельный переход под знаком интеграла Стилтьеса. В гл. V мы доказали ряд теорем о предельном переходе под знаком интеграла Лебега. При этом вопрос ставился следующим образом: даны последовательность функций {Д} и интегралы от них по некоторой фиксированной мере; нас интересует возмож- ность предельного перехода под знаком интеграла. Однако при- менительно к интегралу Стилтьеса интересна и другая поста- новка вопроса: дана последовательность функций с ограничен- ным изменением {Фп}. При каких условиях для фиксированной функции f под знаком интеграла ь 5 f (*) (х) а возможен предельный переход? Здесь имеет место следующая теорема. Теорема 2 (первая теорема Хелли). Пусть функции Фп с ограниченным изменением на отрезке [а, 6] сходятся в ка- ждой точке этого отрезка к некоторой функции Ф, причем пол- ные изменения функций Фп ограничены в совокупности-. Еа[Фп]<С (п=1,2, ...). Тогда предельная функция Ф тоже имеет ограниченное из- менение и для любой непрерывной функции f справедливо ра- венство ь ь lim Ь(Х)4/Ф„(Х)=Ь(Х)4/Ф(Х). (11) J •> а а Доказательство. Покажем прежде всего, что полное из- менение предельной функции Ф не превосходит той же констан- ты С, которой ограничены все Еа[Фп]. Действительно, при лю- бом разбиении отрезка [а, 6] точками а—Хо < Xi < ... < xm=& имеем m m £|Ф(-^) — ®(xfc-i)|= lim £|ф„(хй) — Ф„(х4_|)|<С, &=J fe=I следовательно, Еа[Ф]^С. Покажем теперь, что соотношение (11) выполнено в том случае, если f — ступенчатая функция. Пусть f принимает значения йл
§ 6] ИНТЕГРАЛ СТИЛТЬЕСА 367 на полуинтервалах [хл_ь xh). Тогда ь \ f (х) с!Фп (х) = У hk [Ф„ (xft) — Ф„ (xft_,)] a k И ь J f (X) 4/Ф (X) = X hk [Ф (Xft) - Ф (Xft_,)]. a k Ясно, что первое из этих выражений при п->оо переходит во второе. Пусть теперь f — непрерывная функция и е — произвольное положительное число. Выберем ступенчатую функцию fe так, что И (X) — (х) I < е/(ЗС) Тогда ь ь $Цх)</Ф(х)- $Цх)</Ф„(х) а а b b / \х) 4/Ф (х) — f£ (х) б/Ф (х) а а b Ь + J ft (х) йФ W-J ft (х) d®n W + а а b \ /е(х)(/фь(х}- Jf(x)dO„(x) а а В силу теоремы о среднем для интеграла Стилтьеса, первое и третье слагаемые здесь меньше, чем е/3, а второе — меньше е/3 при всех достаточно больших п. Поскольку е > 0 произвольно, отсюда вытекает утверждение теоремы. Замечание. Эта теорема переносится и на тот случай, когда в интегралах ь J f (х) d<bn (х) а один или оба предела бесконечны. При этом, однако, функция / должна на бесконечности стремиться к некоторому конечному пределу (это позволяет равномерно аппроксимировать ее на всем бесконечном промежутке ступенчатыми функциями, при- нимающими лишь конечное число значений). Если первая теорема Хелли устанавливает условия, при ко- торых в интеграле Римана — Стилтьеса можно переходить к пределу по некоторой последовательности {Фп} функций с огра- ниченным изменением, то вторая выясняет, когда можно гаран- тировать само существование последовательности, удовлетво- ряющей условиям первой.
368 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. VI Теорема 3 (вторая теорема Хелли). Из всякого бес- конечного множества М функций Ф, заданных на некотором от- резке [а, 6] и удовлетворяющих условиям тах|Ф(х)|<С, Уа[Ф]<К, (12) (С и К — постоянные, одни и те же для всех Фе.'И), можно выбрать последовательность, сходящуюся в каждой точке от- резка [а, &]. Доказательство. Достаточно доказать эту теорему для монотонных функций. Действительно, пусть Ф = и — g, где д(х)— полное изменение функции Ф на отрезке [а, х]. Тогда функции v, отвечающие всем Ф е М, удовлетворяют неравен- ствам max | v (х) | К, Vba [и] = Vba [Ф] К, т. е. удовлетворяют условиям теоремы, и монотонны. Считая, что для монотонных функций теорема доказана, выберем после- довательность {Фп} из М так, чтобы для нее vn сходились к не- которому пределу v. Далее, функции gn = vn — Ф„ тоже монотонны и удовлетворяют условиям теоремы. Поэтому из {Фп} можно выбрать подпоследовательность так, что gnk сходятся к некоторому пределу g. Но тогда Ф„4 (х) -> Ф (х) = V (х) — g (х). Итак, приведем доказательство теоремы для семейства М моно- тонных функций. Пусть Г], г2, . . ., гп, ... — все рациональные точки отрезка [а, 6]. В силу (12) числа Ф(Г1) (где Ф пробегает все М) образуют ограниченное множество, поэтому найдется по- следовательность {Ф^}’ сходящаяся в точке /ц. Далее, из нее можно выбрать подпоследовательность {Фп1}, сходящуюся в точке г2 (и, конечно, в ri). Из {Ф„2>} выберем подпоследователь- ность, сходящуюся в точке гз, и т. д. Диагональная последова- тельность {Ф^} будет, очевидно, сходиться во всех рациональ- ных точках отрезка [а, 6]. Ее предел есть неубывающая функция Ф, определенная пока лишь в точках г2, . . . , гп, . . . Доопре- делим ее в остальных точках отрезка [а, 6], положив для ирра- циональных х Ф(х)= lim Ф(г) (г рациональны). Покажем, что г->х-0 полученная таким образом неубывающая функция Ф во всех точках непрерывности служит пределом последовательности
5 6] ИНТЕГРАЛ СТИЛТЬЕСА 369 {ф(п'}. Пусть X* — одна из таких точек. Тогда для заданного е > 0 можно найти такое б > О, что | Ф(х‘) — Ф(х) | < е/6, как только | х*— х | < 6. (13) Выберем рациональные точки г' и г" так, что г' < х* <Z г" и г' > х* —б, г" < х* + б. Пусть теперь «о настолько велико, что при п > п0 выполнены неравенства |Ф„(И-Ф(И1<8/6 и |Ф„(г")-Ф(г")|<8/6. (14) Из (13) и (14) следует, что о |Ф„(г')-Ф„(г")1<уе. Так как функция Ф„ неубывающая, то Ф„ (г') ^Ф„ (х‘) ^Фп (г"). Поэтому |Ф(Х*)-Ф„ (х‘)|< < | Ф (х‘) - Ф (/) I + | Ф (г') - Ф„ (г') I +1 Ф„ (г') - Ф„ (X*) I < б’ + ’б +“б'~е’ а это и значит, что lim Ф„ (х‘) = Ф (х‘). П->оо Итак, мы построили последовательность функций из М, схо- дящуюся к предельной функции Ф всюду, кроме, быть может, точек разрыва функции Ф. Так как множество таких точек не более чем счетно, то, применив снова диагональный процесс, можно из последовательности {Фп} выделить подпоследователь- ность, сходящуюся и в этих точках, т. е. всюду на [а, 6]. 6. Общий вид линейных непрерывных функционалов в про- странстве непрерывных функций. Выше мы уже указывали не- которые применения интеграла Стилтьеса. Сейчас мы рассмот- рим еще одну задачу, связанную с этим понятием, а именно, выясним общий вид линейного функционала в пространстве С [а, 6]. Теорема 4 (Ф. Рисе). Всякий линейный непрерывный функционал F в пространстве С[а,Ь] представим в виде ь F(f)=\f(x)dO>(X), (15) а где Ф — некоторая функция с ограниченным изменением1). При этом II F 11 = Ра [Ф]. ') Здесь имеется в виду интеграл по отрезку [а, 6].
370 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ. vr Доказательство. Пространство С [а, 6] можно рассмат- ривать как подпространство пространства М[а,Ь] всех ограни- ченных функций на этом отрезке, с той же нормой II f II = sup | f (х) I, что и в С [а, &]. Пусть F— непрерывный линейный функционал на С[а, &]. По теореме Хана — Банаха его можно продолжить, с сохранением нормы, с С[а, 6] на все М[а,Ь]. В частности, та- кой продолженный функционал будет определен на всех функ- циях вида ( 1 при X < т, Аа(х) = 0, йт(*) = < п (16) (0 при х > т, если т > а. Положим Ф(т) = 7Дйт) (17) и покажем, что функция Ф имеет ограниченное изменение на отрезке [а, 6]. Действительно, возьмем произвольное разбиение а = х0 < Xj < ... < хп = Ъ (18) этого отрезка и положим ak = sgn (Ф (xft) — Ф (Xfe-0) (k = 1, 2, ..., п). Тогда Е | Ф (xft) — Ф (xft_j) I = Е afe (Ф (xft) — Ф (xft_j)) = akF(hXk - hXk_t) = Я E ak(hXk - hXk_x к—1 1 n Но функция У ak (hXk — hx _]) принимает лишь значения ±1 и 0. Следовательно, ее норма разна 1. Таким образом, У |Ф(хА)-Ф(х,_1)|<||^||. 6=1 Поскольку это верно для любого разбиения отрезка [а, &], то Уа[Ф] <11 F ||. Итак, мы построили по функционалу F функцию Ф, имеющую ограниченное изменение. Покажем, что именно с помощью этой функции функционал F записывается в виде интеграла Стилтье- са (15).
-§ 6] ИНТЕГРАЛ СТИЛТЬЕСА 371 Пусть f — произвольная непрерывная функция на [a, ft]. За- дадим положительное е и выберем б>0 так, что |f(x") — — f(x') | < е при \х"— х'|<6. Выберем теперь разбиение (18) так, чтобы длина каждой из частей была меньше б, и рассмот- рим ступенчатую функцию fe: fe (х) = f (xft) при х4_,<х<хь А-=1, 2, h (a) = f(a). Ее, очевидно, можно записать в виде h (•<) = S f (xk) [hXk (x) - hXk_t (x)], k = 1 где /it— функция, определенная равенством (16). Ясно, что |f(x)— fe(x) | < е при всех х(а d х Ь), т. е. II f (*) - h WII < е. Найдем значение функционала F на элементе fe- В силу линей- ности этого функционала и определения функции hx оно равно f^F(hXk)-F(hXk_y\=t Ж)[Ф(ха)-Ф(ха-1)1, k —I fe=l т. e. представляет собой интегральную сумму для интеграла ь f (х) </Ф(х). а Поэтому при достаточно мелком разбиении отрезка [а, б] ь F(fe)~\f(x) ЙФ(х) а е. Но в то же время I F(f) - F(fe) KIIFH • ||f - М<И11' Следовательно, ь F(f)-jf(x)dO(x) a < 8(1 +IIFII), откуда в силу произвольности е получаем равенство ь F(f)=\f(x) dФ(x).
372 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА 1ГЛ. VI Мы показали, что полное изменение функции Ф, определяемой формулой (17), удовлетворяет неравенству Уа[Ф]<Ш1- (19) С другой стороны, из теоремы о среднем для интеграла Рима- на— Стилтьеса сразу следует, что И1КУа[Ф]. (20} Сравнивая (19) и (20), получаем равенство l|F|| = Va [Ф]. Теорема полностью доказана. Замечание. Ясно, что взяв произвольную функцию с огра* ниченным изменением Ф на отрезке [а, 6] и положив ь F(D = \f(x)d0(x), а мы получим линейный функционал на пространстве С [а, ft], При этом две функции, Ф1 и Ф2, совпадающие на [a, ft] всюду, за исключением не более чем счетного множества внутренних то- чек этого отрезка, определяют один и тот же линейный функцио- нал; обратно, пусть Ф] и Ф2 определяют один и тот же функцио- нал на С [a, ft], т. е. ь ь <*Ф1(х)= j fix) </Ф2(х) а а для каждой непрерывной функции f. Отсюда легко следует, что ф] — ф2 == const во всех точках непрерывности функции Ф1 — Ф2, т. е. всюду, кроме, быть может, конечного или счетно- го множества точек. Таким образом, каждому непрерывному линейному функцио- налу на С [a, ft] отвечает класс функций с ограниченным изме- нением на [a, ft], причем Ф! и Ф2 принадлежат одному классу в том и только том случае, если их разность отличается от по- стоянной не более чем в счетном числе внутренних точек отрез- ка [a, ft]. В каждом таком классе можно выбрать одну и только одну функцию, равную нулю в.точке а и непрерывную справа всюду на полуинтервале (a, ft]. Функции, удовлетворяющие этим условиям, образуют в пространстве всех функций с ограничен- ным изменением на [a,ft] замкнутое линейное подпространство, которое мы обозначим Vc[o, ft]. Заметим, наконец, что для лю- бого функционала F на С[а,Ь] соответствующая функция Ф(т), определяемая равенством (17), есть функция именно из V°[a, ft].
ИНТЕГРАЛ СТИЛТЬЕСА 373 § 61 Так как для таких Ф(т) было установлено равенство ||Г|| = = Уа[Ф], то теореме 4 можно придать следующий вид. Теорема 4х. Существует изоморфное (т. е. взаимно одно- значное, линейное и изометричное) соответствие между про- странствами (С[а, Ь])* и V°[a, 6], устанавливаемое равенством ъ F(f)= ^(х)</Ф(х). а Такое представление линейного функционала с помощью функции из У°[а, 6] мы будем называть каноническим. Из этой теоремы легко получить следующую теорему о ка- ноническом представлении линейного функционала на простран- стве С1 [а, Ь] непрерывных и непрерывно дифференцируемых функций, играющую существенную роль в вариационных задачах. Теорема 5. Всякий линейный функционал в пространстве С1 [а, 6] можно представить одним и только одним способом в виде ь F(f) = af(a)+\f'(X)d(I>(X), (21) а где а — число и Ф е V0 [а, 6]. Доказательство. Рассмотрим в С [а, 6] подпространство С1 [а, 6] функций, удовлетворяющих условию /(£г) =0, и опера- тор А — d/dX, переводящий это подпространство во все про- странство С [а, 6]. Пусть F — линейный функционал на С1 [а, &]. Рассмотрим его сначала только на подпространстве С1 [а, 6]. Те- перь к оператору А: С1 [а, 6]->С[а, 6] и функционалу F: С?[а,6]-> —> R можно применить лемму о тройке (гл. IV, § 5, п. 4). В силу этой леммы найдется такое линейное отображение: ф: С [a, b] —> R, что для каждой функции ge С1 [а, 6] Ж = Ф(М (22) Каждая функция feCfa, 6] может быть представлена в виде f(X) = f(a) + g(X), geCl[a,b], Поэтому F(f) = F (f(a)) + F(g). (?3)
374 НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА [ГЛ VI В силу теоремы Рисса, равенства (22) и определения операто- ра А имеем: ь F (g) = Ф (-4g) = ё' W аФ W- а ИЛИ b /=(§)= Jf'W^(x), (24) а поскольку f'(x)=g'(x). Пусть а—-значение функционала F на функции, тождественно равной единице. Тогда из (23) и (24) окончательно получаем представление (21).
ГЛАВА VII ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ Один из важнейших классов нормированных пространств со- ставляют пространства суммируемых функций, в первую оче- редь пространство всех суммируемых функций А1 и простран- ство L2 функций с суммируемым квадратом. Сейчас мы рассмот- рим основные свойства этих пространств. Содержание этой главы опирается, с одной стороны, на общие свойства метриче- ских и линейных нормированных пространств, изложенные в гл. II—IV, а с другой, — на введенное в гл. V понятие интеграла Лебега. § 1. Пространство L} 1. Определение и основные свойства пространства Пусть X— некоторое пространство с мерой ц; при этом мера са- мого X может быть конечной или бесконечной. Будем считать меру ц полной (т. е. любое подмножество любого множества меры нуль измеримо). Рассмотрим совокупность'всех функций f, суммируемых на X. Поскольку линейная комбинация суммируе- мых функций суммируема, эта совокупность, с обычными опе- рациями сложения функций и умножения их на числа, обра- зует линейное пространство. Это пространство мы обозначим L^X, р.) или, короче, просто Lx. Введем в Lx норму, положив1) Ilf 11 = $lf(*W. (1) Ясно, что при этом II afll = l а| • II fll и II fl + М<11 fl ll + ll f2ll- Однако для того чтобы выполнялось и последнее ’-во нор- мы, а именно, II f II > 0, если f =£ О, ’) Здесь и дальше символ j будет означать интегрирование по всему пространству X.
376 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЯ [ГЛ. VII нужно считать, что функции, эквивалентные друг другу на X, не различаются, а считаются за один и тот же элемент простран- ства L\. В частности, нулевой элемент в Lx— это совокупность всех функций, равных нулю почти всюду. При этом выражение (1) будет обладать всеми свойствами нормы. Итак, мы прихо- дим к следующему определению. Определение 1. Пространством Lx называется нормиро- ванное пространство, элементами которого служат классы экви- валентных между собой суммируемых функций; сложение эле- ментов в L] и умножение их на числа определяются как обычное сложение и умножение функций1), а норма задается формулой || f || = J | f (х) | dp. В Li, как и во всяком нормированном пространстве, с помощью формулы p(f, £) = llf — ЯII вводится расстояние. Сходимость последовательности суммируе- мых функций в смысле этого расстояния называют сходимостью в среднем. Пространство Lx можно считать состоящим из комп- лексных функций (комплексное Lx) или из одних только дей- ствительных (действительное Lx). Содержание данного пара- графа относится к обоим этим случаям. Весьма важен для многих вопросов анализа следующий факт. Теорема 1. Пространство Lx полно. Доказательство. Пусть {Д}— фундаментальная после- довательность в Lx, т. е. II fn — fm II 0 при П, Щ->0О. Тогда можно найти такую возрастающую последовательность индексов {щ}, что Из этого неравенства и теоремы Б. Леви вытекает, что ряд 1М + 1^-М+ ••• сходится почти всюду на X. Но тогда и ряд + ••• ') Точнее: каждый элемент в Lx— это класс эквивалентных между собой суммируемых функций; чтобы сложить два таких класса, надо взять в них по представителю и объявить суммой класс, содержащий сумму выбранных пред- ставителей. Ясно, что результат не зависит от произвола в выборе представи- телей. Аналогично — и для умножения элемента из Lx на число.
5 1] ПРОСТРАНСТВО Lt 37Т сходится почти всюду на X к некоторой функции f (х) = lim f (х). &-> оо Й Таким образом, фундаментальная последовательность в Lx содержит подпоследовательность, сходящуюся почти всюду. Покажем теперь, что подпоследовательность сходится к той же функции f и в среднем. В силу фундаментальности по- следовательности {/п}, при любом фиксированном е > 0 для всех достаточно больших k и I имеем Согласно теореме Фату в этом неравенстве можно перейти к пределу под знаком интеграла при /->оо. Получаем 5 I fnk W — f W Мм < е, откуда следует, что f Lx и что/П)!,->А Но из того, что фунда- ментальная последовательность содержит подпоследователь- ность, сходящуюся к некоторому пределу, следует, что и сама она сходится к тому же пределу. Теорема доказана. 2. Всюду плотные множества в Lx. Для всякой функции f, суммируемой на X, и любого е > 0 существует такая простая суммируемая функция <р(х), что I f W — Ф (х) | dp < е. Далее, поскольку для простой суммируемой функции, прини- мающей значения ух, у2, ... на множествах Ех, Ё2, ..., интеграл определяется как сумма ряда оо £ Уп№ (^л) л=1 '(при условии его абсолютной сходимости), ясно, что всякую простую суммируемую функцию можно представить как предел ’(в среднем) последовательности простых функций, принимаю- щих лишь конечное число значений. Итак, в пространстве Lx всюду плотны функции, каждая из которых принимает лишь ко- нечное число значений (т. е. представляет собой конечную ли- нейную комбинацию индикаторов). Пусть R— метрическое пространство с введенной в нем ме- рой, удовлетворяющей такому условию (выполненному для меры Лебега в евклидовом пространстве и во многих других практи- чески интересных случаях): все открытые и все замкнутые мно- жества в R измеримы, и для любого измеримого множества
378 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ [ГЛ. VII Л1 cz и любого е > 0 найдется1) такое открытое G тэ М, что p(G \ М) < е. (2) Тогда верна следующая теорема: Теорема 2. Множество всех непрерывных функций всюду плотно в Li(H, р). Доказательство. В силу сказанного выше достаточно доказать, что всякая простая функция, принимающая конечное число значений, является пределом, в смысле сходимости в среднем, последовательности непрерывных функций. Далее, так как всякая суммируемая простая функция, принимающая конеч- ное число значений, есть линейная комбинация индикаторов Хм (х) измеримых множеств конечной меры, то достаточно про- вести доказательство для этих последних. Пусть М — измеримое множество в метрическом пространстве /? и р(Л4)<оо. Тогда из условия (2) сразу следует, что для любого б > 0 найдутся замкнутое множество FM и открытое множество GM такие, что FMcc/WccGM и p (GM) p (FM) < е. Определим теперь функцию фе(х), положив 2) , ч р(х- /?Х(3м) Фе(Х) + ’ Эта функция равна 0 при xg/?\Gm и равна 1 при х е FM'. Она непрерывна, так как каждая из функций р(х, FM) и р(х, /? \ Gm) непрерывна и их сумма нигде не обращается в 0. Функция —фе] не превосходит 1 на GM \FM и равна 0 вне этого множества. Следовательно, JlXwW — <pe(x)|dp.<8, откуда и вытекает утверждение теоремы. Ясно, что пространство L\ (X, р) зависит и от выбора про- странства X, и от выбора меры р в нем. Например, если мера р сосредоточена в конечном числе точек, то АДХ, р) будет просто конечномерным пространством. В анализе основную роль играют пространства L\ бесконечной размерности, но содержащие счет- ное всюду плотное подмножество. Для того чтобы охарактери- зовать такие пространства Ly, введем еще одно понятие, относя- щееся, собственно, к общей теории меры. Определение 2. Мера р называется мерой со счетным базисом, если существует такая счетная система s/ — {An} >) Ср. упражнение на стр. 291. г) р(х, А) означает расстояние от точки х до множества А.
S ч ПРОСТРАНСТВО L, 379 (н = 1,2, ...) измеримых подмножеств пространства X ('чет- ный базис меры р), что для всякого измеримого М с. X и вся- кого е > 0 найдется такое Ak е st, что р (.'И А Л4) < е. В частности, мера р имеет счетный базис, если ее можно представить как лебегово продолжение меры т, определенной на некотором счетном полукольце S. В самом деле, в этом слу- чае кольцо 9t(S) (очевидно, счетное) и представляет собой искомый базис. Отсюда видно, например, что счетный базис имеет мера Лебега на отрезке, поскольку для нее за исходное полукольцо можно принять совокупность полуинтервалов с ра- циональными концами. Произведение р = pi ® рг двух мер со счетными базисами также обладает счетным базисом, ибо конечные суммы произве- дений элементов из базиса меры pi на элементы из базиса меры Р2 образуют, как легко проверить, базис меры р = pi ® Р2- По- этому мера Лебега на плоскости (а также и в n-мерном про- странстве) имеет счетный базис. Пусть лг, л;,..., л*,... (3) есть счетный базис меры р. Легко видеть, что, расширяя систе- му множеств (3), можно образовать новый счетный базис этой меры Ль Л2, ..., Ап, ..., (4) замкнутый по отношению к операциям вычитания и взятия ко- нечных сумм и пересечений, т. е. являющийся кольцом. Теорема 3. Если мера р имеет счетный базис, то в Ц (X, р) существует счетное всюду плотное множество функций. Доказательство. Покажем, что счетное всюду плотное множество в Lx(X, р) образуют конечные суммы п Е Ckfk(х), (5) /?=1 где Ck — рациональные числа, а Д — индикаторы элементов счет- ного базиса меры р. Счетность такого множества очевидна; покажем, что оно всюду плотно в Lt(X, р). Как мы уже показали, множество сту- пенчатых функций, принимающих лишь конечное число значе- ний, всюду плотно в Lx. Так как любую такую функцию можно сколь угодно точно аппроксимировать функцией того же вида, но принимающей лишь рациональные значения, достаточно по- казать, что любую ступенчатую функцию f, принимающую зна- чения У\, У2, •••. Уп (все yt рациональны)
380 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ ГГЛ. VII на множествах ЕьЕ2,...,Еп ( J Et = X, E^Ef^ 0 при i #=/), \t=I / можно сколь угодно точно аппроксимировать в смысле метрики Li функциями вида (5). Согласно сделанному замечанию можно без ограничения общности предполагать, что базис меры ц яв- ляется кольцом. По определению счетного базиса меры ц, при любом е > О в нем существуют такие множества А2, . .. , Ап, что I* (Ек А Ак) < е. Положим А'к = Ак\ U (k = l, 2, п) i<k и определим f*, положив ' Уь при x^A'k, 0 при J A'i. i=l Легко видеть, что при достаточно малом е мера (х) #= Г(х)} сколь угодно мала и, следовательно, интеграл 5 I f W — Г W Idy < (2 max | ук |)ц{х: f (х) #= /*(х)} сколь угодно мал при достаточно малом е. В силу сделанных нами предположений относительно базиса меры ц, функция f* есть функция вида (5). Теорема доказана. Для того частного случая, когда X есть отрезок числовой прямой, а ц— мера Лебега, счетное всюду плотное множество в Z-i можно получить и проще, например, взяв множество всех многочленов с рациональными коэффициентами. Оно всюду плотно (даже в смысле равномерной сходимости) в множестве непрерывных функций, а эти последние образуют всюду плотное множество в Li(X, ц). § 2. Пространство L2 1. Определение и основные свойства. Пространство Li пред- ставляет собой, как мы видели, полное нормированное (т. е. ба- нахово) линейное пространство. Однако оно не является евкли- довым: определенную в нем норму нельзя задать с помощью
ПРОСТРАНСТВО Lt 381 § 2) какого-либо скалярного произведения. Это вытекает из «теоре- мы о параллелограмме», установленной в п. 8 § 4 гл. III. На- пример, для интегрируемых на отрезке [0,2л] функций g = sin х соотношение Ilf+ glF + llf-glF = 2(||f|p + ||g|p) в L\ не выполняется. Функциональное пространство, не только нормированное, но и евклидово, можно построить, взяв совокупность функций с ин- тегрируемым квадратом. Введем соответствующие определения. Будем сперва рассматривать действительные функции f, опре- деленные на некотором пространстве X, с заданной на нем ме- рой ц. Все функции предполагаются измеримыми и определен- ными на X почти всюду. Эквивалентные между собой функции не различаются. Определение 1. Функция f называется функцией с инте- грируемым квадратом на X, если интеграл 5 f2W di* существует (конечен). Совокупность всех таких функций мы обозначим L2(X, ц) или, короче, Лг- ' Установим основные свойства функций с интегрируемым квадратом. 1. Произведение двух функций с интегрируемым квадратом есть интегрируемая функция. Это непосредственно вытекает из неравенства 1 f (х) g (х) |<у [f2 (х) + g2 (х)] и свойств интеграла Лебега. Следствие. Всякая функция f с интегрируемым квадратом на пространстве с конечной мерой интегрируема. В самом деле, достаточно, положив g[x) = 1, воспользовать- ся свойством 1. 2. Сумма двух функций из Ь2 также принадлежит Ь2. Действительно, (f (х) + g (X))2 < f2 (х) + 21 f (x) g (x) | + g2 (x); в силу свойства 1 каждая из трех функций, стоящих справа, ин- тегрируема. 3. Если f е Ь2 и а — произвольное число, то af е Ь2. Действительно, если f е Ь2, то $ [af (х)]2 dp = а2 f2 (х) dp < оо.
382 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ [ГЛ. VII Свойства 2 и 3 означают, что линейные комбинации функций из Ь2 снова принадлежат Ь2-, при этом, очевидно, сложение функ- ций из L2 и умножение их на числа удовлетворяют всем усло- виям, перечисленным в определении линейного пространства (гл. Ill, § 1). Таким образом, совокупность Ь2 функций с инте- грируемым квадратом есть линейное пространство. Определим теперь в Ь2 скалярное произведение, положив (Л g) = (xjg(x)dp. Ясно, что все требования, входящие в определение скаляр- ного произведения (см. § 4, гл. III), а именно: 1) = 2) (fi+f2,g) = (h,g)+(f2,g), 3) (af,g) = a(f,g), 4) (f, f) > 0, если f =/= 0, при этом выполнены. В частности, выполнение условия 4) обес- печивается тем, что мы условились не различать эквивалентные между собой функции (за нулевой элемент, таким образом, при- нимается совокупность всех функций на X, эквивалентных ^0). Итак, введя для функций с интегрируемым квадратом опера- ции сложения и умножения на число, а также скалярное произ- ведение, мы приходим к следующему окончательному опреде- лению. Определение 2. Евклидовым пространством Ь2 называет- ся линейное пространство, состоящее из классов эквивалентных между собой функций с интегрируемым квадратом, в котором скалярное произведение определено формулой [f, g)=\f(x)g(x)dp. В Ь2, как и во всяком евклидовом пространстве, выполнены неравенство Коши — Буняковского и неравенство треугольника, которые в данном случае имеют вид ( Ж) g (х) < j f2 (х) др j g2 (х) dp и д/ $ (Ж) + £ (х))2^ц < у/ р2 (х) dp + д/ J g2 (х) dp . В частности, при ц(Х)<оо и g(x)=l неравенство Коши — Буняковского превращается в следующую полезную оценку: (Jf(x)dH)2<H(X) \f4*)dp. (1)
ПРОСТРАНСТВО L, 383 $ 2] Норма в L2 определяется формулой и/11=70 = а расстояние между элементами f и g— формулой Р (Л g) = II f — ё II = (/ W — S W)2 • Величину 5 (fW - g(x))2dp =|| f - g||2 называют также средним квадратичным уклонением функций f и g друг от друга. Сходимость функциональной последовательности в смысле метрики пространства Ь2 называется сходимостью в среднем квадратичном. Если нет опасности спутать эту сходимость со сходимостью в Ль определенной в предыдущем параграфе, мы и здесь будем пользоваться более коротким термином «сходи- мость в среднем». Теорема 1. Пространство L2(X, ц) при ц(Х)<оо полно. Доказательство. Пусть {/п} — фундаментальная после- довательность в L2, т. е. II fn — fm II -* 0 при П.Щ-+ОО, Тогда в силу оценки (1) получаем J I fn W - fm W I dp < [Ц (X)]'4 { j (fn (x) - f m (x))2 dp }" < < 8 [H (X)]'\ (2) т. e. последовательность {/n} фундаментальна и в метрике про- странства Li. Повторяя рассуждения, которые были проведены при доказательстве полноты пространства Lly выберем из {/п} подпоследовательность сходящуюся почти всюду к неко- торой функции f. В неравенстве W)2^<e, справедливом для членов этой подпоследовательности при всех достаточно больших k и I, можно, используя теорему Фату, пе- рейти к пределу при I оо. Получим $(/„* W-f(x))2(/H<e, откуда следует, что f е Ь2 и чтоДля завершения доказа- тельства остается, как и в теореме 1 § 1, воспользоваться тем,
384 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ [ГЛ. VII что, если фундаментальная последовательность содержит схо- дящуюся, то и сама она сходится к тому же пределу. 2. Случай бесконечной меры. Мы рассматривали только что функции с интегрируемым квадратом, определенные на некото- ром пространстве X конечной меры. При этом условие |i(X)<oo использовалось довольно существенно. Именно, сна- чала мы прибегли к нему, доказывая, что всякая функция с суммируемым квадратом суммируема и в первой степени, а за- тем— при выводе неравенства (2), на которое опиралось дока- зательство полноты пространства L2. Если рассматривать функ- ции на множестве бесконечной меры (например, на всей прямой с лебеговой мерой на ней), то не всякая функция из L2 будет содержаться в Lx. Например, функция - не интегрируема -у 1 + х2 на всей прямой, а ее квадрат интегрируем. Далее, в случае |i(X)<oo имеет место неравенство (1), означающее, что из сходимости последовательности функций в L2 следует их сходи- мость в При |i(X)— оо это тоже неверно: например, после- довательность функций на прямой ( \/п при I X ]^п, <PnW | Q ПрИ |х|>.л сходится к 0 в пространстве L2(—оо, оо) функций с суммируе- мым квадратом на прямой, но не сходится ни к какому пределу в АД—оо, оо). Однако теорема о полноте пространства L2 остается справедливой и при р(Х) = оо *). Докажем это утверждение. Как и в п. 6 § 5 гл. V, где мы ввели понятие интеграла по множеству бесконечной меры, будем предполагать, что все пространство X можно представить как счетную сумму множеств конечной меры. Пусть Х = U Хп, g(xn)<oo, Хп(]Хт=0 при п =/= т п=1 — такое представление и пусть {Д}— фундаментальная после- довательность в L2(X, |i). Таким образом, для каждого е>0 существует такое Л/, что [Д W -’ fi (х)12 dp < е для всех k, l^N. Введем обозначение <р(х) при хеД, О при остальных х. ') Доказательство полноты пространства Z-i, проведенное в § 1, не зави- сит, очевидно, от предположения конечности меры пространства X. <р(п) (х) =
5 21 ПРОСТРАНСТВО is 385 Тогда в силу свойства о-аддитивности интеграла Лебега, имеем оо J [ffc (*) - ft (х)]2 dH = £ $ №n) (*) - f?> to]2 < e. n=l Xn Для каждого конечного M и подавно м Е $[^)W-f<n>(x)]2dH<8. (3) П=1 хп Совокупность функций с интегрируемым квадратом на каждом Хп представляет собой полное пространство. Положив fW (х) = lim f jn) (х) I -> оо (где сходимость понимается как сходимость в пространстве Z2(Xn, |i)), мы можем перейти к пределу при /->оо в неравен- стве (3). Получаем м £ J [fkn)W-f(n)(x)]24i<e. П=1 хп Так как это неравенство выполнено для всех Af, то в нем можно перейти к пределу при Af->oo. Таким образом, имеем со Z $[nn)W-f(n)W]2^<e. п=1 хп Положив fto = f(n)to при Х(=хп, мы можем последнее неравенство переписать в виде $ [fn W— f (x)]2dp<e. Отсюда вытекает как принадлежность f к L2(X, pi), так и схо- димость последовательности {/„} к f. Упражнение. Определим Lp(X,p) как совокупность классов эквива- лентных между собой функций, для которых | / (х) dpi < со, где 1 р < < оо. Доказать, что LP(X, ц) является банаховым пространством относитель- но нормы II / II = ( j I f (X) \Р du) /Р. 3. Всюду плотные множества в L2. Теорема об изоморфизме. Итак, пространство L2(X, ц) функций с интегрируемым квадра- том есть полное евклидово пространство. За исключением вы- рожденных случаев, размерность этого пространства бесконечна.
386 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ [ГЛ. VII С точки зрения различных применений в анализе важно выяс- нить, когда пространство L2(X, ц) сепарабельно, т. е. содержит счетное всюду плотное множество. В § 1 мы установили, что для пространства Ь^(Х, ц) сепарабельность вытекает из существова- ния у меры ц счетного базиса. Нетрудно убедиться, что это ус- ловие гарантирует и сепарабельность Ь2(Х, ц). Действительно, каждую функцию из Ь2(Х, ц) можно приблизить, с любой точ- ностью, функциями, каждая из которых равна 0 вне некоторого множества конечной меры1). Далее, те же рассуждения, кото- рые были проведены при доказательстве теоремы 3 § 1, показы- вают, что в совокупности таких функций можно выбрать счет- ное всюду плотное множество. Итак, если мера ц имеет счетный базис, то пространство L2(X, ц) есть полное сепарабельное евклидово пространство. Иначе говоря, оставляя в стороне тот случай, когда L2(X, ц) имеет конечную размерность, мы получаем следующий резуль- тат: если мера ц имеет счетный базис, то Ь2(Х, ц) есть сепара- бельное гильбертово пространство. В силу теоремы об изоморфизме гильбертовых пространств, это означает, что все такие Ь2(Х, ц) изоморфны между собой. В частности, каждое такое Ь2(Х, ц) изоморфно пространству 12 числовых последовательностей со сходящейся суммой квадратов. Последнее можно рассматривать как L2(X, ц), когда X счетно, а ц определена на всех его подмножествах и равна 1 для ка- ждой точки. Ниже мы будем рассматривать только Ь2(Х,р), отвечающие мерам со счетным базисом. В случаях, когда это не может вызвать недоразумений, каждое такое пространство мы будем обозначать просто Ь2. Поскольку пространство L2 представляет собой, как мы вы- яснили, реализацию гильбертова пространства, на Ь2 можно пе- ренести все те понятия и факты, которые были установлены в § 4 гл. III для абстрактного гильбертова пространства. В частности, согласно теореме Рисса всякий линейный функ- ционал в гильбертовом пространстве Н записывается в виде скалярного произведения F (Л) = (Л, а), где а — фиксированный вектор из Н. Поэтому всякий линейный функционал в L2 имеет вид где g — фиксированная функция с интегрируемым квадратом на X. >) Если ц(Х)< оо, то этот шаг отпадает.
§ 2] ПРОСТРАНСТВО L, 387 4. Комплексное пространство L2. Мы рассматривали сейчас действительное пространство Ь2. Изложенные результаты легко переносятся на комплексный случай. Комплексная функция f, определенная на некотором пространстве X с заданной на нем мерой ц, называется функцией с интегрируемым квадратом, если интеграл ^|f (x)|2d|x х конечен. Определив сложение таких функций и умножение их на числа обычным образом и введя скалярное произведение по формуле (f> g) = \f W g(x)dn, x мы получим евклидово пространство, называемое комплекс- ным пространством Ь2. (При этом, как и в действительном слу- чае, мы считаем эквивалентные между собой функции одним и тем же элементом пространства.) Это пространство полно, а если мера ц имеет счетный базис, то и сепарабельно. Таким об- разом (отбрасывая конечномерный случай), мы получаем, что комплексное пространство Ь2, отвечающее мере со счетным ба- зисом, есть комплексное сепарабельное гильбертово простран- ство. Все такие пространства изоморфны между собой, и для них справедливы результаты, изложенные в § 4 гл. III. 5. Сходимость в среднем квадратичном и ее связь с другими типами сходимости функциональных последовательностей. Вве- дя в пространстве Ь2 норму, мы определили тем самым для функций с интегрируемым квадратом следующее понятие сходи- мости: если lim Ufn(x) — f (x)]2dp = 0. rt->oo J Мы назвали такую сходимость сходимостью в среднем квадра- тичном. Посмотрим, как такая сходимость связана с другими типами сходимости функциональных последовательностей. Предположим сначала, что мера пространства-«носителя» X ко- нечна. 1. Если последовательность {fn} функций из Ь2(Х, ц) сходит- ся в метрике Ь2(Х, ц), то она сходится и в метрике L^X, ц).
388 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ (ГЛ VIT Действительно,в силу неравенства (2) имеем $ I f«(x) — f (х) |d|x < [|Х (X) $ (fn (х) - f (х))2 dj'2, откуда и следует наше утверждение. 2. Если последовательность {/п} сходится равномерно, то она сходится и в среднем квадратичном. Действительно, при каждом е > 0 при всех достаточно боль- ших п имеем I f п (х) — f (х) | < е и, следовательно, J[Mx)-f(x)№<8W). откуда вытекает наше утверждение. 3. Если последовательность суммируемых функций {/п} схо- дится в среднем, то она сходится на X и по мере. Это утверждение сразу же следует из неравенства Чебышева (стр. 300). Отсюда и из теоремы 8 § 4 гл. V вытекает: 4. Если последовательность {/п} сходится в среднем, то из нее можно выбрать подпоследовательность }, сходящуюся почти всюду. Заметим, что при доказательстве теоремы о полноте про- странства Lx мы уже установили этот факт, не опираясь на тео- рему 8 § 4 гл. V. Нетрудно убедиться в том, что из сходимости некоторой по- следовательности в среднем (и даже в среднем квадратичном) не вытекает, вообще говоря, ее сходимость почти всюду. Дей- ствительно, последовательность {/п}, построенная в п. 6 § 4 гл.У, сходится к f = 0 в среднем (и даже в среднем квадратичном), но при этом, как мы видели, она не сходится к 0 ни в одной точке. Обратно, последовательность {/п} может сходиться почти всюду (и даже всюду) и не сходиться при этом в среднем. Рас- смотрим, например, на отрезке [0,1] последовательность функ- ций ( п при х <= (0, 1/п], f (х) = s (0 при остальных х. Очевидно, fn(x)->0 при всех хе[0, 1]. Но в то же время 1 I fn (х) | dx = 1 при всех п.
§ 3] ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L, 389 Связь между различными типами сходимости в случае ц (X) <_ < оо можно изобразить следующей схемой: где пунктирная стрелка означает возможность выбора из после- довательности, сходящейся по мере, подпоследовательности, сходящейся почти всюду. В случае ц(А')= оо (например, для функций на всей число- вой прямой с мерой Лебега на ней) установленные выше связи уже не имеют места. Например, последовательность М*) = { 1/Vn о при при | X п, | X | > п . сходится равномерно на всей прямой к функции f= 0, однако она не сходится ни в среднем, ни в среднем квадратичном. Да- лее, при ц(Х)= оо, как мы уже указывали, сходимость в сред- нем квадратичном (т. е. в Ь2) не влечет за собой сходимости той же последовательности в среднем (т. е. в Ц). Заметим в заключение, что из сходимости в среднем ни при р(Х)<; оо, ни тем более при ц(Х) = оо не следует, вообще го- воря, сходимость в среднем квадратичном. § 3. Ортогональные системы функций в L2. Ряды по ортогональным системам Общие теоремы, установленные в § 4 гл. III для евклидовых пространств, говорят нам, что в L2 имеются полные ортогональ- ные (в частности, ортогональные и нормированные) системы функций. Такие системы можно получить, например, применяя процесс ортогонализации, описанный там же, к той или иной полной системе. Если в Ь2 выбрана некоторая полная ортого- нальная система {<рп}, то, опять-таки в соответствии с общими
390 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ [ГЛ. VH результатами § 4 гл. III, каждый элемент можно пред- ставить как сумму ряда оо f = Е с„<р„ п=1 — ряда Фурье функции f по ортогональной системе {<рп}. При этом коэффициенты сп — коэффициенты Фурье функции f по си- стеме <рп — определяются формулами С" = f фп 0 фп ||2 = $ ф« W d(X) • В этом параграфе мы рассмотрим важнейшие примеры ортого- нальных систем в пространствах L2 и отвечающие им разло- жения. 1. Тригонометрическая система. Тригонометрический ряд Фурье. Рассмотрим пространство L2 [—л, л] функций с интегри- руемым квадратом на отрезке [—л, л] с обычной мерой Лебега на этом отрезке. В этом пространстве функции 1, cosnx, sinnx (n=l,2, ...) (1) образуют полную ортогональную систему, называемую тригоно- метрической. Ортогональность легко проверяется прямым вы- числением, например, при п=/= m я я S, 1 I Г п + m . п — ml, „ cos пх cos tnx ах = у \ I cos —— х + cos —-— xj dx — 0 — я —я и т. д. Полнота системы (1) следует из теоремы Вейерштрасса об аппроксимации любой непрерывной периодической функции тригонометрическими многочленами1). Система (1) не нормиро- вана. Соответствующая нормированная система состоит из функций 1 cos пх sin пх . . о х -7=-. ----7=~, —7=^ (п=1,2, ...). У2л -ул -ул Пусть /— функция из L2[—л, л]; ее коэффициенты Фурье, отве- чающие функциям 1, cos пх, sinnx, принято обозначать йо/2, ап и Ъп. Такрм образом, в соответствии с общими формулами для ’) В § 2 гл. VIII мы докажем теорему Фейера, представляющую собой усиление теоремы Вейерштрасса. Тем самым будет дано и доказательство полноты тригонометрической системы (не опирающееся, конечно, на излагае- мые здесь факты).
§ 3] ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИЙ в ь 391 коэффициентов Фурье, имеем Я я = \fMdx, т. е. а0 = ^ \f(x)dx Z /л J J —я -я И я я ап=у- j f (х) cos пх dx, bn — -^- f (х) sin пх dx. — Я —я Соответствующий ряд Фурье имеет вид оо + У' ап cos пх + bn sin пх п=1 и для любой функции f е L2 сходится в среднем квадратичном именно к ней. Если п Sn W = -у + X «А cos kx + bk sin kx fe=l — частичная сумма ряда Фурье, то среднее квадратичное укло- нение Sn от f можно найти по формуле / 2 п \ Ilf (х) - s„(x)|p = ||/||2 — +&И. А=1 ' Среди всех тригонометрических многочленов п тп (х) = -у- + У ak cos kx + Р* sin kx fe=i с данным n частичная сумма ряда Фурье Sn дает наилучшую (в метрике Ь2) аппроксимацию функции f. Неравенство Бесселя для тригонометрической системы имеет вид 9 оо Я T- + £an + *2B<^ \f2(x)dx, п—1 — Я но поскольку тригонометрическая система полна, на самом деле для любой функции из L2 имеет место равенство Парсеваля 2 2 п=1 -л
392 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ [ГЛ. VII Для любой функции f е L2 квадраты ее коэффициентов Фурье образуют сходящийся ряд. Обратно, если числа ао, ап, Ьп (п = оо = 1,2,...) таковы, что ряд У, а2п Ь2п сходится, то ряд оо •у- + ап cos пх + bn sin пх тоже сходится (в L2), а его сумма представляет собой функцию, имеющую ао, ап, Ьп своими коэффициентами Фурье. Все эти утверждения (непосредственно вытекающие из об- щих результатов § 4 гл. III) легко переносятся на функции, за- данные на отрезке произвольной длины, скажем [—I, /]. Если f— функция с суммируемым квадратом на [—I, Z], то замена x—ntjl, т. е. t = lx/п, переводит f(t) в функцию f*(x) = f (•^)на отрезке [—я, л]. В соответствии с этим i ап=у ^f(t)cos^dt, n = 0, 1, ... -i и I 6„ = -j- j f (Z)sin dt, n=l,2, ... -i Ряд Фурье для функции f, заданной на отрезке длины 21, имеет вид оо аа . V* nnt । l • -у- + 2_jancos— + bn sin—. rt=l Замечания. 1. Тригонометрические ряды были использо- ваны французским математиком Ж. Фурье в его работах по ма- тематической физике, в первую очередь по теории распростра- нения тепла. Впрочем, формулы для коэффициентов ап и Ьп встречаются уже у Эйлера. В дальнейшем теория тригонометри- ческих рядов развивалась в работах Римана, Дирихле и др. Пер- воначально термины «ряд Фурье», «коэффициенты Фурье» и т. д. связывались именно с тригонометрической системой и лишь значительно позднее стали употребляться в общем смысле, описанном в § 4 гл. III (т. е. применительно к произволь- ной ортогональной системе в любом евклидовом простран- стве).
§ 31 ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L, 393 2. Из полноты тригонометрической системы и общих теорем § 4 гл. III следует, что для любой f е L2 ее ряд Фурье оо -у- + ап cos пх + bn sin пх п=1 сходится к данной функции f в среднем. Однако с точки зрения конкретных задач анализа важно установить условия, при кото- рых этот ряд сходится к f в другом смысле, скажем, в каждой точке, или равномерно. Этот круг вопросов мы рассмотрим в следующей главе. 2. Тригонометрические системы на отрезке [0, л]. Функции 1, cosx, cos 2х, ... (2) и sinx, sin 2х, ... (3) образуют в совокупности полную ортогональную систему на отрезке [—л, л]. Покажем, что каждая из двух систем (2) и (3) ортогональна и полна на отрезке [0, л]. Ортогональность прове- ряется прямым подсчетом. Докажем полноту системы (2). Пусть f — функция с интегрируемым квадратом на [0, л]. До- определим ее на полуинтервале [—л, 0) формулой f(-x) = f(x) и разложим ее в ряд Фурье по системе 1, cosnx, sinnx (n=l, 2, ...). Поскольку функция f, определенная теперь на [—л, л], — четная, все коэффициенты при синусах равны у нее нулю. Это сразу видно из формулы для коэффициентов: для четной функции f при п I л 0 л f (х) sin пх dx — f (х) sin пх dx + f (х) sin пх dx — -л -л о л л = — f (х) sin пх dx + f (х) sinnx dx = 0. о о Иначе говоря, эту функцию на [—л, л] (а тем более и на [0, л]) можно аппроксимировать в среднем квадратичном с любой точ- ностью линейными комбинациями элементов системы (2). От- сюда следует полнота системы (2). Полнота системы (3) на (0, л] доказывается аналогично, путем нечетного продолжения функции f, заданной на [0, л], на полуинтервал [—л, 0) по фор- муле f( — х) = — f (х).
394 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ [ГЛ. VII Полученная при таком продолжении функция на [—л, л] нечетна и разлагается на этом отрезке по одним синусам. 3. Ряд Фурье в комплексной форме. Тригонометрический ряд можно записать компактно, если воспользоваться форму- лами Эйлера Plnx , -inx inx __ -inx cos пх - -—V------ и si п пх = ---. Внося эти выражения в ряд Фурье, получим -у- + У* ап cos пх + bn sin пх = п=1 п=1 =-г+Е ib"einx+Е °" ibn e~inx = Е с«е'пх> n=l n=l n=-OC где c0 — a0/2 и при n 1 a„ — ibn cn— 2 _ _ an + ibn ^—n — 2 ' > Выражение y Ce‘" n= — co (4) называется тригонометрическим рядом Фурье в комплексной форме. Коэффициенты сп этого ряда выражаются через ап и Ьп с помощью равенств (4); однако легко написать для них и пря- мые формулы. Действительно, как показывает непосредственное вычисление, л г , , | 0 при n=/=m, \einxe~lmx dx = \ ( 2л при п = пг. Поэтому, умножая равенство fW= X спе1пх (5> л=—оо на e~imx (m — 0, ±1, ±2, ...) и интегрируя, получаем Л f (x)e~imlcdx = 2ncm, -Л
•§ 31 ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИЙ В L, 395 т. е. я = \f(x)e~lmxdx (m = 0, ±1, ±2, ...). (6) — Я Разложение (5) остается в силе и для комплексных функций с интегрируемым квадратом на отрезке [—л, л]. Иначе говоря, функции einx образуют базис в пространстве L2[—л, л] комплекс- ных функций с интегрируемым квадратом модуля на отрезке ]—л, л]. При этом выражения (6) представляют собой скаляр- ные произведения f на eimx в этом комплексном пространстве. . пл X — X Заменив функции е‘пХ на е 1 , можно перенести все ска- занное на пространство Аг[—А /] комплексных функций на отрез- ке произвольной длины 21. 4. Многочлены Лежандра. Линейные комбинации функций 1, х, х2, ... (7) — это совокупность всех многочленов. Следовательно, система (7) полна в пространстве L2 функций на произвольном отрез- ке1). Ортогонализируя систему (7) на отрезке [—1,1] по отно- шению к скалярному произведению 1 (f, g)= f (x)g(x)dx, -I мы получим полную ортогональную систему QoW, QiW, Q2(x)..... где Qn — многочлен л-й степени. Покажем, что каждый из мно- гочленов Qn(x) совпадает, с точностью до постоянного множи- теля, с многочленом /?nW = ^r(x2-Dn. В самом деле, во-первых, система {/?„} ортогональна. Пусть п т. Так как ^(«-1)4-.,-^-!)!„, -о ') Полнота системы многочленов в пространстве L2[a, 6] функций с инте- грируемым квадратом на произвольном отрезке [а, &] вытекает из теоремы Вейерштрасса о равномерной аппроксимации любой непрерывной функции на отрезке многочленами. См. п. 2 § 2 гл. VIII.
396 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ (ГЛ. VII при всех k = 0, 1, п — 1, то, интегрируя по частям, полу- чаем 1 1 Rm(x) Rn(x) dx — — \l)w-^^-(х2—1)" = ... , J, dx + dxn — 1 — I 1 Г Г Я« + я 1 •••=(-1)n \[-£^(x2~1)mp2-1)n^- <8> Если m < n, то под знаком последнего интеграла стоит то- ждественный нуль, откуда следует ортогональность систе- мы {/?п}. Во-вторых, ясно, что многочлен Rn имеет степень п, т. е. ка- ждый Rn лежит в подпространстве, порожденном «+ 1 первыми элементами системы (7). Таким образом, как система {/?п}, так и система {Qn} обладают следующими свойствами: 1) ортогональность, 2) n-й элемент системы принадлежит подпространству, по- рожденному элементами 1, х, ..., хп~1. Но этими двумя свойствами каждый элемент системы опре- деляется однозначно с точностью до числового множителя (тео- рема 1 § 4 гл. III). Найдем теперь нормирующие множители для Rn(x). В слу- чае п = т равенство (8) дает 1 1 J/?2(x)6fx = (-l)n J [jgL(X2-l)"](x2- 1)" dx = 1 (l-x2)"dx = -^ ] \ Иначе говоря, норма многочлена Rn равна n! 2" s\j• Та- ким образом, система многочленов "пЛу*" д/ не только ортогональна, но и нормирована. Обычно рассматриваются не эти нормированные многочлены, а многочлены, определяемые формулой Рп = «11^ dP" — • ) Последний интеграл можно вычислить элементарно, применяя рекур- рентные формулы, или же путем сведения его к В-функции.
S 31 ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L2 397 О при n=/=m, 2 [гТ+Т ПРИ n==m- пяти первых многочленов Ле- 1 Их называют многочленами Лежандра, а саму эту формулу — формулой Родрига. Из проведенных выкладок следует, что 1 J Pn(x)Pm(x)dx = -j Приведем явные выражения жандра: Ро(х)=1, Р1 (х) = х, Р2(х) = у. р3 w=4%3—4х’ г> / \ 35 д 15 о । з Р4 W “g- Х Х “Ь "д' • Разложение функции f на отрезке [—1, 1] по многочленам Лежандра имеет вид оо f W=S СпРп (х), П=0 где 1 J f (*) Рп (*) dx. -1 5. Ортогональные системы в произведениях. Кратные ряды Фурье. Пусть на множествах X' и X" определены меры ц' и р". Соответствующие пространства функций с интегрируемым квад- ратом будем обозначать L2 и Ь2. В произведении Х = Х' XX" рассмотрим меру р. — у' ® ц" и обозначим через L2 отвечающее ей пространство функций с интегрируемым квадратом. Функции из Ь2 будем записывать как функции двух переменных. Теорема 1. Если {фт} и {фп} — полные ортонормальные си- стемы соответственно в Ь2 и в Ь2, то система всех произведений fmn(x, у) = фт (х) ф„ (у) есть полная ортонормальная система в Ь2. Доказательство. В силу теоремы Фубини (замечание) $ fmn (*’ dV- = J Tm w ( J (^) dp' = 1. X X' \X" J
398 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ (ГЛ. VII Если т =/= mh то в силу той же теоремы y)fm,nSx> у№ = X = $ Ф„ (у) Ф„, (у) ( J Фж W Ф«, (х) du" = О, X" \Х' / поскольку функция fmn (х, у) fmith (х, у) двух переменных сумми- руема на X = X' X %" Если т = mi, но п =/= п\, то $ fmn (х> У) fmini (*> У)^ = J Фж W ( J Ф„ (//) Ф„, (у) dp,' = 0. X X' \Х" / Докажем полноту системы {fmn}- Допустим, что в Ь2 суще- ствует функция f, ортогональная ко всем функциям fmn. Положим ?М = Jf (х, y)(pm(x)dp'. X' Легко видеть, что функция Fm(y) имеет интегрируемый квадрат. Поэтому Fm(y)tyn(y) при любом п интегрируема. Снова исполь- зуя теорему Фубини, получаем J ?т (У) Фп (У) dp"= J f (х, у) (х, у) dp = 0. X" X В силу полноты системы {фп} отсюда вытекает, что для почти всех у Fm(y) = 0. Но тогда при почти каждом у имеют место равенства \f(x, у) ф„ (х) dp' = 0 X' для всех т. В силу полноты системы {срт} отсюда получается, что при почти каждом у множество тех х, где f (х, у) 0, имеет меру нуль. В силу теоремы Фубини это означает, что на X функция f (x, у) равна 0 почти всюду. Применим эту теорему к некоторым конкретным ортогональ- ным системам. В пространстве функций двух переменных f (х, у) (— л <х, у^л)
§ 3J ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L, 399 с интегрируемым квадратом полную ортогональную систему об- разуют попарные произведения элементов систем: 1, cosтх, sinmx (т=1, 2, ...) и 1, cos пу, sin пу (п — 1, 2, . ..), т. е. функции 1, cos тх, sin тх, cosпу, sin пу, cos тх sin пу, cos тх cos пу, sin тх sin пу, sin тх cos пу. Соответствующий ряд Фурье выглядит несколько громоздко, по- этому здесь удобнее пользоваться показательными функциями eimxeiny _ ei (тх+пу) m = Qt ±1, ±2, . ..). Этому базису отвечает ряд Фурье f (х, у) — £ cmnel ^х+пу)г т, где я я ст»=4^- J J Ж y)e-i(mx+ny'>dxdy. —я —л Многочлены Лежандра дают в пространстве функций, опре- деленных на квадрате — 1 у < 1, полную ортонормальную систему, состоящую из многочленов С? (х и) = + 1) dm , 2 _ , 2 _ jxn ЧпиЛ ’ У) mlnl2m+n+l dxm 1 J dyn{y Все сказанное очевидным образом переносится на функции не- скольких переменных. В частности, тригонометрический ряд Фурье для функции k переменных имеет вид Ж.......*k) = f сп, ... n/(W-+n^), П1 ... пк-ОО где я я ••• .....xt)e-,(Vi+-+^)dX1...t/Xfc. I ' -я -я 6. Многочлены, ортогональные относительно данного веса. Мы пришли к многочленам Лежандра, ортогонализируя функ- ции 1, х, х2...хп, ... (9)
400 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ |ГЛ. VII относительно скалярного произведения 1 5 f(x)g(x)dx, -1 отвечающего обычной мере Лебега на отрезке [—1, 1]. Если на этом отрезке задать какую-либо иную меру ц, такую, что функ- ции (9) в соответствующем пространстве Ь2 со скалярным про- изведением f(x)g(x)dp линейно независимы, то, применив к — I (9) процесс ортогонализации, мы придем к некоторой системе многочленов {Qn}, зависящей, вообще говоря, от выбора меры ц. Предположим, что мера ц определена для измеримых по Лебегу подмножеств сегмента [—1, 1] формулой p(E) = ^g(x)dx, (10) Е где g — фиксированная неотрицательная суммируемая функция. Условие ортонормальности ( 1 при т — п, (Qm, QJ = [0 при в этом случае записывается в виде 1 ( Qm(x)QJx)g(x)dx = f * ПрИ (И) (, 0 при т^=п. Функция g, определяющая меру (10), носит название веса или весовой функции. Таким образом, про многочлены, удовлетво- ряющие условию (И), говорят, что они ортогональны с весом g. Выбор того или иного веса приводит к различным системам многочленов. В частности, положив мы получим многочлены, совпадающие с точностью до постоян- ного множителя с так называемыми многочленами Чебышева, которые определяются формулой Тп (х) = cos п arccos х (п=1, 2, ...) и играют важную роль в различных интерполяционных задачах.
§ 3] ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L, 401 Ортогональность этих многочленов относительно веса 1/V 1 — х2 легко проверяется. Действительно, полагая x = cos0, dx = — sin0d0, V1 ~ x2 = sin0, получаем I л л St (г\т Г V при т = п, —— " '..J- dx — \ cos m0 cos и0 d0 = 2 _i V1 — x2 J о при m=/=n. 7. Ортогональный базис в пространствах £2(—°0, °°) и 12(0, оо). Выше мы рассматривали ортогональные системы на отрезке, т. е. на множестве конечной меры. Рассмотрим те- перь случай бесконечной меры, а именно, пространство Ь2(—оо, оо) функций с интегрируемым квадратом на всей чис- ловой прямой. Ортогональную систему функций в нем нельзя построить ни из многочленов, ни из тригонометрических функ- ций, ибо ни те, ни другие не принадлежат этому пространству. «Материал» для построения базиса в Ь2(—оо, оо) естественно искать среди функций, достаточно быстро убывающих на бес- конечности. В частности, такой базис можно получить ортогона- лизацией последовательности хпе-хг/2 (n = 0, 1, 2, ...). Действительно, всякая функция вида Р(х)е~х'12, где Р— много- член, принадлежит, очевидно, Ь2(—оо, оо), а полнота системы (12) будет доказана в п. 3, § 4 гл. VIII. Применив к функциям хпе~х‘12 процесс ортогонализации, мы получим систему функций вида <Pn(x) = //„(x)e-*’/2 (n = 0, 1, 2, ...), (12) где Нп— многочлен степени п. Эти многочлены называются мно- гочленами Эрмита, а сами функции <рп—функциями Эрмит. Нетрудно показать, что многочлены Эрмита совпадают, с точ- ностью до постоянного множителя, с многочленами Hna~x‘ Действительно, многочлен Н*п имеет, очевидно, степень п, а со- отношение ортогональности оо J Нт (х) Hn (х) е~х' dx = 0 п) — 00 легко получить интегрированием по частям. В силу теоремы об ортогонализации существует лишь одна, с точностью до по- стоянных множителей, система ортогональных функций вида Рп(х)е~*2/2, где Рп — многочлен /г-й степени.
402 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ (ГЛ. VII Полученный результат допускает и такое истолкование. Рас- смотрим на прямой меру ц, имеющую плотность е-*’, т. е. та- кую, что dp — e~x'dx. Это —конечная мера. В пространстве функций, интегрируе- мых с квадратом по этой мере, скалярное произведение имеет вид оо (Л g) = J f(x)g(x}e-*2dx, — со а многочлены Эрмита образуют в нем ортогональную систему. Рассмотрим, наконец, пространство Л2(0, оо) функций с ин- тегрируемым квадратом на полупрямой. Взяв в нем систему функций xrte-x (n = 0, 1, 2, ...) и применив к ним процесс ортогонализации, мы получим систе- му функций Ln (х) е~х, называемых функциями Лагерра. Соответствующие многочлены Ln называются многочленами Лагерра. Многочлены Лагерра можно рассматривать как ортого- нальный базис в пространстве функций, квадрат которых интег- рируем на полупрямой (0, оо) по мере d\L — e~xdx. В п. 3 § 4 гл. VIII мы докажем, что система функций Лагерра полна в Л2(0, оо). 8. Ортогональные многочлены с дискретным весом. Пусть п + 1 различным точкам Хо, хь ..., хп действительной прямой приписаны в качестве «весов» положительные числа ро, Pi, ... ..., рп, а мера ц определена формулой ц(£)= Е Pk, xksE т. е. p(£) равна сумме весов, содержащихся в Е точек Хд. Из- меримыми по этой «вырожденной» мере являются здесь любые множества и функции на прямой, причем любое множество не содержащее точек хд (k — 0, 1, ..., п), имеет меру 0. Тем самым интеграл по всей действительной прямой от функции f равен ОО П J f (x)dp = £pj(xft), — оо fteO
ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L, 403 « 3] а скалярное произведение дается формулой (Л g)= Е Pkf (хк) g (хк). k=Q Очевидно, что функции fag будут эквивалентны по мере ц, если f (xk) = g(xk) во всех точках xq, хь ..., хп, и только в этом случае. Для этого вырожденного случая задача наилучшей аппрокси- мации в смысле расстояния в L2 сводится к определению сумм Софо + С1Ф1 + • • • + стфт» обращающих в минимум выражение п / т \ 2 Е рА fM — Е с<ф/ М ( . А=0 (. >=1 ) т. е. к задаче «интерполирования по методу наименьших квад- ратов». В связи с задачей интерполирования по методу наименьших квадратов многочленами заданной степени П. Л. Чебышев раз- вил теорию ортогональных многочленов. Чтобы изложить отно- сящиеся сюда результаты Чебышева, заметим, что система 1, х, х2, .... хп (13) при нашей мере ц линейно независима, так как скалярное про- изведение (хТ, Xs) выражается формулой « Xs) = £ pkxr+s fe=0 и детерминант Грамма системы (13) есть (суммы по k от 0 до п) Ера Ерл Zpkx2k . • Е Pkxnk Ерл Е рА ЕрЛ • • ЕрЛ+1 Ерл Zpkxk+1 ЕрЛ+2 • • Е pkx2kn ^Ро Pl • • УрУо Урл •• У Рп ^~Рпхп 2 ~РоР1 . • Рп 1 1 . Х0 Х| . .. 1 •• хп 2 =#=0. УРохо УрЛ •• уП уП Л0 Л1 • •• ХПп Наоборот, хг при г > п линейно зависят от функций системы (13), так как в нашем случае L2 имеет размерность п +. 1.
404 ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ [ГЛ. VII Поэтому процесс ортогонализации приводит к конечной системе многочленов /’о, Pf > • • • > Рпг ортонормальных в том смысле, что п £ PkPr (xk) Ps (хк) = drs к=0 и каждая функция f разлагается в конечный ряд п f~ Е сгрг, г=0 где п С г Е PkPr [хк) f {хк). k=0 В точках Хк выполняются равенства f (xk) = J crPr (xA) (k = 0, 1.................n), r=0 т. e. полная сумма ряда есть просто интерполяционный много- член Лагранжа. Неполные суммы т Qm = Е CrPr (т < П) г=0 являются многочленами m-й степени, приближающими f в точ- ках Хк наилучшим способом в том смысле, что выражение Е Pk {f (xk) — Qm (xfe)}2 для Qm меньше, чем для любого другого многочлена той же сте- пени т. 9. Системы Хаара и Радемахера — Уолша. Хааром был построен следую- щий пример полной системы функций на отрезке [0, 1]. Система эта состоит из функции Фо = 1 и серий Фоь Ф11, Ф12, ф21> ф22> ф23, Ф21, %!> Ч’пг.........ЧП2п (п-я серия содержит 2п функций), где <Poi — + 1, -1, 0 <х < 1/2, 1/2<х<1, 7Х Фп = -72, О, 0 < х < 1/4, 1/4 < х < 1/2, 1/2 < х < 1, Ф12 — « 0, 7'2, -72, 0<х<1/2, 1/2 < х < 3/4, 3/4<х<1.
S 3] ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L, 405- Вообще, положим (в точках разрыва значения функций можно брать произ- вольными) ’ 2п/2 -f~ - < х < 1 4_____— ’ 2п 2п 2n+l ’ (п = 0, 1, 2, i = 1, 2.....2п). Легко видеть, что построенная система ортонормальна. Докажем ее полноту. Разобьем отрезок [0, 1] на 2"+1 равных интервалов Д< и рассмотрим мно- жество Л4„+1 всех функций, сохраняющих постоянное значение на каждом из интервалов Д,. Очевидно, Л4„ + 1 есть линейное подпространство размерно- сти 2П+'. Кроме того, все функции нашей системы до функций n-й серии включительно войдут в Mn+i. Так как эти функции в силу ортонормальности нашей системы линейно независимы и так как их число равно 1 + L 2ft = 2n+1, й=0 то функция фо и функции фл, серий k = 0, 1......п образуют в Мл-н пол- ную систему линейно независимых векторов. Отсюда, принимая во внимание,, что любая непрерывная функция может быть сколь угодно точно аппрокси- мирована функцией из Л1„ + 1 (при достаточно большом п), мы убеждаемся в полноте нашей системы. Рассмотрим еще один пример ортонормальной системы функций на от- резке [0, 1], принадлежащий Радемахеру. Положим q>m = (— Иными словами, функция фт получается следующим образом: сегмент [0, 1J делится на 2т равных частей Дг, причем на интервалах Д,- (» = 1, 2т) функция фт принимает попеременно значения +1 и —1. Ортонормальность системы Фо, ......Фп, ••• (14) очевидна. Эта система не полна. Это следует хотя бы из того, что, например, функция 1, если 0 < х < 1/4 или 3/4<х<1, —1, если 1/4 < х < 3/4, ортогональна ко всем функциям системы (14). Однако последнюю можно рас- ширить до полной ортонормальной системы, добавив к ней функции вида <Рт1т2...т4 = Фт1Фт2---ФтА (0 < ^ < zn,, < ... < mJ. (15) Очевидно, что расширенная таким образом система, называемая системой Радемахера — Уолша, останется ортонормальной. Кроме того, она уже будет полной. Доказательство этого проводится аналогично доказательству полноты, системы Хаара, Ф12 — Ф1Ф2 —
ГЛАВА VIII ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ § 1. Условия сходимости ряда Фурье 1. Достаточные условия сходимости ряда Фурье в точке. Рассмотрим снова пространство L2[—л, л] функций с суммируе- мым квадратом на отрезке [—л, л]. Это, как было показано в гл. VII, — полное бесконечномерное евклидово пространство, т. е. гильбертово пространство. Функции 1, cosnx, sinnx (n=l, 2, ...) (1) образуют в нем полную ортогональную систему, поэтому для каждой функции f s L2[—л, л] ряд Фурье ОО -у- + ancosnx + &„sinпх, (2) П=1 где л л ап = f(x) cos пх dx, bn = -^- f(x) sin пх dx, (3) —л -л сходится к f в среднем квадратичном, т. е. в метрике простран- ства L2[—л, л]. Однако в связи с применением рядов Фурье к задачам математической физики и другим вопросам будет суще- ственно установить условия, гарантирующие сходимость ряда Фурье к f не только в среднем, но и в данной точке, всюду, или даже равномерно. Мы установим сейчас условия, достаточные для сходимости тригонометрического ряда в данной точке. Сде- лаем некоторые предварительные замечания. Вместо функций, заданных на отрезке [—л, л], мы можем го- ворить о периодических функциях с периодом 2л на всей пря- мой, поскольку каждую функцию, заданную на отрезке, можно периодически продолжить1)- Далее, функции, образующие три- гонометрическую систему, ограничены, поэтому формулы (3), определяющие коэффициенты Фурье по этой системе, имеют >) Заменив, если нужно, fix) эквивалентной функцией, мы можем считать, что f(—л) = f(n).
УСЛОВИЯ СХОДИМОСТИ РЯДА ФУРЬЕ 407 смысл для любой суммируемой функции') (а не только для функций с суммируемым квадратом). Таким образом, каждой функции f е L\ [—л, л] отвечают совокупность ее коэффициентов- Фурье и ее ряд Фурье fw-т + Е ап cos пх + bn sin пх. /т=1 Перейдем теперь к вопросу о сходимости этого ряда в дан- ной точке х к значению функции f в этой точке. Положим п Sn W = -у- + £ ak cos kx + bk sin kx. (4> k=i Преобразуем сначала Sn(x), подставив в (4) вместо коэффи- циентов ak и Ьк их интегральные выражения (3). Обозначив пе- ременную интегрирования через t, мы получим 11 ( п -у Зп(х) =— \ f (/) у 4- + V cos kx cos kt + sin kx sin kt > dt — ” J I z Z / I -n 4 A=1 ' n у + £ COS k (t — x) fe=l Воспользовавшись хорошо известной формулой2) I ып 2 и у + cos и + cos 2и + • • • + cos пи =----------, (5) 2sinT будем иметь sin -П + 1 (/ — jr) /(0-------х--------dt. (6> п S.W=-H ') При этом, конечно, для произвольной суммируемой функции утверждений о сходимости ряда (2) мы не делаем. ') Для получения этой формулы достаточно просуммировать равенства и 1 „ и s,n_=y.2s,n-, Зи и „и sin — — sin — = cos и • 2 sin -%, никаких +1 . 2л — 1 и sin —-— и —sin —-— и = cos ли • 2 sin —.
408 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIH Это представление Sn(x) и различные его модификации назы- ваются интегралом Дирихле. Сделаем замену, положив t — х = z. Поскольку под интегра- лом в (6) стоит периодическая функция с периодом 2л, интег- рал от нее по любому отрезку длины 2л имеет одну и ту же ве- личину. Поэтому и при интегрировании по z мы можем сохра- нить прежние пределы —л и л. Получаем Л — Л . 2п + 1 sin— о • 2 2sin т dz. Функция . 2п + 1 1 S,n 2 Dn(z) = -J------------- ' 2л ,2 Sin- пазывается ядром Дирихле. Из равенства (5) сразу видно, что при любом п Л Dn (z) dz = 1. —л Используя это равенство, запишем разность Sn(x)— f(x) в виде л . 2п + I . с sin —5— Z S„(x) — f (х) = \ [f (х + z) — f (х)] -----dz. (7) Л sinT Таким образом, мы свели вопрос о сходимости Sn(x) к f(x) к вопросу о стремлении к нулю интеграла (7). Исследование этого интеграла опирается на следующую лемму. Лемма 1. Если функция ф суммируема на отрезке [а, Ь], то ь lim \ (p(x)sinpxdx = 0. р->ОО J а Доказательство. Ecjjjt <р — непрерывно дифференцируе- мая функция, то с помощью интегрирования по частям полу- чаем, что при р->оо ь ь ср (х) sin рх dx = — ср (х) cospp* |а + j ф' (*) С°|~ dx °- (8) а а Пусть теперь ф — произвольная суммируемая на [а, 6] функция. Поскольку непрерывно дифференцируемые функции всюду плот-
§ 1] УСЛОВИЯ СХОДИМОСТИ РЯДА ФУРЬЕ 40» ны в Ai[a, Ь], для любого е > 0 найдется такая непрерывно диф- ференцируемая функция фе, ЧТО ь J I ф (х) — Фе (х) | dx < . (9> а Далее, имеем ь ф(х)з1п pxdx а Ъ j [ф (х) ~~ Фе (*)] siп Рх dx 4- а ь фе (х) sin рх dx _ Первое слагаемое справа меньше, чем е/2, в силу (9), а вто- рое— стремится к нулю при р-э-оо согласно (8). Лемма доказана. Теперь мы легко можем доказать следующий достаточный: признак сходимости ряда Фурье. Теорема 1. Если f — суммируемая функция и при фиксиро- ванном х и некотором 6 > 0 интеграл в j|H5,+0-Hx) \dt (10). -в существует, то частичные суммы Sn ряда Фурье функции f схо- дятся в этой точке х к f(x). Доказательство. Перепишем интеграл (7) в виде Л хс /<«.+.?)-.№). ^_sin2i+lZ(fe. (|1> -я 2 sin у Если функция f(x + z) — f(x) Z интегрируема (по г) в пределах от —6 до 6, то она интегрируе- ма и на всем отрезке [—л, л] (поскольку feLj—л, л]). Но то- гда интегрируема и функция f (* + z) — f (х) . z 2 sin (z/2) ’ поэтому к интегралу (11) можно применить лемму 1, и мы по- лучаем, что этот интеграл стремится к нулю, когда /г->оо. Замечания. 1. Сходимость интеграла (10) называется ус- ловием Дйни. Оно, в частности, выполнено, если в данной точ- ке х функция f непрерывна и имеет конечную производную, или хотя бы правую и левую производные.
•410 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. УШ Рассуждения, проведенные при доказательстве теоремы 1, останутся в силе, если вместо условия Дйни потребовать сходи- мости следующих двух интегралов: о И* ±4-И*-°) dz и Z -б $ f(x + z)-f (x + 0)d2> (12) о где f(x— 0) и f(x-)-O) суть левый и правый пределы функции f в точке х (предполагается, что х есть точка разрыва первого рода для [). Действительно, разность 5 (х) — в) 4х — 0) можно представить в виде 2 о . 2п + 1 1 Г Sln-----2-----2 — \ [f (к + z) — f (х — 0)] —X 73;— dz + л J 1/ 4 ' 11 2 sin (z/2) 1 — Л 1 г VpH^ + ^)-f(x + 0)]-2-n(-/2)........... dz- 0 при условии существования интегралов (12) эти выражения стремятся к нулю, когда п->оо. Отсюда вытекают достаточные условия «глобальной» сходи- мости ряда Фурье, обычно приводимые в курсах анализа. Пусть f — ограниченная функция с периодом 2л, имеющая разрывы лишь первого рода, и пусть f имеет в каждой точке левую и правую производные1). Тогда ее ряд Фурье сходится всюду, а его сумма равна f(x) в точках непрерывности и равна у (f (х + 0) + f (х — 0)) в точках разрыва. 2. Ядро Дирихле Dn(z), игравшее основную роль в наших рассуждениях, представляет собой функцию, принимающую в точке z = 0 значение —— и при больших значениях п быстро колеблющуюся (рис. 22). В силу этого обстоятельства основной >) В точке разрыва первого рода левая и правая производные пони- маются как /(х-Л)-Нх-О) .. Нх + Л)-Нх + 0) lim —-------—т------ и lim -----------т------- h->0+ — я Л->0+ л соответственно.
«11 УСЛОВИЯ СХОДИМОСТИ РЯДА ФУРЬЕ 41Г вклад в интеграл л f (х + z) Dn (z) dz -л при больших п дает лишь сколь угодно малая окрестность точ- ки х. Для функций, удовлетворяющих условию Дини, этот вклад стремится к /(х) при /г->оо. Можно сказать, что ядра Дирихле Dn образуют последовательность функционалов, сходящуюся, в. некотором смысле, к б-функции на множестве функций f, раз- ложимых в сходящийся ряд Фурье. Ясно, что в смысле обычной сходимости последовательность {£)п} не стремится ни к какому пределу, поэтому, исследуя интег- рал (7), мы не могли применить какие-либо стандартные теоремы о предельном переходе под зна- ком интеграла. 3. Условие Дини, обеспечиваю- щее сходимость ряда Фурье, мо- жно заменить другими условия- Рис- 22- ми, но просто отбросить его в теореме 1 нельзя. Действительно, даже среди непрерывных существуют функции с рядом Фурье, расходящимся в некоторых точках. Среди суммируемых функций существуют такие, ряд Фурье которых расходится всюду (А. Н. Колмогоров). Еще в 1915 г. Н. Н. Лузин поставил следующую проблему: суще- ствуют ли в L2 функции, для которых ряд Фурье расходится на множестве положительной меры? Как показал Л. Карлесон (1966 г.), таких функций не существует. Тот факт, что существуют непрерывные функции, для кото- рых ряд Фурье сходится не во всех точках, легко вытекает из общих теорем о слабой сходимости функционалов (п. 3 § 3- гл. IV). Заметим прежде всего, что Л I Dn (г) | dz-+ оо при п-»оо. (13> — Л Действительно, числитель дроби |£>л(г)|= -I n t Z 2п sin I *
412 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII обращается в 1 в точках, где = й = 0, 1, ...,л. (14) Окружим каждую из точек, определяемых условием (14), интер- валом 2k + 1 I . п г---— л|<Т. (15) Длина любого из них равна, очевидно, , .. .В каждом из и \ Z/Z *т“ 1 ) I . 2л + 1 I л т г\ этих интервалов sin——z не меньше, чем 1/2. Оценим вели- чину sin у на й-м интервале (й = О, 1, ..., л). Имеем z . z \ (2k+\ lre\/2rt + l\“‘fc + l sinT<y<yl-^F- п+тД—[>-) <2Т+ТЯ- Поэтому интеграл от |£)п(г)|, взятый только по промежут- кам, определяемым условием (15), больше, чем сумма га п I V1 1 1 4л _ 1 V 1 ~2л L ~2 k + 1 3(2n + 1) ~ “ЗтГ Zj k + 1 • ft='J 2п + 1 Л А=о Эта сумма стремится к оо при п->оо. Отсюда вытекает соотно- шение (13). Оно означает, что нормы функционалов Dn в про- странстве непрерывных функций не ограничены в совокупности. Но тогда в силу теоремы о слабой сходимости функционалов эта последовательность не может быть слабо сходящейся на про- странстве непрерывных функций, т. е. имеются непрерывные функции f, для которых Л lim \ Dn (х) f (х) dx п-^со J не существует. 2. Условия равномерной сходимости ряда Фурье. Мы уста- новили условия, достаточные для сходимости ряда Фурье неко- торой функции f в каждой точке. Класс функций, удовлетворяю- щих этим условиям, весьма широк, и даже непрерывность вовсе не необходима для представимости функции суммой всюду схо- дящегося тригонометрического ряда. Положение несколько из- менится, если мы будем интересоваться условиями равномер- ной сходимости ряда Фурье. Ясно, что если функция f (х) имеет хотя бы один разрыв, то ее ряд Фурье не может сходиться к ней равномерно, поскольку сумма равномерно сходящегося
§ И УСЛОВИЯ СХОДИМОСТИ РЯДА ФУРЬЕ 413 ряда непрерывных функций всегда непрерывна. Таким образом, непрерывность функции есть необходимое (но, конечно, не достаточное) условие равномерной сходимости ее ряда Фурье. Простое достаточное условие дает следующая теорема. Теорема 2. Если функция f с периодом 2л абсолютно не- прерывна, а ее производная f' принадлежит L2 [—л, л], то ряд Фурье функции f сходится к ней равномерно на всей прямой. Доказательство. Обозначим через ап и Ь’п коэффициен- ты Фурье функции f'. Так как f абсолютно непрерывна, то к ин- тегралу Л ап = -^- f (х) cos пх dx — Л можно применить формулу интегрирования по частям. Полу- чаем Л ап =-^~ f (х) cos nxdx = — Л п f 1 £, ч sin пх Iя 1 f «/л • . = — fix)-----------\ f (x)smnxdx =----: « п 1_я пя J ' ' ’ п ’ —л аналогично, л , if а bn = — \ f (х) sin пх dx = —. . п л J 1 х ' п —л Следовательно, ^+Ё1«л+1м=^+£41-+Ф- ов) п=1 п=1 Этот ряд сходится, поскольку оо a S Ь’п + а'п < оо в силу неравенства Бесселя. Числовой ряд (16) служит, очевидно, мажорантой для ряда Фурье функции f. Но тогда, по признаку Вейерштрасса, ряд Фурье функции f рав- номерно (и абсолютно) сходится. Остается показать, что сумма этого ряда есть f. Пусть <р — сумма ряда Фурье функции f. То- гда ср имеет те же самые коэффициенты Фурье, что и f. Отсюда в силу непрерывности обеих функций получаем, что f == <р.
414 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIH Можно дать другое условие равномерной сходимости ряда Фурье, аналогичное условию Дини, именно: Теорема 3. Если на некотором множестве Е cz [—л, л] сум- мируемая функция f ограничена, а условие Дйни выполняется на Е равномерно, т. е. для всякого е > 0 существует такое 6 > 0, что одновременно для всех х^Е, то ряд Фурье функции f сходится к этой функции равномерно на Е. Доказательство этой теоремы основано на лемме, служащей усилением леммы 1 (см. стр. 408). Лемма 2. Если В — предкомпактное в метрике L\ [—л, л] множество суммируемых функций, то для всякого е > 0 най- дется такое N = N (е), что fit) sin W dt при Л Л/(е) для всех f^B одновременно. Для доказательства леммы возьмем в В конечную е/2-сеть Ф1....<рь и выберем N так, чтобы Ф,- (/) sin М dt i — 1, 2, ..., k при Л N. Если теперь f — произвольная функция из В, то при некотором i Ilf — Ф,|| < в/2 и, следовательно, ь ь ь f (/) sin kt dt ( ф, (/) sin Л/ dt + ( (f — q>t) sin kt dt < e. Тем самым лемма доказана. Применение этой леммы основано на том легко проверяемом факте, что в условиях теоремы 3 множество функций предкомпактно. Дальнейшие подробности доказательства предо- ставляем читателю. До сих пор мы говорили о функциях, заданных на отрезке [—л, л]. Ясно, что все сказанное может быть автоматически пере-
3 2] ТЕОРЕМА ФЕЙЕРА 415 несено на функции, определенные на отрезке произвольной длины 21. Для случая нескольких независимых переменных тоже мож- но сформулировать как условия, достаточные для сходимости ряда Фурье в каждой точке, так и условия равномерной сходи- мости ряда Фурье. Мы не будем на этом останавливаться. § 2. Теорема Фейера 1. Теорема Фейера. Пусть f—непрерывная функция с пе- риодом 2л на прямой. Эта функция определяется своим рядом Фурье оо -у- + ап cos пх + sin пх (1) однозначно. Действительно, если Л и /г — две непрерывные функ- ции, имеющие одни и те же коэффициенты Фурье, то f\ — fz — непрерывная функция, равная нулю почти всюду и, следователь- но, тождественный нуль. Однако поскольку ряд Фурье непре- рывной функции, вообще говоря, не обязан сходиться, мы не можем такую функцию f получить непосредственным суммиро- ванием ее ряда Фурье. Способ восстановления непрерывной функции по ее ряду Фурье дает излагаемая ниже теорема, до- казанная в 1905 г. Фейером. .Пусть k Sfe (х) = -у- + й] cos jx + bj sin jx /=' — частичная сумма ряда Фурье функции f. Положим о (х) — + Si (х) + ••• +Sn-1(*) Выражения оп — средние арифметические сумм — называют- ся суммами Фейера функции f. Теорема 1. (Фейер). Если f — непрерывная функция с пе- риодом 2л, то последовательность {оп} ее сумм Фейера сходится к f равномерно на всей числовой оси. Доказательство. Воспользуемся полученным в предыду- щем параграфе интегральным представлением частичных сумм ряда Фурье: 2k + 1 ‘ 2 Z а -----;—dz. 2 sm у (2) (3) 5*(х) = у \ f(x + z) ** V — П
416 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII Подставив эти интегралы в равенство (3), получим для оп(х) следующее выражение: а„ (х) = . 2Л + 1 sin~2~ 2 г s,nT > f (х 4- z) dz, которое с помощью формулы ') fl—1 У sin(2fe + l)z = sin* 2 nz sin г может быть Фейера-. Выражение представлено в виде так называемого интеграла р / sin п У --------— f(x + z)dz. (4) -я \ siny ) (5) называется ядром Фейера. Формулу (4) можно переписать в виде Л on{x) = J f (x + z)O„(z)dz. (6) -л Нам нужно доказать, что при п~>оо это выражение равномерно стремится к f(x). Отметим предварительно следующие свойства ядра Фейера: 1) Ф„(г)>0, Л 2) J<D„(z)dz = l, — я 3) при любом фиксированном 6 > 0 и п->оо имеем -б л Ф„ (z) dz=\ Ф„ (г) dz = т]п (6) -> 0. -л в ') Эту формулу легко получить, суммируя по k равенства 2 sin (2k + 1) г • sin г = cos 2kz — cos 2 (k + 1) z.
§2] ТЕОРЕМА ФЕЙЕРА 417 Первое из этих свойств очевидно, второе получается из равен- ства (6), если положить f(x) = 1 и учесть, что для такой функ- ции а„(х)= 1 при всех п; наконец, третье свойство сразу выте- е . z ^2д кает из того, что если о < z л, то siny.^ — и> следова- тельно, Учитывая эти свойства ядра Фейера, нетрудно доказать тео- рему. Так как функция f — непрерывная и периодическая, то она ограничена и равномерно непрерывна на всей прямой. Ина- че говоря, существует такая постоянная М, что для всех х \f(x)\<M (7) и для каждого е > О найдется такое б > О, что \ f (х") — f (х') \ < ъ/2, (8) как только I х" - х' | < б. Для доказательства теоремы нам нужно оценить разность Л f(x) — Ст„(х)= jj [f(x) — f(x + z)]<D„(z)dz, -л которую можно представить в виде суммы следующих трех ин- тегралов: -в 7-= 5 w — f (^ + г)} ф„ (z) dz, —л б 4 = § {f (х) — f(x + z)} Ф„ (г) dz, -б л /+ = 5 V W — f (* -г- г)} ф„ (г) dz. в Из (7) и (8) непосредственно вытекают следующие оценки: I /- |<2Л4т]„ (б), IЛ К 2Мт]п (б), в I'oKf 5 Ф„(г)^г<|. -б
418 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII Выберем теперь л0 настолько большим, чтобы при п п0 и дан- ном б выполнялось неравенство 2Мт]ч(д) < е/4. Тогда I f W — <т„ (х) | < е/2 + е/4 + е/4 = е, откуда в силу произвольности е и следует утверждение теоремы. Отметим, что при доказательстве мы использовали только свойства 1)—3) ядра Фейера. Это позволяет получать различ- ные обобщения теоремы 1 (см., в частности, п. 3 этого пара- графа). 2. Полнота тригонометрической системы. Теорема Вейер- штрасса. Из теоремы Фейера следует полнота тригонометриче- ской системы в пространстве L2[—л, л]. Действительно, в силу этой теоремы любая непрерывная функция есть предел равно- мерно (а значит, и в среднем) сходящейся последовательности тригонометрических многочленов сгп. Остается заметить, что не- прерывные функции всюду плотны в Ь2. Теорему Фейера можно рассматривать как усиление теоремы Вейерштрасса об аппро- ксимации непрерывных функций тригонометрическими много- членами: эта последняя устанавливает, что всякая непрерывная функция есть равномерный предел какой-то последователь- ности тригонометрических многочленов, а теорема Фейера ука- зывает вполне определенную последовательность, обла- дающую этим свойством, — последовательность сумм Фейера (3). Из теоремы Вейерштрасса о равномерной аппроксимации непрерывной периодической функции тригонометрическими мно- гочленами легко следует и вторая теорема Вейерштрасса — об аппроксимации алгебраическими многочленами любой функции, непрерывной на некотором отрезке [а, &]. Действительно, если f(x)— такая функция, то, положив t — *_ л, т. е. х = = Z а~ + о, мы получим функцию ф(/) от t, заданную на [О, л]. Продолжим ее вначале на полусегмент [—л, 0), положив <р(—— а потом, по периодичности, на всю прямую. По- строим теперь тригонометрический многочлен Тп, удовлетворяю- щий условию I Тп (/) — Ф (/) | < е/2 при всех t. Далее, всякий тригонометрический многочлен разлагается в ряд Тейлора, сходящийся равномерно на любом конечном интервале. Пусть Рт — частичная сумма ряда Тейлора для Тп, такая, что I Тп (0 — Рт (0 | < е/2 при 0 < л.
§ 3] ИНТЕГРАЛ ФУРЬЕ 419 Тогда | ф (0 — Рщ (О I < 8 ПРИ 0 t Л. Сделав в Рт(О обратную замену t = * _ л, мы получим мно- гочлен Qm(x), удовлетворяющий условию IfU) —Q,n(*)l<8 при 3. Теорема Фейера для пространства L\. В теореме Фейера достигнута определенная симметрия между условием и утверждением теоремы. Из того, что функция f принадлежит пространству С [—л, л] непрерывных функций, следует, что отвечающие ей суммы Фейера сходятся к f в метрике того же самого пространства С [—л, л]. Аналогичные теоремы можно получить и для других функциональных пространств, в частности, для пространства L\ [—л, л]. Точнее говоря, имеет место следующая теорема, которую естественно назвать теоремой Фейера для суммируемых функций: Если j — суммируемая на отрезке [—л, л] функция, то ее суммы Фейера сходятся к ней по норме пространства L\ [—л, л]. Доказательство этого утверждения может быть получено с помощью рас- суждений, близких к изложенным в п. 1. Мы не будем здесь их проводить, однако отметим следующий важный факт, вытекающий из теоремы Фейера для суммируемых функций. Всякая суммируемая функция однозначно (с точностью до эквивалентно- сти) определяется своими коэффициентами Фурье. Действительно, пусть f и g— две суммируемые функции, имеющие одина- ковые коэффициенты Фурье. Тогда все коэффициенты Фурье функции f — g равны 0. Следовательно, тождественно равны 0 и все суммы Фейера для f — g. Но тогда и их предел в Li, т. е. функция f — g, есть 0 почти всюду. § 3. Интеграл Фурье 1. Основная теорема. В § 1 были установлены условия, при которых периодическая функция может быть разложена в схо- дящийся ряд Фурье, т. е. представлена как суперпозиция гар- монических колебаний. Попытаемся сейчас перенести этот ре- зультат на функции непериодические. Мы увидим, что при довольно общих дополнительных условиях такое представление возможно, но только уже с помощью не ряда, а интеграла, так называемого интеграла Фурье. Начнем с наводящих соображений. Пусть функция f на ка- ждом конечном интервале удовлетворяет условиям, обеспечи- вающим разложимость ее в ряд Фурье. Иначе говоря, предполо- жим, что f суммируема на любом конечном интервале и в ка- ждой точке удовлетворяет условию Дйни. Рассматривая f, ска- жем, на отрезке [—I, Z], мы можем написать разложение этой функции в ряд Фурье: f (х) = ak cos х + bk sin х. fe=i (1)
420 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ VTTT Подставим сюда вместо а* и bh их выражения: аа = у f (/) dt, ak = у / (/) cos -у-1 dt, -i -i i Z»A = y j f(/)sin ^-tdt. —i Получим г “ ‘ = jf ^dt + X 7 5 f (0 cos-j^-x cos-^-tdt + -l £=! -I I I + y f (t) sin-^-x sin ~tdt = -^ j f(t)dt + -i —i oo I + у X j f (/) [cos -y-xcos-y-/ + sin -y-xsin ~ t\dt, A=1 -I t. e. i » i f(x) = ± J f^dt + ^l- J fW)c°sJr(t-x)dt. (2) — I A=1 -I Дополним предположения о функции f еще одним: пусть эта функция абсолютно интегрируема на всей прямой, т. е. оо J \f(t)\dt<oo. (3) — оо Перейдем теперь (пока чисто формально) в равенстве (2) к пре- делу при /—► оо. В силу (3) первое слагаемое в правой части равенства (2) при /->оо стремится к нулю. Второе слагаемое можно рассматривать как интегральную сумму (но только рас- пространенную на бесконечный промежуток) для интеграла J F(X)dX о от функции F(X) = y- J f(t)cosk(t~ x)dt, — I
•S3] ИНТЕГРАЛ ФУРЬЕ 421 если положить Хд = kn/l и АХ = л//. Поэтому формальный пре- дельный переход в (2) при /->сю приводит к равенству оо оо f(x) = lj dX J f (t)cosX(t — х) dt. (4) О —оо Это и есть искомое представление. Введя обозначения: оо оо ax=-i- f (t) cos Xt dt, = f (t) sin Xt dt, — oo — OO равенство (4) можно переписать в следующем виде, аналогич- ном ряду Фурье: оо f (х) = (ак cos Хх + bK sin Хх) dX. (5) о Мы получили равенство (4), называемое формулой Фурье, с помощью формального предельного перехода. Можно было бы обосновать справедливость этого перехода (при сделанных выше предположениях о функции [), однако проще доказать равен- ство (4) непосредственно. Итак, докажем следующую теорему. Теорема 1. Если функция f абсолютно интегрируема на всей прямой и в точке х удовлетворяет условию Дини, то имеет место равенство ОО ПО f (х) = ± J dX J f (t) cos X (t — x) dt. 0 —oo Доказательство. Введем обозначение A oo 7(4) = 1J dX J f (t) cos X(t — x)dt. 0 —oo (6) Нам нужно доказать, что lim /(Д) существует и равен f(x). Так А->ОО как f абсолютно интегрируема, то внутренний интеграл в (6) сходится, а двойной интеграл сходится абсолютно. Используя теорему Фубини, изменим в повторном интеграле (6) порядок интегрирования: ПО А оо 'И)=4 $ f(t)C08X(t-x)dX = ± J f(t) $а dt. — оо о —оо
422 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIIT Заменой переменных t — х = z приведем этот интеграл к виду оо = i J f(x + z)^dz. (7> — оо Хорошо известное равенство оо 1 f sin Дг , , , „ ~ - j dz = 1 (4 > 0) — оо позволяет записать разность /(4)—f(x) в виде оо J (Д) - f (х) = 1 J f(x + z)-f(x) s jn Az dz — oo Представим стоящий справа интеграл в виде суммы трех слагаемых: N J(A)-f(x) = ± J /(* + z)-f(*) sJn Azdz + — N .1 C f (x + z) . . , fix) C sin Az . H\ 1—- sin Az dz —\ -------------dz. 1 я J z я J z |z|>M |z|>M Второй и третий члены справа представляют собой сходящиеся интегралы, и каждый из них может быть сделан меньше, чем е/3, если число N взято достаточно большим. Первое слагаемое справа (при фиксированном N) стремится к нулю, когда А -> оо (в силу леммы 1 § 1 и условия Дини). Таким образом, получаем. lim (J (4)-/(%)) = 0, Х->оо что и требовалось доказать. 2. Интеграл Фурье в комплексной форме. В интегральной формуле Фурье (4) внутренний интеграл представляет собой четную функцию от X, что позволяет переписать эту формулу в виде оо оо f(x) = 2_ J dk J f(t)cosK(t-x)dt. (9> — oo —oo Далее, из абсолютной интегрируемости функции f следует, что оо интеграл \ f(/)sinX(Z — х) dt существует и представляет собой
§ 41 ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ 423 нечетную функцию от X. Поэтому оо оо 2я $ f (О sinX(/ — x)dt = 0 (10) — оо —оо ^если интеграл по К понимать в смысле главного значения, т. е. Л как lim \ ). Прибавив к (9) равенство (10), умноженное на N-*°° -nJ —i, получим оо оо — оо —оо Это равенство мы будем называть комплексной формулой Фурье. § 4. Преобразование Фурье, свойства и применения 1. Преобразование Фурье и формула обращения. Интеграль- ную формулу Фурье можно расчленить на два равенства. По- ложим оо g(X) = J f(t)e~iKtdt. —оо Тогда оо = S g^e^dK. (1) (2) Заметим, что формула (1) имеет смысл для любой абсолютно интегрируемой функции f. Таким образом, каждой f е L\ (— оо,о°) мы с помощью формулы (1) сопоставляем опре- деленную функцию g, заданную на всей числовой прямой. Функ- ция g называется преобразованием Фурье исходной функции Формула (2), выражающая f через ее преобразование Фурье, называется формулой обращения для преобразования Фурье. Следует обратить внимание на сходство между формулами (1) и (2). Вторая из них отличается от первой лишь знаком в пока- зателе и множителем 1/(2л) перед интегралом. Можно было бы достигнуть здесь еще большей симметрии, определив g форму- лой оо g&} = 5 (Г) — 00
424 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ (ГЛ. VI1F Тогда формула обращения приняла бы вид ОО f(x) = -4=- \g(k)elKxdk, V2n J — СЮ (2'> т. е. различие осталось бы только в знаке показателя экспо- ненты. Однако при всем их внешнем сходстве формулы (1) и (2), по существу, различны: в первой из них интеграл существует в обычном смысле (поскольку fet|(—оо, ос)), а во второй,, вообще говоря, лишь в смысле главного значения. Кроме того, равенство (1) — это определение функции g, а в равенстве- (2), представляющем собой иную запись интегральной формулы Фурье, содержится утверждение, что стоящий там справа интеграл равен исходной функции f. Как мы видели выше, для обеспечения этого равенства на f надо наложить, помимо интег- рируемости, еще дополнительные условия, скажем, условие- Дини. Замечание. Мы определили преобразование Фурье g для всякой функции f из Li(—оо, оо) и показали, что функция Д удовлетворяющая условию Дини в каждой точке, выражается с помощью формулы обращения через свое преобразование Фурье g. Это положение вещей в точности аналогично тому, ко- торое имеется для рядов Фурье. Действительно, коэффициен- ты Фурье Л Cn==i J f(x)e-‘^dx — Л определены для всякой f е Lj [—л, л], однако сходимость ряда Фурье оо 2 cneinx д«—оо (играющего здесь роль формулы обращения) можно гарантиро- вать лишь при определенных дополнительных условиях (условие- Дини). Вместе с тем для преобразования Фурье (как и для ряда; см. конец § 2), имеет место следующее: если для функции, f Li(— оо, оо) СО f (x)e~iKxdx =0, то f(x) — 0 почти всюду.
ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ 425 § Ч Действительно, из написанного выше равенства вытекает, первых, что для всех действительных t и Л f (х 4-t) e~iKx dx = 0. — оо Положим теперь Ф W = $ f (X + /) dt, о тде g—произвольное фиксированное действительное число. Применяя теорему Фубини и используя условие, наложенное на функцию f, легко усмотреть, что функция <р (которая как и f, принадлежит к Ц (—со, со)) удовлетворяет тому же условию, т. е. ОО <р(х) e~iKxdx = 0 — ОО при всех действительных А. Но, как легко видеть, функция <р абсолютно непрерывна на каждом конечном отрезке и, следо- вательно, почти всюду обладает конечной производной. В част- ности, эта функция почти всюду удовлетворяет условию Дини. Поэтому в силу теоремы 1 § 3 она почти всюду обращается в 0, так как ее преобразование Фурье есть тождественный 0. Но <р непрерывна, так что <р(х)=0. Из этого вытекает, в частности, что при всех действительных £ $ f(t)dt = o о и, следовательно, f (х) = 0 почти всюду. Рассмотрим теперь некоторые примеры. 1. Пусть f (х) = е~у |х!, у > 0. Найдем преобразование Фурье этой функции. Имеец оо оо g(A) = dx — e-v|xl(cosАх — isinАх)dx = — оо —оо оо = 2 е~чх cos Ах dx. о С помощью двукратного интегрирования по частям находим 2V А2 + у2 ‘
426 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ VHF 2. Пусть , , _ ( 1 при |х|<а, ' 0 при |х|>а. Тогда Г г / \ Г .i е1Аа —e-i?‘a 2sinAa g (A) = \ f (x) e lKx dx = \ e~‘Kx dx =-. — oo —a (Следует обратить внимание на то, что функция g здесь не принадлежит —оо.оо)). 3. Пусть f (х) = --xi . Тогда оо sw= <3> — оо Этот интеграл проще всего вычислить с помощью теории выче- тов. Пусть сначала А > 0. Дополнив действительную ось, по ко- торой берется интеграл (3), полуокружностью бесконечно боль- шого радиуса, лежащей в нижней полуплоскости (т. е. в тощ где экспонента е~ах стремится к нулю), получим, что интеграл (3) равен сумме вычетов подынтегральной функции в нижней полуплоскости, умноженной на (—2лг). В нижней полуплоско- е~‘Кх сти функция д2 имеет один полюс первого порядка в точке х = —ai. Вычет в этой точке находится по известной формуле: если = и (p(a)=#0, а ф(г) имеет в точке г = а нуль первого порядка, то вычет функции f в точке а равен . По- этому в нашем случае получаем g(A) = — 2лг-2-q.' = — е~аК при А>0. При А < 0 аналогично (рассматривая только верхнюю полу- плоскость вместо нижней) получаем g(^)=-7^- Таким образом, окончательно g(A) =-^ е-а) Аг| (—оо < А < оо). Впрочем, этот результат можно получить сразу по формуле об- ращения, используя пример 1 и теорему 1 § 3.
§ 41 ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ 427 , 4. Положим /(%) = е~ах’. Имеем оо £(?.)= e~ax’e~iKx dx. (4) — оо Здесь под интегралом стоит аналитическая функция, не имею- щая особенностей в конечной части плоскости и стремящаяся к нулю вдоль каждой прямой, параллельной действительной оси. Поэтому в силу теоремы Коши интеграл (4) не изменит своего значения, если его взять не по действительной оси, а вдоль любой прямой г = х + iy (у = const), параллельной этой оси. Таким образом, g(A,)= е-а(х+№ . e-iX(x+ i^dx=: — со со оо — ^аи2 + 1и j g-ax2-2alxu-ibx у — gW*+Au £-ахг-1х(2ау+К} — CO — 00 Выберем теперь постоянное значение у так, чтобы в показателе подынтегральной экспоненты исчезла мнимая часть, т. е. поло- жим у — —к/(2а). Тогда А»_А» р _ А* .---- g (к) = в 4а* 2а е~ах' dx = e 4а д/ у , — ОО поскольку со е~ах* dx = д/. — оо В частности, если положить а= 1/2, то мы получим f (х) = е~х‘12, g (к) = е-^/2, т. е. функция е~х2/2 переводится преобразованием Фурье сама в себя (с точностью до постоянного множителя). 2. Основные свойства преобразования Фурье. Из формулы {1), определяющей преобразование Фурье, вытекает ряд свойств этого преобразования. Рассмотрим эти свойства. Для сокраще- ния записи будем преобразование Фурье функции f обозначать символом Л[/]. Иначе говоря, мы обозначим через F линейный оператор, определенный на пространстве Lj(—оо, оо) и ставя- щий в соответствие каждой функции из этого пространства ее преобразование Фурье1). ) Вообще говоря, не принадлежащее Li.
428 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VHT 1. Если последовательность {fn} функций из L\(—оо, оо) сходится в метрике пространства Lt(—оо, оо), то последова- тельность их преобразований Фурье gn — ^Ifn] сходится равно- мерно на всей прямой. Это утверждение сразу вытекает из очевидной оценки: СО IgnGQ —JlfnW — fm(x)\dx. — co 2. Преобразование Фурье g абсолютно интегрируемой функ- ции f представляет собой ограниченную непрерывную функцию, которая стремится к нулю при |Z|-> оо. Действительно, ограниченность функции g = /ДЛ сразу вид- на из оценки СО 1я(МК $ \fM\dx. — оо Далее, если f — характеристическая функция интервала (а,Ь)г то для нее ь ----------------0~О.Ь e~lKx dx=-------. a Эта функция, очевидно, непрерывна и стремится к нулю при |Z|-> оо. Так как операция F перехода от f к g линейна, то от- сюда следует, что преобразование Фурье любой ступенчатой функции (т. е. линейной комбинации индикаторов интервалов) есть тоже непрерывная функция, стремящаяся к нулю при Z->±°o. Наконец, ступенчатые функции всюду плотны в L[(—оо, оо), поэтому если f е Lit то существует последователь- ность {fn} ступенчатых функций, сходящаяся к f в Lj(—оо, оо). Тогда в силу свойства 1 последовательность функций gn = /?[/n] сходится равномерно на всей прямой к функции g = F[f]. Но тогда предельная функция g тоже непрерывна и стремится к. нулю при |Z|-> оо. Упражнения. 1. Доказать, что преобразование Фурье g абсолютно- интегрируемой функции f равномерно непрерывно на всей прямой. 2. Пусть В — пространство равномерно непрерывных на (—оо, оо) функ- ций, стремящихся к нулю на бесконечности. Показать, что преобразование- Фурье F есть оператор из Lt(—оо, оо) в В с нормой 1, удовлетворяющий, условию Ker F = 0. 3. Если f абсолютно непрерывна на каждом конечном интер- вале и f'eLi(—оо, оо), то имеет место равенство ЛП = *АЛЯ
ПРЕОБРАЗОВАНИЕ ФУРЬЕ. СВОЙСТВА И ПРИМЕНЕНИЯ 429 § 41 Таким образом, дифференцированию функции (при указанных выше условиях) отвечает умножение ее преобразования Фурье на IX. Действительно, абсолютно непрерывная на каждом конечном интервале функция может быть записана в виде X f(x) = f(O) + о Из абсолютной интегрируемости f' следует, что стоящее здесь справа выражение при х->оо и при х-> — оо имеет предел. Этот предел может быть только нулем, так как иначе функция f не была бы интегрируема на всей прямой. Учитывая это, по- лучаем с помощью интегрирования частям оо f[/'iw= $ f'(х) e~lKx dx — — со со = /(х)е~'М 4-гХ f(x)e~iKxdx = i^F[f](K), 1 — СО •> — оо что и требовалось доказать. Если функция f такова, что абсолютно непрерывна на каждом интервале и f, ..., /<h* е (— оо, оо), то с помощью та- ких же рассуждений получим /?[Г’] = (Л)*Г[/]. (5) 4. Связь между степенью гладкости функции и скоростью убывания на бесконечности ее преобразования Фурье. Разделив равенство (5) на (iX)ft и вспомнив, что преобразование Фурье всегда стремится к нулю на бесконечности (свойство 2), полу- чим, что если f(h~> абсолютно интегрируема, то | F[/=] 1 -»о, т. е. в этих условиях F [f] убывает на бесконечности быстрее, чем 1/|Х|\ Итак, чем больше производных в L\ имеет /, тем быстрее убывает на бесконечности ее преобразование Фурье. 5. Если f" существует и принадлежит L\(— оо, оо ), то F[f] абсолютно интегрируема. Действительно, при указанных условиях F[f] ограничена и убывает на бесконечности быстрее, чем 1/Х2. Отсюда следует интегрируемость. Выше (свойство 4) мы показали, что чем больше производ- ных имеет функция /, тем быстрее убывает на бесконечности ее
430 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIIF преобразование Фурье. Справедливо и двойственное утвержде- ние, а именно, чем быстрее убывает f, тем глаже ее преобразо- вание Фурье. Точнее говоря, верно следующее утверждение:. 6. Пусть как функция f (х), так и xf(x) абсолютно интегри- руемы. Тогда функция g = F[/] дифференцируема и g'(X) = F[-ixf(x)\. [6) Действительно, продифференцировав интеграл ОО f (х) e~iKxdx, — ОО определяющий g, по параметру X, мы получим интеграл оо — i xf (х) e~iKx dx, — оо который (в силу интегрируемости функции х/(х)) сходится рав- номерно по К. Следовательно, производная функция g суще- ствует и имеет место (6). Если f такова, что абсолютно интегрируемы функции f(x), xf(x), ..., xPf(x), то, как показывают аналогичные рассужде- ния, функция g имеет производные до р-ro порядка включитель- но, причем ^>U) = E[(-^f(x)] (% = 0, 1, ..., р). 7. Если потребовать, чтобы функция f убывала на бесконеч- ности еще быстрее, то g будет еще более гладкой функцией. Из предположения, что xpf(х)е —оо, оо) при всех р, вытекает бесконечная дифференцируемость функции g. Допустим теперь, что /(x)ezLi(—оо, оо) при некотором 6 > 0. Тогда g(k) распространяется с действительной оси Л как аналитическая функция в полосу на плоскости £ = + ф комплексного пере- менного, причем ширина этой полосы тем больше, чем больше 6. Во всяком случае можно утверждать, что g будет аналитической функцией при |ц| < 6. Действительно, интеграл оо f(x)e~lx^dx, — оо очевидно, будет сходиться при |ц|< 6 и определять непрерыв- ную функцию, совпадающую с преобразованием Фурье функции f на действительной оси. Тот факт, что эта функция дифферен- цируема при |ц|< 6 в смысле теории аналитических функций, доказывается совершенно так же, как свойство 6.
§ 4] ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ 431 3. Полнота функций Эрмита и Лагерра. Используя сообра- жения, изложенные в предыдущем абзаце, можно показать, что если измеримая функция f почти всюду на интервале (а,Ь), где — оо^а</?^оо, отлична от 0 и удовлетворяет условию |/(х) | Се~6] *1, где 6 > 0, то система функций {хп/(х)}, п — = 0, 1,2,..., полна в L2(a, b). Отсюда, в частности, будет следовать, что функции Эрмита образуют полную систему в L2(—оо, оо), а функции Лагерра — в Z.2(0, оо) (см. п. 7 § 3 гл. VII). Докажем сформулированное утверждение о полноте. Пред- положим, что система {хп/(х)} не полна. Тогда в силу теоремы Хана — Банаха найдется такая ненулевая функция h е L2(— оо, оо), что оо xnf (х) h (х) dx = 0 (n = 0, 1, 2, ...). — оо (Мы использовали теорему об общем виде линейного непрерыв- ного функционала в гильбертовом пространстве; если рассмат- ривается комплексное L2(a, b), то вместо Л(х) надо писать А(х).) Ясно, что fh <= Ща, Ь) и, более того, М 1 х\fh е (а, Ь) при любом 6| < 6. В дальнейшем удобно считать, что f(x) и А(х) определены на всей прямой, продолжая их, если необходи- мо, за (а,Ь) нулем. Пусть g— преобразование Фурье функ- ции fh, т. е. оо g (Л) = f (х) h (х) е~iKx dx. — оо Из сказанного выше следует, что функция g продолжается как аналитическая в полосу |lm£|<6. С другой стороны, в силу свойства 6 все производные этой функции при /. — 0 обращают- ся в 0, так что £(?.) = 0. По свойству единственности, доказан- ному в п. 1, отсюда следует, что f(x)/i(x) = 0 почти всюду и, следовательно, Л(х) = 0 почти всюду, так как f(x) почти всюду отлична от 0. Но это противоречит нашему предположению о том, что h— ненулевая функция. Полученное противоречие и доказывает полноту системы {xnf(x)}. 4. Преобразование Фурье быстро убывающих бесконечно дифференцируемых функций. Пользуясь тем, что при переходе от функции f к ее преобразованию Фурье g свойства гладкости функции и убывания ее на бесконечности меняются ролями, лег- ко указать естественные классы функций, которые переводятся преобразованием Фурье сами в себя. Пусть St» — совокупность бесконечно дифференцируемых функций на прямой, для каждой из которых существует набор
432 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII постоянных Ср, (зависящих от самой функции f и чисел р, q) таких, что |x₽fW(x)|<Cp(?. (7) Покажем, что если f е S^, то и Я = /?[Ле^оо> Прежде всего из (7) следует абсолютная интегрируемость каждой из функций хр/(т)(х). Действительно, поскольку (7) выполняется при всех р и <7, то I xPfto (x)iccp+2„/x2, т. е. функция xpf^(x) убывает не медленнее, чем 1/х2. Отсюда в свою очередь следует, что функция Fjf] имеет производные всех порядков. Наконец, согласно п. 2, из суммируемости /(9)(х), q — I, 2, .... следует что убывает на бесконечности быстрее, чем I/]Х|q. Рассмотрим теперь функции W (Z) = (- /)’ F [(xpf(xn каждая из них, как преобразование Фурье интегрируемой функ- ции, ограничена некоторой постоянной Dpq. Таким образом, если f s Soo, то и g=f[/)ESoo. Обратно, пусть g е Soo, тогда, по до- казанному, функция Г(х) = j g(X)e~iKx dx: — оо ВХОДИТ В Soo. Положим f (X) = 2^Г(— х). Ясно, ЧТО feSoo. В то же время по формуле обращения оо оо gW = ^ S f*(x)eikxdx= f (x)e~iKx dx, — оо —00 т. е. g есть преобразование Фурье функции f е S^. Итак, пре- образование Фурье переводит класс Soo снова в весь класс Soo. Ясно, что это отображение взаимно однозначно. ОО Упражнение. Пусть f е Soo и J хР1 (*) dx = 0 при всех р > 0. Сле- — ОО дует ли отсюда, что f(x) = О? 5. Преобразование Фурье и свертка функций. Пусть fi и /2 — интегрируемые на всей прямой функции. Функция оо f(x)= j
ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ 433 § 4] называется их сверткой. Функция f(x) определена при почти всех х и интегрируема. Действительно, двойной интеграл ОО 00 — 00—00 существует, поскольку существует интеграл оо оо — оо —оо (см. замечание к теореме Фубини, стр. 318). Следовательно, существует и интеграл оо оо оо j f(x)dv= dx f, (g) f2 (x — £) di,. — oo — oo —oo Функция f обозначается символом Вычислим преобразова- ние Фурье свертки двух функций из L\. Применяя теорему Фу- бини и полагая х — | = т], получаем ОО 00-00 \ j (х) e~lKx dx — U \ f^h(x-№\e-^dx== — 00 —оо \ — оо 7 оо - оо «. = МЕЧ f2(x-i,)e-tKxdx\di,= — оо — оо ) ОО f оо = Мъ)| $ dl = — 00 Ч —00 ) по ОО = 5 e-iK"dT\ — 00 — -X-I т. е. nf:*f2] = /4fiW2]. Итак, преобразование Фурье переводит операцию свертки в бо- лее простую операцию — умножение функций. Этот факт играет важную роль во многих применениях преобразования Фурье. 6. Применение преобразования Фурье к решению уравнения теплопроводности. Применение преобразования Фурье к диф- ференциальным уравнениям основано на том (см. п. 3), что оно переводит операцию дифференцирования в операцию умноже- ния на независимое переменное. Следовательно, если у нас
434 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIIT имеется линейное дифференциальное уравнение с постоянными коэффициентами у^ + а1у^~^+ ... +ап-}у' + any = q>(x), (8) то преобразование Фурье переводит его в алгебраическое уравнение вида (iA.) z ctj (iA,) z ... tzn_]iA,z ctnz = ф (А,), (9} где z= F[у] и ф = Т7[ф]. Однако для обыкновенных дифферен- циальных уравнений этот прием не открывает каких-либо суще- ственно новых перспектив, так как решение линейных уравнений с постоянными коэффициентами и без того не представляет больших трудностей. Кроме того, переход от (8) к (9) возможен, если неизвестная функция у = у(х) интегрируема на всей пря- мой, а для решений линейных уравнений с постоянными коэф- фициентами это, вообще говоря, не имеет места. Более существенно применение преобразования Фурье к уравнениям с частными производными, где оно позволяет, при определенных условиях, свести решение такого уравнения к ре- шению обыкновенного дифференциального уравнения. Покажем это на примере решения задачи Коши для уравнения теплопро- водности. Будем искать решение уравнения (ю) dt дх2 v 1 при — оо < х < оо и t 0, обращающееся при t = 0 в задан- ную функцию и0(х). Физический смысл этой задачи состоит в нахождении температуры бесконечного теплопроводящего стерж- ня в любой момент времени t > 0, если в начальный момент t = 0 его температура в каждой точке есть и0(х). Предположив, что и0(х), и'0(х) и и'о(х) принадлежат L](—оо, оо), будем искать решение поставленной задачи в классе функций и(х, t), удовлетворяющих следующим усло- виям: 1) функции и(х, /), их(х, /), ихх(х, t) абсолютно интегрируе- мы по всей оси х при любом фиксированном t 0; 2) функция ut (x, t) имеет в каждом конечном интервале 0 t Т интегрируемую мажоранту f(x) (не зависящую от /): оо I Щ (х, t) | f (%), f (х) dx < оо. — оо Выполним в уравнении (10) преобразование Фурье по х. При этом справа мы получим К [ихх (х, /)] = — А,2о (А,, /), где v (A,, t) = F [и (х, /)],
§ 4] ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ 435 а слева в силу условия 2) имеем оо оо F\ut\ = и*^х’ е~‘Кх dx==~dT 5 и(х’ f)e~iKx dx = vt(K, t). — оо — оо Таким образом, преобразование Фурье переводит уравнение '(10) в обыкновенное дифференциальное уравнение Vt (Л, /) = — /-2v (Л, /), для которого нам теперь нужно найти решение, обращающееся при t = 0 в функцию оо Оо (Л) = F [«о (х)] = иа(х) e~iKxdx. Таким решением будет, очевидно, о(Д., t) = е~х‘(и0(Л.). Теперь для того чтобы получить решение нашей первоначаль- ной задачи, остается найти ту функцию и(х, t), преобразованием Фурье которой служит функция о (Л, /). Используя пример 4 п. 1, получаем g-АИ Р Поэтому т. е. и (х, t) С V Мы получили так называемый интеграл Пуассона для решения уравнения теплопроводности. 7. Преобразование Фурье функций нескольких переменных. Преобразование Фурье, рассмотренное нами для функций одной переменной, легко переносится на функции нескольких пере- менных. Пусть f(xi, х2, хп) — функция, интегрируемая по все- му n-мерному пространству Rn. Ее преобразованием Фурье
436 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ (ГЛ VIH называется функция g(Xb Л2, ..., Л„) = оо со = J ••• $ Н*ьХ2, ...,х„)е-‘^>+^+-+хЛ)^1 ... dxn. — GO — ОО Этот n-кратный интеграл, заведомо существующий, посколь- ку f(%i, х2, • ••, хп) интегрируема, можно записать, по теореме Фубини, в виде следующего повторного интеграла: ё (Ч ^2, • • •> — ОО f оо f ОО ч = j < • • • j I $ f (Xi, x2, ..., xn) e~ix^ dxt I X — oo \ — oo V, —co J X e~lx,K,dx2 ... } e~ix^ dxn. (11) Иначе говоря, можно перейти от функции п переменных к ее преобразованию Фурье, последовательно выполняя преобразова- ния по каждой из переменных в отдельности (в любом поряд- ке). Обращая последовательно каждую из п операций в правой части равенства (11), получим формулу ПОО У ОО *’* S | J ^(^1> ^2’ • • • ’ X — оо *• —оо X е‘Хп>'п dkn } rfA,„_1 ... } eix'K'd^. Ее можно переписать в виде n-кратного интеграла f (Х(, х2.х„) = оо оо = -72^ V - ё^Ъ,-, кп)е‘^+х^+- +x^dK{...dKn^) J J — oo — oo однако, поскольку функция g(X|, Хг, . • •, Xn), вообще говоря, не обязана быть суммируемой по всему Rn, нужно указать, в ка- ком смысле следует понимать этот интеграл и те условия на f(xh %2.....хп), при которых она представляется интегра- лом (12). Один из возможных ответов на эти вопросы дает следующая теорема.
ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ 437 Теорема 1. Пусть функция f(хь х2, хп) интегрируема по всему пространству Rn и удовлетворяет условиям: | f(Xi 4-/1, х2.Xn)—f(xb х2, I f (х1, х2 + ^2, • • •, xn) f (Х1> Х2> х„)|<С|Л г, С(х,)|/2Г, I f (Х11 х2> • • • > хп + tn) f (-^1, х2> • • • 1 хп) I <С(ХЬХ2, •••• *n-l)l tn Г, где оо оо О «С а 1, \ С (х,) dxx < оо, ..., \ ... (13) С (хь х2, ..., хп-{) dx} dx2 ... dxn_{ < оо, Тогда формула обращения (12) справедлива, если интеграл в ней понимать как 1 (2л)" \-1 »п lim \ lim \ g(Z,b Л2, Л„) X Xeix^ dXn] e(x»~^~i d^i ... jeix^d^. Действительно, поскольку f(xi,x2, ..., xn) суммируема в Rn, то в силу теоремы Фубини она суммируема по Х\ при почти всех х2, . .., хп. Следовательно, существует функция оо Л(Л1,х2, .... х„) = f(xlt х2, . .., хп) e~ix,K> dxt. Из (13) следует, что f(xlt х2, , хп) как функция от xt удовле- творяет условию теоремы 1 § 3; поэтому f(xb х2, . . . , хп) можно выразить через fi по формуле обращения A'i ЦХ1,Х.2, хп)== lim \ Л(ЛЬ х2, . Nl~^OO Z31 J xn)eix^ d)^. Далее, если мы положим оо f2 (Л1, Х21 х3, ..., хп) = ft (Ль х2, ..., хп) е-‘х^ dx2, — ОО
438 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VHI то из условия (13) следует, что для /4 справедлива формула об- ращения А. •••, *п) = lim J- \ f 2(^1, ^2, •••, xn) eix^> d^, 2n Л т. e. /(xb x2, xn) = A'l / x = Hm 1 lim \ f2(Kb Л2....................xn)etx^‘ dbA elx‘x'dkt. N,->oo J I M2->oo J I — Nl 4 — Ab ' Определив аналогичным образом Л2, Хз .. ., xn) и т. д., мы и придем к формуле (12). Преобразование Фурье функций нескольких переменных ши- роко используется в теории уравнений с частными производны- ми. Рассмотрим, например, уравнение ди д2и , д2и ,.лх ~дГ “ ~дхг "1" dp' ’ I14' описывающее процесс распространения тепла в плоскости. Пусть в момент t = 0 температура задана: и (0, х, у) = и0{х, у). Наложив на искомое решение уравнения (14) условия, анало- гичные тем, которые указаны в п. 6, мы можем сделать в урав- нении (14) преобразование Фурье по переменным х и у. В ре- зультате получим обыкновенное уравнение -^ = -(^2 + а2)щ (15) где оо оо v(t, X, о-)== u(t, х, y)e~l ax+<wdx dy. — 00 —00 Решив уравнение (15), можно затем найти решение исход- ного уравнения (14) с помощью формулы обращения. § 5. Преобразование Фурье в пространстве L2(—00, 00) 1. Теорема Планшереля. Вернемся сначала к тем результа- там, которые мы получили для рядов Фурье. Для большей ана- логии с преобразованием Фурье будем рассматривать ряд Фурье в комплексной форме, т. е. возьмем на отрезке [—л, л] полную ортогональную систему функций е’пх, п — 0, ±1, ±2, ... и ка-
§ 5] ПРЕОБРАЗОВАНИЕ ФУРЬЕ В ПРОСТРАНСТВЕ Ь2(—«>, «>) 439 ждой суммируемой на отрезке [—л, л] функции f мы поставим в соответствие последовательность ее коэффициентов Фурье Л сп = -^ S fWe-inxdx (« = °- ± h ±2> •••)• -Л Если функция f не только суммируема, но и имеет суммируе- мый квадрат, то ее коэффициенты Фурье удовлетворяют усло- вию оо £ I Сп I2 < оо. Л= —ОО Иначе говоря, переход от суммируемой с квадратом функции к совокупности ее коэффициентов Фурье есть отображение евкли- дова пространства L2 на евклидово пространство /2, причем это отображение линейно и удовлетворяет равенству Парсеваля оо Л 2л £ |с„Р= J I f(x)\2dx (1) п=— ОО —л (т. е. этот переход отличается лишь числовым множителем от преобразования, сохраняющего норму). Обратимся теперь к преобразованию Фурье для функций, заданных на всей прямой, и посмотрим, нельзя ли это преобра- зование трактовать как некоторый линейный оператор в ком- плексном пространстве L2(—оо, °°). Основная трудность со- стоит здесь в том, что функция с интегрируемым квадратом на прямой не обязана принадлежать ЬД—оо, оо), т. е. преобразо- вание Фурье в смысле, определенном в § 4, может для нее и не существовать. Однако для всякой f е L2(— оо, оо) можно опре- делить преобразование Фурье в несколько ином смысле. При этом получается следующая теорема, которую можно рассмат- ривать как аналог равенства Парсеваля (1). Теорема (Планшерель, 1910 г.). Для всякой функции f е L2(— оо, оо) интеграл N = J f(x)e~iKxdx — N при любом N представляет собой функцию от Л, принадлежа- щую к L2(— оо, оо). При N -> оо функции gN сходятся в метри- ке пространства Ь2 к некоторому пределу g, причем оо оо 5 I gW 2л I f (x) \2dx. (2)
440 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII Эту функцию g называют преобразованием Фурье функции f е £2. Если f принадлежит также и к — оо, оо), то соответ- ствующая функция g совпадает с преобразованием Фурье функ- ции f в обычном смысле. Доказательство. Основная идея доказательства состоит в том, что равенство (2) устанавливается сперва для всех функ- ций, принадлежащих классу S» бесконечно дифференцируемых быстро убывающих функций, которые всюду плотны в L2(—°0. °0), а потом распространяется по непрерывности на все£2(— оо, оо). Реализуем теперь эту идею в деталях. 1) Пусть fi, f2 е Soo. Обозначим через gi и g2 соответственно их преобразование Фурье. Имеем оо оо оо $ fi(x)f2(x)dt = J i J = — оо — оо — оо 1 2л gl (А) §2 (А) причем изменение порядка интегрирования здесь законно, по- скольку функция g\ (А) /Дх) eiKx абсолютно интегрируема в плоскости (х, А). Положив в получен- ном равенстве f । = f2 = f и gi = gi = g, получим, что формула (2) верна для любой функции f е SM. 2) Пусть теперь f — произвольная функция из L2(—оо, оо), обращающаяся в нуль вне некоторого интервала (—а, а). Тогда f интегрируема на интервале (—а, а) (т. е. принадлежит L](—ct, а)), а следовательно, и на всей прямой. Поэтому для нее определено преобразование Фурье оо g(X) = f (х)е~‘Кх dx. — оо Пусть теперь {fn} — последовательность функций из SM, обра- щающихся в нуль вне (—а, а), и сходящаяся по норме про- странства L2(—оо, оо) к f. Поскольку f и все fn отличны от нуля лишь на конечном интервале, последовательность {fn} схо- дится к f и по норме пространства Li(—оо, оо). Поэтому (см. п. 2 § 4) последовательность {gn} сходится к g равномерно на всей прямой. Кроме того, последовательность {gn} фундамен-
$ 5] ПРЕОБРАЗОВАНИЕ ФУРЬЕ В ПРОСТРАНСТВЕ Ь2(—°о, оо) 44) талька в Л2(—°°> оо). Действительно gn— gm^S№, поэтому в силу уже доказанного 5 — gmW = \fn(x) — fm(x)?dx, — оо —оо откуда и следует фундаментальность последовательности {§«}. Значит, эта последовательность сходится в L2, причем к той же самой функции g, к которой она сходится равномерно. Поэтому в равенстве Ш12=-^1Ш2 можно перейти к пределу при п->оо. Таким образом, получаем, что равенство (2) справедливо для каждой f е L2, обращающей- ся в нуль вне некоторого интервала. 3) Пусть, наконец, / — произвольная функция из L2. Поло- жим f при | х 'n(x>— ( 0 при |х|>ЛГ. Ясно, что Ilf —при Af—^oo. Функция fjt принадлежит —оо, оо), следовательно, для нее существует обычное преобразование Фурье. Оно равно со N = 5 fN(x)e-iUdx= f (х) e~iKx dx. — ОО — N Поскольку в силу пункта 2) наших рассуждений II f N — f М li2 = II Sn — ём II2> функции gN сходятся в L2 к некоторому пределу, который мы обозначим g. Поэтому в равенстве Il fN н2=^k.v li2 можно перейти к пределу при Af->oo, откуда получаем соотно- шение (2) для произвольной f е L2(— оо, оо). Первая часть тео- ремы Планшереля доказана. Если теперь функция f принадлежит как Л2(— оо, оо), так и —оо, оо), то для нее существует преобразование Фурье g(A) = f (х) е~Лх dx,
442 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII понимаемое в обычном смысле. При этом функции f.v сходятся к f в А](—оо, оо) и, значит, их преобразования Фурье gN схо- дятся к g равномерно. Но, кроме того, как мы установили, функ- ции gN сходятся в метрике Ь2(—оо, оо) к некоторому пределу, который мы обозначили g. Отсюда следует, что g совпадает с g. Доказательство закончено. Следствие. Из соотношения (2) сразу вытекает, что для любых fi, f2 е L2(— оо, оо) выполнено равенство оо оо $ fl W ТМ dx = J gj (A) g2(A) dk. — оо —оо Для доказательства достаточно написать равенство (2) для функции fi-f-fi и затем сравнить выражения справа и слева. Если равенство (2) означает сохранение нормы в Ь2 при преоб- разовании Фурье, то последнее равенство означает сохранение скалярного произведения. 2. Функции Эрмита. Теорема Планшереля, изложенная в пре- дыдущем пункте, означает, что преобразование Фурье можно рассматривать как ограниченный линейный оператор F, отобра- жающий пространство L2(—оо, оо) на себя. Если в этом про- странстве выбрать какую-либо полную ортогональную нормиро- ванную систему, то оператор F (как и любой другой линейный оператор) можно записать с помощью бесконечной матрицы. Вид этой матрицы зависит, конечно, от выбора базиса. Проще всего матрица, отвечающая тому или иному оператору, выгля- дит в том случае, когда соответствующий базис состоит из соб- ственных функций данного оператора: в этом случае матрица имеет диагональную форму. Посмотрим, существует ли такой базис для преобразования Фурье Г? Иначе говоря, посмотрим, какие функции из Л2(— °°, оо) являются собственными для пре- образования Фурье Ё? Для этой цели заметим, что уравнение 7?-^ = ^ (3) переводится преобразованием Фурье в такое же уравнение1) ^поскольку операция переходит в умножение на —А2, а умножение на —х2 — в операцию . Поэтому естественно искать собственные функции оператора F как решения уравне- ния (3). Будем искать решения этого уравнения, имеющие вид f = we~x2/2, ') Предполагается, конечно, что неизвестная функция f удовлетворяет соответствующим условиям гладкости и убывания на бесконечности.
§ 5] ПРЕОБРАЗОВАНИЕ ФУРЬЕ В ПРОСТРАНСТВЕ Lj(-oo, оо) 443 где w — многочлен. Подставив это выражение в (3), получим для w уравнение w" — 2xw' = (р + 1) w. Полагая w = а0 + сцх + ... + апхп, (4) получаем равенство (2а2 + 3 • 2 • а3х 4- ... 4- п (п — 1) апхп~2) — — 2х(а1+2а2х+ ... +nanxn~v) = — (н + 1) («о 4- а\х 4- ••• 4" апхп). Сравнивая в нем коэффициенты при одинаковых степенях х сле- ва и справа, находим, что — 2па„==(р4- 1)а„, —2(п— 1)а„_, = (ц + 1)ап_,, и т. д., вообще, k(k— \)ак — 2{k — 2)аЛ_2 = (ц4- 1)аА-2. (5) Поскольку мы считаем старший коэффициент ап отличным от нуля, должно быть ц = — (2п4-1) и а„_! = 0, т. е. ц должно быть нечетным целым отрицательным числом. Все коэффициенты многочлена w определяются соотношением (5) с точностью до постоянного множителя. При этом те коэф- фициенты, четность индекса которых отлична от четности числа п, т. е. степени многочлена w, равны нулю. Наоборот, все коэф- фициенты с индексами, имеющими ту же четность, что и п, от- личны от нуля. Они находятся по рекуррентной формуле йк~2 “ 2k — 2п — 4 йк (если значение ап задано). Таким образом, мы получаем фор- мулу ДЛЯ W. («) -«,(?- *-’ + Л»-.)(«-2) _ у Итак, мы построили систему функций вида <р„ (х) = wn (х) е-*1'2 (п = 0, 1,2, ...). Ясно, что каждая из этих функций принадлежит Л2(—оо, оо) (благодаря наличию множителя е~х2/2). Вдобавок, эти функции попарно ортогональны. Действительно, согласно (3) имеем ф" (х) — х2уп (х) = — (2п 4- 1) фп(х), <р" (х) - х2ут (х) = - (2m 4- 1) <рт (х).
444 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ (ГЛ. VIII Умножив первое из этих равенств на <рт, а второе — на <рп и вы- читая из одного равенства другое, получаем Ф„ФТО - фХ = 2 (т - п) фпфт или [ф„Фт - ФМ' = 2 (/П - П) ф„фт. Если п =£ т, то, интегрируя это равенство, получаем оо со J Фп^ФтМ^^-гСт-л)' J [фХ-фтФп]'^ = — оо —оо 2 (т — п) [ф«Фт Ф/пФп]_оо Таким образом, ортогональность доказана. Каждый из элементов фп полученной ортогональной системы представляет собой многочлен степени п, умноженный на е~х’12. Следовательно, ее элементы должны, с точностью до числовых множителей, совпадать с функциями Эрмита, которые мы по- строили в § 3 гл. VII ортогонализацией последовательности е~х’/2, хё~х’12, ..., xnc~x’l2t ... в пространстве Л2(— оо, оо). Покажем теперь, что функции {фп} являются собственными функциями преобразования Фурье: F<Pn = с„фп. (6) Это вытекает из следующих фактов. 1. Уравнение (3) инвариантно относительно преобразова- ния F. 2. Уравнение (3) при каждом п имеет, с точностью до по- стоянного множителя, лишь одно решение вида Рп(х)е~х'/2, где Рп — многочлен степени п. (d \п / ~dx) е~Х'12~ = Qn (х)е~х’/2, где Qn — многочлен степени п (последнее утвер- ждение легко проверяется по индукции). Из равенства (6) следует, что при каждом целом k Fkq> = ска> . Но преобразование Фурье, примененное четырежды, переводит каждую функцию в себя, умноженную на 4л2. Поэтому с\ — 4л2, т. е. сп может принимать лишь значения ± V 2л и ± i V 2л.
5 6J ПРЕОБРАЗОВАНИЕ ЛАПЛАСА 445 Итак, преобразование Фурье F в пространстве Ь2(— оо, оо) есть линейный оператор, который в базисе, состоящем из функ- ций Эрмита, записывается как диагональная матрица с элемен- тами вида Эгл/ 2л и ± i -у/ 2л '). § 6. Преобразование Лапласа 1. Определение и основные свойства преобразования Лап- ласа. Применимость преобразования Фурье к дифференциаль- ным уравнениям существенно ограничивается тем, что это пре- образование определено лишь для функций, суммируемых на всей прямой. В частности, преобразование Фурье не существует для функций, растущих при х->— оо или х->оо, а такие функ- ции нередко возникают при решении дифференциальных урав- нений. Эту трудность можно преодолеть, распространив преоб- разование Фурье на обобщенные функции; об этом пути мы ска- жем кратко в § 8 этой главы. Другой возможный подход, не выводящий за рамки классического понятия функции и класси- ческих методов анализа, состоит в замене преобразования Фурье так называемым преобразованием Лапласа. Пусть функция f (вообще говоря, не интегрируемая на всей прямой) становится интегрируемой, если ее умножить на е~^х, где у — некоторое действительное число. Тогда интеграл оо оо g(s)= f(x)e~isxdx — f (x)e~ixKexv-dx — оо — оо оказывается сходящимся для некоторых комплексных s = = X + ip, в частности, он сходится на прямой р = —у. На этой прямой он служит преобразованием Фурье функции f(x)e~vx. Наиболее важный для приложений случай, в котором наши предположения об интегрируемости функции f(x)e~vx выполне- ны, — это тот, когда f удовлетворяет следующим условиям: I f (х) | < Cev,x при х > 0, j f(x) = O при х<0 J *) Если преобразование Фурье определить формулой F Ш = ~7= \ f(x)e~lKxdx -у 2л J (т. е. формулой (Г) § 4, а не формулой (1)), то его четвертая степень будет единичным оператором, и в базисе, состоящем из функций Эрмита, мы полу- чаем для F диагональную матрицу с элементами ±1 и ±i.
446 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VHF (уо и С — постоянные). Интеграл со со g(s) — j f (x)e~isx dx = f (х) e~isxdx —со О (2> существует при всех s = \ 4- ip, таких, что ц < —уо, т. е. в по- луплоскости, ограниченной прямой Im s =—у0, и представляет собой преобразование Фурье функции f(x)e^. Эта последняя может быть получена из g с помощью формулы обращения (мы считаем, что f удовлетворяет условиям, при которых эта фор- мула применима) оо f (х) g (S) eikx откуда /Ц + оо = 5 g(s)eisxds (s = A,-Hp). (3> /ц —OO Поскольку функция f(x)e^x при p <—уо убывает как экспо- нента (в силу (1)), ее преобразование Фурье g, а значит, и g(s)eisx, есть функция, аналитическая в полуплоскости Im s < —Ао. Сделаем теперь в формулах (2) и (3) замену переменных, положив р = is и обозначив g(s) через Ф(р). Получим со Ф (р) = f (х) e~?x dx (2') о и —ц+ico — ц + i’oo = i $ ®(p)epxdp. (3'> — Ц—JOO — Ц — /co Функция Ф определена и аналитична в полуплоскости Re р > уо; она называется преобразованием Лапласа функции f (удовлетворяющей условиям (!)) Преобразование Лапласа по своим свойствам мало отличает- ся от преобразования Фурье. Однако класс функций, для кото- рых определено преобразование Лапласа, существенно отличен от класса — оо, оо) функций, для которых существует преоб- разование Фурье. 2. Применение преобразования Лапласа к решению диф- ференциальных уравнений (операторный метод). Преобразова- ние Лапласа можно применить для отыскания решений диффе-
$ 6] ПРЕОБРАЗОВАНИЕ ЛАПЛАСА 447 ренциальных уравнений. Пусть дано линейное дифференциаль- ное уравнение с постоянными коэффициентами Ум _|_ a1£/<«-0 + ... + апу = b (х), (4) и пусть ищется его решение, удовлетворяющее начальным усло- виям Z/(O) = «/o, у' (0) = = (5) Применим к уравнению (4) преобразование Лапласа1), т. е. умножим его на е~Рх и проинтегрируем от 0 до оо. Пусть ОО Y (р) = jj у (х) е~рх dx о — преобразование Лапласа функции у. Интегрируя по частям, мы найдем преобразование Лапласа производной у': оо оо § у' (х) е~рХ dx = у (х) е-Р* |q + р $ у (х) е~Рх dx = рУ (р) — у0. о о Применяя эту формулу последовательно, найдем оо 5 yw>(x)e-Pxdx=p(pn-vY (р) — уп-2 — руп-3— ... — р"~2Ро) —= С п-1 = pnY (р) — yn~i — руп-2 — ... — рп~{у0 = pnY (р) — £ рп~'~кук- Пусть, наконец, оо В(р)= b(x)e~Px dx. о В итоге преобразование Лапласа переводит дифференциальное уравнение (4) [с учетом начальных условий (5)] в алгебраиче- ское уравнение Q(p) + J?(p)y(p) = B(p), где В — преобразование Лапласа функции b, Q — многочлен от р степени п — 1, зависящий от коэффициентов уравнения и от начальных данных. Наконец, Я = S an-kpk, а0 = 1 &=о —характеристический многочлен уравнения (4). ’) Нетрудно показать законность его применения к уравнению (4), если |&(х) | растет не слишком быстро.
448 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ VIII Из полученного уравнения находим Y(p) __ В (р) — Q (р) Й(Р) Решение у получается отсюда по формуле обращения и (х) = — ( В ~ Q ерх do у[Х> 2л» J R(p) е ар' — Ц — i со Этот интеграл обычно вычисляется с помощью вычетов. Для решения линейных дифференциальных уравнений с по- стоянными коэффициентами известен так называемый опера- торный метод. Он состоит в том, что в таком уравнении yw + 4- ... 4- апу = b (х) левая часть рассматривается как результат применения к неиз- вестной функции у оператора .( d \ dn . dn~' . . 4 (—) = —- 4- Я1 „.г 4- • • • 4- ап, (6) X dx J dxn dx‘ а решение уравнения — как применение к его правой части урав- нения оператора, обратного к оператору (6). Результат приме- нения такого оператора к некоторым простейшим функциям — тригонометрическим, показательным, степенным и их комбина- циям— нетрудно найти с помощью непосредственных вычисле- ний. Это дает возможность автоматически выписывать решение линейного уравнения с постоянными коэффициентами, если его правая часть представляет собой комбинации таких функций. Ясно, что операторный метод можно истолковать как приме- нение в неявной форме преобразования Лапласа (устанавли- вающего определенное соответствие между алгеброй дифферен- циальных операторов вида (6) и алгеброй многочленов), что как раз и можно рассматривать как обоснование этого метода, часто фигурирующего в технической литературе в виде некоторого «рецепта». § 7. Преобразование Фурье — Стилтьеса 1. Определение немея снова к АД— оо, оо); преобразования Фурье — Стилтьеса. Вер- преобразованию Фурье в пространстве ОО g(X)= J e~lKxf(x)dx. — оо
ПРЕОБРАЗОВАНИЕ ФУРЬЕ - СТИЛТЬЕСА 419 Эту формулу можно переписать в виде интеграла РиманА— Стилтьеса оо g(A) = j e~axdF(x), (1) — оо где X F(x) = j (2) — оо — абсолютно непрерывная функция с ограниченным изменением / 00 \ на всей числовой оси I равным j | f (х) | dx 1. Однако 'равенство X —ОО S (1) имеет смысл не только для функций вида (2), но и для лю- бых функций с ограниченным изменением на всей прямой. Ин- теграл оо g(A) = j e~iKx dF (х), — оо где F—произвольная функция с ограниченным изменением на прямой, мы будем называть преобразованием Фурье — Стилтье- са функции F. Для преобразования Фурье — Стилтьеса сохра- няется ряд свойств, установленных нами ранее для обычного преобразования Фурье, например, следующее: функция g, опре- деленная интегралом (1), непрерывна и ограничена на всей прямой. Действительно, |g(*i)-g(W< N | e~lK'x — e~iKiX \dF(x) + | e~iK'x — e~iK,x\dF (х). — N 1 AC! > AT Второе слагаемое справа можно сделать сколь угодно малым (сразу при любых X,i и АД, взяв N достаточно большим, а пер- вое при фиксированном N стремится к нулю при А| — Аг->0. Однако не все свойства преобразования Фурье переносятся на преобразование Фурье — Стилтьеса. Так, оно не стремится, вообще говоря, к нулю при |А|->о°. Пусть, например, (О при х^О, F(X)=1 1 при х > 0. Тогда оо g(A) = e~iKxdF(x)= 1.
450 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII Аналогично, преобразование Фурье — Стилтьеса функции, рав- ной 0 при х'о и 1 при х > х0, есть е1хЛ, т. е. периодическая функция от X. Если F — функция скачков, для которой точки п = 0, ±1, ± 2, ... служат точками разрыва, а числа . .., а—!, а0, а{.ап, ... (где £| ап | < , \ п ' — величинами скачков в этих точках, то оо e~lKx dF (х) = ane~inK — оо п есть периодическая функция с периодом 2л. Если же F имеет скачки ап в точках хп, образующих произвольную последова- тельность чисел (вообще говоря, несоизмеримых), то ее преоб- разование Фурье — Стилтьеса имеет вид п Функции такого типа относятся к так называемым почти перио- дическим функциям. 2. Применения преобразования Фурье — Стилтьеса в теории вероятностей. Для суммируемых на (—оо, оо) функций мы ввели в § 4 понятие свертки: оо f(x) = fi*f2(x)= J Г,(х-1)?2(1)^=. (3) — оо Положим X оо X F(x)= J f(f)dt, F1(x)== J fi(t)dt и F2(x)= J f2(f)dt. — ОО —ОО —00 Проинтегрировав равенство (3), перепишем его следующим об- разом: X X оо Е(х) = J f(t)dt = J dt J — 00 —oo —oo oo / X OO = u $ м/-^ф2а)^= J F^x-^dF^) — 00 '4 —00 ' —oo (изменение порядка интегрирования здесь возможно в силу теоремы Фубини и абсолютной интегрируемости функции f).
§ 7] ПРЕОБРАЗОВАНИЕ ФУРЬЕ - СТИЛТЬЕСА 451 Полученное нами соотношение оо F(x) = $ F,(x-£)dF2Q) — оо сопоставляет функциям Fi и F2 функцию F. Но интеграл, стоя- щий здесь справа, существует как интеграл Лебега — Стилтьеса не только для абсолютно непрерывных функций, но и для лю- бых двух функций с ограниченным изменением на всей прямой. Назовем выражение F(x) = j F{(x-$dF2(l), — оо (4) где Fi и F2— произвольные функции с ограниченным измене- нием на прямой, сверткой этих двух функций и обозначим его F}*F2. Покажем, что выражение (4) представляет собой функ- цию, определенную при всех значениях х и имеющую ограни- ченное изменение на всей прямой ’). Действительно, F]— функция с ограниченным изменением, следовательно, она измерима по Борелю, а потому интеграл (4) существует при всех х. Далее, | F(x,) — F (х2) | = оо < $ I F, (х - £) - Fj (х2 - £) | d (var F2 (£)), — оо откуда V [F]< V [FJ V [F2], t. e. F — функция с ограниченным изменением. Теорема 1. Если F есть свертка функций с ограниченным изменением Fi и F2, a g, g\ и g2 — их преобразования Фурье — Стилтьеса, то g(b)=gi (Mg2 W- Доказательство. Пусть F — FpF2 и а = х0, х1; ..., х„ — b ’) В книге В. И. Гливенко «Интеграл Стилтьеса»,’Гостехиздат, 1936, дана элементарная конструкция, позволяющая придать смысл формуле (4) без использования меры,
452 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ VIII — некоторое разбиение отрезка [а, 6]. Тогда при каждом X Ь п {e~iKxdF(x) — lim У e-'^(F(xA)-F(xA_,)) = j max Дхь->0 a ft=i OO n = *!m J E ^‘К(Хк^НРАхк-1)-РАхк-1-1))е-‘кЧр2щ max Дхь->0 J * —oo fe=I t. e. b oo z d —£ \ ^e~lKxdF(x) = H j e~lKxdFi (x) k-,lEdF2(|). a —oo > a —g ' Переходя здесь к пределу при а -> —оо и b -> оо, получаем оо оо оо j e~iKxdF(x) = j e~lKxdFt(x) j e-iKidF2(&, — oo —oo — oo t. e. g (A.)= gi (A) g? (a.)- Теорема о том, что преобразование Фурье — Стилтьеса пере- водит свертку функций в умножение, широко используется в тео- рии вероятностей (метод характеристических функ- ций). Если £ и т] — две независимые случайные величины, a Ft и F2— их функции распределения, то величине В + Л отвечает функция распределения F = F{ * F2. Необходимость рассматривать суммы независимых случай- ных слагаемых возникает в теории вероятностей очень часто. Переход от функций распределения к их преобразованиям Фурье — Стилтьеса, — так называемым характеристическим функциям, — позволяет заменить операцию свертки более про- стой и удобной операцией умножения. Упражнения 1. Доказать, что преобразование Фурье — Стилтьеса обладает свойством единственности: если функция F непрерывна слева, а ее преобразование Фурье — Стилтьеса есть тождественный нуль, то F(x) = = const. 2. Доказать, что операция свертки функций с ограниченным изменением коммутативна и ассоциативна. § 8. Преобразование Фурье обобщенных функций Мы уже говорили, что применение преобразования Фурье, понимаемого в .обычном смысле, в дифференциальных уравне- ниях и других вопросах сильно ограничивается тем, что это пре- образование определено лишь для функций, абсолютно интегри-
ПРЕОБРАЗОВАНИЕ ФУРЬЕ ОБОБЩЕННЫХ ФУНКЦИЙ 453 ? 8] руемых на всей прямой. Применимость преобразования Фурье можно существенно расширить, введя понятие преобразования Фурье для обобщенных функций. Изложим основные идеи та- кого построения. Рассмотрим снова пространство S^ функций, бесконечно дифференцируемых на всей прямой и убывающих на бесконеч- ности вместе со своими производными быстрее, чем любая сте- пень 1/|х| (см. § 4, гл. IV). Приняв Soo за пространство основных функций, рассмот- рим соответствующее пространство обобщенных функцийSi. Определим теперь в пространстве Si преобразование Фурье. Для этого вспомним прежде всего, что пространство Soo перево- дится преобразованием Фурье (понимаемым в обычном смысле) в себя: если ф е S^, то F [ф] е S^, причем F есть взаимно одно- значное отображение Soo снова на все Soo. Исходя из этого, вве- дем следующее определение. Преобразованием Фурье обобщен- ной функции f е= Si называется линейный функционал g е Si, определяемый формулой (g, ф) = 2л ([, ср), где ф = /Дф]. (1) Эту формулу можно переписать и так: (Ff, ф) = 2л(/, ф) = 2л(/, F-'ф). т. е. преобразование Фурье функционала f е Si есть функцио- нал, который на каждом элементе ф е Soo принимает значение, равное (умноженному на 2л) значению исходного функционала f на элементе ф = Д_|ф, где F~l—обратное преобразование Фурье. Поскольку ф = /?[ф] пробегает все Soo, когда ф пробегает Soo, равенство (1) действительно определяет функционал на всем Soo. Линейность и непрерывность этого функционала проверяют- ся непосредственно. Среди элементов Si содержатся все абсолютно интегрируе- мые функции. Для них только что сформулированное определе- ние преобразования Фурье совпадает с обычным. Действитель- но, если f е 3°°, ср е S^, g = F[f] и ф = F[ф], то по теореме Планшереля получаем 2л (f, ф) = (g, ф), (2) причем, при заданной f существует лишь одна, с точностью до эквивалентности, функция g, удовлетворяющая этому равенству при всех ф е 5те. С помощью соответствующего предельного пе- рехода нетрудно показать, что равенство (2) имеет место и для любой feL|(—оо, оо). Таким образом, преобразование Фурье обобщенных функций представляет собой распространение клас- сического преобразования на более широкий класс объектов.
454 ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. V1TT Примеры. 1. Пусть f(x) = с = const. Тогда со 2n(f, ф) = 2л сер (х) dx = 2лсф (0) (ф = F [ф]), — оо т. е. преобразование Фурье константы равно этой константе, умноженной на 2л и на 6-функцию. 2. Пусть f(x) = eiax. Тогда оо 2л(/,ф) = 2л е~‘ал:ф(х)</х = 2лф(—а), — оо т. е. преобразование Фурье функции е'ах есть сдвинутая 6-функ- ция 6(х + а), умноженная на 2л. 3. Пусть f(x) = х?- Тогда из равенства ф"(А.) = — x2q>(x) e~iKx dx, — оо положив в нем % = 0 и умножив его на 2л, получаем 2л (х2, ф (х)) = — 2лф" (0), т. е. преобразование Фурье функции х2 есть вторая производная от 6-функции, умноженная на —2л. Сделаем несколько заключительных замечаний. Мы определили преобразование Фурье для обобщенных функций над S«>. Но можно было бы взять и любое другое ос- новное пространство, например, пространство К бесконечно диф- ференцируемых финитных функций. Для каждой функции ф е К преобразование Фурье (в обычном смысле) существует и, как можно проверить, представляет собой целую аналитическую функцию экспоненциального роста. Точнее говоря, преобразова- ние Фурье есть линейный оператор, переводящий пространство- К в пространство Z, элементами которого служат целые анали- тические функции ф, для каждой из которых выполнены нера- венства | s П ф(5) 1*1 (<7 = 1,2,...), где т= Ims, a Cq и а — постоянные, зависящие от функции ф. Поскольку в пространстве К было введено понятие сходимости, отображением F, переводящим К в Z, индуцируется некоторое- понятие сходимости в Z: последовательность {ф„} сходится в Z" к ф, если соотношение фп->ф выполнено для соответствующих
<8] ПРЕОБРАЗОВАНИЕ ФУРЬЕ ОБОБЩЕННЫХ ФУНКЦИИ 455 прообразов. Впрочем, это понятие сходимости нетрудно сформу- лировать и не пользуясь пространством Л'* 1)- Пусть теперь f-—произвольный элемент из К*. Поставим ему в соответствие линейный функционал g на Z, положив (g, Ф) = 2л(f, ф), где ф = Е[ф]. Этот функционал g мы назовем преобразованием Фурье функ- ционала f. Таким образом, преобразование Фурье обобщенной •функции f над основным пространством К. есть обобщенная функция над Z, т. е. над тем пространством, в которое К пере- водится преобразованием Фурье, понимаемым в обычном смысле. То же самое построение проходит и для обобщенных функ- ций над какими-либо иными пространствами основных функций. При этом каждый раз будет возникать схема, включающая в себя четыре пространства: некоторое исходное пространство основных функций, совокупность преобразований Фурье этих функций (т. е. второе пространство основных функций) и два •сопряженных пространства. Эта схема сводится к двум пространствам, когда за основное пространство принимается 3^, поскольку оно переводится пре- образованием Фурье само в себя. Понятие преобразования Фурье для обобщенных функций нашло широкое применение в теории дифференциальных урав- нений с частными производными. Читатель может ознакомиться с этими вопросами, например, по книге Г. Е. Шилова [52]. *) Именно, ф„->-0 в Z, если при фиксированных C4(q = 1, 2, ...) на выполняются неравенства I «"Фп (S) |<С?еа'Ч и фп-»-0 равномерно на каждом конечном интервале действительной оси.
ГЛАВА IX ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ § 1. Основные определения. Некоторые задачи, приводящие к интегральным уравнениям 1. Типы интегральных уравнений. Интегральным уравнением называется уравнение, которое содержит неизвестную функцию под знаком интеграла. Таково, например, уравнение ь Ф (s) = j A (s,/)Ф (/) d/+ f (s), (1> а где f и К — известные функции, а ф — искомая. Переменные s и t пробегают здесь некоторый фиксированный отрезок [а, Ь]. Характерная особенность уравнения (1)— его линейность: неизвестная функция ф входит в него линейно. Ряд задач при- водит и к нелинейным интегральным уравнениям, например, к уравнениям вида ъ Ф (s) = $ К (s, t) g (ф (0, /) dt, а где К и g— заданные функции. Мы, однако, во всем дальней- шем ограничимся линейными уравнениями. Отдельные интегральные уравнения рассматривались еще в начале прошлого столетия. Так, еще в 1823 г. Абель рассмотрел уравнение S (0<а<1,/(0) = 0), о s ' носящее теперь его имя. Здесь f — заданная функция, а ф — искомая. Абель показал, что решение этого уравнения имеет вид t
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ 457 и Однако общая теория линейных интегральных уравнений была построена лишь на рубеже XIX и XX столетий, в основном в ра- ботах Вольтерра, Фредгольма и Гильберта. Уравнение (1) называется уравнением Фредгольма второго рода (ср. п. 4 § 4 гл. II), а уравнение ъ J К (s, t)(p(t)dt = f(s) (2) а (в котором неизвестная функция <р содержится только под зна- ком интеграла) — уравнением Фредгольма первого рода. Упомянутое выше уравнение Абеля относится к так называе- мым уравнениям Вольтерра; общий вид этих уравнений таков: S $/((«, t) (f (t) dt = f (s) (3) a (уравнение Вольтерра первого рода) или S <p(s)= J/<(s, t)y(t)dt + f(s) (4) a (уравнение Вольтерра второго рода). Ясно, что уравнение Воль- терра можно рассматривать как уравнение Фредгольма, в ко- тором функция К удовлетворяет условию К (s, /) = 0 при t > s. Однако уравнения вольтеррова типа целесообразно выделить в особый класс, поскольку они обладают рядом существенных свойств, отсутствующих у произвольных фредгольмовых урав- нений. Если в уравнениях (1), (2) или (3) функция f равна нулю, то такое уравнение называется однородным. В противном слу- чае уравнение называется неоднородным. 2. Примеры задач, приводящих к интегральным уравнениям. В дальнейших параграфах этой главы мы рассмотрим основные свойства линейных интегральных уравнений, но сначала мы опи- шем несколько задач, приводящих к таким уравнениям. I. Равновесие нагруженной струны. Рассмотрим струну, т. е. упругую материальную нить длины /, которая может свободно изгибаться, но оказывает сопротивление растяжению, пропор- циональное величине этого растяжения. Пусть концы струны закреплены в точках х = 0 и х = I. Тогда в положении равно- весия струна совпадает с отрезком оси х, О х I. Предполо- жим теперь, что в точке х — £ к струне приложена вертикаль- ная сила Р = Р$. Под действием этой силы струна отклонится
458 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. IX" от положения равновесия и примет, очевидно, форму ломаной,, изображенной на рис. 23. Найдем величину б отклонения струны в точке £ под дей- ствием силы Р$, приложенной к этой точке. Если сила Р% мала по сравнению с натяжением ненагруженной струны То, то гори- зонтальную проекцию натяжения нагруженной струны можно- по-прежнему считать равной Т$. ____£=£___________д Тогда из условия равновесия струны получаем равенство: откуда Рис. 23. . (/ -1) I п б= Тй1 Pi- Пусть теперь и(х)— прогиб струны в некоторой точке х под дей- ствием силы Р%. Тогда u(x) = P%G(x, I), при при Из этих формул сразу видно, в частности, что G(x, s) = G(£, х)_ Предположим теперь, что на струну действует сила, распреде- ленная по ней непрерывно, с плотностью р(£). Если эта сила, мала, то деформация зависит от силы линейно, а форма нагру- женной струны описывается функцией i u(x)=\g(x,1)p(№. (5> о Итак, если задана нагрузка, действующая на струну, то форму- ла (5) позволяет найти форму, которую примет струна под дей- ствием этой нагрузки. Рассмотрим теперь обратную задачу: найти то распределение нагрузки р, при котором струна примет заданную форму и. Мьг получили для нахождения функции р по заданной и уравнение,, которое с точностью до обозначений есть уравнение (2), т. е. интегральное уравнение Фредгольма первого рода. 2. Свободные и вынужденные колебания струны. Предполо- жим теперь, что струна совершает какие-то колебания. Пусть- u(x,t)—положение в момент t той точки струны, которая имеет абсциссу х, и пусть р — линейная плотность струны '). На 9 Мы полагаем, что р = const, хотя это и несущественно для даль- нейшего.
31] ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ 459 элемент струны длины dx действует сила инерции, равная д2и (х, 0 , д2и (£, /) ----Р dx, откуда р (|) =-------р. Подставив это выражение вместо р(£) в формулу (5), мы по- лучим u(x,t)=-^G(x,l)p-^JLdl. (6) о Предположим, что струна совершает гармонические колебания с некоторой фиксированной частотой со и амплитудой и(х), за- висящей от х. Иначе говоря, пусть и (х, t) — u (х) sin со/. Подставив это выражение в (6) и сократив обе части равенства на sin со/, получаем для и следующее интегральное уравнение: i u(x) = p^^G(x,t)u(l)dl (7) о Если струна совершает не свободные колебания, а вынужден- ные, под действием внешней силы, то, как показывает неслож- ная выкладка, соответствующее уравнение гармонических коле- баний струны будет иметь вид i и (х) = рсо2 G (х, £) и (I) dl + f (х), о т. е. будет неоднородным уравнением Фредгольма второго рода. 3. Сведение дифференциальных уравнений к интегральным. Иногда решение дифференциального уравнения целесообразно сводить к решению интегрального. Например, доказывая суще- ствование и единственность решения дифференциального урав- нения У' = f <х, у) с начальным условием у(х0) = уо, мы видели (в гл. II), что его удобно свести к интегральному уравнению (нелинейному) X У=Уо+ \Ht»y)dt>. х9 Такое сведение возможно и для дифференциальных уравнений порядка выше первого. Рассмотрим, например, уравнение вто- рого порядка У" +f(x)y = 0.
460 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. IK Положив f(x) = p2 — о(х), где р = const, запишем его так: У" + Р2У = о (х) у. (8> Как известно, решение уравнения У" + P2y^g(x) с начальными условиями у(а) = уо, у'(а) = у'о можно предста- вить в виде X У (х) = Уо cos р (х — а) + -Уй sin ~ а) + -^ sin р (х — £) g (g) dt,.- а Поэтому нахождение решения уравнения (8) с теми же началь- ными условиями сводится к решению интегрального уравнении X У (х) — j О (|) sin р (х — g) у (|) dl = а ( х । Уъ sin Р (х — а) = Уо cos р (х — а) + —----------- § 2. Интегральные уравнения Фредгольма 1. Интегральный оператор Фредгольма. В этом параграфе мы будем рассматривать уравнения Фредгольма второго рода, т. е. уравнения вида ь ф (s) = К (s, t) <p (t) dt + f (s). (1) a Все встречающиеся здесь и ниже функции мы будем предпола- гать, вообще говоря, принимающими комплексные значе- ния. Относительно функции К, называемой ядром этого уравне- ния, мы предположим, что она измерима и принадлежит клас- су Ь2 на квадрате a sC s, t b: ъ b J J|K(s, f)?dsdt< oo. (2} a a Свободный член f уравнения (1) — это некоторая заданная функция из Ь2[а, Ь], а ф — неизвестная функция из L2[a, ft]. Ядра класса L2 называются ядрами Гильберта — Шмидта. Сопоставим уравнению (1) оператор А, определяемый ра- венством: Лф = ф; это означает, что ь j К (s, t) ф (t) dt = ф (s). (3)
$ 2] ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА 461 Всякий оператор вида (3) называется оператором Фредголь- ма. Если же ядро /(($,/) удовлетворяет условию (2), то он на- зывается оператором Гильберта — Шмидта. Исследование урав- нения (1), разумеется, сводится к изучению свойств этого опе- ратора. Теорема 1. Равенство (3), где К(s, t) — функция с интегри- руемым квадратом, определяет в пространстве Г2[а, Ь] компакт- ный. линейный оператор А, норма которого удовлетворяет нера- венству I ь ь а а (4) Доказательство. Заметим прежде всего, что интеграл ь $ I К ($, /) р dt а существует в силу теоремы Фубини и условия (2) для почти всех s. Иначе говоря, K(s,t) как функция от t при почти всех s принадлежит L2[a, Ь]. Так как произведение функций с сумми- руемым квадратом суммируемо, то интеграл, стоящий в (3) справа, существует для почти всех $, т. е. функция ф определе- на почти всюду. Покажем, что Ь]. В силу неравенства Коши — Буняковского для почти всех $ имеем Интегрируя по s и заменяя повторный интеграл от |K(s, t) |2 двойным, получим неравенство ь ь ь Мф1Р= $H(sWs<llq)|l2 5 а а а которое дает и интегрируемость |ф($) |2, и оценку (4) для нор- мы оператора А. Остается показать, что оператор А компактен. Пусть {фп}—полная ортогональная система в L2[a,b]. Тогда всевозможные попарные произведения фт(«)фп(/) образуют полную систему в пространстве L2([a, Ь] X [а, &]) (см. теорему 1 п. 5 § 3 гл. VII) и, следовательно, оо К («> 0 = Г «тпф/п (s) Фп (0. т, п=1
462 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. tx Положим теперь N Kn («, t) = £ атп^т (s) (/), m. n=l и пусть .4,v — оператор, определяемый ядром /). Этот опе- ратор компактен, поскольку он переводит все L2[a, b] в конеч- номерное подпространство (в гл. IV мы назвали такие операто- ры конечномерными). Действительно, если <р е L2 [а, Ь], то b N Ь Лл,ф = (s, /) ф (/) dt — £ атп^т (s) ф (/) (/) dt = а т, п~I а N N = £ Фт (s) £ атпьп, /п=1 п=1 где ь ьп = 5 ф (/) ф„ (t) dt, а т. е. каждый элемент ф^АДа, Ь] переводится оператором в элемент конечномерного подпространства, порожденного векто- рами ipi, . . . , 4^- Далее Kn(s, t) представляет собой частичную сумму ряда Фурье функции /(($, t), поэтому ь ь (s, f) — KN (s, t))2ds dt->0 при V->oo. a a Отсюда, применив оценку (4) к оператору А—Л .у, имеем || А — An ||—*0 при V->oo. Воспользовавшись теоремой о том, что предел сходящейся по- следовательности компактных операторов компактен (п. 2 § 6 гл. IV), получаем компактность оператора А. Замечания. 1. В процессе доказательства теоремы 1 мы установили, что всякий оператор Гильберта — Шмидта может быть представлен как предел (в смысле сходимости по норме) последовательности конечномерных интегральных операторов. 2. Пусть Ai и А2 — два оператора вида (3) и Ki(s,t), ДДх,/)— отвечающие им ядра. Если операторы Л] и Л2 равны, т. е. Л [ф — Л2ф для всех ф е Ь2[а, £>], то Ki(s, t) = Лг(«, /) почти всюду. Действительно, если ь Л|ф — Л2ф =$ (Л\ («, i) — А’г (s, /)) Ф (/) dt = О
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА 463 § 2] для всех <р е L2[a, 6], то при почти всех s е [а, 6] t)~K2(s, t)pdt = O а и, значит, ь ь J $ I Ki (s, t) — K2{s, f)'?dsdt = O, а а откуда и следует наше утверждение. Таким образом, если мы, как обычно, не будем различать эквивалентные между собой суммируемые функции, то можно сказать, что соответствие ме- жду интегральными операторами и ядрами взаимно однозначно. Теорема 2. Пусть А—оператор Гильберта — Шмидта, оп- ределяемый ядром Тогда сопряженный ему оператор А* определяется «.сопряженным» ядром Доказательство. Используя теорему Фубини, получаем ь ( b -j (Л/, g) = U f)f (t)dt Jg(s)ds = a '*• a ’ b b b f b \ = § jj /((s, f)f(f)g(s)dt ds = U jj /((s, t) g(s)ds H (/)<#== a a a a * b 7~~b 7 = V (Z) I J (s> 0 g («) rfs f л = (f, x*g), a > a * откуда и следует утверждение теоремы. В частности, оператор А вида (3) самосопряжен в L2[a,b], т. е. А* = А, тогда и только тогда, когда K(s, t) — K(t, s). В слу- чае, когда рассматривается действительное гильбертово про- странство (и, стало быть, действительные ядра), условием само- сопряженности служит равенство /C(s, 0— K(t,s). Замечание. Мы рассмотрели интегральные операторы, действующие в пространстве Г2[а,Ь]. Однако, как все сказанное выше, так и излагаемые ниже результаты переносятся без из- менений на тот случай, когда вместо отрезка [а, 6] берется лю- бое другое пространство с мерой. 2. Уравнения с симметрическим ядром. Рассмотрим инте- гральное уравнение Фредгольма второго рода ь Ф («) = 5 К (s> О ф (z)dt + f (s)> (5) a
464 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ (ГЛ IX ядро которого удовлетворяет условиям b ь 1) | К (s, t) fdsdt < оо, а а 2) К(М) = О1. Мы будем называть такие уравнения уравнениями с симметри- ческим ядром. В силу теорем 1 и 2 предыдущего пункта соответ- ствующий оператор Фредгольма ь Лф = J к (s, /) ф (/) dt (6) а компактен и самосопряжен. Следовательно, для него справедли- ва теорема Гильберта — Шмидта (п. 5 § 6, гл. IV). Применим эту теорему для отыскания решений уравнения (5). Поскольку для нас имеют значение лишь компактность и самосопряжен- ность оператора (6), а не его интегральное представление, есте- ственно писать уравнение (5) в символической форме Ф = Лф-Н. (7) По теореме Гильберта — Шмидта для А существует такая орто- нормальная система собственных функций {фп}, отвечающих не- нулевым собственным значениям {Хп}, что каждый элемент £ из Z-2 представим в виде £ = Е апФп + I', где AS,' = 0. п Положим f=Eu + r « = 0) (8) п н будем искать решение ф уравнения (7) в виде ф = Е Мл + ф' Нф' = 0). (9) п Подставив разложения (8) и (9) в уравнение (7), получим Е х„ф„ + ф' = Е *лМл + Е Мп + Г- п п п Это равенстве удовлетворяется в том и только в том случае, когда f = ф' и xn(l~kn)^bn (н = 1,2, ...),
§ 2] ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА 465 т. е. когда Г = ф', Ьп хп = При Л„=/=1, Ьп = 0 при Xn = 1. Последнее равенство дает необходимое и достаточное условие разрешимости уравнения (7). Координаты хп, отвечающие тем п, для которых Хп=1, при этом произвольны. Мы получаем, таким образом, следующий результат. Теорема 3. Если 1 не является собственным значением оператора А, то уравнение (7) при любом f имеет одно и только одно решение. Если же 1 есть собственное значение оператора А, то уравнение (7) разрешимо в том и только том случае, когда свободный член f ортогонален всем собственным функциям опе- ратора А, отвечающим собственному значению 1. Если это по- следнее условие выполнено, то уравнение (7) имеет бесконечное множество решений. 3. Теоремы Фредгольма. Случай вырожденных ядер. Мы пе- рейдем теперь к рассмотрению уравнений Фредгольма второго рода с ядрами, подчиненными условию b ь | K(s, t) pdsdt < оо а а (обеспечивающему компактность оператора), но без условия симметрии. Предположим сначала, что рассматривается уравнение 6 ф(«) = K(s, t)(f[t)dt + f (s), (10) a ядро которого — вырожденное, т. е. имеет вид — (11) где Р,, Qi — функции из L2. Оператор с ядром вида (11) пере- водит всякую функцию (peLsB сумму п b £>/(*) JQ.WtW dt, i=l a т. e. в элемент конечномерного подпространства, порожденного функциями Pi, i — 1, 2, ... , п. Заметим, что в выражении (11)
466 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ (ГЛ. IX функции Pi, . . . , Рп можно считать линейно независимыми ме- жду собой. Действительно, если это не так, то, представив ка- ждую из функций Pi как линейную комбинацию независимых, мы получим, что то же самое ядро K(s,t) можно записать в виде суммы меньшего числа слагаемых вида Pj(s)Qj(f), так что функции Pj линейно независимы. Аналогичную редукцию можно проделать для функций Qj. Как легко видеть, после этих редук- ций получится ядро, в котором и Pj и Qi будут между собой ли- нейно независимы. Итак, будем решать уравнение (10) с вырожденным ядром (11), в котором функции Pi, . .., Рп (так же как и Qb ... , Qn) линейно независимы. Подставив в уравнение (10) вместо K(s,/) соответствующую сумму, получим п b Ф (s) = £ Pi(s) $ Q, (0Ф(0+ f (s). (12) 1=1 а Введя обозначения ь j Qi (t) <Р (0 dt = qh a перепишем уравнение (12) в виде <Р («)= £ <pP,(s) + f(s). 1=1 Подставив это выражение для <р в уравнение (10), получим п п Ъ г п "1 qiPi {s)+f (s) = 2 Pi (*) J Qi (0 2 <ЦР] (0+f W dt+f (s). (13) i=l /—I a l-y—i J Положив b b J Qi (/) Pj (/) dt = alh J Qi (!) f (/) dt = bi, a a запишем равенство (13) так: £ QiPi (s) = £ Pi («) [ £ Uijqj + 6,1. i=l i=l L/=l J Функции Pit по предположению, линейно независимы, поэтому отсюда следует равенство соответствующих коэффициентов: <7; = £^/<7/+ &о 7=1,2..........п. (14)
§ 21 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА 457 ААы получили для коэффициентов qi систему линейных уравне- ний. Решив ее, мы найдем функцию <Р (s) = S QiPi («) + f (s). <=i Эта функция удовлетворяет интегральному уравнению (10), по- скольку все выкладки, с помощью которых мы пришли от урав- нения (10) к системе (14), можно проделать в обратном по- рядке. Итак, решение интегрального уравнения с вырожденным яд- ром сводится к решению соответствующей ему системы (14) ли- нейных алгебраических уравнений. Для систем линейных уравнений хорошо известны условия существования и единственности решений. I. Система линейных алгебраических уравнений Тх — у (Г = || aik ||, х = (хь .... х„), £/ = ((/,.//„)) разрешима в том и только том случае, когда вектор у ортогона- лен каждому решению сопряженной однородной системы Гг = 0 (Г = ||^||). II. Если детерминант матрицы Т отличен от нуля, то уравне- ние Тх — у имеет при любом у одно и только одно решение. Если же детерминант матрицы Т равен нулю, то однородное уравнение Тх — 0 имеет ненулевые решения. III. Поскольку матрица Т и сопряженная матрица Т* имеют один и тот же ранг, однородные системы Тх — 0 и T*z — О имеют одно и то же число линейно независимых решений. В силу той связи, которая, как мы выяснили, существует ме- жду интегральными уравнениями с вырожденными ядрами и системами линейных алгебраических уравнений, эти утвержде- ния можно рассматривать как теоремы, относящиеся к реше- ниям вырожденных интегральных уравнений. Мы покажем в следующем пункте, что, по существу, эти же теоремы имеют ме- сто и для уравнений с произвольными (не обязательно вы- рожденными) ядрами. Однако, поскольку для невырожденных интегральных операторов такие понятия, как ранг матрицы и детерминант не имеют смысла, соответствующие теоремы нужно будет сформулировать так, чтобы эти понятия в них не участ- вовали. 4. Теоремы Фредгольма для уравнений с произвольными ядрами. Будем снова рассматривать уравнение ь qp(s)=^/((s, f)q(t)dt + f (s), (15) а
468 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ IX но теперь на его ядро будем накладывать лишь условие Гиль- берта — Шмидта ь ь | К (s, f) \2dsdt < оо а а (обеспечивающее компактность оператора), но не будем это ядро предполагать ни вырожденным, ни симметрическим. Нас будут интересовать условия разрешимости уравнения (15) и свойства его решений. При этом существенным для нас будет лишь свойство компактности оператора, отвечающего уравне- нию (15), а не его интегральное представление. Поэтому мы бу- дем все дальнейшие рассмотрения вести для операторного урав- нения ср = Хф + f, (16) считая, что А — произвольный компактный оператор, заданный в гильбертовом пространстве И. Положив Т = 1 — А (где / — единичный оператор), перепи- шем уравнение (16) в виде ГФ = Л (17) Будем наряду с этим уравнением рассматривать однородное уравнение 7фо = О (18) и сопряженные уравнения T*^ = g, (19) Г1рэ=0 (20) (Т* = /— Д*)_ Связь между свойствами решений этих четырех уравнений устанавливается следующими теоремами Фред- гольма. I. Неоднородное уравнение Тф — f разрешимо при тех и только тех f, которые ортогональны каждому решению сопря- женного однородного уравнения T*4>o = 0. II (альтернатива Фредгольма). Либо уравнение Tq = f имеет при любом f е Н одно и только одно решение, либо однородное уравнение Тфо — 0 имеет ненулевое решение. III. Однородные уравнения (18) и (20) имеют одно и то же, и притом конечное, число линейно независимых решений. Прежде чем приступать к доказательству этих теорем, заме- тим, что они справедливы (в силу сказанного в п. 2) для урав- нений с симметрическим ядром. При этом в силу совпадения А и А* теорема III становится тривиальной. С другой стороны, если А — вырожденный интегральный опе- ратор, то соответствующие уравнения сводятся, как мы видели выше, к системам линейных алгебраических уравнений; при
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА 469 § 2] этом теоремы Фредгольма автоматически переходят в теоремы о линейных системах, приведенные в предыдущем пункте. Поскольку всякий компактный оператор есть предел сходя- щейся последовательности вырожденных, т. е. конечномерных, операторов, мы могли бы доказать теоремы Фредгольма с по- мощью соответствующего предельного перехода (от вырожден- ных ядер к невырожденным). Мы, однако, пойдем по другому’ пути и дадим доказательство этих теорем, не связанное с рас- смотрением вырожденных уравнений. Доказательство теорем Фредгольма. Напомним, что Кег В есть совокупность нулей линейного непрерывного опе- ратора В (т. е. множество всех тех хе//, для которых Вх — 0), a Im В — область значений оператора В, т. е. совокупность век- торов вида у = Вх. Ясно, что Кег В всегда есть замкнутое ли- нейное подпространство. Множество Im В также представляет собой линейное многообразие, однако, вообще говоря, не замк- нутое. Мы сейчас покажем, что для оператора Т=1 — А, где А — комплексный оператор, замкнутость соответствующего мно- гообразия имеет место. Лемма 1. Многообразие Im Т замкнуто. Доказательство. Пусть уп е Im Т и -> у. По предпо- ложению существуют такие векторы хп е Н, что Уп = Тхп = хп — Ахп. (21) Мы можем считать, что векторы хп ортогональны к Ker Т, вы- читая, если необходимо, из хп его проекцию на Ker Т. Далее, можно считать, что ||хп|| ограничены в совокупности. Действи- тельно, в противном случае, переходя к подпоследовательности, мы бы имели ||хп||->оо и, разделив на ||хп||, получили бы из (21), что так как оператор А компактен, то, снова переходя к подпоследовательности, можно считать по- следовательность ( Л „ * | сходящейся. Поэтому и „ Хп„ у- б I II хп II ) J || Хп II 3 дет сходиться, скажем, к вектору z е Н. Ясно, что ||г|| = 1 и Tz = 0, т. е. z е Ker Т. Однако мы считаем векторы хп ортого- нальными к Ker Т и, следовательно, вектор z обязан быть орто- гональным к Ker Т. Полученное противоречие и позволяет счи- тать, что ||хп11 ограничены в совокупности. Вместе с тем в этом случае последовательность {Ахп} можно считать сходящейся, а тогда, как это следует из (21), будет сходящейся и последова- тельность {хп}. Если через х обозначить предел этой последова- тельности, то из (21) следует, что у — Тх. Лемма доказана. Лемма 2. Пространство Н является прямой ортогональной суммой замкнутых подпространств Ker Т и Im Т*, т. е. Кег ГФ Im Г =/7, (22).
470 ЛИНЕПНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. IX и аналогично, Ker Т*® Im Т — Н. [23) Доказательство. Мы уже знаем, что оба подпростран- ства, фигурирующие в левой части равенства (22), замкнуты. Кроме того, они ортогональны, поскольку если h Ker Т, то (/1, Т*х) — (Th, х) — 0 для всех xs Н. Остается доказать, что никакой ненулевой вектор не может быть одновременно ортого- нальным к Ker Г и Im Т*. Но если вектор z ортогонален к Im Г*, то для любого хе Н имеем (Tz, х) = (z, Т*х) = 0, т. е. z е Ker Т. Равенство (23) доказывается аналогично. Лемма доказана. Из леммы 2 сразу вытекает первая теорема Фредгольма. Действительно, f J_ Ker Т* в том и только том случае, если f е Im Т, т. е. если существует такое ср, что Тф = f. Далее, для каждого целого k положим Hk — Im(Tft), так что, в частности, /71 = Im Г. Ясно, что подпространства Hh образуют депочку вложенных подпространств, Н=>Н'=>Н2=> ..., (24) а в силу леммы 1 все эти подпространства замкнуты. При этом T(Hh)= Hh+l. Л е м м а 3. Существует такое j, что Hk+l — Hk при всех k^j. Доказательство. Если такого / не существует, то, оче- видно, все Н* различны. В этом случае можно построить такую ортонормированную последовательность {хд}, что х^еЯ6 и ор- тогонально Hk+t. Пусть I > k. Тогда Axt — Axk = — xk + (xz + Txk — 7xz) и, следовательно, ||Axz — Axk|| 1, так как xz + Txh — Txt i= Hk+\ Поэтому из последовательности {Аха} нельзя выбрать сходя- щейся подпоследовательности, что, однако, противоречит ком- пактности оператора А. Тем самым лемма доказана. Лемма 4. Если Кег 7 = {0}, то Im Т = Н. Доказательство. Если Кег Т— {0}, то оператор Т взаим- но однозначен и, следовательно, если при этом Im Т =/= И, то цепочка (24) состоит из различных подпространств, а это про- тиворечит лемме 3. Поэтому Im Т = Н. Аналогично, Im Т* — Н, если Кег Т* = {0}. Л е м м а 5. Если Im Т = Н, то Ke Т — {0}. Доказательство. Так как Im Т = Н, то, по лемме 2, Ker Т* = {0}, но тогда, по лемме 4, ImT1* = Н и следовательно, по лемме 2, Ker Т = {0}. Совокупность лемм 4 и 5 и составляет содержание второй теоремы (альтернативы) Фредгольма. Тем самым эта теорема доказана. Докажем, наконец, третью теорему Фредгольма.
§ 21 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА 47Г Предположим, что подпространство Ker Т бесконечномерно. Тогда в этом подпространстве найдется бесконечная ортонормп- рованная система {хД. При этом Ахк = хк и, следовательно, при k I имеем || Ахк— Ах1^ — д/2. Но тогда из последовательно- сти {ЛхД нельзя выбрать сходящейся подпоследовательности, что противоречит компактности оператора А. Пусть теперь р — размерность Ker Т и v — размерность Ker Т*. Предположим, что р < v. Пусть {фь .... фД— ортонор- мированный базис в Ker Т и {ipi, ..., i|)v}— ортонормированный базис в Ker Т*. Положим и Sx = Тх+ 52 (х, /==» Так как оператор S получается из оператора Т прибавле- нием конечномерного оператора, то все результаты, доказанные выше для оператора Т, остаются верными и для оператора S. Покажем, что уравнение Sx = 0 имеет только тривиальное- решение. Действительно, допустим, что в 7х+ £(х, ф/)'ф/ = 0. (25> !=' Так как векторы ip.,- в силу леммы 2 ортогональны ко всем век- торам вида Тх, то из (25) следует, что Тх = 0 и (х, ф;) = 0 при Поэтому, с одной стороны, вектор х должен быть линейной комбинацией векторов фь а с другой, — ортогонален им. Следо- вательно, х = 0. Итак, уравнение Sx = 0 имеет только триви- альное решение. Но тогда по второй теореме существует такой вектор у, что в Ту + S (У, Ф/) = tn+i- /=i Умножив это равенство скалярно на трц+i, мы получим справа 1, а слева 0, поскольку Ту = ImT, a ImT_LKerT* Это противо- речие возникло из предположения ц < v. Поэтому ц 2г у. Заме- няя теперь оператор Т на Г*, мы получим v и, следователь- но, ц = V. Теорема III доказана полностью. Замечания. 1. В теоремах Фредгольма по существу речь идет об обратимости оператора А—/и эти теоремы означают, что Х= 1—или регулярная точка для А или собственное зна- чение конечной кратности. Разумеется, все, что утверждается в. этих теоремах, остается справедливым и для операторов А —XI,
472 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ (ГЛ. IX если X =/= 0. Поэтому всякая отличная от 0 точка спектра ком- пактного оператора является его собственным значением конеч- ной кратности. Кроме того, мы знаем, что множество таких соб- ственных значений не более чем счетно. Ввиду следствия на <тр.243 0 всегда принадлежит спектру компактного оператора в бесконечномерном пространстве, но не обязан, вообще гово- ря, быть собственным значением. Компактные операторы, для которых 0 служит единственной точкой спектра, называюФся (абстрактными) операторами Вольтерра. 2. Мы доказали теоремы Фредгольма для уравнения вида Ф = Лер -j- f, где А— компактный оператор в гильбертовом про- странстве. Эти теоремы могут быть перенесены без существен- ных изменений и на случай произвольного банахова простран- ства Е. При этом, разумеется, сопряженное уравнение ip = — A-j- g будет уравнением в пространстве Е*, условие орто- гональности (f, фо) = 0 нужно понимать как обращение в нуль на элементе f^E каждого функционала из подпространства Ker Т* аЕ* решений уравнения Т*ф0 = 0 и т. д. Изложение тео- рем Фредгольма для уравнений в банаховом пространстве со- держится, например, в книге Л. А. Л ю с т е р н и к а и В. И. Со- болева «Элементы функционального анализа». 5. Уравнения Вольтерра. У равнением Вольтерра (второго рода) называется интегральное уравнение S ф(х)= Jk(s, + (26) а где K(s,t) — ограниченная измеримая функция: |Д($, /) | ^ Л4. Поскольку это уравнение можно рассматривать как частный случай уравнения Фредгольма (с ядром, равным нулю при t > s), теоремы Фредгольма справедливы и для уравнения (26). Однако для уравнений Вольтерра эти теоремы можно уточнить следующим образом. Уравнение Вольтерра (26) при любой функции f i= Ь2 имеет одно и только одно решение. Действительно, дословно повторяя рассуждения п. 4 § 4 гл. II, мы видим, что некоторая степень оператора $ Аф= К (s, /) ф (f)dt а является сжимающим оператором и, следовательно, однородное уравнение имеет единственное (тривиальное) решение. В силу теорем Фредгольма отсюда и следует наше утверждение. Упражнение. Пусть на отрезке задано интегральное уравнение Фред- гольма второго рода с непрерывным ядром. Доказать для такого уравнения
S 2] ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА 479 теоремы Фредгольма в пространстве непрерывных функций. При этом роль «сопряженного уравнения» играет интегральное уравнение с транспонирован- ным ядром, а ортогональность понимается в смысле Li. 6. Интегральные уравнения первого рода. Абстрактным урав- нением Фредгольма первого рода называется уравнение вида Дф = А (27) т. е. уравнение, содержащее неизвестную функцию ф лишь под знаком компактного оператора. Решение такого уравнения представляет собой задачу, вооб- ще говоря, более сложную, чем решение уравнения второго рода, и уравнение (27) не может иметь решения при любой правой части. Рассмотрим вначале в качестве простейшего примера урав- нение S f(s) = (f(i)dt, а т. е. уравнение с ядром ( 1 при i^.s, K(s, /) = { л (, 0 при t > 1. Оно имеет очевидное решение <p(s) =/'(s), если f абсолютно непрерывна и ее производная принадлежит L2, и оно неразре- шимо в противном случае. Покажем, что и в общем случае уравнение (27) не может быть разрешимо при произвольном f е Н. Действительно, суще- ствование решения уравнения Дф = f при любом озна- чало бы, что этот оператор отображает Н снова на все Н. По- кажем, что это невозможно. Все Н можно представить как сум- му счетного числа шаров Хп (например, шаров радиуса 1,2,... ..., п, ... с центром в нуле). Каждый из них переводится ком- пактным оператором А в предкомпактное множество. Таким образом, замыкание Im Л есть сумма счетного числа компак- тов. Но в Н любой компакт нигде не плотен; в то же время /7, как и любое полное метрическое пространство, не может быть представлено как сумма счетного числа нигде не плотных мно- жеств. Таким образом, 1тД #= Н\ иными словами, каков бы ни был компактный оператор А в Н, уравнение А<р = f не может быть разрешимо при всех f е И. Другой существенный момент состоит в том, что оператор, обратный компактному, не ограничен. Поэтому, если fi и )2 — два близких между собой элемента из Н и оба уравнения Лф2 = /2
474 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. IX разрешимы, то соответствующие решения <pi = А~1 fг и <р2 = А~![г могут сильно отличаться друг от друга. Иначе говоря, сколь угодно малая погрешность в свободном члене уравнения мо- жет привести к сколь угодно большой ошибке в решении. Зада- чи, в которых малое изменение исходных данных приводит к малому изменению решения (эта «малость» может в разных задачах пониматься по-разному), называются корректными. Решение интегрального уравнения первого рода (в отличие от уравнения второго рода) — некорректная задача. За последнее время разного рода некорректные задачи и методы их регуляри- зации (т. е. сведения их к задачам, в том или ином смысле кор- ректным) получили широкое развитие. Однако изложение этих вопросов выходит за рамки данной книги. § 3. Интегральные уравнения, содержащие параметр. Метод Фредгольма 1. Спектр компактного оператора в Н. Будем рассматривать уравнение ср = АДф + f, или, иначе, (/-м)ф = л (1) где А — компактный оператор в гильбертовом пространстве Н, а А— числовой параметр. В силу альтернативы Фредгольма возможны два и только два взаимоисключающих случая: 1. Уравнение (1) имеет при данном X одно и только одно решение для каждого f е Н. 2. Однородное уравнение ф — АЛф имеет ненулевое решение. В первом случае оператор /— А.4 отображает, и притом взаимно однозначно, Н на все Н. Отсюда следует существова- ние ограниченного обратного оператора (/ — АЛ)"1. Это равно- сильно тому, что оператор (л— определен на всем Н и ограничен; иначе говоря, в этом случае 1/А не принадлежит спектру оператора А. Пусть теперь имеет место вторая возможность, т. е. суще- ствует такой отличный от нуля элемент ф>. е Н, что Фх = Мфх. или Лфх = у фх; тогда 1/А есть собственное значение оператора А. Мы получаем следующий результат: каждое отличное от нуля число ц = 1/А является собственным значением компакт- ного оператора А либо регулярно. Иными словами, у компакт-
§ 3] ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ. СОДЕРЖАЩИЕ ПАРАМЕТР 475 ного оператора непрерывный спектр либо совсем отсутствует либо состоит из одной точки р = 0. Объединив только что сказанное с теоремой 4 § 6 гл. IV, мы получаем следующее описание спектра компактного оператора в И. Спектр любого компактного оператора А в Н состоит из конечного или счетного числа отличных от нуля собственных значений рь рг, • •, Р-п, • • •> каждое из которых имеет конечную кратность, и точки нуль1). Точка нуль— единственная возмож- ная предельная точка для последовательности {рп}- Сама точка р = 0 может быть собственным значением конечной или беско- нечной кратности, а может и не быть точкой множества соб- ственных значений. Как было показано в п. 5 § 2 для уравнения <р = АВф + f, где В — интегральный оператор вольтеррова типа, всегда имеет место первый случай альтернативы Фредгольма (разрешимость при любом f е Ь2). Иначе говоря, спектр интегрального опера- тора типа Вольтерра состоит из одной точки р = 0. Вместе с тем в конце п. 4 § 2 мы назвали абстрактным оператором Воль- терра компактный оператор, спектр которого сводится к точке 0. Поэтому можно сказать, что интегральный оператор Вольтерра является и абстрактным оператором Вольтерра, и вся эта тер- минология оказывается оправданной. 2. Отыскание решения в виде ряда по степеням X. Детерми- нанты Фредгольма. Формально решение уравнения (/ —А,Л)ф = ^ можно записать в виде Ф = (/-М)-^. (2) Эта формула действительно определяет решение, если||АД||< 1, т. е. | А | < -д jj-, поскольку в этом случае оператор (/ — АЛ)-1 существует, определен на всем Н и ограничен (см. п. 7 § 5 гл. IV). При этом оператор (/ — АЛ)"1 можно представить как сумму степенного ряда (/- АЛ)-1 = / + АЛ + А2Л2 + ... + кпАп + ..., сходимость которого (по норме) обеспечивается условием | А | < <1/|| ЛII- Следовательно, решение (2) нашего уравнения (1) можно записать так: Ф = f + KAf + K2A2f + ... +KnAnf+ ... (3) ’) p = 0 обязательно принадлежит спектру Д, поскольку А1 не может быть ограничен в бесконечномерном Я (см, следствие на стр. 243).
476 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. IX Этот же результат получится, если искать решение уравнения (1) в виде степенного ряда Фх = Фо + М>1 + ••• + ^пФп + ••• (где фп от X уже не зависят). Подставив этот ряд вместо ф в правую и левую части уравнения ф = АЛф + / и приравняв за- тем коэффициенты при одинаковых степенях X в обеих частях равенства, мы получим Фо = f, Ф, = Л/, ..., ф„ = Лф„_1 = Anf, ..., т. е. ряд (3). Покажем, что если А — интегральный оператор Гильбер- та— Шмидта, т. е. оператор, определяемый квадратично интег- рируемым ядром /C(s,/), то оператор (/—ХЛ)“’ при достаточно малых значениях X может быть записан как сумма / -ф ХГ (X) единичного оператора / и некоторого интегрального оператора ХГ(Х) Гильберта — Шмидта с квадратично интегрируемым яд- ром, зависящим от параметра X. Выясним сначала, каким обра- зом записываются ядра операторов А2, А3 и т. д. Рассмотрим для этого более общий вопрос: пусть даны два интегральных оператора ь ь Лф = К ($, О ф (/) dt, Вф — Q (s, f) ф (/) dt, а а где b b | К ($, t) pdsdt = k2 < оо, а а b b I Q ($, О I2 ds dt — q2 < оо. а а Найдем ядро оператора АВ. Имеем ь г ь ABq> = Ji K(s, «) j Q (и, t) ф (t) dt du = a ( a b ( b = I < к ($, u) Q (u, t)du ф (f) dt. a (a Возможность изменения здесь порядка интегрирования выте- кает из теоремы Фубини, поскольку подынтегральная функция К (s, u)Q(u, t)q>(t) суммируема по совокупности переменных и и t как произведе- ние двух функций K(s, п)ф(0 и Q(u, t), квадрат каждой из которых суммируем.
S 3] ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ. СОДЕРЖАЩИЕ ПАРАМЕТР 477 Положим ь R(s, t) = j К (s, и) Q(u, t) du; (4) a в силу неравенства Коши — Буняковского имеем ь ь I R (s, t) |2 < J | К (s, и) |2 du J | Q (u, t) |2,7 -. а а откуда b ь J J I R (s, t) |2 ds dt k2q2. a a Итак, произведение двух интегральных операторов типа Гиль- берта— Шмидта есть оператор того же типа, с ядром, опреде- ляемым формулой (4). В частности, положив А— В, получаем, что А2 есть интегральный оператор с ядром ь Ki (s, t) — J К ($, и) К (и, /) du, а которое удовлетворяет условию b Ь Г b Ь -12 J Jl K2(s, t)\2dsdt^ J J|K(s, /)|2dsrfq = k\ a a a J откуда || A21| k2, где ь b k2 = J J | К (s, t)\2dsdt. a a Аналогично получаем, что каждый из операторов Ап опреде- ляется ядром ь Кп (s, t) = J Кп-\ (s, и) к (и, t) du (п — 2, 3, ...), а удовлетворяющим условию b ь JJ|K„(S, t)fdsdt^kin. (5) а а Ядра Kn(s,t) называются итерированными ядрами.
478 ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ [ГЛ. IX При | X | < \/k ряд /C(s, /) + X/C2(s, /)+ ... +Xn-IK„(s, /) + ... сходится в силу оценки (5) в пространстве А2([а, b] X [а, &]) к некоторой функции Г(х, /; X), квадрат которой суммируем по «• и t при каждом |Х|< 1//г. Интегральный оператор Г(Х), для которого функция Г(s, /; X) служит ядром, есть сумма сходяще- гося ряда Л + ХЛ2+ ... +кп~'Ап + .... (6) компактных операторов и, следовательно, он компактен. Домножив эту сумму на X и прибавив к ней единичный опе- ратор /, мы и получим оператор (/ — ХЛ)~'. Итак, действитель- но, при |Х| < \/k оператор (/ — ХЛ)-1 есть сумма единичного оператора / и компактного оператора ХГ(Х) с ядром ХГ (s, /; Х)= § X"K„(s, /). п— 1 Условие |X| < 1/k достаточно для сходимости ряда (6), но вовсе не необходимо. В некоторых случаях этот ряд может ока- заться сходящимся даже при всех значениях X. Например, если А — оператор вольтеррова типа с ядром, удовлетворяющим ус- ловию |K(s, /)|<М, то, как показывает прямой подсчет, для итерированных ядер Kn(s,t) справедлива оценка: I Kn(s, /)К Мп (Ь-а)4-' (/г-1)! откуда следует сходимость ряда (6) при любом X. Однако, вообще говоря, степенной ряд (6) имеет некоторый конечный радиус сходимости. В то же время уравнение <р = = ХЛср + f имеет решение при всех X, кроме конечного или счет- ‘ного числа значений, именно таких, что 1/Х есть собственное значение оператора А. Фредгольм показал, что для интеграль- ного оператора Л, определяемого ограниченным и непре- рывны м ядром /C(s,/), решение уравнения <р —ХЛ<р + / мо- жет быть найдено следующим способом. Введем обозначение «1 Л К K(Sl, /,) ... K(slt tn) К {sn, ... К (sn, tn)
§ 31 ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ. СОДЕРЖАЩИЕ ПАРАМЕТР 479 и определим функции D(X) и D(s,t;h), называемые, соответ- ственно, детерминантом Фредгольма и минором Фредгольма, формулами: b ь ь 1 -a.U(!‘ +-7-И J \ 51 / z J J V 51 52 / а а а b С п! } а \к(11 ” ... dln+ .... (7) b b b / S \ р / S £ \ 1 г С С Р(МД)=Ч ,Н UL + \ Г / J \Г Ь1 / z J J а а а (s ЛЯ ЛЯ _1_ G ъ i2)d^d^+- Я’ J* " ... dln+ ... (8) j \Г Ь| •• • 6п/ Тогда для интегрального уравнения ь Ф (s) = К К (s, t) ф (/) dt + f (s) a резольвентное ядро дается формулой г(», t, X)-1 L и решение записывается в виде ь = + f(t)dt (9) а для всех значений X, таких, что 1/А, не есть собственное значе- ние интегрального оператора А, отвечающего ядру K(s,i). При этом D(А,) и O(s,^;A,) представляют собой целые аналитические функции параметра А, и О(/.)—О в том и только том случае, если 1/А, есть собственное значение интегрального оператора А. Как показал в 1921 г. Т. Карлеман, формулы (7), (8) и (9), полученные Фредгольмом в предположении непрерывности ядра остаются в силе и для любого ядра с интегрируе- мым квадратом. Мы не будем приводить здесь выводы формулы (9) и формул (7), (8) '). ‘) См. Т. С а г 1 е m a n, Zur Theorie der Integralgleichungen, Math. Zeitschr. 9 (1921), 196—217, а также F. Smithies, The Fredholm theory of integral equations, Duke Math. Journal, 8 (1941), 107—130. Вывод формул (7), (8) и (9) см. в книгах [35] и [46].
ГЛАВА X ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ В тех вопросах функционального анализа, которыми мы за- нимались в предыдущих главах, основную роль играли понятия линейного функционала и линейного оператора. Однако некото- рые задачи, возникающие в функциональном анализе, носят су- щественно нелинейный характер; они приводят к необходимости развивать наряду с «линейным» и «нелинейный» функциональ- ный анализ, т. е. изучать нелинейные функционалы и нелиней- ные операторы в бесконечномерных пространствах. К нелиней- ному функциональному анализу относится, по существу, такая классическая область математики, как вариационное исчисле- ние, основы которого были заложены еще в XVII—XVIII вв. в работах Бернулли, Эйлера, Лагранжа. Однако в целом нели- нейный функциональный анализ представляет собой сравнитель- но новую область математики, пока еще далекую от своего за- вершения. В этой главе мы изложим некоторые первоначальные понятия, относящиеся к нелинейному функциональному анализу, в основном к теории дифференцирования, и некоторые приме- нения этих понятий. § 1. Дифференцирование в линейных пространствах 1. Сильный дифференциал (дифференциал Фреше). Пусть X и У — два нормированных пространства и F— отображение, действующее из X в У и определенное на некотором открытом подмножестве О пространства X. Мы назовем это отображение дифференцируемым в данной точке хеО, если существует та- кой ограниченный линейный оператор У), что для любого е > 0 можно найти 6 > 0, при котором из неравенства ||/i||< 6 следует неравенство ||F(x + h)- F(x) — Lxh\\^e\\h\\. (I) To же самое сокращенно записывают так: F(x + h)-F(x)-Lxh = o(h). (2) Из (I) следует, что дифференцируемое в точке х отображе- ние непрерывно в этой точке. Выражение Lxh (представляющее
§ 1] ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ 481 собой, очевидно, при каждом h^X элемент пространства У) называется сильным дифференциалом (или дифференциалом Фреше) отображения F в точке х. Сам линейный оператор Lx называется производной, точнее, сильной производной отобра- жения F в точке х. Мы будем обозначать эту производную сим- волом F'(x). Если отображение F дифференцируемо в точке х, то соответ- ствующая производная определяется единственным образом. В самом деле, равенство \\L\h— £2/i|| = o(h) для операторов Li е (X, У), г = 1,2, возможно, лишь если Ei = L2. Установим теперь некоторые элементарные факты, непосред- ственно вытекающие из определения производной. 1. Если F(x) = уо = const, то F'(x)=0 (т. е. F'(x) в этом случае есть нулевой оператор). 2. Производная непрерывного линейного отображения L есть само это отображение-. L'(x) — L. (3) Действительно, по определению имеем L(x + h)~ L(x) — L(h). Несколько менее очевиден следующий важный результат. 3. (П роизводная сложной функции). Пусть X, У, Z — три нор- мированных пространства, U(x0)—окрестность точки xQ е X, F — отображение этой окрестности в У, у0 = F(x0), E(z/o) — окрестность точки у0^ Y и G — отображение этой окрестности в Z. Тогда, если отображение F дифференцируемо в точке хо, a G дифференцируемо в точке уо, то отображение Н = GF (ко- торое определено в некоторой окрестности точки х0) дифферен- цируемо в точке хо и H'(x0) = G'(y0)F'(x0). (4) Действительно, в силу сделанных предположений F(x0 + l) = F(x0) + F' (ХоП + oi (Ю и G (у0 + П) = 6 (Уо) + G' (у0) т) + о2 (т)). Но F' (х0) и G'(y0) — ограниченные линейные операторы. Поэтому Н (Хо + В) = G (уо + F' (Хо) | + о, (I)) = G (уо) + G' (yQ) (F' (х0) I + + 01 (£)) + О2 (F' (Хо) | + о, (О) = G (уп) + G' (у0) F' (х0) I + о3 (|). (Проведите аккуратную выкладку сейб). Если F, G и Н— числовые функции, то формула (4) пре- вращается в известное правило дифференцирования сложной функции.
482 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. X 4. Пусть F и G — два непрерывных отображения, действую- щих из X в У. Если F и G дифференцируемы в точке х0, то и отображения F + G и aF (а — число) тоже дифференцируемы в этой точке, причем (F + G)'(х0) = F'(х0) + 6'(х0) (5) (aF)' (x0) = aF'(x0). (6) Действительно, из определения суммы операторов и произ- ведения оператора на число сразу получаем, что (F + G) (х0 + h) = F (х0 -j- h) + G (х0 + й) = = F (х0) + G (х0) + F' (х0) h + G' (х0) h + ok (й) и aF (х0 + h) = aF (х0) + aF' (х0) h + о2 (й), откуда следуют равенства (5) и (6). 2. Слабый дифференциал (дифференциал Гато). Пусть снова F есть отображение, действующее из X в У. Слабым дифферен- циалом или дифференциалом Гато отображения F в точке х (при приращении й) называется предел DF (х, й) = 4 F (х + th) I = lim л (х + th^ ~ F , 1/=0 /_>о I где сходимость понимается как сходимость по норме в простран- стве У. Иногда, следуя Лагранжу, выражение DF(x,h) называют первой вариацией отображения F в точке х. Слабый дифференциал DF(x,h) может и не быть линеен по й. Если же такая линейность имеет место, т. е. если DF(x, й) = Е'с(х)й, где F'c (х) — ограниченный линейный оператор, то этот оператор называется слабой производной (или производной Гато). Заметим, что для слабых производных теорема о дифферен- цировании сложной функции, вообще говоря, неверна. (Приве- дите пример!) 3. Формула конечных приращений. Пусть О — открытое мно- жество в X и пусть отрезок [х0, х] целиком содержится в О. Пусть, наконец, F есть отображение X в У, определенное на О и имеющее слабую производную F'c в каждой точке отрезка [х0, х]. Положив Дх = х— хо и взяв произвольный функционал <р е У*, рассмотрим числовую функцию f (^) = <р(Е (х0+ Мх)),
§ IJ ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ 483 определенную при Эта функция дифференцируема по t. Действительно, в выражении f (/ + М) — f (/) _ ( F (х0 + t Ьх + М Ьх) — F (х0 + t Ах) \ А/ А/ ) можно перейти к пределу под знаком непрерывного линейного функционала ф. В результате получаем f' (0 — Ф (Fc (х0 + t Ах) Ах). Применив к функции f на отрезке [0, 1] формулу конечных приращений, получим f (l) = f(0) + Г(0), где О<0<1, т. е. Ф (F (х) — F (х0)) = ф (Fc (хо + 0 Ах) Ах). (7) Это равенство имеет место для любого функционала ф е У* (ве- личина 0 зависит, разумеется, от ф). Из (7) получаем | ф(^(х) - F(x0)) | <||ф|| • sup || F'c (хо + 0 Ах) || • || Ах ||. (8) о < е< 1 Выберем теперь ненулевой функционал ф так, что Ф (F (х) - F (х0)) = || ф || • || F (х) - F (хо) || (такой функционал ф существует в силу следствия 4 теоре- мы Хана — Банаха (см. п. 3 § 1 гл. IV)). При этом из (8) по- лучаем || F (х) — F (х0) || < sup || Fc (хо + 0 Ах) || • || Ах || (Ах = х — х0). (9) о < е< 1 Это неравенство можно рассматривать как аналог формулы ко- нечных приращений для числовых функций. Применив формулу (9) к отображению х —> F (х) — Fc (хо) Ах, получим следующее неравенство: || F (х) — F (хо) — Fc(xo) Ах ||< sup || F'c (хо + 0 Ах) — F’c (х0) || • || Ах ||. о<е<1 (Ю) 4. Связь между слабой и сильной дифференцируемостью. Сильная и слабая дифференцируемость представляют собой раз- личные понятия даже в случае конечномерных пространств. Действительно, из анализа хорошо известно, что для числовой функции f(x) = f(xt...*п) при н > 2 из существования производной
484 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. X при любом фиксированном h = (йь ..., hn) еще не следует диф- ференцируемость этой функции, т. е. возможность представить ее приращение f(x-]-h)— f(x) в виде суммы линейной (по h) части и члена выше первого порядка малости относительно h. Простейшим примером здесь может служить функция двух переменных f (хь х2)— *1*2 X? + Х22 если (хь х2) =# (0, 0), (Н) 0, если (хь х2) = (0, 0). Эта функция непрерывна всюду на плоскости, включая точку (0,0). В точке (0,0) ее слабый дифференциал существует и ра- вен 0, поскольку lim <-»о f(O + ^)-f(O) = . f%ft2 t <->о + f2ft2 0. Вместе с тем этот дифференциал не является главной линей- ной частью приращения функции (11) в точке (0,0). Действи- тельно, если положить h2 — h2, то f(hvh2)-f(0, 0) lim ———---------------- цн-»о IIя» Однако если отображение F имеет сильную производную, то оно имеет и слабую, причем сильная и слабая производные сов- падают. Действительно, для сильно дифференцируемого отобра- жения имеем F (х + th) — F (х) = F' (х) (th) + о (th.) = tF' (х) h + о (th) и F (х + th) -FM = р, м h + лВ. _> р' (х) . Выясним условия, при которых из слабой дифференцируе- мости отображения F следует его сильная дифференцируемость. Теорема 1. Если слабая производная F'c (х) отображения F существует в некоторой окрестности U точки х0 и представляет собой в этой окрестности (операторную) функцию от х, непре- рывную в Хо, то в точке Хо сильная производная F'(x0) суще- ствует и совпадает со слабой. Доказательство. По е > 0 найдем б >0 так, чтобы при ||/i|| < б выполнялось неравенство: II F'c(x0 + h)~ F'c(x0) |К е.
$ 1] ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ 485 Применив к отображению F формулу (10), получим: II F (х0 + А) - F (хо) - F'c (хо) h || < < sup II F'c(xo + 0ft) — F'c (хо) II II ft IK e I! ft ||. o< i Тем самым имеет место (1), т. е. доказано как существова- ние сильной производной F'(x0), так и ее совпадение со слабой производной. В дальнейшем мы будем, если не оговорено противное, рас- сматривать такие отображения, которые дифференцируемы в сильном, а значит, и в слабом смысле. 5. Дифференцируемые функционалы. Мы ввели дифферен- циал отображения F, действующего из одного нормированного пространства X в другое нормированное пространство У. Произ- водная F'(x) такого отображения при каждом х— это линей- ный оператор из X в У, т. е. элемент пространства £(Х, У). В частности, если У — числовая прямая, то F — принимающая числовые значения функция на X, т. е. функционал. При этом производная функционала F в точке х0 есть линейный функ- ционал (зависящий от х0), т. е. элемент пространства X*. Пример. Рассмотрим в действительном гильбертовом про- странстве Н функционал F(x) — ||х||2. Тогда II х + ft ||2 — || х II2 = 2 (х, л) + II л II2; величина 2(х, й) представляет собой главную линейную (по й) часть этого выражения, следовательно, F' (х) = F'c (х) = 2х. Упражнение. Найти производную функционала || х || в гильбертовом пространстве. (Ответ: х/|| х || при х =/= 0; при х = 0 не существует.) 6. Абстрактные функции. Предположим теперь, что к число- вой прямой сводится пространство аргументов X. Отображение Е(х), сопоставляющее числу х элемент некоторого банахова пространства У, называется абстрактной функцией. Производ- ная F'(х) абстрактной функции (если она существует) пред- ставляет собой (при каждом х) элемент пространства У — каса- тельный вектор к кривой Е(х). Для абстрактной функции (пред- ставляющей собой функцию одного числового аргумента) сла- бая дифференцируемость совпадает с сильной. 7. Интеграл. Пусть F — абстрактная функция действитель- ного аргумента t со значениями в банаховом пространстве У. Если F задана на отрезке [а, Ь], то можно определить интеграл функции F по отрезку [а, А]. Этот интеграл понимается как пре- дел интегральных сумм п — 1 ZF(lk)(tk+i-tk), Л=»Э
486 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ ГГЛ. X отвечающих разбиениям а = /о<Л< ••• </„ = &, ^fe+iL при условии, что max(/ft+1 — Интеграл (представляющий, собой, очевидно, элемент из У) обозначается символом ь J F (/) dt. а Рассуждения, в значительной мере аналогичные проводимым для функций, принимающих скалярные значения, показывают,, что интеграл от функции, непрерывной на отрезке, существует; при этом он обладает свойствами обычного риманова интеграла. Среди этих свойств отметим следующие. 1. Если U— фиксированное линейное непрерывное отобра- жение пространства У в некоторое пространство Z, то ь ь ^UF(t)dt = U^F (t) dt. а а 2. Если F(t) имеет вид f(t)y0, где f(t) — числовая функция, а уо — фиксированный элемент из У, то ь ь J F (t)dt = уо J f (t) dt. (13> а а II & Ь 3. К F(t)dt < J||F(/)||c//. II а а Пусть снова X и У — нормированные пространства, а ВС(Х, У) — линейное пространство всех непрерывных ограни- ченных1) отображений X в У. В пространстве ВС(Х, У) можно ввести топологию, принимая за окрестности нуля множества t/„,E = {F: sup ||F(x)||<e}. 1! х II С п На подпространстве Z(X, У)cz ВС(Х, У) всех линейных непре- рывных отображений X в У эта топология совпадает с обычной топологией в Z(X, У), задаваемой операторной нормой. Пусть J = [х0, х0 -ф- Дх] — какой-нибудь прямолинейный отрезок в X. Допустим, что задано непрерывное отображение этого отрезка ’) Отображение F : X-э-У называется ограниченным, если для всякого ограниченного множества Q а X множество F(Q) ограничено в У. Нелиней- ное непрерывное отображение не обязательно ограничено.
§ 1) ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ 487 в пространство ВС(Х, У), т. е. что каждой точке хе / сопостав- лено некоторое отображение F(x)e ВС(Х, У), непрерывно зави- сящее от векторного параметра хе/. Тогда можно определить интеграл от F(х) по отрезку /, полагая х0+Дх 1 F (х) dx = F (х0 + Мх) (Ax) dt (14) Хо О (здесь F(x0 + t Ах) (Ах) при каждом t е [0, 1] есть элемент про- странства У, являющийся образом элемента Ах е X при отобра- жении F(xq + /Ax). Ясно, что интеграл, стоящий в правой части формулы (14), существует и является элементом простран- ства У. Применим эту конструкцию к восстановлению отображения по его производной. Рассмотрим отображение F, которое действует из X в У и имеет на отрезке [х0, х0+ Ах] непрерывно зависящую от х силь- Хо+Дх ную производную F'(x). Тогда существует интеграл F'(x)dx. Хо .Докажем, что имеет место равенство J F'(x)dx==F(x0 + Ax)- F(x0), (15) Хо обобщающее формулу Ньютона — Лейбница. Действительно, по определению, Хо+Дх га-1 ( F' (х) dx = lim У F' (х0 + tk Ах) (Ах) (tk+i — tk) =* j б->0 “ Xq «=о = lim У F'(xk)(Xxk), °-*0 *=о где Xk = хй + tk Хх, Xxk = (tk+l — tk)Xx и й = max (ZA+1 — 4). k Но в то же время при любом разбиении отрезка 0^ t 1 имеем П—1 F (х0 -ф Хх) — F (х0) = £ [F (х0 + tll+l Ах) — F (х0 + tk Ах)] = k=0 п — 1 = E[^(xft+1) —f(xj]. я=0
488 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ (ГЛ. X По формуле (10) получаем I п —1 Е [^ta+i) — F(xk) — F'(xk)\xk] < 11 fe=3 n— 1 <11 Ax II E (tk+i — tk) sup || F' (xk + 0* Ax*) — F' (xk) ||. a=o e (16> Так как производная F'(x) непрерывна, а следовательно, и рав- номерно непрерывна на отрезке [х0, х0 + Ах], правая часть нера- венства (16) стремится к нулю при неограниченном измельче- нии разбиения отрезка [Хо, х0 -ф Лх], откуда и вытекает равен- ство (15). 8. Производные высших порядков. Пусть F — дифференци- руемое отображение, действующее из X в Y. Его производная F'(x) при каждом х е X есть элемент из Z(X, У), т. е. F' есть отображение пространства X в пространство линейных опера- торов Z (X, У). Если это отображение дифференцируемо, то его производная называется второй производной отображения F и обозначается символом F". Таким образом, F" (х) есть элемент пространства Z (X, £ (X, У)) линейных операторов, действую- щих из X в £ (X, У). Покажем, что элементы этого простран- ства допускают более удобную и наглядную интерпретацию в виде так называемых билинейных отображений. Мы говорим, что задано билинейное отображение простран- ства X в пространство У, если каждой упорядоченной паре эле- ментов х, х' из X поставлен в соответствие элемент у = = В(х, х')е У так, что выполнены следующие условия: 1) для любых X], х2, х], х-2. из X и любых чисел а, 0 имеют место равенства: В (aXj + 0х2, xQ = аВ (хр х]) + 0В (х2, х(), В (Xj, ax] + 0х') = аВ (xu х() + 0В (хр х2); 2) существует такое положительное число М, что ||В(х, х')||<М||х||-||х'|1 (17} при всех х, х' е X. Первое из этих условий означает, что отображение В линей- но по каждому из двух своих аргументов; нетрудно показать, что второе условие равносильно непрерывности В по совокуп- ности аргументов. Наименьшее из чисел М, удовлетворяющих условию (17),. называется нормой билинейного отображения В и обозна- чается ||В|[. Линейные операции над билинейными отображениями опре- деляются обычным способом и обладают обычными свойствами-
и ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ 489 Таким образом, билинейные отображения пространства X в про- странство У сами образуют линейное нормированное простран- ство, которое мы обозначим В(Х2, У), При полноте У полно и В(Х2, У). Каждому элементу А из пространства S(X, S (X, У)) можно поставить в соответствие элемент из В(Х2, У), положив В(х, х') — (Ах)х'. (18) Очевидно, что это соответствие линейно. Покажем, что оно так- же и изометрично и отображает пространство S(X,S(X,Y)) на. все пространство В(Х2, У). Действительно, если у = : В (х, х') = (Ах)х', то Ili/IKII Ах|| • ||х'II <11 АII • ||х II. II х'||, откуда 1161К11ЛЦ. (19) С другой стороны, если задано билинейное отображение В, то при фиксированном хе.Х отображение х'-*(Ах)х' = В(х, х') есть линейное отображение пространства X в У. Таким образом, каждому хеХ ставится в соответствие эле- мент Ах пространства S(X, У); очевидно, что Ах линейно зави- сит от х, т. е. билинейное отображение В определяет некоторый элемент А пространства S (X, S’ (X, У)). При этом ясно, что ото- бражение В восстанавливается по А при помощи формулы (18) и II Ах 11 = sup || (Ах) х'||= sup || В (х, х') |К|| В || • || х ||, откуда 11А1КП5Ц- (20) Сопоставляя (19) и (20), получаем ||А|| = ||В||. Итак, соответ- ствие между В(Х2, У) и S(X, S(X, У)), определяемое равен- ством (18), линейно и изометрично, а следовательно, взаимно однозначно. При этом образ пространства S(X, S(X, У)) есть все В(Х2, У). Мы выяснили, что вторая производная F"(x) есть элемент пространства S (X, S (X, У)). В соответствии с только что ска- занным мы можем считать F"(x) элементом пространства В(Х2, У). Рассмотрим элементарный пример. Пусть X и У — конечно- мерные евклидовы пространства размерностей тип соответ- ственно. Тогда каждое линейное отображение X в У можно за- дать некоторой (и X т) -матрицей. Таким образом, производная В'(х) отображения F, действующего из X в У, есть (зависящая <от хеХ) матрица. Если в X и У выбраны базисы, скажем, eh ..., ет в X и fn в У,
490 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. к то х = XjCi 4-^2^2 + ••• +хтет, y = ylfl+y2f2 + ••• +ynfn- Тогда отображение у = F(x) можно записать в виде yi = Fl(xl, , хт), Уп = Рп(х1, хт), и Вторая производная F"(х) определяется в этом случае совокуп- 52(/. ностью п X tn X величин ak< ti — д д --. Такую совокупность величин аь, ц можно рассматривать как определяемое формулой т ^к, i “ X &к, ijXi i=l линейное отображение пространства X в пространство 3?(Х, У), или как определяемой формулой т У* = Ч UXiX'i билинейное отображение пространства X в У. Очевидным образом можно ввести понятие третьей, четвер- той и вообще /i-й производной отображения F, действующего из X в У, определив п-ю производную как производную от произ- водной (п—1)-го порядка. При этом, очевидно, п-я производ- ная представляет собой элемент пространства S’(X,Z’(X, ... . .., Z (X, У))). Повторяя рассуждения, проведенные для вто- рой производной, можно каждому элементу этого пространства естественным образом поставить в соответствие элемент про- странства Х(Хп, У) n-линейных отображений X в У. При этом под п-линейным отображением понимается такое соответствие- y = N(x', х", ..., х(п>) между упорядоченными системами (х', х", .. . , х<п)) элементов из X и элементами пространства У, которое линейно по каждому из х1' при фиксированных осталь- ных элементах и удовлетворяет при некотором М > 0 условию || N (х!, х", ..., х^) ||< М || х' || • || х" || ... 1| х^ ||. Таким образом, п-ю производную отображения F можно считать- элементом пространства Х(Хп, У).
§ 1] ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ 491 9. Дифференциалы высших порядков. Мы определили (силь- ный) дифференциал отображения F как результат применения к элементу АеХ линейного оператора F'(x), т. е. dF = F'(х) h. Дифференциал второго порядка определяется как d2F = = F"(х) (Ji, h), т. е. как квадратичное выражение, отве- чающее отображению F" (х) <= В (X2, У). Аналогично дифферен- циалом n-го порядка называется dnF=F(n>>(x) (h, h, . . ., h), т. e. тот элемент пространства У, в который элемент (ft, й, ..., ft) е е Х/ХХ ... XX = Р переводится отображением Нп)(х). 10. Формула Тейлора. Сильная дифференцируемость отобра- жения F означает, что разность F(x-\-h)—F(х) может быть представлена в виде суммы линейного члена и слагаемого, имеющего порядок выше первого относительно ||ft||. Обобщением этого факта является формула, аналогичная формуле Тейлора для числовых функций. Теорема 2. Пусть F — отображение, действующее из X в У, определенное в некоторой области ОсХи такое, что F<n)(x) существует и представляет собой равномерно непрерывную функцию от х в О. Тогда имеет место равенство /(x + ft)-F(x) = F'(x)ft + ^-F"(x)(ft, ft)+ ... ... +^F(n)(x)(ft......ft) + со(х, ft), (21) где ||co(x, ft) || = о(||йП. Доказательство будем вести по индукции. При и=1 равенство (21) тривиально. Возьмем теперь произвольное фик- сированное п и предположим, что равенство, получающееся из (21) заменой п на п—1, уже доказано для всех отображений, удовлетворяющих условиям теоремы, в которых п заменено на п — 1. Тогда для отображения F' имеем rix + h^F'^ + F" (,x)h + ^F"'(x)(h, ft)+ ... • • + ру~Т)! й) + (%, ft), (22) где ||е>1(х, ft)|| = o(||ft|ln-'). Интегрируя обе части равенства (22) по отрезку [х, х-фА] и пользуясь формулой Ньютона — Лейбни- ца (15), мы получим । 1 / (х -ф ft) — F (х) = J F' (х + /Л) Л dt = ( { F' (х) -ф tF" (х) й -ф о о + ±t2F"'(x)(h, .... h}]hdt + Rn, (23) I где Rn = coj (%, th) h dt. о
492 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. к Из (23) получаем F(x + h)- F(x)~ = F'(x)h + ±-F"(x)(h, h)+ ... +±-FM(x)(h, .... h) + Rn, причем i KK th) II - II ft 11^ = 0(11 ft ID- 0 Тем самым наше утверждение доказано. Формулу (21) называют формулой Тейлора для отобра- жений. § 2. Теорема о неявной функции и некоторые ее применения 1. Теорема о неявной функции. Одна из важнейших теорем: классического анализа, имеющая разнообразные применения,— это теорема о неявной функции. Мы сейчас покажем, что эта теорема переносится без больших изменений с числовых функ- ций на отображения произвольных банаховых пространств. Теорема 1. Пусть X, У, Z— банаховы пространства, U — окрестность точки (хо,Уо)^Х X У и F — отображение U в Z, об- ладающее следующими свойствами: 1. F непрерывно в точке (х0,у0). 2. F(x0, у0) = 0. 3. Частная производная F'y (х, у) существует в U и непре- рывна в точке (х0, z/о), а оператор F'y(xQ, у0) имеет ограничен- ный обратный. Тогда уравнение F(x,y) = 0 разрешимо в некоторой окрест- ности точки (х0,у0). Точнее это означает следующее: существуют такие е>0пб>0п такое отображение У = Цх), (1) определенное при ||х — х0|| < б и непрерывное в точке х0, что- каждая пара (х,у), для которой ||х — х0|| < б и y~f(x), удо- влетворяет уравнению F(x, у) = 0, (2) и обратно, каждая пара (х,у), удовлетворяющая уравнению (2) и условиям || х — х01| < б, || у — уо || е, удовлетворяет и (1). Доказательство. Обозначим через С7(Ж) сг У совокуп- ность тех у, для которых (х, у)е U при данном х. Будем счи- тать, что ||х — х0|| настолько мало, что уо е U&, и рассмотрим определенное на С7(Ж) отображение Л(Х>: А(Х)У = У~ [F'y (*<г //о)]"' F (х> У)- (3>
§2] ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 493 Ясно, что уравнение Ах)У = У равносильно уравнению F(x, у) = 0. Для доказательства существования решения уравнения (3) применим принцип сжимающих отображений. С этой целью по? кажем, что для каждого достаточно малого е > 0 найдется та* кое б ~> 0, что при ||х — х0|| < 6 отображение Л(Х) является сжи- мающим и переводит шар ||z/ — z/oll е в себя. Начнем с того, что вычислим и оценим по норме производную отображения Л(х). Имеем в силу формул (3) — (5) § 1: Аw (У) =1 “ Оо* F'v У) = = [< (*о> Уо)]"1 [Ру (Л- Уо) - Ру ’ У)]- В силу непрерывности производной Fy в точке (хо, Уо) можно выбрать 8 и б так, что №(у)11<<7< 1. Это неравенство вследствие формулы конечных приращений означает, что отображение Л(х) пространства Y при любом х, удовлетворяющем неравенству ||х—х0||<б на шаре ||г/—z/oll^e является сжимающим. Оценим теперь — */oll. Имеем: ».)]'! If(*. »«)!= =1И(^ ».)Г'1И(х, у.у-ру.. »»)Ц. В силу непрерывности отображения F в точке (хо, уо) последнее выражение можно сделать за счет выбора б сколь угодно ма- лым. Пусть б > 0 настолько мало, что II А*)Уо —УоИ< е(1 — <?) при || х0 — х || < б. Проверим, что при таком выборе б отображение А(Х) переводит замкнутый шар ||z/ — z/oll е в себя. Действительно, если ||х — Xoll < б и ||г/ — z/ol| 8, то из формулы конечных прира- щений получим II А(Х)У — Уо IK II Ах)Уо — Уо II + IIЛ(Х)У — А(х)у01| < <8(1-<7) + ° suf), ||Л[х)(r/oH-0(t/—х/0))Ц- ||//-у0||<в(1-<7)+е?=е. Итак, при ||х — Хо|| < б отображение Л(х) переводит замкну- тый шар ||г/—z/oll е в себя и является на этом шаре сжимаю- щим. Значит, в этом шаре существует единственная неподвиж- ная точка у* — f(x), т. е. точка, для которой У* = У*~ [Ру (*о> Уо)]"' Р U- У*).
494 ЭЛЕМЕНТЫ дифференциального исчисления ГГЛ. X т. е. в силу условия 3 теоремы F(x, /) = 0. Отображение f и есть искомое. Действительно, справедливость уравнения (2) уже проверена. Равенство f(x0) — у0 вытекает из единственности неподвижной точки для отображения А(Х»), а не- прерывность построенной функции f следует из того, что в при- веденных выше рассуждениях величина е может быть взята сколь угодно малой. Замечание. Нетрудно показать, что если в теореме 1 пред- положить отображение F непрерывным в окрестности U (а не только в точке (х0, Уо)), то соответствующее отображение f бу- дет непрерывно в некоторой окрестности точки х0. Нижеследующая теорема устанавливает условия, при кото- рых функция, определяемая уравнением вида F(x, у) = О, диф- ференцируема. Теорема 2. Пусть выполнены условия теоремы 1, и пусть, кроме того, в U существует частная производная F'x, непрерыв- ная в точке (х0, уо). Тогда отображение f дифференцируемо в точке х0 и f (*о)= (*о> Уо)] Fx (*о> Уо)- (4) Доказательство. Обозначим выражение, стоящее в (4) справа, через А. Оно представляет собой линейный оператор, действующий из X в У. Доказать, что этот оператор служит про- изводной отображения f в точке хс, это значит доказать суще- ствование для каждого 8 > 0 такого б > О, что при любом х таком, что ||х— Xoll < б, выполнено неравенство || f (х) — f (х0) — А (х — х0) || < е || х — х0||. (5) Полагая f(x) = у, и заменив f(x0) на уо, а оператор А — его вы- ражением (4), имеем f (x)-f (х0)—A (х—х0) = у-у0 + [F' (х0, у0)]~‘ Fx (х0, у0) (х-х0)= = (*0’ Уо)] {Fx (*0> Уо) (* *о) + Fy (*0> Уо) (у Уо)}- Но F(x, у) — F(x0, уо) = 0, поэтому с помощью формулы ко- нечных приращений получаем такую оценку: || f(x) — f (х0) — А (х — х0) || < ||[F'y (х0, г/о)]~11X Х| {F (х, у) F(xq, уq) Fx(xq, у^)(х х0) Fy(xQ, у^)(у Уо)}||^== < (*о- Уо)]”' I [0 <SUP <, || F'x (х0 + 0 (х - х0), у0 + 0, (у - у о)) - - Fy (*о> Уо)II • IIх - *01| + 0 , !ЦР ,IIFy (хо + 0 Iх - *о)> Уо + е1 (у - Уо)) - F'y (*о> У о) II • II У - Уо II ] < П [ II* “ *о|| + ||У “ У oil ]>
ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 495 § 21 где величина ц может быть сделана сколь угодно малой в силу непрерывности производных Fx и Fy, если величина б доста- точно мала. Таким образом, мы получили, что II f(x) — f (х0) — Л (х — х0) НСТ][|| х — х0 II + II f(x) — f (х0) II ] < < Т] [ IIX — х0 II + II Л (х — х0) II + II f (х) — f (х0) — Л (х — х0) II]. Отсюда при достаточно малом ц получаем II Ж - f W - Л (х - Хо) II < n (1 - nF1 (1 + II Л II) II х - х0 II, и для доказательства неравенства (5) остается лишь выбрэть ц так, что т)(1 —т))-1(1 + 11Л||) е е. Теорема доказана. Рассмотрим теперь некоторые применения теоремы о неяв- ной функции. 2. Теорема о зависимости решения дифференциального урав- нения от начальных данных. Рассмотрим задачу Коши для диф- ференциального уравнения dx/dt = f(t, х), x(t0) = x0, (6) где f(t,x) и х — элементы некоторого банахова пространства Е. Задача (6) равносильна интегральному уравнению t х (t) — х0 — f (т, х (r))dr = 0. (7) *0 Запишем это уравнение как F(x0, x(t)) = 0. Таким образом, F — это оператор, отображающий прямую сумму пространства Е и пространства Се[^о,6] непрерывно дифференцируемых функций со значениями в Е в пространство Се [Cj, 6]. Если функция f(t,x) непрерывна и имеет непрерывную по (t, х) производную, то вы- ражение t х (0 — f (т, х (т)) dx ^0 определяет дифференцируемое отображение пространства Се По, 6] в себя. Следовательно, и Е(х0, х(0) есть дифференци- руемый по x(t) оператор, а так как х0 входит в Е(х0, х(^)) ад- дитивно, то F есть дифференцируемая функция на EXCftty. 6]. Дифференциал этой функции по х имеет вид F'xh = h (t) — f 'х (т, х (т)) h (т) dx. (8) ^0
495 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. X Правая часть этого равенства определяет оператор, отображаю- щий СЁ [/о, й] в себя. Этот оператор обратим. Действительно, для любой функции у (t) е Се[/0, /1] уравнение F'xh (t) = y (/), или t h (t) — f'x (т, x (т)) h (т) dx = у (О, равносильно дифференциальному уравнению ^-fat,x(t))h(t) = y'(fy (9) с начальным условием h(t0)= y(to). Уравнение (9) — это линейное уравнение с непрерывными коэффициентами, поэтому в силу известных теорем (см. [24]) существует единственное решение этого уравнения, определен- ное на всем отрезке [/о, Л] и удовлетворяющее указанному выше начальному условию, а это и означает обратимость опера- тора F'x. Полученный результат означает, что к уравнению F (х0, х (/)) = О применима теорема о неявной функции. В силу этой теоремы решение х — x(t) данного уравнения, которое может рассматри- ваться как функция переменного начального значения х0: х == — x(t,x0), дифференцируемым образом зависит от х0. В част- ности, принимая за Е конечномерное пространство, мы получаем обычную теорему о непрерывной дифференцируемой зависимо- сти решения системы дифференциальных уравнений от началь- ных условий. Аналогичным образом с помощью теоремы о неявной функ- ции может быть получено утверждение о дифференцируемой за- висимости решения дифференциального уравнения ^=f(t,x,a) от параметра а, если его правая часть дифференцируемым об- разом зависит от а. 3. Касательные многообразия. Теорема Люстерника. В каче- стве еще одного применения теоремы о неявной функции рас- смотрим следующий вопрос. Пусть F(x), где х — (хь х2), — диф- ференцируемая функция на плоскости. Уравнение F(x)=0 оп- ределяет на плоскости некоторую кривую С. Пусть х0 — точка, принадлежащая этой кривой. Касательная к кривой С в данной точке может быть определена либо как совокупность векторов
ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ 437 § 2] вида х0 + th, где h— вектор, перпендикулярный вектору F'(хо) (т. е. градиенту функции F в точке х0), либо как совокупность точек + th, расстояние которых до кривой С есть бесконечно малая выше первого порядка относительно t. Содержание тео- ремы Люстерника состоит в том, что эквивалентность двух оп- ределений касательной имеет место и для многообразий в произ- вольных банаховых пространствах. Введем некоторые понятия и обозначения, необходимые для точной формулировки соот- ветствующей теоремы. Пусть X и Y — банаховы пространства и F— отображение пространства X в У. Пусть далее Мо — совокупность точек из X, удовлетворяющих уравнению F(x)=0, и х0 е Мо. Предполо- жим, что отображение F непрерывно дифференцируемо в неко- торой окрестности U точки хо. Мы назовем отображение F ре- гулярным в точке хо, если линейный оператор F'(x0) отображает пространство X на все У. Обозначим через То совокупность элементов h е X, удовле- творяющих условию F' (х0)й = 0, т. е. То— КегАДхо). Ясно, что То есть подпространство в X. Сдвиг этого подпространства на вектор хо, т. е. многообразие хо+ То, обозначим через Ти на- зовем линейным многообразием, касательным к множеству Мо в точке х0. Имеет место следующая теорема. Теорема 3 (Л. А. Люстерник). При указанных выше усло- виях относительно F элемент хо + h принадлежит касательному многообразию Тх, в том и только том случае, если расстояние элемента хо + th от множества Мо есть величина выше первого порядка малости относительно t. Эта теорема играет очень важную роль в задачах оптималь- ного управления. Она служит инструментом, с помощью которо- го известное правило множителей Лагранжа нахождения услов- ного экстремума может быть распространено на широкий круг экстремальных задач в банаховых пространствах. Сколько-нибудь полное изложение этих вопросов выходит за рамки настоящей книги (о них см., например, в книге: А. Д. Иоффе и В. М. Тихомиров, Теория экстремальных задач, М., «Наука», 1974). Мы ограничимся тем, что проведем доказательство теоремы Люстерника для так называемого «раз- ложимого» случая, в котором теорема Люстерника почти не- посредственно вытекает из теоремы о неявной функции. Именно, предположим, что пространство, на котором определено отобра- жение F, может быть разложено в прямую сумму А’=Г0®Л подпространства То = Кег F'(xa) и некоторого пространства Т%. (Заметим, что в банаховом пространстве, отличном от гильбер- това, не всякое подпространство имеет прямое дополнение. Бо-
•498 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. X лее того, можно показать, что если в пространстве X всякое линейное подпространство имеет прямое дополнение, то X — гильбертово пространство.) При этом предположении теорема 3 может быть сформули- рована следующим более точным образом. Теорема 4. Если Х=Т0®Тъ и отображение F : X -> У удовлетворяет указанным выше усло- виям, то существует такое гомеоморфное отображение окрест- ности точки Хо в Мо на окрестность этой же точки в ТХа, что расстояние между соответствующими друг другу точками есть величина высшего порядка малости по сравнению с их расстоя- ниями до точки Хо- Доказательство. Обозначим через А оператор F'(x0)> рассматриваемый только на подпространстве 7\, т. е. Xg = F'(x0)g при Покажем, что А отображает 7\ на все У. Действительно, по ус- ловию каждый элемент из X имеет вид x = h+l, h<=To, Поэтому F'(xo)x = F'(xo)(h + £)==F'(xon = Al, (10) так как F'(x0)h — 0. Но по условию F'(x0) отображает X на все У, а этб и означает, что Hg пробегает все У, когда g пробе- гает Т\. Далее отображение A: Ti->Y взаимно однозначно, так как, если /lgi = /4g2, т. е. F'(x0) (gj—g2) = — 0, то gi — g2 е То, откуда gi — g2 = 0. Итак, оператор А об- ратим и по теореме Банаха обратный оператор Л'1 линеен и ограничен. Представив каждый элемент х е X в виде x = x0-]-h-]-l, h^T0, перепишем уравнение F(x) = 0, определяющее многообразие М, так: Ф(й, g) = F(.vo + /i + g) = O. Частный дифференциал этой функции в точке (0,0), отвечаю- щий приращению Ag второго аргумента, имеет вид Фе (0,0) Ag = F'(x0)Ag = XAg.
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ 499 § 3j Оператор Л = Ф£(0, 0) имеет обратный, поэтому в силу теоре- мы о неявной функции уравнение Ф(й, £) = 0 в некоторой окрестности точки (0,0) равносильно уравнению вида где ф(й)— дифференцируемое отображение, удовлетворяющее условию ф (0) — 0. Мы получили, что каждая точка х е Мо, достаточно близкая к точке хо, имеет вид х = х0 +й + ф(й), йеД Т$. Тем самым построено отображение х0 + h х0 + h + ф (й) рекоторой окрестности точки х0 в Тх0 на окрестность той же точ- ки в Мо. Это отображение взаимно однозначно и непрерывно. Остается показать, что расстояние между соответствующими друг другу точками, т. е. величина ||т|>(й)||, имеет высший поря- док малости по сравнению с ||й||. Дифференцируя равенство Ф(й, 4>(й)) — 0, имеем: ф; (о, о) й + ф| (о, о) ф' (о) й = ф; (о, о) й + (о) й = о, откуда ф' (0) й = — А~' Фл (0, 0) й = — A~'F' (х0) й = 0. Поэтому в равенстве ф(й) = ф(0) + ф,(0)й + о(||й||) лервые два слагаемых справа равны нулю, т. е. "Ф (й) = о (II й II), -что и требовалось. Теорема доказана. § 3. Экстремальные задачи Один из самых старых и наиболее разработанных разделов нелинейного функционального анализа — нахождение экстрему- мов функционалов. Изучение таких задач составляет содержа- ние так называемого вариационного исчисления. Боль- шинство методов, существующих в вариационном исчислении, связано со специальным видом тех функционалов, экстремаль- ные значения которых ищутся. Однако некоторые общие прие- мы и результаты могут быть сформулированы и для более или менее произвольных функционалов. Не ставя себе здесь задачи сколько-нибудь полного изложения вариационных методов, мы
500 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. X ограничимся кратким рассмотрением элементов общей теории, лежащих в основе вариационного исчисления. 1. Необходимое условие экстремума. Пусть F— некоторый действительный функционал, определенный на банаховом про- странстве X. Говорят, что функционал F достигает в точке х0 ми- нимума, если для всех х, достаточно близких к х0, выполнено не- равенство F(x)—F(xq)^0. Аналогично определяется максимум функционала. Если в данной точке %о функционал F достигает минимума или максимума, то мы будем говорить, что в этой точке функционал F имеет экстремум. К отысканию экстремумов тех или иных функционалов могут быть сведены многие физические и механические задачи. Для функций п переменных хорошо известно следующее не- обходимое условие экстремума: если функция f дифференцируе- ма в точке х0 = (х®, х?2..х«) и имеет в этой точке экстре- мум, то в этой точке df = 0 или, что равносильно, _ <?f __ df _п dxt дхг ‘ ’ дхп Это условие легко переносится на функционалы на произволь- ном нормированном пространстве. Теорема 1. Для того чтобы дифференцируемый функцио- нал F достигал в точке х0 экстремума, необходимо, чтобы его дифференциал в этой точке равнялся нулю при всех /и Г(хо)й=О. Иначе говоря, необходимо, чтобы F' (xa) — Q. Доказательство. По определению дифференцируемости имеем Е(х0 + й)-Е(х0)==Е'(х0)Л + о(/г). (1) Если F/(Xo)ft#=O для некоторого h, то при достаточно малых действительных X знак всего выражения F'(x0) (Хй) + о(Хй) сов- падает со знаком его главного члена F'(x0) (Mi). Но F'(x0)— ли- нейный функционал, поэтому F'(x0) (Mi) = KF'(x0)h. Следова- тельно, если F'(x0)h=/= 0, то выражение (1) может принимать при сколь угодно малых h как положительные, так и отрица- тельные значения, т. е. экстремума в точке х0 быть не может. Рассмотрим некоторые примеры. 1. Пусть & F(x)=\f(t,x(t))dt, (2) а где f — непрерывно дифференцируемая функция. Этот функ- ционал, рассматриваемый в пространстве С [а, Ь] непрерывных
§ 3] ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ 501 функций на отрезке [а, А], дифференцируем. Действительно, F (х + А) — F (х) = ь ъ = $ [f (t, x(t) + h (/)) - f (t, X (/))] dt=\f'x (t, x (/)) h (t) dt + o (A), a a откуда & dF = x(t))h(t)dt. a Равенство нулю этого линейного функционала для всех h е С [а, Ь] означает, что f'x (t, х (/)) = 0. Действительно, при вся- ком х(/)се С[а, Ь] производная f'x (t, x(t)) есть непрерывная функ- ция от t. Если в какой-то точке to она отлична от нуля, скажем, f 'x Со’ х (Q) > О’ т0 эт0 неРавенство имеет место и в некоторой окрестности (а, 0) точки to. Тогда, положив , .. ( (/ —а)(₽ —0 при А (/) = < п , (, 0 при остальных t, получаем x)h(t)dt>Q. а Полученное противоречие доказывает наше утверждение. Урав- нение f'x(t,x) = O определяет, вообще говоря, некоторую кри- вую, на которой функционал (2) может достигать экстремума. 2. Рассмотрим на том же пространстве С [а, А] функционал ь ъ Ж = $ ^x^x^d^dU, (3) а а где /C(gi, g2)—непрерывная функция, удовлетворяющая усло- вию /<(£1, £2)= ^(£2,£i)- Нетрудно подсчитать, что дифферен- циал этого функционала равен ь ь dF=2 \ \K^A2)xd)h(l2)d^dl2. а а Если при всяком АеС[а, А] это выражение равно нулю, то в силу рассуждений, проведенных в примере 1, имеем ь К (h, I2) х (h) dh =0 для всех %2, а<£2<А.
592 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. X Одно из решений этого уравнения — функция х = 0. Ответ на вопрос о том, имеется ли в этой точке экстремум и суще- ствуют ли другие точки, в которых экстремум возможен, зави- сит от вида функции £2) и требует дополнительного иссле- дования. 3. Рассмотрим функционал ь F(x) = \f(t,x(t), (4) а определенный на пространстве С1 [а, й] непрерывно дифференци- руемых функций на отрезке [а, &]. Здесь х' (/) = ~-Х^ , a f(t, х, х') — дважды дифференцируемая функция своих аргу- ментов. Функционал (4) играет основную роль во многих вопро- сах вариационного исчисления. Найдем его дифференциал. Пользуясь формулой Тейлора, получаем ь F (х. А) — F (х) = j (/, х -ф h, х' + h') — f (/, x, x')] dt — a b = \(f'xh + f'x,h')dt + o(\\h\\), a где ||й|| — норма функции h как элемента пространства С1 [а, &]. Итак, необходимое условие экстремума для функционала (4) имеет вид ъ dF=\(f'xh + f'x,h')dt = O. (5) а В такой интегральной форме это условие мало пригодно для на- хождения той функции х, на которой достигается экстремум. Преобразуем его к более удобному виду, проинтегрировав в (5) член f'x,h' по частям *). Получим & fab \f'xh'dt = f'x,h\a-\h-^f'x,dt. а а !) Эта операция требует дополнительного обоснования, поскольку суще- d j ствование производной х , входящей в выражение не предполагается, , См. по этому поводу любой курс вариационного исчисления.
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ 503 § 3] Таким образом, dF=\(f'x--^f'X')hdt + f'x,h[ = O. (6> а Это равенство должно выполняться при всех h, в том числе и таких, для которых h(a) = h(b)= 0. Следовательно, ь И?«-4^)',л=0 а при всех h, для которых /г(а)= h(b)— 0, откуда, в силу рассу- ждений, аналогичных проведенным в примере 1, получаем Поэтому равенство (6) сводится к fX'h\a=Q- (8) Если функционал (4) рассматривается на всех непрерывно диф- ференцируемых функциях х, определенных на [а, &], то мы мо- жем взять h. так, что /г(ц)=0, /г(Ь)У=О, и тогда из равенства (8) получим Д|,.ь=о. Го а положив h(b) = 0, /г(а) =/= 0, получим Д1,.„=<> (Го Таким образом, из условия (6) (т. е. из равенства нулю диффе- ренциала функционала (4)) вытекает, что функция х, на кото- рой функционал (4) достигает экстремума, должна удовлетво- рять дифференциальному уравнению (7) и граничным условиям (9), (10) на концах отрезка [а, &]. Общее решение дифферен- циального уравнения второго порядка содержит две произволь- ные постоянные и в нашем распоряжении оказывается как раз то число граничных условий, которое нужно для отыскания этих постоянных. 2. Второй дифференциал. Достаточные условия экстремума функционала. Вернемся снова к нахождению экстремума функ- ции п переменных. Пусть для функции f(xh .... хп) в точке (xf, ..., *„) выполнено условие df = 0. Тогда, как известно, для решения вопроса о том, действительно ли в данной точке имеет- ся экстремум или нет, следует рассмотреть второй дифферен- циал. Именно, справедливы следующие утверждения.
504 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ, X 1. Если функция f (хь ..., хп) имеет в точке (х?..х°) ми- нимум, то в этой точке d2f 0. (Аналогично, если в точке {Хр ..х°) имеется максимум, то в этой точке d2f 0.) 2. Если в точке (х°, .х°) выполнены условия п df = O и d2f — £ дх дх. dxt dxk > 0 i, ft=t * й (когда не все (/х< = 0), то в этой точке f(x) имеет минимум (аналогично максимум, если d2f < 0). Короче говоря, неотрицательность второго дифференциала необходима, а его положительная определенность доста- точна для минимума. Посмотрим, в какой мере эти факты переносятся на функ- ционалы, заданные на банаховом пространстве. Теорема 2. Пусть F — действительный функционал, задан- ный в банаховом пространстве X и имеющий в некоторой окрест- ности точки х0 непрерывную вторую производную. Если этот функционал достигает в точке хо минимума, то d2F(xo)^O1). Доказательство. По формуле Тейлора получаем F (х0 + h) - F (х0) = F' (х0) h + 4 F" (х0) (h, h) + о (|| h ||2). Если в точке хо функционал F имеет минимум, то К'(хо) = О и остается равенство F (х0 + h) - F (х0) = у F" (х0) (h, h) + о (|| h IP). (II) Если при каком-либо h выполнено неравенство F"(x0)(h,h)<0, (12) то, поскольку F"(x0) (eh, eh) = е2 F"(x0) (h, h), существуют и сколь угодно малые по норме элементы h, для которых выполне- но (12). Но при достаточно малых ||/г|| знак всего выражения (11) определяется знаком главного члена F" (х0) (h, h), и мы получаем F (х0 + h) - F (х0) = 4 F" W (Л> ^) + о (|| Л И2) < 0, т. е. минимума в точке хо нет. Аналогичную теорему можно сформулировать для макси- мума. Доказанная теорема есть прямое обобщение соответствую- щей теоремы для функций конечного числа переменных. Иначе ’) Это неравенство означает, что F"(xa)(h,h) 0 для всех h.
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ 505 § 3] обстоит дело с достаточным условием. Упомянутое выше усло- вие F"(х0) (Л, h) > 0, достаточное для минимума в случае функ- ции п переменных, не является достаточным для функционалов, определенных на банаховом пространстве бесконечного числа измерений. Рассмотрим простой пример. Пусть в гильбертовом пространстве /2 задан функционал оо 2 00 F w Е ~ Е х«- п=1 М=1 В точке 0 первый дифференциал этого функционала равен 0, а второй — ряду 2 , т. е. представляет собой положитель- п=1 но определенный функционал. Тем не менее, в точке 0 нет ми- нимума, так как F (0) = 0 и F (0, .. ., 0, 1/п, 0, .. .) = 1/п5 — п—1 — 1/п4 < 0. Следовательно, в любой близости от точки 0 суще- ствуют точки, в которых F(x) < F(0). Введем следующее понятие. Квадратичный функционал В называется сильно положительным, если существует такое по- стоянное число с > 0, что В(х, х)^ с||х||2 для всех х. Теорема 3. Если функционал F, определенный в банаховом пространстве X, удовлетворяет условиям 1) df(x0) = 0, 2) d2F(x0)~ сильно положительный квадратичный функцио- нал, то F имеет в точке х0 минимум. Доказательство. Пусть F" (х0) (h, А) с||А||2. Выберем е>0 настолько малым, чтобы при ||А|| <; е величина о(||А||2) в равенстве (11) удовлетворяла условию | о (|| h ||2) | < -j-1| А ||2,. Тогда F (х0 + h) - F (х0) = 1 F" (х0) (А, А) + о (|| h If2) > | \\ h |р > 0 при || h || < е. В конечномерном пространстве сильная положительность квадратичной формы эквивалентна ее положительной опреде- ленности, поэтому (при равенстве нулю первого дифференциала) положительная определенность второго дифференциала доста- точна для экстремума функции. В бесконечномерном случае (как показывает приведенный выше пример) сильная положи- тельность есть более сильное условие, чем положительная опре- деленность. Условие сильной положительности второго дифференциала, гарантирующее минимум, удобно тем, что оно применимо к лю- бому дважды дифференцируемому функционалу (независимо от1
503 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. X его конкретного вида) в любом банаховом пространстве. Вме- сте с тем это условие обычно оказывается слишком грубым и трудно проверяемым в практически важных случаях. В вариа- ционном исчислении устанавливаются более тонкие достаточные условия экстремума (использующие конкретный вид тех функ- ционалов, которые рассматриваются в вариационных задачах); однако изложение этих вопросов не входит в задачу данной книги. 3. Экстремальные задачи с ограничениями. Выше речь шла о нахождении экстремума для функционалов, заданных на всем пространстве, т. е., как обычно говорят, об экстремальных зада- чах без ограничений. При наличии тех или иных ограничений, определяющих ту область, на которой задан рассматриваемый функционал, утверждения, приведенные в пп. 1 и 2, вообще го- воря, несправедливы. Это видно уже на простейшем примере функции, заданной на отрезке: если такая функция достигает экстремума в граничной точке, то ее первый дифференциал в этой точке может быть отличен от нуля, а знак второго диффе- ренциала может быть любым. Рассмотрение экстремальных за- дач при наличии ограничений составляет обширную и важную область математики, включающую такие разделы, как класси- ческое вариационное исчисление, оптимальное управление, ли- нейное и выпуклое программирование и т. д. Мы здесь ограни- чимся тем, что приведем лишь один результат. Его доказатель- ство основано на применении теоремы Люстерника, играющей важную роль во многих вопросах теории экстремальных задач. Пусть X и Y— банаховы пространства, F— функция на X и Ф: X -> У— отображение пространства X в У. Допустим, чго ищется минимум функции F (х) на множестве, определяемом условием Ф(х) = 0. Теорема. Пусть функция F и отображение Ф непрерывно дифференцируемы в некоторой окрестности точки х0, удовлетво- ряющей условию ф(хо)=О, и пусть образ пространства X при отображении Ф'(х0): X-> У замкнут. Если в точке х0 достигает- ся локальный минимум функции F (х) на множестве {х: Ф(х) = = 0), то существуют число Хо и линейный функционал у*, опре- деленный на У, не равные нулю одновременно и такие, что ЯоЕ(хо) + [Ф'(хо)Г/ = О. (13) Доказательство. Введем обозначение А = Ф/(х0)Х. По условию L — замкнутое подпространство. Если Z, У, то, со- гласно следствию 3 теоремы Хана — Банаха (п. 3 § 1 гл. IV) найдется ненулевой функционал у$ е У*, равный нулю на L. Для него при всех xg X имеем ([Ф'(хо)ГУо, х) = (уо, Ф' (хо)х) = О, так как Ф'(х0)х<=£. Поэтому, приняв уо за у* и положив Хо = 0, получаем (13).
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ 507 § 3] Рассмотрим теперь случай, когда Ф(х0)Х=У. Применив к отображению Ф теорему Люстерника, получаем, что для ка- ждого h е X, удовлетворяющего условию Ф' (х0) А = 0, при всех достаточно малых t существует такой элемент х (/, /г) = х0 4* th 4* г (/), что Ф(х(/, А))==0, Г11| г (t) || -* 0 при /->0. Рассмотрим функцию f(t) = F(x(t, ft)). Ее производная в нуле должна быть равна нулю. Действительно, если F' (х0) й = с 4 0, то знак разности F (х (t, ft)) — F (х0) = ct + F' (х0) г (() 4- о Ц) определяется членом ct и, следовательно, меняется при замене t на —t, а при этом в точке х0 не может быть экстремума. Итак, мы получаем, что F'(x0')h = t} для всех h таких, что h е КегФ'(хо). Иначе говоря, F'(х0) есть элемент из X*, ортого- нальный подпространству Кег Ф'(х0) cz X. Но, согласно лемме об аннуляторе ядра оператора (см. стр. 232) [КегФ' (хо)Н = 1т[Ф'(хо)Г. Это означает, что если F'(x0) е [Кег Ф'(хо)]-1, то найдется такой функционал у* е У*, что F'(х0) = — [Ф'(х0)]* у*. (14) Положив %о = 1 и взяв тот функционал у*, для которого выпол- нено равенство (14), мы и получим (13). Доказанная теорема представляет собой бесконечномерное обобщение известного из классического анализа правила множи- телей Лагранжа для задач на условный экстремум. Действи- тельно, если X и У — конечномерные пространства, т. е. если ищется минимум функции f0(x,.......хп) при условиях f;(xb ... . .., *п)= 0, i = 1, 2...пг, то функционал у*—это система пг чисел Ai.....Хщ. Условие замкнутости образа пространства X
508 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. X в У при линейном отображении в конечномерном случае выпол- нено автоматически. Равенство (13) при этом превращается в зд0)=°- (=0 4 ' т. е. в известное правило Лагранжа для нахождения условного экстремума. § 4. Метод Ньютона Одним из хорошо известных методов решения уравнений вида f(x) = O (1) (f — числовая функция числового аргумента, определенная на некотором отрезке [а, 6]) является так называемый метод Нью- тона, или метод касательных. Он состоит в \f^Xj том, что по рекуррентной формуле V х„+1 = хп — ^((хп^ (2) 1 \\ ищутся последовательные приближения к । \ \ решению. (За нулевое приближение х0 при I \ । \ этом берется произвольная точка того от- ! \ резка, на котором f определена.) Геометри- ‘ х, веский смысл этого метода иллюстрируется \ рис. 24. Можно показать, что если х* — единственный корень уравнения (1) на от- Рис. 24. резке [а, Ь] и функция f имеет на этом отрез- ке не обращающуюся в нуль первую про-^ изводную и ограниченную вторую производную, то существует «область притяжения корня х*», т. е. такая окрестность точки х*, что при любом выборе точки хо в этой окрестности последо- вательность (2) сходится к х*. Метод Ньютона может быть перенесен на операторные урав- нения. Мы изложим его для уравнений в банаховых простран- ствах. Рассмотрим уравнение FW = 0, (3) где F— отображение банахова пространства X в банахово про- странство У. Предположим, что отображение F сильно диффе- ренцируемо в некотором шаре В(х0, г) радиуса г (центр кото- рого хо мы примем за нулевое приближение искомого решения). Заменяя, как и в одномерном случае, выражение F(x0)—F(x)
МЕТОД НЬЮТОНА 509 § 4] его главной линейной частью, т. е. элементом F'(x0) (х0— х), мы получаем из (3) линейное уравнение F' (х0) (х0 — х) = F (х0), решение которого х1 = х0 — [F' (х0)]-‘ Е(х0) естественно рассматривать как следующее приближение к точ- ному решению х уравнения (3) (существование оператора [Г(хо)]-1 здесь, конечно/предполагается). Повторяя те же рас- суждения, мы получаем последовательность хп+1=хп~ [F'(xn)]~l(F(xn)) (4) приближенных решений уравнения (3). В бесконечномерном случае нахождение обратного оператора [F'(хп)]-1 может быть достаточно сложной задачей. Поэтому здесь бывает целесооб- разно пользоваться так называемым модифицированным мето- дом Ньютона (см. [27, 28]). Модификация состоит в том, что вместо последовательности (4) рассматривается последователь- ность, определяемая формулой х„+1 = х„-[Е'(хо)]"1(Е(х„)), (5) т. е. обратный оператор [Е'(хо)]"1 берется на каждом шаге при одном и том же значении аргумента х = х0. Хотя такая модифи- кация уменьшает скорость сходимости, она часто оказывается целесообразной с вычислительной точки зрения. Перейдем те- перь к формулировке и доказательству точного утверждения. Теорема 1. Пусть отображение F сильно дифференцируемо в некотором шаре В(х0,г) с центром х0 и радиусом г, а произ- водная F(x) удовлетворяет в этом шаре условию Липшица-. ||F'(x,)-F'(x2) IK ill M-*2II. Пусть [F'(xo)]-1 существует и М = ||[F' (х0)]-*||, Ml И'К)]"1 F(xo)||, h — MkL. Тогда, если h < ’/4, то в шаре ||х — х0|| <5 kta, где t0 —мень- ший корень уравнения ht2 — t -f- 1 =0, уравнение F(x) = 0 имеет единственное решение х* и последовательность {хп}, определяе- мая рекуррентной формулой (5), сходится к этому решению. Доказательство. Рассмотрим в пространстве X отобра- жение Ах = х — [P/(xo)]_|F(x). Его сильная производная равнаО в точке хо. Это отображение переводит шар ||х — х0|| ktQ в себя. Действительно, Ах — х0 = х — х0 — [F' (х0)]“' F (х) = = If'(хо)]"’ {F' (х0) (х - х0) - Е(х) + Е(х0)} - [F' (хо)]~‘Г(хо).
5!0 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. X Поэтому II Дх — х0 || <||[^ (хо)Г' II • II /?'(хо)(х - Хо) - F(x) 4- F(x0) || + + 11 [F'(xo)]"1 F<M т. е. || Ах — х0 |К М || F' (х0) (х — х0) — F (х) + F (х0) || + k. (6) Рассмотрим вспомогательное отображение Ф (х) = F (х) — F (х0) — F' (х0) (х — х0). Оно дифференцируемо и его производная равна Ф'(х) = = Е'(х)— F'(x0). Если ||х — Xoll < kt0, то имеет место оценка II Ф' (х) II = II F' (х) - F' (х0) || < L || х - х01| < Ltji. Отсюда по теореме о среднем (формула (9) § 1) получаем || Ф (х) II = || Ф (х) - Ф (х0) || < Lt Ji 11X - х01 < Lt2k2. (7) Итак, если || х — х01| ^/0£, то из (6) и (7) получаем || Ах - х0| < MLFJi2 + k = k (MLt2k + 1) = k {ht2 + 1) = kt0, а это и означает, что отображение А переводит шар ||х — х0|| kt0 в себя. Покажем теперь, что А —сжимающее отображе- ние этого шара. При ||х — х0|| sC kt0 имеем A' {x] = I- [F (х0)]-' F’ (х) = [F' (хо)Г' (F' (х0) - F' (х)), г ткуда || А' (х) ||< М || F' (х0) - F' (х) ||< ML || х - х01| < MLkt0. Но to — меньший корень уравнения ht2 — / + 1 = 0, т. е. tQ = = -—. Поэтому || А' (х) I! < MLkt0 = Af0 = А = <7 < 1, (8) откуда || ДХ] — Дх21| < у IIX! — х2 II, т. е. Л—сжимающее отобра- жение. Следовательно, отображение А имеет в шаре ||х — х0|| kt0 одну и только одну неподвижную точку х*. Для этой точки х* = х* - [Г (х0)]-1Е(х‘), т. е. Е(х‘) = 0. Вместе с тем Ахп = хп — [Е'(хо)]-'Е(хп) = Хп+1
МЕТОД НЬЮТОНА 51! § 4] и, в силу теоремы о сжимающих отображениях, последователь- ность {х„} сходится к х*. Из неравенства (8) сразу вытекает следующая оценка скоро- сти сходимости модифицированного метода Ньютона: II хп - х II < [Г (Хо)] F (х0) I, (9) т. е. погрешность модифицированного метода Ньютона убывает как геометрическая прогрессия. Отметим для сравнения, что обычный метод Ньютона [в котором приближения определяются формулой (4), а не (5)] сходится быстрее, чем геометрическая прогрессия: для этого метода 1|ХЛ - х‘||^ ^(2/1)^-' k. Пример. Рассмотрим нелинейное интегральное уравнение ь x(s)=^K(s, t, x(t))dt, (10) а где K(s, t, и)—непрерывная и непрерывно дифференцируемая функция своих аргументов. Введя отображение у = F(x), опре- деляемое равенством ь у (д) = х (s) — j К (s, t, х (/)) dt, a запишем уравнение (10) в виде F(x)—0. Пусть х0 — нулевое приближение для решения этого уравне- ния. Тогда первая поправка Ax(s) = x1—х0 определяется из уравнения F'(x0)Ax = —F(x0). (11) Если функция K(s, t, и) и функциональное пространство, в котором рассматривается уравнение (10), таковы, что производ- ная F'(x) отображения F может быть вычислена «дифференци- рованием под знаком интеграла», т. е. если z = F' (х0) х означает, что ь z(s) = x (s) — Fu (s, t, x0 (0) X (t) dt, a то уравнение (11) принимает вид ь Лх (s) = j (s, t, x0 (0) Ax (0 dt + <p0 (s), (12)
512 ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ [ГЛ. X где ь Фо («) = $ (s> хо (0) dt — х0 (s). а Аналогично находятся и следующие поправки. Таким образом, нахождение каждого следующего приближе- ния сводится к решению линейного интегрального уравнения. Если применяется модифицированный метод Ньютона, то при этом на каждом шаге приходится решать линейное уравнение с одним и тем же ядром. Более подробное изложение метода Ньютона и связанных с ним вопросов имеется в книге [28], а так- же в статье Л. В. Канторовича [27], которому и принадлежат основные результаты, относящиеся к обоснованию метода Нью- тона для операторных уравнений.
ДОПОЛНЕНИЕ БАНАХОВЫ АЛГЕБРЫ В. М. Тихомиров В третьей главе этой книги изучались линейные пространства. Там был выделен важный класс линейных пространств — банаховы пространства. Здесь, в этом дополнении, будут изучаться банаховы алгебры, т, е. банаховы пространства, в которых определено умножение элементов. Наличие умноже- ния в сочетании с линейной и метрической структурой наделяет банаховы алгебры рядом замечательных свойств. § 1. Определения и примеры банаховых алгебр 1. Банаховы алгебры, изоморфизмы банаховых алгебр. Напомним, что линейным пространством называется непустое множество элементов, в кото- ром введены две операции — сложение и умножение на числа, удовлетворяю- щие восьми аксиомам, сформулированным в § 1 гл. III. Определение 1. Линейное пространство X называется алгеброй, если в нем введена еще одна алгебраическая операция — умножение, которое под- чинено следующим аксиомам: ]. (ху)г = х(уг). 2. х(у + г) = ху + хг; (у + г)х = ух + гх. 3. а(ху) = (ах) у = х(ау). 4. Если существует элемент е е X такой, что ех = хе = х для всех х X, то е называется единицей алгебры X, а сама алгебра называется ал- геброй с единицей ‘). 5. Если операция умножения коммутативна, т. е. если выполняется ак- сиома: ху = ух, то алгебру X называют коммутативной алгеброй. Коммутативные алгебры с единицей и будут в основном объектом нашего дальнейшего рассмотрения. Всюду в этом дополнении числовое поле, над которым рассматриваются наши алгебры, это поле С комплексных чисел. В § 3 гл. Ill было введено понятие нормированного пространства, т. е. линейного пространства, снабженного нормой ||х||, удовлетворяющей трем аксиомам, сформулированным на стр. 139. Определение 2. Нормированное пространство X называется норми- рованной алгеброй, если оно является алгеброй с единицей и при этом вы- полнены еще две аксиомы: 6. lie 11=1. 7. II ху || -IIУII- Если нормированная алгебра X вдобавок полна (т. е. является бана- ховым пространством), то она называется банаховой алгеброй. ') Единица в алгебре всегда единственна, ибо если бы элемент е' также обладал свойством 4, то мы бы получили ее' = е = е'.
514 ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ Отображение F: X -> У называют гомоморфизмом алгебры X в У, если удовлетворяются условия: F (х + у) = Fx + Fy, (1) F(ax)=aFx, (2) F (xy) = Fx Fy. (3) Две алгебры, X и У, называют изоморфными, если существует взаимно однозначное отображение F, удовлетворяющее условиям (1) — (3). Нормированные пространства X и У называют изометричными, если су- ществует взаимно однозначное отображение F: Xt-тУ, для которого выпол- нены условия (1) и (2) и, кроме того, || Fx\\y = ||х||х. Определение 3. Две банаховые алгебры У и У мы назовем изомет- рически изоморфными, если существует алгебраический изоморфизм F:X+-*-Y, являющийся изометрией X и У как нормированных пространств. 2. Примеры банаховых алгебр. 1. Поле С. Комплексные числа {г} доставляют простейший пример ба- наховой алгебры, если ввести норму формулой: l|z|| = |z| = Vx2 +у~ (,z = x + iy). Комплексные числа образуют поле С. В С для всех элементов, кроме нуля, определено деление — операция, обратная умножению. Мы покажем в дальнейшем, что С есть единственная нормированная алгебра, являющаяся полем. 2. Алгебра Ст. Пусть Т — некоторое компактное хаусдорфово топо- логическое пространство. Обозначим через Ст линейное пространство всех непрерывных комплексных функций x(t), заданных на Г с обычными для функций операциями сложения и умножения на число, в котором норма опре- деляется равенством || х || = шах | х (/) |. Ранее в гл. II и III рассматривался частный случай пространства Ст, когда Т = [а, Ь] есть отрезок вещественной прямой. Другим важным частным случаем пространства Ст является пространство Сл = {(z;, ..., zn)} «-мер- ных комплексных векторов, т. е. функций на пространстве из п точек. Сло- жение, умножение на числа и умножение элементов С" производится покоор- динатно, а норма определяется формулой || z || = шах | z |. К i <п Алгебра Ст является коммутативной банаховой алгеброй. Единицей в Ст служит функция e(t) = 1. Проверка всех аксиом не составляет труда. 3. Алгебра st аналитических функций в к р у г е. Обозна- чим через st линейное пространство всех функций x(z) комплексного пере- менного z, определенных и непрерывных в круге К {z:|z| 1} и аналити- ческих внутри этого круга. Определим умножение в st, как обычное умно- жение функций и зададим норму формулой [|х||= max | х (г) |. I Z |<1 Этим путем мы превратим st в коммутативную банахову алгебру с единицей Справедливость всех аксиом и здесь вполне очевидна.
§ 1] ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ БАНАХОВЫХ АЛГЕБР 5.15 4. А л г е б р а /ь Обозначим через 1\ совокупность всех двусторонних абсолютно суммируемых комплексных последовательностей х= (..., х~п, . ..х_ь х0, хь ,.., хп, ...) с нормой Е lxd- (4> k =— оо Произведением х • у двух таких последовательностей: X = (..., х_п.....Хо.....Хп, ...), У — (• • •, у-п, ... , Уо, , Уп, . •) назовем их свертку 2 = х * у, т. е. последовательность, члены которой опреде- ляются так: оо z„=(x.y)n= £ (5) k= — ОО Если каждой последовательности х из Ц сопоставить ряд Фурье со х (!) = У, хkeikt, 0 t 2л, то последовательность, определенная форму- k —— оо лой (5), соответствует произведению функций x(t) y(t), построенных по последовательностям х и у. Таким образом, алгебра Ц и алгебра W функ- ций x(t) с абсолютно сходящимися рядами Фурье и нормой, определяемой (4), изометрически изоморфны. Поэтому большинство аксиом алгебры и норми- рованного пространства для проверяются без труда, так как для U7 они верны тривиально. Проверим аксиому 7. Имеем для z = х * у: ||21|=XI zn I=ЕIЕ хп-кУк I < Е ЕI xn-k 11 yk\ = п п \ k I п k = E(Ek-s i)i‘/4i=ii*ii-iii/h Алгебра W, очевидно, коммутативна, следовательно, коммутативна и ал- гебра /ь Единицей в /1 служит последовательность е, соответствующая функ- ции e(t) = I: у этой последовательности все компоненты суть нули, за ис- ключением компоненты с нулевым номером, которая равна единице. В даль- нейшем мы будем пользоваться изоморфизмом -*->-1Г и соответствием {хп}+—+-х (/), не оговаривая этого особо. 5. Банахова алгебра ограниченных операторов. Пусть X— банахово пространство. Рассмотрим пространство S?(X, X) всех линей- ных непрерывных операторов, преобразующих X в себя, с обычными для опе- раторов действиями сложения, умножения оператора на число и умножения (гл. IV, § 5, п. 3). Единицей в Э?(Х, X) служит тождественный оператор. Превратим 2”(Х, X) в банахову алгебру, определив норму как обычно: II А || = sup || Ах ||. »Х||< 1 Действительно, аксиома 7 была уже проверена ранее (см. формулу (4) на стр. 224). Доказать полноту 9?(Х, X) предоставлялось читателю в упражне- нии, приведенном там же. Алгебра 9?(Х, X)—один из важнейших примеров.'! некоммутативной банаховой алгебры с единицей. 3. Максимальные идеалы. Определение 4. Идеалом I коммутативной алгебры X называется- подпространство X, обладающее тем свойством, что для всякого у <= / и лю- бого х из X произведение ух принадлежит I. Идеал, состоящий из одного нуля, а также идеал, состоящий из всего X, мы называем тривиальными'и в дальнейшем исключаем из рассмотрения. Максимальным называется идеал, не содержащийся ни в каком другом нетривиальном идеале. Введенные понятия рассмотрим на примере алгебры
516 ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ Пусть — непустое подмножество компакта Т. Множество М^ — = {х (/) Е Ст : х (/) — 0, состоящее из функций, обращающихся в нуль на ЗГ, образует, как легко видеть, идеал в Ст. Максимальные идеалы в Ст допускают простое описание, являющееся к тому же ключом к понима- нию всего замыслатеории коммутативных банаховых алгебр. Лемма 1. Максимальный идеал алгебры Ст есть совокупность всех функций из Ст, обращающихся в нуль в какой-либо одной фиксированной точке т0 множества Т. Доказательство, а) Пусть М.^ = {х (/) е Ст: х (т0) = 0}. Тогда есть идеал. Покажем, что он максимален. Действительно, пусть xQ (/) ф М^, т. е. xo(rQ)#=O. Для любого у (t) е С- положим: z(t)=y(t)--(то) *о _ Хд (Тд) Тогда z(to) = O и, следовательно, z (t) принадлежит MTq. Итак, добавление любого элемента не из приводит к тому, что идеал, порожденный AfTj и этим элементом, становится тривиальным. Следовательно, AfTo — максимален. б) Пусть наоборот, М — какой-либо максимальный идеал из Ст- Покажем, что все функции, входящие в этот идеал, обращаются в нуль в некоторой точке. Действительно, если это не так, то для каждой точки те Г найдется функция хт (/) е М такая, что хт (т)#=0. В силу непрерыв- ности хт (/) по t найдется такая окрестность Ux точки г, что хт (/)=/=0 в Ux. Из открытого покрытия Г cz U 17т выберем конечное покрытие U....Uх . х 1 п Тогда в силу определения идеала п xQ(t) = ^~(i}.xx (t)+ ...+х (t)Xt (/)=£ |Х (0|2 II п п । I Л | принадлежит М. В силу того, что х0(/) > 0 всюду на Т, функция 1/х0(/) будет непрерыв- ной. Поэтому 1 = (1/х0(/)) • х0(/) е М. Но идеал, содержащий единицу ал- гебры, содержит и любой элемент алгебры, ибо y(t) = y(t) 1. Поэтому М — тривиальный идеал, что противоречит предположению о том, что М — макси- мальный, а следовательно, нетривиальный идеал. Таким образом, мы получили, что между максимальными идеалами и точ- ками из пространства-носителя Т можно установить взимно однозначное со- ответствие. Это позволяет трактовать функции на Т как «функции на про- странстве максимальных идеалов». Мы покажем,— и в этом цель излагаемой ниже теории коммутативных банаховых алгебр, — что всякая такая алгебра X допускает реализацию в ви- де подалгебры алгебры непрерывных функций на компактном хаусдорфовом топологическом пространстве, образованном ее максимальными идеалами. § 2. Спектр и резольвента В этом параграфе алгебра X не обязательно коммутативна, но имеет еди- ницу. Многие рассмотрения здесь подобны тем, которые проводились в § 5 гл. IV, 1. Определения и примеры. Определение. Элемент х е X называется обратимым, если он имеет обратный, т. е. если найдется такой элемент х_|, что х • х~' = х-1 • х = е. В противном случае элемент х называется необратимым. Спектром <т(х) элемента хеХ называется множество комплексных чисел X, для которых элемент Ze — х необратим. Если Z^o(x), точку Л называют регулярной.
СПЕКТР И РЕЗОЛЬВЕНТА 517 $ 2] Функция 7?Х : С \ а (х) -> X, Rj.x = х (Л) — (Хе — х)~1, определенная на множестве регулярных точек элемента х, называется резоль еентой этого элемента. Спектральным радиусом г(х) элемента х е X называется число r(x) = sup IА |. (1) К а (х) Введенные важные понятия проиллюстрируем на примерах. а) Если X — С, то обратимы все элементы кроме нуля; б) Если X = Ст, то для обратимости x(t) необходимо и достаточно, что- •бы функция x(t) была всюду отлична от нуля. Спектр о(х) совпадает с м н о.ж еством значений x(t); резольвента R-f, имеет вид Rk= X-x(t) ’ а г (х) = II х II = max ] х (/) I . t в) Если X — Z [Y, У)—алгебра ограниченных операторов, то обратимые элементы суть обратимые операторы, спектр и резольвента в этом случае сов- падают со спектром и (с точностью до знака) резольвентой оператора, кото- рые были введены в п. 7 § 5 гл. IV. Собственно говоря, в этом параграфе мы в общем виде исследуем те понятия, которые вводились ранее для банаховой алгебры ограниченных линейных операторов. 2. Свойства спектра. Теорема 1. 1°. Для любою линейного функционала f (х) из сопря- женного пространства X* функция f (х (Л)) = F (Л) аналитична на С\<т(х) и F Л) -> 0 при | X | -> со. 2°. Спектр <т(х) элемента х банаховой алгебры X есть непустое ком- пактное множество в С. Имеет место неравенство: г«<1|х||. (2) Доказательству теоремы 1 предпошлем несколько лемм. Лемма 1 (ср. с теоремой 5 § 5 гл. IV). Пусть элемент х из банаховой алгебры X имеет норму, меньшую единицы. Тогда элемент е — х обратим и (е — х)-1 = е + х + ... +хп+ ... Действительно, положив sn = е + х + ... + хп, имеем: k ... “ 1 II л 11 1=1 Итак, последовательность sn фундаментальна. Так как X полно, то она схо- дится к некоторому элементу se.Y. При этом s (е — х) = lims„(e —х)= lim (е — xrt+1) — е П-> со Аналогично доказывается, что (е — x)s = е. Следствие. Для всякого х е А' (е — ix)~' -> е при /->0. Действительно, (е —/х)-1^ lim (е + tx + ... -f- (tx)n) = е + О (/). Л-> ОО
518 ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ Лемма 2 (ср. с теоремой 4 § 5 гл. IV). Пусть хи— обратимый элемент и !1 бх II <|| х0-' ||~‘- Т огда Х1 = х0-|-Дх— обратимый элемент', при этом х,"1 = (е + х"1 Дх) ' х^'. Действительно, х, = х0 + Дх = х0 (е + х^1 Дх) = х0 (е — х), ||х|| = = | — х^'1 Дх || < 1. Применив лемму 1, мы находим, что xt 1 = (е — х) 1 х0 что и требо- валось. Следствие 1. Множество обратимых элементов банаховой алгебры открыто (в нормированной топологии банаховой алгебры). Множество не- обратимых элементов замкнуто Следствие 2. Резольвента х (Л) есть непрерывная функция от А на. С\а(х). Действительно, в силу следствия из леммы 1 х (Ао + ДА) — (Аое — х + ДАе) 1 — (е + ДАх (Ао)) 1 х (Ао) х (Ао). Лемма 3 (ср. с п. 7 § 5 гл. IV). Пусть A, |ieC\ а (х). Т огда a) R-,x • R^x = R^x RKx, 6) R-Kx — R^x = (ц — A) R^x R^x (тождество Гильберта). Доказательство. a) R-,x • /?цХ = (Ae — x)-1 (це — x)~ = = [(це — x) (Ae — x)]-1 = [(Ae — x) (це — x)]~* = R^x RKx. б) В силу a) и определения R>. и Rlt имеем R>x = (це — x) RK x R^x, R^x = (Xe — x)R^x R^x, откуда R},x — /?цХ = (це — Ae) R>.x • R^x = (ц — A) R-,x • RILx, что и требо- валось. Следствие. Если Ао е С \ о (х), то х' (Ао) = — х2 (Ао). Имеем в силу б) и следстьия 2 леммы 2: х' (Ао) = lim Х ~ \ (Ло)- == - lim х (А) • х (Ао) = - х2 (Ао). Х->Х0 С. Ад Теперь докажем теорему 1. 1°. Пусть f (х) линейный непрерывный функционал на х, т. е. f (х) е X*. Положим F (А) — f (х (А)) = f (R^x). Имеем в силу следствия из леммы $ для Ао а (х): F (А) - F (Ао) _ £ ( х (А) - х (Ао) \ F (Ло)==Л™ А-а;— = Дтх0Ч А-А0- )- — Ао Таким образом, доказана аналитичность F (А). Далее, при | А | > || х || в силу леммы 1 мы получим:' I F (А) | < || f Цх. || х (А) ||х = || f ||х. || (Ае - х)~! || = iifiix«k п-1 с п
$ 2! СПЕКТР И РЕЗОЛЬВЕНТА 519 2°. а) Непустота спектра а (х). Пусть а(х)=0. Тогда в силу 1° для всякого элемента f е X” F (Л)— целая функция, стремящаяся к нулю при | Л |-> оо. Значит, F (Л) = 0, т. е. f ((Ле — х)~*) = 0 для любого f s X*, я значит, в силу следствия 4 из теоремы Хана — Банаха (п. 3 § 1 гл. IV), (Ле— х)~1 = 0, чего не может быть. б) Компактность спектра а(х). Если |Л|>||х||, то в силу леммы 1 элемент Ле — х = Л [е---обратим, откуда следует ограничен- ность а(х), а заодно и неравенство (2). Замкнутость а (х) следует сразу из леммы 2: если Ло регулярно, то окрестность | ДЛ | < ||х (Ло)||-1 состоит из ре- гулярных точек, так как (Ло + ДЛ) е — х = Лое — х + ДЛе. Отметим два следствия из теоремы 1. Следствие 1. Банахова алгебра над полем С, являющаяся полем, изо- метрически изоморфна С. Действительно, пусть X есть «банахово поле» их — произвольный эле- мент из X. Найдем то Л, для которого элемент Ле — х необратим и, значит, •есть нуль. Мы получим, что х = Ле. Легко понять, что соответствие х-<—>-Л есть изоморфизм X и С. Так как ||el| = 1, то ||х|| — |Л|. Мы получили изометрию X и С. Следствие. 2. Спектр любого ненулевого оператора А из Э?(Х,Х) не пуст. Это утверждение без доказательства уже формулировалось ранее (см, стр. 236). 3. Теорема о спектральном радиусе. Теорема 2. Имеет место следующая формула для спектрального ра- диуса'. г(х)= lim V||xrt||. (3) n->oo Действительно, пусть f — любой элемент из X*. В силу теоремы 1 функ- ция F (Л) = f (х (Л)) аналитична на С \ а (х) В частности, F (Л) аналитична в области | Л | > || х ||. В этой области в силу леммы 1 откуда F (Л) = f (х W) = f-^J, причем это разложение, верное вследствие леммы I при |Л[ > ||х||, должно иметь место при |Л| > г(х) в силу теоремы единственности для аналитиче- ских функций и, значит, Мы получили, что множество векторов хп/Лп + 1 является слабо ограни- ченным, а значит, оно ограничено сильно. (Этот результат, называемый иногда принципом равномерной ограниченности, или теоремой Банаха — Штейнгауза, был доказан в § 3 гл. IV; подробнее об этом см. в монографии [21], гл. II.) Таким образом, существует число с (Л), зависящее от Л, такое, что ’
520 ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ откуда lim || хп ||1/л < | Л | для всех {А : | Л | > г (х)}, т. е. -О lim ||хл||1/л <г(х). Л->оо С другой стороны, если i.eo(.t), то Лле а (хл), так как элемент Лле — хл, очевидно, делится на Ле — х. В силу теоремы 1, если ц е а (х), то | ц | || х ||. п _____ Полагая ц = Лл, полагаем, что из ). еа(х) следует, что | Л | Vll хл ||, п ______________________ откуда г (х) lim Vll*nll- Теорема доказана. оо § 3. Некоторые вспомогательные результаты В этом коротком параграфе сосредоточен ряд вспомогательных утверж- дений, при доказательстве которых используются стандартные технические приемы. 1. Теорема о фактор-алгебре. Пусть X — коммутативная банахова алгебра с единицей, / — идеал в X. Отметим, во-первых, что I состоит лить из необратимых элементов, ибо если г <= / обратим, то для любого xe.Y мы получим, что (xz~')z = х е /, т. е. I тривиален, а этот случай мы исключаем. Во-вторых, в силу леммы 1 § 2, расстояние от единицы е до любого необратимого элемента, а значит, п до любого идеала, не меньше единицы. Рассмотрим теперь фактор-пространство У// (см. § 1 гл. III) и определим там операцию умножения, назвав произведением двух классов | и Г) из X/f тот класс который содержит элемент х • у, где х и у — представители клас- сов £ и Г)- (Проверьте, что результат не изменится, если х и у заменить лю- быми другими представителями тех же классов | и ц, и что введенная опера- ция «умножение» удовлетворяет аксиомам 1—5 § 1.) Таким образом, Х/1 становится коммутативной алгеброй. Назовем ее фактор-алгеброй X по идеалу I. Введем в Х/I норму как и в п. 3 § 3 гл. III: ||5II= inf ||х + </|!, где х — представитель д. Имеет место Теорема 1. Если X — есть банахова алгебра, а 1 — замкнутый идеал в ней, то фактор-алгебра X/f также является банаховой алгеброй с единицей. В п. 3 § 3 гл. III было показано, что фактор-пространство банахова про- странства по любому его замкнутому подпространству является банаховым пространством. Таким образом, нам остается лишь проверить, что выпол- няются аксиомы 6 и 7 из п. 1 § 1 на стр. 513. a) Illnll= inf 11*0 +zlK inf II (* + “) (0 + «) IK zgI u, t» e / < inf || x + и || • inf || у + v || = HI! • II П II- ue/ ре/ б)£=е + /, т. e. E2 = e2 + I = e + l, значит, E2 = E, откуда ||£|| = и ||E21| <|| fll2. Но элемент E не эквивалентен нулю, так как окрестность точки е, как мы отметили выше, не содержит необратимых элементов, из которых состоит /. Значит, 1 <||£||. Но, с другой стороны, ||£|| = inf ||е + 0||, у е/ т. е. || £|К1. Итак, ||£|| = 1. Теорема доказана.
ОСНОВНЫЕ ТЕОРЕМЫ 521 § 4] 2. Три леммы. Нам далее понадобятся три леммы: теоретико-множествен- ная, алгебраическая и топологическая. Лемма 1. Всякий нетривиальный идеал I содержится в максимальном идеале. Доказательство этой леммы основано на лемме Цорна, сформулированной на стр. 40. Действительно, пусть .7 — множество всех нетривиальных идеалов, содер- жащих I. Ойо частично упорядочено по вложению: Д 12, если Д != Д. Для всякого линейно упорядоченного множества {/а} из 3 объединение [J /а а есть нетривиальный идеал, служащий верхней гранью для {/ а}- Значит, в силу леммы Цорна, / подчинен максимальному элементу в 3, т. е. максимальному идеалу. Следствие. Если X не есть поле, то в нем имеется максимальный идеал. Более того, каждый необратимый элемент, отличный от нуля, содер- жится в некотором максимальном идеале. Действительно, возьмем любой необратимый элемент х0 =/= 0 и рассмотрим совокупность ха X. Это есть, конечно, идеал. Он содержит Хо и не содержит е — единицы X, т. е. не является тривиальным идеалом, следовательно, в силу леммы 1 содержится в максимальном идеале. Лемма 2. Для того чтобы идеал I содержался в некотором нетривиаль- ном идеале I' с X, необходимо и достаточно, чтобы алгебра Х/J имела нетри- виальный идеал. Докажем необходимость. Пусть I с I' с X, 1^=1', Х^ Г. Выделим среди классов g е Х/I те = х’ + Д для которых х’ е I'. Легко проверить, что получится нетривиальный идеал в Х/I. Достаточность получается аналогично. Л е м м а 3. Замыкание нетривиального идеала I есть нетривиальный идеал. Нетривиальность следует из того, что I состоит лишь из необратимых элементов, остальное следует из непрерывности алгебраических операций. Следствие. Максимальный идеал замкнут. § 4. Основные теоремы В этом параграфе X — коммутативная банахова алгебра с единицей. 1. Линейные непрерывные мультипликативные функционалы и максималь- ные идеалы. Определение 1. Линейный непрерывный функционал f на банаховой алгебре X называется мультипликативным, если для любых х и у f(x.y)=f(x)-f(y). (1) Совокупность всех нетривиальных линейных непрерывных мультипликативных функционалов мы обозначим через ЗС. Заметим, что линейный непрерывный мультипликативный функционал мы могли бы определить, как непрерывный гомоморфизм X в С. Если f Е Л, то I f (х) КII х И, (2) ибо если для некоторого х0, по норме равного единице, |f(x0) | = Л> 1, то |/(х”) | = г->со, т. е. мы получили бы, что f не непрерывен. Далее, f(e)=/(e2) = (f(e))2,
522 ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ откуда либо f{e) = 0, т. е. f тривиален, либо f(e) = l. (3> Из (2) и (3) следует, что нетривиальные линейные непрерывные мульти- пликативные функционалы имеют норму единица и, следовательно, Ж есть подмножество единичной сферы в сопряженном пространстве X*. Нулевое подпространство функционала f (т. е. совокупность тех .геХ, для которых f(x) — 0) обозначим Kerf и назовем ядром f. Лемма 1. Ядро Ker f при f е Ж есть максимальный идеал. Действительно, из у е I = Ker f и х е X следует, что f(y-x) = f (у) -f(x) = 0, т. е. у • х е Ker f. Таким образом, Kerf — идеал. Покажем, что Kerf — максимальный идеал. Допустим, что это не так, т. е. Ker f можно расширить до идеала / =/= X, со- держащего Ф Kerf. Но Kerf имеет коразмерность I (см. гл. Ill, § 1, п. 6). Значит, элемент е можно представить так: е = Ах0 + у, где у е Ker f. Отсюда следует, что ее/. Значит, 1 = X. Противоречие дока- зывает лемму. Лемма 2. По всякому максимальному идеалу М можно однозначно по- строить линейный непрерывный мультипликативный функционал f е Ж такой,, что М = Ker f. Действительно, в силу следствия из леммы 3 § 3 М — замкнутый идеал. Применив теорему 1 § 3, мы получим, что Х/М есть банахова алгебра. На в силу леммы 2 § 3 Х/М не имеет нетривиальных идеалов, т. е. алгебра Х/М не содержит необратимых элементов, отличных от нуля (см. следствие из лем- мы 1 § 3). Значит, Х/М есть поле, являющееся банаховой алгеброй. В силу следствия 1 из теоремы 1 § 2 поле Х/М изоморфно С. Это, па определению, означает, что для любого х е X найдется однозначно числа f (х) $= С такое, что x — f (х)-е + и, и<=М. (4> Покажем, что f есть гомоморфизм. Докажем, например, что f(x • у) — = f(*) • f (£/) - Имеем х — f (х) • е + и. и е М, У = f (У) • е + v, v е М, откуда ху = f(x) f(y) • е + w, w ен М. Но это и означает, что f(x • у) = f(x) f(y). Соотношения f(x+y) = = f(x)+f(y) и f(Ax) = Af(x) доказываются аналогично. Кроме того, если х ее М, то из (4) следует, что f(x) = 0, а если х = е, то f(x) = 1. Лемма доказана. Итак, мы получили, что между максимальными идеалами {Af} и функцио- налами f из Ж существует взаимно однозначное соответствие. В силу этого обстоятельства условимся функционалы из Ж обозначать fM, а буквой М соответствующие им максимальные идеалы. Для множества всех максималь- ных идеалов {Af} мы будем употреблять ту же букву Ж, что и для соответ- ствующего ему множества {fM}- Пусть х — некоторый элемент из X.
$ 4] ОСНОВНЫЕ ТЕОРЕМЫ 523 Рассмотрим функцию х(М) на множестве Л, задав ее формулой х (Л1)= ?м (5) {Значение функции х(М), построенной по элементу х, на максимальном идеа- ле М равно числу fM(x), т. е. значению на элементе х гомоморфизма, соот- ветствующего идеалу М.) Мы получили реализацию элементов алгебры X в виде функций на множестве Л, о которой говорили в конце § 1. 2. Топология во множестве Л. Основные теоремы. Нам осталось доказать, что Л компактно в некоторой топологии и что функции х(М) непрерывны в той же топологии. Чуть ранее мы упомянули, что Л есть подмножество единичного шара. С другой стороны, в п. 4 § 3 гл. IV было приведено доказательство для се- парабельного случая следующего утверждения. Единичный шар пространства X*, сопряженного к банаховому простран- ству, компактен в *-слабой топологии. Доказательство этой теоремы в общем случае можно найти, например, в [21], стр. 459. Напомним, что «-слабая топология определяется системой окрестностей ....хт. 6 (fo) = {fе I f Ы - fo Ы I <6-k ’..........."О- (6) Множество Л мы рассмотрим именно в «-слабой топологии. Компакт- ность Л вытекает из сформулированного выше результата и следующей .леммы. Лемма 3. Множество Л есть замкнутое подмножество единичного шара в X* и функции х(Л4) непрерывны на Л. Действительно, пусть функционал /о принадлежит замыканию Л. Это значит, что внутри любой базисной окрестности отображения f0 найдется го- моморфизм fM, порожденный максимальным идеалом М. Возьмем окрестно- сти Ux, у, х+у, 6(fo). В силу (6) и определения х(Л4) мы получим I fM(«)~ fo W | < б, ' I fM (</) - fo (</) | < 6, > | fM С-* + У) — fo (^ + I/) | < 6. , Но /м есть гомоморфизм, т. е. ?м(х + у) = f м (х) + [м(у). Тогда из (7) следует, что fo (х + у) = fo (х) + f0 (у). (7) Аналогично показывается, что f0 (ах) = afa (х) и fo(xy) = f0 (х) • f0(y). (Надо взять окрестности Ux, аХ: 6 (fa) и Ux, у, ху> 6 (fa).) Значит, f есть непрерывный линейный мультипликативный функционал. Далее, взяв окрестности ие^((а), мы получим, что fo(e) = 1, т. е. fa нетри- виален. Значит, fo е Л, т. е. Л замкнуто. Покажем, что функция х0(Л4) = [м(хо) непрерывна на Л. Пусть Мо е Л. Для в > 0 возьмем окрестность Ux° е (Мо). Если М е g( то в силу (6) получится, что I ?М (Хо) ~ fjUo(*o) 1 = 1 *0 W ~ Хо(Мо) I < Ь- Но это и означает непрерывность функции лс0(Л1) в точке Л10. Иемма доказана.
524 ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ Теорема 1. Отображение х->-х(М) задает гомоморфизм алгебры X в алгебру См непрерывных функций на компактном хаусдорфовом простран- стве Jt максимальных идеалов алгебры Х\ при этом II я (М) || = max | х (Л4) |<|| х ||. (8> В силу сказанного выше в этом параграфе, нам остается доказать лишь со- отношение (8). Заметим, что для всякого М элемент х — {м(х)е по определению }м(х) принадлежит идеалу М, т. е. является необратимым. Поэтому [м(х) е о(х). С другой стороны, взяв любое число )4ea(.t), мы обнаруживаем, что х — }^е необратим и, значит, принадлежит максимальному идеалу 1ЛГ откуда 0 — [м(х — Хое), т. е. Хо = [м (х). Итак, образ jfC при отображении х(Л1) совпадает с а(х). Следовательно, в силу утверждения 2° теоремы 1 § 2, мы получаем, что неравенство (8) справедливо. Нам осталось лишь уточнить теорему 1 при разных допущениях об ал- гебре X. Введем определения трех понятий. Определение 2. Пересечение R = Q всех максимальных идеа- .МсЛ лов называется радикалом X. Если R = {0}, то говорят, что X не имеет ради- кала. Банахова алгебра X называется регулярной, если ||х2|| = |1х||2. Банахова алгебра X называется симметричной, если для всякой функции х(М) най- дется элемент у е X такой, что у(М) = х(Л4). (Черта означает комплексное сопряжение.) Теорема 2. а) Если радикал алгебры X состоит из одного нуля, та отображение х-+х(М) является взаимно однозначным. б) Если алгебра X регулярна, то X изометрически изоморфна со своим образом в См, в частности, X не имеет радикала. в) Если алгебра X симметрична, то образ X при отображении х-^х(.М) всюду плотен в См. г) Если алгебра X обладает свойствами б) и в), го X изометрически изо- морфна См. Доказательство. Сначала выведем последнее утверждение из ос- тальных. В силу б) взаимно однозначное отображение х*-*х(Л4) является изометрией: II х || = max | х (М) |. Л М В силу в) {х(Л4)} всюду плотно в См. Но X — полное пространство. Значит, и {л(Л4)} (вследствие равенства норм в X и в См) полно, откуда {х(М)}—См, Докажем а). Пусть х0 =/= 0, а х0(М) s0 на Л. Это означает, что /м(*о) =0 для всех М, т. е. хоеКег/м для всех М, значит, х0 е R. Но R = {0}, откуда Хо = 0. Противоречие доказывает а). Для доказательства б) заметим, что из равенства ||х2|| = ||х||2 сразу сле- дует, что 2п ____ lim Vll х2" 11 = II*II- n->oo Применив теорему о спектральном радиусе (теорема 2 § 2), мы полу- чаем, что г (х) = |1х II. (9)
ОСНОВНЫЕ ТЕОРЕМЫ 525 § 4] Тогда из (9), во-первых, следует, что радикал состоит только из нуля. Действительно, если допустить, что то для всех М выражение /лт(х0) =0, т. е. а(х0) совпадает лишь с нулем, что противоречит тому, что г(х0) = ||х0|| #= 0. Далее, из (9) следует, что отображение х-»—>-х(М), являющееся изомор- физмом X и соответствующей подалгебры {х(Л4)} в См, будет изометрией, ибо в силу (8) II х (МЦС = max | х (Л1) | = г (х) = || х ||. Доказательство в) требует привлечения одной из весьма замечательных теорем алгебры и анализа — теоремы Стоуна — Вейерштрасса — которая зву- чит так: Пусть А есть подалгебра банаховой алгебры Ст непрерывных функций на компакте Т такая, что: 1) Единица (т. е. функция e(t) =1) принадлежит А. 2) Алгебра А разделяет точки Т (т. е. для любых ti =/= t2 существует функция х(0 е А такая, что x(tt) #= х(/2))- 3) Алгебра А инвариантна по отношению к комплексному сопряжению (т. е. из x(t) А следует, что x(t) е Д). Тогда А всюду плотна в Ст. Доказательство теоремы Стоуна — Вейерштрасса см. в [13], стр. 53—56; [21], стр. 296—297: [26], стр. 20. Докажем теперь в). Пусть А = {х(М)} означает образ X при отображе- нии х -* х(М). Из (4) сразу следует, что е-^е(М) = 1, т. е. е(М) == 1 е А. Пусть Л4, и М2 два различных максимальных идеала. Это означает, что существует эле- мент Хо, принадлежащий Л4] и не принадлежащий М2 (или наоборот), откуда Хо(^1)==^1(Хо)==О> хо(М2} = ГмЛхо}^°' т. е. А разделяет точки Л. Далее, по самому определению, симметричная алгебра А инвариантна относительно комплексного сопряжения. Применение теоремы Стоуна — Вейерштрасса приводит к в). Теорема доказана. 3. Теорема Вииера; упражиеиия. Приложения теории банаховых алгебр весьма разнообразны. Напомним ряд результатов из алгебры и анализа, которые уже были получены нами по ходу дела. Банахова алгебра над полем С, являющаяся полем, изометрически изо- морфна С. Спектр любого ненулевого ограниченного оператора в банаховом про- странстве не пуст. Для любого ограниченного оператора А в банаховом пространстве X п _______________________ существует предел lim Vll Ап II =г (Л), и спектр А целиком лежит в круге |Х| г(Д). Докажем теперь, используя теорию коммутативных банаховых алгебр, следующую теорему Винера: Если функция х(0) разлагается в абсолютно сходящийся ряд Фурье ОО х(0) = X xke'M и нигде не обращается в нуль, то и функция </(0) = £= — ОО = 1/х(0) также разлагается в абсолютно сходящийся ряд Фурье. Рассмотрим изометрически изоморфные алгебры Е и W (см. пример 4 п. 2 § 1). Найдем пространство Л для них. Легко понять, что гомоморфизм W в С достаточно задать на функции x0(t) — е'1 и далее он распространится на U7
526 ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ однозначно. Положим Ьл (хо) = 1м (в1/) = ?• Тогда В силу (2) 1£1 = 16и(*о)1ММ=Ь ll/U = |fAf(xo-1)|<ho_|||=1' откуда |£| = 1, т. е. £ = eie. Мы получили, что М находится во взаимно однозначном соответствии с окружностью |£| = 1, Для любой последователь- ности х = (..., х-„, ..., Хо, ..., х„, ...) е и соответствующей ей функции х (/) = ^xkelkl е W имеем: k fM М = fM (х (t)) = fM xkeik‘\ = £ (e“)]* = £ xke‘ke = x (0). \ k J k k Поэтому тот факт, что функция x(0) не обращается в нуль ни для каких —л 0 <; л, означает, что х не принадлежит ни одному максимальному идеалу. Значит, в силу следствия из леммы 1 § 3, эта последовательность обратима в алгебре Zj. Положим у = х-1 = (..., у-п.....Уо, ..., уп, Тогда ОО y(M)=fM(y)= У z/Aelfe0=/(x’I) = —L-= ^—1-------------------, *=-- И } £ xkeM k=~ ОО что и требовалось. Два других важных приложения теории банаховых алгебр — спектраль- ную теорему для ограниченных операторов и теорему Стоуна — Чеха — мы сформулируем ниже в виде упражнений (см. упражнения 8 и 9). Упражнения. 1. а) Показать, что пространство максимальных идеа- лов алгебры st (см. пример 3 п. 2 § 1) можно взаимно однозначно и непре- рывно сопоставить с точками единичного круга |z| 1. б) Показать, что st регулярна, несимметрична и не имеет радикала. 2. Какое обстоятельство мешает тому, чтобы можно было утверждать, что li (см. пример 4 п. 2 § 1) изометрически изоморфна пространству См, т. е. пространству всех непрерывных функций на окружности = 1? 3. Доказать, что имеет место теорема: Пусть ОО сю х (г) = Е хкг\ Е I xk I < °0- fe=j k=J причем x(z) 0 при |z| 1. Тогда функция у (?) = Тейлора, абсолютно сходящийся при |z| sg 1. 4. Обозначим через Сп [а, 6] совокупность п раз цируемых на [а, 6] функций x(t). а) Показать, что Сп [л, 6] становится банаховой обычных операций и нормы, задаваемой формулой: 1 x(z) разлагается в ряд непрерывно дифферен- алгеброй относительно п Их 11= У 4т max !x(ft,(0|. к* ас t
ОСНОВНЫЕ ТЕОРЕМЫ 527 § 4] б) Найти максимальные идеалы Сп[а,Ь] (см. [13], стр. 19, 20). в) Проверить, что С" [а, 6] есть симметричная алгебра без радикала. Что дает в этом случае применение теоремы 2? 5. Пусть CBV [0, 1] означает алгебру непрерывных комплексных функций ограниченной вариации на отрезке [0, 1] с нормой 11x11 = sup | х (/) | + [х], 0<i <1 а) Показать, что CBV [0, 1] есть банахова алгебра. б) Найти максимальные идеалы этой алгебры. 6. Привести пример банаховой алгебры, совпадающей со своим ра- дикалом. 7. Описать все замкнутые идеалы в алгебре С [а, Ь]. 8. Пусть Т — вполне регулярное топологическое пространство (см. п. 6 § 5 гл. II). Обозначим через Вт множество всех определенных на Т ограничен- ных комплексных функций с обычными операциями и нормой ||х|| = sup|x(<) |. ter а) Проверить, что Вт есть регулярная симметричная алгебра без ра- дикала. б) Показать, что точки Т гомеоморфно вкладываются в пространство Ж максимальных идеалов алгебры Вт, причем образ Т при этом вложении яв- ляется в всюду плотным подмножеством. в) Показать, что любая ограниченная комплексная функция на образе Т при этом вложении допускает единственное непрерывное продолжение на Ж. Утверждение б), дополненное тем, что Ж есть компакт (это последнее обстоятельство сразу следует из а), если применить теоремы 1 и 2 § 4), составляет содержание известной теоремы Тихонова о бикомпактном расши- рении. Утверждение в) принадлежит Стоуну и Чеху. Бикомпактное расши- рение, обладающее свойством в), называется максимальным. Утверждение в) означает, что Ж есть максимальное бикомпактное расширение (см. [22], стр. 23). 9. Пусть Н — гильбертово пространство. В алгебре S’(77, И) рассмотрим коммутативную подалгебру В(Л0), порожденную самосопряженным операто- ром Ло (т. е. являющуюся замыканием линейной оболочки степеней Ло). а) Показать, что В(Л0) регулярна и не имеет радикала. б) Показать, что В(Л0) симметрична, причем х(М) = х* (М), где х* — оператор, сопряженный к оператору хеВ(Л0), х(А7)—отображе- ние, построенное в § 4. По поводу б) см. также упражнение 10 в). Применение теоремы 2 § 4 к алгебре С(Л0) приводит к так называемой спектральной теореме для самосопряженных операторов (см. [22], гл. X; [26], гл. II). 10. Говорят, что банахова алгебра (необязательно коммутативная) есть алгебра с инволюцией, если имеется отображение Х-+Х, обладающее свой- ствами: (х+ </)* = х*+ </’, (xt/)‘= t/*x‘, (ах)* = ах*, (х*)' = х. Алгебра с инволюцией называется В*-алгеброй, если, кроме того ‘||хх*|| = = WI2. а) Показать, что алгебра 3?(Н,Н) есть В*-алгебра (см. [22], стр. 26). б) Показать, что коммутативная В*-алгебра регулярна (см. [22], стр. 26). в) Показать, что В*-алгебра симметрична, более того, х(А4) = х*(М) (см. [22], стр. 27, лемма Аренса).
528 ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ Утверждения б) и в) в сочетании с теоремой 2 приводят к такому ре- зультату, принадлежащему Гельфанду и Наймарку и называемому иногда основной теоремой теории коммутативных банаховых алгебр: Коммутативная В*-алгебра изометрически изоморфна алгебре См и при этом изоморфизме х(М) = х*(М). Итак, абстрактный алгебраический объект, описываемый двадцатью че- тырьмя аксиомами (13 аксиом коммутативной алгебры, 5 аксиом, связанных с нормой, аксиома полноты и 5 аксиом В*-алгебры), оказалось возможным реализовать в виде алгебры всех непрерывных функций на компактном ха- усдорфовом топологическом пространстве. Этот результат позволяет рассмотреть с единой точки зрения такие, каза- лось бы, весьма далекие друг от друга факты, как теорема Винера об абсо- лютно сходящихся тригонометрических рядах, теорема о спектральном раз- ложении самосопряженного оператора, топологические теоремы Тихонова, Сто- уна и Чеха и ряд других.
ЛИТЕРАТУРА 1. Авербух В. И., Смол я нов О. Г., Теория дифференцирования в ли- нейных топологических пространствах, УМН XXII, вып. 6 (138) (1967), 20С—260. 2. Александров П. С., Введение в общую теорию множеств и функций, Гостехиздат, 1948. 3. Ахиезер Н. И., Глазман И. М., Теория линейных операторов, «Нау- ка», 1966. 4. Банах С., Курс функцюнального анал!зу, Радяньска школа, Ки1в, 1948. 5. Березанский Ю. М., Разложение по собственным функциям самосо- пряженных операторов, «Наукова думка», Киев, 1965. 6. Бохнер С., Лекции об интегралах Фурье, Физматгнз, 1962. 7. Бур баки Н„ Общая топология. Основные структуры, Физматгиз, 1958. 8. Б у р б а к и Н., Теория множеств, «Мир», 1965. 9. Бурбаки Н., Топологические векторные пространства, ИЛ, 1959. 10. Виленкин Н. Я. и др., Функциональный анализ (серия «Справочная математическая библиотека»), «Наука», 1964. 11. Винер Н., Интеграл Фурье и некоторые его приложения, Физматгиз, 1963. 12. В и н е р Н., И э л и Р., Преобразование Фурье в комплексной области, «Наука», 1964. 13. Г е л ь ф а н д И. М., Р a ij к о в Д. А., Шилов Г. Е., Коммутативные нор- мированные кольца, Физматгиз, 1960. 14. Гельфанд И. М., Шилов Г. Е., Обобщенные функции, вып. 1; Обоб- щенные функции и действия над ними, изд. 2, Физматгиз, 1959. 15. Гельфанд И. М., Шилов Г. Е., Обобщенные функции, вып. 2; Про- странства основных и обобщенных функций, Физматгиз, 1958. 16. Гельфанд И. М., Шилов Г. Е., Обобщенные функции, вып. 3; Неко- торые вопросы теории дифференциальных уравнений, Физматгиз, 1958. 17. Гельфанд И. М., Виленкин Н. Я., Обобщенные функции, вып. 4; Некоторые применения гармонического анализа. Оснащенные гильбер- товы пространства, Физматгиз, 1961. 18. Гох б ер г И. Ц., Крейн М. Г., Введение в теорию линейных несамо- сопряженных операторов, «Наука», 1965. 19. Г о х б е р г И. Ц., Крейн М. Г., Теория вольтерровых операторов в гильбертовом пространстве и ее приложения, «Наука», 1967. 20. В у л и х Б. 3., Теория полуупорядоченных пространств, Физматгиз, 1961. 21. Данфорд Н., Шварц Дж. Т., Линейные операторы. Общая теория, ИЛ, 1962. 22. Д а н ф о р д Н., Шварц Дж. Т., Линейные операторы. Спектральная теория, «Мир», 1966. 23. Дэй М., Линейные нормированные пространства, ИЛ, 1961. 24. Дьедонне Ж-, Основы современного анализа, «Мир», 1964. 25. Зигмунд А., Тригонометрические ряды, т. 1, 2, «Мир», 1965. 26. И о с и д а К., Функциональный анализ, «Мир», 1967. 27. Канторович Л. В., Функциональный анализ и прикладная математика, УМН, 111, вып. 6 (28) (1948), 89—185,
539 ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ 28. Канторович Л. В., Акилов Г. П., Функциональный анализ в нор- мированных пространствах, Физматгиз, 1959. 29. Келли Дж, Л., Общая топология, «Наука», 1968. 30. Красносельский М. А., Топологические методы в теории нелинейных дифференциальных уравнений, Гостехиздат, 1956. 31. Куратовский К., Топология, т. I, «Мир», 1966. 32. Лебег А., Интегрирование и отыскание примитивных функций, ГТТИ, 1934. 33. Лоэв М., Теория вероятностей, ИЛ, 1962. 34. Люмис Л., Введение в абстрактный гармонический анализ, ИЛ, 1956. 35. Михлин С. Г., Лекции по интегральным уравнениям, Физматгиз, 1959. 36. Морен К., Методы гильбертова пространства, «Мир», 1965. 37. Найм ар к М. А., Нормированные кольца, изд. 2, «Наука», 1968. 38. Н а й м а р к М. А., Линейные дифференциальные операторы, изд. 2, «Нау- ка», 1969. 39. Н а т а н с о н И. П., Теория функций вещественной переменной, изд. 2, Гостехиздат, 1957. 40. П л е с и е р А. И., Спектральная теория линейных операторов, «Наука», 1965. 41. Рисе Ф., Надь Б. С., Лекции по функциональному анализу, ИЛ, 1954. 42. Робертсон А., Робертсон В., Топологические векторные простран- ства, «Мир», 1967. 43. Рудин У., Основы математического анализа, «Мир», 1966. 44. Сакс С., Теория интеграла, ИЛ, 1949. 45. Титчмарш Е., Введение в теорию интегралов Фурье, Гостехиздат, 1948. 46. Трикоми Ф., Интегральные уравнения, ИЛ, 1960. 47. Ф р е и к е л ь А., Б а р - X и л л е л И., Основания теории множеств, «Мир», 1966. 48. X а л м о ш П., Теория меры, ИЛ, 1953. 49. Халмош П., Конечномерные векторные пространства, Физматгиз, 1963. 50. Халмош И., Лекции по эргодической теории, ИЛ, 1959. 51. Хилле Е., Филипс Р., Функциональный анализ и полугруппы, ИЛ, 1962. 52. Ш и л о в Г. Е., Математический анализ. Второй специальный курс. Физ- матгиз, 1965. 53. Ш и л о в Г. Е., Гуревич Б. Л., Интеграл, мера и производная. Общая теория, «Наука», 1967. 54. Ш и л о в Г. Е., Фан Дык Т и н ь, Интеграл, мера и производная на линейных пространствах, «Наука», 1967. 55. Эдвардс Р., Функциональный анализ, «Мир», 1967. 56. Schwartz L„ Theorie des distributions, I, 11, Act. Sci. Ind., 1091, 1122, Paris, 1951. 57. Fraenkel A., Abstract Set Theory, Amsterdam, 1953. РАСПРЕДЕЛЕНИЕ ЛИТЕРАТУРЫ ПО ГЛАВАМ Глава I. 2; 8; 47; 56. Глава II. 2; 4; 7; 24; 29; 31. Глава III. 4; 9; 10; 13; 15; 17; 20; 21; 23; 24; 26; 27; 28; 34; 36; 37; 41; 42; 49; 51; 55. Глава IV. 3—5; 13—19- 21—23; 26; 34; 36—38; 40; 52; 57. Глава V. 12; 21; 32; 33; 39; 41; 44; 48; 50; 53; 54. Глава VI. 21; 28. Глава VII. 32; 39; 41; 44; 53. Глава VIII. 6; 11; 12; 14—17; 25; 52. Глава IX. 35; 46. Глава X. 1; 24; 28; 30; 43; 51. Дополнение. 13; 21; 22; 26.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абсолютная непрерывность интеграла Ле- бега 301 Абсолютно непрерывная мера 264 ----функция 342 и далее — непрерывный заряд 352, 353 Абстрактная функция 485 Абстрактное уравнение Фредгольма пер- вого рода 473 Абстрактный оператор Вольтерра 472, 475 Аддитивный функционал 124 Аксиома выбора 39 — нормальности 96 ♦- отделимости 94 ----Т2 (хаусдорфова) 95 •— счетности первая 89 ----вторая 88 — треугольника 48 •— Цермело 39 Аксиоматическая теория множеств 39 Алгебра (банахова, коммутативная, нор- мированная, с единицей) 513 — множеств 42 ----измеримых 273 — с ннволюцней 527 — функций, аналитических в круге 514 ----, непрерывных на компакте 514 — — с абсолютно сходящимися рядами Фурье 515 4- h 515 Алгебраическая размерность 123, 143, 175 Алгебраически сопряженное пространство 182 Алгебраические действия над измеримыми функциями 283 Алгебраическое число 24 Альтернатива Фредгольма 468 Аннулятор 181 Антисимметричность 31 Арифметическое (евклидово) пространство 49, 120 База топологии 87, 88 Базис в конечномерном линейном простран- стве 122 — Гамеля 123, 175 — двойственный 185 — меры 379 Банахова алгебра 513 — — ограниченных операторов 515 ----, основная теорема о коммутатив- ных 528 ---- регулярная 524 ----симметричная 524 Банахово пространство 139 Бесконечное множество 21, 26 Бесконечномерное линейное пространство 122 Биекция 17 Бикомпакт 105 Бикомпактное расширение 527 — топологическое пространство 105 Билинейное отображение 488 Бинарное отношение 21 Борелевская функция 282 Борелевское множество 46, 62 Вариационное исчисление 499, 506 Вариация заряда, верхняя, нижняя и пол- ная 352 — отображения первая 482 Векторное пространство 119 Верхний предел функции в точке 102 Верхняя грань 40 Вес (весовая функция) 400 Взаимно однозначное соответствие 17 — между интегральными операто- рами и их ядрами 463 — -------линейными функционалами и гиперплоскостями 128 Внешняя мера 256, 272 , 279 ---, полуаддитнвность 256 ---, — счетная 272 Внутренняя мера 276, 279 — точка множества 61 Восстановление функции по ее производ- ной 213, 339, 345, 348, 487 Вполне непрерывный оператор 237 — ограниченное множество 106 — регулярное топологическое простран- ство 96 — упорядоченное множество 34 Всюду плотное подмножество 59 —-------- в пространстве Li 377, 378, 379 -----------L2 386 Вторая аксиома счетности 88 — производная отображения 488 и далее Второе сопряженное пространство 190 Выпуклая оболочка 130 Выпуклое множество 128 — тело 128 — — в нормированном пространстве 180 Выпуклый функционал 130 Вычитание множеств 15 Геометрическая интерпретация линейного функционала 126 ---теоремы Хана — Банаха 179 Геометрический смысл нормы линейного функционала 178
532 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ’ Геометрическое определение интеграла Лебега 316 Гильбертов кирпич 107, 129 Гильбертово пространство 155, 386 ----комплексное 166, 387 Гиперплоскость 127 Глобальная сходимость ряда Фурье 410 Гомеоморфизм пространств метрических ---- топологических 93 Гомоморфизм алгебр 514 Грань симплекса 130 График оператора 229 Двойственности принцип 15 Двойственный базнс 185 Действительное линейное пространство 119 Детерминант Грама 403 — Фредгольма 479 Диагональная процедура Кантора 27 Диаметр множества 70 Дискретная мера 264, 357 — топология 85 Дискретный заряд 352 Дисперсия 360 Дифференциал Гато 482 — Фреше 481 Дифференциалы высших порядков отобра- жения 491 Дифференциальное уравнение в классе обобщенных функций 2Н и далее ----второго порядка 459 ----, зависимость решений от начальных данных 495 ----,------параметра 496 — — с постоянными коэффициентами 434, 447 ----, теорема существования и единствен- ности 78—80 Дифференцируемый функционал 485 Длина кривой в метрическом пространстве 117 Дополнение множества 15 Достаточность запаса основных функ- ций 210 Достаточные условия минимума функцио- нала 505 ----сходимости интеграла Фурье 421 -----------многомерного 437 ------ряда Фурье 409 -----------равномерной 413, 414 Евклидово пространство 143, 162 ---- комплексное 164 ----п-мериое арифметическое 49 Единица алгебры 513 — системы множеств 42 Единичный оператор 219 Естественное отображение Е в Е** 191 Задача Коши 78—81 ---- для уравнения теплопроводности 434 ------------На плоскости 438 Задачи, приводящие к интегральным уравнениям 457—460 Замена переменных в интеграле Лебега 362 Замкнутая ортонормальная система 151 Замкнутое множество в метрическом про- странстве 60 Замкнутое множество в топологическом пространстве 84 ---на прямой 63 — подпространство нормированного про- странства 141 — покрытие 90 Замкнутость максимальных идеалов 521 — множества необратимых элементов ба- наховой алгебры 518 Замкнутый оператор 229 — отрезок 128 — шар 57 Замыкание линейное 141 — множества в пространстве метриче- ском 57 ---------топологическом 85, 98 Заряд 349, 350 — непрерывный, дискретный, абсолютно непрерывный и сингулярный 352 Знакопеременная мера 349, 350 Идеал в кольце 243 — коммутативной алгебры 515 Измеримая функция 282, 292 ---, действия иад ними 283—285 Измеримое множество 257, 272, 276—279, 352 ---, свойства 257—262 Измеримость по Каратеодори 276 Изолированная точка множества в мет- рическом пространстве 58 Изометрически изоморфные алгебры 514 Изометричность отображения нормирован- ного пространства во второе сопряжен- ное 191 Изометрия. 56 Изоморфизм алгебр 514 — между гильбертовым пространством и ему сопряженным 187 — пространств гильбертовых сепарабель- ных 156 ------— комплексных 166 ---евклидовых 155 ---линейных 121, 123 ------ Ь<Х,ц) 386 — — — комплексных 387 — частично упорядоченных множеств 32 Индикатор 31 Интеграл абстрактной функции 485 — Дирихле 408 — как б-аддитивная функция множества 302 — Лебега 291 н далее — —, замена переменных 362 — — неопределенный 320 ---, основные свойства 295 н далее ---по множеству бесконечной меры 306 и далее ---1 сравнение с интегралом Римана 307 — —t--------— несобственным ЗОЭ — Лебега—Стилтьеса 358 и далее ------по функции монотонной 358 ------ ограниченной вариации 359 — от простой функции 293 ------, свойства 294 — по множеству 295 — Пуассона 435 — Римана 307 — Римана — Стилтьеса 362 и далее — Фейера 416 — Фурье 419 и далее (см. Преобразова- ние Фурье) ---в комплексной форме 422 Интегральное неравенство Гельдера 52 ---Коши — Буняковского 51
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 53$ Интегральное неравенство Минковского 54 — уравнение 456 ----Абеля 456 ----Вольтерра 82, 457, 472 ----задачи, к нему приводящие 457— 460 — — нелинейное 82 , 456, 511 — — Фредгольма 81, 457, 460, 463, 473 Интегрируемая функция 294 ----простая 293 Интегрируемость ограниченной измери- мой функции 296 Интервал в множестве порядковых чисел 103 Интерполирование по методу наименьших квадратов 403 Инъекция 17 Исключающее «или» 16 Исчерпывающая последовательность мно- жеств 306 Итерированные ядра 477 Критерий компактности пространства мет- рического 108 -------топологического 99 — непрерывности линейного функционала. в пространстве нормированном 176 —,-----—------топологическом 175 — — отображения топологического про- странства 92 — полноты метрического пространства 69 ---ортогональной нормированной систе- мы 154 ---счетно-иормированного пространства 171 — предельности точки в /^-пространствах 94 — предкомпактности множества в полном- метрическом пространстве 109 — слабой сходимости в нормированном пространстве 195 -------последовательности функционалов 198 — суммируемости простой функции 293 •— счетной компактности топологического* пространства 103 Канторова лестница 341 Канторово множество 63 — —, точки первого и второго рода 64 Касательное многообразие к множеству 497 Классы смежности по подпространству 123 Колебание функции в точке 102 Колебания струны 457 Кольцо множеств 41 ----измеримых 272 ----, — по Жордану 279, 281 •---, порожденное полукольцом 45 ----элементарных 252 Коммутативная алгебра 513 Компакт 98, 105 Компактное топологическое пространство 98 Компактность замкнутых подмножеств компактного пространства 99 — интегрального оператора 239 •—спектра элемента алгебры* 517, 519 г— счетно-компактного метрического про- странства 108 Компактный оператор 237 ----в гильбертовом пространстве 245, 246 Комплексное пространство гильбертово 166 ----евклидово 164 ----линейное 119 Композиция борелевской функции с изме- римой 283 — измеримых функций 283 Компонента открытого множества 65 Конечное множество 21 — разложение множества 43 Конечномерный оператор 237, 462 Континуум-гипотеза 39 Контрпример к теореме Фубинн 319 Координаты вектора в евклидовом про- странстве 149 Коразмерность 124 — ядра линейного функционала 126 Корректная задача 474 Коэффициенты Фурье 152, 166, 390—392, 394, 406, 424, 439 ----, однозначность определения функции по ним 419 ----по ортонормальной системе 149 Критерий базы топологии 88 — измеримости функции 283, 292 -------простой 292 Лебегова мера 257, 263, 272 Лебегово продолжение меры 274 ------, полнота 275 Лемма Аренса 527 — Гейне-Бореля 98 — о замкнутости образа 469 ----замыкании идеала алгебры 521 ----максимальных идеалах алгебры не- прерывных функций 516 ---- равномерном стремлении к нулю ко- эффициентов Фурье компактного мно- жества функций 414 ---разложении гильбертова пространства в прямую сумму Кег Т и Im Т* 469, 470 ----сепарабельности подмножества 158 ----стремлении к нулю коэффициентов Фурье суммируемой функции 408 ----существовании максимального идеала. 521 ---- тройке 228 ----ядре мультипликативного функцио- нала 522 — об аннуляторе 180 ------ядра оператора 232 ----идеалах фактор-алгебры 521 ---- обратимости элементов, близких к. единичному 517 ---------,----обратимому 518 — Рисса о множестве невидимых точек 325, 326 ----обобщенная 329 — Цорна 40 Линейная зависимость и независимость 121 — оболочка 123 Линейно упорядоченное множество 33 Линейное замыкание 141 — многообразие 141, 158 ----абсолютно непрерывных функций 343- ---- в гильбертовом пространстве 158 ----касательное к множеству 497 — пространство 119 и далее ---- топологическое 167 Линейные функционалы в счетно-норми* рованном пространстве 181 Линейный оператор 218 и далее (см также- Оператор) ----, график 229 ----замкнутый 229 ----непрерывный 218 ----ограниченный 222. 223
534 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ' Линейный оператор самосопряженный 233 ----. сопряженный к данному 231 ----эрмитово сопряженный 233 функционал 124, 174 и далее (см. также Функционал линейный) ----не непрерывный 175 Локальная выпуклость нормированного пространства 170 ---- сильной топологии в Е* 134 — ограниченность нормированного про- странства 179 Локально выпуклое топологическое линей- ное пространство 169 «— ограниченное топологическое линейное пространство 169 Ломаные Эйлера 112 -Максимальная цепь 39 Максимальное бикомпактное расширение 527 Максимальный идеал 515 ----алгебры С? 516 — элемент 32 Максимум функционала 500 Математическое ожидание 360 Мера 251 и далее, 265 — абсолютно непрерывная 264 — дискретная 264 — Жорданова 279 — Лебега 272 ----на плоскости 257 — —, непрерывность 261 ----, полнота 262 — — п-мерная 313 Лебега—Стилтьеса 263, 264, 356, 358 ------абсолютно непрерывная 264, 357 ------дискретная 264 , 357 ------1 примеры 357 ---производящая функция 356 —-----сингулярная 264, 357 — на классе прямоугольников 252 ---- полукольце 265 , непрерывность 274 — полная 275 — сингулярная 264 — со счетным базисом 378, 379 — (J-аддитивная 268 — а-конечная 276 ' с Метод касательных 508 — математической индукции 40 — Ньютона 508 ----модифицированный 509 ----, пример 511 — последовательных приближений 76 — характеристических функций 452 Метризуемое пространство 98 Метрический компакт 105 Метрическое пространство 48 Минимальная топология, порожденная си- стемой множеств 86 — а-алгебра 46 Минимальное кольцо, порожденное систе- мой множеств 42 Минимальный элемент 32 Минимум функционала 500 Мииор Фредгольма 479 Многочлены Лагерра 402 — Лежандра 395 и далее — Чебышева 400 — Эрмита 401 Множеств алгебра 42 — кольцо 41 — объединение 13 •«- пересечение 14 Множеств полукольцо 43 — равенство 14 — разность 15 ----симметрическая 15 — система 41 Множества диаметр 70 — дополнение 15 — замыкание 57. 85 — мощность 28 Множество 13 — бесконечное 21, 26 — всюду плотное 59 — выпуклое 128 — замкнутое 60, 84 — .измеримое 257 , 272, 277 — — относительно ст-кольца 279 ----по Жордану 279, 281 — конечное 21 — линейно упорядоченное 33 — неизмеримое 264 — несчетное 23 — нигде не плотное 59 — ограниченное 57 — однозначности меры 280 — открытое 61, 65, 84 — относительно компактное 105 — отрицательное относительно заряда 350 — плотное в другом множестве 59 — положительное относительно заряда 350 — предкомпактное 105 — пустое 13 — симметричное 170 — совершенно упорядоченное 33 — счетное 22 — счетно-предкомпактное 105 — упорядоченное 33 — — частично 31 — ст-однозначности меры 281 Множители Лагранжа 507 Монотонные функции 321 Мощность континуума 28 — множества 28 —• — всех подмножеств натурального ряда 30 - W1 38 Мультипликативный функционал 521 «Наивная» теория множеств 39 Наличие счетной базы у вполне ограни- ченных метрических пространств 106 Направленное множество 32 Наследственное свойство 96 Наследственность полной регулярности 96 Начальный отрезок упорядоченного множе- ства 36 Невидимая справа или слева точка 325, 326, 329 Неизмеримое множество 264 Неисключаюшее «или» 16 Некоммутативная банахова алгебра 515 Некомпактность единичного оператора в банаховом пространстве 237 Некорректная задача 474 Нелинейное интегральное уравнение 82. 511 Необратимый элемент алгебры 516 Необходимое условие минимума функцио- нала 504 •--------для задачи с ограничениями 506 ---------? контрпример 505 ----экстремума функционала 500 Неопределенный интеграл Лебега 320, 344 Неподвижная точка отображения 75, 101 Непрерывная кривая в метрическом про- странстве 116
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 535 Непрерывное отображение пространства метрического 55 ------- топологического 91 Непрерывность линейного оператора 222 — меры 261, 274 • — слева н справа 322 — сложной функции 93 Непрерывный заряд 352 — спектр 235 — функционал на линейном топологиче- ском пространстве 174 Неприводимость о-алгебры 46 Непустота спектра элемента алгебры 517, 519 Неравенство Бесселя 151, 152, 166 ---для тригонометрической системы 391 — Гёльдера 52 — — интегральное 54 — Коши—Буняковского 49, 143 —------интегральное 51, 382 — Минковского 52 --- интегральное 54 — Чебышева 300 Несепарабельность пространства т 60 Несравнимые элементы 33 Несчетное множество 23 Несчетность множества действительных чисел 26 Нигде не плотное множество в метриче- ском пространстве 59 Нижний предел функции в точке 102 Норма 139 — билинейного отображения 488 — линейного оператора 223 —------сопряженного 23Г — функционала 176 Нормальное пространство 96 Нормированная алгебра 513 Нормированное пространство 139 Нормируемость 170 — локально выпуклых, локально ограни- ченных линейных топологических про- странств 170 — пространства, сопряженного к норми- руемому 183 Носитель заряда 352 Нулевой оператор 219 Нуль-множество 279 Область значений функции 16 — определения оператора 218 ---функции 16 Обобщение принципа сжимающих отобра- жений 82 Обобщенная производная 208 ---, сравнение с обычной 348 — • теорема Арцела 114 — функция 203 и далее --- комплексная 215 ---на окружности 216 -------пространстве КП 215 --- первообразная 213 ---периодическая 216, 217 ---, производная 208 --- регулярная 205 --- сингулярная 205 Образ множества 17 — оператора 218 — элемента 17 Обратимый оператор 225 — элемент алгебры 516 Общий вид линейного оператора нз в Rm 219 Общий вид линейного функционала в про* странстве гильбертовом 187, 188, 386 -----------— конечномерном 185 -----------—----------счетно-нормированном -----------С[а, 5] 369 -----------С[а, Ь] 373 ~ — — — — Со 186 --------------1,. 1р187 . Объединение множеств 13 Ограниченное множество в пространстве- лннейном топологическом 169 --------- метрическом 57 — отображение 486 Ограниченность слабо ограниченного под* множества нормированного простран- ства 194, 195 ---сходящейся последовательности функ- ционалов на банаховом пространстве 198 ---------элементов нормированного про- странства 194 Однозначность определения суммируемой функции по ее коэффициентам Фурье 119- --------------преобразованию Фурье 424 — продолжения меры 276, 280 и далее Однородно-выпуклый функционал 131 --------------на комплексном пространстве 136 Однородный функционал 124 Окрестность множества 95 — точки 85 Оператор 218 н далее — Вольтерра 241, 472, 475 — вполне непрерывный 237 ------ в гильбертовом пространстве 245 — Гильберта—Шмндта 461 ------, компактность 461 ---—, сопряженный оператор 463 — дифференцирования 220, 221 — единичный 219 — замкнутый 229 — компактный 237 ---в гильбертовом пространстве 245, 246^ — конечномерный 237 — линейный 218 ---нз Rn в Rm 219 — непрерывный 218 — нулевой 219 — обратимый 225 — обратный к данному 225 — ортогонального проектирования 220 — самосопряженный 233, 246 — сопряженный 231 ---в евклидовом пространстве 233 — Фредгольма 4&1 — эрмитово-сопряженный 233 Операторный метод решения дифферен- циальных уравнений 446—448 Операции над множествами 13, 15 Операция замыкания в пространстве мет- рическом 57 --------- топологическом 97 Определяющая система окрестностей 89’ Оптимальное управление 506 Ортогонализация 147 Ортогональная нормированная система 145-- Ортогональное дополнение 159 Ортогональность векторов 144, 166 — с весом 400 Ортогональные многочлены Лагерра 402 ---Лежандра 395 и далее ---с дискретным весом 402 и далее ---Чебышева 400 — — Эрмита 401
536 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ’ Ортогональные системы на произведении пространств 397 ----функций в Ьъ 389 ----Радемахера—Уолша 405 -------Хаара 404. 405 Ортогональный базис 145 ----в пространствах L2(— <», °°) и £г(0, <») 401 ----из собственных векторов 249 ----нормированный 145 Ортонормальная система 145 Ортопроектор 220 Основной параллелепипед гильбертова пространства 107 Остаток упорядоченного множества 36 Отделимость выпуклых множеств в про- странстве линейном 137 -----------нормированном 180 — сильной топологии в £* 184 Отделимые топологические пространства 168, 169 Открытое множество в пространстве мет- рическом 61 ---- топологическом 84 ---- на прямой 62 — покрытие 90 Открытость множества обратимых ограни- ченных операторов 229 ------- элементов банаховой алгебры 518 Открытый отрезок 128 — шар 56 Относительная топология 86 Отношение бинарное 21 — эквивалентности 19 Отображение 16 (см. также Оператор, Функционал, Функция) — билинейное 488 — «в» 17 — гомеоморфное пространств метриче- ских 56 -------топологических 93 — дифференцируемое 480 — замкнутое 93 — линейного топологического пространства во второе сопряженное 191 «на» 17 — непрерывное 91, 92 — ограниченное 486 — открытое 93 — регулярное 497 —, сохраняющее порядок 32 — п-лннейное 490 Оценка скорости сходимости метода Нью- тона 511 Первая аксиома счетности 89 — вариация отображения 482 Первообразная обобщенной функции 213 Пересечение множеств 14 — системы подпространств линейного про- странства 123 Плотное подмножество в метрическом про- странстве 59 Плотность распределения вероятностей 361 Поглощение 134, 169 Подмножество 13 — собственное 13 Подпокрытие 90 Подпространство нулей лииёйного функ- ционала 126 — пространства гильбертова 158 ----линейного 122 -------нормированного 141 -------, порожденное множеством эле- ментов 123 Подпространство пространства метрическо- го 55 ----топологического 86 Покрытие (открытое, замкнутое, конечное, счетное) 90 Полная вариация заряда 352 ----функции 332 и далее — мера 275 — ограниченность 106 — регулярность топологического простран- ства 96 — система элементов в нормированном пространстве 141 — упорядоченность 34 Полное метрическое пространство 66 Полнота пространства рефлексивного нор- мированного 192 ----, сопряженного к нормированному, в сильной топологии 183 ----счетно-нормированного 171 ----С[а, Ь] 67 ----Ц 376 ----Ьг 383, 384 ----li 67 ----т 69 ----Rn 66 - - R?. R" 67 — системы функций Лагерра 431 -------тригонометрических 390, 393, 418 -------Уолша 405 —------Хаара 405 -------Эрмита 431 Полный прообраз 17 ----системы множеств 47 Полуаддитнвность меры 255, 270, 280 Полукольцо 43 Полунепрерывная функция на метриче- ском пространстве 102 Полуиепрерывность снизу (сверху) 102 ----длины кривой в метрическом про- странстве 117 Пополнение пространства 71, 157 Порядковое число 35 Порядковый тнп 33 — — (О 3 3 ----«1 38 Порядковых чисел произведение 36 ---- сравнение 36 ----сумма 34 Порядок функционала на счетио-нормнро- ванном пространстве 182 Последовательность сходящаяся 58, 90 ----в счетно-нормированном простран- стве 171 ----обобщенных функций 207 ----слабо 193 — фундаментальная 66 «Почти всюду» 285 Почти периодические функции 450 Правило множителей Лагранжа 507 Предел последовательности в метрическом пространстве 58 — справа нли слева 321 Предельная точка в метрическом про- странстве 58 ------- топологическом пространстве 85 -------Трпространстве 94, 95 Предельный переход под знаком интеграла Лебега 302 ------------ Стилтьеса 366 Преобразование Лапласа 446 ----, применение к решению дифферен- циальных уравнений 446—448 — Фурье 423
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 537 Преобразование Фурье быстроубывающих функций 4о1 ----в пространстве Lz(—°°. °°) 438—445 ----обобщенных функций 453 — — — —, примеры 454 ----, однозначность определения функции 424 ----, основные свойства 427—430 ----, примеры 425—427 — — свертки 432, 433 ----, формула обращения 423 ----функции п переменных 435 и далее ----Функционала 455 — Фурье — Стилтьеса 449, 452 -------свертки функции с ограниченным изменением 451 Применения принципа сжимающих ото- бражений 75—83 — теоремы о неявной функции 495—499 Пример аддитивной, но не о-аддитивиой меры 269 — не вполне ограниченного множества 107 — неизмеримого множества 264 — иесепарабельного пространства 60, 147 — не о-конечной меры 277 — счетно-компактного, но не компактного пространства 103 — функции, дифференцируемой только слабо 484 Примеры банаховых алгебр 514—515 — линейных операторов 219—221 ----функционалов 125 ----на нормированных пространствах 176-178 — ортогональных базисов 145, 146 — преобразований Фурье 425—427 -------обобщенных функций 454 — производных от обобщенных функций 208—210 — пространств векторных 120, 121 ----нормированных 139, 140 ----сопряженных 185—190 ----счетно-нормированных 171—173 ----топологических линейных 167, 168 — слабо сходящихся последовательностей 195-197 — экстремальных задач 500—503 Принцип двойственности 15 •—равномерной ограниченности 519 — сжимающих отображений 75 -------, обобщение 82 -------, применения 75—83 Проблема Н. Н. Лузина 411 Программирование линейное н выпуклое 506 Продолжение меры 246 ----по Жордану 279 -------Лебегу 271-276 Произведение бесконечно дифференцируе- мой функции на обобщенную 207 — мер 312, 313 — оператора на число 224 — операторов 224 — порядковых чисел 36 — функционала на число 182 — элемента линейного пространства на число 119 — элементов алгебры 513 Производная Гато 482 — заряда по мере 353, 356 — интеграла по верхнему пределу 331, 337 — линейного отображения 481 — обобщенной функции 208 — сложной функции 481 — Фреше 481 Производные высших порядков 488 Производные числа 324, 325 Производящая функция меры Лебега — Стилтьеса 356 Прообраз 17 — топологии 92 Простая функция 292 ---суммируемая (интегрируемая) 293 Пространства гомеоморфные 56, 93 — нзометричные 56, 514 — изоморфные евклидовы 155 ---линейные 121 Пространство арифметическое 49, 120 — банахово 139 — бикомпактное 105 — быстро убывающих последовательностей.* 173 — векторное 119 — вполне регулярное 96 — второе сопряженное 190 — гильбертово 155, 156 — дискретное 48, 49, 59, 66 — евклидово 143, 164 — изолированных точек 48, 49, 59, 66 — компактное 98 — линейное 119, 167 — метрнзуемое 98 — метрическое 48 ---сепарабельное 59, 89 — нормальное 96 — нормированное 139 — основных функций 204 — полное 66 — полурефлексивное 191 — регулярное 95 — рефлексивное 191 — с аксиомой счетности второй 88 первой 89 — связное 90 — сепарабельное 59, 89 — слипшихся точек 85 — со счетной базой 88 метрическое 89 — сопряженное 182 — , — к пространству быстро убывающих последовательностей 189 — ,-----гильбертову 187, 188 —t--------счетно-нормированному 181 -------С[а, Ь] 373 — ,-----Со 186 -------Zi, 1р 187 — ,-----R ", Сге 185 — счетно-гильбертово 172 — счетно-компактное 103 — счетно-нормированное 171 — топологическое 84, 167 — функций с ограниченным изменением 333, 337 — хаусдорфово 95 — с" 120, 122, 140, 165 — С[а, Ь] 50, 60, 67, 120, 140, 164, 192, 197, 369- — С‘[а, ft] 373, 502 - с" [a, ft] 173, 526 С,[a, ft] 51, 60, 68, 146 ---комплексное 165 — Ст 514 — CBV [0, 1] 527 — с 120 — Со 121, 192 — с* 186, 192 — К 204, 454 — К' 455 — К[а, ft] 168, 171, 173 — К 205
538 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ' Пространство Кп 215 — Li 376, 379, 387-389 — —, плотность множества функций не- прерывных 378 — —,-------простых 377 — L2 381—384 , 387—389 — — комплексное 387 -L 385 — /, 186, 192 — I- 50, 60, 67, 107, 120, 145, ГЛ> ----комплексное 165 — 1р 54, 192 — /’. 1* 187, 192 — т 51, 60, 121, 140, 187, 192 — R' 49, 66, 120, 139 — Rn49, 66, 166, 120, 122, 139, 176,185. 195 - RJ, 50 . 60. 67. 140. 186 — R” 52, 163, 185 — rJ, 50 , 60, 67, 140, 186 — R°° 121, 168 — 172, 217. 218. 432, 453 — S Jo 453 — Vo[a, b] 337, 372 - Z 453 Процесс ортогонализации 149 Прямая сумма 160 ----счетного числа подпространств 161 ----а-алгебр 277 Прямое произведение множеств 310 ----систем множеств 310 Прямоугольник 251 Пустое множество 13 Равенство множеств 14 — Парсеваля 151 ---для тригонометрической системы 391 — порядковых чисел 36 Равновесие нагруженной струны 457 Равномерная непрерывность отображения метрического пространства 113 — ограниченность семейства функций ПО Равностепенная непрерывность семейства функций ПО Радикал банаховой алгебры 524 Разбиение множества на классы 18 Разделение выпуклых подмножеств с по- мощью линейных фннкциоиалов 138, 180 Разложение Жордана 352 — меры Лебега — Стилтьеса в сумму аб- солютно непрерывной, дискретной и сингулярной 357 — функции в ряд Фурье (см. Ряд Фурье) ---монотонной на непрерывную и функ- цию скачков 324 ---по многочленам Лежандра 397 --- с ограниченным изменением в раз- ность монотонных 335 ------------на абсолютно непрерывную, сингулярную и функцию скачков 347 — Хана 351 Размерность линейного пространства 122 Разность множеств 15 Расстояние в метрическом пространстве 48 — между двумя множествами 65 ---кривыми 117 — от точки до множества 65 Регулярная банахова алгебра 524 — точка оператора 235 ~ — элемента алгебры 516 Регулярное отображение 497 — топологическое пространство 95 Регулярность отделимых линейных тополо- гических пространств 169 Резольвента оператора 235 — элемента алгебры 517 Резольвентное ядро 479 Рефлексивное линейное топологическое пространство 191 Рефлексивность 19, 31 Решетка 40 Ряд Фурье 149, 152, 166, 407 — — в комплексной форме 394, 424 — по ортогональной системе функций 390 ----— ортонормальной системе 149 ------- тригонометрической системе на от- резке [—Я; я] 391 --------------произвольном отрезке 392 — — расходящийся 411 ----. суммирование по Фейеру 415 и далее ----, сходимость в точке 409 ----, — глобальная 410 ----. — равномерная 413, 414 ----функции двух переменных 399 Самосопряженный оператор 233, 246—250 Сведение дифференциального уравнения второго порядка к интегральному урав- нению 459, 460 Свертка 433 — в li 515 — функций с ограниченным изменением 451 Свойства абсолютно непрерывных функций 343 — измеримых множеств 258 и далее, 272 и далее ----функций 282 и далее — интеграла абстрактной функции 486 ----Лебега 295 и далее ----Римана — Стилтьеса 363 и далее — полной вариации 332—335 •— преобразования Фурье 427—430 — производной Фреше 481, 482 — спектра н резольвенты элемента ал- гебры 517—519 — счетных множеств 23, 24 — функций с интегрируемым квадратом 381 Свойство параллелограмма 162 Связное двоеточие 85, 94 Связность открытого множества в Rn 65 — топологического пространства 90 Связь между гладкостью функции и убы- ванием ее преобразования Фурье на бесконечности 429 Сдвиг открытого множества 167 Сепарабельное пространство метрическое 59 ---- топологическое 89 Сепарабельность подмножеств сепарабель- иого метрического пространства 158 — пространств Rn, /2, С 1а, 6] С2[а, 6] 60 — пространства Li 372 ----L2 386 Сжатие (сжимающее отображение) метри- ческого пространства 74 Сильная производная отображения 481 — сходимость в линейном нормированном пространстве 193 — топология в пространстве, сопряженном к линейному топологическому 84 •--------,----нормированному 183 Сильно положительный квадратичный функционал 505
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 530 Сильный дифференциал 481 Симметрическая разность 15 Симметричная банахова алгебра 524 Симметричное множество в линейном про- странстве 170 Симплекс 130 Сингулярная функция 347 Сингулярный заряд 352 Система множеств 41 — окрестностей нуля 167 — ортогональных векторов 144 -----функций Радемахера 405 -----Уолша 405 —----Хаара 404, 405 Скалярное произведение 143, 165 — — в комплексном пространстве 165 -----£2 382 Скачок функции в точке разрыва 322 Слабая производная отображения 482 — сходимость в пространстве линейном топологическом 193 --------- нормированном 194 --------- функционалов 198 —--------С[а, Ь] 197 ---------/2 196 — топология в пространстве линейном то- пологическом 193 —--------сопряженном 197, 199 ---------. — к банахову 198 и далее Слабо ограниченное подмножество в нор- мированном пространстве 194, 195 Слабый дифференциал 482 След системы множеств 86 Случайная величина 360 -----дискретная и непрерывная 361 Собственное значение 234 — подмножество 13 — подпространство 122 Совершенно упорядоченное множество 33 Согласованные нормы 170 Соответствие взаимно однозначное 17 Сопряженное пространство 182 — ядро 463 Сопряженно-л инейный изоморфизм 188 — функционал 124 Сопряженно-однородный функционал 124 Сопряженный оператор 231 -----в евклидовом пространстве 233 -----, свойства 231—234 Спектр оператора (точечный и непрерыв- ный) 235 -----в гильбертовом пространстве, ком- пактного 475 — элемента алгебры 516 Спектральная теорема для ограниченных самосопряженных операторов 527 Спектральный раднус 236, 519 -----элемента алгебры 517 Сравнение порядковых чисел 36 — топологий 85, 86 Сравнимые нормы 171 Среднее квадратичное уклонение 383 Степень меры 313 — множества 310 — системы множеств 311 Строение класса множеств, измеримых по Лебегу 272 и далее Структура 40 Струна 457—459 Сумма множеств 13 ----- упорядоченная 34 — операторов 223 — порядковых чисел 35 — функционалов 182 — элементов векторного пространства 119 Суммируемая функция 293, 294, 306 Суммы Дарбу 307 — Фейера 415 Сходимость в пространстве К 204 -------L\ 376, 387—389 -------La 383, 387—389 -------5оо217 -------Z 454—455 --- среднем 376 ------- квадратичном 383 — по мере 288, 388 — последовательности в пространстве мет- рическом 58 --------- топологическом 90 — — функций, сравнение разных видов 387—389 — почти всюду 286, 388 Счетная аддитивность меры 255, 268, 273 ---— Лебега 261 — база 88 — — у вполне ограниченных метрических пространств 106 — компактность 103 Счетно-гильбертово пространство 172 Счетное множество 22, 25 Счетно-компактное топологическое про- странство 103 Счетно-нормированное пространство 171 Счетно-предкомпактное множество 105 Счетность множества рациональных чи- сел 23 — ортогональной системы в сепарабель* ном евклидовом пространстве 147 Счетный базис меры 379 Сюръекция 17 Теорема Арцела 109—111 ---обобщенная 114 — Банаха о замкнутом графике 229 — — об обратном операторе 225 — Банаха — Штейнгауза 519 — Бэра 70 — Вейерштрасса 141, 146, 390, 395, 418 — Вннера 525 — Гельфанда — Наймарка 528 — Гильберта — Шмндта 246, 247 — Егорова 287 — Кантора — Бернштейна 28 — Карлесона 411 — Лебега о восстановлении абсолютно не- прерывной функции по ее производной 345 ------ дифференцируемости монотонной функции 324 ------ предельном переходе 302 — Леви 303 — Лузина 291 — Люстерника о касательном многообра- зии 497 -----------в разложимом случае 498 — о банаховой алгебре, изоморфной полю С 519 ---вложенных шарах 69 ---выборе счетного подпокрытия в про- странствах со счетной базой 90 ---выделении подпоследовательности, сходящейся почти всюду, из последо- вательности, сходящейся по мере 289 ---гомеоморфности непрерывной биек- ции компакта в хаусдорфово простран- ство 101 — — гомоморфизме банаховой алгебры в алгебру непрерывных функций 523—524 — — дифференцировании интеграла по верхнему пределу 331, 337
<540 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ' Теорема о дифференцируемости функций с ограниченным изменением 335 ----достижении нижией грани полуне- прерывной функции 103 ----зависимости решения дифферен- циального уравнения от начальных дан- ных 495 ----замкнутости компакта в объемлющем хаусдорфовом пространстве 100 -------множества компактных операто- ров 241 ----компактности замкнутого шара в про- странстве, сопряженном сепарабель- ному нормированному в смысле ‘-сла- бой топологии 202 -------оператора Гильберта — Шмндта 461 ---------, сопряженного компактному 243 ------- произведения операторов, одни из которых компактен 243 ------- спектра элемента алгебры 517 — — композиции измеримых функций 282, 283 — — метризуемости единичного шара в пространстве, сопряженном сепарабель- ному нормированному 200 ----множителях Лагранжа 506 — — мощности множества всех подмно- жеств 29 — — наличии счетной базы у сепарабель- ных метрических пространств 89 ----неподвижной точке 75 — — непрерывном образе компактного про- странства 101 ---- непрерывности композиции непрерыв- ных отображений 93 -•--непустоте спектра 236. 517 ----неявной функции, дифференцируе- мость 494 — — -----, существование 492 ----нормальности компакта 100 ----пересечении выпуклых множеств 129 -------колец 42 ------- топологий 86 ---- полной и замкнутой ортонормальных системах 151, 154 — -- — ограниченности счетно-компактного метрического пространства 107 — — полноте произведения полных ортого- нальных систем 397 ------- пространства L\ 376 ---------д, 383. 384 ---------, сопряженного к нормируемому 183 ---- полуаддитивностн меры, заданной на кольце 267 ---- пополнении метрического простран- ства 71 ----почленном дифференциповании ряда из монотонных функций 329 -— — предкомпактности ограниченных мно- жеств в Е* в смысле ‘-слабой тополо- гии 202 <---продолжении меры с пппукппьца на порожденное им кольцо 266. 269 ----прообразе пересечения множеств 18 -------суммы множеств 17 ----пространстве, сопряженном к гиль- бертову 187, 188 -------.----счетно-нормированному 189 ----прямом произведении полуколец 311 ----равенстве норм оператора и его со- пряженного 231 ----равномерной непрерывности непре- рывного отображения метрического ком- пакта 113 .----- разделении выпуклых множеств 180 Теорема о разложении абсолютно непре- рывной функции в разность монотон- ных абсолютно непрерывных функций 343 ------- гильбертова пространства в пря- мую сумму подпространства и его орто- гонального дополнения 159 ------- заряда 350 ------- монотонной функции на функцию скачков и непрерывную 324 -------отображения по формуле Тейлора 491 -------функции с ограниченным измене- нием в разность монотонных 335 -------------------сумму абсолютно не- прерывной, сингулярной и функции скачков 347 ----связи выпуклых функционалов н вы- пуклых множеств 132 ----сепарабельности пространства L\ 379 — — слабой сходимости последователь- ности элементов нормированного про- странства 195 -----------функционалов на банаховом пространстве 198 — — собственных векторах и собственных числах компактного оператора 244 , 246 ---- совпадении компактности и счетной компактности для пространств со счет- ной базой 104 ----спектральном радиусе 236, 519 ---- спектре ограниченного оператора 235, 236, 519 ----сравнении интеграла Римана с инте- гралом Лебега 307 ---------Рнмана — Стилтьеса с интегра- лом Лебега — Стилтьеса 362 ---- сравнимости порядковых чисел 36 ---- среднем 363 ----строении минимального кольца над полукольцом 45 ---- суммируемости производной монотон- ной функции 340 ---- существовании базиса подпростран- ства гильбертова пространства 159 — -----кривой наименьшей длины между двумя точками метрического компакта 118 —------минимального кольца 42 —------минимальной О-алгебры 46 ------- предельной точки у бесконечного подмножества компактного простран- ства 99 ------- сильной производной 484 ----сходимости метода Ньютона 509 -------по мере последовательности, схо- дящейся почти всюду 288 ------- ряда Фурье в точке 409 ------------равномерной 413. 414 ---- счетности множества точек разрыва монотонной Функции 322 — — фактор-алгебре 520 ----(j-аддитнвности прямого произведе- ния мео 313 — рб абсолютной непрерывности неопре- деленного интеграла Лебега 344 ----анв ’итн,т«ости резольвенты элемента алгебры 517 ---- измеримости предела последователь- ности измеримых функций 284 ----изомот>Фи™<е банаховой алгебры с ал- геброй Сд! 524 ------- пространств сепарабельпых гиль- бертовых 156, 166 ---------С[а, 6] * и У°[а, 5] 373
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 541 Теорема об обращении оператора, близ- кого к единичному 230 ----— преобразования Фурье 421 -----------функции п переменных 437 ----общем виде линейного функционала на пространстве гильбертовом 187, 188, 386 <------------------С‘[а, Ь] 373 — — ограниченности непрерывной функции на компактном пространстве 101 ------- снизу функции, полунепрерывной снизу на компактном ^пространстве 103 ------- спектра линейного оператора 235 ----отделении непересекающихся выпук- лых подмножеств в вещественном ли- нейном пространстве 138 ----открытом отображении 227 ----открытости множества обратимых операторов 230 — — ортогонализации 147, 148 — - условиях счетной компактности 103 ----условном экстремуме 505 отделимости (первая и вторая) 180 — Пеано J11 — Планшереля 439, 440 — Радона — Никодима 353 — Рисса об общем виде линейного функ- ционала на Cfa, 369, 372 — Рисса — Фишера* 153 — Стоуна — Вейерштрасса 525 — Стоуна — Чеха 527 — Тихонова 527 — Урысона о метризуемости 98 -------продолжении 97 — Фату 305 — Фейера 390, 415 ---- для пространства Li 419 — Фубиин 317 ----«малая» 329 — Хана — Банаха 134 -------в пространстве комплексном 136 j----------нормированном 179 — Хаусдорфа 40 — Хелли вторая 368 ---- первая 366 — Цермело 39 Теоремы Фредгольма для уравнений в про- странстве банаховом 472 --------------непрерывных функций 473 ---------с ядром вырожденным 465—467 --------------произвольным 468—471 --------------симметрическим 465 Теория множеств 13, 39 — обобщенных Функций 203 и далее Тождество Гильберта 518 Топологическое пространство 84 ---- линейное 167 ---- со счетной базой 88 Топология 84 — в множестве максимальных идеалов 523 — — счетио-нормироваином пространстве 171 — дискретная 85 —, порожденная системой множеств 86 —, способы задания 97 — тривиальная 85 — ядерно-выпуклая 170 Тотальная система векторов 155 Точечный спектр 235 Точка внутренняя 61 — изолированная 58 — неподвижная 75 •— предельная в пространстве метрическом 58 ---------топологическом 85 Точка прикосновения в пространстве мет« рическом 57 --------- топологическом 85 Точки невидимые слева 326 ---справа 325, 329 — общего положения в линейном простран- стве 130 — разрыва монотонной функции 322 ---первого рода 322 Точная верхняя нлн нижняя грань 40 Транзитивность 31 Трансфинит 35 — <о 33 — (0i 38 Трансфинитная индукция 40 Трансфнннтное порядковое число 35 Трансцендентное число 27 Тривиальный идеал алгебры 515 Тригонометрическая система на отрезке [—Л, Л] 390 ---------[0, Л] 393 --- — плоскости 399 Тригонометрический ряд Фурье 391 -------в комплексной форме 394 -------для функций п переменных 399 Угол между векторами 144 Умножение в алгебре 513 Упорядоченная сумма 34 Упорядоченное множество 33 — произведение 35 Уравнение Абеля 456 — Вольтерра 82 — — второго рода 457. 472 ---первого рода 457 — колебаний струны 459 — равновесия нагруженной струны 458 — теплопроводности 434, 438 — Фредгольма второго рода 81, 457 ---------с симметрическим ядром 463, 464 --- первого рода 457 ------- — абстрактное 473 Условие Дини 409, 414 — Липшица 65 Условия сжимаемости 76—78 Условный экстремум 507 Фактор-алгебра 520 Фактор-пространство пространства бана- хова 142 --- линейного 123 --- нормированного 141 Формула для спектрального радиуса эле- мента алгебры 519 — конечных приращений для отображения 482, 483 — Ньютона — Лейбница 339 -------обобщенная 487 — обращения для преобразования Фурье 423, 436 — Родрига 397 — Тейлора для отображений 491 — Фурье 421 ---комплексная 423 Фундаментальная последовательность то- чек в метрическом пространстве 66 Функции Лагерпа 402 ---, полнота 431 — Эрмита 401 ---как собственные Функции преобра- зования Фурье 442—445 ---, полнота 431
542 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Функционал 102, 124 • — аддитивный 124 — выпуклый 130 — дифференцируемый 485 — линейный 124. ---, геометрический смысл 126 н далее ---не непрерывный 175 ---непрерывный 174 ------на пространстве гильбертовом 187 — --------- нормированном 176 -----------счетно-нормированном 181 ----------- С[а, 6] 369 -----------С[д, Ь] 373 — — — — — Со 186 -----------1,, 1р 187 -----------r" 185 ------, примеры 176—178 ---ограниченный 175, 176 ---, примеры 125, 126 — Минковского 132 — мультипликативный 521 — непрерывный 174 — однородно-выпуклый 131 ---на комплексном пространстве 136 — однородный 124 — положительно-однородный 130 — , разделяющий множества 137, 180 — сопряженно-линейный 124 — сопряженно-однородный 124 Функция 16 — абсолютно непрерывная 342 — абстрактная 485 — весовая 400 — Дирихле 286, 308 — измеримая 282 — , — по Борелю 282 — монотонно неубывающая (невозрастаю- щая) 321 — непрерывная в пространстве метриче- ском 55 --------- топологическом 91 — обобщенная 205 — основная 204 — простая 292 — распределения 360 — с интегрируемым квадратом 381 --------- комплексная 387 — — ограниченным изменением 332 — сингулярная 347 — суммируемая 294, 295, 306 — Финитная 203 — Хевисайда 209 — В-измеримая 282 — м-измеримая 282 — <5у)-измеримая 282 Характеристическое свойство евклидовых пространств 162 Хаусдорфова аксиома отделимости 95 Хаусдорфовы пространства 95 Центрированная система множеств 99 Цепь в частично упорядоченном множе- стве 39 Частичная упорядоченность 31 — ~ топологий 86 Число алгебраическое 24 — производное (верхнее, нижнее, левое правое) 324, 325 — трансфинитное 35 — трансцендентное 27 Шар замкнутый 57 — открытый 56 Шара центр н радиус 57 Эквивалентность множеств 25 — норм 143, 171 Эквивалентные функции 285, 353 Экстремальные задачи 499 н далее ---с ограничениями 506 Экстремум функционала 500 ---, необходимые условия 500, 506 Элементарное множество иа плоскости 25Z- Эрмитово-сопряженный оператор 233 Ядерно-выпуклая топология 170, 175 Ядро Гильберта — Шмидта 460, 465 — Дирихле 408 — интегрального уравнения Фредгольма 81, 460 — итерированное 477 — линейного оператора 218 --- функционала 126 — множества в пространстве линейном 128- ---------нормированном 180 — произведения двух интегральных опера- торов 476—479 — Фейера 416 В*-алгебра 527 В-измеримая функция 282 В-множества 46 В-пространство 139 С-свойство 291 ft-мерная грань симплекса 130 «-линейное отображение 490 «-мерное пространство арифметическое 120 — — евклидово 49 «-мерный симплекс 130 n-я производная отображения 488 — степень меры 313 ---множества 310 ---системы множеств 311 Т\’Пространство 94, 168 Л-пространство 95 б-алгебра 45 б-кольцо 45 — измеримых множеств 275 б-функция 125, 178, 197, 198, 205, 411 — , производная 206 — смещенная 206 е-окрестность 57 в-сеть 106 ц-измеримая функция 282 ц-эквнвалентные функции 353 а-адднтивность интеграла Лебега 298, 302 — меры 255, 257, 261, 268, 273 ---Лебега 298, 302 0-алгебра 45 — измеримых множеств 257—259, 273, 275 — неприводимая 46 (^кольцо 45 а-конечиая мера 276 t-слабая топология 199
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ <А 514 Вт 527 В (х0, г) 56 В [х0, г] 57 В(Х2, У) 489 ВС (X, У) 486 Ж(@) 46 С 513 С = С [0, 1] 50 С [а, 6] 50 Ст 514 С1 [а, 6] 373 Сп[а, 6] 173 С2 [а, &] 51 Се Ро’ *1] 495 С°° 168 CBV[0, 1] 527 с 28 DF (х, Л) 482 D (Л), D (s, t; Л) 479 dF, d2F, dnF 491 £*. Е$ 182 (£’, b) 195 (£’, II'll) 183 f: M-> N 17 f(4) 17 Г1(Ь) 17 j-1 (t) 92 F" 488 9S(E, E^ 229 Im 218 J (E) 128 К [a, Z>] 168 Ker 126, 218 Li, Li (X, p) 375 T,2, 7,2 (7f, ц) 381 Lp (X, ц) 385 Z (E, Er) 224 L/L' 123 7- ({xa}) 123 /i 186, 515 /2 50 lP 54 JT 521 m 51 N (Xn, У) 490 1R(<S) 42 Soo 217 S^ 453 ?x0 497 Vba 332 Vo [a, 6] 337 W 515 Z 453 Pi (*, У) 50 Рр (x. У) 54 Poo U. У) 50 т(Е) 86 К 28 «о 28 «1 38 0 13 U 13 П 14 А 15 \ 15 С 15 ~ 25 ф 19