/
Автор: Зарубин В.С. Пирумов У.Г.
Теги: общее машиностроение технология машиностроения математика машиностроение высшая математика энциклопедия
ISBN: 5-217-01951-4
Год: 2003
Текст
МАШИНОСТРОЕНИЕ
ЭНЦИКЛОПЕДИЯ
В СОРОКА ТОМАХ
РЕДАКЦИОННЬШ СОВЕТ
ФРОЛОВ К.В.
Председатель редакционного совета
Члены совета:
Белянин П.Н. (зам. Председателя редсовета и главного
редактора), Колесников К.С. (зам. Председателя редсовета
и главного редактора), Адамов Е.О., Анфимов Н.А.,
Асташов В.К., Бессонов А.П., Бюшгенс Г.С.,
Васильев В.В., Васильев Ю.С., Воронин Г.П.,
Глебов И.А., Долбенко Е.Т., Жесткова И.Н.,
Кирпичников М.П., Клюев В.В., Коптев Ю.Н.,
Ксеневич И.П., Мартынов И.А., Митенков Ф.М.,
Новожилов Г.В., Носов В.Б., Образцов И.Ф.,
Панин В.Е., Паничев Н.А., Патон Б.Е., Пашин В.М.,
Платонов В.Ф., Пугин Н.А., Румянцева О.Н.,
Силаев И.С., Федосов Е.А., Фортов В.Е., Черный Г.Е,
Шемякин Е.И.
МОСКВА "МАШИНОСТРОЕНИЕ" 2003
Раздел I
ИНЖЕНЕРНЫЕ
МЕТОДЫ РАСЧЕТОВ
Том 1-1
МАТЕМАТИКА
Редакторы-составители:
чл.-корр. РАН У.Г. Пирумов,
д-р техн. наук В.С, Зарубин
Ответственный редактор академик РАН
К.С. Колесников
Редакторы тома: B.C. Зарубин (Введение в анализ),
А.П. Крищенко (Алгебра и геометрия),
АА. Пунтус (Дифференциальные уравнения),
А.Р. Панков (Функциональный анализ, Стохастический анализ),
У.Г. Пирумов (Методы математического моделирования)
МОСКВА "МАШИНОСТРОЕНИЕ" 2003
УДК 621.01/03
ББК 22.1
М38
Авторы: У.Г. Пирумов, B.C. Зарубин, А.П. Крищенко, В.И. Безяев, А.И.
Белоусов, Б.В. Вербицкий, Е.А. Власова, И.К. Волков, Р.Я. Глаголева,
Е.Р. Горяинова,. Т.А. Турина, Е.П. Иванова, Г.А. Каменский,
А.Н. Канатников, А.И. Кибзун, Е.С. Кочетков, Г.Н. Кувыркин,
Т.А. Летова, А.Д. Мышкис, А.Р. Панков, А.В. Пантелеев, B.C.
Пугачев, А.А. Пунтус, Ю.А. Рябов, В.И. Синицын, А.Н. Сиротин,
И.В. Станкевич, СБ. Ткачев, В.Н. Четвериков
Ученый секретарь тома канд. физ.-мат. наук А.Н. Канатников
Рабочая группа Редакционного Совета: К.С. Колесников, П.Н. Белянин,
В.В. Васильев, В.К. Асташов, А.П. Бессонов, Н.Н. Боброва,
Е.Т. Долбенко, И.Н. Жесткова, Г.В. Москвитин
Машиностроение. Энциклопедия / Ред. совет: К.В. Фролов (пред.) и др.-М.: Машиностроение.
М38 Математика. Т. 1-1 / У.Г. Пирумов, B.C. Зарубин, А.П. Крищенко и др.; Под общ. ред. У.Г. Пирумова,
B.C. Зарубина. 2003. 992 с, ил.
Изложены широко используемые в инженерной практике основные сведения из
элементарной математики и разделов современного курса высшей математики, изучаемого
в технических вузах и университетах.
Уделено внимание направлениям прикладной математики, получившим развитие в
последнее время и нашедшим применение при создании новой техники в различных
отраслях промышленности.
ББК 22.1
ISBN 5-217-01951-4 (Т. 1-1)
ISBN 5-217-01949-2 © Издательство "Машиностроение", 2003
ОГЛАВЛЕНИЕ
ПРЕДИСЛОВИЕ 21
Часть I. ВВЕДЕНИЕ в АНАЛИЗ 23
Раздел 1. ЭЛЕМЕНТАРНАЯ МАТЕМАТИКА 23
Глава 1.1. ЭЛЕМЕНТАРНАЯ АЛГЕБРА
(B.C. Зарубин) 23
1.1.1. Алгебраические выражения
(23). 1.1.2. Преобразование
алгебраических выражений (24). 1.1.3.
Иррациональные выражения (24). 1.1.4.
Алгебраические уравнения (25). 1.1.5.
Неравенства (25)
Глава 1.2. ПЛАНИМЕТРИЯ (В С.Зарубин,
А.Н. Канатников) 26
1.2.1. Прямая (26). 1.2.2. Расстояние
(26). 1.2.3. Угол (26). 1.2.4.
Многоугольник (27). 1.2.5. Окружность и
круг (28). 1.2.6. Треугольник (30).
1.2.7. Четырехугольник (31)
Глава 1.3. ТРИГОНОМЕТРИЯ (B.C. Зарубин) 32
1.3.1. Значения тригонометрических
функций (32). 1.3.2.
Тригонометрические соотношения (34). 1.3.3.
Решение треугольников (36)
Глава 1.4. СТЕРЕОМЕТРИЯ (B.C. Зарубин,
А.Л. Крищенко) 37
1.4.1. Прямые и плоскости в
пространстве (37). 1.4.2. Двугранные и
многогранные углы (38). 1.4.3.
Многогранники (38). 1.4.4. Поверхности и
тела, образованные перемещением
линий (40)
Глава 1.5. СФЕРИЧЕСКАЯ ГЕОМЕТРИЯ
(B.C. Зарубин, А.Н. Канатников) 42
1.5.1. Геометрия на сфере (42). 1.5.2.
Сферическая тригонометрия (42)
Глава 1.6. ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
И ИХ ГРАФИКИ (B.C. Зарубин) 43
1.6.1. Понятие функции (43). 1.6.2.
Некоторые свойства функций и их
графики (44). 1.6.3. Основные
элементарные функции (44). 1.6.4.
Некоторые элементарные функции
(46)
СПИСОК ЛИТЕРАТУРЫ 48
Раздел 2. МАТЕМАТИЧЕСКИЙ АНАЛИЗ 50
Глава 2.1. ЭЛЕМЕНТЫ ТЕОРИИ
МНОЖЕСТВ (B.C. Зарубин) .50
2.1.1. Некоторые логические символы
(50). 2.1.2. Понятие множества (50).
2.1.3. Операции над множествами
(51). 2.1.4. Отношения (52). 2.1.5.
Отображение множеств. Функция
(52). 2.1.6. Типы отображений (53).
2.1.7. Элементы комбинаторики (54).
2.1.8. Мощность множеств (55)
Глава 2.2. ЧИСЛОВЫЕ СИСТЕМЫ
(B.C. Зарубин, А.Н. Канатников) 55
2.2.1. Действительные числа (55).
2.2.2. Числовая прямая (56). 2.2.3.
Абсолютное значение
действительного числа (57). 2.2.4. Натуральные,
целые и рациональные числа (58).
2.2.5. Комплексные числа (58)
Глава 2.3. ПРЕДЕЛ (ВС. Зарубин,
А.П. Крищенко) 60
2.3.1. Окрестности в точечных
множествах (60). 2.3.2. Числовая
последовательность и ее предел (62). 2.3.3.
Предел последовательности точек из
R" (63). 2.3.4. Предел
действительной функции действительного
переменного (63). 2.3.5. Свойства функ- .
ций, имеющих предел в точке
a G R (65). 2.3.6. Бесконечно малые
функции (66). 2.3.7. Предел функции
многих переменных (67)
Глава 2.4. НЕПРЕРЫВНОСТЬ
(В. С Зарубин, А.П. Крищенко) 68
2.4.1. Непрерывность функции в
точке (68). 2.4.2. Точки разрыва
функции (69). 2.4.3. Непрерывность
функции на множестве (69). 2.4.4.
Непрерывность функции многих
переменных (69)
Глава 2.5. ПРОИЗВОДНАЯ И
ДИФФЕРЕНЦИАЛ ДЕЙСТВИТЕЛЬНОЙ
ФУНКЦИИ ДЕЙСТВИТЕЛЬНОГО
ПЕРЕМЕННОГО (В. С. Зарубин) 71
2.5.1. Понятие производной (71).
2.5.2. Понятие дифференциала (71).
2.5.3. Свойства дифференцируемых
функций (72). 2.5.4. Бесконечная
производная (73). 2.5.5. Производные
и дифференциалы высших порядков
(74)
6
ОГЛАВЛЕНИЕ
Глава 2.6. ОСНОВНЫЕ ТЕОРЕМЫ
ДИФФЕРЕНЦИАЛЬНОГО
ИСЧИСЛЕНИЯ (Е.А. Власова,
ВС. Зарубин) 75
2.6.1. Теоремы о нуле производной
(75) 2.6.2. Теоремы о
промежуточном значении производной (75).
2.6.3. Правило Бернулли-Лопиталя
вычисления пределов (75). 2.6.4.
Формула Тейлора (76)
Глава 2.7. ИССЛЕДОВАНИЕ ФУНКЦИЙ
(В. С Зарубин, А.Н. Канатников) 77
2.7.1. Возрастание и убывание
функции Экстремум (77). 2.7.2.
Выпуклость и точки перегиба (78). 2.7.3.
Наибольшее и наименьшее значения
функции (79). 2.7.4. Общая схема
исследования функции (79)
Глава 2.8. ФУНКЦИИ МНОГИХ
ПЕРЕМЕННЫХ (ВС. Зарубин,
А.Н. Канатников, А.П. Крищенко) 80
2.8.1. Частные производные (80).
2.8.2. Дифференцируемость
функций многих переменных (80). 2.8.3.
Частные производные высших
порядков (81). 2.8.4.
Дифференциалы высших порядков. Формула
Тейлора (82). 2.8.5. Неявная и
обратная функции (83). 2.8.6.
Геометрические приложения (84).
2 8.7. Локальные экстремумы (85).
2.8.8. Условные экстремумы (85).
2.8.9. Нахождение наибольшего и
наименьшего значений (86)
Глава 2.9. НЕОПРЕДЕЛЕННЫЙ
ИНТЕГРАЛ (Е.А. Власова, ВС.
Зарубин) 87
2.9.1. Понятия первообразной и
неопределенного интеграла (87).
2.9.2. Свойства неопределенного
интеграла (87). 2.9.3. Основные
неопределенные интегралы (87).
2 9.4. Интегрирование дробно-
рациональных функций (88). 2.9.5.
Интегрирование иррациональных
функций (89). 2.9.6.
Интегрирование трансцендентных функций (90)
Глава 2.10. ОПРЕДЕЛЕННЫЙ
ИНТЕГРАЛ (B.C. Зарубин, А.П. Крищенко) 91
2.10.1. Понятие определенного
интеграла (91). 2.10.2. Свойства
интегрируемых функций (91).
2.10.3. Свойства определенного
интеграла (91). 2.10.4. Формула
Ньютона - Лейбница (93). 2.10.5.
Несобственные интегралы (94).
2.10.6. Признаки сходимости
несобственного интеграла (95).
2.10.7. Приложения определенного
интеграла (96)
Глава 2.11. ИНТЕГРАЛЫ, ЗАВИСЯЩИЕ
ОТ ПАРАМЕТРА (Е.А. Власова,
ВС. Зарубин) 98
2.11.1. Зависимость интеграла от
параметра (98). 2.11.2. Свойства
интегралов, зависящих от параметра
(98). 2.11.3. Несобственные
интегралы, зависящие от параметра (98).
2.11.4. Эйлеровы интегралы (99)
Глава 2.12. КРАТНЫЕ ИНТЕГРАЛЫ
(B.C. Зарубин, А.Н. Канатников) 100
2.12.1. Двойной интеграл (100).
2.12.2. Тройной интеграл (101).
2.12 3. Свойства кратных интегралов
(101). 2.12.4. Вычисление кратных
интегралов (102). 2.12.5. Замена
переменных в кратных интегралах
(103). 2.12.6. Несобственные кратные
интегралы (104). 2.12.7. Кратные
интегралы, зависящие от параметра
(105). 2.12.8. Приложения кратных
интегралов (106)
Глава 2.13. КРИВОЛИНЕЙНЫЕ И
ПОВЕРХНОСТНЫЕ
ИНТЕГРАЛЫ (B.C. Зарубин) 107
2.13.1. Гладкие и кусочно гладкие
кривые (107). 2.13.2.
Криволинейный интеграл I рода (107) 2.13.3
Криволинейный интеграл II рода
(108). 2.13.4. Независимость
криволинейного интеграла от пути
интегрирования (109) 2.13.5.
Гладкие и кусочно гладкие
поверхности (ПО). 2.13.6.
Поверхностный интеграл I рода (111).
2 13.7. Поверхностный интеграл II
рода (112). 2.13.8. Приложения
криволинейных и. поверхностных
интегралов (113)
Глава 2.14. ВЕКТОРНЫЙ АНАЛИЗ
(B.C. Зарубин, А. П. Крищенко) 114
2.14.1. Векторные функции
скалярного аргумента (114). 2.14.2.
Скалярные и векторные поля (115) 2.14 3.
Интегрирование функций радиус-
вектора (116). 2.14.4.
Дифференцирование функций радиус-вектора (118).
2.14.5. Дифференциальные операции
второго порядка (119). 2.14.6
Интегральные формулы (120). 2.14.7
Отыскание скалярного и векторного
потенциалов (121). 2.14.8. Отыскание
векторного поля по его диверрбнции
и ротору (121)
СПИСОК ЛИТЕРАТУРЫ 121
Раздел 3. РЯДЫ 122
Глава 3.1. ЧИСЛОВЫЕ РЯДЫ
(Е.А. Власова) 122
3.1.1. Числовые ряды и их
сходимость (122). 3.1.2. Свойства
сходящихся рядов (124). 3.1.3.
Знакоположительные ряды Признаки
сравнения (125). 3.1.4
Интегральный признак сходимости Коши
(126). 3.1.5. Признаки Даламбера
(127). 3.1.6. Радикальные признаки
Коши (128). 3.1.7. Абсолютная и
ОГЛАВЛЕНИЕ
7
условная сходимости (128). 3.1.8.
Умножение радов (130). 3.1.9.
Оценки сумм радов (131). 3.1.10.
Признаки сходимости Дирихле и
Абеля (133)
Глава 3.2. ФУНКЦИОНАЛЬНЫЕ РЯДЫ
(ЕЛ. Власова) 134
3.2.1. Сходимость
функциональных последовательностей (134).
3.2.2. Сходимость
функциональных рядов (135). 3.2.3.
Равномерная сходимость функциональных
последовательностей (137). 3.2.4.
Равномерная сходимость
функциональных рядов (138). 3.2.5.
Свойства равномерно сходящихся
рядов (140)
Глава 3.3. СТЕПЕННЫЕ РЯДЫ
(ЕЛ. Власова, А.Н. Канатников) ... 141
3.3.1. Комплексные степенные
ряды (141). 3.3.2. Действительные
степенные ряды. Ряд Тейлора
(144). 3.3.3. Интегрирование
обыкновенных дифференциальных
уравнений с помощью рядов (148)
Глава 3.4. РЯДЫ ФУРЬЕ (ЕЛ. Власова) 152
3.4.1. Ортонормированные
системы и ряды Фурье (152). 3.4.2.
Комплексная форма записи
тригонометрического ряда Фурье
(155). 3.4.3. Ряды Фурье по
тригонометрической системе (156).
3.4.4. Разложение функции в
тригонометрические ряды на
отрезке (159). 3.4.5. Разложение
функций в ряды Фурье по синусам
и косинусам (163)
Глава 3.5. ДИСКРЕТНОЕ
ПРЕОБРАЗОВАНИЕ ФУРЬЕ. БЫСТРОЕ
ПРЕОБРАЗОВАНИЕ ФУРЬЕ
(ЕЛ. Власова) 165
СПИСОК ЛИТЕРАТУРЫ..
169
Раздел 4. ТЕОРИЯ ФУНКЦИЙ
КОМПЛЕКСНОГО ПЕРЕМЕННОГО 170
Глава 4.1. КОМПЛЕКСНАЯ
ПЛОСКОСТЬ (А.Н. Канатников) 170
4.1.1. Алгебраическая форма
записи комплексного числа (170).
4.1.2. Тригонометрическая форма
записи комплексного числа (171).
4.1.3. Бесконечно удаленная точка.
Сфера Римана (174). 4.1.4.
Геометрия на комплексной плоскости
(174). 4.1.5. Задание множества
точек на комплексной плоскости
(179)
4.2.1. Последовательности
комплексных чисел (181). 4.2.2.
Комплексные числовые ряды
(182). 4.2.3. Степенные ряды (182).
4.2.4. Круг сходимости (183). 4.2.5.
Двусторонний степенной ряд (184)
Глава 4.3. ФУНКЦИИ
КОМПЛЕКСНОГО ПЕРЕМЕННОГО
(А.Н. Канатников) 185
4.3.1. Определение и
геометрическое представление функции
комплексного переменного (185).
4.3.2. Предел и непрерывность
функций комплексного
переменного (186). 4.3.3. Элементарные
функции комплексного
переменного (188). 4.3.4. Обратные
тригонометрические функции (190)
Глава 4.4. ДИФФЕРЕНЦИРОВАНИЕ
ФУНКЦИЙ КОМПЛЕКСНОГО
ПЕРЕМЕННОГО (А.Н.
Канатников) 191
4.4.1. Производная функции
комплексного переменного (191).
4.4.2. Необходимые и достаточные
условия дифференцируемости
(192). 4.4.3. Аналитические
функции (193). 4.4.4. Геометрический
смысл аргумента и модуля
производной (193). 4.4.5.
Восстановление аналитической функции по ее
действительной или мнимой части
(195)
Глава 4.5. ИНТЕГРИРОВАНИЕ
ФУНКЦИЙ КОМПЛЕКСНОГО
ПЕРЕМЕННОГО (А.Н. Канатников) 198
4.5.1. Понятие и вычисление
интеграла от функции
комплексного переменного (198). 4.5.2.
Интегральная теорема Кош и (199).
4.5.3. Интегральная формула
Коши (200). 4.5.4. Комплексный
потенциал плоского векторного
поля (201)
Глава 4.6. ФУНКЦИОНАЛЬНЫЕ РЯДЫ
НА КОМПЛЕКСНОЙ
ПЛОСКОСТИ (ЕЛ. Власова, А.Н.
Канатников) 203
4.6.1. Равномерная сходимость
функциональных рядов (203).
4.6.2. Ряд Тейлора (205). 4.6.3. Ряд
Лорана (206). 4.6.4. Связь ряда
Лорана с рядом Фурье (206)
Глава 4.7. НУЛИ И ОСОБЫЕ ТОЧКИ
АНАЛИТИЧЕСКОЙ ФУНКЦИИ
(Е.А. Власова, А.Н. Канатников) .... 207
4.7.1. Нули аналитической
функции (207). 4.7.2. Изолированные
особые точки (208)
Глава 4.2. ПОСЛЕДОВАТЕЛЬНОСТИ И
РЯДЫ КОМПЛЕКСНЫХ ЧИСЕЛ
(Е.А. Власова, А.Н. Канатников) ... 181
Глава 4.8. ВЫЧЕТЫ В
ИЗОЛИРОВАННЫХ ОСОБЫХ ТОЧКАХ
(А.Н. Канатников) 211
8
ОГЛАВЛЕНИЕ
4.8.1. Вычет в конечной точке (211).
4.8.2. Вычисление вычета в полюсе
(212). 4.8.3. Вычет в бесконечно
удаленной точке (213). 4.8.4.
Логарифмический вычет (214)-
Глава 4.9. ГЕОМЕТРИЧЕСКИЕ
ПРИНЦИПЫ ТЕОРИИ ФУНКЦИЙ
КОМПЛЕКСНОГО
ПЕРЕМЕННОГО (А.Н. Канатников) 215
4.9.1. Взаимно однозначные
отображения (215). 4.9.2. Свойства
конформных отображений (216).
4.9.3. Принцип соответствия
границ (218). 4.9.4. Принцип
максимума модуля функции (218).
4.9.5. Принцип симметрии (219)
СПИСОК ЛИТЕРАТУРЫ 220
Часть II АЛГЕБРА И ГЕОМЕТРИЯ 221
Раздел 5. ВЫСШАЯ АЛГЕБРА 221
Глава 5.1. АЛГЕБРА МНОГОЧЛЕНОВ
(А.Н. Канатников) 221
5.1.1. Многочлены одной
переменной (221). 5.1.2. Операции над
многочленами (221). 5.1.3.
Деление многочленов (222). 5.1.4.
Наибольший общий делитель
(222). 5.1.5. Наименьшее общее
кратное (223). 5.1.6. Корни
многочленов (223). 5.1.7. Разложение на
неприводимые множители (224).
5.1.8. Рациональные дроби (224)
Глава 5.2. МАТРИЦЫ И ОПЕРАЦИИ
НАД НИМИ (А.Н. Канатников,
А.П. Крищенко) 225
5.2.1. Виды матриц (225). 5.2.2.
Линейные операции над матрицами
(226). 5.2.3. Транспонирование
матриц (227). 5.2.4. Умножение
матриц (227). 5.2.5. Блочные
матрицы (229). 5.2.6. Операции над
строками и столбцами матрицы
(230). 5.2.7. Обратная матрица (231)
Глава 5.3. ХАРАКТЕРИСТИКИ
МАТРИЦ (А.Н. Канатников,
А.П. Крищенко) 232
5.3.1. Перестановки (232). 5.3.2.
Определители л-го порядка (233).
5.3.3. Свойства определителей
(233). 5.3.4. Методы вычисления
определителей (235). 5.3.5. Ранг
матрицы (235)
Глава 5.4. СИСТЕМЫ ЛИНЕЙНЫХ
АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ
(А.Н. Канатников, А.П. Крищенко) 236
5.4.1. Основные определения (236).
5.4.2. Общее решение системы
линейных уравнений (238). 5.4.3.
Как решать СЛАУ? (238). 5.4.4.
СЛАУ с комплексными
коэффициентами (240)
Глава 5.5. МУЛЬТИПЛИКАТИВНЫЕ
РАЗЛОЖЕНИЯ (А.Н. Канатников) 240
5.5.1. Z,{/-разложение (240). 5.5.2.
LZW-разложение (241). 5.5.3. ST-
разложение (241). 5.5.4. QR-
разложение(241). 5.5.5.
Сингулярное разложение (242)
Глава 5.6. АЛГЕБРАИЧЕСКИЕ
СТРУКТУРЫ (АН. Канатников, СБ. Ткачев).... 243
5.6.1. Первичные понятия (243).
5.6.2. Группа (244). 5.6.3. Кольца и
поля (244)
СПИСОК ЛИТЕРАТУРЫ 245
Раздел 6. АНАЛИТИЧЕСКАЯ
ГЕОМЕТРИЯ 246
Глава 6.1. ЛИНЕЙНЫЕ ОПЕРАЦИИ
НАД ВЕКТОРАМИ (А.Н.
Канатников, А.П. Крищенко) 246
6.1.1. Векторные и скалярные
величины (246). 6.1.2. Типы векторов
и их взаимное расположение (246).
6.1.3. Линейные операции и их
свойства (247). 6.1.4. Ортогональная
проекция (248). 6.1.5. Линейная
зависимость и независимость
векторов (248). 6.1.6. Базис (249). 6.1.7.
Вычисления в координатах (250)
Глава 6.2. ПРОИЗВЕДЕНИЯ
ВЕКТОРОВ (А.Н. Канатников) 250
6.2.1. Скалярное произведение
(250). 6.2.2. Векторное
произведение (251). 6.2.3. Смешанное
произведение (253). 6.2.4. Двойное
векторное произведение (253)
Глава 6.3. СИСТЕМЫ КООРДИНАТ
(B.C. Зарубин, А.Н. Канатников).... 253
6.3.1. Декартова система координат -
(254). 6.3.2. Преобразование
прямоугольных координат (254). 6.3.3.
Простейшие задачи аналитической
геометрии (255). 6.3.4. Кривые и
поверхности (256). 6.3.5. Полярная
система координат (257). 6.3.6.
Цилиндрическая и сферическая
системы координат (258)
Глава 6.4. ПРЯМАЯ НА ПЛОСКОСТИ
(А.П. Крищенко) 259
6.4.1. Алгебраические кривые
первого порядка (259). 6.4.2.
Специальные виды уравнения прямой (259)
Глава 6.5. ПРЯМАЯ И ПЛОСКОСТЬ В
ПРОСТРАНСТВЕ (А.П. Крищенко) 261
6.5.1. Алгебраические поверхности
первого порядка (261). 6.5.2.
Специальные виды уравнения
плоскости (262). 6.5.3. Уравнения
прямой в пространстве (263). 6.5.4.
Взаимное расположение прямых и
плоскостей (264). 6.5.5. Расстояние
от точки до плоскости и до
прямой (266). 6.5.6. Пучки и связки .
Пучок плоскостей (267)
ОГЛАВЛЕНИЕ
9
Глава 6.6. КРИВЫЕ ВТОРОГО
ПОРЯДКА (Л.П. Крищенко) 267
6.6.1. Эллипс (267). 6.6.2.
Гипербола (268). 6.6.3. Парабола (270).
6.6.4. Оптические свойства (270).
6.6.5. Полярные уравнения (271)
Глава 6.7. ПОВЕРХНОСТИ ВТОРОГО
ПОРЯДКА (B.C. Зарубин) 271
6.7.1. Эллипсоиды (272). 6.7.2.
Гиперболоиды (272). 6.7.3.
Параболоиды (273). 6.7.4. Конусы
(274). 6.7.5. Цилиндрические
поверхности (274). 6.7.6. Метод
сечений (275). 6.7.7. Конические и
линейчатые поверхности (276).
6.7.8. Конические сечения (277)
Глава 6.8. ИССЛЕДОВАНИЕ
УРАВНЕНИЯ ВТОРОГО ПОРЯДКА
(Л.Н. Канатников, А.П. Крищенко) 279
6.8.1. Поверхности второго
порядка (279). 6.8.2. Изменение системы
координат (279). 6.8.3. Упрощение
уравнения поверхности второго
порядка (280). 6.8.4.
Классификация кривых второго порядка (283).
6.8.5. Классификация
поверхностей второго порядка в
пространстве (283)
Глава 6.9. ОСНОВНЫЕ ПОНЯТИЯ
ПРОЕКТИВНОЙ ГЕОМЕТРИИ
(А.Н. Канатников) 284
6.9.1. Объекты проективной
геометрии (284). 6.9.2. Проективные
координаты (285). 6.9.3.
Преобразование проективной системы
координат (286). 6.9.4. Проективные
преобразования (287)
СПИСОК ЛИТЕРАТУРЫ 288
Раздел 7. ЛИНЕЙНАЯ АЛГЕБРА 289
Глава 7.1. ЛИНЕЙНЫЕ
ПРОСТРАНСТВА (А.П. Крищенко) 289
7.1.1. Определение линейного
пространства (289). 7.1.2.
Линейная зависимость (290). 7.1.3. Базис
линейного пространства (291).
7.1.4. Размерность линейного
пространства (292). 7.1.5.
Преобразование координат вектора при
замене базиса (292)
Глава 7.2. ЛИНЕЙНЫЕ
ПОДПРОСТРАНСТВА (А. П. Крищенко) 294
7.2.1. Определение и примеры
(294). 7.2.2. Пересечение и сумма
линейных подпространств (294).
7.2.3. Ранг системы векторов (295)
Глава 7.3. ЕВКЛИДОВЫ
ПРОСТРАНСТВА (ВС Зарубин, А.П. Крищенко) 297
7.3.1. Определение евклидова
пространства (297). 7.3.2.
Нормированные пространства (297).
7.3.3. Ортогональные системы
векторов (298). 7.3.4.
Ортогональное дополнение (299). 7.3.5.
Нормы матриц (300). 7.3.6.
Псевдорешения и псевдообратная
матрица (301)
Глава 7.4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ
(А.П. Крищенко) 302
7.4.1. Определение и примеры
линейных операторов (302). 7.4.2.
Матрица линейного оператора
(303). 7.4.3. Операции с
линейными операторами (304)
Глава 7.5. СОБСТВЕННЫЕ ВЕКТОРЫ
И СОБСТВЕННЫЕ ЗНАЧЕНИЯ
(В. С Зарубин, А. П. Крищенко) 305
7.5.1. Характеристическое
уравнение (305). 7.5.2. Собственные
векторы линейного оператора
(305). 7.5.3. Свойства собственных
векторов (306). 7.5.4. Жорданова
нормальная форма (307)
Глава 7.6. САМОСОПРЯЖЕННЫЕ И
ОРТОГОНАЛЬНЫЕ
ОПЕРАТОРЫ (А.Н. Канатников, А.П.
Крищенко) 308
7.6.1. Сопряженный оператор
(308). 7.6.2. Ортогональные
матрицы и операторы (308). 7.6.3.
Приведение симметрической
матрицы к диагональному виду
(309)
Глава 7.7. КВАДРАТИЧНЫЕ ФОРМЫ
(А.Н. Канатников, А.П. Крищенко) 310
7.7.1. Определение квадратичной
формы (310). 7.7.2. Ортогональные
преобразования квадратичных
форм (311). 7.7.3. Типы
квадратичных форм (312). 7.7.4.
Билинейные формы (313)
Глава 7.8. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ
АЛГЕБРЫ (А.Н. Канатников,
В.Н. Четвериков) 314
7.8.1. Сопряженное пространство
(314). 7.8.2. Полилинейные формы
(315). 7.8.3. Тензоры (315). 7.8.4.
Операции с тензорами (316)
СПИСОК ЛИТЕРАТУРЫ 318
Раздел 8. ДИФФЕРЕНЦИАЛЬНАЯ
ГЕОМЕТРИЯ 319
Глава 8.1. ГЕОМЕТРИЯ КРИВЫХ
(В.Н Четвериков) 319
8.1.1. Гладкая кривая (319). 8.1.2.
Длина дуги спрямляемой кривой
(320). 8.1.3. Касательная к кривой
(320). 8.1.4. Соприкасающаяся
10
ОГЛАВЛЕНИЕ
плоскость и соприкасающаяся
окружность (320). 8.1.5.
Подвижный трехгранник (321). 8.1.6.
Плоская кривая (321). 8.1.7.
Кривизна кривой (322). 8.1.8.
Кручение кривой (322). 8.1.9.
Формулы Френе (322)
Глава 8.2. ГЕОМЕТРИЯ
ПОВЕРХНОСТЕЙ (В. Н. Четвериков) 323
8.2.1. Гладкая поверхность (323).
8.2.2. Касательная плоскость и
нормаль к поверхности (324).
8.2.3. Первая квадратичная форма
поверхности (324). 8.2.4. Вторая
квадратичная форма поверхности
(325). 8.2.5. Классификация точек
поверхности (326). 8.2.6.
Нормальная кривизна поверхности
(327). 8.2.7. Главные направления
и главные кривизны поверхности
(328). 8.2.8. Внутренняя и
внешняя геометрии поверхности (328)
Глава 8.3. ГЛАДКИЕ МНОГООБРАЗИЯ
(В.Н. Четвериков) 329
8.3.1. Понятие многообразия (329).
8.3.2. Гладкие отображения
многообразий (331). 8.3.3.
Подмногообразия и задание многообразий
уравнениями (332). 8.3.4. Касательные
векторы (333). 8.3.5. Касательное
расслоение (334). 8.3.6.
Дифференциал отображения (335)
Глава 8.4. ПОЛЯ НА МНОГООБРАЗИИ
(СБ. Ткачев, В.Н. Четвериков) 335
8.4.1. Тензорные поля (335). 8.4.2.
Векторные поля (336). 8.4.3.
Фазовый поток векторного поля
(337). 8.4.4. Алгебра Ли векторных
полей (338). 8.4.5. Распределения
и теорема Фробениуса (339)
Раздел 9. ДИСКРЕТНАЯ МАТЕМАТИКА 341
Глава 9.1. ОТНОШЕНИЯ (A.M.
Белоусов, А.Н. Канатников) 341
9.1.1. Соответствия и бинарные
отношения (341). 9.1.2. Операции
над соответствиями (343). 9.1.3.
Специальные свойства бинарных
отношений (346). 9.1.4.
Отношения эквивалентности (347). 9.1.5.
Упорядоченные множества.
Теорема о подвижной точке (348)
Глава 9.2. ПОЛУКОЛЬЦА И БУЛЕВЫ
АЛГЕБРЫ (А.И. Белоусов,
СБ. Ткачев) 351
9.2.1. Полукольца. Основные
примеры (351). 9.2.2. Замкнутые
полукольца (353). 9.2.3. Решение
систем линейных уравнений (355).
9.2.4. Булевы алгебры (357)
Глава 9.3. ТЕОРИЯ ГРАФОВ
(СБ. Ткачев) 359
9.3.1. Основные определения
(359). 9.3.2. Способы
представления (364). 9.3.3. Деревья (365).
9.3.4. Остовное дерево
наименьшего веса (366). 9.3.5. Методы
систематического обхода вершин
графа (368). 9.3.6. Задача о путях
во взвешенных ориентированных
графах (372). 9.3.7. Изоморфизм
графов (376). 9.3.8.
Топологическая сортировка (379)
Глава 9.4. БУЛЕВЫ ФУНКЦИИ
(А.И. Белоусов) 381
9.4.1. Понятие булевой функции
(381). 9.4.2. Таблицы булевых
функций (383). 9.4.3. Фиктивные
переменные. Равенство булевых
функций (384). 9.4.4. Формулы и
суперпозиции (386). 9.4.5.
Дизъюнктивные и конъюнктивные
нормальные формы (389). 9.4.6.
Построение минимальных ДНФ
(391). 9.4.7. Теорема Поста (397).
9.4.8. Схемы из функциональных
элементов (403)
СПИСОК ЛИТЕРАТУРЫ 406
Часть Ш. ДИФФЕРЕНЦИАЛЬНЫЕ
УРАВНЕНИЯ 407
Раздел 10. ОБЫКНОВЕННЫЕ
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 407
Глава 10.1. ОБЩАЯ ТЕОРИЯ
(А.А. Пунтус) 407
10.1.1. Основные определения
(407). 10.1.2. Задача Коши
(начальная задача) (409). 10.1.3.
Теорема Коши о существовании и
единственности решений
уравнений и систем дифференциальных
уравнений (409). 10.1.4.
Непрерывная зависимость решений от
начальных данных и от
параметров (410). 10.1.5. Аналитические
решения дифференциальных
уравнений. Интегрируемые виды
обыкновенных дифференциальных
уравнений первого порядка (411).
10.1.6. Методы интегрирования
дифференциальных уравнений
порядка выше первого (414).
10.1.7. Метод интегрируемых
комбинаций решения системы
уравнений (415)
СПИСОК ЛИТЕРАТУРЫ 415N
Глава 10.2. ЛИНЕЙНЫЕ
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ И
ЛИНЕЙНЫЕ СИСТЕМЫ
ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЙ (А.А. Пунтус) 416
ОГЛАВЛЕНИЕ
И
10.2.1. Основные определения
(416). 10.2.2. Представление
решений линейных систем через
фундаментальную систему
решений и с помощью
фундаментальной матрицы. Интегральное
представление решения
неоднородной системы уравнений (416).
10.2.3. Линейные
дифференциальные уравнения с постоянными
коэффициентами. Метод Эйлера
решения линейных систем с
постоянными коэффициентами
(420)
СПИСОК ЛИТЕРАТУРЫ 422
Глава 10.3.
ПРИБЛИЖЕННО-АНАЛИТИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ
ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЙ И СИСТЕМ
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
(АЛ. Пунтус) 423
10.3.1. М етод п осл едо вател ьн ых
приближений (423). 10.3.2.
Интегрирование дифференциальных
уравнений с помощью степенных
рядов (423). 10.3 3. Метод малого
параметра (425)
СПИСОК ЛИТЕРАТУРЫ 427
Глава 10.4. КРАЕВЫЕ ЗАДАЧИ ДЛЯ
ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЙ (Е.П. Иванова) 427
10.4.1. Краевые задачи для
линейных дифференциальных
уравнений (427). 10.4.2. Краевая задача
для системы дифференциальных
уравнений (430). 10.4.3. Задача
Штурма-Лиувилля (430). 10.4.4.
Краевые задачи для нелинейных
дифференциальных уравнений
(431)
СПИСОК ЛИТЕРАТУРЫ 431
Глава 10.5. ДИНАМИЧЕСКИЕ
СИСТЕМЫ (ГЛ. Каменский,
ТА. Турина) 432
10.5.1. Основные определения
(432). 10.5.2. Свойства фазовых
траекторий динамических систем
(433). 10.5.3. Динамические
системы на плоскости (434). 10.5.4.
Абстрактные динамические
системы (437)
СПИСОК ЛИТЕРАТУРЫ 439
Глава 10.6. ЭЛЕМЕНТЫ ТЕОРИИ
УСТОЙЧИВОСТИ РЕШЕНИЙ
ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЙ И СИСТЕМ
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
(АЛ. Пунтус) 439
10.6.1. Основные определения
(439). 10.6.2. Устойчивость
решений линейных дифференциальных
уравнений и систем
дифференциальных уравнений (441). 10.6.3.
Устойчивость решений линейных
дифференциальных уравнений и
систем дифференциальных
уравнений с постоянными
коэффициентами (442). 10 6.4. Теоремы
Ляпунова об устойчивости по
первому приближению (443).
10.6.5. Функции Ляпунова.
Теоремы Ляпунова об устойчивости и
асимптотической устойчивости
(444). 10.6.6. Теоремы Четаева и
Ляпунова о неустойчивости (445)
СПИСОК ЛИТЕРАТУРЫ 445
Глава 10.7.
ФУНКЦИОНАЛЬНО-ДИФФЕРЕНЦИАЛЬНЫЕ
УРАВНЕНИЯ (А.Д. Мышкис) 446
10.7.1. Начальные задачи для
функционал ьн о-дифференциал ьных
уравнений (446). 10.7.2. Краевые
задачи для разностно-дифферен-
циальных уравнений (450)
СПИСОК ЛИТЕРАТУРЫ 451
Глава 10.8. ДИФФЕРЕНЦИАЛЬНЫЕ
УРАВНЕНИЯ С ЧАСТНЫМИ
ПРОИЗВОДНЫМИ ПЕРВОГО
ПОРЯДКА (АЛ. Пунтус) 451
10.8.1. Линейное
дифференциальное уравнение. Уравнения
характеристик (451). 10.8.2. Решение
задачи Коши для линейного
уравнения (452). 10.8.3.
Квазилинейное дифференциальное
уравнение (453). 10.8.4. Решение
задачи Коши для квазилинейного
уравнения (454)
СПИСОК ЛИТЕРАТУРЫ 454
Глава 10.9. АСИМПТОТИЧЕСКИЕ
МЕТОДЫ В ТЕОРИИ
ОБЫКНОВЕННЫХ
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ (ЮЛ. Рябов) 454
10.9.1. Понятие асимптотического
ряда (454). 10.9.2. Ряды по степеням
независимой переменной (455).
10.9.3. Ряды Пуанкаре — Ляпунова
по степеням малого параметра для
решений при заданных начальных
условиях (455). 10.9.4. Ряды
Пуанкаре — Ляпунова по степеням
малого параметра для
периодических решений (456). 10.9.5.
Итерационный вариант метода малого
параметра Пуанкаре - Ляпунова
(458). 10.9.6.
Численно-аналитические итерации (459). 10.9.7.
Асимптотические методы,
основанные на усреднении (462)
СПИСОК ЛИТЕРАТУРЫ 463
12
ОГЛАВЛЕНИЕ
Раздел 11. ИНТЕГРАЛЬНЫЕ
ПРЕОБРАЗОВАНИЯ И
ОПЕРАЦИОННОЕ ИСЧИСЛЕНИЕ 464
Глава 11.1. ОБЩИЕ ПОЛОЖЕНИЯ
(И. К. Волков, Л.Н. Канатников) 464
И. 1.1. Интегральное
преобразование для линейного
дифференциального оператора 2-го порядка
(465). 11.1.2. Интегральное
преобразование на отрезке (467). 11.1.3.
Интегральное преобразование на
полуограниченном или
неограниченном интервале (469)
Глава 11.2. ОСНОВНЫЕ
ИНТЕГРАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ НА
НЕОГРАНИЧЕННЫХ
ИНТЕРВАЛАХ (Л.Н. Канатников) 471
I I.2.I. Экспоненциальное
преобразование Фурье (471). 11.2.2.
Смешанное интегральное
преобразование Фурье (471). 11.2.3.
Интегральное
косинус-преобразование Фурье (471). 11.2.4.
Интегральное
синус-преобразование Фурье (472). 11.2.5.
Интегральное преобразование Ганкеля
(472). 11.2.6. Интегральное
преобразование Вебера (472). 11.2.7.
Интегральное преобразование
Меллина (472)
Глава 11.3. ПРЕОБРАЗОВАНИЕ ФУРЬЕ
(Е.А. Власова, Л.Н. Канатников) 473
11.3.1. Определение и условия
существования (473). 11.3.2.
Свойства преобразования Фурье
(474). 11.3.3. Косинус- и синус-
преобразования Фурье (474)
Глава 11.4. ОПЕРАЦИОННОЕ
ИСЧИСЛЕНИЕ (Л.Н. Канатников) 475
11.4.1. Преобразование Лапласа
(475). 11.4.2. Основные теоремы
операционного исчисления (477).
11.4.3. Изображения элементарных
функций-оригиналов (478)
Раздел 12. СПЕЦИАЛЬНЫЕ ФУНКЦИИ
(Ю.А. Рябов) 481
Глава 12.1. СФЕРИЧЕСКИЕ
ФУНКЦИИ 481
12.1.1. Определение (481). 12.1.2.
Ортогональность сферических
функций (482)
Глава 12.2. ФУНКЦИИ БЕССЕЛЯ 482
12.2.1. Определение (482). 12.2.2.
Уравнения, приводящиеся к
уравнению Бесселя (483). 12.2.3.
Функции Бесселя 1-го рода
Jv(x) (483). 12.2.4. Функции
Бесселя 2-го рода (484). 12.2.5.
Общее решение уравнения
Бесселя (484). 12.2.6. Функции Бесселя
3-го рода (484). 12.2.7.
Рекуррентные, дифференциальные и
интегральные формулы (484). 12.2.8.
Поведение функций Бесселя 1-го
и 2-го рода вблизи начала
координат Х = 0 (485). 12.2.9. Поведение
функций Бесселя 1-го и 2-го рода
вдали от начала координат (485).
12.2.10. Функции Бесселя
полуцелого порядка. Сферические
функции (485). 12.2.11. Нули функций
Бесселя (486). 12.2.12.
Ортогональность бесселевых систем
функций (487). 12.2.13.
Модифицированные функции Бесселя
(487). 12.2.14. Функции Кельвина
и их обобщения (488). 12.2.15.
Функции Бесселя и частные
решения некоторых уравнений
математической физики (488)
Глава 12.3. ЭЛЛИПТИЧЕСКИЕ
ИНТЕГРАЛЫ И ФУНКЦИИ 490
12.3.1. Эллиптические интегралы
(490). 12.3.2. Эллиптические
функции Якоби (491). 12.3.3.
Периодичность и другие свойства
эллиптических функций Якоби
(492). 12.3.4. Поведение функций
Якоби при различных модулях
(492). 12.3.5. Функции Якоби
мнимого и комплексного
аргументов (493). 12.3.6. Производные и
интегралы (493). 12.3.7.
Разложения эллиптических функций в
ряды Фурье (493)
Глава 12.4. НЕКОТОРЫЕ
ИНТЕГРАЛЬНЫЕ ФУНКЦИИ 494
12.4.1. Интегральные синус,
косинус, логарифм, показательная .
функция (494). 12.4.2. Интегралы
Френеля (494). 12.4.3. Функция
ошибок и интеграл вероятности
(495). 12.4.4. Гамма- и бета-
функции Эйлера (495)
Глава 12.5. ГИПЕРГЕОМЕГРИЧЕСКАЯ
ФУНКЦИЯ. ОРТОГОНАЛЬНЫЕ
ПОЛИНОМЫ 496
12.5.1. Гипергеометрическая
функция (496). 12.5.2. Полиномы
Лежандра Рп (х) (496). 12.5.3.
Присоединенные функции
Лежандра Р™(х) (497). 12.5.4.
Полиномы Чебышева (498). 12.5.5.
Полиномы Эрмита Нп (х) (498).
12.5.6. Полиномы Лагерра (499)
СПИСОК ЛИТЕРАТУРЫ 500
Раздел 13. УРАВНЕНИЯ МАТЕМАТЧЕ-
СКОЙ ФИЗИКИ (УМФ) 501
ОГЛАВЛЕНИЕ
13
13.1. ОБЩИЕ СВЕДЕНИЯ ОБ
УМФ (Р.Я. Глаголева) 501
13.1.1. Основные определения
(501). 13.1.2. Классификация
линейных уравнений с ч.п. 2-го
порядка (502). 13.1.3. Постановка
задач математической физики
(МФ). Корректность (503)
СПИСОК ЛИТЕРАТУРЫ 504
13.2. ЭВОЛЮЦИОННЫЕ
УРАВНЕНИЯ (Р.Я. Глаголева) 504
13.2.1. Задача Коши для волнового
уравнения (504). 13.2.2. Задача
Коши для уравнения
теплопроводности (506). 13.2.3. Смешанная
задача для эволюционных
уравнений. Метод Фурье (507). 13.2.4.
Тепловые потенциалы и их
применение к решению смешанных
задач для уравнения
теплопроводности (509). 13.2.5. Метод
характеристик решения гиперболических
задач на плоскости (511)
13.3. КРАЕВЫЕ ЗАДАЧИ ДЛЯ
ЭЛЛИПТИЧЕСКИХ
УРАВНЕНИЙ (Р.Я Глаголева) 514
13.3.1. Фундаментальное решение
оператора Лапласа. Функция
Грина. Интегральное
представление решения внутренней задачи
Дирихле для уравнения Пуассона
(514). 13.3.2. Функция Грина для
шара (круга). Решение задачи
Дирихле для уравнения Лапласа в
шаре (круге). Интеграл Пуассона.
Свойства гармонических функций
в ограниченных областях (515).
13.3.3. Внешние задачи. Условия
регулярности решения на
бесконечности. Сведения внешних
краевых задач к внутренним (516).
13.3.4. Потенциалы, их свойства и
применение к решению краевых
задач (517). 13.3.5. Метод Фурье
решения краевых задач (519)
13.4. ОБОБЩЕННЫЕ
РЕШЕНИЯ ЛИНЕЙНЫХ
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
(В.И. Безяев) 520
13.4.1. Определение обобщенного
решения (520). 13.4.2.
Фундаментальные решения (520). 13.4.3.
Пространства Соболева (522). 13.4.4. Понятия
обобщенных решений эллиптических
краевых задач и задач на собственные
значения (524). 13.4.5.
Функциональные методы решения эллиптических
краевых задач и задач на собственные
значения (526). 13.4.6. Регулярность
решений эллиптических краевых задач
(527). 13.4.7. Обобщенные решения
параболических краевых задач (528).
13.4.8. Обобщенные решения
гиперболических краевых задач (529)
СПИСОК ЛИТЕРАТУРЫ 530
Глава 13.5. НЕЛИНЕЙНЫЕ
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
(В.И. Безяев) 530
13.5.1. Нелинейные
дифференциальные операторы (530). 13.5.2.
Краевые задачи для нелинейных
стационарных уравнений (532).
13.5.3. Вариационный метод
решения коэрцитивных задач
(533). 13.5.4. Примеры
нелинейных задач механики (534). 13.5.5.
Метод теории монотонных
операторов и топологический метод
(535). 13.5.6. Методы
приближенного решения Ритца и Галеркина
(537). 13.5.7. Регулярность
решений нелинейных эллиптических
уравнений (537)
СПИСОК ЛИТЕРАТУРЫ 539
Раздел 14. ФУНКЦИОНАЛЬНЫЙ
АНАЛИЗ (B.C. Пуганее, В.И. Сшшцын) 540
Глава 14.1. МНОЖЕСТВА,
ПРОСТРАНСТВА, ФУНКЦИИ 540
14.1.1. Функции и отображения
(540). 14.1.2. Метрические
пространства (542). 14.1.3. Линейные
пространства (543). 14.1.4.
Линейные функции (545)
Глава 14.2. ТЕОРИЯ МЕРЫ 546
14.2.1. Классы множеств (546).
14.2.2. Функции множества и
меры (547). 14.2.3. Продолжение
меры (549)
Глава 14.3. ИНТЕГРАЛЫ 550
14.3.1. Измеримые функции (550).
14.3.2. Сходимость почти всюду и
по мере (550). 14.3.3. Интеграл
Бохнера. Интегрирование простых
функций (551). 14.3.4. Интегралы
Лебега, Лебега — Стилтьеса (551).
14.3.5. Предельные переходы под
знаком интегралов (552). 14.3.6.
Абсолютная непрерывность и
сингулярность мер (553). 14.3.7.
Лебеговы пространства.
Пространства Соболева (554). 14.3.8. Меры
в произведении двух пространств
(555). 14.3.9. Мера Винера (555)
Глава 14.4. ТОПОЛОГИЧЕСКИЕ
ПРОСТРАНСТВА 556
14.4.1. Основные понятия топологии
(556). 14.4.2. Аксиомы отделимости.
Аксиомы счетности (557). 14.4.3.
Сходимость. Непрерывность
функции (558). 14.4.4. Компактность
множеств и пространств (559). 14.4.5.
Компактность в метрических
пространствах (559). 14.4.6.
Топологические линейные пространства (560).
14.4.7. Слабые топологии в линейных
пространствах (561)
ЧаглЫУ. ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ 540
14
ОГЛАВЛЕНИЕ
Глава 14.5. ПРОСТРАНСТВО
ОПЕРАТОРОВ И ФУНКЦИОНАЛОВ 562
14.5.1. Общая теория.
Сопряженные пространства. Топологии в
пространстве ограниченных
линейных операторов (562). 14.5.2.
Сопряженные пространства
некоторых функциональных
пространств (564)
Глава 14.6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ 565
14.6.1. Основные понятия и
теоремы (565). 14.6.2. Спектр
линейного оператора (567)
Глава 14.7. ГИЛЬБЕРТОВЫ
ПРОСТРАНСТВА 569
14.7.1. Ортогональные
подпространства. Ортогональные
дополнения. Теорема Рисса (569). 14.7.2.
Линейные операторы в
гильбертовых пространствах. Гильбертовы
сопряженные операторы (569).
14.7.3. Самосопряженные и
симметричные операторы (570). 14.7.4.
Операторы ортогонального
проектирования. Общее определение
проектора (571). 14.7.5.
Последовательности векторов и базисы.
Разложение функций в ряды (571)
Глава 14.8. СПЕКТРАЛЬНАЯ ТЕОРИЯ
ЛИНЕЙНЫХ ОПЕРАТОРОВ 575
14.8.1. Спектральные разложения
компактных самосопряженных и
нормальных операторов (575).
14.8.2. Операторная мера.
Интегралы по операторной мере и
определяемые ими операторы
(575). 14.8.3. Функции от
операторов (577). 14.8.4. Спектральное
разложение самосопряженного
оператора (578). 14.8.5.
Спектральное разложение унитарного
оператора (578). 14.8.6.
Спектральное разложение группы
унитарных операторов (579).
14.8.7. Спектральное разложение
нормального оператора (579)
Глава 14.9. НЕЛИНЕЙНЫЙ
ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ 579
14.9.1. Дифференцирование
функционалов и операторов.
Производные и дифференциалы Фреше
и Гато. Формула и ряд Тейлора
(579). 14.9.2. Экстремумы
функционалов (581). 14.9.3.
Операторные уравнения. Метод
сжимающих отображений (581)
СПИСОК ЛИТЕРАТУРЫ 582
Раздел 15. ВАРИАЦИОННОЕ
ИСЧИСЛЕНИЕ (ГЛ. Каменский) 583
Глава 15.1. НЕОБХОДИМЫЕ
УСЛОВИЯ ЭКСТРЕМУМОВ
ФУНКЦИОНАЛОВ 583
15.1.1. Введение (583). 15.1.2.
Вариационные задачи с фиксированными
концами (583). 15.1.3. Экстремумы
функционалов, зависящих от
старших производных неизвестной
функции (586). 15.1.4. Вариационные
задачи с подвижными границами
(586). 15.1.5. Экстремали с угловыми
точками (587)
Глава 15.2. УСЛОВНЫЙ ЭКСТРЕМУМ 588
15.2.1. Изопериметрическая задача
(588). 15.2.2. Задача Лагранжа
(588). 15.2.3. Задача Майера (589).
15.2.4. Задача Больца (589)
Глава 15.3. ДОСТАТОЧНЫЕ УСЛОВИЯ
ЭКСТРЕМУМОВ
ФУНКЦИОНАЛОВ 589
15.3.1. Поля экстремалей (589).
15.3.2. Достаточные условия
слабого экстремума (590). 15.3.3.
Достаточные условия сильного
экстремума (590)
Глава 15.4. ВАРИАЦИОННЫЕ
ЗАДАЧИ ДЛЯ НЕЛОКАЛЬНЫХ
ФУНКЦИОНАЛОВ 591
15.4.1. Симметричные краевые
условия (591). 15.4.2.
Асимметричные краевые условия (592)
Глава 15.5. ВАРИАЦИОННЫЕ
ЗАДАЧИ С ЧАСТНЫМИ
ПРОИЗВОДНЫМИ 593
СПИСОК ЛИТЕРАТУРЫ 593
Раздел 16. ОБОБЩЕННЫЕ ФУНКЦИИ
(АН. Сиротин) 594
Глава 16.1. ОСНОВНЫЕ ПОНЯТИЯ 594
16.1.1. Понятие обобщенной
функции (594). 16.1.2.
Пространство основных функций (595).
16.1.3. Обобщенные функции (595)
Глава 16.2. ОПЕРАЦИИ НАД
ОБОБЩЕННЫМИ ФУНКЦИЯМИ 596
16.2.1. Простейшие операции
(596). 16.2.2. Дифференцирование
(597). 16.2.3. Дифференциальные
уравнения в классе обобщенных
функций (598). 16.2.4. Весовые
функции (599). 16.2.5.
Преобразования Фурье и Лапласа (600)
СПИСОК ЛИТЕРАТУРЫ 601
Раздел 17. ИНТЕГРАЛЬНЫЕ
УРАВНЕНИЯ (Б.В. Вербицкий) 602
Глава 17.1. ТЕРМИНОЛОГИЯ И
ОБОЗНАЧЕНИЯ 602
Глава 17.2. ИНТЕГРАЛЬНЫЕ
УРАВНЕНИЯ ТИПА ФРЕДГОЛЬМА 603
ОГЛАВЛЕНИЕ
15
17.2 1. Интегральные уравнения II
рода с вырожденным ядром (603)
17.2.2. Интегральные уравнения II
рода с ядром общего вила (606).
17.2.3. Интегральные уравнения II
рода с симметричным ядром (608).
17 2.4 Решение интегральных
уравнений I рода (610)
Глава 17.3. ИНТЕГРАЛЬНЫЕ
УРАВНЕНИЯ С
НЕОТРИЦАТЕЛЬНЫМИ ЯДРАМИ 611
17.3.1. Некоторые спектральные
свойства интегральных операторов
с положительными ядрами (611).
17.3.2. Важнейшие свойства
интегральных операторов со
стохастическими ядрами (613). 17.3.3.
Интегральные операторы с осцил-
ляционными ядрами (613)
Глава 17.4. ОДНОМЕРНЫЕ
СИНГУЛЯРНЫЕ УРАВНЕНИЯ 615
17.4 I. Основные определения
(615) 17 4 2. Вэжнейшие свойства
сингулярных интегралов (616).
17.4 3. Формулы
дифференцирования и интегрирования,
содержащие сингулярные интегралы
(617) 17 4.4. Регуляризация (617)
Глава 17.5. ИНТЕГРАЛЬНЫЕ
УРАВНЕНИЯ С ЯДРАМИ,
ЗАВИСЯЩИМИ ОТ РАЗНОСТИ
АРГУМЕНТОВ 619
17.5.1. Важные частные случаи.
Уравнения Вольтерра (620). 17.5.2
Символ Условия нормальной
разрешимости (620). 17.5.3.
Уравнения на полуоси с
суммируемыми ядрами (620)
Глава 17.6. НЕЛИНЕЙНЫЕ
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 622
17.6.1. Простейшие виды
нелинейных интегральных уравнений
(622). 17.6.2. Некоторые свойства
нелинейных интегральных
операторов (623) 17.6 3. Простейшие
приемы решения нелинейных
интегральных уравнений (624)
СПИСОК ЛИТЕРАТУРЫ 625
Часть V. СТОХАСТИЧЕСКИЙ АНАЛИЗ 626
Раздел 18. ТЕОРИЯ ВЕРОЯТНОСТЕЙ
(Е.С. Кочетков) 626
Глава 18.1. ЭЛЕМЕНТАРНЫЕ
ПОДХОДЫ К ОПРЕДЕЛЕНИЮ
ВЕРОЯТНОСТИ 626
18 1.1 Примеры случайных
событий (626) 18 12. Операции над
случайными событиями (626).
18 13. Классическая схема теории
вероятностей (627) 18.14.
Простейшие свойства вероятности (627)
18.1.5. Условные вероятности в
классической схеме (627). 18.1.6
Геометрические вероятности (627).
18.1.7. Статистический подход к
определению вероятности (628)
Глава 18.2. СЛУЧАЙНЫЕ СОБЫТИЯ И
ИХ ВЕРОЯТНОСТИ 628
18.2.1. Аксиомы теории
вероятностей (628). 18.2.2. Элементарные
свойства вероятности (629). 18 2.3
Свойство непрерывности
вероятности (629). 18 2.4 Формула сложения
вероятностей (630) 18.2.5. Условная
вероятность и ее свойства (630).
18 2.6 Формула умножения
вероятностей (630). 18.2.7. Независимые
события (630). 18.2.8. Формула
полной вероятности; формула
Байеса (631) 18 2.9. Схема Бернул-
ли (631). 18.2.10. Полиномиальная
схема (631)
Глава 18.3. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 632
18.3.1. Случайная величина и ее
функция распределения (632).
18.3.2. Вероятность попадания
случайной величины в заданный
промежуток (632). 18 3.3.
Математическое ожидание случайной
величины и его основные свойства
(632). 18.3.4. Начальные и
центральные моменты случайной
величины (633). 18.3 5. Проблема
моментов (634). 18.3.6. Дисперсия
случайной величины и ее
простейшие свойства (634) 18 3.7.
Характеристическая функция случайной
величины (634). 18.3.8. Дискретные
случайные величины (635). 18 3.9.
Целочисленные случайные
величины; их характеристические и
производящие функции (636).
18.3 10. Энтропия дискретной
случайной величины (636). 18.3.11.
Примеры дискретных случайных
величин (636) 18.3.12.
Непрерывные случайные величины
(распределения вероятностей); плотность
вероятности (638) 18.3.13. Энтропия
абсолютно непрерывного
распределения вероятностей (640). 18.3 14.
Примеры абсолютно непрерывных
распределений вероятностей (640).
18.3.15. Использование 8-функции
при описании случайных величин
(644) 18.3.16. Моделирование
случайных величин с помощью ЭВМ
(645). 18.3.17. Функции от случайных
величин (645)
Глава 18.4. СЛУЧАЙНЫЕ ВЕКТОРЫ ... 646
18.4.1. Случайный вектор и его
функция распределения (646)
18.4.2. Независимые случайные
величины (646) 18 4 3. Ковариация
и коэффициент корреляции двух
случайных величин (647) 18 4.4.
Некоррелированные величины (647).
16
ОГЛАВЛЕНИЕ
18.4.5. Мультипликативное
свойство математического ожидания (647).
18.4.6. Математическое ожидание
случайного вектора и его свойства
(648). 18.4.7. Ковариационная и
нормированная корреляционная
матрицы случайного вектора (648).
18.4.8. Дискретные случайные
векторы (649). 18.4.9. Абсолютно
непрерывные случайные векторы;
многомерные плотности
вероятности (649). 18.4.10. Условное
распределение и условное математическое
ожидание случайной величины
относительно случайного события
(650). 18.4.11. Условное
распределение одной случайной величины
относительно другой (случай
дискретного совместного
распределения) (650). 18.4.12. Условное
распределение одной случайной
величины относительно другой
(случай абсолютно непрерывного
совместного распределения) (651).
18.4.13. Наилучшая в среднем
квадратическом оценка одной
случайной величины по другой
случайной величине (651). 18.4.14.
Формула умножения плотностей
(651). 18.4.15. Обобщения на
многомерные распределения (652).
18.4.16. Характеристическая
функция случайного вектора и ее
свойства (652). 18.4.17. Свертка
плотностей вероятности (653). 18.4.18.
Многомерное нормальное
распределение вероятностей (653). 18.4.19.
Энтропия и количество
информации (655). 18.4.20. Функции от
случайных векторов (655)
Глава 18.5. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ
ТЕОРИИ ВЕРОЯТНОСТЕЙ 656
18.5.1. Неравенство Чебышева
(656). 18.5.2. Сходимость по
вероятности (656). 18.5.3.
Сходимость почти наверное (656). 18.5.4.
Сходимость в среднем (656).
18.5.5. Сходимость по
распределению (657). 18.5.6. Обзор
импликаций, связанных с видами
вероятностной сходимости (657). 18.5.7.
Сходимость случайных
последовательностей и соответствующих
моментов (657). 18.5.8.
Непрерывное преобразование сходящейся
случайной последовательности
(657). 18.5.9. Закон больших чисел
(658). 18.5.10. Усиленный закон
больших чисел (658). 18.5. II.
Центральная предельная теорема
(658). 18.5.12. Нормальная и пуас-
соновская аппроксимации
биномиального распределения (659)
СПИСОК ЛИТЕРАТУРЫ 660
Раздел 19. МАТЕМАТИЧЕСКАЯ
СТАТИСТИКА^./'. Горяинова,
А.И. Кибзуи) 661
Глава 19.1. ОСНОВНЫЕ
ВЫБОРОЧНЫЕ ХАРАКТЕРИСТИКИ 661
19.1.1. Основные понятия (661).
19.1.2. Вариационный ряд (662).
19.1.3. Выборочная функция
распределения (663). 19.1.4.
Гистограмма (663). 19.1.5.
Выборочные моменты (664)
Глава 19.2. ОСНОВНЫЕ
РАСПРЕДЕЛЕНИЯ В СТАТИСТИКЕ 665
19.2.1. Распределение хи-квадрат
(665). 19.2.2. Распределение Стью-
дента (666). 19.2.3. Распределение
Фишера (667)
Глава 19.3. ТОЧЕЧНЫЕ ОЦЕНКИ 668
19.3.1. Основные понятия (668).
19.3.2. Метод максимального
правдоподобия (670). 19.3.3. Метод
моментов (672)
Глава 19.4. РЕГРЕССИОННЫЙ АНАЛИЗ 673
19.4.1. Модели регрессии (673).
19.4.2. Схема Гаусса-Маркова
(673). 19.4.3. Простая линейная
регрессия (674)
Глава 19.5. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ 677
19.5.1. Основные понятия (677).
19.5.2. Использование центральной
статистики (677). 19.5.3.
Использование точечной оценки (679)
Глава 19.6. МЕТОД
СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ 681
19.6.1. Основные понятия (681).
19.6.2. Вычисление вероятности
события (681). 19.6.3. Вычисление
определенного интеграла (682)
Глава 19.7. ПРОВЕРКА
СТАТИСТИЧЕСКИХ ГИПОТЕЗ 684
19.7.1. Основные понятия (684).
19.7.2. Проверка гипотезы о
значении параметра (685). 19.7.3.
Проверка гипотезы о виде закона
распределения (688). 19.7.4.
Проверка гипотезы о
независимости двух СВ (689). 19.7.5.
Проверка гипотезы об однородности
наблюдений (690)
СПИСОК ЛИТЕРАТУРЫ 691
Раздел 20. СЛУЧАЙНЫЕ ПРОЦЕССЫ
(А.Р. Панков) 692
Глава 20.1. ОСНОВНЫЕ ПОНЯТИЯ 692
20.1.1. Определение случайного
процесса (692). 20.1.2.
Вероятностные характеристики (692). 20.1.3.
Моментные характеристики (693).
20.1.4. Примеры случайных
процессов (695)
Глава 20.2. АНАЛИЗ И
ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ
ПРОЦЕССОВ 696
ОГЛАВЛЕНИЕ
17
20.2.1. Линейное преобразование
последовательности (696). 20.2.2.
Непрерывность случайной функции
(696). 20.2.3. Дифференцирование
случайной функции (697). 20.2.4.
Интегрирование случайной
функции (697). 20.2.5. Линейные
дифференциальные уравнения (698)
Глава 20.3. СТАЦИОНАРНЫЕ
СЛУЧАЙНЫЕ ПРОЦЕССЫ 699
20.3.1. Основные определения (699).
20.3.2. Спектральные
характеристики (699). 20.3.3. Линейные
преобразования (701). 20.3.4. Примеры
стационарных процессов (701)
Глава 20.4. МАРКОВСКИЕ
СЛУЧАЙНЫЕ ПРОЦЕССЫ 703
20.4.1. Марковское свойство
процесса (703). 20.4.2. Дискретные
цепи Маркова (704). 20.4.3. Эргоди-
ческие цепи Маркова (704). 20.4.4.
Марковские случайные функции
(705). 20.4.5. Процесс рождения и
гибели (706)
Глава 20.5. СЛУЧАЙНЫЕ ПРОЦЕССЫ
С НЕЗАВИСИМЫМИ
ПРИРАЩЕНИЯМИ 706
20.5.1. Основные определения (706).
20.5.2. Пуассоновский процесс (707).
20.5.3. Винеровский процесс (708).
20.5.4. Непрерывный белый шум (709)
Глава 20.6. СТОХАСТИЧЕСКИЕ
ИНТЕГРАЛЫ И ДИФФЕРЕНЦИАЛЫ 709
20.6.1. Стохастический интеграл
Ито от неслучайной функции
(709). 20.6.2. Стохастический
. интеграл Ито от случайной
функции (711). 20.6.3. Стохастический
дифференциал. Формула Ито (712)
Глава 20.7. СТОХАСТИЧЕСКИЕ
УРАВНЕНИЯ 712
20.7.1. Разностные стохастические
уравнения (712). 20.7.2.
Стохастические дифференциальные уравнения
(713). 20.7.3. Линейные
стохастические дифференциальные уравнения
(713). 20.7.4. Метод моментов (714).
20.7.5. Законы распределения
решений стохастических уравнений (715).
20.7.6. Численное интегрирование
стохастических уравнений (716)
Глава 20.8. СТАТИСТИКА
СЛУЧАЙНЫХ ПРОЦЕССОВ 717
20.8.1. Оценивание моментных
характеристик (717). 20.8.2.
Оценивание спектральной плотности (719).
20.8.3. Оценивание процессов по
среднеквадратичному критерию (719).
20.8.4 Фильтр Калмана для случайных
последовательностей (720). 20.8.5.
Фильтр Калмана для случайных
функций (721)
СПИСОК ЛИТЕРАТУРЫ 722
4AdbVL МЕТОДЫ МАТЕМАТИЧЕСКОГО
МОДЕЛИРОВАНИЯ 723
Раздел 21. МЕТОДЫ ОПТИМИЗАЦИИ
(А.В. Пантелеев, Т. А. Летова) 723
Глава 21.1. УСЛОВИЯ ЭКСТРЕМУМА
ФУНКЦИЙ 723
21.1.1. Постановка задачи
оптимизации и основные положения
(723). 21 1.2. Необходимые и
достаточные условия безусловного
экстремума (725). 21.1.3.
Необходимые и достаточные условия
условного экстремума (729)
Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ
ПОИСКА БЕЗУСЛОВНОГО
ЭКСТРЕМУМА 733
21.2.1. Методы нулевого порядка
(735). 21.2.2. Методы первого
порядка (754). 21.2.3. Методы
второго порядка (764)
Глава 21.3. ЧИСЛЕННЫЕ МЕТОДЫ
ПОИСКА УСЛОВНОГО
ЭКСТРЕМУМА 766
21.3.1. Методы последовательной
безусловной минимизации (767).
21.3.2. Методы возможных
направлений (775)
Глава 21.4. ЗАДАЧИ ЛИНЕЙНОГО
ПРОГРАММИРОВАНИЯ 781
21.4.1. Методы решения задач
линейного программирования
(781). 21.4.2. Методы решения
задач линейного целочисленного
программирования (790)
СПИСОК ЛИТЕРАТУРЫ 795
Раздел 22. МАТЕМАТИЧЕСКАЯ
ТЕОРИЯ ОПТИМАЛЬНЫХ
ПРОЦЕССОВ УПРАВЛЕНИЯ
(А.В. Пантелеев) 796
Глава 22.1. СИНТЕЗ ОПТИМАЛЬНЫХ
НЕПРЕРЫВНЫХ
ДЕТЕРМИНИРОВАННЫХ СИСТЕМ 797
22.1.1. Нахождение оптимального
программного управления (797).
22.1.2. Нахождение оптимального
управления с полной обратной
связью (802). 22.1.3. Нахождение
оптимального управления с
неполной обратной связью (806)
Глава 22.2. СИНТЕЗ ОПТИМАЛЬНЫХ
НЕПРЕРЫВНЫХ
СТОХАСТИЧЕСКИХ СИСТЕМ.. (А.В. Пантелеев)... 809
22.2.1. Нахождение оптимального
программного управления (809).
22.2.2. Нахождение оптимального
управления с полной обратной
связью (811). 22.2.3. Нахождение
оптимального управления с
неполной обратной связью (813)
18
ОГЛАВЛЕНИЕ
Глава 22.3. СИНТЕЗ ОПТИМАЛЬНЫХ
ДИСКРЕТНЫХ
ДЕТЕРМИНИРОВАННЫХ СИСТЕМ (Л.В. Пантелеев) 819
22.3.1. Нахождение оптимального
программного управления (819).
22.3.2. Нахождение оптимального
управления с полной обратной
связью (822)
Глава 22.4. СИНТЕЗ ОПТИМАЛЬНЫХ
ДИСКРЕТНЫХ
СТОХАСТИЧЕСКИХ СИСТЕМ (А.В. Пантелеев) 826
22.4.1. Нахождение
оптимального программного управления
(826). 22.4.2. Нахождение
оптимального управления с полной
обратной связью (828)
Глава 22.5. СИНТЕЗ ОПТИМАЛЬНЫХ
НЕПРЕРЫВНО-ДИСКРЕТНЫХ
ДЕТЕРМИНИРОВАННЫХ
СИСТЕМ (А.В. Пантелеев) 831
22.5.1. Нахождение оптимального
программного управления (831).
22.5.2. Нахождение оптимального
управления с полной обратной
связью (833)
Глава 22.6. СИНТЕЗ ОПТИМАЛЬНЫХ
НЕПРЕРЫВНЫХ СИСТЕМ ПО
МИНИМАКСНОМУ КРИТЕРИЮ
(А.В. Пантелеев) 834
22.6 1. Нахождение оптимального
программного управления (834).
22.6.2. Нахождение оптимального
позиционного управления (837)
Глава 22.7. ПРЕОБРАЗОВАНИЕ
АФФИННЫХ СИСТЕМ (А.П. Крищенко) 838
22.7 1. Основные определения
(838). 22.7.2. Глобальные условия
эквивалентности (839). 22.7.3.
Матрица управляемости (842).
22.7.4. Локальные условия
эквивалентности (843). 22.7.5.
Неоднозначность канонического вида
(845). 22.7.6. Частично
определенное многозначное представление
(846). 22.7.7. Построение
наблюдателей (846)
СПИСОК ЛИТЕРАТУРЫ 848
Раздел 23. ВЫЧИСЛИТЕЛЬНАЯ
МАТЕМАТИКА (У.Г Пирумов) 850
Глава 23.1. ПРИБЛИЖЕННЫЙ АНАЛИЗ 850
23.1.1. Структура погрешности
(850). 23.1.2. Корректность
вычислений (851)
Глава 23.2. ЛИНЕЙНЫЕ УРАВНЕНИЯ.. 851
23.2.1. Метод Гаусса (852). 23.2.2.
Вычисление определителя и
обратной матрицы (853). 23.2.3.
Метод прогонки (854). 23.2.4
Итерационные методы (855)
Глава 23.3. НЕЛИНЕЙНЫЕ
УРАВНЕНИЯ 856
23.3.1. Отделение корня (856)
23.3.2. Метод дихотомии (857).
23.3.3. Метод простой итерации
(857). 23.3.4. Метод Ньютона.
Метод секущих. Метод парабол
(858). 23.3.5. Системы нелинейных
уравнений (860)
Глава 23.4. ВЫЧИСЛЕНИЕ
СОБСТВЕННЫХ ЗНАЧЕНИЙ И
СОБСТВЕННЫХ ВЕКТОРОВ
МАТРИЦ 861
23.4.1. Метод вращения (861)
Глава 23.5. ПРИБЛИЖЕНИЕ
ФУНКЦИЙ 863
23.5.. 1. Интерполяционные
многочлены Лагранжа и Ньютона (863).
23.5.2. Погрешность и сходимость
интерполяции (866). 23.5.3.
Сплайны (867). 23.5.4. Метод
наименьших квадратов (868)
Глава 23.6. ЧИСЛЕННОЕ
ДИФФЕРЕНЦИРОВАНИЕ 869
23.6 1. Вычисление первой и
второй производных (869)
Глава 23.7. ЧИСЛЕННОЕ
ИНТЕГРИРОВАНИЕ 871
23.7.1. Формула прямоугольников,
трапеций, Симпсона (871)
Глава 23.8. ОБЫКНОВЕННЫЕ
ДИФФЕРЕНЦИАЛЬНЫЕ
УРАВНЕНИЯ 873
23.8.1. Метод конечных разностей.
Погрешность, аппроксимация,
сходимость (874). 23.8.2. Метод Эйлера.
Метод Эйлера с пересчетом (875).
23.8.3. Метод Рунге-Кугты (876).
23.8.4. Метод Адамса (877). 23.8.5.
Неявные схемы для решения
жестких систем (877). 23.8 6.
Метод стрельбы для решения
краевых задач (879). 23.8.7.
Конечно-разностный метод (880)
Глава 23.9. УРАВНЕНИЯ В ЧАСТНЫХ
ПРОИЗВОДНЫХ 881
23.9.1. Метод сеток. Задача
Дирихле для уравнения Лапласа (881).
23.9.2. Явные и неявные
разностные схемы (884). 23.9.3.
Аппроксимация, устойчивость,
сходимость (886). 23.9.4. Метод Фурье
исследования устойчивости (887)
Глава 23.10. НЕКОТОРЫЕ
СПЕЦИАЛЬНЫЕ МЕТОДЫ 890
23.10.1. Метод переменных
направлений (дробных шагов) (890).
23.10.2. Метод установления (894).
23.10.3. Метод сквозного счета
(894). 23.10.4. Метод прямых (896).
23.10.5. Метод характеристик (898)
СПИСОК ЛИТЕРАТУРЫ 900
ОГЛАВЛЕНИЕ
19
Раздел 24. ИССЛЕДОВАНИЕ
ОПЕРАЦИЙ 901
Глава 24.1. ОСНОВНЫЕ ПОНЯТИЯ
ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
(И.К Волков) 901
24.1.1. Постановки задач и их
классификация (901). 24.1.2.
Классификация задач исследования операций
по виду информационного
состояния "лица, принимающего решения"
(903). 24.1.3. Классификация задач
исследования операций по структуре
информационного состояния "лица,
принимающего решения" (903).
24.1.4. Классификация задач
исследования операций по виду критерия
оптимальности (904). 24.1.5. Об
одном аспекте решения задач
многокритериальной оптимизации (905)
Глава 24.2. ОСНОВЫ ЛИНЕЙНОГО
ПРОГРАММИРОВАНИЯ
(ЛИ. Белоусов, И.К Волков) 910
24.2.1. Постановка общей задачи
линейного программирования и ее
анализ (910). 24.2.2. Формы
записи задач линейного
программирования (913)
Глава 24.3. ЗАДАЧИ, ПРИВОДЯЩИЕ К
ЗАДАЧАМ ЛИНЕЙНОГО
ПРОГРАММИРОВАНИЯ (И.К.
Волков) 915
24.3.1. Транспортная задача (915).
24.3.2. Задача о календарном
планировании комплекса работ
(915). 24.3.3. Задача о
минимизации дисбаланса на автоматической
линии (916)
Глава 24.4. ЦЕЛОЧИСЛЕННОЕ
ПРОГРАММИРОВАНИЕ (И. К Волков) 917
24.4.1. Методы решения задач
целочисленного программирования
(917). 24.4.2. Метод ветвей и границ
(919). 24.4.3. Задачи
целочисленного программирования (921)
Глава 24.5. ЗАДАЧИ ТРАНСПОРТНОГО
ТИПА (И.К Волков) 923
24.5.1. Классическая транспортная
задача (924). 24.5.2. Транспортная
задача с промежуточными пунктами
(926). 24.5.3. Задача о назначениях
(926). 24.5.4. Задача выбора
кратчайшего пути (928). 24.5.5.
Симплексный метод решения задач
транспортного типа (929)
Глава 24.6. МАРКОВСКИЕ МОДЕЛИ
ПРИНЯТИЯ РЕШЕНИЙ
(И.К. Волков) 931
24.6.1. Основные понятия (931).
24.6.2. Принятие решений при
конечном горизонте планирования
(934). 24.6 3. Принятие решений
при бесконечном горизонте
планирования (936)
Глава 24.7. ЗАДАЧИ ПРИНЯТИЯ
РЕШЕНИЙ В УСЛОВИЯХ
РИСКА И НЕОПРЕДЕЛЕННОСТИ
(И.К Волков) 941
24.7.1. Одноэтапные процедуры
принятия решений в условиях
риска (942). 24.7.2. Одноэтапные
процедуры принятия решений в
условиях неопределенности (944)
Раздел 25. МАТЕМАТИЧЕСКОЕ
МОДЕЛИРОВАНИЕ В ТЕХНИКЕ 947
Глава 25.1. РОЛЬ
МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ В
ТЕХНИКЕ (B.C. Зарубин,
Г.Н. Кувыркин) 947
25.1.1. Математическое
моделирование и вычислительный
эксперимент (947). 25.1.2. Влияние
математического моделирования на
развитие техники (947). 25.1.3.
Последовательность этапов
моделирования и вычислительного
эксперимента (948)
Глава 25.2. МАТЕМАТИЧЕСКАЯ
МОДЕЛЬ ТЕХНИЧЕСКОГО
ОБЪЕКТА 949
25.2.1. Структура математической
модели (B.C. Зарубин) (949). 25.2.2.
Свойства математических моделей
(B.C. Зарубин, Г.Н. Кувыркин) (950).
25.2.3. Структурные и
функциональные модели (Г.Н. Кувыркин)
(951). 25.2.4. Теоретические и
эмпирические модели (B.C.
Зарубин, Г.Н. Кувыркин) (951). 25.2.5.
Особенности функциональных
моделей (B.C. Зарубин) (952). 25.2.6.
Иерархия математических моделей
и формы их представления
(B.C. Зарубин) (953)
Глава 25.3. ЛИНЕЙНЫЕ МОДЕЛИ
ТИПОВЫХ ЭЛЕМЕНТОВ 955
25.3.1. Параметры типа потенциала и
потока (B.C. Зарубин, Г.Н. Кувыркин)
(955). 25.3.2. Модели электрических
двухполюсников (B.C. Зарубин, Г.Н.
Кувыркин) (955). 25.3.3. Модели
простейших элементов механических
систем (B.C. Зарубин) (956). 25.3.4.
Некоторые элементы тепловых
систем (Г.Н. Кувыркин, И.В.
Станкевич) (958). 25.3.5. Модели элементов
гидравлических систем (B.C. Зарубин,
Г.Н. Кувыркин) (959). 25.3.6.
Особенности моделей пневматических
систем (ВС Зарубин) (960)
Глава 25.4. МОДЕЛИ СИСТЕМ ИЗ
ТИПОВЫХ ЭЛЕМЕНТОВ 961
25.4.1. Эквивалентная схема
технической системы (B.C. Зарубин,
Г.Н. Кувыркин) (961). 25.4.2.
Дуальность электрических цепей
(B.C. Зарубин, Г.Н. Кувыркин) (961).
20
ОГЛАВЛЕНИЕ
25.4.3. Двойственность
электромеханической аналогии {B.C. Зарубин)
(962). 25.4.4. Эквивалентная схема
механической системы (Г.Н.
Кувыркни) (963). 25.4.5. Формализация
построения модели сложной
системы (B.C. Зарубин) (964)
Глава 25.5. НЕЛИНЕЙНЫЕ МОДЕЛИ
МАКРОУРОВНЯ 965
25.5.1. Некоторые причины
возникновения нелинейностей (B.C. Зарубин)
(965). 25.5.2. Статические и
стационарные модели (Г.Н. Кувыркни, И.В.
Станкевич) (967). 25.5.3. Некоторые
нестационарные модели (B.C. Зарубин,
Г.Н. Кувыркни) (969)
Глава 25.6. МОДЕЛИ МИКРОУРОВНЯ 971
25.6.1. Плотность физических
субстанций (Г.Н. Кувыркин) (971).
25.6.2. Модели переноса
физических субстанций (B.C. Зарубин,
Г.Н. Кувыркин) (972). 25.6.3.
Локальная форма законов
сохранения физических субстанций
(В.С.Зарубин) (973). 25.6.4.
Модели простейших сред (B.C. Зарубин,
Г.Н. Кувыркин) (974)
Глава 25.7. АЛГОРИТМИЗАЦИЯ
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ 975
25.7.1. Преобразование
математических моделей (B.C. Зарубин, Г.Н.
Кувыркин) (975). 25.7.2.
Рационализация алгоритмов матричных
операций (И.В. Станкевич) (977). 25.7.3.
Операции с разреженными
матрицами (B.C. Зарубин, И.В. Станкевич)
(979)
СПИСОК ЛИТЕРАТУРЫ 982
ПРЕДИСЛОВИЕ
В многотомной энциклопедии
«Машиностроение» математике посвящен отдельный
том. Это объясняется все возрастающей
ролью математики и ее методов при проведении
научно-исследовательских и
опытно-конструкторских работ по самым различным
техническим направлениям и, в том числе, в
машиностроении. Основным проявлением такой
математизации разработок в области техники
становится широкое использование методов
математического моделирования и
вычислительного эксперимента. Они состоят в
адекватной замене существующего или
создаваемого технического устройства или процесса
соответствующей математической моделью и
в ее последующем изучении
(экспериментировании с нею) на ЭВМ с помощью
вычислительно-логических алгоритмов. Это позволяет
при разработке современной техники
экономить время и материальные ресурсы,
количественно оценивать эффективность практической
реализации результатов фундаментальных
исследований в области механики, физики,
химии и других естественно-научных дисциплин,
обеспечивать расчетно-теоретическое
сопровождение на всех стадиях жизненного цикла
технических устройств и систем.
В настоящее время математику и
математические методы можно рассматривать как
инструмент, творческое применение которого
может способствовать прогрессу в любой
отрасли техники. Поэтому современный
инженер должен владеть этим инструментом,
ориентироваться в возможностях и ограничениях
существующих математических методов,
представлять взаимосвязь между отдельными
разделами математики, обладать навыками
работы с математической литературой.
Достижению этих целей и посвятили свой труд авторы
этого тома, имеющие многолетний опыт
преподавания математики в МГТУ им. Н.Э.
Баумана и авиационном институте (МАИ). Этот
опыт нашел отражение в многочисленных
учебниках и учебных пособиях по курсу
высшей математики, в том числе в 21 выпуске
серии «Математика в техническом
университете», издание которой завершено в 2001 г.
Издательством МГТУ им. Н.Э. Баумана.
Изложенный в этом томе материал
объединен в шесть частей. Первые две части
написаны сотрудниками математических кафедр
МГТУ им. Н.Э. Баумана и включают
элементарную математику, математический анализ,
теории рядов и функций комплексного
переменного, высшую и линейную алгебру,
аналитическую и дифференциальную
геометрию, дискретную математику. Авторами
последующих трех частей являются профессора
и преподаватели математических кафедр
МАИ. Эти части посвящены
дифференциальным уравнениям и вариационному
исчислению, интегральным преобразованиям,
специальным функциям и операционному
исчислению, прикладным разделам
функционального анализа, теории вероятностей,
математической статистике и случайным
процессам. В шестую часть, написанную
совместно авторами двух упомянутых
технических университетов, вошли оптимальное
управление, вычислительная математика,
исследование операций и заключительный
раздел, названный «Математическое
моделирование в технике».
В данном томе представлен не только
материал, традиционно входящий в общий
курс высшей математики технических вузов,
но изложено и большинство специальных
разделов, изучаемых в технических
университетах с углубленной математической
подготовкой выпускников. Эти разделы, ранее
обычно не включавшиеся в справочные
руководства и энциклопедии по машиностроению,
в последнее время находят все более широкое
применение при решении разнообразных
прикладных задач и поэтому необходимы для
современного инженера. Несмотря на
наличие в настоящее время ряда достаточно
универсальных компьютерных пакетов по
математике, в которых реализовано большое число
вычислительных и символьных операций,
теоретические положения и обоснование
математических методов не утратили своего
значения. Наличие таких пакетов позволило
авторам не включать в этот том громоздкие
таблицы интегралов, а также таблицы
значений различных функций.
22
ПРЕДИСЛОВИЕ
Рубрикация этого тома выдержана в
соответствии с ранее вышедшими томами
энциклопедии «Машиностроение»: разделы
имеют сквозную нумерацию от 1 до 25 с
двойной нумерацией входящих в них глав,
например, глава 2.10. Определенный интеграл. В
конце разделов помещены списки
рекомендуемой литературы, в которые включены наиболее
известные и доступные издания. В пределах
каждой главы нумерация параграфов, формул,
рисунков и таблиц сквозная, например,
параграф 2.10.4. Формула Ньютона - Лейбница.
Первые две части тома, включающие в
основном материал общего курса высшей
математики в технических вузах, составлены
так, что каждый параграф с тройной
нумерацией можно читать независимо от других,
опираясь на понятия, соответствующие
терминам (ключевым словам), которые при
первом упоминании их в т?ксте параграфа
отмечены светлым курсивом. Для сокращения
перекрестных ссылок эти термины включены в
предметный указатель в алфавитном порядке
по существительному в именительном падеже
с указанием параграфа, где он определен или
описан и выделен полужирным курсивом (в
случае многословного термина выделена лишь
его существенная часть).
Авторы надеются, что представленные в
этом томе сведения будут полезны широкому
кругу читателей — от студентов технических
вузов до инженеров и научных работников,
занимающихся прикладными задачами в
различных отраслях машиностроения.
ЧАСТЬ I
ВВЕДЕНИЕ В АНАЛИЗ
Раздел 1
ЭЛЕМЕНТАРНАЯ МАТЕМАТИКА
Глава 1.1
ЭЛЕМЕНТАРНАЯ АЛГЕБРА
1.1.1. Алгебраические выражения. Над
числовыми величинами можно выполнять
арифметические операции: сложение,
умножение, вычитание и деление. Первые две
являются основными. Они выполнимы для любых
пар чисел любого типа (целых,
действительных, комплексных) и определяют
дополнительные операции вычитания и деления,
выполнение которых может быть ограниченным в
зависимости от типа числовых величин.
Выполняемые операции обозначают
знаками арифметических операций: сложение
"+", умножение "х" или "•", вычитание "—",
деление "/" или ":". Переменные числовые
величины обозначают обычно строчными или
прописными латинскими буквами, причем
для серии близких по смыслу величин
используют индексы (например, Я|,Д2>Яз)> а
постоянные (константы) указывают явно.
Запись, в которой обозначения величин
соединены знаками операций, называют
алгебраическим выражением. В случае числовых
величин и арифметических операций говорят
об арифметическом выражении.
Последовательность выполнения
операций определяют специальными
соглашениями. В первую очередь выполняют операции
умножения и деления, а затем сложения и
вычитания, т.е. первые две имеют более
высокий приоритет. Несколько подряд идущих
операций одного приоритета выполняют
слева направо. Если необходимо изменить
порядок операций, в выражении используют
скобки. Операции внутри скобок выполняют в
первую очередь.
По существу, часть выражения внутри
скобок является автономным элементом
выражения, т.е. подвыражением, которое, в свою
очередь, может содержать подвыражения, т.е.
скобки могут быть вложенными, например:
((2.x + у) z + *) Z ■ Для наглядности
используют скобки разных типов: круглые ( ),
квадратные [ ], фигурные { }, причем каждой
открывающей скобке соответствует
закрывающая скобка того же типа. Например,
выражение {(а + Ь] + с) не корректно, поскольку
левой круглой скобке соответствует правая
фигурная.
Для повышения наглядности
алгебраических выражений используют еще несколько
соглашений. Между буквенными
обозначениями знак умножения, как правило,
опускают, т.е. вместо а • Ь пишут аЬ. Для
обозначения произведения нескольких равных
величин используют натуральный показатель
степени, указываемый верхним индексом
(например, вместо аааа пишут а ), т.е.
возведение числа в натуральную степень является
дополнительной арифметической операцией.
Деление иногда обозначают дробью в "два
этажа": над чертой — числитель дроби, под
чертой — знаменатель дроби, например —.
Ь
Арифметические выражения являются
стандартным элементом алгоритмических
языков. При записи текста ЭВМ-программ
традиционные правила записи арифметических
выражений часто модифицируют. Так,
переменную величину в выражении можно
обозначать последовательностью из нескольких
букв и цифр, называемой идентификатором.
Он не содержит специальных знаков и
должен начинаться с буквы. Операции в
выражении обозначают либо специальными знаками
(сложение "+", вычитание "—", умножение "*",
деление "/", возведение в степень "**" или
"л"), либо ключевыми словами, т.е. заранее
определенными идентификаторами.
Так как дополнительные
арифметические операции могут иметь смысл не для
любых числовых величин, переменные в
алгебраическом выражении могут принимать не
24
Глава 1.1. ЭЛЕМЕНТАРНАЯ АЛГЕБРА
все значения. Множество допустимых
наборов значений числовых величин, при которых
определено данное выражение, называют об-
ластью определения этого выражения.
Подстановка в выражение вместо переменных
некоторого допустимого набора их значений даст
после выполнения всех указанных в
выражении операций значение алгебраического
выражения.
Если в выражении некоторые величины
в рамках решаемой задачи остаются
неизменными, то их называют коэффициентами или
параметрами (например, коэффициенты
многочлена или алгебраического уравнения).
Традиционно параметры обозначают начальными
буквами алфавита, а переменные —
конечными.
1.1.2. Преобразование алгебраических
выражений. Алгебраические выражения
называют тождественными, если они принимают
одинаковые значения при любом из
возможных наборов значений входящих в эти
выражения величин. Связывая такие выражения
знаком равенства =, получают тождество, т.е.
утверждение, верное всюду в их области
определения. Замену алгебраического выражения
тождественным ему называют
(тождественным) преобразованием. В
преобразованиях арифметических выражений
используют свойства арифметических операций:
коммутативность (перестановочность) a+b=b+a,
ab = ba .ассоциативность (сочетательность)
a + (b + c) = (a + b) + c, a (be) = (ab) с ;
дистрибутивность (распределительность)
умножения относительно сложения
а (Ь + с) = ab + ас. При возведении в
натуральную степень атап = ат+", (ab)" = a"b",
(ат)" = ат\ ат/а" = ат~\ (a/b)" = a"/b" .
Отсюда следуют некоторые формулы
преобразований арифметических выражений,
содержащих натуральные степени чисел:
a2-b2 =(a-b)(a + b);
a3±b3 =(a±b)(a2+ab + b2);
a"-b"=(a-b)x
x(a"-[+a"-2b + ... + ab"-2+b"-]);
a2"-b2n=(a + b)x
x(a2"-]-a2"-2b + ... + ab2"-2-b2"-]);
a2n+l+b2,t+{=(a + b)x
x(a2"-a2n-[b + ...-ab2"-{+b2");
(a + bf =a2 + 2ab + b2;
(a + bf = a3 +3a2b + 3ab2 + b3\
(a + b)" = ^Ckna"-kbk =
A:=0
= СУЬ° + C\a"-Xb +... + C>V,
причем Сп=С£ = \ (см. 2.1.7) и
(a + b + c) =a2 +b2 +c2 + lab + 2bc + 2ac\
(a + b + cf =a3 +b3 + c3 + 3a2b + 3a2c +
+3ab2 + 3ac2 + 3b2c + 3bc2 + 6abc\
(a{ +... + an)N = ^CN(kh...,kn)a^ -..<#■,
причем каждое из слагаемых под знаком Е
суммы соответствует одному из возможных
кортежей (k\,...,kn) неотрицательных целых
чисел, сумма которых в точности равна N, а
1.1.3. Иррациональные выражения.
Операцию, обратную возведению в
натуральную степень, называют извлечением корня. Для
корня степени п из числа а используют
обозначение yfa (или а}'п), а при п = 2 пишут
просто у/а . Это число, п -я степень которого
равна а, т.е. (у/а) =(а1'") =а. Корень
четной степени из действительного числа
является действительным, если подкоренное
число неотрицательно, причем для
положительных чисел такой корень имеет два
значения, одинаковых по абсолютному значению, но
отличающихся знаком. Положительное
значение корня четной степени называют
арифметическим значением корня (в алгебраических
выражениях, как правило, подразумевают
арифметическое значение корня). Корень
нечетной степени имеет единственное
значение того же знака, что и подкоренное число.
Извлечение корня позволяет распространить
операцию возведения в степень на дробные
АЛГЕБРАИЧЕСКИЕ УРАВНЕНИЯ
25
показатели вида к/п, где п — натуральное,
к — целое: а
Если в алгебраическое выражение
входит операция извлечения корня
(обозначаемая радикалом — символом
извлечения корня) или (что равносильно) операция
возведения в дробную степень, то такое
выражение называют иррациональным.
1.1.4. Алгебраические уравнения. Два
алгебраических выражения, содержащие
переменные и соединенные знаком равенства,
образуют алгебраическое уравнение. Множество
значений переменных, при которых значения
левой и правой частей уравнения совпадают,
называют решениями (или корнями) этого
уравнения. О корнях уравнения говорят, что
они удовлетворяют данному уравнению. Если
в заданной области значений переменных
уравнение не имеет решений, то его называют
неразрешимым в этой области. Если же
уравнению удовлетворяют любые возможные
значения переменных, то оно является
тождеством.
Два уравнения с одним и тем же
набором переменных являются эквивалентными,
если они имеют одно и то же множество
решений. Уравнение, эквивалентное данному,
можно, например, получить, если заменить в
нем одно из подвыражений на ему
тождественное.
Несколько уравнений могут
рассматриваться как единая система уравнений. Ее
решением называют такой набор значений
переменных, который является решением
каждого уравнения системы.
Поиск решений алгебраического
уравнения или системы проводят
последовательным преобразованием путем замены
уравнений на эквивалентные им. Иногда в
результате преобразований новое уравнение имеет
более широкое множество решений, чем
исходное уравнение. Тогда говорят, что
уравнение (или система уравнений) приобретает
посторонние решения (посторонние корни). Их
выявляют подстановкой всех решений в
исходное уравнение и отбрасывают. Так, если
уравнение V2 - х = х возвести в квадрат, то
получим квадратное уравнение х2 + х - 2 = О
с корнями х, = 1 и х2 = -2 , последний из
которых является посторонним.
1.1.5. Неравенства. Два алгебраических
выражения, принимающие значения из
множества действительных чисел и соединенные
одним из знаков <,<,>,> , образуют
алгебраическое неравенство. Иногда несколько
неравенств записывают вместе в виде цепочки,
например: а < Ь < с. Неравенство называют
тождественным (или универсальным), если
оно выполнимо для любых допустимых
значений входящих в него переменных.
Примерами таких неравенств являются: обобщенное
неравенство треугольника
\а]+а2+... + ап\<\а[\ + \а2\ + ... + \ап\',
неравенство Коши-Буняковского
(*,Л| + afa +... + anbnf < (а{ + а] + ... + а*)х
х(й>2+*2+ ... + *,?);
неравенство Гельдера при l/p + \/q = 1
\а& +... + a„b„\ < (la,!7 +... + \a„f} x
х^г-к-Ч'/Г;
неравенство Минковского (при р > 1 )
(h+^+...+K+*/)<
ф\р + ...+Ы^р + (№+...+\ь„гУР.
Для положительных чисел tf/(/ = l,An
выполнима цепочка неравенств между их
средними гармоническим, геометрическим,
арифметическим и квадратичным
соответственно
Т1 ( п f" , п (. п W
/=1 j i /=| ) i=\ I /=i
Если неравенство не является
тождественным, то возникает задача описания всех
возможных наборов переменных, при
которых неравенство является верным, т.е. всех
его решений. Процесс нахождения всех
решений неравенства также называют решением
этого неравенства. Его проводят путем
последовательного эквивалентного преобразования
неравенства, состоящего в замене исходного
неравенства эквивалентным ему, т.е.
неравенством, имеющим то же множество решений,
что и исходное. Примеры простейших
эквивалентных преобразований неравенств: если
а < Ь , то b > а ; если а < b и £ < я , то
а = b ; если а < b и b <с , то а < с ; если
а < b и b < с или а < b и b < с , то а < с;
если а < b и с < d , то а + с < b + d ; если
26
Глава 1.2. ПЛАНИМЕТРИЯ
a <b и с > О , то ад<Ьс\ если а < b и
с < О , то ас> Ьс\ если 0 < а < £ или
а < b < О , то \/а>\/Ь.
Глава 1.2
ПЛАНИМЕТРИЯ
Первичными (т.е. неопределяемыми)
объектами элементарной (точнее, евклидовой)
геометрии являются тонка, прямая и
плоскость, отношения между которыми
определяет система аксиом. Основными отношениями
евклидовой геометрии являются отношения
принадлежности (например, точка
принадлежит прямой), порядка (например,
описывающее расположение точек на прямой: из трех
точек на прямой одна лежит между двумя
другими) и конгруэнтности, т.е. совпадения
объектов при их определенном перемещении
в геометрическом пространстве.
Множество точек образует
геометрический объект или геометрическую фигуру.
Прямая и плоскость — простейшие
геометрические фигуры. Планиметрия изучает
геометрические фигуры, которые целиком лежат в
одной плоскости.
1.2.1. Прямая. Одна из аксиом
евклидовой геометрии гласит, что через две точки
можно провести прямую, и притом только
одну. Значит, каждая прямая может быть
задана однозначно двумя своими точками. Две
прямые, имеющие только одну общую точку,
называют пересекающимися. Через заданную
точку А , не лежащую на данной прямой / ,
можно провести, и притом единственную,
прямую /', не пересекающуюся с / (пятый
О О А
в) I)
Рис. 1.2.1
постулат Евклида). Прямую /' называют
параллельной прямой / (при этом и /
параллельна /', т.е. отношение параллельности
симметрично).
Две точки А и В определяют, с одной
стороны, прямую, проходящую через них, а с
другой, — множество точек этой прямой,
лежащих между А и В , которое называют
отрезком и обозначают АВ . Точки А и В
— это концевые точки отрезка АВ (или
просто концы отрезка). Они принадлежат отрезку.
Перемещая отрезки по плоскости, их можно
сравнивать между собой: два отрезка можно
разместить на плоскости так, что один станет
частью другого и, следовательно, первый
будет меньше второго. Используя некоторый
фиксированный отрезок как эталон, можно
ввести понятие длины отрезка, определяющее
число эталонных отрезков, размещаемое на
данном отрезке.
Зафиксированная на прямой точка делит
прямую на две полупрямые (два луча),
являющиеся конгруэнтными. Эта точка является
началом каждого из лучей и принадлежит
каждому из них. Аналогично, каждая прямая
делит плоскость на две полуплоскости, являясь
их общей частью и границей.
1.2.2. Расстояние. Каждым двум
точкам А и В соответствует неотрицательное
число, называемое расстоянием от А до В и
обозначаемое \АВ\, причем \АВ\ > О , если
точки различны (А Ф В), и \АВ\ = О , если
они совпадают (А = В). Для любых двух
точек А и В \АВ\ = \ВА\. Для любых трех
точек А, В, С \АС\<\АВ\+\ВС\
(неравенство треугольника). Расстояние от
точки А до точки В совпадает с длиной
отрезка АВ.
1.2.3. Угол. Два различных луча О А и
ОВ с общим началом в точке О (рис. 1.2.1,
а) разделяют плоскость на два угла, являясь их
общей границей и общей частью. При этом
точку О называют вершиной угла, лучи ОА и
О В — его сторонами. Один из двух углов
можно выбрать, указав его внутреннюю точку,
не лежащую на одной из сторон. Выбранный
угол отмечают на рисунке одной или
несколькими дугами, соединяющими стороны
угла, и обозначают ZAOB. Иногда под углом
понимают объединение только двух различных
лучей с общим началом.
Как и отрезки, углы можно сравнивать,
используя перемещение по плоскости. Конгру-
МНОГОУГОЛЬНИК
27
энтные углы называют также равными.
Неравные углы можно совместить так, что один
станет частью другого. Тогда первый из них
будет меньше второго.
Угол, стороны которого составляют одну
прямую, называют развернутым (7 на рис.
1.2.1, б). Он является полуплоскостью с
отмеченной на границе точкой О (вершиной
угла). Если два угла имеют общую сторону,
причем расположены по разные стороны от
общей стороны, то их называют прилежащими
(например, углы 2 и 3 на рис. 1.2.1, б). В
частном случае, когда внешние
(несовпадающие) стороны прилежащих углов
лежат на одной прямой, получаем смежные
углы (2 и 4 на рис. 1.2.1, б). Объединение
прилежащих углов дает угол, являющийся
суммой этих углов. Он больше каждого из
прилежащих, а каждый из прилежащих
меньше их суммы. Один из прилежащих углов
равен разности их объединения и второго
угла.
Луч, выходящий из вершины угла и
делящий его на два равных угла, называют бис-
сектрисой этого угла (луч ОА на рис. 1.2.1, в
— биссектриса угла 3). Биссектриса
развернутого угла делит его на два прямых угла (углы 1
и 2 на рис. 1.2.1, г). Сумма двух прямых углов
равна развернутому. Стороны ОА и ОВ
прямого угла взаимно перпендикулярны. Угол,
меньший прямого, называют острым, а
больший прямого, но меньший развернутого, —
тупым (например, углы 2 и 4 на рис. 1.2.1, б).
Образующиеся при пересечении прямых
пары углов (рис. 1.2.2) называют: 1 и 3, 2 и 4,
5 и 7, 6 и 8 — вертикальными (они попарно
Рис. 1.2.2
Рис. 1.2.3
равны); /и 5, 2 и 6, 4 и 8, 3 и 7 —
соответственными; 4 и 5, 3 и 6 — внутренними одно-
сторонними; 1 и 8, 2 и 7 — внешними
односторонними; 3 и 5, 4 и 6 — внутренними накрест
лежащими; 1 и 7, 2 и 8 — внешними накрест
лежащими. При пересечении прямой
параллельных прямых (рис. 1.2.3) наряду с
вертикальными равны попарно соответственные,
внутренние и внешние накрест лежащие, а
пары внутренних и внешних односторонних в
сумме равны двум прямым. На рисунке
равные углы обычно отмечают одинаковым
количеством дуг, соединяющих их стороны (см.
рис. 1.2.2), или одинаковым количеством
штрихов на таких дугах (см. рис. 1.2.3).
1.2.4. Многоугольник. Объединив
отрезки AqA\, А[А2,...,Ап_[Ап , получим
геометрическую фигуру, называемую ломаной.
Составляющие ломаную отрезки — это ее звенья,
точки Aq,A[,...,A,j — ее вершины, крайние
вершины Aq и Ап — ее концы. Ломаную
называют простой, если ее соседние звенья не
лежат на одной прямой, а несоседние не
имеют общих точек. Если концы Aq и Ап
простой ломаной при п > 2 совпадают, то ее
называют простой замкнутой ломаной (рис.
1.2.4). Она выделяет на плоскости
ограниченную область, называемую (вместе с самой
ломаной) многоугольником. При этом
вершины ломаной называют вершинами
многоугольника, а звенья — его сторонами. Длины сторон
многоугольника в сумме составляют его
периметр. Отрезок, соединяющий любые две
несоседние вершины многоугольника, именуют
его диагональю. Конгруэнтные многоугольники
считают равными.
Выбрав вершину многоугольника и
примыкающие к ней две его стороны, можно
построить угол с вершиной в вершине
многоугольника и сторонами, являющимися
продолжением сторон многоугольника. Такой
угол называют внутренним углом
многоугольника. По количеству вершин (или углов)
различают треугольники (см. 1.2.6),
четырехугольники (см. 1.2.7) и, вообще, п -угольники.
Сумма внутренних углов п -угольника равна
2 (лг — 2) прямым углам.
Если отрезок, соединяющий две
произвольные внутренние точки многоугольника,
лежит внутри этого многоугольника, то
многоугольник называют выпуклым. Выпуклый
многоугольник является пересечением его
внутренних углов. Если все внутренние углы
многоугольника равные, то многоугольник
является выпуклым. Многоугольник, у
которого равны все внутренние углы и равны все
его стороны, называют правильным.
28
Глава 1.2. ПЛАНИМЕТРИЯ
Рис. 1.2.4
В общем случае рассматривают
многоугольники, образованные произвольными
замкнутыми ломаными, несоседние звенья
которых имеют общие точки, т.е.
пересекаются. Такие многоугольники называют
самопересекающимися. Они не являются выпуклыми.
Ж)
Рис. 1.2.5
М
Рис. 1.2.6
1.2.5. Окружность и круг.
Окружностью называют множество точек плоскости,
удаленных от заданной точки плоскости
(центра окружности О ) на одинаковое
расстояние R , называемое радиусом окружности
(рис. 1.2.5, а). Радиусом также называют
отрезок, соединяющий центр с любой точкой
окружности. Любую часть окружности
именуют ее дугой. Объединение окружности и
ограниченной ею части плоскости называют
кругом. Взаимное расположение двух
окружностей с радиусами R и /*(/?>/*) зависит от
расстояния Я между их центрами. Если
R + r < Я или R-r>H (рис. 1.2.5, б и в),
то окружности не пересекаются. При
R + г = Н касание окружностей внешнее, а
при R - г = Я — внутреннее (рис. 1.2.5, г и
д). Если R-r < Н < R + r (рис. 1.2.5, е), то
окружности пересекаются (имеют две общие
точки). Окружности с общим центром
(Я = 0) называют концентрическими (рис.
1.2.5, ж). При R = г такие окружности
совпадают.
Отрезок, соединяющий две различные
точки окружности, называют хордой, а хорду,
проходящую через центр окружности —
диаметром. У пересекающихся в точке А хорд
(рис. 1.2.6) |^В|.|>4Д|=|>4С|-|у4£| = Л2-|а4|2.
Прямую, для которой хорда является
отрезком, называют секущей. Она пересекает
окружность в двух точках. Прямую, имеющую с
окружностью одну общую точку, называют
касательной к окружности. Для
пересекающихся в точке А секущих и касательных
(рис. 1.2.7) \АЩ • \АВ\ = \АС\ • \АЕ\ = \АТ\2 =
= \AP\2=\OA\2-R2.
Центральным называют угол,
ограниченный двумя лучами с общим началом в центре
О окружности, а вписанным — угол,
ограниченный лучами, включающими хорды с
общим концом. Опирающийся на дугу АСЕ
окружности центральный угол а = 2(3 , где (3 —
любой вписанный угол, опирающийся на ту
же дугу (рис. 1.2.8). Опирающийся на дугу
EDT центральный угол 8 = 2у, где у —
угол между хордой ТВ и касательной к
окружности в точке Т . Диаметр и касательная,
имеющие общую точку, перпендикулярны.
Угол у между пересекающимися хордами
(см. рис. 1.2.6) равен полусумме центральных
углов аир, опирающихся соответственно
на дуги EFC и DME , т.е. у = (а + р)/2 .
ОКРУЖНОСТЬ И КРУГ
29
Таблица 1.2.1
п
3
4
5
6
7
8
9
10
12
15
16
20
24
32
48
64
a'/R
1,7321
1,4142
1,1756
1,0000
0,8678
0,7654
0,6840
0,6180
0,5176
0,4158
0,3902
0,3129
0,2611
0,1960
0,1308
0,0981
a/R
3,4641
2,0000
1,4531
1,1547
0,9631
0,8284
0,7279
0,6498
0,5359
0,4251
0,3978
0,3168
0,2633
0,1970
0,1311
0,0983
а'/а*
0,5000
0,7071
0,8090
0,8660
0,9010
0,9239
0,9397
0,9511
0,9659
0,9781
0,9808
0,9877
0,9914
0,9952
0,9979
0,9988
S'/R2
1,2990
2,0000
2,3776
2,5981
2,7364
2,8284
2,8925
2,9389
3,0000
3,0505
3,0615
3,0902
3,1058
3,1214
3,1326
3,1366
S"/R2
5,1962
4,0000
3,6327
3,4641
3,3710
3,3137
3,2757
3,2492
3,2154
3,1883
3,1826
3,1677
3,1597
3,1517
3,1461
3,1441
S'/a'2
0,4330
1,0000
1,7205
2,5981
3,6339
4,8284
6,1818
7,6942
11,196
17,642
20,109
31,569
45,575
81,225
183,08
325,69
Диаметр, пересекающий хорду в ее середине,
перпендикулярен к ней. Для углов,
образованных пересекающимися секущими и
касательными (см. рис. 1.2.7), справедливы
соотношения а = (а - а')/2, р = (р" - р')/2,
Y = (у' - У )/2 •
Если все вершины многоугольника
принадлежат одной окружности, то ее называют
описанной (вокруг многоугольника), а его —
вписанным (в окружность). Наоборот, если все
стороны многоугольника касаются одной
окружности, то ее называют вписанной (в
многоугольник), а его — описанным (вокруг
окружности). Любой правильный многоугольник
может быть как вписанным, так и описанным.
Длина 2кЯ окружности радиуса R и площадь
nR ограниченного ею круга больше
соответственно периметра Р' и площади S' любого
вписанного в нее многоугольника и меньше
периметра Р* и площади S* любого
описанного около нее многоугольника.
Отношение длины окружности к ее диаметру не
зависит от выбора окружности и является тран-
цендентным числом, обозначаемым я и с
точностью до 5 • 10 равным 3,14159. В табл.
1.2.1 даны значения некоторых характерных
отношений для окружности, вписанного и
описанного правильных п -угольников,
причем через а', S' и а", S" обозначены
соответственно длины их сторон и площади.
В качестве единицы измерения углов
используют радиан, соответствующий центральному
углу, опирающемуся на дугу, длина которой
равна радиусу окружности. При этом
развернутый угол равен к , прямой — к/2 , а полный
центральный — 2я. Наряду с радиан ной
мерой иногда используют градусную меру,
принимая за единицу измерения 1/90 часть
прямого угла, называемую (угловым) градусом
и обозначаемую символом °. Градус делят на
60 (угловых) минут, минуту — на 60 (угловых)
секунд и используют обозначения
Г = 60' = 3600*. Тогда прямой угол
я/2 = 90°, развернутый к = 180° и полный
2 я = 360°. В градусной мере иногда
измеряют дуги окружностей.
Рис. 1.2.8
30
Глава 1.2. ПЛАНИМЕТРИЯ
Рис. 1.2.9
Рис. 1.2.10
Пересечение центрального угла а (в
радианах) и круга радиусом R образует сектор
круга с длиной дуги aR и площадью aR /2.
Любая хорда делит круг на два сегмента,
заштрихованные на рис. 1.2.9 в разные стороны
и имеющие дуги АСЕ и BDA длиной
соответственно aR и (2я - a) R . Длина хорды
2а, высота сегмента {стрела его дуги) h и
радиус круга R связаны соотношением
Площадь сегмента равна
или приближенно
(при малых h/a) Ah I Ъа + 2Ып2 + а2 \\ 5 .
При малых h/a длина дуги сегмента
приближенно равна 2yja2 + Ah /3 или
2Ujh2+a2 -fll/3.
Область, заключенную между двумя
концентрическими окружностями (включая
сами окружности) с радиусами R иг,
R > г (рис. 1.2.10) именуют круговым
кольцом. Оно имеет внешний D = 2R и
внутренний d = 2r диаметры, средний радиус
р = (R + г)/2 , ширину 5 = R - г и площадь
5 = 2яр6 = я(7?2-г2) = я(/)2-^2)/4.
Пересечение кольца и центрального угла а
образует сектор кольца площадью
<хр5 = ос(Д2 - r2)/2 = <x(Z)2 - d2)}k .
1.2.6. Треугольник. Любой треугольник
(рис. 1.2.11) является выпуклым
многоугольником. Длины а,Ь, с его сторон удовлетворяют
неравенству треугольника: каждая сторона
больше разности двух других сторон. Сумма
его внутренних углов а + Р + у = к (радиан),
т.е. равна развернутому углу (или двум прямым
углам). Треугольник определен, если задан
один из следующих наборов его элементов:
три стороны, удовлетворяющие неравенству
треугольника; две стороны и угол между
ними, меньший развернутого; сторона и два
прилежащих к ней угла, сумма которых
меньше развернутого. Различают
остроугольные (все углы острые), прямоугольные (один
угол прямой) и тупоугольные (один угол
тупой), равносторонние (правильные) и
равнобедренные (две стороны равны) треугольники. В
треугольнике против меньшего угла лежит
меньшая сторона, и наоборот.
Равными являются треугольники с
равными соответственными сторонами и углами.
Треугольники равны, если у них попарно
равны элементы в указанных выше наборах,
определяющих треугольник. Подобными
являются треугольники с пропорциональными
соответственными сторонами и равными
углами между пропорциональными сторонами.
Для подобия треугольников необходимо и
достаточно либо пропорциональности
соответственных сторон, либо попарного
равенства двух соответственных углов, либо
пропорциональности двух соответственных сторон и
равенства углов между ними.
Отрезок прямой, соединяющий вершину
треугольника с серединой противолежащей
стороны, называют медианой. Длина
проведенной к стороне а (см. рис. 1.2.11) медианы
^(»!«г
н/
2 . Три медианы
пересекаются в одной точке, называемой центроидом.
Она делит каждую медиану в отношении
2:1, считая от вершины. Высотой называют
отрезок (иногда — его длину) перпендикуляра,
ЧЕТЫРЕХУГОЛЬНИК
31
опущенного из вершины треугольника на
противолежащую сторону или ее
продолжение. Высоты треугольника пересекаются в
одной точке, называемой его ортоцентром.
Биссектрисы углов треугольника пересекаются
в одной точке, являющейся центром
вписанной окружности. Длина отрезка биссектрисы
угла а до пересечения с противолежащей
стороной Abe Ub + с) - я2) /(Ь + с). Центр
описанной окружности находится в точке
пересечения перпендикуляров к серединам
сторон треугольника и лежит на одной прямой с
центроидом и ортоцентром, называемой
прямой Эйлера. Медиана, высота и биссектриса,
исходящие из одной вершины, совпадают,
если прилегающие стороны равны. Для
равностороннего треугольника совпадают центры
вписанной и описанной окружностей,
центроид и ортоцентр. Отрезок, соединяющий
середины двух сторон, называют средней
линией треугольника. Она равна половине третьей
стороны и параллельна ей.
Если угол у прямой (рис. 1.2.12), то
стороны а и b называют катетами, а сто-
9 9 9
рону с — гипотенузой, причем а + b = с
(теорема Пифагора), а = qc,b ~ sc,h = qs
и S = ab/2 = Ас/2 . Центроид треугольника
является его центром тяжести, а центром
тяжести совокупности его сторон является
центр окружности, вписанной в треугольник,
вершинами которого будут середины сторон
данного треугольника.
1.2.7. Четырехугольник. Для любого
четырехугольника (рис. 1.2.13) сумма
внутренних углов а + р + у+5 = 2гс и a2 +t? +C2 +d2 =
2 2 2
= и +v +1 , где t — отрезок,
соединяющий середины диагоналей и и v . В
четырехугольник можно вписать окружность тогда и
только тогда, когда а + с = b + d . Описать
окружность около четырехугольника можно
тогда и только тогда, когда а + у = (3 + 5 . Для
такого четырехугольника ас + bd = uv и
площадь
s = yJ(P ~ a){P - Ь){р - с)(р - d) , где
p = (a + b + c + d)/2 — половина его
периметра.
Среди четырехугольников различают
параллелограмм, ромб, прямоугольник, квадрат,
трапецию. У параллелограмма
противоположные стороны равны [a = c,b = d) и
параллельны, диагонали в точке пересечения
делятся пополам (t = 0), противоположные углы
Рис. 1.2.12
Рис. 1.2.13
равны. Параллелограмм будет ромбом, если
он обладает любым из равносильных свойств:
равенство всех сторон; перпендикулярность
диагоналей; диагонали являются
биссектрисами углов. Прямоугольник - это
параллелограмм, у которого все углы равны между
собой и равны прямому, что равносильно
равенству диагоналей \ и = v = у/а + b . Его
площадь равна ab. Равносторонний
прямоугольник является квадратом (правильным
четырехугольником). Для него
и = v2 ~ 1,414а и площадь S = а - и /2 .
Трапеция — это четырехугольник, у
которого параллельны лишь две стороны а и
с, называемые ее основаниями (рис. 1.2.14).
Если b = d , то трапецию именуют
равнобочной. Площадь трапеции S = qh = [а + с) Л/2
(А — ее высота и q = (а + с)/2 — средняя
линия - отрезок прямой, соединяющий
середины непараллельных сторон).
С
а
Рис. 1.2.14
32
Глава 1.3. ТРИГОНОМЕТРИЯ
Глава 1.3
ТРИГОНОМЕТРИЯ
1.3.1. Значения тригонометрических
функций. Рассмотрим на плоскости декартову
прямоугольную систему координат хОу с
началом в точке Q и окружность с центром Q
и радиусом 1. Отложив на окружности от
точки Z)(l;0) на оси абсцисс в положительном
направлении (т.е. против хода часовой
стрелки) дугу длины а , получим точку А —
конец этой дуги. Длина этой дуги равна
величине центрального угла ZDOA , измеренного в
радианах (рис. 1.3.1). Если а - отрицатель- -> „,
длины отрезков: В А = sin a ,
ное число, то дугу длины |а| откладывают по ^ _ t gp _ ct qq
ходу часовой стрелки. Проекции точки А на
оси абсцисс и ординат называют
соответственно косинусом и синусом числа а (угла а)
и обозначают cos а и sin а . На их основе
можно определить: тангенс tga = sin a/cos a
при a Ф я/2 + kn; котангенс
Рис. 1.3.1
OB = cos a ,
sec a и
OF = coseca.
Значения тригонометрических функций
используют для выражения соотношений
между элементами треугольников и
многоугольников. В частности, в прямоугольном треугольнике
с углом а (см. рис. 1.2.12) значениям этих
функций соответствуют отношения:
ctga = cos a/sin a при a ф kn ; секанс sin a = а/с, cos a = b/c, tga = a/b, ctga = b/a,
sec a = 1/cos a при а.Фп/2 + kn и косеканс sec a = c/b, coseca = с/а . Приставка "ко" в
coseca = 1/sin a при а±кк, где слове "косинус" означает, что косинус угла a
к = 0,±1,±2,... - целые числа (к е Z) . Также является синусом угла р = к/2 - a , дополни-
называют и обозначают тригонометрические тельного к а до прямого угла я/2 ; аналогич-
функции переменного угла. Для острого угла но для котангенса и тангенса, косеканса и
а(0<а<я/2) значениям тригонометриче- секанса. Верно и обратное: синус является
косинусом дополнительного угла и т.д. Таким
ских функций на рис. 1.3.1 соответствуют образом,
cos a = sin (я/2 -a), sin a = cos (я/2-a), ctga = tg^/2-a),
tga = ctg^/2-a), coseca = sec (я/2 -a), sec a = со5ес(я/2- a).
(1.3.1)
В прямоугольном треугольнике угол а
является острым, но (1.3.1) справедливы для
любого угла, в том числе,
При смене знака угла
отрицательного.
sin (-a) = -sin a, cos (-a) = cos a, tg(-a) = -tga,
ctg (-a) = -ctga, sec (-a) = sec a, cosec (-a) = -coseca.
Значения тригонометрических функций a , при которых определены слагаемые и
связаны соотношениями (для значений угла сомножители и не равен нулю знаменатель):
sin2 a + cos2 a = 1, tga- ctga = 1, sin a • coseca = 1, cos a seca = l,
i tga =
sin a
cos a ctga
sec a =
1 = 1 + tg2a,
cos a 1
ctga = -^ = -—,
tga
1
sin a
(1.3.2)
cos2 a
cosec a =
sin2 a
1 + ctg~a.
ЗНАЧЕНИЯ ТРИГОНОМЕТРИЧЕСКИХ ФУНКЦИЙ
33
Использование на практике значений секанса
и косеканса ограничено, поскольку их
значения легко выразить через значения косинуса
и синуса. В табл. 1.3.1 приведены значения
тригонометрических величин для некоторых
характерных значений угла а .
Таблица 1.3.1
а
рад
sin а
cos а
tga
ctga
0
0°
0
1
0
-
я/9
20°
-0,3420
-0,9397
-0,3640
-2,7475
л/6
30й
1/2
V3/2-0,8660
V3/3-0,5774
V3-1,7322
л/4
45°
V2/2-0,7071
л/2/2 «0,7071
1
1
л/3
60°
7з/2-0,8660
1/2
л/3 « 1,7322
73/3-0,5774
л/2
90°
1
0
-
0
Острый угол а соответствует
положению точки А на окружности единичного
радиуса в 1 четверти плоскости (1 квадранте)
(см. рис. 1.3.1). Для угла у > л/2 абсолютные
значения тригонометрических величин также
могут быть представлены длинами отрезков.
Но знак этих величин зависит от того, какой
четверти соответствует угол у (табл. 1.3.2),
учитывая, что отличие у на угол 2пк (к е Z)
не изменяет значений тригонометрических
величин. Чтобы выразить значения
тригонометрических величин, соответствующих II, III
и IV четвертям, через их значения для I
четверти (0 < a < л/2), используют формулы
приведения (табл. 1.3.3).
Таблица 1.3.2
Четверть
1
11
III
IV
Интервал изменения угла у
2кк < у < л/2 + 2пк
л/2 + 2пк < у < л + 2пк
л + 2кк < у < Зл/2 + 2кк
Зл/2 + 2кк < у < 2л + 2кк
sin у
+
+
-
-
cosy
+
-
-
+
tgy
+
-
+
-
ctgy
+
-
+
-
Таблица 1.3.3
Четверть
Угол у
sin у
cosy
tgy
ctgy
I
л/2-a
cos a
sin a
ctga
tga
II
л/2 + a
cos a
- sin a
-ctga
-tga
л-а
sin a
cos a
tga
ctga
in
л + а
- sin a
-cos a
tga
ctga
3 л/2 - а
-cos a
- sin a
ctga
tga
IV
3 л/2 + а
-cos a
sin a
-ctga
-tga
2л-a
-sin a
cos a
-tga
-ctga
Таким образом, для любого значения у
по табл. 1.3.2 можно найти соответствующую
ему четверть, по табл. 1.3.3 подобрать
значение а и выразить искомую
тригонометрическую величину для угла у через
указанную в табл. 1.3.3 тригонометрическую
величину для угла а из I четверти. Из j(1.3.l) и
(1.3.2) следует, что для конкретного
значения а (или дополнительного к нему до
л/2) достаточно располагать табличным или
вычисленным значением лишь одной из
тригонометрических величин (например,
синуса), а остальные можно выразить через
нее (табл. 1.3.4).
Если задано значение
тригонометрической величины, то для однозначного
определения соответствующего этому значению угла
необходимо задать и четверть (квадрант)
плоскости.
2 - 7706
34
Глава 1.3. ТРИГОНОМЕТРИЯ
Таблица 1.3.4
величина
sin a
cos а
tga
ctga
Величина с известным значением
sin a
sin a
VI - sin2 a
1/Vl/sin2 a -1
yjl/sm2 a -1
cos a
VI - cos2 a
cos a
т/l/cos2 a -1
l/Vl/cos2 a -1
tga
l/V1 + !/tg2a
l/Vl + tg2a
tga
l/tga
ctga
\/yj\ + ctg2a
l/Vl + l/ctg2a
1/ctga
ctga
1.3.2. Тригонометрические соотноше- лов и кратных углов используют формулы
ния. При вычислении значений тригономет- <ПРИ Условии, что определены слагаемые и
рических величин для суммы и разности уг- сомножители и не равен нулю знаменатель):
sin (a + Р) = sin a cos p + cos a • sin p, cos (a + P) = cos a ■ cos p - sin a sin p,
tefaiB)- tga + tgP = ^eHctga = 1
&v V) l-tgatgp ctgactgp-l ctg(a + p)'
sin 2a = 2 sin a cos a = 2 (tga)/(l + tg2a),
cos 2a = cos2 a - sin2 a = 1 - 2sin2 a = 2 cos2 a - 1 = (l - tg2a)/(l + tg2a),
, ~ 2tga 2 2ctga 1
tg2a = =-=— = = —^— = ——-;
1-tg^a ctga-tga ctg2a-l ctg2a
sin 3a = (З - 4 sin2 a jsin a, cos 3a = (4 cos2 a - 3) cos a,
4 - 3tga-tg3a 3ctg2a-l 1
tg3a = 5— = —r-s = ——;
1 - 3tg2a ctgJa - 3ctga ctg3a
sin 4a = 4 {l cos2 a - ljsin a • cos a = 4 (l - 2 sin2 a) sin a cos a,
cos 4a = 8 cos4 a - 8 cos2 a +1,
tg4a = 4 j
1 - tg2a _^ ctg2a-l _ 1
1 - 6tg2a + tg4a ctg4a - 6ctg2a +1 ctg4a
cos(2fl + l)a =
Из формулы Муавра при натуральных
числах /i = l,2,...(/i€ N) для кратных углов
(-1) (-2,7+1 cos v ' a ■ sin a,
fc=o
cos 2na =
sin 2яа =
= X(-l)AC22*cos2("-A:)asin2*a,
*=0
= £ (-1)*+1 Ctf~l cos2*"-^1 a • sin2*"' a,
ТРИГОНОМЕТРИЧЕСКИЕ СООТНОШЕНИЯ
35
sin(2w+ l)oc =
= £ (-if*1 C\kn;l cos2^"*) a • sin2*+l а,
к=0
где Ст — количество сочетаний из т
элементов по к , причем CJJ = С/" = 1, /яеМ
(см. 2.1.7).
В соотношениях для половинного угла
выбор знака зависит от того, какой четверти
соответствует угол Р/2:
sin(p/2) = ±>/(l-cosp)/2,
cos(p/2) = ±70 + cosp)/2,
1-cosp 1
ship ~ctg(p/2)'
При вычислении интегралов от рациональных
функций тригонометрических аргументов
полезны соотношения:
sin Р:
2tg(P/2)
l + tg2(p/2)'
cosp = ~ -,
1 + tg2 (p/2)
tgp =
2tg(P/2) 1
1 - tg2 (p/2) ctgp'
*!=*£
cosp _ sinp
cos p 1 + cos p
. A . Q . . a±p a±p
sina±sinp = 2 sin -cos -,
2 2
Для суммы, разности, произведения и
степени тригонометрических величин
используют формулы:
Q ~ a + P a-P
cosa + cosp = 2cos——^ cos —
cos a ± sin a
л
= sin
— ±a =cos —+ a , cosa-cosP = 2sin -•
4 J I4 J 2
sin
sin(a±p) 0 cos (a + P)
tga±tgp = i Ц-, ctga ± tgp = -7—^ Ц, ctga±ctgp:
2 '
p-a
2 '
sin(p±a)
cos a • cos p' ° or sin a • cos P' sin a • sin P'
2 sin a • sin p = cos (a - P) - cos (a + p), 2 cos a • cos p = cos (a - P) + cos (a + p),
2 sin a • cos P = sin (a + p) + sin (a - P), sin (a + P) • sin (a - p) = cos2 p - cos2 a,
cos (a + P) • cos (a - p) = cos2 p - sin2 a = cos2 a - sin2 p,
tga + tgp _ tgp-tga _ 1
tga • tgp =
ctga + ctgP ctga - ctgp ctga • ctgP'
tga + ctgp ctgp - tga 1_
tga • ctgp ,
ctga + tgp ctga - tgp ctga • tgP
4 sin a • sin p • sin у - sin (a + p - y) + sin (P + у - a) + sin (y + a - P) - sin (a + p + y),
4 sin a • cos P • cos у = sin (a + p - y) - sin (P + у - a) + sin (y + a - p) + sin (a + P + y),
4 sin a • sin P • cos у = cos (p + у - a) + cos (y + a - p) - cos (a + p - y) - cos (a + P + y),
4 cos a • cos p • cos у = cos (a + p»- y) + cos (p + у - a) + cos (y + a - p) + cos (a + P + y);
2 sin2 a = 1 - cos 2a, 4 sin3 a = 3 sin a - sin 3a, 8 sin4 a = cos 4a - 4 cos 2a + 3,
2 cos2 a = 1 + cos 2a, 4 cos3 a = 3 cos a + cos 3a, 8 cos4 a = cos 4a + 4 cos 2a + 3.
36
Глава 1.3. ТРИГОНОМЕТРИЯ
1.3.3. Решение треугольников. Под
решением треугольника понимают
вычисление всех его элементов по заданным
значениям какого-либо набора элементов, который
однозначно определяет этот треугольник (см.
1.2.6). При этом используют соотношения
(см. рис. 1.2.11): а+Р+у=л; fl/sina = £/sinp =
= c/sin у =1R (теорема синусов), где R —
радиус описанной окружности, и теорему
косинусов
с2 = а2 + b2 - lab cos у. (1.3.4)
Остальные соотношения следуют из (1.3.4)
циклической перестановкой сторон
а —> b —> с —> а и углов a —> Р —> у —> a.
Если заданы три стороны треугольника,
то из (1.3.4) находят косинусы всех углов по
формулам вида cosy = (a2+b2-c2)l{2ab),
что позволяет вычислить значения всех углов
треугольника.
Пусть заданы две стороны а и b и угол
у между ними. Тогда при помощи (1.3.4)
находят с = у я2 + b2 - lab cos у и
cos a = (b2 + с2 - a2)/(lbc), вычисляют а и
затем Р = л - a - у.
Если задана сторона с и два
прилежащих к ней угла а и Р, то вычисляют третий
угол у = л - a - Р и затем по теореме
синусов находят стороны а - (csina)/siny и
b = (с sin P)/sin у.
Рис. 1.3.2
Если задать две стороны и угол,
противолежащий одной из них, например, а,Ь и
a , то при л/2 < a < л решение существует,
когда а > b (так как a > Р , против большего
угла должна лежать большая сторона, см.
1.2.6) (рис. 1.3.2, а), а при a < к/2 — когда
а > £sina (рис. 1.3.2, б). Тогда с учетом
теоремы синусов ship = [bsino)ja < 1 и при
a > л/2 имеем Р < л/2 , у=л-а-р,аиз
теоремы синусов с = (a sin y)/sin a . При
a < л/2 возможны различные случаи: 1)
а = b — равнобедренный треугольник
определен однозначно, причем ос = Р, у = л-2а и
из теоремы синусов
с = (b sin y)/sin P = lb cos а (при а = л/3
cos a = 1/2 (см. табл. 1.3.1), т.е. треугольник
равносторонний); 2) 0 = £sina — решение
единственно, причем Р = л/2 , у = л/2 - а и
с = b cos a = yjb - a — треугольник
прямоугольный; 3) a > b — поскольку a > P
(против меньшей стороны лежит меньший
угол), решение единственно (Р < л/2),
с - a cos p + £cosa и у = л-а-Р; 4)
b > а > b sin a - имеют смысл два значения
Р, соответствующие значению
sinp = (£sina)/tf: р, < л/2 (I четверть) и
Р2 > л/2 (II четверть), причем Pj + Р2 = л ;
каждому из двух значений Р отвечает
треугольник, для которого сиу находят как и
в предыдущем случае.
После определения всех сторон и углов
треугольника радиус R описанной
окружности находят по теореме синусов, а остальные
элементы — из соотношений для площади
треугольника
S = у]р(Р -а)(р - Ь)(р -с) =
abc ab .
где р = (д + b + c]jl — половина периметра
треугольника, г — радиус вписанной
окружности. Расстояние между центрами описанной и
вписанной окружностей равно ^R(R- lr) ,
а медиана та и высота hQ на сторону а и
длина 1а отрезка биссектрисы угла а равны
ПРЯМЫЕ И ПЛОСКОСТИ В ПРОСТРАНСТВЕ
37
та = —jl(b2 + с2\-а2 =—yjb2 +c2 + 2bccosa, ha = bs'm y = csinp = 2 — ,
bc((b + cf-S) ^ ba
b+c b+a
Эти формулы справедливы при циклической
перестановке я, Ь, с и соответственно а, Р, у.
К решению треугольников сводят
вычисление элементов многих геометрических
фигур. В частности, правильный многоугольник
(я -угольник) со стороной а можно разбить
на п равнобедренных треугольников с
основанием а и противолежащим углом
а = 2 л/я . Тогда прилежащие к основанию
равные углы р = у = л (1/2 - 1/я) , а равные
стороны b = с = aj(2 sin P) = а/(2 cos (л/я))
соответствуют радиусу описанной около
многоугольника окружности. Высота
я = {a/2) tgP = (a/2) ctg (к/п) треугольника
соответствует радиусу вписанной в
многоугольник окружности. Площадь треугольника
ah/2 = (a /4j ctg (л/я) в я раз меньше
площади многоугольника. Числовые значения
даны в табл. 1.2.1.
у ~ са Р
cos— = 2 cos~.
? с + а 2
Глава 1.4
СТЕРЕОМЕТРИЯ
Часть элементарной (евклидовой)
геометрии, связанную с изучением свойств и
взаимного расположения геометрических фигур в
геометрическом пространстве, называют
стереометрией. В стереометрии для плоских
фигур справедливы свойства, известные из
планиметрии.
1.4.1. Прямые и плоскости в
пространстве. Через любые две различные точки
геометрического пространства \проходит одна
и только одна прямая. Прямая лежит в
заданной плоскости, если имеет с ней две
различные общие точки. Три различные не лежащие
на одной прямой точки или прямая и не
лежащая на ней точка лежат в одной и только в
одной плоскости. Не имеющие общих-точек
или совпадающие плоскости называют
параллельными. Две плоскости или параллельны,
или пересекаются по прямой. Две различные
прямые, лежащие в одной плоскости, либо
имеют одну общую точку (пересекающиеся
прямые), либо не имеют ни одной общей
точки (параллельные прямые). Две
пересекающиеся или две различные параллельные прямые
лежат в одной и только в одной плоскости.
Две прямые (или плоскости), параллельные
третьей, параллельны.
Прямая, имеющая с плоскостью
единственную общую точку, пересекает плоскость.
Прямая параллельна плоскости, если она
лежит в плоскости или не имеет с ней общей
точки. Прямая, параллельная прямой,
лежащей в плоскости, параллельна этой
плоскости. Если в одной из пересекающихся
плоскостей лежит прямая, параллельная другой
плоскости, то линия пересечения плоскостей
и эта прямая параллельны. Плоскость
пересекает параллельные плоскости по
параллельным прямым.
Две непересекающиеся непараллельные
прямые называют скрещивающимися. Угол и
расстояние между ними определяют как угол
между параллельными им прямыми,
проходящими через одну точку, и как длину отрезка
прямой, пересекающей каждую из
скрещивающихся прямых под прямым углом. Прямые
скрещиваются, если одна из них лежит в
плоскости, а другая пересекает эту плоскость
в точке, не лежащей на первой прямой.
Прямую, перпендикулярную двум
пересекающимся прямым, лежащим в плоскости,
называют перпендикуляром (или
перпендикулярной) к этой плоскости. Плоскости,
имеющие общий перпендикуляр, параллельны.
Расстояние между ними равно длине отрезка,
отсекаемого ими на общем перпендикуляре.
Через каждую точку пространства проходит
только один перпендикуляр к данной
плоскости. Точку его пересечения с плоскостью
называют проекцией (ортогональной) этой точки
на данную плоскость. Точка пересечения
перпендикулярной к плоскости прямой с этой
плоскостью является проекцией любой точки
данной плоскости на эту прямую. Если
прямая пересекает плоскость и не
перпендикулярна к ней, то ее называют наклонной к этой
плоскости. Проекцией наклонной на
плоскость является прямая, проходящая через
точку пересечения наклонной с плоскостью и
проекцию на данную плоскость любой другой
точки этой наклонной. Углом между
наклонной и плоскостью называют угол между
наклонной и ее проекцией на данную
плоскость.
38
Глава 1.4. СТЕРЕОМЕТРИЯ
Рис. 1.4.1
1.4.2. Двугранные и многогранные
углы. Любая плоскость разбивает множество не
принадлежащих ей точек геометрического
пространства на две части. Объединение одной
из таких частей и этой плоскости называют
полупространством. Плоскость служит общей
границей двух полупространств. Пересечение
двух полупространств, границами которых
служат непараллельные плоскости, образует
двугранный угол (рис. 1.4.1). Он ограничен
двумя гранями — полуплоскостями Р п Q .
Линию ЛВ пересечения плоскостей
называют ребром двугранного угла. Пересечение
двугранного угла плоскостью,
перпендикулярной к его ребру, называют его линейным
углом (угол а на рис. 1.4.1). Им измеряют
величину двугранного угла, который может
быть острым, прямым или тупым. Две
пересекающиеся плоскости определяют в
пространстве 4 двугранных угла с общим ребром,
причем противолежащие двугранные углы
попарно равны, а сумма смежных (с общей гранью)
равна к. Величину меньшего из смежных
двугранных углов называют углом между
этими плоскостями. Если смежные углы равны
(каждый из них равен прямому), то плоскости
считают взаимно перпендикулярными.
Рис. 1.4.2
Если точка О не лежит в плоскости
некоторого многоугольника, то объединение всех
лучей с общим началом в этой точке,
пересекающих многоугольник, образует
многогранный угол с вершиной в точке О (рис. 1.4.2).
Лучи, проходящие через вершины
многоугольника, именуют ребрами многогранного
угла. Лучи, проходящие через каждую сторону
многоугольника, образуют его грань (или
плоский угол, меньший развернутого). Выпуклый
многогранный угол целиком лежит только в
одном из полупространств, ограниченных
плоскостью любой из его граней. Сумма
плоских углов любого выпуклого многогранного
угла меньше 2л. Любой трехгранный угол
выпуклый. Два многогранных угла равны
(конгруэнтны),.если их можно совместить так,
что при совпадении их вершин совпадают их
ребра и грани. При этом попарно равны
соответствующие плоские углы и двугранные углы
между соседними гранями.
1.4.3. Многогранники. Совокупность
конечного числа многоугольников такая, что
каждая сторона любого из них есть сторона
только одного другого и от любого из них
можно достичь каждого многоугольника,
последовательно пересекая эти общие стороны,
называют замкнутой многогранной
поверхностью. Объединение ее и части ограниченного
ей геометрического пространства именуют
многогранником, многоугольники, их стороны
и вершины — соответственно его гранями,
ребрами и вершинами. Отрезок, соединяющий
две вершины, не принадлежащие одной
грани, называют диагональю многогранника.
Выпуклым считают многогранник, который
целиком лежит по одну сторону от плоскости
любой его грани. Для него к + / - т = 2
(теорема Эйлера), где к,1 и т —
соответственно число вершин, граней и ребер.
Существует 5 правильных выпуклых
многогранников, у каждого из которых все
грани — равные правильные многоугольники и
многогранные углы при всех вершинах равны
(рис. 1.4.3, табл. 1.4.1). Куб и правильный
октаэдр (см. рис. 1.4.3, бив) дуальны
(переходят друг в друга), если центры тяжести
граней одного принять за вершины другого и
обратно. Также дуальны додекаэдр и икосаэдр
(см. рис. 1.4.3, г и д). Правильный тетраэдр
(см. рис. 1.4.3, а) дуален сам себе, а его
вершины совпадают с вершинами куба,
принадлежащими разным ребрам куба. Додекаэдр
также можно получить из куба построением
на гранях куба "крыш".
Призмой называют многогранник, две
грани которого являются лежащими в
параллельных плоскостях равными п -угольниками,
МНОГОГРАННИКИ
39
именуемыми ее основаниями, а остальные п
граней, называемые боковыми, —
параллелограммами. Если боковые грани
перпендикулярны к основаниям, то призма прямая (ее
боковые грани — прямоугольники), в
противном случае призма наклонная. Прямую призму
называют правильной, если ее основания —
правильные многоугольники. Ее объем
V = SI {S — площадь основания, / —
длина бокового ребра) и боковая
поверхность F^-pl (p — периметр основания).
У наклонной призмы V' - Sh- SqI, /5 =
= ph = PqI , где h — ее высота {расстояние
между основаниями), Sq и /?0 — площадь и
периметр сечения призмы плоскостью, под
прямым углом пересекающей все ее ребра
(или их продолжения). Для трехгранной
призмы, усеченной не параллельной
основанию плоскостью, V = S(jt и /5 = ptf , где
t = (а + b + с)/3 — среднее арифметическое
длин а,Ь,с боковых ребер. У п -гранной
призмы, усеченной не параллельно
основанию (рис. 1.4.4), V = Sss, F6=pQq (Ss -
площадь сечения призмы, перпендикулярного
к отрезку ВС длиной s между центрами
тяжести В и С оснований, q — среднее
арифметическое длин боковых ребер).
Рис. 1.4.3
Таблица 1.4.1
Название
многогранника
Тетраэдр
Куб
Октаэдр
Додекаэдр
Икосаэдр
к
4
8
6
20
12
/
4
6
8
12
20
т
6
12
12
30
30
R/a
>/б/4« 0,612
л/з/2-0,866
Л/2 - 0,707
j6(3 + V5)/4«
-1,401
^2(5 + 2V5)/4~
-0,951
r/a
л/б/l 2-0,204
1/2
l/л/б -0,408
^(5 + ll/V5)/8-
-0,964
(3 + >/5)V3/l2-
«0,756
v/a3
V2/l2-0,118
1
VI/З-0,471
(15 + 7л/5)/4-
-7,663
5(3 + V5)/l2-
-2,182
Параллелепипедом называют призму, у
которой основания — параллелограммы. Все
четыре диагонали параллелепипеда
пересекаются в одной точке, которая делит их
пополам. У прямоугольного параллелепипеда все
грани - прямоугольники, объем V = a be ,
полная поверхность F = 2 (cb + be + са) и
длина равных между собой диагоналей
d = yla2+b2+c' , где а,Ь,с — длины его
ребер. Прямоугольный параллелепипед с
равными ребрами (а = b = с) является кубом, у
которого V = а , F = 6а , d = у/За.
Многогранник, основанием которого
является п -угольник, а треугольные боковые
грани сходятся в одной вершине, называют
40
Глава 1.4. СТЕРЕОМЕТРИЯ
Рис. 1.4.4
Рис. 1.4.5
п -угольной пирамидой. Ее объем V = Sh/З,
где S — площадь основания, h — ее высота
(отрезок перпендикуляра, опущенного из
вершины на плоскость основания). Пирамиду
именуют правильной, если ее основание —
правильный многоугольник, а высота
соединяет вершину с его центром. При этом
площадь равных между собой боковых граней
равна flAfc/2, где а — сторона основания,
h$ — апофема (высота боковой грани).
Пересекающая пирамиду плоскость, параллельная
основанию, делит ее высоту и боковые ребра
на пропорциональные части. Часть пирамиды
между такой плоскостью и основанием
называют усеченной (рис. 1.4.5). Ее объем
(S + S0 +V^b)Ao =(' +а01а + {а0/а)2)щ/з,
где Л0 — ее высота (расстояние между
нижним основанием площадью S и верхним
основанием площадью Sq), а и %- две
соответственные стороны оснований. Боковые
грани правильной усеченной пирамиды
являются равными равнобочными трапециями.
1.4.4. Поверхности и тела,
образованные перемещением линий. Две
параллельные плоскости и пересекаемая ими
цилиндрическая поверхность с замкнутой направляющей
ограничивают тело, называемое цилиндром.
Призма является цилиндром, направляющая
которого — простая замкнутая ломаная.
Объем цилиндра V - Sh- SqI и его боковая
поверхность F§ = ph = p$l, где S, р и
Sq,Pq — площадь и периметр его основания
и сечения, перпендикулярного к образующей,
Ли/— высота цилиндра и длина отрезка
образующей между основаниями. Образующая
прямого цилиндра является перпендикуляром к
основанию, т.е. S = Sq,p = Pq и h-l. У
прямого кругового цилиндра в основании круг,
S = nR2, p = 2nR, V = nR2h, F6 = 2nRh и
полная поверхность F = 2kR(R + h), где
R - радиус круга. Для такого цилиндра,
усеченного не параллельной основанию
плоскостью (рис. 1.4.6), площадь сечения
S* = KRyJR2+(h[-h2f/4, V = kR2x
x(h{+h2)/2, F6=nR(h{+h2) и F = F6 +
+S + S* (Н^ и h2 ~~ наибольший и
наименьший отрезки образующей).
Прямую, проходящую через центры
оснований прямого кругового цилиндра,
называют его осью. Вращением вокруг оси двух
параллельных ей прямых, расположенных от
нее на расстояниях R и г , можно
образовать наружную и внутреннюю поверхности
цилиндрической трубы толщиной 5 = R - г и
средним радиусом р = (R + г)/2 .
Конус — тело, ограниченное плоскостью
и пересекаемой ею конической поверхностью с
замкнутой направляющей. Пирамида является
конусом, у которого направляющая —
простая замкнутая ломаная. Объем конуса
V = Sh/З , где -5* - площадь его основания и
И — его высота (отрезок перпендикуляра,
опущенного из вершины конуса на плоскость
основания). Прямой круговой конус имеет в
основании круг, а его высота соединяет
вершину с центром круга. При этом
V = nR Л/3 , боковая поверхность Fq = kRI
ПОВЕРХНОСТИ И ТЕЛА, ОБРАЗОВАННЫЕ ПЕРЕМЕЩЕНИЕМ ЛИНИЙ
41
Рис. 1.4.6
и полная поверхность F = kR (R + I), где R —
радиус круга и / = vR + И — отрезок
образующей между вершиной и основанием. Часть
конуса между пересекающей его плоскостью,
параллельной основанию, и основанием
называют усеченным (рис. 1.4.7). Для усеченного
прямого кругового конуса К = лх
х(д2+г2 +Rr)ho/3, F6=n(R + r)l0 и
F = Fq + k(R + r 1, где Hq — его высота
(расстояние между нижним основанием
радиусом R и верхним основанием радиусом
г )> 4) = v^o + (R ~ r) ~~ длина отрезка
образующей между основаниями. Не
параллельные основанию плоскости при
пересечении конуса образуют конические сечения.
Сферой называют множество точек
геометрического пространства, удаленных на
одинаковое расстояние {радиус сферы) от
одной точки, называемой центром сферы.
Диаметром сферы является отрезок, вырезаемый
ею на прямой, проходящей через центр
сферы. Сферу можно образовать вращением
окружности вокруг ее любого диаметра.
Поверхность сферы F = 4kR2 (R - радиус
сферы). Часть пространства, ограниченную
сферой и содержащую ее центр, называют
шаром. Его объем 2лЯ3/3 = FR/3. Сечение
сферы любой плоскостью является
окружностью. О сфере и плоскости говорят, что они
касаются, если они имеют одну и только одну
общую точку. Сф£ры с общим центром
называют концентрическими. Сферу именуют
описанной около многогранника, если ей
принадлежат все его вершины, и вписанной в него,
если она касается всех его граней. Для"
правильного выпуклого многогранника с длиной
Рис. 1.4.7
ребра а отношения R/a и г/а для радиусов
описанной (R) и вписанной (г)
концентрических сфер даны в табл. 1.4.1. Там же дано
отношение У/а3 для объема V такого
многогранника, как объединения равных
пирамид с высотой г , построенных на каждой
грани и имеющих общую вершину в центре
вписанной сферы.
Площадь части поверхности сферы
радиусом R = 1 , высекаемой конической
поверхностью с вершиной в центре сферы,
является мерой телесного угла, ограниченного
данной конической поверхностью. За единицу
измерения телесного угла принимают
стерадиан, соответствующий единичной площади
высекаемой части сферы. Полный телесный
угол равен 4л стерадиан.
Сегмент круга при вращении вокруг
диаметра, перпендикулярного к хорде его
дуги, образует шаровой сегмент объемом
п (bo1 + h2>)h/6 = n(3R-h) h2/3 с полной
поверхностью n(h + 2а ) = nylRh + a ) и
сферической частью поверхности
2%Rh = %(h +a ), где И - стрела дуги (см.
рис. 1.2.9) сегмента круга, a = y]2Rh-h -
половина хорды его дуги. Сектор круга при
вращении около диаметра,
перпендикулярного к хорде его дуги, образует шаровой
сектор объемом 2kR h/Ъ с полной
поверхностью nR (2h + a). Часть шара, заключенную
между пересекающими его параллельными
плоскостями, называют шаровым слоем (рис.
1.4.8). Его объем к(3а2 + ЪЬ2 + И2Уб ,
площадь сферической части поверхности
42
Глава 1.5. СФЕРИЧЕСКАЯ ГЕОМЕТРИЯ
Рис. 1.4.8
(сферического пояса) 2%Rh и полная
поверхность nilRh + a +b ), причем
4(R2-a2)h2 =(a2-b2-h2f . Тело,
ограниченное поверхностями сферического пояса
и вписанного в него усеченного конуса, имеет
объем л/о Л/6 ( /q — длина образующей
конуса).
Круг радиусом R при вращении около
прямой, лежащей в плоскости круга, но не
пересекающей его, образует тор (кольцо
кругового сечения) объемом 2л R Н с
поверхностью 4л /?// (Я — расстояние от
центра круга до прямой).
Глава 1.5
СФЕРИЧЕСКАЯ ГЕОМЕТРИЯ
1.5.1. Геометрия на сфере. Сечение
сферы плоскостью, проходящей через ее
центр, принято называть большим кругом
Рис. 1.5.1
(геодезической линией на сфере). Радиусы
большого круга и сферы равны. Через каждые
две точки А к В сферы, не принадлежащие
одному диаметру сферы, проходит только
один большой круг (рис. 1.5.1). Длина
меньшей из его дуг ЛВ есть кратчайшее
расстояние на сфере между А и В , измеряемое
соответствующим дуге центральным углом с.
Угол а между дугами ЛВ и АС больших
кругов измеряют углом между касательными к
ним в точке А их пересечения (или, что
равносильно, двугранным углом, образованным
плоскостями больших кругов).
Два больших круга на сфере образуют 4
сферических двуугольника. Каждый
двуугольник имеет равные углы с вершинами в точках
А и А пересечения больших кругов (см.
рис. 1.5.1). Его площадь на сфере радиуса R
равна aR (а — угол двуугольника в
радианах). Обычно принимают R = 1 .
Три больших круга, не пересекающиеся
в одной паре диаметрально противоположных
точек сферы, образуют на ней сферические
треугольники. Их сторонами являются дуги
больших кругов между точками пересечения,
измеряемые плоскими углами трехгранного угла
с вершиной в центре О сферы. Сферический
треугольник называют эйлеровым, если каждая
его сторона меньше половины дуги большого
круга (каждый угол меньше л). Через углы и
стороны эйлерова треугольника можно
выразить элементы остальных треугольников,
образованных на сфере пересечением трех
больших кругов.
Сферические треугольники равны, если
их можно совместить перемещением по
поверхности сферы. Помимо трех случаев
равенства треугольников на плоскости (см.
1.2.6) для сферических треугольников
существует четвертый: они равны, если равны их
соответствующие углы (на сфере нет
подобных треугольников).
В эйлеровом треугольнике: сумма сторон
меньше 2л/? ; каждая сторона меньше суммы
и больше разности двух других; против
меньшего угла расположена меньшая сторона;
сумма двух углов меньше третьего,
увеличенного на л; сумма всех углов меньше Зл и
больше л. Разность е суммы углов и л
называют сферическим избытком (сферическим
эксцессом). Площадь эйлерова треугольника
S = eR2.
1.5.2. Сферическая тригонометрия.
Раздел сферической геометрии, изучающий
соотношения между углами и сторонами
сферического треугольника, называют сферической
ПОНЯТИЕ ФУНКЦИИ
43
тригонометрией. Эти соотношения
устанавливают теорема синусов (sin ot)/sin a =
= (sin (3)/sin (3 = (sin c)/sin у, теорема
косинусов сторон
cos с = cos a • cos b + sin a sin b • cos у
(1.5.1)
и теорема косинусов углов
cos у = - cos a • cos p + sin a • sin (3 • cos c,
(1.5.2)
где a, (3 и у — углы эйлерова треугольника,
противолежащие соответственно его сторонам
a, b и с , измеряемым в радианах
соответствующими центральными углами (см. рис.
1.5.1). Остальные соотношения следуют из
(1.5.1) и (1.5.2) циклической перестановкой
сторон а -> b -> с -> а и углов
a -> (3 -> у -> ex.
Если заданы три стороны эйлерова
треугольника, то при помощи (1.5.1) вычисляют
косинусы всех углов и затем значения углов.
Если заданы три угла, то при помощи (1.5.2)
находят косинусы всех сторон треугольника и
затем значения сторон.
Пусть заданы две стороны а и b и угол
Y между ними. Тогда из (1.5.1) находят
cos с , и затем после циклической
перестановки в (1.5.1) сторон и углов вычисляют
cos a и cos (3, что позволяет однозначно
определить сторону с и углы а и (3 . Если
задана сторона с и два прилежащих к ней
угла а и (3 , то из (1.5.2) находят cosy, и
затем после циклической перестановки в
(1.5.2) углов и сторон вычисляют cos а и
cos b, что дает возможность однозначно
определить угол Y и стороны а и b .
Если задать две стороны и
противолежащий одной из этих сторон угол, например,
а , b и a , то в силу теоремы синусов
решение существует только тогда, когда
sin b • sin a < sin a , причем в случае строгого
неравенства существуют два решения. Пусть
заданы два угла и сторона, противолежащая
одному из них, например, a , Р и а . Тогда
согласно теореме синусов решение существует
только тогда, когда sin p • sin a < sin a ,
причем в случае строгого неравенства существуют
два решения.
Глава 1.6
ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
И ИХ ГРАФИКИ
1.6.1. Понятие функции. Функция —
одно из основных понятий современной
математики (о функции в общем случае см.
2.1.5). В простейшем случае действительная
функция f одного действительного
переменного выражает зависимость одной переменной
числовой величины от другой. Эта
зависимость любому действительному числу х
(аргументу функции) f из области
определения D(f) этой функции f ставит в
соответствие единственное действительное число,
обозначаемое f (х) и называемое значением
функции f . Значение аргумента х, для
которого / (х) = 0 , называют нулем функции
/ (х). Если значению х соответствует более
одного значения / (х), то функцию именуют
многозначной и рассматривают ее однозначные
ветви.
Действительную функцию у = f (x)
одного действительного переменного х можно
изобразить на плоскости в виде графика как
множество всех точек (х;у) с координатами
х и у = f (х), причем х пробегает все
значения из D(f). Прямую, пересекающую
график функции в двух точках, называют
секущей, участок графика и отрезок секущей
между этими точками — соответственно дугой
графика и ее хордой.
Функция / может быть задана
аналитически либо формулой у = f(x), явно
разрешенной относительно у, либо неявно
уравнением F (х, у) = 0 , содержащим х и у как
аргументы другой функции F , либо
параметрически, когда соответствующие друг другу
значения хну выражены через третью
переменную величину, называемую параметром.
Функция также может быть задана
алгоритмически или описательно словесной
формулировкой. Задание функции графиком
наглядно, но имеет ограниченную точность.
Если D(f) является конечным множеством,
то функцию задают в виде таблицы. Таблично
можно задавать функцию и в общем случае.
Тогда значения функции при промежуточных
44
Глава 1.6. ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ И ИХ ГРАФИКИ
значениях аргумента находят приближенно,
используя методы интерполяции.
1.6.2. Некоторые свойства функций и
их графики. Пусть область D[f)
определения функции f (х) симметрична относительно
начала координат. Если для каждого х из
D (/) / (-х) = / (х), то функцию называют
четной, а при /(-х) = -/(х) — нечетной. У
четной функции график симметричен
относительно оси ординат, у нечетной —
относительно начала координат. Смена знака перед
функцией не меняет ее четности. При
сложении только четных или только нечетных
функций их сумма сохраняет свойство
четности своих слагаемых. Произведения четных
функций и четного числа нечетных функций
являются четными функциями, а
произведение нечетного числа нечетных функций дает
нечетную функцию. Любая функция f (х)
единственным образом представима суммой
четной ф(х) = (/ (х) + / (-х))/2 и нечетной
¥ (х) = (/ (*)_ / (~х))/2 функций с
областью определения D(f). Функцию, не
обладающую свойством четности, называют
функцией общего вида.
Если существует действительное число
Т такое, что для любого х из области
определения функции /(х) числа х±Т также
принадлежат этой области и
f(x) - f(x±T), то говорят, что f(x) -
периодическая функция с периодом Т . График
такой функции во всей области ее
определения можно построить перемещением на целое
число периодов вдоль оси абсцисс фрагмента
графика этой функции, построенного в
пределах любого отрезка длиной Т .
В некоторых случаях график функции
можно построить по графику другой функции
путем параллельного переноса, растяжения
(или сжатия), преобразования симметрии.
Если Г - график функции f(x), то графики
функций ~f(x) и f (~х) являются
зеркальным отражением Г относительно
соответственно осей абсцисс и ординат. Графики
функций f(x- а) и f(x) + b можно
получить сдвигом Г соответственно вдоль оси
абсцисс на а вправо при а > О (влево при
а < О) и вдоль оси ординат на b вверх при
b > О (вниз при b < О ), а графики функций
f(x/k), k>0 и с/(х), о 0
-растяжением Г вдоль оси абсцисс в к раз и вдоль
оси ординат в с раз. Таким образом, путем
простых преобразований графика Г нетрудно
построить график функции вида
pf(qx-r) + s для любых значений чисел
р, q,r,s. График абсолютного значения
х) функции f(x) получают зеркальным
отражением относительно оси абсцисс частей
Г при /(х) < 0 .
Пусть Xj и Х2 из области определения
^(/) Функции f(x), для которых Х| < х2 ,
выбраны произвольно. Функцию / (х)
называют: возрастающей, если f {х\) < f {xj)',
неубывающей, если f (x\) < f (х2);
убывающей, если f (xy)> f (xj), и невозрастающей,
если /(xj) > f (xi). Во всех этих случаях
функцию называют монотонной, причем о
возрастающей и убывающей функциях
говорят, что они строго монотонны. Различным
значениям аргумента х соответствуют
различные значения у = f (x) строго
монотонной функции. Для нее в ее области значений
определена обратная функция x = g(y),
обозначаемая обычно /~ . Функции / и
/~ называют взаимно обратными. Графики
функций / (х) и /~ (х) симметричны
относительно прямой у - х.
1.6.3. Основные элементарные
функции. К основным элементарным функциям
относят небольшую совокупность
перечисленных ниже сравнительно простых функций,
часто встречающихся в приложениях. При
х > 0 для любого действительного числа
s (seR) определена степенная функция
(рис. 1.6.1, а)
y = xs. (1.6.1)
Число s называют показателем степени.
Если s > О, то степенная функция определена и
при х = 0 . В случае s = О у = \ для всех х.
Если S = п (п - натуральное число, т.е.
п е N), то степенная функция определена
для всех xeR, причем для четных
ОСНОВНЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
45
Рис. 1.6.1
п = 2т (awgN) она является четной
функцией, а для нечетных п = 2т - 1 — нечетной
(см. рис. 1.6.1, б). При s = \/n и п = 2т-\
она определена для всех xgR, а при
п -2т - для х > О . Если s = k/n (k -
целое число, т.е. k e Z , причем & и я
несократимы), то степенная функция определена:
для всех х g R, когда п = 2т-\ и & > О
(причем для к четного функция является
четной, а для к нечетного — нечетной); для
х > О , когда п-2т и к > О ; для х > О ,
когда п = 2т и /: < О (см. рис. 1.6.1, в); для
всех х g R , кроме х = 0 , когда п = 2т-\
и &<0.
Для всех xg R определена
показательная функция
Рис. 1.6.2
}> = 0*>О (1.6.2)
с основанием а > О. Эта функция является
возрастающей, если л > 1 , и убывающей, если
О < я < 1 (рис. 1.6.2), т.е. строго монотонна и
имеет обратную функцию
y = \ogax, (1.6.3)
называемую логарифмической функцией. Она
определена при х > О , возрастает при а > 1
и убывает при 0 < а < 1 , ее график в любом
случае проходит через точку (1;0) и
симметричен относительно прямой у = х графику
функции ах (см. рис. 1.6.2).
Для любого числа х > О существует
единственное число у, удовлетворяющее
соотношению ау = х при а > О и а * 1 .
Именно это число у и называют логарифмом
числа л: по основанию я и обозначают
1°8я * i причем равенство aogaX = x
называют основным логарифмическим тождеством.
Степенную функцию (1.6.1) с любым
значением s e R можно определить равенством
Xs = lalogaх\ =as,og«x . Основные свойства
логарифмов: \oga 1=0; \oga a = 1; при
b > 0 и о 0 \oga be = \oga b + log,, с и
\oga (b/c) = \oga b - \oga с; для любого
s g R и x > 0 logfl xs = s log,, x . Поскольку
log„ x = - log,/,, x и я* = (1/я)"* , графики
46
Глава 1.6. ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ И ИХ ГРАФИКИ
У
ж/2
f
Ч -ж/2-1 0
sen x^^ i ^jy
arcsinx\_
1
~\arcsinx
—""*■/L^^ i ""^^
/ 1 1
/ x/2
-/
-ж/2
sinx
X*
JT^
Рис. 1.6.3
функций logfl x и logj^ x симметричны
относительно оси Ох , а графики функций
ах и 1/0* - относительно оси Оу .
Нахождение логарифма любого выражения именуют
логарифмированием, а восстановление
выражения по его логарифму — потенцированием.
Вместо обозначения \oga х при 0 = 10
используют Igx, а при а = е~ 2,71828 -
In х и называют натуральным логарифмом
числа х. Функцию ех , обратную к функции
In х, называют экспоненциальной (или экспо-
нентои). Ее иногда обозначают ехр(х).
Поскольку значения всех
тригонометрических функций для любого значения угла
можно выразить через одну из них (см. 1.3.1),
к основным элементарным из них можно
также отнести лишь одну, например,
функцию синус
у = sinx,
(1.6.4)
которая определена для всех хе R и
является периодической с периодом 2л (рис. 1.6.3).
При -я/2 < х < л/2 эта функция строго
монотонна (возрастает) и имеет обратную
функцию, называемую арксинусом, обозначаемую
arcsinx и имеющую областью определения
отрезок [—1, 1] и областью значений отрезок
[-л/2, л/2]. Но на любом отрезке
[-л/2 + кп, л/2 + кп] (k e Z) функция
sin х строго монотонна и имеет обратную
функцию с той же областью определения
[—1,1] и областью значений
[-л/2 + кп, л/2 + кп]. Таким образом,
существует многозначная обратная к sin л: функция,
все однозначные ветви которой определены на
отрезке [—1, 1], но каждая из ветвей имеет
свою область значений, соответствующую
конкретному значению целого числа к.
Функцию arcsinx, соответствующую к = 0 ,
называют главным значением арксинуса, а
совокупность всех однозначных ветвей
многозначной обратной к sinx функции
записывают в виде
Arcsinx = kn + (-l)k arcsinx. (1.6.5)
1.6.4. Некоторые элементарные
функции. К элементарным относят функции,
которые можно получить при помощи
конечного числа алгебраических операций над
основными элементарными функциями и их
суперпозицией. В приложениях широко используют
элементарную функцию вида
Рп (х) = а0х" + а{х"-{ +... + ап_{х + ап,
(16.6)
являющуюся линейной комбинацией степенных
функций с натуральными показателями
степени до п включительно и называемую
многочленом. Числа а0,а[,...,ап_[,ап называют
коэффициентами многочлена, а натуральное
число п — его степенью. Многочлен определен
для всех х. Значение х, обращающее
многочлен в нуль, называют нулем этого многочле-
НЕКОТОРЫЕ ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ
47
Многочлен первой степени
/*1 (лс) = aQx + (2[, uq Ф О, называют линейной
функцией. Ее графиком является прямая.
Многочлен второй степени
Р2 (х) = а0х + а{х + а2, Oq * О , часто
именуют квадратным трехчленом. Его можно
привести к виду Р2 (х) = % (х - х$) + уО ,
Xq = -Я|/(2яь)> Уо=<*2- Oi/(4a0). График
квадратного трехчлена можно получить сдви-
гом графика параболы у = а$х вдоль осей
координат (см. 1.6.1). На рис. 1.6.4, а
приведен график для случая я0 > 0, Xq > О
и Уо <0.
Многочлены называют целыми
рациональными функциями. Функцию вида
У = Рт (*) = %*т + а{хт-[ +... + атЛх + ат
Q„{x) b()xn+b[xn-[+... + bn_lx + bn '
(1.6.7)
где Рт (х) и Qn (x) - многочлены степени
соответственно тип, называют дробно-
рациональной (или рациональной дробью). При
т> п рациональную дробь именуют
неправильной, а при т < п — правильной. Она
определена для всех тех значений х, которые
не являются корнями уравнения Qn (х) = О .
Частным случаем (1.6.7) является дробно-
линейная функция у = (а0х + а{ )/{Ь^х + Ь[)
при ^0 и а$Ь\ * а\Ьо • Ее можно привести
к виду У = y0+h/(x-XQ), где y0=aQ/b()t
xO=-b\/bo и h = (a{bQ-a{)b{ )/bfi . График
дробно-линейной функции можно получить
сдвигом графика гиперболы вдоль осей
координат (см. 1.6.1). На рис. 1.6.4, б график
представлен для случая h > 0, х0 > 0 и у0 > 0 .
К тригонометрическим функциям помимо
синуса относят косинус cos x = sin (x + я/2)
(рис. 1.6.5), тангенс tgx = (sin x)/cosx и
котангенс ctgx: = (cos x)/sin x = 1/tgx (рис.
1-6.6), секанс sec x = 1 /cos x и косеканс
cosecx = l/sinx. Все эти функции являются
периодическими, причем косинус и секанс —
четными, а остальные — нечетными. Косинус
(как и синус) определен для всех jc , тангенс
Рис. 1.6.5
Рис. 1.6.6
Рис. 1.6.7
и секанс — для всех х, кроме
х = (2к - 1) л/2 , где к — целое число
[к е Z), котангенс и косеканс - для всех х,
кроме х = кп . К обратным
тригонометрическим функциям помимо арксинуса
принадлежат арккосинус, арктангенс, арккотангенс и
48
Глава 1.6. ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ И ИХ ГРАФИКИ
Arshx
Arcthx \j.
Рис. 1.6.9
малоупотребительные арксеканс и арккосеканс.
Все эти функции являются многозначными. Их
главные значения можно выразить через
главное значение арксинуса: arccos х =
= л/2 - arcsin х, arctg x = arcsin I х/\1 + х2 I,
arcctg x = л/2 - arctg x = arcsin 11/ V1 + х2 1.
Совокупностями однозначных ветвей
арккосинуса, арктангенса и арккотангенса
соответственно будут Arccos х = ± arccos х + 2кп,
Arctgx = arctgх + кп и Arcctgx = arcctgx + kn.
Арктангенс и арккотангенс определены для
всех х (рис. 1.6.7), а арккосинус - при
-1 < х < 1 (см. рис.1.6.5).
К гиперболическим функциям
принадлежат гиперболический синус sh х = (ех - е~х 1/2,
гиперболический косинус сп х = 1ех + е~х 1/2,
гиперболический тангенс th х = (sh x)/ch х =
= (<?* -е~х)/(е* + е j гиперболический
котангенс cthх = (chx)/shх = (ех + е~х)/(ех - е~х)
(рис. 1.6.8). График функции clix иногда
называют цепной линией. Функции shx, clix
и thx определены для всех х, a cthx — для
всех х, кроме х = О . Функция clix
является четной, а остальные — нечетными. К
обратным гиперболическим функциям относят
ареасинус Arsh x = hi fx + Vx2+ll
ареако-
+4?
синус Arch х = hi I x + Vxz - 1 I, ареатангенс
Arth x = (1/2) In ((1 + x)/(l - x)) и. ареако-
тангенс Arcth x = (1/2) In ((x + 1 )/(x - 1))
(рис. 1.6.9). Две однозначные ветви ареакоси-
нуса симметричны относительно оси абсцисс.
Эта функция определена при х > 1.
Ареасинус определен для всех х, ареатангенс - при
-1 < х < 1, ареакотангенс — при х < -1 и
х > 1. Функции Arsh х, Arth х и Arcth x
являются нечетными.
Итак, рациональные элементарные
функции - это результат арифметических действий
со степенной функцией (1.6.1), имеющей
натуральный показатель степени.
Арифметические действия со степенной функцией,
имеющей показателем степени рациональное
число, приводят к иррациональным
элементарным функциям, которые вместе с
рациональными образуют класс алгебраических функций.
Элементарные функции, в которые входит
хотя бы одна из функций: степенная,
имеющая показателем степени иррациональное
число; показательная; логарифмическая;
тригонометрическая или обратная
тригонометрическая, относят к классу трансцендентных.
СПИСОК ЛИТЕРАТУРЫ
1. Бронштейн И.Н., Семендяев К.А.
Справочник по математике для инженеров и
учащихся втузов. 13-е изд., испр. М.: Наука,
1986. 544 с.
СПИСОК ЛИТЕРАТУРЫ
49
2. Волынский Б.А. Сферическая
тригонометрия. М.: Наука, 1977. 136 с.
3. Дорофеев Г.В., Потапов М.К., Розов
Н.Х. Пособие по математике для
поступающих в вузы (избранные вопросы
элементарной математики). 5-е изд., перераб. М.:
Наука, 1976. 640 с.
4. Математический энциклопедический
словарь / Гл. ред. Ю.В. Прохоров. М.: Сов.
энциклопедия, 1988. 848 с.
5. Морозова В.Д. Введение в анализ. М.:
Изд-во МГТУ им. Н.Э. Баумана, 2000. 408 с.
(Сер. Математика в техническом
университете: Вып. 1).
6. Погорелов А.В. Элементарная
геометрия. М.: Наука, 1977. 208 с.
7. Энциклопедия элементарной
математики / Под ред. П.С. Александрова, А.И.
Маркушевича и А.Я. Хинчина. В 5 т.: Т. 4
(Геометрия). М.: Физматгиз, 1963. 568 с; Т. 5
(Геометрия). М.: Наука, 1966. 624 с.
Раздел 2
МАТЕМАТИЧЕСКИЙ АНАЛИЗ
Глава 2.1
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
2.1.1. Некоторые логические
символы. Теория множеств, по существу, является
языком современной математики и для
краткости записи математических высказываний
широко использует логические символы.
Высказыванием называют предложение, о
котором имеет смысл говорить, что оно истинно
или ложно. Запись р => q указывает, что
высказывание р влечет (имеет следствием)
высказывание q (если р, то q ). При этом р
является достаточным условием q , a q -
необходимым условием р. Если и р => q , и
q =* р , то высказывания р и q называют
эквивалентными, пишут р <=> q и говорят: р
является необходимым и достаточным
условием q ; q тогда и только тогда, когда р; р
равносильно q . В этих фразах р и q можно
поменять местами. Запись р :<=> q означает
эквивалентность {равносильность) р и q no
определению (двоеточие заменяет слова "такое,
что"). Символ л в записи р л q имеет смысл
союза "и" (и р, и q одновременно), а символ
v в записи р v q заменяет не исключающий
союз "или" (или р, или q , или и то и другое
вместе). Отрицание высказывания р (р не
имеет места, не р) обозначают -лр (иногда
р). В сложных выражениях приоритет
применения указанных символов, называемых
логическими (иногда логическими связками),
возрастает в таком порядке: <=>, =>, v, л, —i.
Наряду с ними используют символы V и 3 -
кванторы общности и существования
соответственно. Квантор V заменяет слова: для
каждого; для любого; каково бы ни было, а
квантор 3 - существует; имеет место; можно
найти. Символ 3! используют для замены
слов "существует и притом единственный", а
р "не существует".
2.1.2. Понятие множества.
Математическое понятие множества принимают в
качестве исходного и неопределяемого
(интуитивного). Под множеством понимают
набор определенных различимых объектов,
называемых элементами образуемого ими
множества. Его рассматривают как единый
математический объект. Запись а е А или
А э а означает, что элемент а принадлежит
множеству А или множество А содержит
элемент а. Если а не принадлежит А, то пишут
а £ А . Множество, содержащее конечное
число элементов, называют конечным, в
противном случае оно является бесконечным.
Множество задают либо перечислением
его элементов (например, А = {2,4} -
конечное множество, элементами которого
являются числа 2 и 4 и только они) или
указанием свойства (совокупности свойств),
которым обладают все элементы этого множества
и только они (например,
X = [х g R : sin х = 0} - множество
действительных чисел х, таких, что sin х = 0 ).
Множество, не содержащее элементов,
называют пустым и обозначают через 0 .
Множества А и В равны, если они содержат одни и
те же элементы:
А = В:<=* \/х(хе А »хе В).
В этой записи символы = и е имеют
приоритет перед логическими символами.
Множество В называют подмножеством
множества А, если все элементы В являются
ОПЕРАЦИИ НАД МНОЖЕСТВАМИ
51
также и элементами А, и пишут В с: А или
A~dB (В включено в А или А включает В,
причем возможно и В = А), а в случае
В Ф А используют обозначение В а А или
Az) В, и тогда В называют собственным
подмножеством А. Пустое множество является
подмножеством любого множества А. Запись
В (X А или означает, что В не
является подмножеством А.
Логические символы позволяют
определить с и (X через е и g :
BaA:t=* Vx(xe B=>xe А) и B<zA:t=*
<=> Зх е В : х £ А , где последнее двоеточие
заменяет слова "такое, что". Связь между
включением и равенством множеств отражает
запись A = B<^>AczBaBc:A.
2.1.3. Операции над множествами. В
каждом конкретном случае множества
имеющих к нему отношение объектов обычно
включены в некоторое всеобъемлющее так
называемое универсальное множество Q (его
иногда именуют универсумом). Пусть заданы
множества А с: Q и 5cQ, условно
изображенные на рис. 2.1.1 различно
заштрихованными кругами, называемыми кругами
Эйлера. Результатом операций над А и В
являются множества: объединение А и В , которое
содержит все элементы, принадлежащие хотя
бы одному из множеств А или В; пересечение
А п В — все элементы, принадлежащие и
множеству А, и множеству В одновременно;
разность А\В — все такие элементы
множества >4, которые не принадлежат В;
симметрическая разность ААВ — все элементы,
принадлежащие только А и только В; т.е.
AUB
АПВ ААВ
Рис. 2.1.1
A kj В = {х : хе A vxe В}, An В = {х : хе А лхе В}, А\В = {х : хе А лхе В}
ААВ = {х:хе А л хе В v хе В л хе А} = (А\В)и(В\А).
Если А п В = 0 , то множества А и В
называют непересекающимися. Множество
А \ В является относительным дополнением
В до А, а множество Q \ В - абсолютным
дополнением (или просто дополнением)
множества Д обозначаемым В .
Операции объединения и пересечения
обладают свойствами коммутативности (п. 1
табл. 2.1.1), ассоциативности (п. 2) и
идемпотентности (операция над множеством не
изменяет его, см. п. 3). Объединение обладает
свойством дистрибутивности относительно
пересечения и наоборот (см. п. 4).
Соотношения пп. 5 и 6 выражают законы поглощения и
де Моргана, а пп. 7-10 — свойства операций с
пустым и универсальным множествами.
Таблица 2.1.1
п/п
1
2
3
4
5
6
7
8
9
10
Некоторые свойства операций над множествами
АиВ=ВиА
Ли
(BuC) = (AkjB)kjC
АиА = А
А и (В
nC) = (AuB)n(AuC)
Аи(АпВ) = А
\
AuB=AnB
Аи0 = А
AuQ = Q
AkjA = Q
0 = Q
AnB=BnA
An(BnC) = (AnB)nC
АпА = А
Ап(ВиС) = (АпВ)и(АпС)
Ап(АиВ) = А
АпВ=АиВ
AnQ = A
Ап0 = 0
АпА=0
й = 0
52
Глава 2.1. ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
Пары соотношений в каждом из пунктов
табл. 2.1.1 переходят одно в другое заменой
символа и на п и 0 на Q (принцип
двойственности (или дуальности)).
2.1.4. Отношения. Под отношением
понимают некоторую связь между
математическими объектами. Отношение между
парами объектов именуют бинарным (или
двухместным) и записывают в виде xRy, где R —
символ отношения (например, х = у,
хе X , X с Y ). Оно является
подмножеством множества Ах В = {(*, }>):хе А, у е В}
упорядоченных пар (х, >>) объектов хиу,
называемого прямым (или декартовым)
произведением множеств А и В. Так, бинарное
отношение у = 2х при ^,ХбЕ
соответствует множеству точек прямой на плоскости. В
этом смысле оно является подмножеством
множества точек плоскости, задаваемого
произведением RxR двух экземпляров
множества R всех действительных чисел, обозна-
чаемым R .
Равенство упорядоченных пар (х,у) и
(*', у') определяют условиями х = х' и
у - у''. Пары (х,у) и (у,х) различны, если
х Ф у . Это особенно важно иметь в виду,
когда множества А и В совпадают. Поэтому в
общем случае Ах В Ф Вх А, т.е.
произведение произвольных множеств не обладает
свойством коммутативности, но оно обладает
свойством дистрибутивности по отношению к
объединению, пересечению и разности
множеств: Ах(ВпС) = (АхВ)а(АхС), где
d — одна из трех названных операций.
Примерами произведений более двух
множеств являются множество точек
геометрического (трехмерного) пространства
R x R x R = R и общий случай точечного
множества R"(neN) всевозможных
упорядоченных наборов х = (х\,Х2,...,хп)е R" из
п действительных чисел Х\,Х2,...,хп е R .
Произведение п произвольных множеств
есть множество упорядоченных наборов из п,
вообще говоря, разнородных элементов. Такие
наборы называют кортеж, вектор или п-ка
(произносят "энка"). Элементы в п -ке
связаны п-арным (или п-местным) отношением.
2.1.5. Отображение множеств.
Функция. Отображением f множества X в
множество Y (или функцией, определенной на X
со значениями в Y ) называют соответствие,
которое каждому элементу хе X соотносит
некоторый единственный элемент х е Y.
Множество X называют областью определения
функции / и обозначают D{f), элемент
хе X — аргументом функции (или
независимым переменным, а элемент ye Y —
зависимым переменным. При этом элемент у е Y,
соответствующий элементу хе X , именуют
образом элемента х при отображении / , или
значением функции f в точке х, и
обозначают f(x). Областью значений функции /
(или образом множества X при отображении
/) называют множество
f(X) = {yeY:y = f(x),xeX},
обозначаемое /?(/)• Множество X = D(f)
является прообразом множества f(X) = R(f)
при отображении / . При заданном элементе
ye Y совокупность всех таких элементов
хе X , что f(x) = у , называют прообразом
элемента у и обозначают /~ (у), т.е.
/_1 (у) = {хе X : f (х) = у]. Факту задания
отображения (или функции) соответствует
запись f : X ->Y (или у = f(x)). Итак,
/ : X -> Y : «> Vjc е X 3! у е Y : у = f (х).
Отображение (или функцию) можно
рассматривать как бинарное отношение между
элементами множеств X и Y и составить
множество
r = {{x,y):xeX,yeY,y = f(x)}c:XxY
упорядоченных пар (х,у), которое является
подмножеством прямого произведения X х Y .
Такое множество Г называют графиком этого
отображения, или графиком функции /(•*)■
Термин "функция" обычно используют,
когда при отображении образ f(X) = R(f)
включен в точечное множество Rm,meN
или множество С комплексных чисел. Так,
ТИПЫ ОТОБРАЖЕНИЙ
53
при Л(/)сЕ/(х) называют
действительной (скалярной) функцией, при /?(/)£М",
п е N, п > 1 — векторной функцией и при
/?(/)сС - комплекснозначной. При Z)(/)cR
(или D(/)cC)/(x) именуют функцией
действительного (или комплексного)
переменного. Если /)(/) с R и Я (/) с R , то /(*)
называют действительной функцией
действительного переменного, а если /)(/) с МЛ при
/? (/) с К , то — действительной (скалярной)
функцией п (или многих, нескольких)
действительных переменных (иногда —
действительной (скалярной) функцией векторного
аргумента).
Итак, отображению f :X qR" -> Rm,
п > 1 , соответствует функция f (х) многих
переменных (ФМП), при т = 1 скалярная
(СФМП), а при т > 1 векторная (ВФМП).
Если для элементов х е R" и у е Rm ввести
координаты, записав х = (jq,..., xt,..., хп),
/ = !,/! и y = (y{,...,yj,~.,ym), j = \,m,To
ВФМП можно представить в виде
y = f(x) = (A(x),...,fj(x),...,fm(x)), где
yj = fj (x)e R являются СФМП и их
называют координатными функциями ВФМП
f(x). Функцию, определенную на
множестве N натуральных чисел (/)(/) = N),
называют последовательностью элементов
множества Y (при R(f) с R - числовой
последовательностью), обозначаемой {fn} или {уп} >
где yn=fn=f(n)eY VfleN.
Подмножество S=[ye Y:y=f(x),xeЛ} =
= f(A) с У является образом подмножества
А с X при отображении / : X -» Y . Для
образов подмножеств А с X и В а X
справедливы соотношения:
f(AvB) = f(A)Kjf(B),
f(AnB)cf(A)nf(B),
f(A\B)=>f{A)\f(B),
а в случае Ad В имеем /[А)^/{В).
Подмножество A = {xeX:f(x)eS} = f-[(S)czX
является прообразом подмножества S с Y
при отображении / : X —> Y . Для прообразов
подмножеств S czY и Т aY справедливы
соотношения /~l (SuT) = /"* (5) uZ"1 (Г),
Г1(5пГ) = Г1(5)пГ1(Г), Г'^\7>
= /_1 (5) \ /_1 (Г) и при условии S с Г
Если f : X ~-> Y и g : К —» Z, то
отображение ф : Л" —> Z , определенное для
каждого хеХ формулой ф(х) = #(/(*)),
называют композицией (суперпозицией)
отображений (функций) fug, или сложной
функцией, и обозначают g ° f. Условием того, что
D{gof) = X, является Д (/) с Д ($) •
Композиция отображений обладает свойством
ассоциативности: если / : X —» Y ,
g :Y -> Z и А : Z -> # , то (А ° g) ° / =
- h°{g ° /) > что проще записывают в виде
Aogo/.
2.1.6. Типы отображений. Правило,
задающее отображение f : X -> Y , можно
условно изобразить стрелками (рис. 2.1.2, а).
Если в множестве Y есть хотя бы один
элемент, на который не указывает ни одна из
стрелок, то это означает, что область значений
функции f не заполняет все множество Y ,
т.е. f{X) с Y . Если же f(X) = Y , то
говорят, что функция / отображает X на Y , а
запись
/ : * -> Y :<=> V^e Г Нхе X : /(*) = >>
определяет сюрьективное отображение (или
сюръекцию, наложение). В таком случае к
каждому элементу yeY ведет хотя бы одна
стрелка (рис. 2.1.2, б). Если к любому
элементу ye Y ведет не более одной стрелки, то
говорят, что / отображает Хв Y , а запись
f: X ->Y :*=>Vye f(x) qY3\xe X: f(x) = у
определяет инъективное отображение (или
54
Глава 2.1. ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
однозначное соответствие между множествами
X и У и ее называют взаимно однозначной
функцией.
Биективное отображение и сюръективно
и инъективно: на рис. 2.1.3, а стрелки
соединяют попарно каждый элемент из Хс каждым
из У . Если повернуть все стрелки вспять
(рис. 2.1.3, б), то отображение g : У —» X
также будет биективным, называемым
обратным отображением (или обратной биекцией) к
/ : X —> У и обозначаемым g = f~ . Ото-
инъекцию, вложение). Оно не обязательно бражения (функции) /и f~l именуют аза-
сюръективно, т.е. стрелки ведут не ко всем
элементам уе У (рис. 2.1.2, в), но образы имно обратными. В частном случае Х = У
„ ~ имеем отображение множества X на себя,
различных элементов из Л различны. Запись г Л ,.
v F называемое преобразованием множества. Через
/: X -> У :<=> Vyе f[X) = Y3\xe X: f(x) = y lx -X -* X обозначают тождественное
отображение (преобразование) множества,
определяет биективное отображение (или би- л _ v
р г. которое каждому элементу из л сопоставляет
екцию). При этом / устанавливает взаимно этот же элемент Тогда
f-.Х^У -биекция **3{g:Y ->X):(gof = Ix)*{fog = IY),
f:X->Y -инъекция *>3(g :Y-> X):(go f = Ix),
f : X ->Y - сюръекция <=> 3(g :Y->X):(f°g = IY).
2.1.7. Элементы комбинаторики. Одна количество перестановок, отличающихся по-
из задач комбинаторики состоит в нахождении рядком следования элементов,
количества различных подмножеств, которые //
можно образовать выборкой и расположением Р„ = \ 2...(п - \)п = ТТт = п\, (2.1.1)
по определенным правилам из элементов не- **
которого (обычно конечного) множества. Пре-
~ v где п\ означает произведение п натуральных
образование конечного множества X„ из п , . ч w
п чисел (читают «эн факториал»). Условно при-
элементов называют его перестановкой. Общее нято, что 0! = I.
ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА
55
Подмножество Zk с Хп из к
различных элементов называют сочетанием из п
элементов по к, а при определенном порядке
следования элементов — размещением из п
элементов по к. Общее количество таких
размещений и сочетаний соответственно равно
к<п. (2.1.2)
При к = п А" = Рп и С" = 1. Кроме того,
С,? = СЦ~к , С*+/ = С* + С*+1 и общее
количество всех подмножеств множества Хп
(включая пустое множество и само
множество Х„)
£С* = 2". (2.1.3)
Каждое размещение есть множество
образов инъективного отображения множества
Nfc ={1,2,...,/:} в множество Хп. Сюръек-
тивному отображению отвечает размещение с
к
повторениями, общее количество которых п ,
причем возможно и к > п . Если при этом
порядок следования элементов не существен,
то имеем сочетания с повторениями из п
элементов по к с общим их количеством
[п + к + 1) \/(п - 1) \/к! . Перестановкой
множества Хп с повторениями называют
упорядоченный набор п групп элементов хт е Хп ,
каждый из которых взят кт раз, так что
п
2_j^m = N • Общее количество таких пере-
т=\
становок
Ск^^'-"'^'т^Ы- (214)
2.1.8. Мощность множеств. Если
природа элементов конечного множества
несущественна, то его характеризует лишь
количество принадлежащих ему элементов. Понятие
количества элементов обобщают на
бесконечные множества, вводя сравнительную
характеристику, называемую мощностью
множества и выражаемую для множества А его
кардинальным числом card А. Множества А и В
называют равномощными, если существует
биективное отображение f:A—>B.
Для конечного множества А,
содержащего п элементов, card А = п, для множества
РА всех его подмножеств, согласно (2.1.3),
card РА = 2", а для пустого .множества
card 0 = 0. Бесконечное множество
называют счетным, если оно равномощно
множеству N натуральных чисел, для которого
используют обозначение card N = N0 (произносят
«алеф-нуль»); в противном случае
бесконечное множество называют несчетным.
Мощность несчетного множества R всех
действительных чисел именуют мощностью
континуума и обозначают card R = К = 2К° ,
т.е. N > Kq (мощность континуума выше
мощности счетного множества). Всякое
бесконечное множество включает счетное
подмножество и собственное подмножество,
которому оно равномощно. Обратно, множество,
равномощное своему собственному
подмножеству, бесконечно. Каждое бесконечное
подмножество счетного множества счетно.
Объединение счетной совокупности счетных
множеств является счетным множеством, а
пересечение счетных множеств счетно или
конечно.
Глава 2.2
ЧИСЛОВЫЕ СИСТЕМЫ
2.2.1. Действительные числа.
Множество R всех действительных (или
вещественных) чисел полностью описывает система
аксиом сложения (пп. 1-4), умножения (пп. 5-
9), упорядоченности (пп. 10-13) и принцип
Дёдекинда непрерывности (п. 14).
Тождественность двух чисел а и Ь
обозначают знаком равенства = (например,
а = Ь), а если они различны, то пишут а # Ь.
Для любых чисел a, b e R определено
единственное число (a +b) eR, называемое
суммой чисел а и Ь, и единственное число
а • b еШ (далее просто ab), называемое
произведением чисел а и Ь. Число а + b
(соответственно ab) является итогом операции
сложения (умножения) чисел а и Ь,
называемых слагаемыми (сомножителями).
56
Глава 2.2. ЧИСЛОВЫЕ СИСТЕМЫ
1. Сумма обладает свойством
коммутативности: \/я, 6 е R ал-Ь-Ьл-а .
2. Va,b,ceR я + (6 + с) = (я + 6) +с
(ассоциативность суммы).
3. Существует число 0 е R , называемое
нулем, такое, что для любого я е R
а+ 0 = я.
4. \/я е R 3b eR :a + b = 0 . Такое
число b называют противоположным числу а и
обозначают b = —a.
5. \/я,6 е R ab = ba (коммутативность
произведения).
6. \/я,6,с е R я(бс) = (яб)с
(ассоциативность произведения).
7. Существует число 1 е R, называемое
единицей, такое, что для любого я е R
1 а = а , т.е. 31 е R : \/я е R 1 я = я .
8. Для любого а е R , не равного нулю,
существует единственное число b е R , такое,
что яб = 1, т.е. \/я еМ\{0) В!6бМ : ab = 1.
Такое число £ называют обратным числу
о^О и пишут b = 1 / а .
9. \/д,/),С€Е a(b + c) = ab + ac
(дистрибутивность умножения относительно
сложения). Умножение имеет приоритет перед
сложением (если нет скобок, то умножение
выполняют раньше сложения).
10. Для любых я,6 е R имеет место
одно (и только одно) из трех соотношений:
а < b, я = b , я > 6, причем а < b <=> b> а
(знаки неравенства < и > читают «меньше» и
«больше»).
11. Vtf,6,ceR : (я < Ь) л (6 < с) =»
=> а < с (транзитивность).
12. Va,b,ceR : а < b =* а + с < b + с .
13. Va,b,ceR : (я<6)л(с>0)=>
=* ас < be.
14. Если множество R разделено на два
непустых непересекающихся подмножества А
и В так, что из а е А и b < а следует
b е А , то существует единственное число
s е R , такое, что при с < s с е А , а при с >
>sсеВ.
Из этих аксиом вытекают следствия,
определяющие операции с действительными
числами при наличии равенств и неравенств:
1) 3!0eR, причем-0 = 0;
2) Уяе R 3!(-я)е R , причем я =
= -(-я) и а-а = 0;
3) Уя,6е R -я-6 = -(я + 6);
4) \/я, 6 е R 3! х: я + х = 6 ; число х
является результатом операции вычитания; его
называют разностью действительных чисел b
(уменьшаемого) и а (вычитаемого) и
обозначают х = b - а ;
5) 3!1 eR, причем 1/1 = 1;
6) Уя е R \ {0} 3! (\/а) е R , причем
1/(1/я) = я и а/а = 1 ;
7) Va,bE R\{0} (1/я) (1/6) = 1/(я6);
8) (VfleR\{0})A(V6eR) 3!х:ял: = 6;
число jc является итогом операции деления
действительных чисел; его называют частным
двух чисел (делимого b и делителя а) и
обозначают х = b/а ;
9) (Уя,се R)a(VMg R\{0}) (я/6 =
= c/rf <=> <w/ = 6c) л (я/6 = ad/(bd)) л ((я/6) х
x(c/rf) = яс/(6</))л (Ф + г/я" = яя" + &/(&/));
причем знак деления / имеет приоритет перед
знаком сложения +, т.е. если нет скобок, то
деление выполняют раньше сложения;
10) Уя,6 е R (яб = 0 <=> (я = 0) v(6 = 0)) л
л ((- я)б = -яб) л ((- я)(- 6) = яб), в
частности, (- 1)6 = -6 и (- IX- 1) = 1 •
11) VfleR (я > 0=* 1/я > 0), причем
1>0;
12) Va,b,c,d eR (я < 6=»-я>-6)л
л ((я < 6) л (с < d) =» я + с < 6 + я") л ((я <
< 6) л (с < d) л (6 > 0) л (о 0) =» яс < бя").
При я > 0 число я е R называют
положительным, а при я < 0 — отрицательным.
Если а не больше (не меньше) Ь, то пишут
я<б(я>6).
2.2.2. Числовая прямая. Задание на
прямой двух различных точек О и 1 (рис.2.2.1)
однозначно определяет систему отсчета.
Левую из них (точку О) принимают за начало
отсчета, а длину отрезка между ними — за
единицу масштаба. Прямую с заданной
системой отсчета называют координатной осью и
обозначают обычно Ох. Точка О делит
координатную ось на две части: положительную
АБСОЛЮТНОЕ ЗНАЧЕНИЕ ДЕЙСТВИТЕЛЬНОГО ЧИСЛА
57
полуось, где лежит точка 1, и отрицательную
полуось. Координатой точки М на оси Ох
называют длину отрезка ОМ, взятую со знаком
«+», если М лежит на положительной
полуоси, и со знаком «—» в противном случае.
Таким образом, каждой точке на оси Ох
однозначно соответствует действительное число,
для которой оно является ее координатой, и
наоборот. Множество R всех действительных
чисел тем самым можно рассматривать как
множество точек на координатной оси,
называемой также числовой прямой.
Если а < b , то говорят, что точка а
лежит левее b (или b лежит правее а). Числовую
прямую, дополненную точкой, обозначаемой
+ ©о и лежащей правее любой точки х е R, и
точкой, обозначаемой -°° и лежащей левее
любой точки xgR, называют расширенной
(или пополненной). В отличие от конечных
точек х eR точки +оо и -оо называют
бесконечными. Такой прямой соответствует
расширенное (пополненное) множество
действительных чисел, дополненное элементами + °°
(«плюс бесконечность») и -оо («минус
бесконечность») и обозначаемое R. Полагают,
что -оо < +оо и для всех чисел Х€Ё
-oo<x<+oo, т.е. R = {х:-оо < х <+оо}.
Объединение элементов -« и +«
обозначают оо.
Подмножествам из R при а < b
(a,b е R) отвечают промежутки числовой
прямой:
интервал (а, Ь) = [х е R: а < х < b} (при
а = Ь (а,Ь) = 0);
отрезок [a,b]={x eR : а < х < b} (при
а = Ь [а,Ь] = {а});
полуинтервалы \а,Ь)= 1х еШ :а < х < b},
(a,b] = {xeR: a<x<b};
бесконечные интервалы (- оо?+оо) = R и
[а ,-н») = [х е R: х > а}, (- оо, Ь) = {х е R: х < b);
бесконечные полуинтервалы [я,+<*>) =
= {xeR:x>a], (-oo,b] = {xe R : х < Ь).
Подмножества из R называют
числовыми множествами. Числовое множество А с R
является ограниченным сверху, если 3 С е R :
'- Vx е А х < С , и ограниченным снизу, если
ЗС е R: V* е А С' < х . Число С называют
Рис. 2.2.1
верхней границей (или мажорантой)
множества А, а С — его нижней границей (или
минорантой). Числовое множество А называют
ограниченным, если оно ограничено и сверху и
снизу.
Число М именуют точной верхней
гранью числового множества А, если М есть
верхняя граница А и Ve > 0 Зх е А:х >
> М - г, а число т — точной нижней гранью
А, если т — нижняя граница А и
Ve> 0 Зх е А.х < т + е , и используют
обозначения М = sup A = sup х и т = inf A =
хеА
= inf x (читают «супремум» и «инфимум»).
хеА
Для ограниченного сверху (снизу) числового
множества А М(т) есть наименьшее
(наибольшее) число, ограничивающее А сверху (снизу).
Если М е А (т е Л), то это число называют
наибольшим (наименьшим) элементом
множества А и обозначают max A = max x
хеА
min A = min x . Всякое непустое ограни-
хеА )
ченное сверху (снизу) числовое множество
имеет единственную верхнюю (нижнюю)
грань (принцип Вёйерштрасса непрерывности
числовой прямой).
Непрерывность числовой прямой (а
значит, и множества действительных чисел)
выражает также принцип Кантора вложенных
отрезков', любая последовательность
вложенных друг в друга отрезков [flj, by] з [fl2> ^г] 2
з [<?з, ^з] =2 • • • =2 [ап, Ьп] з... , длины которых
стремятся к нулю, имеет одну общую точку.
Все принципы непрерывности (Дедекинда
(см. 2.2.1), Вейерштрасса и Кантора)
равнозначны: любой из них можно принять как
исходную аксиому, из которой следуют два
остальных.
2.2.3. Абсолютное значение
действительного числа. Число | а | называют
абсолютным значением числа а е R , если | а | = а
при а > 0 и |д| = -д в случае а < О. При
этом VaeR Н^О, |-я| = |д|, |д|>
58
Глава 2.2. ЧИСЛОВЫЕ СИСТЕМЫ
>а, (|д| = 0«=>я = 0) и Va,beR \ab\ =
= \a\-\b\, \a/b\ = \a\/\b\{b*0), \a + b\<
<\a\ + \b\ (неравенство треугольника),
|| a | -1 b || < | a - b |. При Vfl, e R f / = 1, л)
справедливо обобщенное неравенство
треугольника
2.2.4. Натуральные, целые и
рациональные числа. Понятие натурального числа
связано с процессом счета. Натуральные
числа 1, 2, 3, ... получают последовательным
добавлением 1, начиная с 1. Они образуют
множество натуральных чисел N ,
обладающее свойствами: a) 1 е N; б) я е N =>
=» л +1 е N; в) neN=>(n-\e N «=> л * 0);
г) если подмножество А с N обладает
свойствами а) и б), то А = N .
Свойство г) называют аксиомой индукции.
Оно позволяет проводить доказательства по
методу полной (математической) индукции:
пусть зависящее от п е N утверждение В(п)
верно при п = 1 и доказано, что если В(п)
верно для некоторого п = т е N , то
справедливо также В[т +1) (так называемый шаг
индукции); тогда B(ri) верно Vaj е N . Если
индукцию начинают не с п = 1 , а с
некоторого А20 е N, то В(п\ будет верно при
(VA2 Е N) Л (п > П0) .
Связь натуральных и действительных
чисел устанавливает аксиома Архимёда:
Va, b е R (л > 0) 3neN:an> b .
Первоначально она была сформулирована для
отрезков: отложив достаточное число раз меньший
из двух заданных отрезков, всегда можно
построить отрезок, превосходящий больший.
Аксиома Архимеда следует из принципа
непрерывности числовой прямой.
Числа п - т Vn,m e N называют
целыми, они принадлежат множеству целых чисел
Z = {0, ± 1, ± 2, ± 3,...}. Сумма, разность и
произведение целых чисел всегда целые числа,
но частное от их деления не всегда является
целым. Числа k/n VA: e Z , Vaj e N
называют рациональными, они принадлежат
множеству рациональных чисел Q . Число q = k/n e
gQ не определяет однозначно числа k e Ъ
и п е N , поскольку k/n = кт/(пт) Vm e N .
Любое действительное число можно
записать в виде десятичной дроби, причем
рациональные числа и только они представимы
периодическими десятичными дробями.
Множество R \ Q включает счетное
подмножество алгебраических чисел, являющихся
нулями многочленов с целыми коэффициентами,
и подмножество трансцендентных чисел,
которые не являются нулями таких
многочленов. Числа из R \ Q называют
иррациональными. Они представимы непериодическими
десятичными дробями. Справедливы
включения: N с Z с Q с R . Множества Z и Q
являются счетными, а множество R \ Q —
несчетное. Множества Q и R \ Q являются
всюду плотными в R , т.е. в каждом интервале
числовой прямой лежат как рациональные, так
и иррациональные числа.
2.2.5. Комплексные числа. Множество
С комплексных чисел определяют как
множество упорядоченных пар z = (я,Ь), a,b e R ,
для которых равенство вводят соотношением
{аьЬ{) = (а2,Ь2)^>(а[ =Ь{)л(Ь{ = bj) и
задают операции сложения «+» и умножения
«•» пар по формулам (flj, b\) + {а2, bj) =
= (flj + a2,b{ + bj); (fli,*i) ■ (а2Л) = (*i*2 -
-b^bj , й\Ь>2 + a2t\), требуя выполнения
аксиом типа 1-9 для действительных чисел (см.
2.2.1). Эти аксиомы, в частности, гарантируют
свойства коммутативности и
ассоциативности сложения и умножения комплексных
чисел и дистрибутивности умножения
относительно сложения.
В силу однозначного соответствия между
парами (х,0) и числами х е R обозначают
х = (х,0). Пары вида (0,у) при yeR
называют (чисто) мнимыми числами, а пару
(0, 1) — мнимой единицей и обозначают через
/ (в технической литературе — часто через
j ). Поскольку /2 = (0,1) (0,1) = (— 1,0) = —1 ,
/ является нулем многочлена х + 1 .
Алгебраическая форма представления комплексного
числа следует из тождества
КОМПЛЕКСНЫЕ ЧИСЛА
59
Z = {x,y) = (x,0) + (0,y) =
= х + (0,1)-(.y,0) = * + />,
где х = Re z называют действительной, а
у = Im z — мнимой частью ь Если Re z -
= Im z = 0 , то пишут z = 0 ; в противном
случае z * 0.
Комплексные числа z = х + iy и z =
= х - iy называют (комплексно)
сопряженными. Справедливы соотношения: z = Z ; Z =
= Z«=>zeM; ZZ=x2+y2\ Rez = (z + z)/2;
Im Z = (z~ Z)J2 ; Z\ + Z2 = Zi + Z2 ; ^jZ2 =
= Z\Z2 • Модулем z \ комплексного числа
Z = x + iy является неотрицательное
действительное число Jzz = ух + у . Справедливы
соотношения | Z\Z2 \ = \ Z\ \\ Z2| и | Z\ + Z2| ^
Для комплексных чисел Z\ = Х\ + /у| и
^2 = х2 + % > заданных в алгебраической
форме представления, Z\ = Z2 <=> (*i = *2) а
л (^i = У2); *i + *2 = (*i + *2) + *{у\ + л);
£|*2 = (*1*2 - Я-Ы + *{Х\У2 + *2.Vl) •
Деление числа £| на Z2 * 0 вводят как действие,
обратное умножению, т.е. под частным Z\/Z2
Vz2 * 0 понимают комплексное число Z ,
удовлетворяющее равенству z2Z = Zi, из
которого после умножения его обеих частей на
Z2 следует Z = Z\/z2 = (*| + '>|)/(*2 + 'ДЪ) =
= ((*1*2 + У\У2) + '(*1.У2 " Х1У\))/| *2 |2 •
Возведение комплексного числа z в степень
я е N является умножением z на себя п раз
с учетом того, что i" = 1 VA2 = 4А:, /'" = /
Va2 = 4А: + 1, /" = -1 Va2 = 4k + 2 и /" = -i
Va2 = 4A: + 3, A: e N .
Комплексные числа имеют
геометрическую форму представления в виде точек (или
их радиус-векторов) на плоскости R ,
которую в этом случае называют комплексной (или
плоскостью комплексных чисел). Каждому
комплексному числу z = х + iy отвечает
точка М с абсциссой х и ординатой у (или радиус-
вектор ОМ) (рис. 2.2.2, а). Действительным
числам отвечают точки оси абсцисс Ох,
называемой действительной, а чисто мнимым —
точки оси ординат Оуу называемой мнимой
осью. Точки, отвечающие комплексно
сопряженным числам z и z , симметричны
относительно действительной оси. Расстояние
точки М до начала координат О (длина
радиус-вектора ОМ) равна | z |, а | Z\ - Z2 | равно
расстоянию между точками,
соответствующими Z\ и £2 • Сложение (вычитание)
комплексных чисел Z\ и Z2 соответствует
сложению (вычитанию) векторов в комплексной
плоскости по правилу параллелограмма (рис.
2.2.2, б).
Аргументом Argz комплексного числа
Z = х + iy называют угол ф между
положительным направлением оси Ох и
соответствующим радиус-вектором (см. рис. 2.2.2, а),
причем главное значение аргумента: argz = ф
при -тс < ф < к , т.е. Arg z = arg z + 2кк ,
k e Ъ . Равенства х = | z | cos ф и у = | z | x
ХБШф преобразуют алгебраическую форму
Рис. 2.2.;
60
Глава 2.3. ПРЕДЕЛ
представления комплексного числа в
тригонометрическую, а формула Эйлера е/ф =
= cos (р + / sin ф — в показательную форму
представления:
z = x + iy = | г | (cos ф н- / sin ф) = | г | ^'ф.
Аргумент комплексного числа z = 0 не
определен. При z * 0
_ Jarccos(x/|z|), >'>0;
1 arccos(- x/\ z |) - к, У < 0.
т.е. \zn = |zf и Argz" =nAi%z. При |г|*
Ф 0 эта формула верна для любой целой
степени п g Z , а для п = 0 z = 1 .
Для любой степени в виде несократимой
дроби # = (т/п) е Q, /w e Z , я е N :
= |z|^exp[/^P±^UEN.
Если в является действительным числом, то СРеди возможных значений zq различными
модуль комплексных чисел вида е равен
единице, т.е. в комплексной плоскости им
соответствуют точки окружности единичного
радиуса.
Если Z\ =\z\ |(cosф| +/sin<pi) и Z2 =
= | Z2|(cos Ф2 + ' sin (p2), то
Z\Z2=\ Z\Z2\ (С08(ф, + ф2) + / Sin(9i + ф2)) =
и в случае | Z2 | * 0
*i/*2 =|zi/z2|(cosfo| -Ф2) + ^ш(ф, -Ф2)) =
т.е. |^2| = |^i||z2|, Arg(z,Z2) = Arg г, +
+Argz2 , | Z\/z2\= | Z]\/\ Z2\, Aig(*i/*2) =
= Arg Z\ - Arg z2 • На комплексной
плоскости умножению соответствует поворот радиус-
вектора ОМ\ на угол ф2 (против хода часовой
стрелки при ф2 > 0) и изменение его длины
в | Z2 | раз, а делению — поворот этого
отрезка на тот же угол по ходу часовой стрелки и
изменение его длины в l/| z2\ раз. По
формуле Муавра с учетом формулы Эйлера при
neN
Zn = (| z I (cos ф + / sill ф)) =
= | Z f(cOS Яф + / Sill А2ф) = | Z \"e"^,
будут п значений, соответствующих k = 0,n-\.
В частности, при т = 1 показатель степени
q = \/п является простой дробью, т.е. речь
идет об извлечении из комплексного числа
корня степени я е N :
\1п | \\/п( ф + 2А;л . . ц + 2кк\
z -\z\ cos- + / sin— =
, A/n (.y + 2kn\ . __
= J z I exp i — , k e N.
На комплексной плоскости п различным
значениям z отвечают точки, расположенные
в вершинах правильного п-уголышка, вписан-
ного в окружность радиусом \z\ с
центром в начале координат. Одной из точек
соответствует аргумент ф/я .
Глава 2.3
ПРЕДЕЛ
2.3.1. Окрестности в точечных
множествах. Пусть а = (aha2,...,an)e R" и
b = (b\,l>2,...,bn) еМ" — две точки
точечного множества Ш." (яеМ), имеющие
координаты dj,bj еШ , i = \,п . Неотрицательное
число
\1/2
РМЧХ(*/-*)2
*./=!
(2.3.1)
ОКРЕСТНОСТИ В ТОЧЕЧНЫХ МНОЖЕСТВАХ
61
называют расстоянием между точками а и Ь.
При п = 1 р(я,#) = | d\ - £||. Множество
U(a,e) = {jteR\-p(a,Jt)<e}cR" при е>0
называют z-окрестпостью точки ае Rn. В
случае л = 1 е-окрестность точки а е R есть
интервал (а - е,а + г) числовой прямой. На
расширенной числовой прямой для бесконечных
точек U(+ оо, е) = (1/£)+оо) и у (_оо, е) =
= (-~,-1/е).
Множество U(а) с МЛ называют олре-
стностыо точки а е К", если оно включает
какую-нибудь е-окрестность этой точки. При
п = 1 и(я) есть любой интервал (с, Ь) с К,
содержащий точку я е R. В этом случае
полуинтервалы [а,Ь) и (с, я] называют
соответственно правой и левой полуокрестностями
точки а.
Для любых двух различных точек
существуют непересекающиеся окрестности
(аксиома Хаусдорфа отделимости).
Множество U(fl)\ la} , не содержащее точку ael",
называют проколотой окрестностью этой
точки и обозначают U(a). При п = 1
проколотые окрестности бесконечных точек считают
совпадающими с окрестностями этих точек, а
интервалы (в,Ь) и (с,а) рассматривают
соответственно как правую и левую проколотую
полуокрестности точки а е R .
Точную верхнюю грань расстояний между
точками множества А с R" называют его
диаметром. Множество, имеющее конечный
диаметр, является ограниченным в Rn и
может быть заключено в n-мерный шар
конечного радиуса. В противном случае его
называют пеограниченым в Rn .
Точку а е Rn именуют предельной
точкой (для) множества >lcRw, если каждая ее
е-окрестность содержит отличную от а точку
из А, причем возможно, что а е А . Каждая е-
окрестность предельной для А точки содержит
бесконечно много точек из А. Если точка
Ь е А не является предельной для А, то ее
называют изолированной. Любое бесконечное
ограниченное множество точек из Rn имеет
в Rn хотя бы одну предельную точку
(теорема Больцано — Вёйерштрасса).
Множество А с Rn является
замкнутым, если оно содержит все свои предельные
точки, и открытым, если Va e A 3U(a,e):
U (а, е) с А . Открытым множеством
является е-окрестность любой точки а е А с R" .
Пустое множество замкнуто и открыто
одновременно. Множество А с Rn замкнуто
тогда и только тогда, когда его дополнение
Rn \ А открыто. Пересечение произвольного
числа и объединение конечного числа
замкнутых множеств суть замкнутые множества, а
пересечение конечного числа и объединение
произвольного числа открытых множеств суть
открытые множества.
Точку а е А с Rn называют внутренней
точкой множества А, если 3U(a,e):
U (a,e) с А . Внутренняя точка дополнения
Rn \ А является внешней точкой для
множества А. Точку Ъ е Rn именуют граничной
точкой множества А с R" , если любая ее е-
окрестность содержит как точки из А, так и
из R" \ А , причем возможно, что Ъ £ А .
Множество дА всех граничных точек
множества А называют границей А. Объединение
А = A{jdA именуют замыканием множества
А.
Множество А с R" называют линейно
связным, если любые две его точки можно
соединить непрерывной кривой, все точки
которой принадлежат А. Множество А является
связным, если не существует таких открытых
множеств Х\ и Xj , что А с Х[ U %г ,
Х] П Х2 = 0 , причем и А П Х\ Ф 0 и
Af]X2^0 • Линейно связное множество
связно. Открытое связное множество линейно
связно. Его называют областью.
Ограниченную область называют односвязной, если ее
границу можно стянуть по области в точку, и
многосвязной в противном случае.
Объединение области и ее границы называют
замкнутой областью. Любую замкнутую кривую без
самопересечений, лежащую в односвязной
области, можно стянуть в точку путем
непрерывной деформации внутри этой области.
Множество называют выпуклым, если вместе с
62
Глава 2.3. ПРЕДЕЛ
любыми двумя точками ему принадлежат все = \im\zn} = а , то limb:,,} = а {признак схо-
точки соединяющего их отрезка. L J L J
Если объединение совокупности некото- димости промежуточной последовательности),
рых открытых множеств включает множество Для сходимости {:*„} необходимо г и доста-
А, то эта совокупность образует покрытие _ w л -, АТ ~т w \т
. г, л точно, чтобы Ve > О 3N е N : V/w > N,
множества А. Если А — замкнутое ограничен- ' '
ное множество, то из любого его покрытия, Vw > N \хп - хт I < е (критерий Коши схо-
состоящего из открытых множеств, можно ^ последовательности). Последователь-
выделить конечное покрытие множества А „ удовлетворяющую критерию Коши,
(состоящее из конечного числа множеств) - называют фундаментальной.
лемма Гёине-Борёля о конечном покрытии. Последовательность рациональных чисел
Ъ.Ъ.Ъ. Числовая последовательность и может сходиться к иррациональному числу (в
ее предел. Числовая последовательность {;*:„} том числе к трансцендентному). Примером
{(i+v-r}.
определена, если задано правило, по которо- является последовательность
му для любого номера п е N можно найти ее
ш» гч г- сходящаяся к трансцендентному числу е, рав-
элемент leK. Это правило задают либо «-10«0 с 1Л_6
п F ному 2,71828 с точностью до 5-10 ь.
формулой хп = f(n), либо рекуррентным Если Шп{хл} = а и 1ип[у„} = Ь , то
соотношением, выражающим хп через эле- limjx^} = ab и Vr, 5 е R \im{rxn +syn} =
менты с меньшими номерами. Если Vaj e = га + sb. Если, кроме того, £*0, то
е Nxn < хп+[ (в частности, хп < хп+[) или 3N eN:Vn> N уп Ф 0 и lim {*„/>>„} =
*„>*„+, (в частности, х„ > хя+1), то {хп} =а/ь Из lim{JC||} = fl следует, что {| хп\}
называют соответственно неубывающей (в ча- . .
стности, возрастающей) или невозрастающей сходится к \а\. При ит{хп} = а > 0 3N е
(в частности, убывающей) последовательно- eN: V/i># ли >0 и тогда VseR 1Ых.5} =
стью. Эти названия объединяют общим тер- L J
мином монотонная (в частности, строго мо- = as . Если при a, be К а < хп < b и
нотонная) последовательность. Последова- 3 Цт г ) е R, то fl < Iim {jC/j } < £ .
тельность [x/;j является ограниченной, если
ЗС>0 : Vwg N |х„|<С
Число а е R называют пределом после
Последовательность {л:,,} называют
бесконечно малой, если lim{jc/1} = 0. Тогда для
довательности {х„},если Ve > 0 3N(e)eN: ограниченной последовательности {уп} име-
Vn>N(z)\x„-a\<z, обозначают д = ем Urn{x^} = °- Если последовательность
= \\т{хп} = lim хя и говорят, что последо- Ы такова, что Ve > 0 3N е N : V* > N
\wn> 1 /е , то ее называют бесконечно боль-
вательность сходится к пределу а. Вне любой ' *
Е-окрестности точки а лежит лишь конечное шой и условно пишут lim{ww} = ©о . В част-
число элементов такой сходящейся к а после- hqcj^ ^ vE> 0 3N е N : Vn > N
довательности.
Последовательность может иметь только wn > 1/е (или wn < -1 / е), то пишут
один предел. Не имеющую предела последо- limfw\ = ^0 (или Цт\*п}=-~) и гово-
вательность называют расходящейся. Сходя- J L J
щаяся последовательность ограничена. Моно- рят, что последовательность \wn\ имеет
бестонная ограниченная последовательность схо-
, nrv конечный предел (в отличие от конечного пре-
дится (признак Вёиерштрасса сходимости по- г ,
следовательности), причем у неубывающей Дела lim {хл} g М , который имеет сходящая-
(не возрастающей) сходящейся последова- ся последовательность \хп}.
тельности предел совпадает с точной верхней
(нижней) гранью множества ее значений. Если Из множества элементов хп любой по-
3N е N : Vw > N уп < хп < zn и lim|>>„j= следовательности |хл} с неограниченно воз-
ПРЕДЕЛ ДЕЙСТВИТЕЛЬНОЙ ФУНКЦИИ ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО 63
растающими номерами можно составить
последовательность, называемую
подпоследовательностью данной последовательности {*„}.
Если последовательность \хЛ имеет предел
(конечный или бесконечный), то тот же
предел имеет и любая ее подпоследовательность.
Если выделенная из |xw}
подпоследовательность имеет конечный или бесконечный
предел, то его именуют частичным пределом
{*„}. Если все элементы хп различны, то
каждый частичный предел |хл} является
предельной точкой множества X = \х eR:
х= хп , п е N} . Для {*„}, имеющей предел,
частичный предел единствен и совпадает с
этим пределом. Из любой ограниченной
последовательности можно выделить
сходящуюся подпоследовательность (теорема Больцано-
Вёйерштрасса, эквивалентная признаку Вей-
ерштрасса сходимости последовательности), а
из любой неограниченной, — бесконечно
большую подпоследовательносгь. Любая
последовательность имеет наибольший
(наименьший) частичный предел, называемый
верхним (нижним) пределом. Совпадение
верхнего и нижнего пределов
последовательности равносильно тому, что она имеет
предел (конечный или бесконечный).
2.3.3. Предел последовательности
точек из R" . Последовательность [хк} точек
xk e Rn ( k е N ) точечного множества Rn
является ограниченной, если множество
[xk<=Rn : /ее n} ограниченное. Точку flel
называют пределом последовательности
{хк } точек из R" , если lim {р(я, хк )} = 0 ,
т.е. расстояния р(а,хк) точек хк е Rn до
точки а образуют бесконечно малую
последовательность, и говорят, что [хк} сходится к
точке а.
Для сходимости [хк} необходимо и
достаточно, чтобы были сходящимися числовые
последовательности каждой из координат
точек хк е. Rn . Поэтому на последовательности
точек из Rn можно перенести большинство
свойств числовых последовательностей. В
частности, последовательность {хк} является
фундаментальной, если фундаментальны
числовые последовательности каждой из
координат точек хк е R" или расстояний между
ними.
2.3.4. Предел действительной
функции действительного переменного. Пусть
действительная функция действительного
переменного (далее просто функция) f(x)
определена в проколотой окрестности V(a) фик-
сированной точки а еК расширенной
числовой прямой. Эта точка является предельной для
такой окрестности, и точка х е Via) может
0V '
сколь угодно близко приближаться к а
(стремиться к а), не совпадая с точкой а, что
обозначают х —> а . Точку b е R называют
пределом функции f(x) в точке а (или при х,
стремящемся к а) и обозначают b - lim f(x\,
X-Hl
если, какова бы ни была окрестность U(Z>)
точки 6, найдется проколотая окрестность
U(я) с U(я) точки а такая, что ее образ
/ U(fl) включен в U(^), т.е
b = lim f(x) : <=>
х->а
<*V\J(b) 3V(a):f\V(a)\czU(b).
(2.3.2)
Используют также обозначение f(x) -> b
при х —> а (или f(x) —> b ) и читают
х->а
«/(х) стремится к b при х, стремящемся к а».
Это достаточно общее определение предела
функции можно конкретизировать для
конечных и бесконечных точек а и b из R , выбрав
соответствующим образом их окрестности.
Если a,beR, то U(a) = {jceR:0<
<|х-я|<5} при 5>0, \J(b) = {yeR:
| у - b | < ej при е > 0 и вместо (2.3.2)
пишут
b= lim/(jc) : <=> Ve > О В5 > 0 :
64
Глава 2.3. ПРЕДЕЛ
(0<|х-д|<8=»|/(х)-й|<е)
Если х -» +оо 9 то U(+ oo) = |xeR:x> 1/5},
5 > 0 и при beR
b = lim f(x): <=*Ve>0 35 > 0 :
(*>l/5=»|/(*)-A|<e).
Аналогично при х —> -«> U (-°°) = {x e R :
х<-1/5}, 5>0 и при beR
b= lim /(*):<=> Ve>0 35 > 0 :
X->-°o
(jc<-l/8=»|/(jc)-ft|<e).
В двух последних случаях прямую у = b
называют односторонней (соответственно
правосторонней и левосторонней) горизонтальной
асимптотой графика функции /(*) (рис.
2.3.1, а и б). Прямую у = Z> называют
двусторонней горизонтальной асимптотой графика
f(x), когда точка beR является пределом
функции f(xj и при х —> + ©о и при
х —» -оо . В этом случае пишут
b= lim/(jc):<=>Ve>0 35>0:
X—>оо
(|*|>1/8=>|/(*)-*|<е).
Функция /(jc) имеет в точке а е R
конечный предел beR тогда и только тогда, когда
• Ve>0 3 Ща): Vx, ,х2 е Ща) |/(х,)-f(x2)\ <
< г (критерий Коши существования
конечного предела функции).
Если при х -* a eR функция f(x)
неограниченно возрастает по абсолютному
значению, то ее называют бесконечно большой
функцией при х —» а и вместо (2.3.2) пишут:
lim/(x) = oo:<=>Ve>0 3V(a):
дс-»а
JCGU(fl)=»|/(jc)|>l/e|;
lim /(jc) = +oo:<=>V8>0 3U(a):
xe \J(a)=>f(x)>\/e ;
lim /(jc) = -oo:<=>V8>0 3U(a):
xe U (a) =>/(*) <-l/e
В каждом из этих случаев бесконечного
предела функции f(x) проколотую окрестность
U(fl) точки a eR можно конкретизировать
так же, как и при beR. Если f(x) -
бесконечно большая функция при х —> а е R ,
то прямую х = а называют вертикальной
асимптотой графика этой функции (рис. 2.3.2
соответствует случаю f(x) —>+°° при х —> а ).
У*
Рис. 2.3.1
Рис. 2.3.2
СВОЙСТВА ФУНКЦИЙ, ИМЕЮЩИХ ПРЕДЕЛ В ТОЧКЕ а €Е R
65
Если в некоторой проколотой
окрестности и(я) точки a eR определены функции
f(x), g(x), h(x), для которых f(x) <
о
< g(x) < h(x) при Vx е U(fl), и существуют
совпадающие между собой пределы функций
f(x) и h(x) в точке я, то в этой точке
существует такой же предел функции g(x).
Определенная в некоторой проколотой
окрестности U(fl) точки fleR функция
fix) имеет lim fix) = b е. R тогда и только
тогда, когда для любой числовой последова-
о
тельности {*„}, такой, что xne\J(a) и
lim {хп } = а , справедливо равенство
lim {/ [хп )} = Z). Этот критерий удобно
использовать, чтобы проверить отсутствие у
функции f(x) предела в точке а.
Точка я, будучи предельной для области
определения D(f) функции f(x), может не
иметь проколотой окрестности в D{f)
(например, точка х = О в ^(/) = \х е R:
х > 0} для функции f(x) = -Jx ). Тогда
изменение аргумента х при х —> а имеет
смысл лишь по одну сторону от точки а. В
таких случаях для анализа особенностей
поведения функции при х —> а вводят понятие
одностороннего предела. Точку b e R
называют пределом справа (слева) функции f[x) в
точке а еЖ и пишут b = lim fix) =
х->я+0 ч '
= /(fl + 0) (b= lim /(jc) = /(jc-0)), если,
JC-X7-0 X ' Ч '
какова бы ни была окрестность U(Z>) точки Ь,
существует такое 5 > 0 , что f(x) e U(Z>) при
Vxe(fl,fl + 5) (при Vxe(a-8,fl)).
Функция f(x) имеет (двусторонний) предел в
точке а е Е тогда и только тогда, когда в точке
а существуют оба односторонних предела этой
функции и они совпадают. Пределы функции
f(x\ при х —> +оо и jc —> -оо можно рас-
3 — 7706
сматривать как ее односторонние пределы в
бесконечной точке °°.
2.3.5. Свойства функций, имеющих
предел в точке agR. Функция может иметь
в точке не более одного предела. Функцию
f(x) называют ограниченной на множестве X,
если 3C>0: Vjcg X с R |/(jc) | < С . В
противном случае ее называют неограниченной
на этом множестве. Функция, имеющая в
точке конечный предел, ограничена в
некоторой проколотой окрестности этой точки. Если
функция имеет в точке отличный от нуля
конечный предел, то в некоторой проколотой
окрестности этой точки значения функции
сохраняют знак предела. Знакопостоянная в
некоторой проколотой окрестности точки а
функция не может иметь в этой точке предел
другого знака. Функция, равная в некоторой
проколотой окрестности точки а постоянному
числу, имеет в точке а предел, равный этому
числу. Если в некоторой проколотой
окрестности U(а) точки а определены функции
f(x) и g(x), имеющие в этой точке
пределы, и Vjcg bid) fix) <g(x), то lim fix) <
x->a
о
< lim g(x) (при f(x) < g(x) \fx e Ща)
x—*a
пределы этих функций в точке а могут быть
равны). Для функции f(x), значения
которой в некоторой проколотой окрестности
и(я) точки а не больше (не меньше) b еШ ,
ее предел в а (если он существует) не больше
(не меньше) Ь.
Пусть 3 lim fix) = ^1иЗ lim glx) =
х-*а х-К7
= се R. Тогда Vr,5 gE
lim (r f (x) + sg (x)) = rb + sc ,
JC-»rt
lim f(x)g(x) = be и
дс->я
при с Ф 0 . Для многочлена Р„(х) = Oqx" +
+ alxn~l+...+an_\X + an , п е N , а0 ф 0 при
66
Глава 2.3. ПРЕДЕЛ
a eR lim Рп (х) = Рп (а), а для дробно-
рациональной функции при условии Pn(pi) Ф О
имеем |im(Pm(x)/Pn(x))= Рт(а)/Р„(а).
Рассмотренные свойства можно
перенести и на односторонние пределы.
2.3.6. Бесконечно малые функции.
Функцию а(х) называют бесконечно малой
(б.м.) при x-)fl€R, если lim а(х) = О .
х->я
Понятие б.м. функции неразрывно связано с
указанием об изменении ее аргумента.
Например, a(jc) — б.м. функция при х —> а + 0,
если lim а(х) = 0.
Х-Х7+0 V '
Функция /(*) имеет в точке а е R
предел b e R тогда и только тогда, когда эта
функция в некоторой проколотой окрестности
точки а равна сумме числа b и б.м. при
х —> а функции а(х). Сумма и произведение
конечного числа функций, б.м. при х —> а ,
являются функциями, б.м. при л: —> я .
Произведение функции, б.м. при х -» а , и
(Думским, ограниченной в некоторой проколотой
окрестности точки о, есть б.м. при х —> а
функция. Частные от деления единицы на
отличную от нуля в некоторой проколотой
окрестности точки а функцию, б.м. при
х —> а , и функцию, бесконечно большую (6.6.)
при х —> а , являются соответственно б.б. и
б.м. при х —> а функциями.
Пусть б.м. при х -> а функции а(х) и
Р(х) отличны от нуля в некоторой проколо-
о
той окрестности и(я) точки a eR. Их
называют б.м. одного порядка (малости) при
х -> а и пишут офс) = #(Р(*)) или
Р(х) = 0(a(x)) (символ О читают «О
большое»), если при х —> а существует отличный
от нуля конечный предел их отношения.
Функцию а(х) называют б.м. более высокого
порядка (малости) по сравнению с (или
относительно) P(jc) при х -> а и пишут
а(х) = о(р(х)) (символ о читают «о
малое»), если при х -» а существует и равен
нулю предел отношения а(х)/$(х) (или
бесконечен предел обратного отношения
P(x)/a(x). В этом случае также говорят, что
Р(х) является б.м. функцией более низкого
порядка малости по сравнению с а(х) при
х —> а (слово «малости» во всех трех случаях
обычно опускают). Произведение любых б.м.
при х —> а функций, отличных от нуля в
некоторой проколотой окрестности точки я,
есть при х —> а б.м. функция более высокого
порядка по сравнению с каждой из них.
Функции а(х) и Р(х) именуют
несравнимыми б.м. при х —> а , если не существует ни
конечного, ни бесконечного предела их
отношения при х —> а .
Равенства, содержащие символы О и о,
иногда называют асимптотическими
оценками. Эти символы, называемые символами
Ландау, используют также при сравнении
произвольных функций. Так, записи f(x) =
= o(g(x)) и fix) = 0(h(x)) означают,
что в некоторой проколотой окрестности
точки a eR соответственно f(x) = a(x)g(x),
где а(х) — функция, б.м. при х -> а , и
|/(х)|<С|Л(х)| при С>0.
При необходимости более точной
сравнительной характеристики поведения б.м.
функций при х —> а более простую из них
выбирают в качестве своего рода эталона.
Функцию а(х) называют б.м. порядка s
(s > О) относительно р(х) при х —> а , если
функции а(х) и $s(x) являются б.м. одного
порядка при х —> а . При этом пишут
а(х) = 0($s(x)). Б.м. при х -> а функции
а(х) и Р(х) называют эквивалентными и
обозначают а(х) ~ Р(*), если предел их
х->а
отношения при х —> а равен 1. Примером
эквивалентных при х —> 0 функций
являются sin х и х, для которых lim (sin x)/x = 1
х->0v "
(первый замечательный предел).
Для эквивалентности б.м. при х —> а
функций необходимо и достаточно, чтобы их
ПРЕДЕЛ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
67
разность имела при х —> а более высокий
порядок (малости) по сравнению с каждой из
них. Если при х —> а существует предел
произведения (частного) функции,
определенной в некоторой проколотой окрестности
точки а е R , и функции, б.м. при х —> а , то
он не изменится при замене б.м. функции на
эквивалентную, что позволяет при
вычислении пределов заменять под знаком предела
б.м. функции на более простые
эквивалентные. С учетом транзитивности свойства
эквивалентности можно составить цепочку
эквивалентных при х —> 0 элементарных
функций:
х ~ sin* ~ tgx ~ arcsinx ~
jc—>0 х->0 х->0 jc—>0
- arctgx ~ ln(l + x) ~ ех -1 -
х->0 л:—>0 х->0 х->0
А с Rn, причем функция /(jc) определена в
точках пересечения некоторой проколотой
окрестности точки а и множества А. Точку
b eR называют пределом функции /(jc) при
стремлении х по множеству А к точке а и
пишут b = lim /(jc) или /(jc) -> b при
->,)•-■)/,
x->0
В этой цепочке х может быть функцией,
которая отлична от нуля в некоторой проко-
о
лотой окрестности U(x) точки т и
lim x(t) = 0.
/->т v '
Пусть OLn(x), n = \,N - б.м. при
х —> а функции и а (х) — их сумма. Если
для n = 2,N ап(х) = о(щ(х)), то щ(х)
называют главной частью суммы б.м. при
X —> а функций. Если в сумме есть
несравнимые слагаемые, то выделить ее главную
часть не удается. Если же главная часть
существует, то сумма конечного числа б.м. при
х —> а функций эквивалентна своей главной
части и сохраняет ее знак в некоторой
проколотой окрестности точки я, причем если для
б.м. при х —> а е R функции существует
представление главной части в виде
А(х - а) , s > 0, то оно единственно.
Сравнение б.б. функции аналогично
сравнению б.м. функций.
2.3.7. Предел функции многих
переменных. Пусть /(jc) - действительная
функция п действительных переменных, точка
й € Rn и является предельной для множества
х->а
А
х —> а , если, какова бы ни была окрестность
А
U(£) с R точки b , существует проколотая
окрестность U(a) с Rn точки а такая, что
образ / и(а)ГМ ее общей с А части
U(a)f)A включен в U(Z>). Функция /(jc)
имеет lim /(jc) = b eR тогда и только тогда,
х->д
А
когда для любой последовательности {jty}
точек Xfr eRn (k е N ) такой, что xk z А и
limfjc^} = a e Rn , справедливо равенство
lim[/(jc^)j = b. Этот критерий удобен при
проверке отсутствия у функции f(x) многих
переменных предела в точке а е Rn .
В случае векторной функции /(*) =
= (/i(jc), ..., fm(x)) n действительных
переменных понятие предела вводится
аналогично, причем его существование и нахождение
сводится к соответствующим вопросам для ее
координатных функций, которые являются
действительными функциями п
действительных переменных: предел векторной функции
f(x\ при JC —> а существует и равен
А
Ь = {1\,..., Ьт), если для всех / = 1, т
существуют пределы функций ft (jc) при jc —> а и
А
они равны соответственно Ъ-г .
Если А = Rn, то говорят о пределе
функции в точке a eRn, не упоминая
множество А. Однако рассматривать пересечение
о
и(а)Г\А особенно важно в случае, когда
функция в некоторой окрестности точки я,
68
Глава 2.4. НЕПРЕРЫВНОСТЬ
являющейся граничной точкой множества А,
определена только в точках из множества А.
Для функции п действительных переменных
понятия «предел по множеству» и «предел»
соотносятся так же, как и понятия «предел
справа (слева)» и (просто) «предел» в точке в
случае действительной функции одного
действительного переменного. Более того, на
функции многих переменных можно перенести (с
соответствующим изменением формулировок)
большинство свойств пределов
действительных функций одного действительного
переменного.
Глава 2.4
НЕПРЕРЫВНОСТЬ
2.4.1. Непрерывность функции в
точке. Пусть действительная функция
действительного переменного (далее просто функция)
f{x) определена в некоторой окрестности
U 0 (я) фиксированной точки a eR. Эта
точка является предельной для U0(tf) и точка
х е Uq(a) может сколь угодно близко
приближаться к а (стремиться к а), вплоть до
совпадения с ней. Функцию f(x) называют
непрерывной в точке а, если, какова бы ни
была окрестность 1Л/(я м точки f(a) е. R ,
можно указать окрестность и(я) с Uq(^)
такую, что ее образ /(и(ян включен в
U(/(e)), т.е. VU (/ (a)) 3U (а) с U0 (a):
/(U(fl))cU(/(e)).
Функция, определенная в некоторой
окрестности точки а еШ , непрерывна в а тогда
и только тогда, когда в а существует предел
этой функции и он равен ее значению в этой
точке, т.е. когда lim f(x) = /Ы) • Для
непрерывности функции f(x) в точке a eR
необходимо и достаточно, чтобы любой числовой
последовательности {хп}, такой, что хп е.
е Uo(tf) и Нт{я:я} = а, отвечало равенство
lim{/(*„)} = f(a). Приращение Ay = f{x) -
- f(o) функции f(xj в точке а является
функцией, бесконечно малой при х - а =
= Ах -» 0 , т.е. lim Ay = 0 (малым прираще-
Дх->0
ниям Аде аргумента х соответствуют малые
приращения непрерывной функции).
Если функция f(x) непрерывна в точке
я, то в некоторой окрестности этой точки она
является ограниченной и при условии
/(я) Ф О — знакопостоянной. Сумма,
разность и произведение функций, непрерывных в
точке, являются функциями, непрерывными в
этой точке. Если f(x) непрерывна в точке а
и f(a) Ф О, то функция l//(*) также
непрерывна в этой точке. Если функция у = f(x)
непрерывна в точке а, а функция g(y}
непрерывна в точке Ь = f(a), то сложная
функция g(f(xj\ непрерывна в точке а, т.е.
Hm g(f(x)) = g(f(aj) = g(b) = *Qjm /(*)) .
(2.4.1)
Все элементарные функции непрерывны в
каждой точке своей области определения.
Из (2.4.1) следует, что для непрерывных
функций операция предельного перехода
перестановочна с операциями по вычислению
значения функции в соответствующей точке.
Это позволяет при вычислении предела
сложной непрерывной функции удобным образом
чередовать эти операции. Например, для
второго замечательного предела, записанного в
виде lim (1 + х) , логарифмированием и вне-
сением символа In непрерывной при
положительных значениях аргумента
логарифмической функции под знак предела получим
предел отношения (ln(l + xulx двух
эквивалентных при х —> 0 бесконечно малых
функций: In lim(l + х) /х = lim (ln(l + x))/x = 1
х->0
x->0v
Л/х
и после потенцирования lim (1 + х) = е .
дс->0
Аналогично понятию одностороннего
предела вводят понятие односторонней
непрерывности. Функцию f(x) называют
непрерывной справа {слева) в точке а, если в этой
точке у нее существует предел справа {слева) и
он равен значению функции в данной точке,
НЕПРЕРЫВНОСТЬ ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
69
т.е. f(a + 0) = f(a) (/(я - 0) = /(я)). Функция f(x), непрерывная на отрезке
Функция непрерывна в точке тогда и только А = \a,b\ , является ограниченной на А и дос-
тогда, когда она непрерывна в этой точке как , ч
справа, так и слева. тигает на А наибольшего М=тах/(х) и
2.4.2. Точки разрыва функции. Если • w \
_/ v „ наименьшего m = mmj(x) значении, причем
функция J [xj не является непрерывной в тон- хеА
ке oeR, т.е. является разрывной (имеет раз- ее область значений R(f) = [т,М]. При этом
рыв в точке а), то а называют точкой разрыва если f(a)f(b)<0, то существует хотя бы
этой функции. При этом а может быть точ- \ / \ /
кой: одна точка с е А , такая, что /(с) = 0. Для
а) устранимого разрыва, когда существует г ,
llm/(*) = *, причем если функция f(x) монотонной на М Й**»"" /(*) т =
= тт{/(й),/(*)}иЛ/ = тах{/(а),/(6)}.
определена в точке а, то ЬФ]\а) (разрыв L J
можно устранить, либо изменив значение СтРого монотонная на А = [а,Ь] функция
f(x) в а, либо, если /(*) не определена в a, f(x) непрерывна на А тогда и только тогда,
из от-
доопределив /(*) в а равенством f{a) = b); KO™a она принимает каждое значение
c4 резка \т,М]. Монотонная на отрезке функ-
б) конечного разрыва, когда в точке а су- v L ' J к 4v
ществуют конечные пределы как справа, так и ция может иметь на нем не более чем счетное
слева, но /(я + 0) Ф f(a - 0) (f(x) в а име- множество точек разрыва, причем точек раз-
v ' v / v / рыва только первого рода. Для строго моно-
ет скя««ж значений, равный |/(я + 0)- тонной и непрерывной на [я, б] функции
- f(a - 0)1 ; если f(x) определена в а, то f(x) определена обратная к ней функция
равенство f(a) = (f(a + 0) + f(a - 0))/2 ха- /'Н*)» строго монотонная и непрерывная на
рактеризует правильный разрыв. отрезке \т, М\.
Точки устранимого и конечного разрыва .
относят к точкам разрыва первого рода. Точ- Функцию f(x) называют равномерно
ками разрыва второго рода называют точки в непрерывной на множестве А с D(f), если
которых хотя бы один из односторонних преде- ч '
лов является бесконечным или не существует. для любого 8 > 0 существует 5 > 0 такое,
2.4.3. Непрерывность функции на что V^, jc2 g/1 из условия |jc, - х2| < 5 сле-
множестве. Функция fix), имеющая об- , ,
дует f(x[) - /(*2л < 8 > пРичем число 5 не
ласть определения Dyf) с К , является непре-
зависит от выбора Х\ и ^. Если функция
рывной в точках множества А с D(f), если
— v ' равномерно непрерывна в интервале или на
она непрерывна в каждой точке из А. Если отрезке А, то она непрерывна на А. Обратное
А - промежуток, то для непрерывной на А верно> если А отрезок. Если Vjc,,jc2 e \a,b] с
функции ее график на А является непрерыв- L J
ной линией. Все элементарные функции не- с/)(/) I /(jCj)- /(^2) \< Ц х\ ~ xl\» гАе
прерывны в своей области определения.
Функцию называют непрерывной в интервале L > 0 , то говорят, что функция f(x) на
(М) <= />(/) , если она непрерывна в каждой |-fl j^ удовлетворяет условию Липшица с по-
точке хе(а,Ь), и непрерывной на отрезке стоянкой Липшица L. Такая функция (равно-
[а,Ь], если она непрерывна в (а,Ь), непре- меРно) непрерывна на [а,Ь].
рывна справа в точке а и непрерывна слева в 2.4.4. Непрерывность функции многих
точке Ь. Функцию называют кусочно непре- переменных. Пусть скалярная функция
рывной на отрезке, если она непрерывна во г .R#i _> R многих переменных определена на
всех точках отрезка, за исключением
конечного числа точек разрыва первого рода. пересечении множества AczRn и некоторой
70
Глава 2.4. НЕПРЕРЫВНОСТЬ
окрестности тонки a = (ai,...,ai 9...,an)eRn. тие Функции /, непрерывной в точке по
. г/ \ „ двум переменным х( и X;. Это понятие
Функцию /(*) называют непрерывной по J
обобщают на любое меньшее п число пере-
множеству А в точке *, если, какова бы ни менных и говорят Q скалярной функции
была окрестность U(/(fl))cR точки f(a), многих переменных, непрерывной по части
переменных.
существует окрестность U(e) с R" точки а Если функция /(*) непрерывна во всех
такая, что образ Ди(а)ГМ) ее общей с А точках некоторой области (некоторого
множества), то ее называют непрерывной в этой
части \J(a)f]A включен в U(/(a)). Если области (на множестве). Если же функция
а тп>/1 " fix) во всех точках некоторого множества А
А = R , то говорят просто о скалярной J V / n^wiwpw ^ ™nu^ iDa ^
функции многих переменных, непрерывной в непрерывна по этому множеству, то ее назы-
точке я, опуская все упоминания о множестве вают непрерывной на множестве А по этому
А- множеству. Функция /(*), непрерывная на
Функция /(*) непрерывна в точке а множестве Д непрерывна на Л по А
(непрерывна по множеству А в предельной В случае векторной функции многих
переточке а множества А) тогда и только тогда, менных понятие непрерывности в точке (по
когда существует предел этой функции множеству) вводится аналогично. При этом
(соответственно, предел этой функции по мно- векторная функция непрерывна в некоторой
J4 _/ ч точке (по множеству), если все ее координат-
жеству А) в данной точке и он равен f{a). нш фунщии непрерывны в этой точке (по
Для непрерывности функции f(x) в точке а множеству).
4 ' На функции многих переменных распро-
(по множеству А в точке а) необходимо и страняются (с соответствующим изменением
достаточно, чтобы любой последовательности формулировок) некоторые свойства непре-
lxk\ точек xkeRn, /fc e N , из области Рывных действительных функций действи-
1 ' тельного переменного. В частности, если ска-
определения функции (и, соответственно, из лярная функция д,) непрерывна на ограни-
множества А) такой, что lita{xk} = а е R" , цетш замкнутш множестве Ау то она явля-
отвечало равенство i\m{f(xk)} = f(a). Этот ется ограниченной на А и достигает на А наи-
1 v /J v ' большего и наименьшего значений. Если функ-
критерий удобен при доказательстве отсутст- ция д,ч непрерывна на лиией/,0 связном
вия соответствующей непрерывности функ- v '
ции многих переменных. множестве (например, в некоторой (замк-
„ , у ЛТТ./1 т, нутой) области), то, принимая в точках этого
Пусть функция /:R -> R многих пе- множества какие-Либо два значения, она
ременных определена в некоторой окрестно- принимает на нем и любое промежуточное
сти точки а = (д, ,...,ai9...,an)e R" . Тогда в ме*ДУ ними значение.
Действительная функция f(x), опреде-
некоторой окрестности точки а{ е Е опреде- v '
лена действительная функция 9/^)= ленная на множестве /1сГ, равномерно
= / (Я] ,..., JC/,..., ап ) одного действительного
непрерывна на Л, если для любого 8 > 0
существует такое 5 > 0 , что для любых Х\, jc2 e A
переменного х.. Если функция <р(хА непре- / ч ~
' v ' при P(*|,*2J <" выполнено неравенство
рывна в точке я,-, то скалярную функцию / \ r< \ w \l
У 1*1) ~ У 1-*2) < е > гДе Р ~ расстояние в
многих переменных называют непрерывной по ' х 7 х 7|
одному переменному xt в точке я. Аналогично МЛ . Это определение отличается от опреде-
в окрестности точки (аГ,аЛ можно опреде- ления непрерывности функции на множестве
тем, что 5 не зависит от выбора JC| и jc2 .
лить функцию y[Xj ,Xj J = f(d\ ,...,X/,..., Если функция равномерно непрерывна в об-
v ласти (на множестве А), то она непрерывна в
xj>--->an) ДВУХ переменных и ввести поня- этой области (на А по множеству А). Если А -
ПОНЯТИЕ ДИФФЕРЕНЦИАЛА
71
ограниченное замкнутое множество, то верно
и обратное. Говорят, что функция f{x) на
множестве Л удовлетворяет условию Липшица с
постоянной Липшица L > О , если Vjcj , Х2 е
е А £ D{f) |/(*,) - f(x2\ < Lp(xux2). Та-
кая функция равномерно непрерывна на А.
Глава 2.5
ПРОИЗВОДНАЯ И ДИФФЕРЕНЦИАЛ
ДЕЙСТВИТЕЛЬНОЙ ФУНКЦИИ
ДЕЙСТВИТЕЛЬНОГО ПЕРЕМЕННОГО
2.5,1. Понятие производной. Пусть
fix) — действительная функция
действительного переменного х, определенная в некоторой
окрестности точки а е R . Функцию (р(х) =
= (/(*) - f(a))/(x ~ a) называют
разностным отношением функции f(x) в точке а.
Производной функции f(x) в точке а
называют предел
Птф)=\\ш/^'/^ (2.5.1)
х->о v ' jc-40 х- а
(если он существует) и обозначают ее / (а)
или df(a)jdx. Геометрически (рис. 2.5.1)
ф(х) = tg (3 , где (3 — угол наклона секущей,
проведенной через точки М$ш\/(ау1 и
М(х\ /(*)) графика функции у = f(x). Если
предел в (2.5.1) существует, то при
стремлении точки М к точке Л/0 секущая
стремится к касательной к графику функции f(x) в
точке Mq . Уравнение касательной
y = f{a) + f'(a)(x-a), (2.5.2)
причем /(fl) = tga, где a — угол наклона
касательной.
Функцию /(х) называют
дифференцируемой в точке а, если существует / (а). Она
дифференцируема справа (слева) в точке я,
У
f(x)
Ma
На)
о\
//Уж]
s*^/$\\^dx°Ax^
'а х ^
Рис. 2.5.1
если существует предел справа lim fix)
x-*a+0 v '
(слева lim fix)). Такой предел называют
производной функции f(x) справа (слева) в
точке а и обозначают / (а + 0) I/ (а - 0)1.
Эти производные именуют односторонними.
Функция дифференцируема в точке тогда и
только тогда, когда она дифференцируема и
справа и слева в этой точке.
Функция f(x) дифференцируема на
множестве X, если она дифференцируема в
каждой точке х е X (функция
дифференцируема на отрезке [я,£], если она
дифференцируема в интервале (а,Ь), дифференцируема
справа в точке а и дифференцируема слева в
точке Ь). Функцию f(x) называют
дифференцируемой, если она дифференцируема в
каждой точке своей области определения £>(/).
Если f(x) дифференцируема на X, то
функцию / {х) с областью определения
f)lf ) = X называют производной функции
fix). Операцию вычисления производной
называют дифференцированием. Производные
некоторых элементарных функций приведены в
табл. 2.5.1.
2.5.2. Понятие дифференциала.
Функция f(x), определенная в некоторой
окрестности точки а, является дифференцируемой в
72 Глава 2.5. ПРОИЗВОДНАЯ И ДИФФЕРЕНЦИАЛ ДЕЙСТВИТЕЛЬНОЙ ФУНКЦИИ
Таблица 2.5.1
/(*)
С = const
X
xs
\/х
ех
ах
In л:
loga*
7м
0
1
sxs-1
-l/x2
ex
ax In a
l/x
l/(xlna)
/W
sin x
COS*
tgx
ctgx
arcsin x
arccos x
arctg x
arcctgx
7w
cosx 1
- sin x
1 / cos2 x
-1 /sin2 x
l/Vl-x2
-i/Vi-*2
•/И2)
-»/(—2)
/W
shx
chx
thx
cthx
Arshx
Archx
Arth x
Arcth x
/w
chx
shx
l/ch2x
-l/sh2x
l/Vl + x2
l/Vx2-l
•A1-2)
-,/(x2-,)
этой точке тогда и только тогда, когда ее
приращение Ау = /(х) - f(a) в точке а предста-
вимо в виде Ay = f (а)Ах + (З(Дх)Дх , где
Ах) — бесконечно малая функция при
Дх = х-д->0. Тогда (З(Дх)Дх при Ах->0 -
бесконечно малая более высокого порядка, чем
Ах . Поэтому с использованием символа «о
малое» Ay = f (я)Дх + о(Дх). Линейное
относительно Ах слагаемое f (a)Ax
приращения функции /(х) в точке а называют
дифференциалом этой функции в точке а и
обозначают df(a). Если аргумент х функции /(х)
является независимым переменным, то его
приращение Ах обозначают через dx и
называют дифференциалом аргумента. Тогда
df(ai) = f (a)dx . Дифференциал функции в
точке а соответствует приращению ординаты
касательной к графику функции при
приращении аргумента Ах = dx = х - а (см. рис.
2.5.1).
Производную f (x) функции у = /(х) в
произвольной точке х обозначают у ,
dy/dx, df/dx, df(x)/dx.
2.5.3. Свойства дифференцируемых
функций. Дифференцируемая в точке функция
является непрерывной в этой точке. Если
функции и(х) и v(x) дифференцируемы в
некоторой точке, то в этой точке
дифференцируемы их сумма и произведение, причем
(опуская обозначение аргумента функции)
(п/ + sv) = ru' + rv Vr, s e R (дифференци-
рование — линейная операция) и {uv) =
= u'v + uv , а если в этой точке v Ф О , то
дифференцируемо их частное и (ujv) =
= (u'v-uv')/v2 .
Если функции /(х) и #(>>)
дифференцируемы соответственно в точках а и
b = f(a), то в точке а дифференцируема
сложная функция А(х) = g[f(xj\, причем ее
производная h\x) = g\b)f\a) = g(f(o))f\a)
и ее дифференциал dh(a) = h'(a)dx = g'{b)dy,
где dy- f'{a)dx, обладает свойством шюа-
риантности формы записи по отношению к
аргументам х и у. Если функция >> = /(х)
строго монотонна в некоторой окрестности
точки а и существует / (я) * 0 , то в точке
£ = f(a) существует производная g (Z>) = \/f (a)
функции g(y) = f~ [у), обратной к /(х).
p
БЕСКОНЕЧНАЯ ПРОИЗВОДНАЯ
73
2.5.4. Бесконечная производная. Если
функция f(x) является непрерывной справа
(слева) в точке а е R и / (х) при х ->
—> а + 0 (при х —> а -0) — бесконечно
большая функция, то говорят, что в точке а
функция f(x) имеет бесконечную правую (левую)
производную. При этом условно пишут
/ (а + 0) = +оо или / (а + 0) = -оо
(соответственно / (а - 0) = +оо или / (а - 0) = -оо).
Соответствующая касательная к графику
функции в этой точке вертикальна.
Если функция /(*) является
непрерывной в точке а и знаки бесконечных
односторонних производных в этой точке совпадают, то
говорят, что в точке а функция имеет
бесконечную двустороннюю производную
определенного знака и условно пишут / (а) = +оо или
f (а) = -©о . График функции в окрестности
такой точки имеет вид, показанный
соответственно на рис. 2.5.2, а и б. Если же знаки
бесконечных односторонних производных
различны, то у этой функции в данной точке
не существует бесконечной двусторонней
производной определенного знака и возможна
лишь условная запись / (а) = ©о , в этом
случае на графике функции будет точка
заострения, причем сочетанию / (а - 0) = +оо
и / (а + 0) = -о© соответствует рис. 2.5.3, в, а
обратному сочетанию — рис. 2.5.3, г. Если
функция f(x) непрерывна и строго
монотонна в некоторой окрестности точки а, то
при / (а) = 0 обратная к f(x) функция
будет иметь в точке f(a) бесконечную
производную определенного знака (и наоборот, в
случае / (а) = ±©о производная обратной к
f(x) функции в точке f(a) равна нулю).
У1
<а)
0
\ S
гт
у а
X
а)
Рис. 2.5.2
74 Глава 2.5. ПРОИЗВОДНАЯ И ДИФФЕРЕНЦИАЛ ДЕЙСТВИТЕЛЬНОЙ ФУНКЦИИ
2.5.5. Производные и дифференциалы
высших порядков. Пусть производная f (х)
функции f(x) является дифференцируемой в
точке а е Mf) • Тогда (/'(*))
ют второй производной (или производной
второго порядка) функции /(*) в этой точке и
обозначают / "(я), a d2f(a) = f"(a)dx2
называют вторым дифференциалом (или диф-
ференциалом второго порядка, причем dx
означает (dx) . Вторую производную
функции у - f{x) в произвольной точке х
обозначают у" , d2y/dx2 , d2f/dx2 .
Аналогичным образом определяют п-ю
производную (или производную п-го порядка) и
п-й дифференциал (или дифференциал п-го
порядка) функции f(x) в точке а:
шут / , / , — • Функцию называют л раз
дифференцируемой в точке, если в этой точке
существует ее л-я производная. Для т + л раз
дифференцируемой в точке а функции
/(*) верно [Am\x)fl
f(m+n\a) =
=(/wm|
Ml
f (%)={/("-%))
и rfW/(e) =
r(")(
= f^n'(x)dxn . Дифференциалы высших
порядков сложной функции в общем случае не
обладают свойством инвариантности формы
записи.
Третью производную обычно обознача-
/•'" Л4) Л5)
ют / , а вместо /v ', /v ', ... иногда пи-
Функцию называют л раз непрерывно
дифференцируемой на множестве X, если она л
раз непрерывно дифференцируема в каждой
точке х е X и ее л-я производная является
непрерывной функцией на множестве X. В
случае п е N говорят, что функция бесконечно
дифференцируема на X. Если функции и(х) и
v(x) n раз дифференцируемы в точке а, то
их произведение также л раз дифференцируемо
в этой точке и справедлива формула Лейбница
(u(x)v(X)f\ =±CkJk){a)v^(a),
(2.5.3)
причем С° = Спп = 1 (см. 2.1.7) и iS°\a) =
= м(д), гЛ '(д) = а(д).
Для некоторых функций л-е
производные представлены в табл. 2.5.2.
Таблица 2.5.2
/(*)
в**
/«(*)
т\хт-"/(т-п)\
(при п> теЦ
(*")W-0)
(*lna)V*
/м
sin /лх
COS/ШГ
/{n)w
хл hi д
mn s'm(mx + пк/2)
mn cos(/wx + ля/2)
/w
shx
chx
f{"\x)
sh x (л четное)
ch x (л нечетное)
ch x (л четное)
sh x (л нечетное)
ПРАВИЛО БЕРНУЛЛИ-ЛОПИТАЛЯ ВЫЧИСЛЕНИЯ ПРЕДЕЛОВ
75
Глава 2.6
ОСНОВНЫЕ ТЕОРЕМЫ
ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
2.6.1. Теоремы о нуле производной.
Если действительная функция /(*)
действительного переменного определена в некоторой
окрестности точки ogR, является
дифференцируемой в этой точке и достигает в ней
наибольшего (или наименьшего) значения, то
производная этой функции в точке а равна
нулю (теорема Ферма). Геометрически
утверждение теоремы Ферма означает, что
касательная к графику дифференцируемой
функции в точке ее наибольшего или наименьшего
значения параллельна оси Ох. Существенно
то, что функцию следует рассматривать в
двусторонней окрестности точки а. В противном
случае утверждение теоремы Ферма может не
иметь места.
Если функция f(x) является
непрерывной на отрезке [я,£], дифференцируемой в
интервале (а, Ь) и принимает на концах
отрезка равные значения, то хотя бы в одной
внутренней точке отрезка производная этой
функции равна нулю (теорема Рдлля). В
частном случае f(a) = f(ti) = 0 справедливо
утверждение: между двумя нулями
дифференцируемой функции лежит хотя бы один нуль
ее производной.
2.6.2. Теоремы о промежуточном
значении производной. Если действительная
функция f(x) является непрерывной на
отрезке \Oyb\ и дифференцируемой в интервале
(a,ti), то ее конечное приращение на этом
отрезке равно произведению значения ее
производной f (xq) в некоторой внутренней точке
х0 отрезка и его длины (теорема Лагранжа),
т.е. справедлива формула Лагранжа конечных
приращений
f(b)-f(a) = f'{x0){b-a) или
/(л + Дх)-/(д) = /'(л + 0Дх)Дх,
(2.6.1)
где Ах = Ь- а и 0е (0, 1). Геометрический
смысл теоремы Лагранжа: на дуге графика
дифференцируемой функции между концами А
и В этой дуги можно найти хотя бы одну
точку, в которой касательная к графику
параллельна хорде АВ с угловым коэффициентом
(f(b)- f{cm{b- я), стягивающей концы
дуги. Отметим, что если /'(*) = 0 Vxe (a,b),
то f(x) = с = const на отрезке [а, Ь\.
Пусть функции f(x) и g(x)
непрерывны на отрезке [я,£] и дифференцируемы
в интервале (а,Ь). Тогда по теореме Кошй
существует хотя бы одна точка Хце(а,Ь),
такая, что (f(b) - f(a))g'(x0) = (g(b) -
-g(a))f(xo). Если к тому же Vxe(a,b)
g\x) Ф 0 , то g(b) Ф g(a) и
/(*)-/И_/'Ы
g{b)-g(a) g\Xo)
x0e(a,b). (2.6.2)
2.6.3. Правило Бернулли-Лопиталя
вычисления пределов. Пусть действительные
функции f(x) и g(x) определены и являются
дифференцируемыми в некоторой проколотой
окрестности точки agR расширенной
числовой прямой и обе бесконечно малыми (или обе
бесконечно большими) при х —> а . Переход к
пределу их отношения f(x)/g(x) при х -> а
приводит к неопределенности типа 0/0 (или
©о/©©). Если существует конечный или
бесконечный предел lim(/'(x)/g'(x)) = А , то и
lim (f(x)/g(x)) - А (правило
Бернулли-Лопиталя). Когда указанные условия выполнены
только в правой (или только в левой)
проколотой полуокрестности точки а, то это правило
верно в отношении только предела справа
(или только предела слева) отношения
f(x)/g(x) в этой точке.
Если при х ~» а функции / (х) и
g (x) являются обе бесконечно малыми или
бесконечно большими, дифференцируемы в
некоторой проколотой окрестности точки а и
существует предел liml/ (x)/g (*)) = А , то
76
Глава 2.6. ОСНОВНЫЕ ТЕОРЕМЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
\im(f\x)/g\x)) = Um(f(x)/g(x)) = A . Итак,
это правило можно применять
последовательно, если выполнены указанные условия для
производных более высокого порядка. Перед
каждым последующим его применением
полученное на предыдущем этапе отношение
бесконечно малых или бесконечно больших
функций заменой на эквивалентные функции
можно преобразовать к более удобному виду.
К двум основным типам
неопределенностей (0/0 и оо/оо) тождественными
преобразованиями можно свести неопределенности
типа ±оо + оо,0<»,1оо,0 и ©о0 . Так, если
при х —> а функции f(x) и g(x)
бесконечно большие, то неопределенность типа
±оо + оо в зависимости от удобства
последующих вычислений преобразованием
/(*)-*(*)'
1
1
1//М V*M
!/*(*)-У/(*) /Щх)
т*ш \/(ых)-щх))
можно свести к типу 0/0 или оо/оо. В
некоторых случаях освободиться от
неопределенности типа ±оо + оо в иррациональных
выражениях можно путем переноса иррациональности в
знаменатель. Если при х —> a f(x) —
бесконечно малая и g(x) — бесконечно большая
функции, то неопределенность типа 0 • ©о
преобразованием f(x)g{x) = f(x)/(\/g(x)) =
= g(x)/(l//(x)J также можно свести к типу
0/0 ИЛИ оо/оо.
Неопределенности типа Г°, 0 и ©о
возникают при вычислении предела
показательно-степенной функции и(х) * ', когда при
х -> а либо и(х) -> 1, a v(x) - бесконечно
большая функция, либо и н(х), и v(x) —
бесконечно малые функции, либо и(х) —
бесконечно большая, a v(x) — бесконечно
малая функции. Тогда преобразованием
lim u(x)v^x' = expf lim v(x) In u(x) неопре-
x->a \x-*a J
деленности этих типов можно свести к
неопределенности типа ©о • 0 (или 0 • сю )> которую
затем привести к типу 0/0 или оо/оо.
2.6.4. Формула Тейлора. Если
действительная функция f(x) является п раз
дифференцируемой в точке а е R , то f(x) пред-
ставима формулой Тейлора п-го порядка
f(x) = P„(x) + R„(x), (2.6.3)
где
/'
■(*)
ад=Хтг<х-а) (2-6-4)
*=о
многочлен Тейлора п-й степени (0! = 1 и
/ (я) = /(я)), a Rn(x) — остаточный
член, который может быть записан в форме
Пеано Rn(x) = о\ (х - а)" I.
Многочлен Тейлора является
единственным многочленом степени п, который в
окрестности точки а представляет п раз
дифференцируемую в этой точке функцию с
погрешностью более высокого порядка, чем
(х - а) . В этом смысле Р„{х) является
многочленом наилучшего приближения. Если
f(x) дифференцируема п + 1 раз в
некоторой окрестности точки а, то в этой
окрестности остаточный член можно записать в форме
Лагранжа
ед=
/И+1\х +
*^&{х-аГ,
(я + 1)!
©€(0,1).
(2.6.5)
При а = 0 (2.6.3) называют формулой Маклд-
рена. В частном случае п = 0 (2.6.3) с учетом
(2.6.5) переходит в (2.6.1).
Формула Тейлора позволяет изучение
некоторых свойств дифференцируемой
определенное число раз функции заменить
исследованием соответствующего многочлена
Тейлора. Формулу Тейлора применяют для
вычисления пределов и приближенных значений
функций, исследования их экстремумов,
точек перегиба, интервалов выпуклости и
вогнутости, сходимости рядов и интегралов и т.п.
ВОЗРАСТАНИЕ И УБЫВАНИЕ ФУНКЦИИ. ЭКСТРЕМУМ
77
Глава 2.7
ИССЛЕДОВАНИЕ ФУНКЦИЙ
2.7.1. Возрастание и убывание
функции. Экстремум. Дифференцируемая в
интервале (о,Ь) действительная функция f(x)
является возрастающей {убывающей) в этом
интервале, если Vx e (a, b) /'(*) > 0 (/'(*) <
< 0) (неубывающей (невозрастающей), если
Vx е (д, b) f\x) > 0 (/'(х) < О)). Итак, зна-
копостоянство производной f (х) в интервале
достаточно для того, чтобы функция f(x) в
этом интервале была строго монотонной.
Пусть функция f(x) определена в
интервале (а,Ь). Значение /(х0) в точке Xq e
е(а,Ь) называют локальным максимумом
(локальным минимумом) этой функции в данном
интервале, если существует проколотая окре-
о
стность U(xq) с (о,Ь) точки Xq , такая, что
VxeU(xo) f(x)*f{xo) (f(x)>f(x0j).
(2.7.1)
Локальные максимум и минимум объединяют
общим названием локальный экстремум, а
точку Xq называют тонкой локального
экстремума функции. Если в (2.7.1) выполнены
строгие неравенства, то Xq называют точкой
строгого локального максимума (минимума),
объединяя эти понятия общим термином
строгий локальный экстремум. Значение
функции в точке экстремума иногда называют
экстремальным (соответственно
максимальным или минимальным).
На рис. 2.7.1 сплошная линия
соответствует графику функции f(x), определенной на
отрезке [a,b], причем х0 , d и Х\ - точки
строго локального максимума, х2 ~~ точка
строгого локального минимума, с — точка
локального минимума, Vxe(c,*/) - точки
локального экстремума (локальных
максимума и минимума одновременно). Далее слова
«строгий» и «локальный» опустим. Функция
не определена в полной окрестности концов
отрезка [я,£] и точки а и Ъ не являются
точками экстремума (иногда говорят, что а —
точка краевого минимума, а Ь — точка
краевого максимума).
Точку Xq называют стационарной
тонкой функции f(x), если функция является
дифференцируемой в этой точке и / (xq) = 0 .
Для существования в точке Xq экстремума
функции необходимо, чтобы Xq была
стационарной точкой этой функции либо ее
производная в этой точке не существовала.
Точки, в которых выполнено это необходимое
условие существования экстремума функции,
называют ее критическими точками (на рис.
Рис. 2.7.1
78
Глава 2.7. ИССЛЕДОВАНИЕ ФУНКЦИЙ
2.7.1 точки Хз , Xq , Vx g [с,*/], *4 » *1 » x2 интервале, если VX|,x2 е (я,£) при q e (0,1)
и х5 ). и х3 = ^ + (1 - q)x2
Если функция f(x) является непрерыв-
ной в некоторой окрестности точки Xq и ,2 7 2^
дифференцируема в ее проколотой окрестно- /w \<а f(x \ + (\_Q\ f(x ))
сти, то достаточным условием существования \J\3)-4J\\) \ 4)J \ 2))-
в этой точке экстремума данной функции - /л п лч
к , Если в (2.7.2) выполнены строгие неравенст-
является смена знака / (х) при переходе ар- ва> то ГОВОрят, что f{x) строго выпукла вверх
гумента х через значение х0 , причем, если (<WIIJ) в интервале (а,Ь). Вместо «выпуклая
при возрастании х /'(*) меняет знак с плюса вверх» часто говорят «выпуклая», а вместо
на минус, то имеем максимум, а в противном «выпуклая вниз» - «вогнутая». Любая дуга
,( v графика строго выпуклой вверх (вниз) функ-
случае - минимум. По графику / (х) (штри- ции лежит выше (ниже) стягивающей эту дугу
ховая линия на рис. 2.7.1) можно установить, хорды.
что это достаточное условие применимо к Дифференцируемая в интервале (а,Ь)
критическим точкам x-i, Хп , Vx e \c,d), w ч
J u l ' / функция /\Х) выпукла вверх (вниз), если
х4 у Х\ , Xj и Хк и выполнено лишь для w / , ч
412 5 , . Vx^e^,*)
точек Xq , Х[ и X]. Если функция f(x) в
некоторой окрестности точки х0 дифферен- /(*2) -/(*1) +/'(х1 )(х2 ~ *1)
цируема по крайней мере п + 1 раз, п е N , (2.7.3)
причем все ее производные до л-го порядка / г<х \ > г<х \ У/х ух _ \\
включительно в этой точке равны нулю, то ^Л 2/-Л lj J \ ij[ 2 {))•
при нечетном п Xq является точкой экстре-
Если в (2.7.3) выполнены строгие неравенст-
мума данной функции (при /("+1)(x0) < 0 - ва> то Функция строго выпукла вверх (вниз).
v Все точки графика строго выпуклой вверх
точкой максимума, при /("+1) (х0) > 0 - (вниз) ФУНК^ИИ лежат ниже <выше) любой
проведенной к нему касательной (кроме точ-
точкой минимума). Если Xq — стационарная ки ее касания). Производная функции, выпук-
точка f(x) и существует /"(х0)* 0 , то при лой ввеРх <вниз> в интервале (а,Ь), является
„ невозрастающей (неубывающей) функцией в
f [Xq) < 0 Xq — точка максимума, а при этом интервале (производная строго выпуклой
-"/ ч л , вверх (вниз) функции является убывающей
f (х0)> 0 х0 - точка минимума функции {возрастающей) функцией. Дважды дифферен-
f(x). цируемая в интервале (я,£) функция f(x)
Достаточные условия существования выпукла вверх (вниз) в этом интервале тогда
экстремума не применимы к критическим и только тогда> когда Vx e M)
точкам, в которых функция терпит разрыв v '
(точка d на рис. 2.7.1). Такие точки исследу- f'4%\ < 0 if'ux > Q\ (ддя ой выпукло.
ют, непосредственно используя определение v ' \ v ' )
точки экстремума. Для непрерывной функции сти вверх (вниз) достаточно, чтобы Vx e (a,b)
точка экстремума функции служит общей v '
границей интервалов возрастания и убывания f"(x\ < 0 (f"(x\ > 0\
этой функции (точки Xq , *j и х2 на рис. * '
2.1 А). Точку Xq на границе интервалов с раз-
2.7.2. Выпуклость и точки перегиба. личными направлениями строгой выпуклости
Функцию /(*), определенную в интервале непрерывной функции f(x) называют точкой
(д,£), называют выпуклой вверх (вниз) в этом перегиба этой функции, а точку (*о;/(*о)) _
ОБЩАЯ СХЕМА ИССЛЕДОВАНИЯ ФУНКЦИИ
79
точкой перегиба графика этой функции. Если
в точке перегиба графика функции существует
касательная, т.е. в точке х0 функция имеет
производную (конечную или двустороннюю
бесконечную определенного знака), то эта
касательная пересекает график в точке
(*ь;/(*ь))-
Для функции f(x), дважды
дифференцируемой в окрестности ее точки х0
перегиба, / (х0) = 0 . Если для дважды
дифференцируемой в некоторой проколотой
окрестности точки Xq функции f(x) ее вторая
производная f (х) меняет знак при переходе
аргумента х через значение х0 , то Xq
является точкой перегиба этой функции. Если
функция f(x) в некоторой окрестности
точки Xq дифференцируема по крайней мере
п > 2 раз, причем /"(х0) =...= рп~ '(х0) =
= 0 и /^(*о)*0, то ПРИ п нечетном х0
является точкой перегиба этой функции.
2.7.3. Наибольшее и наименьшее
значения функции. Функция /(*), непрерывная
на отрезке [я>^], достигает на нем своих
наибольшего М и наименьшего т значений (см.
2.4.3). Если этот отрезок не содержит
критических точек функции f(x), и она является
дифференцируемой в интервале (а,Ь), то ее
производная f (х) знакопостоянна в этом
интервале. Тогда /(х) строго монотонна на
[я,£] и М равно наибольшему, а т -
наименьшему из значений f(a) и /(£)•
Если же отрезок [я,£] содержит конечное
число критических точек непрерывной на нем
функции f(x), то М и т можно найти
перебором значений функции в точках а и b и во
всех критических точках. Используя
достаточное условие существования экстремума,
целесообразно из критических точек для
перебора оставить лишь точки максимума и
минимума данной функции. Если функция в
интервале (я,£) строго выпукла вверх (вниз),
то в этом интервале она может иметь не более
одной точки максимума (минимума),
значение функции в которой и будет совпадать с М
{т).
Найденные указанным путем значения
Мит называют иногда соответственно
абсолютным (или глобальным) максимумом и
минимумом функции f(x) на отрезке [я,£].
Понятия абсолютного (или глобального)
максимума и минимума объединяют термином
абсолютный (или глобальный) экстремум,
применимым к любому множеству, на
котором определена функция. Если это множество
совпадает с областью определения функции, то
упоминание о нем опускают.
2.7.4. Общая схема исследования
функции. Наиболее наглядное представление
о поведении действительной функции f(x)
одного действительного переменного х дает ее
график. Построению графика функции
(точнее, его эскиза) обычно предшествует
исследование функции методами теории пределов и
дифференциального исчисления, включающее
следующие этапы:
1. Установление области определения
функции и выяснения, является ли функция
четной, нечетной, периодической',
2. Поиск точек разрыва функции и их
классификация, нахождение вертикальных
асимптот графика функции и промежутков, в
которых она является непрерывной;
3. Нахождение нулей функции f(x)
путем решения уравнения f(x) = 0;
4. Установление промежутков, в
которых функция является (строго) монотонной,
поиск критических точек функции, выделение
из них ее точек экстремума, нахождение
значений функции в критических точках;
5. Установление промежутков, в которых
функция является (строго) выпуклой вверх
(вниз), нахождение точек перегиба функции и
значений функции в этих точках;
6. Исследование поведения функции
при х —> ±оо . Если существуют конечные
пределы lim (f(x)/x) = к и lim (f(x) -kx) = b,
то график функции /(х) при х —> +<»
неограниченно приближается к наклонной
правосторонней асимптоте с уравнением
у = kx + b (в случае к = 0 асимптота будет
горизонтальной правосторонней). Если
существуют конечные пределы lim (f(x)/x) = к и
lim (/(*)- kx) = b , то график имеет на-
80
Глава 2.8. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
клонную левостороннюю асимптоту (в случае
к = 0 — горизонтальную левостороннюю).
При к = к и b = b график имеет
наклонную двустороннюю асимптоту. В частном
случае к = к = 0 асимптота будет
горизонтальной двусторонней.
Результаты перечисленных этапов
исследования функции позволяют построить эскиз
ее графика, достаточно полно
характеризующий поведение функции в ее области
определения.
Глава 2.8
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
2.8.1. Частные производные. Пусть
скалярная функция f :Rn —> R многих
переменных определена в некоторой окрестности
точки a = (ci[ ,...,я,- ,...,яя)е R" . Тогда в
некоторой окрестности точки щ е R
определена действительная функция ф, (*/) = /(fli ,•••,
X;,...,tfw) одного действительного
переменного х,. Производную ф/(в/) функции ф/(х/)
в точке я, называют частной производной
скалярной функции / многих переменных в
точке а по переменному х, и обозначают
/*',(«) или д/(а)/дх{ .
Если в некоторой окрестности точки а
определена векторная функция f : Rn —> Rm
многих переменных с координатными функциями
fj: Rn —> R , j = 1, m , имеющими в этой
точке частные производные по х,, то
существует частная производная векторной функции
/ в точке а по переменному X/, равная
Ъ/{а) (Щ(а) Ща) д/т(а))
Эх, I Эх/ ' ' Эх, ''*'' Эх,
с R" области определения D(f) функции f ,
то она равна векторной функции,
координатными функциями которой являются
производные Э/у(х)/Эх/ , j = 1,/и .
Пусть функция / имеет в точке
х е D(f) частные производные по всем
независимым переменным X/, / = \,п . Тогда из
частных производных ее координатных
функций можно составить прямоугольную матрицу
Якдби
/'(*)-
¥т {х)/дхп
Э/i (x)fan
¥т (x)fan
Обратно, если существует Э/(я)/Эх, , то
существуют все производные Э/ДяуЭх, ,
j = \,m . Если существует Э/(х)/Эх, в
некоторой точке х = (xj,...,X/,...,xw) g/)(/) с
размером тх п. Если т-п, то матрица
Якоби квадратная и ее определитель называют
якобианом. Матрицу Якоби часто записывают
в виде блочной матрицы-столбца или
матрицы-строки (в последнем случае каждый блок
этой матрицы является матрицей Якоби
соответствующей координатной функции).
Геометрическую интерпретацию частной
производной скалярной функции можно дать
на примере функции f(^\,x2) Д°УХ
переменных. Графиком этой функции будет
некоторая поверхность, заданная в прямоугольной
системе координат Ох\Х2х^ уравнением Хз =
= /(х[,Х2). Уравнениями линий Т\ и Г2
пересечения этой поверхности плоскостями
Х2 = а2 и Х| = а\ будут соответственно
x3=/(xi,fl2) и *з = f(a\>x2)- Эти линии
имеют общую точку M{a\,a2,f(a\,a2j\ e R3 .
Пусть в точке а = (ai,a2} eR существуют
частные производные функции / по Xj и х2 .
Тогда Э/(л)/Эх1 = tg cti и Э//Эх2 = tg a2 ,
где ОС] - угол между касательной к Г] в
точке М и осью Ох\, а2 _ угол между
касательной к Г2 в точке М и осью Ох2 .
2.8.2. Дифференцируемость функций
многих переменных. Пусть векторная
функция f : Rn —> Rm многих переменных
определена в некоторой окрестности точки
ЧАСТНЫЕ ПРОИЗВОДНЫЕ ВЫСШИХ ПОРЯДКОВ
81
х = (х{,...,хп) g Шп и Ах = (Axj... Дхл)т —
такой вектор приращения независимых
переменных х,- , / = 1,л , что точка х + Ах тоже
принадлежит этой окрестности. Тогда
соответствующее приращение Af(x) = /(х + Ax) -
~ f{x) Функции f называют ее полным
приращением в точке х. Функцию называют
дифференцируемой в точке дг, если ее полное
приращение в окрестности этой точки можно
представить в виде
Af(x)=AAx + a(Ax^Ax\, (2.8.1)
где А — матрица размером тх п, элементы
которой не зависят от Ах , |Дх| - длина
вектора Ах , а векторная функция ос(Дх)
является бесконечно малой при | Ах | —> 0 .
Линейное относительно Ах слагаемое
А Ах в правой части (2.8.1) называют
дифференциалом функции / и обозначают df(x).
Дифференциалы dx,-, / = 1,л, независимых
переменных равны приращениям Дх, этих
переменных, поэтому Ax = dx и
<//(*) = f\x)dx = У J£-&f. . (2.8.2)
Каждое слагаемое в правой части (2.8.2)
иногда называют частичным дифференциалом
функции / в точке х eRn (в таком случае
левую часть (2.8.2) называют полным
дифференциалом функции /в этой точке).
Дифференцируемая в точке х векторная функция f
является непрерывной в этой точке и имеет в
ней все частные производные, причем матрица
Л совпадает с матрицей Якоби f (х).
Функция/дифференцируема в точке х,
если в этой точке дифференцируемы все
ее координатные функции /,• : R" —> Rm ,
У = 1, /м . Скалярная координатная функция
fj многих переменных является
дифференцируемой в точке jcgM", если она в этой
точке имеет частные производные по всем
независимым переменным х,- (/ = 1,я) и эти
производные непрерывны в точке х. Если
функция / дифференцируема во всех точках
некоторой области, то ее называют
дифференцируемой в этой области.
Если векторная функция / : Rn -> Rm
дифференцируема в точке х° е Rn , а вектор-
ш к
ная функция g : R —> R дифференцируема
в точке у° =flx°)e Rm, то сложная функция
+ и к
g о / : R" —> R дифференцируема в точке
х°, причем (go/) (x°) = g'(y°)f'(x0), где
g\y°) — матрица Якоби функции g в точке
у°, a f'(a) — матрица Якоби функции /в
точке х°. Дифференциал сложной функции
имеет свойство инвариантности формы записи:
d(g°f) = (g°fj(x°)dx = g'(y°)f'(x°)dx =
= g'(f)dy,
где dy — f'(x°\dx - дифференциал функции
/в точке х° е R".
Для сложной функции элементы матри-
цы Якоби (g о /) (х) размером к х п имеют
вид
При п = к = 1 отсюда следует равенство
dx ^dyj Эх '
называемое полной производной сложной
функции #(/(*)) в точке jcgR.
2.8.3. Частные производные высших
порядков. Пусть скалярная функция многих
переменных /: R'1 —> R во всех точках неко-
82
Глава 2.8. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
торой окрестности тонки х имеет частные
производные bf{x)jdxi , / = 1,л . Тогда каждая
из этих частных производных сама является
скалярной функцией многих переменных,
определенной в окрестности точки х°, и
может оказаться, что она имеет частную
производную в точке jc°, например, по переменному
X;. Частную производную
"у •
«ьИ-£
№'П
Эдс/
называют частной производной второго
порядка по переменным хг и X: в точке х° и
обозначают (d2f(x°)y(dXjdXi) или fx,xj(x°)
(иногда в первом обозначении изменяют
порядок независимых переменных). В связи с
этим fx{x) называют частной производной
первого порядка.
Всего у рассматриваемой функции в
точке jc° может быть п частных производных
второго порядка. При i Ф j их называют
смешанными. Значения смешанных
производных fxiXj {*) И fxjxj (*) в точке х° > в ко"
торой они являются непрерывными
функциями по части переменных jc#- и х.-, совпадают,
т.е. в этом случае значение смешанной
производной не зависит от порядка
дифференцирования. При j = i используют обозначение
(э2'И)/К)./^
или /
Если все частные производные второго
порядка рассматриваемой функции
существуют, то можно составить квадратную матрицу
порядка п
(b2f{x) д2/(х) Э2/(*)4
/'(*)«
Эх,2
дХ2^Х\
*А*)
дХ\ Э*2
э2/(*)
Эх2
#№
ОХ\ ОХп
Э2/(х)
оХп оХ\ dxfJ оХ2
аХ2оХп
Эх2
которую называют матрицей Гессе. Если все
смешанные производные по переменным х-,
и X: (/,у = 1,л ) непрерывны по этим
переменным, то эта матрица является
симметрической.
Аналогично частным производным
второго порядка вводят частные производные
высших порядков. Частную производную к-то
порядка (к > 1) функции /: R" —> R
определяют как частную производную первого
порядка от частной производной (fc-l)-ro
порядка этой функции. Например, для этой
функции возможно существование в точке
х g R" частных производных порядка к вида
(э*(х))/(эх1/'...Эх,/'...Эх^)> где /,+...+/,+•••
+1п = к . Как и в случае частных
производных второго порядка, при условии
непрерывности в точке х любой k-vi производной в
этой точке, ее значение не зависит от порядка
дифференцирования.
Через С (X) обозначают множество
тех скалярных функций /: X с R" —> R , у
которых все частные производные до порядка
к включительно непрерывны в области X. Для
множества векторных функций / : X с:
сКл-)Е'", все координатные функции
которых принадлежат С (X), используют
обозначение Функции из множеств
Ск(Х) и Ck(x,Rm) называют к-раз
непрерывно дифференцируемыми в области X. В
обозначениях этих множеств допустим случай
к = оо, которому соответствуют функции,
бесконечно дифференцируемые в области X.
2.8.4. Дифференциалы высших
порядков. Формула Тейлора. Если скалярная
функция /: R" —> R многих переменных
является дифференцируемой в точке х е Rn , то
ее i
#w=ifu
как функция от х может оказаться
дифференцируемой функцией в этой точке. Тогда
выражение
НЕЯВНАЯ И ОБРАТНАЯ ФУНКЦИИ
83
j/jw w V1 \f \х)) j где использовано обозначение dxf = (dxA .
d{df{x))=L дх. dxJ= y J
У=1 i Пусть скалярная функция /: Rn -> R
2 п переменных определена в некоторой окре-
= ££iLZM dXidXj стности Сточки х g R" и / е Cm(X). Если
у=1 /=1 У ' ^ включает отрезок, соединяющий точки х и
, , . дг + Дх, то имеет место формула Тейлора
называют дифференциалом второго порядка
функции / в точке х и обозначают d f (x) .В т-\ ^k w^x ^m ri% + 0д^\
^/ \ л.л. f(x + Ajc) = У — + * -,
этой связи djlx) иногда называют диффе- J v > £ы fry m\
ренциалом первого порядка этой функции в
T°4Ke.f r ве (0,1). (2.8.3)
Если функция f является дважды непре- \ ' / '
рывно дифференцируемой в точке дг, то ее
дифференциал второго порядка в этой точке бу- В частном случае х = 0 это равенство называ-
дет квадратичной формой относительно пере- ют формулой Маклдрена. При т = 3 и функ-
менных dxi9 / = Гя. В матричной записи ^ии /(*b*z) двух независимых переменных
»2 у/ \ (2.8.3) принимает вид
его можно представить в виде d j[x) =
= dxTf"(x)dx , где dx = {dxb...,dxh...,
*Я)Т > /» " "»W Г*™ ФУн^ии / в +/* (*1 '*2 ^ +/^ (*l '*2)**2 +
точке х. +f'jL (*1,*2)(Д*1 f /2 + fx[x2 (*1 ^2)Ах{Ах2 +
По индукции можно ввести понятие 1 '
дифференциала dkf(x) = ^л"1/(*)) *-го + /*2 (*|, *2) (Д*2 f /2 +
порядка (к > 1) функции / в точке * е R" . +(1/6)*/3/(*1 + ®A*i, х2 + 0Дх2),
Если feCk(X), то этот дифференциал
существует в области X. При помощи оператора 0е (U, 1).
-—dx + I dx I + -—dx ^ак и в слУ4^ действительной функции од-
3jC| 3jc/ ' 3jc„ " ного действительного переменного, последнее
слагаемое в правой части (2.8.3) называют
можно записать остаточным членом в форме Лагранжа. Его
Hk f( \- можно записать в форме Пеано о\ |Ддс| ]
/ -ч -ч ^ \к при |Дх| —> 0. В приближенных вычислениях
= ~?х~ + + ~?х~ + + 3jT~ " I '' формулу Тейлора для скалярных функций
^ * ' п ) многих переменных используют таким же
образом, как и в случае одного переменного
В последнем выражении скобку возводят в , *~ 2 6 4)
степень к по обычным алгебраическим прави- ' j j j R g функции. В
лам, причем полагают г w ;"
некоторых случаях уравнение f(x,y) = 0 от-
^Элг/
( Э ^ Э' / носительно двух неизвестных позволяет одно
т—^*/ = ~r~Jdxi и из неизвестных рассматривать как функцию,
\oXj j дх; зависящую от другого неизвестного. В этом
случае говорят, ч
-. \т -j+w указанным уравж
*?*>) =^&fdxidx'r' ~ 4^1
зависящую от другого неизвестного. В этом
случае говорят, что функция задана неявно
-. у^ -, у1 ^i+m указанным уравнением. Если: 1) координаты
МЭд^"^7! ~ zJ^m "^'"~J » /wo^acm f[x~,y~] удовлетворяют уравнению
84
Глава 2.8. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
f(x\y°j = 0; 2) функция f(x,y)
определена, является непрерывной и имеет
непрерывные частные производные первого порядка в
некоторой окрестности точки Р\ 3) Xl*^)*
Ф 0, то на плоскости хОу найдется
прямоугольник
|(дс>^):дсе[дс0-8,дс0+8],
je[/-k/+48>(U>0}
с центром в точке />(я:0,>у0), в котором:
1) уравнение f(x,y) = 0 задает функцию
у = <р(х) при я: е Ьс°-5,*°+5 ; 2) эта
функция непрерывна в ее области
определения; 3) ф(х) имеет непрерывную производную
<р'{х) = -/х{х,У)//у{х>У)'
Обозначим часть переменных из Rn+m
через (*!,...,хЛ) = х , а остальные - через
(>>1,... ,^w) = у . Пусть определена векторная
функция F: R"+m -> Rm . Тогда если этой
функции соответствует такая система
уравнений F(x,y) = 0, что: 1) F(x°,y°) = 0;
где U - окрестность
точки Р(х°,у°) в Rw+W;3) detF;(jc°,/)Ф
Ф 0 , то в К"1*'1 найдется параллелепипед
j(*,j>) :*,- g[*; -6,,*; +8/], i = i,/i,
с центром в точке Plx° ,у°), в котором
система F (х,у) = 0: 1) задает векторную
функцию у = /(*) при Xj g be/ -8/5х; + 8,-1,
/ = 1,л; 2) эта функция непрерывна в ее
области определения; 3) эта функция имеет
непрерывные частные производные первого
порядка, причем ее матрица Якоби f'(x) =
= -(F;(X,y)ylK(x,y).
Пусть векторная функция G: Rn —> Rn
является непрерывно дифференцируемой в
некоторой окрестности V точки a gR" , т.е.
GeC{(v,R")
, и матрица Якоби этой
функции в точке а не, является вырожденной, т.е.
det С(а)Ф 0 . Тогда найдется такая
окрестность U точки Ь = G(a), что: 1) в U
определена векторная функция G~ [у), обратная к
функции G(jc), т.е. G~x(y)s V при .уе U
и С^С1(у))^у9 ;gU;2) функция G"1^)
непрерывно дифференцируема в U (в
частности, непрерывна в U ), а ее матрица Якоби
связана с матрицей Якоби функции G(jc)
равенством (G-1 J (,y)= (G'(jc))
2.8.6. Геометрические приложения.
Пусть в некоторой окрестности точки
Mlx°)eRn определена скалярная функция
/ : R" —> R и задан вектор л Ф 0 с началом
в этой точке. Обозначим через л° = п/\ л | =
= (vi,...^) единичный вектор в
направлении, задаваемом вектором л, л° = 1. Если
существует предел
——= lim ,
Эл s-hO 5
то его называют производной функции / по
направлению вектора п в точке Л/1дс°). Эта
производная равна скорости изменения
значений функции / в точке М в направлении
вектора л, причем
1=1 '
УСЛОВНЫЕ ЭКСТРЕМУМЫ
85
/ , , уг нении строгих неравенств говорят о строгих
где grad f\x) = lfXj(x)... fXn(x)\ - градиент локальных максимуме и минимуме. В
дальнейшем слова «строгий» и «локальный» опус-
скалярной функции f «переменных, а ( ,} - тим. Точки максимума и минимума называют
точками экстремума.
скалярное произведение векторов из R . Если
функция f является дифференцируемой в тон- Если в точке Р G R Фикция /(*)
i л имеет экстремум и в этой точке существуют
ке х , то в этой точке вектор grad f\x J все ее настные производные первого порядка, то
/ / \\ они в точке Р равны нулю (необходимое ус-
l-grad/(jc° JJ задает направление наиболь- ловие экстремума). Точки экстремума надо
шего возрастания (убывания) значений этой искать сРеди тех точек> в котоРых Ф^Л*) =
функции, причем соответствующая скорость =0 или не существует хотя бы одна из част-
lerad fix°\ (coot- ных пРоизв°Днь1Х первого порядка. Точки, в
| \ /| которых градиент функции равен нулю,
называют стационарными точками этой функции.
Эти точки вместе с точками, в которых не
существует хотя бы одна из частных произ-
Пусть точка М(а,Ь,с) принадлежит по- водных первого порядка, относят к критиче-
изменения значении равна
ветственно
grad/(jt°|).
с тп>з ским точкам функции / .
верхности о с К и существует плоскость тс , J
Для формулировки достаточных условий
проходящая через эту точку и содержащая все ^ * * ы , - J
касательные, построенные в точке М к кри- ЭКСТР™У™ скалярной функции / исполь-
вым, лежащим на поверхности S и проходя- Зуют ее дифференциал второго порядка d2f(x)
щим через эту точку. Тогда тс называют
касательной плоскостью к поверхности S в в точке Р> в котоРой gnid/(/>)=0 . Если
точке М Прямую L, проходящую через квадратичная форма d2f(P) является поло-
точку М и перпендикулярную к касательной , ч
„ жительно (отрицательно) определенной, то в
плоскости тс, называют нормалью к поверхно- n / \
точке Р минимум (максимум), а если неопре-
сти S в точке М . Если: 1) F(x,y,z) = 0 — деленная, то в точке Р экстремума нет. В слу-
о ^ч шж/ . \ чае неотрицательно (неположительно) опреде-
уравнение поверхности о ; 2) точка М\а,о,с)е ?
ленной квадратичной формы d f(P) необхо-
е S ; 3) функция F(x,y,z) дифференцируе-
v > димо дополнительное исследование. Для вы-
ма в точке М ; 4) gmdF(M) Ф О , то в точке яснения типа квадратичной формы d2f(P)
М существует касательная плоскость к по- обычно используют критерий Сильвестра.
верхности S, вектор grad/^M) является 2.8.8. Условные экстремумы. Скаляр-
нормальным вектором этой плоскости, и ее ноя функция f: Rn -» R многих переменных
уравнение имеет вид Fx{M){x-a)^-Fy{M)x достигает в точке Р е Rn , удовлетворяющей
x(y-b)+F~(M)(z-c)=0, а уравнение нор- уравнениям связи g(P)=0 , g : JR"-^"1 ус-
мали L: (x-a)/FUM)=(y-b)/F;(M)= ловного локальног° максимума (минимума),
v n v / v и у \ I если существует окрестность и точки Р, в
= (z~c)/Fz(M). которой для всех точек М е U , удовлетво-
2.8.7. Локальные экстремумы. Скаляр- ряющих уравнениям g(M)=0 и отличных от
ноя функция f: Ел -> R многих переменных, />, выполнено неравенство f(M) < f(P)
определенная в некоторой окрестности точки . fi \/г\ ^ w D\ п ™™„
„ ы к И „ (f[M)> f[P). При выполнении строгих
Р, имеет в этой точке локальный максимум w v / ^ v /
(локальный минимум), если существует такая неравенств говорят об условных строгих ло-
окрестность U точки Р, что для любой точки сальных максимуме и минимуме. В после-
w тт лг п дующем слова «строгий» и «локальный» опус-
MeU, МфР, выполнено неравенство т^,м. Точки условного максимума и минимума
/(М) < f(P) (f(M) > f{P) )• При выпол- называют точками условного экстремума.
86
Глава 2.8. ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
Для нахождения условных экстремумов
составляют функцию Лагрйнжа
т
L(x+) = f(x)+(Kg(x)) = f(x) + 2h'gj(x)>
где Х = (Х{...Хт)Т, fW = (ftW-*«W)T-
причем X; (у = 1,/я) называют
множителями Лагранжа. Если Р gR" является точкой
условного экстремума и существует такая
окрестность U точки Р, что f,gjeC (U),
а /?яиг матрицы Якоби g (P) функции g в
точке jP равен т, то существуют множители
Лагранжа X.•, у = 1,/я, которые вместе с
координатами дс/ (/ = 1,я) точки Р
удовлетворяют системе уравнений
Решая эту систему, находят точки, которые
могут быть точками условного экстремума, и
соответствующие им множители Лагранжа.
Если Р — одна из таких точек, то при
/ , gj e С (U) (у = 1,/я ) можно выяснить
наличие в ней условного экстремума путем
анализа дифференциала второго порядка
d L(P) функции Лагранжа L(x) в этой
точке при фиксированных значениях
соответствующих точке Р множителей Лагранжа.
Этот дифференциал необходимо исследовать
как квадратичную форму d L(P)„ на
линейном подпространстве ЯсК", заданном
системой линейных алгебраических уравнений
dgj(P) = О, у = 1,/я. Тип квадратичной
формы определяет вид условного экстремума
в точке Р или отсутствие экстремума в этой
точке так же, как и в случае обычного
экстремума (см. 2.8.7).
2.8.9. Нахождение наибольшего и
наименьшего значений. Пусть X ей"
является ограниченным замкнутым множеством.
Тогда непрерывная на этом множестве
скалярная функция f : Rn —> R многих переменных
достигает на нем наибольшего и наименьшего
значений (см. 2.4.4). Это означает, что
найдутся такие jc*,jc* е X , что для всех х е X
выполнены неравенства /(** ) < f(x) < fix* J.
Путь нахождения х+,х* рассмотрим на
примере функции /(*i,*2) двух переменных.
Пусть множество X с R ограничено
тремя кривыми, заданными на плоскости
Х[Ох2 уравнениями gj(x\ ,х2) = 0, у = 1,2,3 ,
причем для внутренних точек этого
множества gj(X[,X2)> 0 (рис. 2.8.1). Тогда
наибольшего (наименьшего) значения функция /
может достигнуть либо во внутренней точке
множества X, либс на одной из дуг АС, АВ
или ВС, либо в точках А, В или С
пересечения этих дуг. Поэтому следует вычислить и
сравнить между собой значения функции /
в точках А, В, Си во всех критических точках
этой функции, являющихся внутренними для
X, а также в точках, «подозрительных» на
условный экстремум функции f в каждой из
трех задач с уравнением связи либо g\(x\iX2) =
= 0,либо g2{xbX2) = Q, либо £3(*1>*2) =
= 0 . Аналогично можно найти х* и х* ив
общем случае, но часто этот путь является
весьма трудоемким и предпочтительнее
использовать численные методы оптимизации.
х'\ с
в
0 х{
Рис. 2.8.1
ПОНЯТИЯ ПЕРВООБРАЗНОЙ И НЕОПРЕДЕЛЕННОГО ИНТЕГРАЛА
87
Глава 2.9
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ
2.9.1. Понятия первообразной и
неопределенного интеграла. Если для любого
х е (а,Ь) производная F (х) = f(x) (или
дифференциал dF(x) = f(x)dx ), то функцию
F(x) называют первообразной функции /(*)
в интервале {а,Ь). Сумма F(x) и
произвольной постоянной С также является
первообразной функции f(x) и любая из
первообразных имеет такой вид, т.е. график любой
первообразной функции f(x) можно
получить сдвигом по оси ординат графика одной
из этих первообразных.
Неопределенным интегралом от функции
f(x) называют множество всех ее
первообразных, обозначаемое f(x)dx , т.е.
jf(x)dx = F(x) + C. (2.9.1)
Символ именуют знаком интеграла, /(х) -
подынтегральной функцией, a f(x)dx —
подынтегральным выражением, х — переменным
интегрирования, а С — постоянной
интегрирования.
2.9.2. Свойства неопределенного
интеграла. Каждая непрерывная в интервале
функция f(x) имеет в этом интервале
неопределенный интеграл. Операцию его вычисления
называют интегрированием. Она обратна
дифференцированию, т.е. jl/(jc)rfx:J = F (х) =
= /(*), d\ f{x)dx = f(x)dx, jdF(x) =
.= F(x) + С. Интегрирование является
линейной операцией: Г (tf (x) + sg(x)) dx =
= r[f(x)dx + s\g(x)dx Vr,seR. Если
функции и(х) и v(x) являются непрерывно
дифференцируемыми в некотором интервале, то
в этом интервале справедливо правило
интегрирования по частям
\u(x)v'(x)dx = u(x)v(x)-\u'(x)v(x)dx,
(2.9.2)
или, опуская обозначение аргумента х,
\udv = uv-tvdu. (2.9.3)
Справедливо правило подстановки
(замены переменного)
J g(f(x))f'(x)dx = j g(y)dy , (2.9.4)
если функция g(y) непрерывна на отрезке
[ос,р], а функция у = f(x) является
непрерывно дифференцируемой и обратимой на
отрезке \а,Ь\ и каждому хе[я,£]
соответствует >>е[(Х,р]. После вычисления интеграла
в правой части (2.9.4) следует вернуться к
исходному переменному интегрирования х при
помощи обратной функции х = /~ [у).
В частном случае линейной функции
y = f(x) = rx + s (r,s<=R, г Ф 0) для х
таких, что у е [а, р],
jg(nc + s)dx = -jg(f(x)]f\x)dx =
-if «(,)*■ 3^ + с,
С = const,
где G(y)— первообразная функции g(y) на
отрезке [ос,р]. В случае g(y)=\/y из (2.9.4)
следует
dx
= 1п|>>| + С = 1п|/(фС.
2.9.3. Основные неопределенные
интегралы. К основным относят неопределенные
интегралы от некоторых элементарных
функций. Приведенные ниже равенства имеют
место в каждом интервале, в котором
подынтегральная функция является непрерывной.
88
Глава 2.9. НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ
1. \usdu = -— + С, s*-l.
J S + 1
2.jf=lnH + C.
г а"
3. я"*/и = + С, я>0, я*1.
J In я
4. je"du = e" + C.
5. j sin udu = -cosu + C .
6. j cos w */w = sin w + C.
8. f ^— = -CtgW + C.
J sin w
9. \ shudu = chu + C.
10. jch w*/w = shw + C.
J rh2#y
ch^w
12. f-^- = -cthw + C.
shzw
rfw 1
13. -^ - = _arctg- + C:
J uz +az a a
= —arcctg — + С,, я ф 0.
J и2 -а2 2а
15. J Л
и -а
и + а
+ С ,я*0.
, = arcsin — + С =
-arccos — + Q, я * 0.
ч
du
v^~
In
w + V и2 + .
+ C.
Эти интегралы обычно называют
табличными. Они позволяют с использованием
свойств неопределенного интеграла
вычислить интегралы и от более сложных функций.
Но неопределенный интеграл даже от
сравнительно простой элементарной функции может
не быть элементарной функцией (например,
2
интегралы от функций ех , (sin*)/*,
\/\пх). О таких интегралах говорят, что они
не берутся в конечном виде. В отличие от
дифференцирования общие правила
интегрирования существуют лишь для некоторых видов
элементарных функций.
2.9.4. Интегрирование дробно-
рациональных функций. Неопределенный
интеграл от функции (1.6.7) Pm(x)/Qn{x)
(Рт(х) и Qn(x) — многочлены степени
соответственно тип) берется в конечном виде.
Если т> п, то делением Рт{х) на Qn(x)
выделяют целую часть и остаток, т.е.
неправильную рациональную дробь представляют в
виде Рт-п{х)+ P/c{x)/Qn{x)» где многочлен
Р/с{х) степени k < n не имеет общих
множителей с Qn{x). Для многочлена Рт-п(х)
степени т - п с коэффициентами Cq , С\ , ...,
/ т-п
,/'=0
dx =
т-п т-п |+1
= yZcijxidx=Jjci — .
/=0 /=0 '+ f
Правильную рациональную дробь
P/c(x)/Qn{x) можно разложить (см. 5.1.8) на
сумму простейших рациональных дробей вида
л/(х-а)1 и (Bx + E)/QJ(x), где Q(x) =
= х2 + рх + q,А ,В ,Е,о,/?^еК, D = p2 -
-4<7<0, i<n и 2j<n. При / = 1 и />1
соответственно
\A*L = Aln\x-a\ + C и
J х-а ' '
ИНТЕГРИРОВАНИЕ ИРРАЦИОНАЛЬНЫХ ФУНКЦИЙ
89
\'-1
А^ = А{-4 +с.
(х-а)1
/-1
При у > 1 тождественные преобразования
дают
rBx + Edx с B(2x + p)dx
QJ{*) J2(x2+px + q)J
JS-,')Ij{x)m-Mtl +
{ y2)lK) 2Q>-\x)
>(в-р%ул*).
причем
'j-H
J J nJ
dx
2x + p
Qj{x) (j-\)DQJ-\x)
После j -1 этапов преобразований //(*)
можно выразить через интеграл
w
dx 2 . 2х + р ~
arctg . г + С.
В случае j = 1
JTpf*-Tbflw+(*-'T)''W-
В общем случае неопределенный
интеграл от правильной рациональной дроби
представим по методу Острогрйдского суммой
алгебраической (а именно — рациональной) и
трансцендентной функций
Г Pk(x) , Ps(x) f Pt(x) л
\J^dx = -?±4 + [ Kt\dx, (2.9.5)
где s < I, / < /I - / , а многочлен G„_/(x) =
= Qn{x)lQi{x) не имеет кратных нулей.
Многочлен G/(x) является наибольшим общим
делителем многочленов Qn{x) и G„(x) и
может быть найден при помощи алгоритма
Евклида. Дифференцирование (2.9.5) дает
тождество Рк(х) = Ps{x)Qn4(x) + Р,(хЩх) -
-Ps(x)P(x), позволяющее найти
коэффициенты многочленов Ps(x) и //(*) методом
неопределенных коэффициентов, так как P(x) =
~Ql {x)Qn-i (x)/Qi (x) также является
многочленом. Если все нули многочлена Qn(x)
простые, то Qj = 1 , /'(х) = /^(лс) = 0, а
интеграл в (2.9.5) является линейной комбинацией
логарифмов и арктангенсов от рациональных
функций и не содержит алгебраической части.
2.9.5. Интегрирование
иррациональных функций. Подходящей подстановкой
неопределенный интеграл от иррациональной
функции в некоторых случаях можно свести к
интегралу от рациональной функции. Пусть
/?(w,v,...) — рациональная функция
аргументов w, V,... . Тогда в интеграле
ii*&m~:
dx,
ad ф be,
после подстановки t" = (ах + ЬУ(сх + d), т.е.
x = [tnd-b}l[a-ctn} и dx = [n(ad-bc)tn-4
/ia-ctn) \dt, где /igN - общий
знаменатель дробей P,Q,...gQ , подынтегральная
функция станет рациональной.
Аналогичный результат для интеграла
\ R(x, u(x))dx , w (jc) = yjax2 + 2bx + c y
а ф 0, ac * b2
(2.9.6)
дает одна из подстановок Эйлера: если л > О,
то u(x) = t±Xyfa ; если с > 0, то м(х) =
= х/ ± Vс ; если многочлен ах +2Ьх + с
имеет разные действительные нули а и (3 , то
и(х) = t(x -ос) или и(х) = t(x - (3). Часто в
(2.9.6) проще подстановкой / = (ах + b}j
Лас - b перейти к рациональной функ-
90
Глава 2.9. НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ
ции вида
затем заменой / на одну из
тригонометрических или гиперболических функций свести
(2.9.6) к интегралу от трансцендентной
функции (см. 2.9.6). В частном случае Ryх, w(x)J =
= Рт(х)/и(х), где Рт(х) - многочлен
степени т g N , полагают
(fmMdx = Pm_l{x)u{x)+A{^L (2.9.7)
J U[X) J U[x)
и находят число А и коэффициенты многочлена
Рт-\(х) методом неопределенных
коэффициентов из тождества, получаемого
дифференцированием (2.9.7) и последующим
умножением на и(х). Интеграл в правой части (2.9.7)
выделением из квадратного трехчлена полного
квадрата сводят к одному из табличных
интегралов от иррациональных функций (см.
2.9.3).
Интеграл jxr(a + bxqJ dx от
дифференциального бинома (a,b eR,p,q,r gQ)
можно выразить через элементарные функции,
если одно из чисел р, (r + \yq или
р +(г + 1)/<7 является целым {теорема Че-
бышёва). При этом используют замену:
/ = лс1' {к — общий знаменатель дробей г и
q), если р g Z ; / = \а + &Г71 (л —
знаменатель дроби р), если (г + 1) / р g Z ;
/ = (шТ*7 + £J , если /? + (г + l)/tf g Z .
2.9.6. Интегрирование
трансцендентных функций. Пусть R(u,v,...) —
рациональная функция аргументов и, v, ... . Тогда в
неопределенном интеграле R(sinx,cosx)dx
после подстановки t = tg(x/2)
подынтегральная функция станет дробно-рациональной. Если
функция R является нечетной относительно
sin х или cos х , то проще использовать
подстановки соответственно / = cosx и
/ = sin х (при необходимости - в сочетании
с тригонометрическими соотношениями - см.
1.3.1 и 1.3.2), а если R — четная функция
относительно sin х и cos х , то t = tg x.
В частном случае f sin"1 x • cos" x dx
при четных m,neN (одно из этих чисел
может быть нулем) наряду с подстановкой
t = tg х полезны формулы sin x =
= (l-cos2x)/2 и cos2 x = (l+cos2x)/2, a
при нечетных т, п е Z удобна подстановка
/ = cos 2x . Последовательным
интегрированием по частям этот интеграл при V/я,/igZ с
учетом тригонометрических соотношений
можно привести к табличному. Если /h,/jgQ,
то подстановка / = sin х или / = cos x
приводит к интегралу от дифференциального
бинома.
Интегралы вида sin ax • cos bx dx
Va,beR при помощи тригонометрических
соотношений нетрудно свести к табличным.
Если аргументами рациональной
подынтегральной функции являются синусы и
косинусы углов, зависящих от произведений х на
различные рациональные числа, то нужно найти
общий знаменатель л е N этих чисел и после
подстановки t = х / п при помощи формул
для кратных углов (см. 1.3.2) выразить
аргументы через натуральные степени sin/ и
cos / , а затем воспользоваться
рассмотренными выше подстановками.
Интеграл \ Riepx, eqx,... j dx
подстановкой / = ex'm (wgN - общий
знаменатель дробей p,q,...eQ) можно свести к
интегралу от рациональной функции аргумента
/ . Этот путь пригоден и для интеграла
j R(sh рх,chрх,shqx,chqx,...)dx, если
гиперболические функции выразить через
экспоненты. Интегралы вида [/?(shx,chx)rfx,
\s\\mxohnxdx (m,neQ) и fshfljtx
xch bx dx (a, b e R) можно преобразовать
аналогично интегралам от тригонометрических
функций. Некоторые из интегралов от
произведений степенной, экспоненциальной,
логарифмической, тригонометрической или
обратной тригонометрической функций берутся в
конечном виде интегрированием по частям.
СВОЙСТВА ОПРЕДЕЛЕННОГО ИНТЕГРАЛА
91
Глава 2.10
ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ
2.10.1. Понятие определенного
интеграла. Пусть действительная функция f(x)
определена на отрезке [a,b]eR. Разобьем
[а, Ь] точками а-х^ <Х\ <... < xf <... <
<хп_\ <хп=Ь на л отрезков [x,-_i,*|]
длиной AXj = X/ - Х/-1 > / = 1,л , и выберем
произвольные точки £/ 6 [*м,Х/]. Конечный
предел суммы
п
•*#.=£/&)**,■ (2.10.1)
i=l
при условии, что lim Ап = 0, где Ап =
= max Ax; , если он существует и не зависит
1</<я
от разбиения отрезка [а,Ь] и выбора точек
5/, называют определенным интегралом
(интегралом Римана) от f(x) на [я,^] и
обозначают
Ь
I = jf(x)dx. (2.10.2)
а
В (2.10.2) а и b называют соответственно
нижним и верхним пределами интегрирования.
Значение / не зависит от разбиения [a,b]
на отрезки [x/_i,X/] и выбора точек £,- на
них. Для неотрицательной на [а,Ь] функции
f(x) значение / соответствует
заштрихованной на рис. 2.10.1 площади криволинейной
трапеции ABCD под графиком этой функции.
Замена в интегральной сумме (2.10.1)
значения /(£/) на точную верхнюю (нижнюю)
грань множества значений функции f(x) на
каждом отрезке [x/_i,X/] дает верхнюю S*
(нижнюю iS* ) сумму Дарбу этой функции для
рассматриваемого разбиения отрезка [а, £].
Если lim S* = lim S* = А е R , то / = А
д„-»о д„-»о
у
0
1
f/*J<^§
if
/1
с
Шж
г ^
,/;
В
» л
Рис. 2.10.1
и функцию /(*) называют интегрируемой
по [д, £]. Для существования определенного
интеграла необходимо и достаточно, чтобы
lim IS* - S*) = 0 . Для интегрируемости
д„->(Л /
функции по отрезку достаточно, чтобы она
являлась либо непрерывной, либо ограниченной
и монотонной, либо ограниченной при
наличии лишь конечного числа точек разрыва.
2.10.2. Свойства интегрируемых
функций. Если функция является
интегрируемой по отрезку, то она интегрируема и по
любой части этого отрезка. Обратно, если
функция интегрируема по каждой части отрезка,
то она интегрируема по всему отрезку.
При изменении в конечном числе точек
значений интегрируемой по отрезку функции
она сохраняет свойство интегрируемости по
этому отрезку, а соответствующий
определенный интеграл сохраняет свое значение. Если
функции f(x) и g(x) интегрируемы по
отрезку [я,£], то по [а,Ь] интегрируемы их
линейная комбинация и произведение, а если
|g(;c)| > С > 0 на [д,£], то и частное
f{x)jg(x) интегрируемо по [я,£].
2.10.3. Свойства определенного
интеграла. Значение / в (2.10.2) не зависит от
обозначения переменного интегрирования.
Очевидно, что
a b a
J f(x)dx = 0, | f(x)dx = -J f(x)dx
» J
dx = b-
92
Глава 2.10. ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ
Если функция f{x) является интегрируемой Если f(x) неотрицательна и интегрируема
по отрезкам [я,с] и [с,£], то при любом по [я,£],то
взаимном расположении точек a, b и с она b
интегрируема по [а, Ь] и f f{x)dx > 0,
Ь с Ь а .
jf(x)dx = jf{x)dx + jf(x)dx. а если, кроме того, на [я,^] существует такая
а а с точка, в которой функция f(x) является не-
Пусть f(x) интегрируема по [а,Ь]. Тогда и прерывной и положительной, то
функция |/(х)| интегрируема по [а,Ь] и ^
jf(x)dx>0.
ь
~ J I ^ 'I ' Периодическая функция f(x) с периодом
а
Т, интегрируемая по [а,а + Т], интегрируема
а если V* е \а,Ь] m < fix) < М , то п. i ™i ^» ™
L J J v ' и по отрезку [b,b + Г] V£g R , причем
J/M*
я+Г 6+Г
4* - a) * J /W* * M(b " *) • J f(X)dx = f /(*) Л .
a a b
Если функция f(x) интегрируема по Пусть функции f(x) и g(x) интегрируемы
[a^JcZ (я>0) и является четной на по [а,Ь]. Тогда и функция rf(x) + sg(x)
множестве X с R , то она интегрируема по \/r,5 g R интегрируема по [я,£], причем
[-£,-я] и
Ь Ь b
-а ь [ (tf(x) + sg(x)) dx = rj f{x) dx + sj g(x) dx
jf(x)dx = jf(x)dx, a a a
-b a
Vr,5GR;
а при а = 0
b b при f(x)<g(x) Vxe[a,b]
jf(x)dx = 2ff(x)dx. b b
~b ° ]f(x)dx<]g(x)dx,
Интегрируемая по [fljZ/jcA' (a>0) нечет- а а
ноя на X функция f(x) интегрируема по а если, кроме того, на [я, £] существует такая
[-я,-£] d X и точка с, в которой обе функции непрерывны
и f(c)<g(c), то
-а о
jf(x)dx = -jf(x)dx, ь ь
-Ъ a J f(x) dx < \ g(x) dx.
а при а = 0 а а
Ь Если функции f(x) и g(x) интегрируемы
-ь
jf(x)dx-0. по ^ ^ Vxe[e>ftj WS/(X)SW) a g(x)
ФОРМУЛА НЬЮТОНА-ЛЕЙБНИЦА
93
не меняет знака, то
х е
ML
jf(x)g(x)dx = iijg(x)dx, (2.10.3)
а а
причем т < \х, < М (первая теорема о
среднем значении для определенного интеграла).
В частности, если /(*) непрерывна на
[я, ft], то существует такая точка £e(tf,ft),
что
Ъ Ь
jf(x)g(x)dx = f(^)jg(x)dx. (2.10.4)
а а
При g(x) =1 Vjcg [я, ft] из (2.10.3) и (2.10.4)
следует, что
b
J f(x)dx = ji(ft-tf) и
]f(x)dx = f$){b-a).
а
Геометрический смысл последнего равенства:
для неотрицательной на [я, ft] функции f(x)
площадь криволинейной трапеции ABCD на
рис. 2.10.1 равна площади прямоугольника с
основанием ЛВ и высотой /(£).
Если на [я, ft] функция f(x) является
монотонной и ограниченной, a g(x)
интегрируема, то существует такая точка £ е [а, ft],
что
Ь £> Ь
\f(x)g(x)dx = f(a)jg(x)dx + f{b)jg(x)dx
а а £
(вторая теорема о среднем значении для
определенного интеграла).
2.10.4. Формула Ньютона-Лейбница.
Если функция f(x) является интегрируемой
по отрезку [а, Ь], то на нем будет непрерывной
функция
Л. I U
Ф(х)=|/(/)А 4»(*) = J/(/)A
называемая определенным интегралом с
переменным верхним (нижним) пределом. Если
f(x) непрерывна на [я, ft], то функция Ф(х)
(Ч'(х)) будет дифференцируемой на [я, ft],
причем Ф'(х) = /(дс) (ч*'(дг) = -/(*))■ т.е.
производная интеграла с переменным верхним
(нижним) пределом от непрерывной функции
равна этой функции (умноженной в случае
нижнего предела на —1).
Итак, Ф(х) является первообразной
непрерывной на [я, ft] функции f(x) и Ф(х) =
= F(x) + С , где С = -F(a), a F(x) -
произвольная первообразная функции f{x) на
отрезке [я, ft]. При х = b
]f(x)dx = F(b)-F(a) = F(x)\ba=[F(x)]
(2.10.5)
(формула Ньютона —Лейбница). Эта формула
позволяет использовать табличные интегралы
и все способы интегрирования (см. 2.9) для
вычисления определенных интегралов.
Для непрерывно дифференцируемых на
[я, ft] функций и(х) и v(x) справедлива
формула интегрирования по частям
ь ъ
\u(x)v(x)dx = u(x)v(x)\ -\u(x)v{x)dx.
а а
(2.10.6)
Если функция g(y) непрерывна на [о,ft], а
у = f(x) непрерывно дифференцируема на
[я, ft] и Vx е [я, ft] ye [oc,p], то
справедлива формула интегрирования подстановкой
(заменой переменного)
Ъ /(b)
\g{f(x))f\x)dx= \g(y)dy =
f(a) (2.10.7)
= G(f(b))-G(f(a)) = G(yf/^
94
Глава 2.10. ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ
где G(y) - произвольная первообразная то сходится и несобственный интеграл от
/ \ г от г- /(*) на к, ^1, причем
функции g[y) на [a,pj. Если, кроме того, v ' L J
функция fix) на \а, £] является строго мо- br cr bp
г l\ I f(x)dx = \ f(x)dx + [ f(x)dx .
нотонной, т.е. имеет на \а,о\ обратную функ- J v ' J v ' J v '
а а с
цию П[у) - J (у), то Еслп хотя бы один из интегралов (2.10.9)
расходится, но существует конечный предел
\g{y)dy= jg{f(x))f'(x)dx. (2.10.8) Hm
а Л(а) e->+0
с-г b
J f(x)dx+ J f(x)dx
\
2.10.5. Несобственные интегралы. то его называют главным значением (в смысле
Обобщением определенного интеграла на слу- Коши) несобственного интеграла от fix) на
чай неограниченной подынтегральной функции и
бесконечных пределов интегрирования является г
несобственный интеграл. [я> Ь\ и обозначают V. p. J f(x)dx .
Если существует конечный предел а
Пусть функция f(x) определена при
/= lim f f(x)dx, ге(0,Ь-а), х>а н интегрируема по каждому отрезку
е_>+° а [о,х] с [я,+©°). Если существует конечный
где функция f(x) является интегрируемой по предел lim f f(t)dt, то его называют схо-
каждому отрезку \а,Ь - г\а\а,Ь), но я
,. w \ дящимся несобственным интегралом от f(x)
lim J (X) = оо э то этот предел называют ■* v '
х"^ в промежутке [я,+°°) и обозначают
сходящимся несобственным интегралом от
fix) на [#,£] и используют обозначение г
_ _ |/(дс)Л. Аналогично, когда /(х) опреде-
(2.10.2). Это же определение используют, если J v ' v '
существует конечный предел а
лена при х < а и интегрируема по каждому
Ь а
/ = lim f f(x)dx , е е (0,b - а), отрезку [х,а] с (-°°,а], предел lim \f(t)dt
а+е х
(если этот предел существует и конечен) на-
когда f(x) интегрируема по каждому отрезку зывают сходящимся несобственным интегра-
., , ., , ч лом от fix) в промежутке (-°°,а] и обозна-
\a + e,b]a(a,b] и lim /(х) = ~. Если w v J
конечный предел не существует, то говорят, чают [f{x)dx. Если существует и конечен
что несобственный интеграл от f(x) на .^
[а, Ь] расходящийся. каждый из двух указанных пределов, то
Пусть функция f(x) неогран и чена в +г а +Г
/ .ч г- [/(*)<** = 1/МЛ+ \f(x)dx (2.10.10)
окрестности точки се [а, и). Если сходится Jv/ Jv/ Jv/
—оо —оо а
каждый из несобственных интегралов
называют сходящимся несобственным инте-
г , ч г , ч гралом от /(х) на множестве R действи-
\f{x)dx и Г/(х)А, (2.10.9) И МУ
J J тельных чисел, а функцию f(x) — интегри-
ПРИЗНАКИ СХОДИМОСТИ НЕСОБСТВЕННОГО ИНТЕГРАЛА
95
руемой по R . Если в правой части (2.10.10) 2.10.6. Признаки сходимости несоб-
хотя бы один из интегралов расходится, но , "
существует конечный предел стаенного интарала. Пусть Ь е R - точка
расширенной числовой прямой, a f(x) и g(x) —
lim f f(x)dx функции, интегрируемые по любому отрезку
x->+ooJ ' [я,с]с [я,£), причем если ЬеШ, то при
х —> b - 0 эти функции являются неограничен-
то этот предел называют главным значением
несобственного интеграла от f(x) на R и г.м,
v ' ними. Несобственный интеграл f(x)dx бу-
обозначают V.p. jf(x)dx. Если функция дет годящимся тогда и ТОлько\огда, когда
А*)+ А"*) интегрируема по R , то f f(x)dx -> 0 при £, л -> £ - 0 (критерий
V d f f(x\dx = — f f /"(Vi + /"С- xYldx Аоиш сходимости несобственного интеграла).
-оо 2 J Если при V*eM) Функции f(x) и
__ g(;c) неотрицательны и f(x) < g(x), то из
Пусть b е Ш — точка расширенной числовой .
прямой и fix) интегрируема по любому от- f „/а .
И J V / ^ FJ J сходимости интеграла g(x}tf:x: следует схо-
резку [я,с] с [я,£), причем если b е Ш , то я
при х—>£-0 fix) неограничена. Тогда при г
димость /(x)rfx, а из расходимости
Vxe[a,b) f(x) имеет первообразную F(x). J
Если существует конечный предел ъ Ъ
lim F(x)= F(b-0), то применима форму- f(x)dx — расходимость #(х)а(л: (признак
ла (2.10.5) Ньютона - Лейбница в виде сравнения).
Ь Ь
[ f(x)dx = F(b - 0) - F(a). (2.10.11) Интеграл I f(x)dx сходится абсолютно,
а
Ъ
р если сходится g(x)d!x: и при Vxe[a,b)
Несобственный интеграл f(x)dx называют J
абсолютно (или условно) сводящимся, если он М й *М <*"« «*™«>*«™ o«hW
сходится и, кроме того, сходится (или расхо- сти).
b При g(x) > 0 Vx g [я,£) и существо-
дится) несобственный интеграл /(xlflbc. В t t . чЧ
J ' " вании конечного предела lim (/m/gm) Ф
a x->b-0y v " v "
случае b е R подстановкой * = (Ztf + d)/(t + 1) 6
интеграл по [я,*) можно свести к интегралу *° несобственные интегралы \ f{x)dx и
по [0,+оо): ь
g(x)dx либо оба сходятся, либо оба расхо-
J/ (xjtfx: = (0-0j J / "y^7j~ j~ "Г- дятся. В частности, если b - бесконечная
a 0 ^ ' v' + v точка -И» расширенной числовой прямой и
(2 10 12) g{x) = x~S> то эти интегралы сходятся при
96
Глава 2.10. ОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ
s > 1 и расходятся при s < 1, а если b еШ н функция g(x) является монотонной и ограни-
g(x) = (b-x) , то они сходятся при 5<1 и ценной в промежутке [0,+°°)- Тогда сходится
расходятся при s > 1 . -н»
Если сходятся несобственные интегралы ИНТеграл j f(x)g(x)dx (признак Абеля). Если
f(x)dx и g(x)dx, то интеграл от линей- г \ w \
Jv/ J °^ ' в |д,+°°) Дх} имеет ограниченную первооб-
а а
* „ wv\ , ~т/~\ •, .. ^ та разную, a g(x) монотонно стремится к нулю
ной комбинации qj(x)+rg(x), ^,геК,тоже ^ ' ' *v / и J
при х —> +оо f то сходится интеграл
сходится,
Ь
причем j(qf(x) + rg(x))dx= lf{x)g{x)dx (1тзнакДирихлё).
a J
Все вышесказанное можно перенести на
г f / \ Dce вышесказанное можно перенести на
- Я\ f{x)dx + г\ g(x)dx . При существова- случаи, когда функции интегрируемы по лю-
а а бому отрезку [с,Ь] с {а,Ь~\, a eR, ЬеШ ,
нии для непрерывно дифференцируемых в лол,)/-
гл л , о w \ „/ \ или когда они неограничены при х—>я + 0,
интервале [а,о) функции Дх) и g(x) ко- F F
я g
нечного предела \\т f(x)g(x) = В е Ш и 2.10.7. Приложения определенного
интеграла. Длина кривой графика непрерывно
f r'i \ / \j дифференцируемой на отрезке \а,Ь] функции
сходимости / [x)g\x)dx также сходится L J
b
\ f(x)g (x)dx и применима формула (2.10.6)
/(х) равна / = Ul + f'2(x)dx . Если функ-
ция у = /(х) задана параметрически (см.
в виде 1.6.1) непрерывно дифференцируемыми функ-
b b циями х = ф(/) и у = у(/), г g [/h/2] то
J/(x)g'(x)^ = Я" /(^И-}/(хЖ^- 'i _
a a /=JV92(0+V2(0*-
(2.10.13)
'I
При задании кривой в полярных координатах
Если функция g(y) является непрерывной ф, р непрерывно дифференцируемой функ-
в полуинтервале [я,£), а у = /(х) непре- цией р = р(ф) (ф| < ф < ф2) / =
рывно дифференцируема в нем, причем <р2
/'(*)* 0 Vxg[a,Z>), Hm /(х) = р и = f >/р2(ф) + р'2(ф)</ф.
jc—>6-0 «*
Ф|
/(а) = а, то справедлива формула (2.10.7) в Площадь криволинейной трапеции
виДе ABCD (см. рис. 2.10.1) под графиком неот-
р ^ рицательной функции /(х) вычисляют при
fg(.v)4v = \s(f(x))f\x)dx . (2.10.14) помощи (2.10.2). Площадь криволинейного
J J сектора ОАВ (рис. 2.10.2), ограниченного
кривой АВ, заданной функцией р = р(ф)
При этом из сходимости (или расходимости)
одного из интегралов в (2.10.14) следует схо- (ф| < Ф < Ф2 ), и радиусами ОА и ОВ, будет
димость (или расходимость) другого.
+~ _ 1 7 2
Пусть сходится интеграл \ f(x)dx, a 2^J^ №№ '
«Pi
ПРИЛОЖЕНИЯ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА
97
и моменты инерции
Ь
Рис. 2.10.2
Объем тела, образованного вращением
криволинейной трапеции ABCD вокруг оси
Ох (см. рис. 2.10.1),
ь
V = n\f2(x)dx, (2.10.15)
а
а площадь боковой поверхности вращения
этого тела при условии, что f(x)
непрерывно дифференцируема на [a, b], Sq = 2я х
xjf(x),l\ + f'2(x)dx. Если f(x) задана
а
параметрически непрерывно
дифференцируемыми функциями х - ф(/) и у - ц/(/),
'2 .
/ е [tl9t2], то 5б = 2л J v(0V<P'2(0 + V'2(f)dt'
'i
Если ось Ох пересекает тело в точках а и b
и интегрируемая по отрезку [а,Ь] функция
g(x) задает зависимость от х площади
перпендикулярного к этой оси сечения тела, то
Ь
его объем V = \ g(x)dx .
Заданная непрерывно
дифференцируемой на [а, Ь] функцией у = f{x)
материальная кривая с линейной плотностью т(х)
имеет массу
ь
М = jm(x}J\ + f'2(x)dx
Jx=)m{x)f2(xyl\ + f'\x)dx,
а
Ь
Jy =jm(x)x2Jl + f'2(x)dx
а
соответственно относительно осей Ох и Оу, а
координаты центра масс этой кривой
b
хс = —jm(x)xjl + f'2(x)dx,
а
b
yc=jj-jm{x)f(x)Jl + f'2(x)dx.
При постоянной линейной плотности кривой
Sq = 2nycL , т.е. площадь поверхности
вращения кривой вокруг оси Ох, не
пересекающей этой кривой, равна произведению длины
окружности, описываемой центром масс
кривой, на длину L кривой (первая теорема
Гульдина).
Для криволинейной трапеции ABCD
(см. рис. 2.10.1) с площадью S* и
однородным распределением массы координаты
центра масс хс = Sy/S* , Ус - $х1 S*» где
Ь ь
Sx=(l/2)jf2(x)dx и Sy=jxf(x)dx -
а а
статические моменты этой трапеции
относительно осей Ох и Оу соответственно. Тогда
вместо (2.10.15) V = 2nycS*.
Объем тела, образованного плоской
фигурой при ее вращении вокруг оси,
лежащей в плоскости фигуры и не пересекающей
ее, равен произведению длины окружности,
описываемой центром масс фигуры, на ее
площадь S* (вторая теорема Гульдина). Для
криволинейной трапеции ABCD (см. рис.
2.10.1) с постоянной поверхностной
плотностью т моменты инерции относительно осей
b
Ох и Оу соответственно Jx = (т/4)\ f3(x)dx,
а
Ь
Jу =mjx2f(x)dx.
а
4 - 7706
98
Глава 2.11. ИНТЕГРАЛЫ, ЗАВИСЯЩИЕ ОТ ПАРАМЕТРА
Глава 2.11
ИНТЕГРАЛЫ,
ЗАВИСЯЩИЕ ОТ ПАРАМЕТРА
2.11.1. Зависимость интеграла от
параметра. Пусть на множестве УсЕ
определены функции ф(у) и у (у) (ф(д>) < у (у)
\/у eY ) и в плоской области F - {(х,.у):
ф(д>) < х < \\f(y), у eY} определена
функция f(x,y), при каждом фиксированном
У eY интегрируемая по отрезку \<р(у), ^(у)]
(по х). Тогда интеграл
Ф)
Ф(У)= j f{*>y)dx (2.11.1)
Ф)
определяет на Y некоторую функцию Ф(у)
аргумента у, называемого в этом случае
параметром определенного интеграла. Правую
часть в (2.11.1) называют интегралом,
зависящим от параметра. В частном случае пределы
интегрирования в (2.11.1) могут быть
постоянны: Vy e Y у(у) = а и \\r(y)=b (a<b).
2.11.2. Свойства интегралов,
зависящих от параметра. Если функции ф(у) и
у(у) являются непрерывными на отрезке
[с,*/], a f(x,у) непрерывна в плоской
замкнутой области F = {(^.у): ф(д>) < х < у(у),
у g [с,(/]} (рис. 2.11.1), то функция Ф(д>) в
(2.11.1) будет непрерывной и интегрируемой
по отрезку [c,d], причем
(2.11.2)
Рис. 2.11.1
d d (ф)
J*004V=N jf{x,y)dx\dy =
с с уф)
d ф)
= jdy jf(x,y)dx.
с ф)
Интеграл в правой части (2.11.2)
называют повторным. Если ф(у) s а и у(у) = Ь
Уд>е[с,*/], то в (2.11.2) можно изменить
порядок интегрирования:
d Ъ Ь d
jdyjf(x1y)dx = jdxjf(x1y)dy. (2.11.3)
с а ас
Если функции ф(у) и у(у) являются
дифференцируемыми на [c,d] и f(x,y) имеет в
замкнутой области F непрерывную частную
производную fy(x,y) по у, то Ф[у)
дифференцируема на [c,d], причем
Ф)
ф'{у)= J fy(x,y)dx + f(v(y),y)v'(y)-
Ф)
-/{Ф),у)у'(у)-
2.11.3. Несобственные интегралы,
зависящие от параметра. Пусть при
х -> b-Q (Ь еШ) функция f(x,y) является
неограниченной или же b является бесконечной
точкой +©о расширенной числовой прямой Ш .
Тогда зависящий от параметра у интеграл
b
^>{y) = \f{xiy)dx (2.11.4)
а
будет несобственным. Если для каждого
фиксированного уеУсМ несобственный
интеграл (2.11.4) является сходящимся, то его
называют сходящимся на множестве Y . Этот
интеграл именуют равномерно сходящимся на Y ,
если для любого е > 0 существует такое
число ц(г)<Ь, что Vy e Y и У£е(л.(е)>^)
ЭЙЛЕРОВЫ ИНТЕГРАЛЫ
99
выполнено неравенство
}/(*>от
d Ь
Ь d
< е.
Если существует неотрицательная
функция f(x), определенная в полуинтервале
[а,Ь), интегрируемая по каждому отрезку
[0,л.]с:[л,6) и такая, что |/(x,j>)| <
< <р(х) V* € [a,b) и У у 6 Y , то из сходи-
Ь
мости <p(x) dx следует равномерная сходи-
а
мость на Y интеграла (2.11.4) (признак
Вёйерштрасса). Для равномерной сходимости
на Y интеграла (2.11.4) необходимо и
достаточно, чтобы для любого е > 0 существовало
такое число л.(е) < b , что V£, С, € (ц(^), Ь) и
Vy € Y было выполнено неравенство
С
< е (критерий Коши).
]f(x,y)d>
Если интеграл (2.11.4) равномерно
сходится на У и функция f(x,y) является
непрерывной при х е[а,Ь) и у eY, то
функция Ф(д>) непрерывна на У и для c,deY
справедливо (2.11.3). Если, кроме того,
f(x,y) имеет при у eY и х € [а,Ь)
непрерывную частную производную fy(x,y) по >> и
Ь
интеграл g(y) = \ fy(x,y)dx равномерно
а
сходится на К , то функция Ф(у) будет
дифференцируемой на Y , причем Ф (у) = g(y) .
Пусть при изменении у в проколотой
окрестности точки d € R функция f(x,y)
неограничена или же d eR и равномерно
сходятся интеграл (2.11.4) на любом отрезке
d
[с, п.] (с < г\ < d) и интеграл \f(x,y)dy на
с
любом отрезке [я,£] (о < £ < Ь). Тогда если
существует один из интегралов
jdyj\f(x9y^dx9 jdxf\f(x,y)dy, то спра-
с а ас
ведливо (2.11.3), в котором все интегралы
сходятся.
Интегрирование и дифференцирование
несобственных интегралов, зависящих от
параметра, используют для вычисления обычных
несобственных интегралов.
2.11.4. Эйлеровы интегралы.
Примерами несобственных интегралов, зависящих от
параметров, являются эйлеровы интегралы
^)=jV<
tx~{dt и
о
соответственно второго рода, определяющий
гамма-функцию Г(х), и первого рода,
определяющий бета-функцию В(х,у). Эйлеров
интеграл второго рода является несобственным
интегралом, равномерно сходящимся при х > О
и расходящимся при х < О. Подстановками
и = е~* и v = 111 f его можно привести к
виду
1 , « ус-1 -н»
r(jc) = Jlln —J du= je^dv.
При х > О гамма-функция является бес-
конечно дифференцируемой и
rW(x)= Je-V-^In/f*, «eN.
о
Для x = neN Г(л) = (л-1)! (при 0! = 1),
т.е. Г(х) является продолжением функции
х!, определенной лишь для х = п - 1, на
интервал (0,+°<>). Основное функциональное
уравнение Г(х + 1) = дсГ(дс) позволяет по
формуле Г(х) = Г(х + 1)/х последовательно
доопределить гамма-функцию в интервалах
(-Л, 1-я) (рис. 2.11.2). Значения Г(х) при
xgR\{1-/i} нетрудно вычислить по значе-
100
Глава 2.12. КРАТНЫЕ ИНТЕГРАЛЫ
1/г(х);пх)
Г\
1' 1
№
4 -J
1 1
i
и
г\
I 1
\J
,'">,
-2 -/
Л
¥■
J
о
1
4
1
ч_>
9\
L
7
J
Г\\
II
и
и
\
/
/
\
-А
ч
1
г'—^
*»■-»
' ;
П
\\
/
Л/т)
*<
? j
«ч
Г X
Рис. 2.11.2
ниям Г(х) при х е [1, 2] . На отрезке [1, 2]
Г(х) достигает минимума Г( 1,46163...) =
= 0,88560... . При х -> -и*» г(х) ~ <j2n/x x
х(х/е) (формула Стйрлинга для гамма-
функции, являющаяся обобщением формулы
Стйрлинга п! ~ ^2к/п(п/е)" (п -> оо) для
факториала)
Эйлеров интеграл первого рода
равномерно сходится на множестве Ux,y):x > 0,
у > 0} и расходится, если х < 0 или у < 0.
Для любых х>0 и у>0 В(х,у) = Г(х)Г(у)/
/Г(х + у), В(х,у) = В(у, дс), В(х,1) =
= В(1, х) = \/х. Кроме того, В(х, у) =
= (j/-1)B(x,j/-1)/(jc + j/-1) Vx>0 и
Vy>l, B(jc,ii) = (ff-l)!/(jc(jc + l)— (jc+h-1))
Vx>0 и weN, B(x, 1-х) = Г(х)Г(\-х) =
= n/smnx Vxe(0,l).
Глава 2.12
КРАТНЫЕ ИНТЕГРАЛЫ
2.12.1. Двойной интеграл. Пусть
функция f(x,y) определена и является
ограниченной в плоской замкнутой области F с
границей в виде кусочно гладкой кривой. Сеткой
кусочно гладких кривых разобьем F на л
элементарных областей F, f/ = l,/ij, таких,
п
что M/j = F (рис. 2.12.1, а). В каждой эле-
/=1
ментарной области Fj площадью А/}
выберем произвольную точку Mj(Xj,yj)e Fj.
Конечный предел суммы
Я„=^/{х;,У()АЪ (2.12.1)
/=1
при условии, что Ап —> 0 , где Ап —
наибольший из диаметров элементарных
областей, если этот предел существует и не зависит
от разбиения F на А/} и выбора точек А/,-,
называют двойным интегралом от f(x,y) по
F и обозначают
СВОЙСТВА КРАТНЫХ ИНТЕГРАЛОВ
101
I = jf(x,y)dF = jjf(x,y)dxdy. (2.12.2)
F F
Для неотрицательной в F функции f(x,y)
значение / равно объему цилиндрического
тела с основанием F, ограниченного
поверхностью Z = f(x,y) (рис. 2.12.1, б). При
/(х,д>)=1 в F значение / равно площади
плоской области F.
Замена в интегральной сумме (2.12.1)
значения /(x/,J>,-) точной верхней (нижней)
гранью множества значений функции f(x,y)
в каждой из элементарных областей А/)
приводит к верхней S* (нижней S*) сумме Дарбу
этой функции для указанного разбиения
области F . Если lim S* = lim S* = А е R ,
д„-»о д„-»о
то I = А и функцию f(x,y) называют
интегрируемой по плоской области F . Для
существования двойного интеграла необходимо
и достаточно, чтобы lim [S* - S*) - 0 .
д„-»о\ /
Функция интегрируема по области F, если
она является непрерывной в F или
ограниченной в F и имеет точки разрыва в F,
принадлежащие конечному множеству гладких
кривых.
2.12.2. Тройной интеграл. Пусть
функция f(x,y,z) определена и является
ограниченной в пространственной замкнутой области
V с границей в виде кусочно гладкой
поверхности. Системой кусочно гладких поверхностей
разобьем V на п элементарных областей Vl
—ч "
/ = 1,/|], таких, что М^/=^- В каждой
элементарной области Vt объемом AVi
выберем произвольную точку Mj (x/; yt; Zj) g Vi
Конечный предел суммы
Sn=^f(xhyhZi)bVi (2.12.3)
/=|
при условии, что Ап -» 0, где Ал —
наибольший из диаметров элементарных
областей, если этот предел существует и не зависит
от разбиения V на A V{ и выбора точек Л/,-,
называют тройным (иногда объемным)
интегралом от f(x,y,z) по V и обозначают
/ = J/(*,J>,*)rfK = ////(*,**) dxdydz .
(2.12.4)
При f(x,y,z) = l в К значение / равно
объему пространственной области V .
Замена в интегральной сумме (2.12.3)
значения /(х,, д>,-, Zj) точной верхней
(нижней) гранью множества значений функции
f(x,y,z) в каждой из элементарных
областей AVj приводит к верхней S* (нижней
S*) сумме Дарбу этой функции для
указанного разбиения области V . Если lim S* =
= lim S* = A € R , то I = А и функцию
f(x,y) называют интегрируемой по
пространственной области V . Для
существования тройного интеграла необходимо и
достаточно, чтобы lim [S* - S*) = 0 . Функция
интегрируема по области V , если она
является непрерывной в V или ограниченной в V и
имеет точки разрыва в V , принадлежащие
конечному множеству гладких поверхностей.
2.12.3. Свойства кратных интегралов.
Понятия двойного и тройного интегралов
можно обобщить для замкнутой области D с R/w
в m-мерном точечном множестве Rm, что
приводит к понятию /и-кратного интеграла
/</Z) по области интегрирования D от
функции f : Z) -» R, интегрируемой по Z) .
Многократные (говорят просто кратные)
интегралы имеют общие свойства, которые
можно рассмотреть на примере двойного
интеграла.
Пусть ограниченная функция f(x,y)
является интегрируемой по замкнутой плоской
области F . Тогда она интегрируема по
любой части F. При изменении в конечном
числе точек области F значений функции
она сохраняет свойство интегрируемости по
102
Глава 2.12. КРАТНЫЕ ИНТЕГРАЛЫ
F . Если F состоит из двух областей /j и непрерывны и /(£, Т|) < g(£, т]), то
F2 , не имеющих общих внутренних точек, то jj f^y)dxdy < jj g(Xly)dxdy . Если в ^
ЯГ F
J(X,y) x у - т^ f(x,y) < М , a g(x,j) не меняет знака,
/i F2 J J /(*, >>)g(x, j) dxdy = jLxJJ g(x, j/) dxdy ,
(свойство аддитивности относительно
областей). Кроме того, (2.12.5)
I причем /и<|1<Л/ (теорема о среднем зна-
I) f(x,y)dxdy\< || |/(x,y)|rfx:d[y , нении для двойного интеграла). В частности,
\ F \ F если f(x,y) непрерывна в F , то существует
а при т < f(x,y) < М , (х;у) е F , такая точка Ы е F • что
«5 < jj f{x,y)dxdy <MS, Я Ax>y)g(x>y)dxdy = f% Л)Д *(*,У)<fa* •
F F F
где 5 - площадь плоской области F. Если
f(x,y) неотрицательна в F, то При g(x,y) = ] в F из (2.12.5) и (2.12.6)
JJ f{x,y)ixdy > 0, а если, кроме того, в /" слелУет> что
F „ . ff/(x,j^)rf«fr = nJ и
существует точка, в которой функция J J
f(x,y)>0 и является непрерывной, то
jjf(x,y)dxdy > 0. JJ/(jc,^)rfwfr = f&i\)S -
Пусть ограниченные функции f(x,y) и Если {/rj _ последовательность облас-
g(x,y) интегрируемы no F. Тогда по F тей /^ с площадями Sn и диаметрами А„ и
интегрируемы их линейная комбинация и л/ю- если точка М е Fn V« € N и lim{A„} = 0
изведение, а если в F \g(x,yjL > С > 0, то и Г _ -, ..
1 v 7| ' {/л/ стягивается в точку М ), то для непре-
частное f(x,y)/g(x,y) также интегрируемо .. ч
v " v ' рывной функции f(x,y) существует предел
по Т7 , причем для любых г, 5 € R /л . . ^ ч
(дифференцирование по области)
jj{rf(x,y)^sg(xiy))dxdy= Hm ±\\f(x9y)dxdy = f(M).
F я-*~ Sn у
= rjjf(x,y)dxdy + jjjg(x,^)rfw/v.
/г /г 2.12А. Вычисление кратных
интегралов. При вычислении кратного интеграла его
При f(x,y)<g(x,y) V(x;y)eF \\f(x,y)x предварительно приводят к повторному шипе-
v ' °v ' v ' JJ-'v '•'z г/?о/гу, содержащему последовательно вычис-
^ ляемые интегралы меньшей кратности. Если
xdxdy< \\g(x9y)dxdy, а если, кроме того, плоская замкнутая область задана в виде
F F = {{x,y): ф) <х< у{у),У € [с,</]} , где
в некоторой точке (^;т|)б/7 обе функции ф(^) и \j/(.y) - функции, непрерывные на от-
ЗАМЕНА ПЕРЕМЕННЫХ В КРАТНЫХ ИНТЕГРАЛАХ
103
резке [c,d] (см. рис. 2.11.1), то для
интегрируемой по F функции f(x,y)
лЫу) Л
jjf{x,y)dxdy = j\ jf(x,y)dx\dy =
F с {ф) )
d У(У)
= jdy jf(x,y)dy,
с ф)
(2.12.7)
т.е. для вычисления двойного интеграла
достаточно последовательно вычислить два
определенных интеграла (внутренний зависит от
параметра у).
Аналогично, если F = {(*;>>): х е [а, Ь\
а(х) <у< р(х)} (рис. 2.12.2, а), то
dx =
jjf{x,y)dxdy = j\ jf{x,y)dy
F a [a(x)
ь PM
= jdx jf(x,y)dy
a a(x)
(2.12.8)
(здесь внутренний интеграл зависит от
параметра х). В случае более сложной области
(например, на рис. 2.12.2, б) ее
предварительно разбивают на подобласти, к которым
применимы (2.12.7) или (2.12.8), и используют
свойство аддитивности кратного интеграла
относительно области (см. 2.12.3).
Если пространственная область V
вычисления тройного интеграла —
цилиндрическое тело с образующей, параллельной оси
Oz, и проекцией F на координатную
плоскость хОу, ограниченное поверхностями,
заданными непрерывными в F функциями
Z = и(х,у) и Z = у(х,у) , то для
интегрируемой по V функции f(x,y,z)
jjjf(Xiy,z)dxdydz=jjdxdy jf{x,y,z)dz,
V F u(x,y)
т.е. интегрированием по z вычисление
троичного интеграла можно свести к вычислению
двойного интеграла по области F . Если V
р
0
1
а
^а(х) b
X
а)
Рис. 2.12.2
лежит между плоскостями х = а и х-Ь и
сечение V любой плоскостью х = const
(х € [я, Ь]) является замкнутой областью Fx,
то
jjj f(x,y,z)dxdydz =jdxjjf(x,y,z)dydz .
V a Fx
Аналогичные приемы используют при
вычислении интегралов большей кратности.
2.12.5. Замена переменных в кратных
интегралах. Иногда вычисление кратных
интегралов можно упростить заменой
переменных. Пусть непрерывно дифференцируемые в
плоской области G функции х = х(и, v) и
У = у(и, v) » (w; v) € (7 , осуществляют
взаимно однозначное отображение G на область F
в координатной плоскости хОу. Тогда для
непрерывной в F функции f(x,y) двойной
интеграл по F
jjf(x,y)dxdy = jjf(x(u,v),y(u,v))x
F G
x\6ttJ2\dudv
при условии, что якобиан
104
Глава 2.12. КРАТНЫЕ ИНТЕГРАЛЫ
det /9 =
\дх/ди dx/dv\
\ду/ди dy/dv\
*0.
Величину dG = \detJ2\dudv называют
элементом площади в криволинейных координатах
и, v. Для полярных координат х = р cos ф ,
у = рsinф и det /2 = Р > те- dG = рфАф .
Замена переменных в двойном интеграле
возможна и при нарушении указанных условий,
но вдоль конечного множества кусочно гладких
кривых, на которых f(x,y) и det/2
ограничены.
Пусть непрерывно дифференцируемые в
пространственной области Q функции
x = x(u,v,w), y = y(u,v,w) и z = z(u,v,w),
(u,v,w)e Q , взаимно однозначно
отображают Q на область V с R с прямоугольной
системой координат Oxyz. Тогда для
непрерывной в V функции f(x,y,z) тройной
интеграл по V
jjjf{x,y,z)dxdydz = jjjf(x(u,v,w),
V Q
,v(w,v,w),^(w,v,w)) \ det J3\dudvdw
при условии, что якобиан
det /3 =
\дх/ди дх/dv dx/dw\
\ду/ди ду/dv dy/dw\
dz/dlt dz/dv dzldw\
*0.
Величину dQ = |det J$\ du dvdw называют
элементом объема в криволинейных
координатах и, v, w . Для цилиндрических координат
х = рсо5ф, ^ = р5Шф, Z = Z и /з = Р>
т.е. dQ = pdpdydz , а для сферических
координат х = р sin d • cos ф, у = р sin Ф • sin ф ,
Z = рcosФ и У3 = Р2 snl^» те- ^ = р2 х
х sin Ъ dpdbdy. Замена переменных в
тройном интеграле возможна и на конечном
множестве кусочно гладких поверхностей, на
которых f(x,y,z) и /3 Должны быть
ограничены.
Аналогичным путем возможна замена
переменных в интегралах большей кратности.
2.12.6. Несобственные кратные
интегралы. Обобщением кратного интеграла на
случай неограниченной подынтегральной
функции и неограниченной области интегрирования
является несобственный кратный интеграл.
Пусть D с Жт — открытое множество
(ограниченное или нет) в /и-мерном точечном
множестве Rm. Если замыкание Dn открытого
множества Dn включено в открытое
множество Dn+i \рп с Dn+i VA7 € Nj и
МDn = D , то {Dn} называют
последовали
тельностью, монотонно исчерпывающей
множество D. Пусть существует кратный
интеграл \ f dD от функции f : D -» R
(ограниченной или нет). Если при любом
выборе {Dn} существует равный нулю предел
Штн
, то говорят, что несобствен-
jfdD)
[D\D„
ный кратный интеграл I f dD является
сходящимся и равен lim
\fdD
, а в
противном случае — что расходящимся. Если функция
f является интегрируемой по области D, то
f dD совпадает с обычным кратным ин-
D
тегралом (см. 2.12.3).
Для сходящегося несобственного
кратного интеграла справедливы свойства (см.
2.12.3): аддитивность относительно областей
интегрирования, линейность, интегрирование
неравенств, сведение к повторному интегралу
и замена переменных. В частности, если
векторная функция х = h(u), иеСсК'",
х G D с Жт , является непрерывно
дифференцируемой на G и осуществляет взаимно
однозначное отображение G на D, причем
якобиан det У этого отображения нигде на G
КРАТНЫЕ ИНТЕГРАЛЫ, ЗАВИСЯЩИЕ ОТ ПАРАМЕТРА
105
не равен нулю, то f f(x) dD = f /(*(«)) x определяет на множестве У некоторую
JD J функцию Ф(у) векторного аргумента у, на-
w I л^ т I лп зываемого в этом случае параметром. Правую
х dety \аО при условии, что сходится хотя ,~ «~ m J F * v *
I I v часть (2.12.9) называют кратным интегралом,
бы один из этих двух интегралов. зависящим от параметра.
Несобственный кратный интеграл Если множество D является ограничен-
\fdD называют абсолютно сходящимся, ным, а функция f(x,y) — непрерывной на
D множестве Q = D x Y с Rm+k , то Ф(у)
если сходится J |/| </Д . Если j f dD сходит- непрерывна yyeY „ в случае ограничен-
_ _ ного множества Y существует интеграл
ся, то он и абсолютно сходится. Пусть
0<f(x)<g(x) VxeDzR™. Тогда из ^{y)dY = \dY \ f{x,y)dD =
сходимости \gdD следует сходимость Y YD (2 12 10)
D = jdDJf(x,y)dY,
Г / dD, а из расходимости / dD - pacxo- D Y
димость \gdD . Для сравнения удобно ис- а если> кРоме того> Функция f(x,y) является
D дифференцируемой по у на Q , то Ф(у) диф-
пользовать функцию g(x) = p~s(x,a), где , v '
°w r v ; ференцируема на / , причем Фу. =
р(х,а) — расстояние между точками г —
= \fy.(x,y)dD,i = \,k.
x,aeRm, причем если функция f(x) явля- i
ется ограниченной в неограниченной области Зависящий от параметра кратный инте-
D, то а = 0 (начало координат), а если f(x) грал в (2.12.9) может быть несобственным,
неограничена в каждой проколотой окрестно- если ""ожество D или функция f(x,y) при
сти точки Xq e Rm и область Я ограничена, некоторых фиксированных у е Y являются
л неограниченными. Тогда этот несобственный
то я=*0. Тогда J p" (x,a)dD сходится при ^лжь/и интеграл будет сходящимся на Г ,
* ^ если при каждом фиксированном уп е Y
s > т в первом случае и при s < m во
втором. Из существования неотрицательной сходится J f(x,y0)dD, что при /я > 2 рав-
функции ф(дг) > | f(x) | Vjc t D , такой, что D
сходится \<pdD, следует сходимость носил ьно сходимости J \f(x,y0)\dD. Сходя -
Z) Д
f ~ jrk г. -I ,~ f jrk щийся интеграл в (2.12.9) сходится равномк
\fdD, причем \\f\dD<\ydD. r
D D D \ С \
на Y , если Уу0 е ^ lim^! J f(x,y0)dD
2.12.7. Кратные интегралы, завися- L^
щие от параметра. Если функция fix, у) л
r r J \ >*j =o при любом выборе последовательности
Jte/JcR7" при каждом фиксированном {/)„} множеств DnczD, n e N, монотонно
j> € К с R* является интегрируемой по от- исчерпывающих множество D (см. 2.12.6).
крытому множеству D , то кратный интеграл Аналогом признака Вёйерштрасса
равномерной сходимости (см. 2.11.3) в данном слу-
Ф(у)= [ f(х v)dD (2 12 9) чае является существование такой неотрица-
Р тельной функции ср(*) > |/(*,.f)| V* € D и
106
Глава 2.12. КРАТНЫЕ ИНТЕГРАЛЫ
\/у eY, что Г f(x)dD сходится.
D
Если интеграл в (2.12.9) сходится
равномерно на У и f(x,y) непрерывна на
каждом открытом множестве Qn = Dn x Y с
с Rm+k, то Ф(у) непрерывна \/у eY и
справедливо (2.12.10). Если интеграл (2.12.9)
сходится на Y , f(x,y) дифференцируема по
у на Qn и интегралы у,- (у) =
= \ fy.(x,y)dD 1/ = 1,А:] равномерно схо-
D
дятся на Y, то существуют производные
ЭФ(у)/ду1 , причем ЭФ^/Эу,- = V/00
2.12.8. Приложения кратных
интегралов. Если основанием цилиндрического тела
служит область F плоскости хОу, а сверху
оно ограничено поверхностью z - f(x,y), то
двойной интеграл (2.12.1) равен объему этого
тела. В случае неограниченной области F
или функции f(x,y) , неограниченной в каждой
проколотой окрестности некоторой точки
(a;b) e F, при вычислении объема
цилиндрического тела необходимо исследовать
сходимость соответствующего несобственного
интеграла. Плоская область F с
распределенной поверхностной плотностью т(х,у)
имеет соответственно массу и моменты
инерции относительно осей координат Ох, Оу:
М = jjm(x,y)dxdy,
F
Jx =jfy2m(x,y)dxdy,
F
J у = J J x2m(x,y)dxdy ,
F
а координаты центра масс этой области
хс = SyjM , ус = Sx/M , где
Sx = IT ym(x,y)dxdy и
Sy = jjxm(x,y)dxdy -
F
статические моменты области F
относительно осей соответственно Ох и Оу.
Пространственная область объемом V ,
заполненная массой с плотностью
т = m(x,y,z), имеет полную массу М =
= jjjm(x,y,z)dxdydz = \mdV , dV =
v v
- dxdy dz , статические моменты
относительно плоскостей соответственно хОу, yOz и zOx
Sxy = \zmdV , Syz = \xmdV и S& =
v v
= ymdV, координаты центра масс
V
хс = Syz/M, yc = S&/M и zc = Sxy/M и
моменты инерции относительно тех же
плоскостей Jyy - \z2mdV , Jyz - \x2mdV и
V V
Jpc - \ymdV. Моменты инерции этой
V
области относительно осей Ох, Оу и Oz
соответственно будут Jx = Jуу + Jyc, J у -
- Jyz + Jxy и Jz = Jф + Jyz . Сила
гравитационного притяжения F, с которой эта
область действует на материальную точку
(а\Ь\с)еЖ единичной массы, имеет
проекции на координатные оси: Fx =
= yj(x- a)(mlf)dV, Fy=yj(y-b)x
V V
x(m/p3)dV, Fz=yj(z-c)(m/p3)dV, где
p = y(* - af + (j/ - £)2 + (z - с)2 - /юс-
стояние между точками (x\y\z) и (а;Ь',с),
у — гравитационная постоянная. При
(a;b',c)eV последние интегралы будут
несобственными, но переходом к сферическим
координатам с началом в точке (а\Ь\с) их
можно преобразовать в обычные тройные
интегралы. Кратный интеграл
КРИВОЛИНЕЙНЫЙ ИНТЕГРАЛ I РОДА
107
г m(M)dV(M) называют гладкой, если эти функции являются
^C^o) = Y| /ду жж ч—, непрерывно дифференцируемыми на отрезке
" Р( ' 0) М] и Ф» + ¥'2(0 + х'2(0>о
*/(*;;,>;*)е К «г К3, M0(u;v;w)eVcR3 V'6['b'2]- В каждой точке такой кривой
можно провести касательную. Точки
(2.12.11) (x\;y\\Z\) и (х2\У2\1г) при значениях t{ и
является зависящим от параметров и, v и w h параметра t именуют соответственно на-
и определяет гравитационный потенциал дан- чальной и конечной точками кривой. При сов-
ной области в точке М0, причем VM0 £ V падении этих точек кривую называют
замкнутой. Кривую именуют кусочно гладкой, если
F (кл \-Л' ( ал \ F (\4 \-П' (\Л \ ее можно Разбить на конечное число гладких
*х \м0 ) ~ ии \МЪ ) у Гу (м0 )~uv \мъ ), участков. Аналогичные определения имеют
место, если в (2.13.1) %(t) = 0 \/t € [/,,t2],
Fz(M0) = Uw(Mq) ■ (2.12.12) т е кривая ЛеЖит в плоскости хОу.
В криволинейных интегралах подынте-
При Mq € V зависящий от параметров крат- тральную функцию (в общем случае — век-
ный интеграл в (2.12.11) является несобствен- тоРнУю ФУ»**™) в точка* пространственной
ным, причем его подынтегральная функция кривой L задают в виде f(x,y,z),
дифференцируема по и, v и w на множестве 3
(x;y;z) £ L cR . а в точках плоской кривой
ЩМс\)Г\У и поэтому формулы (2.12.12) w ч , ч 9
, ,„. ,*Л, Г- ввиде /х,у , х;^)ЕГеК2, ноэта
верны (см. 2.12.6 и 2.12.7). \ / \ /
.. ее с есс , ч функция может принимать различные значе-
Кратныи интеграл у ^^ (1/р)х нш в одной и той же тоцке пространства или
я плоскости (например, в точке самопересечения
х т{х\ у; г)ц(£; T\\z)dxdydzd£sd(\aXu, где р = кривой). При интегрировании вдоль заданной
. кривой говорят о криволинейном интеграле
= J(x - Qf + (у - Т|) + (z - С)2 , (x\y\z) е I рода, а при интегрировании по проекциям
этой кривой на оси координат — о криволи-
eVczR3, (^;?)€ficR3, Q = V х D с нейном интеграле IIрода.
2.13.2. Криволинейный интеграл I ро-
R , ц(£;т|;£) — плотность массы в облас-
да. Пусть в точках (x\y\z) g L с R кусочно
ти D, характеризует собственную
гравитационную энергию областей V и D. гладкой кривой L с начальной точкой Л и
конечной точкой В (рис. 2.13.1) определена огра-
ничейная функция f(x,y,z). Точки Aq = A,
А\,...,Ап_\,Ап = В разбивают L на п участ-
КРИВОЛИНЕЙНЫЕ И ПОВЕРХНОСТНЫЕ г —
ИНТЕГРАЛЫ ков А" каждый длиной ASj, i = \,n.
Криволинейный интеграл I рода от функции
2.13.1. Гладкие и кусочно гладкие f(x,y,z) по кривой L, обозначаемый
кривые. Обобщение операции интегрирования . f
на случай, когда значение подынтегральной J f(x,y,z)ds (или просто \fds), сущест-
функции зависит от положения точки на за- ^ ^
данной кривой, приводит к понятию криволи- вует ес1И существует конечный предел инте-
нейного интеграла. Пространственную кривую, гральной суммы
параметрически заданную в прямоугольной
системе координат функциями п
х = <р(>), у = у(/), z = х(>)' * е [№]> ы\
(2.13.1) (2.13.2)
108
Глава 2.13. КРИВОЛИНЕЙНЫЕ И ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ
Рис. 2.13.1
при условии, что Ап -» 0, где Ап = max As;,
1</<л
и значение этого предела не зависит от
разбиения L на участки Ц и от выбора на Ц
точек Mi (£/; т|/; С/) • При этом | / ds =
I
= lim iS*,, и не зависит от ориентации кри-
Дя->0
вой и направления движения вдоль нее, так
как длина каждого ее участка положительна
при отсчете от любого его конца.
Аналогично определяют криволинейный
интеграл I рода f(x,y}ds (или просто
г
/ ds ) по плоской кусочно гладкой кривой
г
Г от заданной в ее точках (х;^)бГсК
ограниченной функции f(x,y).
При параметрическом представлении
кривой L в виде (2.13.1) дифференциал длины
ее дуги ds = ^'2{t)+\y"1(t) + %2{t)dt и
'2
jf(x,y,z)ds=jf(<p(t)M*Mt))x
L /j
х7ф'2(/) + у2(/) + х2(0*.
т.е. существование криволинейного интеграла
следует из существования определенного
интеграла. Если в (2.13.1) в качестве параметра
выбрать длину 5е[0,/] дуги AM кривой L
(см. рис. 2.13.1) от ее начальной точки А до
текущей точки М , где / - длина кривой L,
то
/
jf(x,y,z)ds = jf(4>(s),y(s),x{s))ds
L 0
(для лежащей в плоскости хОу кривой Г
x(s) = 0 Vs g [0,/]). Если кривая Г задана в
этой плоскости в явном виде у = у(х),
X € [<2,£] , ТО
ь
J f{x,y)ds = J* f{x9y{x))Jl + y\x) dx.
Г а
Для криволинейного интеграла 1 рода в
силу его представления через определенный
интеграл справедливы свойства и способы
вычисления последнего (см. 2.10).
2.13.3. Криволинейный интеграл II
рода. Пусть в точках (x\y\z) e L с К
гладкой кривой L с начальной точкой А и
конечной точкой В (см. рис.2.13.1) определена
ограниченная векторная функция f(x,y,z) =
= iP(x,y,z) + jQ(x,y,z) + kR(x,y,z), где i, у,
k - орты прямоугольной системы координат, а
P,Q,R — координатные функции векторной
функции / (проекции вектора / на оси
соответственно Ox, Oy, Oz). Положение
касательной к кривой в текущей точке
M[x\y\z)^L задает единичный вектор
t(x,y,z) = /cosa + ycosP + k cos у ,
направленный по движению точки М вдоль L от
точки А (а,р,у - углы вектора t с осями
соответственно Ox, Oy, Oz). Тогда в точках
{x',y,z)€ L определена ограниченная
функция W(x,y,z)= f't = />cosa + QcosP +
+/?cosy и существует криволинейный
интеграл /рода
\W ds = Г (Р cos a + Q cos p + R cos y)ds =
L L
= $Pdx+ JQdy+ j Rdz,
AB AB AB
(2.13.3)
НЕЗАВИСИМОСТЬ КРИВОЛИНЕЙНОГО ИНТЕГРАЛА ОТ ПУТИ ИНТЕГРИРОВАНИЯ 109
поскольку cos a = dx/ds, cos (3 = dy/ds и
cos у = dz/ds .
Интегралы в правой части (2.13.3)
являются криволинейными II рода по проекциям
кривой L на оси Ох, Оу и Oz от функций,
заданных на L. Каждый из них равен пределу
интегральной суммы вида (2.13.2), но при
замене в ней As, на проекцию участка Ц с L
на соответствующую ось координат. Это
приводит к смене знака интеграла при изменении
направления интегрирования (например,
jpdx = -jp dx). Значение интеграла по
АВ ВА
замкнутой кривой L, обозначаемого
символом ф, не зависит от начальной точки ин-
L
тегрирования, но также меняет знак при
изменении направления обхода кривой. Для
краткости правую часть в (2.13.3) записывают
в виде J P dx + Q dy + Rdz (в случае замк-
АВ
нутой кривой L — в виде
Pdx + Qdy + Rdz ).
L
При параметрическом представлении
кривой L в виде (2.13.1) dx = ф (t)dt, что
позволяет заменой переменного интегрирования
\Pdx к
АВ
i
свести вычисление
вычислению
определенного интеграла:
АВ
jP{x,y,z)dx = | />(ф(/),у(0,х(0)ф>)*.
АВ tx
Аналогично преобразуют JQdy и JRdz
АВ АВ
(для лежащей в плоскости хОу кривой Г
X (t) = 0 V/ € [/| ,t2]). Если кривая Г задана
в плоскости хОу в явном виде у = у(х),
х g [a,b], то
b
jp(x,y)dx = jp(x,y(x))dx,
АВ
$ Q{x,y)dx = JQ(x,y(x))dx
АВ а
В силу представления через определенный
интеграл возможно обобщение
криволинейного интеграла на случай кусочно гладкой
кривой, причем на этот случай также можно
перенести свойства и способы вычисления
определенного интеграла (см. 2.10), в том числе,
когда криволинейный интеграл несобственный
или зависящий от параметра.
2.13.4. Независимость
криволинейного интеграла от пути интегрирования.
Пусть А, В е V с R — две различные точки
в односвязной области V и P(x,y,z),
Q{x,y,z), R(x,y,z) ~ функции,
непрерывные в V вместе с частными производными
Ру , Pz , Qz , Qx , Rx, Ry . Криволинейный
интеграл \ Pdx + Qdy + Rdz не зависит от
АВ
выбора кривой L е V , соединяющей точки А
и В, тогда и только тогда, когда существует
функция U(x,y,z), (x\y\z)^V такая, что
U'x = Р, Uy=Q и U'z = R, т.е. когда
Pdx + Qdy + Rdz = dU (подынтегральное
выражение является полным дифференциалом
функции U ). Для этого необходимо и
достаточно выполнения в V условий интегрируемо-
emu Qz = Ry , Rx = Pz, Py =QX. Тогда
jPdx + Qdy+Rdz = U(B)-U(A) и
АВ
j>Pdx + Qdy + Rdz = 0 VL e V .
L
Функцию U можно построить по
формуле U = C+ \Pdx + Qdy + Rdz,r*e С -
постоянная интегрирования, Mq,МеУ —
фиксированная начальная и текущая точки,
соединенные любой кривой L с V . Если
точки M0(x0,y0,Zo) и M(x,y,z) можно
соединить параллельными координатным осям
отрезками, полностью лежащими в V (в
общем случае это ребра прямоугольного
параллелепипеда с диагональю MqM (рис. 2.13.2)), то
можно получить формулу
no
Глава 2.13. КРИВОЛИНЕЙНЫЕ И ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ
Рис. 2.13.2
х
U(x,y,z) = C+jP{^y0,ZoH +
х0
У Z
уо zo
или пять аналогичных формул при выборе
пяти других возможных путей интегрирования
вдоль параллельных осям Ox, Оу, Oz
отрезков.
Если A,BeF^R — две различные
точки в плоской области F и Р(х,у),
Q(x,y) — функции, непрерывные в F
вместе с частными производными Ру и Qx, то
криволинейный интеграл \Pdx+Qdy не
ЛВ
зависит от выбора кривой Г € F,
соединяющей точки А и В, при условии, что существует
функция U(x,y), (x;^) g F, для которой
U'X = P и U'y=Q,T.c. Pdx + Qdy = dU.
Тогда
$Pdx + Qdy = U(B)-U(A) и
АВ
&Pdx + Qdy = 0 VreF.
L
Если область F является односвязной, то
необходимым и достаточным признаком
существования функции U является выполнение
в F условия интегрируемости Ру = Qx , a
функцию U можно построить по формуле
U = C+ [Pdx + Qdy. Здесь С - посто-
янная интегрирования, Mq,M e F —
фиксированная начальная и текущая точки,
соединенные любой кривой Г cz F. Если точки
М0(х0;у0) и М(х\у) можно соединить
параллельными осям Ох и Оу сторонами
прямоугольника с диагональю MqM , полностью
лежащими в F , то
х у
U(x,y) = C + fP$,y0)dZ,+ \Q{x,T\)ch\
*0 УО
или
У х
U(x,y) = C+ JQ(xo,4)d4+ f Р£9уЩ.
уо *о
2.13.5. Гладкие и кусочно гладкие
поверхности. Обобщение двойного интеграла на
случай, когда значение подынтегральной
функции зависит от положения точки на заданной
поверхности, приводит к понятию
поверхностного интеграла. Поверхность S, заданную
в прямоугольной системе координат
параметрическими уравнениями
x = x(u,v), y = y(u,v), z = z(u,v),
(м;у)еГсЕ2, (2.13.4)
называют гладкой, если различные точки
(u\v) некоторой замкнутой области Г
плоскости uOv дают разные точки на S , функции
в (2.13.4) являются дифференцируемыми в G и
равен двум ранг матрицы
( ' ' '\
I / / / I >
\XV yv ZVJ
ПОВЕРХНОСТНЫЙ ИНТЕГРАЛ I РОДА
111
т.е.
с2 =
1 г
хи
Ху
/
/
Уи Zlt
Уу Zv
2
+
г
Zy
'I2
Уи
Уу
>0.
f
Хи
xv\
(2.13.5)
В каждой точке гладкой поверхности S
можно провести касательную плоскость и
построить нормаль в двух возможных
противоположных направлениях. Если, выбрав в
произвольной точке на S направление
нормали и непрерывно изменяя нормаль при
обходе лежащей на S некоторой замкнутой
кривой, можно в исходную точку вернуться с
противоположным направлением нормали, то
S называют односторонней поверхностью
(например, лист Мебиуса). В противном
случае S называют двусторонней поверхностью и
каждую ее сторону характеризует выбранное
направление нормали в произвольной точке
на S. Далее рассматриваемые поверхности
считаем двусторонними.
В каждой точке гладкой замкнутой
поверхности, ограничивающей некоторую
пространственную область V , определен
единичный вектор внешней нормали, направленный
из этой области. Если поверхность состоит из
конечного числа гладких участков, то ее
называют кусочно гладкой.
В поверхностных интегралах
подынтегральную функцию (в общем случае —
векторную функцию) в точках на поверхности S
задают в виде f(x,y,z) , [x\y\z) е S с R3.
При интегрировании по S говорят о
поверхностном интеграле Iрода, а при
интегрировании по проекциям на координатные плоскости
определенной стороны поверхности S — о
поверхностном интеграле IIрода.
2.13.6. Поверхностный интеграл I
рода. Пусть в точках (x;y;z) e S aR кусочно
гладкой поверхности S определена
ограниченная функция f(x,y,z)- Сеткой лежащих на
S кусочно гладких кривых (рис. 2.13.3)
разобьем S на п элементарных участков Sj с
площадями А5/ f/ = l,/ij так, что
и
\\Sj = S . Поверхностный интеграл I рода
/=!
Рис. 2.13.3
от функции f(x,y,z) no S, обозначаемый
\ f(x,y,z) dS (или просто \fdS),
cymes' S
ствует, если существует конечный предел
интегральной суммы
(2.13.6)
/=l
при условии, что Ап -» 0, где Ап -
наибольший из диаметров элементарных
участков, и этот предел не зависит ни от разбиения
S на участки 5,-, ни от выбора на S, точек
М i (х,; yi \Zi)- В таком случае / dS =
S
= lim On. При /si на S интеграл
\ f dS равен площади поверхности S .
S
При параметрическом представлении S
в виде (2.13.4) дифференциал площади
поверхности с учетом (2.13.5) равен dS = \idudv и
ff(x,y,z)dS = jjf(x(u,v),y(u,v),z{u,v))x
S Г
x\xdu dv,
т.е. существование поверхностного интеграла
по S следует из существования двойного
интеграла по области Г. Если S задана явно
функцией z = z(x,y), т.е. в (2.13.4) и = х,
v = у и (х',у) е Fxy , где Fxy - проекция S
на координатную плоскость хОу, то
jf(x,y,z)dS= fjf(x9y,z(x,y))x
112
Глава 2.13. КРИВОЛИНЕЙНЫЕ И ПОВЕРХНОСТНЫЕ ИНТЕГРАЛЫ
x^l + Zx +Z* dxdy.
Верны аналогичные формулы, если S задана
явно функциями вида x = x(y9z) или у =
= y(x9z). Для поверхностного интеграла I
рода в силу его представления через двойной
интеграл справедливы свойства и способы
вычисления последнего (см. 2.12.3-2.12.5).
2.13.7. Поверхностный интеграл II
рода. Пусть в точках (x\y\z) е S czR
гладкой поверхности S определена векторная
функция f(x9y9z) = iP(x,y,z) + jQ{x,y,z) +
+kR(x,y,z), где i,y\Л" - орты прямоугольной
системы координат, a P,Q,R —
координатные функции векторной функции / (проекции
вектора f на координатные оси
соответственно Ox,Oy,Oz), ограниченные на S.
Выбранное направление нормали к S в текущей
точке M(x9y9z) e S задано единичным
вектором п(х9у9 z) = i cos a + У cos p + k cos у
(а,р,у - углы вектора п с осями
соответственно Ox, Oy, Oz). Тогда в точках
(x\y\Z) e S определена ограниченная
функция W[x4y,z)= f • п = jPcosoc + (?cosp +
+7?cosy и существует поверхностный
интеграл I рода
jlVdS = \(Pcosa + Qcosp + Rcosy)dS =
S S
= \Pdydz+ [Qdzdx + [Rdxdy,
Fyz ^zx *xy
(2.13.7)
поскольку cos a = dy dz/dS , cos p =
= dzdzx/dS и cosy = dxdy/dS . Интегралы
в правой части (2.13.7) являются
поверхностными II рода от функций, заданных на S, по
проекциям Fyz , F& и Fxy на координатные
плоскости соответственно yOz , zOx и хОу
определенной стороны поверхности S (эта
сторона задана выбором направления
нормали n(x9y9z) в произвольной точке (x\y9z)^
е S). Каждый из них равен пределу
интегральной суммы вида (2.13.6), но при замене
в ней AiS1/ на проекцию (с определенным
знаком) участка Sj с S на соответствующую
координатную плоскость. Это вызывает смену
знака интеграла при изменении направления
нормали. Интеграл по ограничивающей
некоторую пространственную область замкнутой
поверхности S меняет знак при смене
внешней нормали на внутреннюю и наоборот.
В (2.13.7) всю правую часть записывают
в виде \\ Pdydz +Qdzdx + Rdxdy (в слу-
S
чае замкнутой поверхности - в виде
£&Pdydz + Qdzdx + Rdxdy ). Если функ-
S
ции P9Q9R9PX9Qy9Rz являются
непрерывными в односвязной области V , то о Р dy dz +
S
+Qdzdx + Rdxdy = 0 тогда и только тогда,
когда Р'х + Q'y + R'z = 0 в V .
При параметрическом представлении S
в виде (2.13.4) замена переменных
интегрирования в (2.13.7) приводит к двойному интегралу
по области Г, например, R(x9y9z)dxdy =
= JJ R(x(u, v), у (и, v), z(u, v)) det Jxydu dv
при условии, что
dctJxy =
\xu У и
xv yv
*0.
Аналогично преобразуют UP dy dz и
FK
jj Qdzdx.
f*
Если S задана явно функцией
Z = Z(x, у), то
jj Щх,у, z) dx dy = jj R(x, y,z{x, у)) х
Fxy
XV1 + ^2 +z? dxdy-
Fxy
Верны аналогичные формулы, если S задана
явно функциями вида x = x(y9z) или у =
ПРИЛОЖЕНИЯ КРИВОЛИНЕЙНЫХ И ПОВЕРХНОСТНЫХ ИНТЕГРАЛОВ
ИЗ
= y(x,z)- В силу представления через
двойной интеграл поверхностный интеграл можно
обобщить на случай кусочно гладкой
поверхности, причем на этот случай также можно
перенести свойства и способы вычисления
двойного интеграла (см. 2.12.3-2.12.5), в том
числе если поверхностный интеграл является
несобственным или зависящим от параметра.
2.13.8. Приложения криволинейных и
поверхностных интегралов. Площадь
плоской области, ограниченной замкнутой кривой
Г, S = (l/imxdy - у dx положительна, если
г
при обходе Г область находится слева. Масса
и координаты центра масс материальной
пространственной гладкой кривой L с линейной
плотностью m(x,y,z)
M = jmds, xc=—j
xmds,
а моменты инерции кривой относительно осей
Ох, Оу и Oz
Jx=\(y2+Z2)mds, Jy=j(z2+x2)mds,
L L
Jz = \(x2 +y2)mds.
L
Если f(x,y,z) = iP{x9y,z) + jQ{x9y,z) +
+кЯ(х,у^) ~~ вектор силы, зависящий от
положения точки (x\y\z)b L на кривой L,
а /,у, Л" - орты прямоугольной системы
координат, то (2.12.3) определяет работу этой
силы при движении точки вдоль L. Работа не
зависит от пути между двумя
фиксированными точками тогда и только тогда, когда
существует функция U(x,y,z) (потенциал
силового поля) такая, что Pdx + Qdy + Rdz = d(J
(см. 2.13.4).
Объем тела, ограниченного кусочно
гладкой замкнутой поверхностью S, при выборе
внешней нормали к S
^ = ^fZdxdy = t&xdydz = Hydzdx =
s s s
= —£bxdydz+ydzdx + zdxdy.
s
Масса и координаты центра масс кусочно
гладкой материальной поверхности S с
поверхностной плотностью m(x,y,z) равны:
M-\mdS, хс -—\xmdS ,
i Mi
yc=±jymdS, Zc-jfjzmdS,
s s
а моменты инерции относительно
координатных плоскостей хОу, yOz и zOx соответственно
Jxy=jz2mdS, Jyz = \x2mdS,
s s
Jtx=jy2mdS.
Вектор F силы гравитационного
притяжения, с которой эта поверхность действует на
материальную точку (a;b;c)eR единичной
массы, имеет проекции
Fx = y\^-mdS, F =y\>LZ±mdS,
s Р s Р
Fz=yj^mdS,
где р = у(х - а)2 + (у - bf + (z - с)2
расстояние между точками M(x\y\z)t S и
М$(а\Ь\с), у - гравитационная
постоянная. Последние интегралы при Mq e S
являются несобственными, но переходом к
сферическим координатам с началом в точке Л/q
их можно преобразовать в обычные.
Поверхностный интеграл
, , cm(M)dS(M)
114
Глава 2.14. ВЕКТОРНЫЙ АНАЛИЗ
M(x;y;z)eS аМ3, М0(и; v; w) e R3 ,
(2.13.8)
зависящий от параметров и , v и w,
определяет гравитационный потенциал в точке Mq
материальной поверхности S с
поверхностной плотностью т[М), причем VAf0 g S
проекции силы притяжения равны:
FX(M0) = U'U(M0), Fy(M0) = l/'v(M0),
FZ(M0) = U'W(M0). (2.13.9)
При Mq e S интеграл в (2.13.8) будет
несобственным, зависящим от параметров и , v и
w, но подынтегральная функция является
дифференцируемой по w, v и w на
множестве U(Mq)C\S , и поэтому формулы (2.13.9)
верны.
Глава 2.14
ВЕКТОРНЫЙ АНАЛИЗ
Предметом векторного анализа является
исследование векторных функций методами
дифференциального и интегрального
исчислений.
2.14.1. Векторные функции
скалярного аргумента. Если каждому значению
аргумента t e К поставить в соответствие
единственный вектор r(t). то r(t) называют
вектор-функцией (векторной функцией)
скалярного аргумента. Конец радиус-вектора r(t)
с началом в фиксированной точке О при
изменении f описывает пространственную
кривую, называемую годографом вектор-
функции г(/) (рис. 2.14.1) (если f — время,
то говорят о траектории точки М ).
В прямоугольной системе координат с
ортами I, у, к функцию г(0 можно задать
при помощи координатных функций
x(t),y(t),z(t):
r(t) = ix(t) + jy(t) + kZ(t). (2.14.1)
Таким образом, параметрическое
представление годографа функции r(t) (или траектории
точки М ) имеет вид
х = x(t),y = y(t),z = Z(t)9te[tbt2]. (2.14.2)
Пределом функции r(t) = ii\(t) + jr2(t) +
+kr$(t) при f —»/о называют вектор
a = W| + ja2 + Аю?з и обозначают lim r(t) =
= а или r(f) -» а или f -» f0 , если
lim |r(f) - al = 0 , что равносильно
lim //(f) = flf/, / = 1,2,3 . Для непрерывной в
точке f0 функции r(t) lim r(t) = r(fo), что
равносильно непрерывности координатных
функций /j(f), / = 1,2,3 , в точке fo .
Если существует предел
д/->0 At д/->0 At
то его называют производной функции r(t) в
точке f и обозначают ^/г/t/f или r\t). Из
представления (2.14.1) следует r\t) = ix\t) +
+jy'(0 + kz\t) • Вектор r\t) касателен к
годографу (см. рис. 2.14.1) в точке М и
направлен в сторону, соответствующую
возрастанию f , а его длина |r'(f)| зависит от
выбора f (если f — время, то обычно
используют обозначение г , и |г| является скоростью
движения точки М по траектории, а г —
вектором скорости этой точки, а если f —
длина дуги, то |г'(0| = 1). Дифференциал
dr(t) = r\t)dt радиус-вектора r(t) касателен
к годографу, а дифференциал длины дуги
годографа ds = yldr(t)dr(t) = |</r(f )| = |r(f)df|.
Если р, q e R , то (опуская обозначение
аргумента) (рг\ + <7Г>) = /*/]' + qr^ (линейность
операции дифференцирования). Если /(f) -
скалярная функция, то {fr) = fr' + f'r и
И/)/ = Г//' • Кроме того, (/] г>)' =
= Л//!>+/1/!> и (Л х/!>) = Л'х/!> +1 хг1 •
В случае r(f) = /() = C0/wf годограф вектор-
функции r(t) лежит на сфере радиуса г0 и
всегда г г' = 0 .
Если существует производная функции
r(t) , то (г'(0) = ^(0 ~ вторая производная
СКАЛЯРНЫЕ И ВЕКТОРНЫЕ ПОЛЯ
115
Рис. 2.14.1
функции г(0. При представлении в виде
(2.14.2) r\t) = ix\t) + jy\t) + kz\t). Если
t - время, то обычно используют
обозначение г , причем |г| является ускорением
движения точки М по траектории, а г —
вектором ускорения этой точки.
Аналогично вводят производные вектор-
функции r(t) более высоких порядков. Если
они существуют, то справедлива формула
Тейлора
где при условии 0,- е (0, 1), / = 1,2,3
остаточный член с учетом представления (2.14.1)
Л/1+1 = (ix{n+l)(t + 0,Л) + jy(n+l)(t + 02Л) +
+kz^4t + e3h))-^—-.
'(/i + l)!
2.14.2. Скалярные и векторные поля.
Множество значений скалярной функции
U(x>y>Z) = Ьг(г) = U(M), зависящей от
положения точки M(x\y\z)t К с радиус-
вектором г = ix + jy + kz, где i, у, к - орты
прямоугольной системы координат Qxyz,
вместе с областью определения этой функции
образуют пространственное (трехмерное) скалярное
поле. Геометрически оно представимо
совокупностью поверхностей уровня U(x,y,z) =
= const, на каждой из которых U имеет
постоянное значение. Функция U(x,y)
задает плоское скалярное поле, представимое
линиями уровня U(x9 у) = const. Если
поверхности уровня являются цилиндрическими с
образующими, параллельными одному
постоянному направлению, то скалярное поле
называют плоскопараллельным, и в каждой
плоскости, перпендикулярной к этому
направлению, его можно задать скалярной функцией
двух переменных.
Рис. 2.14.2
Векторная функция У(х, у, z) = У (г) =
= V(M) = iVx(M) + jVy{M) + kVz{M)
вместе со своей областью определения образуют
пространственное векторное поле,
характеризуемое тремя скалярными полями,
определяемыми координатными функциями VX(M),
Vy(M), VZ(M) векторной функции V(M).
Векторное поле представимо совокупностью
векторных линий (линий тока), имеющих в
каждой точке М направление вектора
У(М) и удовлетворяющих системе
дифференциальных уравнений drxV(r) = 0 , или
<Ьс/Ух(х, у, z) = dy/Vy(x, у, z) = dz/Vz(x, у, z).
116
Глава 2.14. ВЕКТОРНЫЙ АНАЛИЗ
Если использовать параметрическое
представление вида (2.14.1) и (2.14.2), введя
параметр t линии тока, то, например, для
x(t) dx(t)/dt = Vx(x(t), y(t), z(0).
Плотность линий тока в точке М
пропорциональна \V(M)\. Часть пространства,
состоящая из линий тока, охватываемых
некоторой замкнутой кривой или пересекающих
ее, называют векторной трубкой. В каждой
точке М е S поверхности трубки нормаль
п(М) к S перпендикулярна к вектору
Г(Л/),т.е. V(M)n(M) = Q.
Векторная функция V (х, у) =
= iVx(x, у) + jVy(x, у) + kVz(x, у) задает
плоско-параллельное векторное поле. Если при
этом Vz(x, y) = 0, то векторное поле
называют плоским. Его линии тока являются
плоскими кривыми.
В некоторых случаях скалярные и
векторные поля удобнее задавать в сферических
или цилиндрических координатах.
Прямоугольные координаты точки A/(x;.y;2)eR
связаны с ее сферическими координатами
(рис. 2.14.2, а) формулами х = psinflcoscp,
у = р sin О sin (p, z = р cos О , причем ее
радиус-вектор r(M) = ix + jy + kz = е\р + е2$ +
+езф, а ориентация правой тройки единичных
векторов е\, е2, £3 (ортов сферической
системы координат) зависит от положения
точки М . Тогда U(M) = U(p, О, (р),
V(M) = <?,К,(Л/) + e2V2(M) + e3V3(M), где
V\ = Vx sin г) cos (p + Vy sin Ь sin (p + Vz cos 0,
V2 = Vx cos#cos(p+ KyCosOsincp-J^sint^,
V3 = J^coscp - J^sincp - координатные
функции векторной функции V(M) в
сферической системе координат.
Обратные соотношения: Ух-^\ sinflcos<p +
+V2 cos Ocos(p - K3 sin (p, Vy = Vx sin Osin ф +
+V2 cos0siii9 + K3 cos9, Vz = Vx cosfl-
-K2sinO. Если U(M) или V(M) =
=.e\V\(M) зависят лишь от расстояния
р(Л/, Л/0) между точками М и Mq , то
говорят о центральном (сферическом)
скалярном или векторном поле и о сферических
координатах с началом в точке Л/q
U(M) = U(p) и V(M) = e]Vl(p).
Прямоугольные координаты точки
М(х] у; z) e R связаны с ее
цилиндрическими координатами (рис. 2.14.3, б)
формулами х = р cos ф, у = р sin ф, z = Z , причем ее
радиус-вектор r(M) = bc + jy = fe = qp + е2ф +
+ e3z (орты е\, е2, е3 =к) цилиндрической
системы координат образуют также правую
тройку векторов с зависящей от положения
точки Л/ ориентацией). Тогда U(M) =
= t/(p, ф, Z) и Г(Л/) = ЧК,(Л/) + *2К2 +
+e3Vz(M), где К, = Vx cosф + ^ sin ф,
V2 = ^ cos ф - Vx sin ф, Vz — координатные
функции векторной функции V(M) в
цилиндрической системе координат. Обратные
соотношения: Vx = V\ cos <p-V2 sin ф, Vy =
= V\ sin ф + K2 cos ф. Для плоского
векторного поля V(M) = e\V\(M) + e2V2{M), а для
плоскопараллельного - V(M) = в\У\(М) +
+e2V2(M) + e3Vz(M). Если функции (/(Л/)
или Р(Л/) не зависят от угла ф, то говорят
об осесимметричном скалярном или
векторном поле и пишут U(M) = U(p9z) и
V(M) = «jK,(p, z) + e2K2(p, г) + e3Vz(p, z) ■
Если U(M) и Р(Л/) зависят только от
расстояния р точки М от оси Oz, то
скалярное поле будет плоским осесимметричным,
причем U(M) = U(p), а векторное -
плоскопараллельным осесимметричным при
V(M) = elV](p) + e2V2(p) + e3V3(p) и в
частном случае Vz(p) = 0 — плоским
осесимметричным.
2.14.3. Интегрирование функций
радиус-вектора. При представлении радиус-
вектора r(t) в виде (2.14.1) и (2.14.2) длина
дуги его годографа
'2 '2
l = j\dr(t)\ = j\r\t)\dt =
'1 ч
'2
= JV*'2(0 + /2(0 + z'2(0</>.
'1
Интегрирование по дуге L этого
годографа зависящих от положения точки
М(х\ у\ z)e L скалярной U(M) = U(r) и
векторной V(M) = V(r) функций
приводит к криволинейным интегралам // рода:
ИНТЕГРИРОВАНИЕ ФУНКЦИЙ РАДИУС-ВЕКТОРА
117
J U(r)dr = i J U(x, у, Z)dx + jj U(x, y, z)dy + к j U(x, y, z)dz,
L L L L
j V(r)dr = J Vx(x, y, z)dx + j Vy(x, y, z)dy + J Vz(x, y, z)dz,
L L L I
f V(r)xdr = if K/z - K^ + у f Vzdx- Kx<fe + kjVxdy- Vydx,
L L L L
где Vx,Vy,Vz ~ координатные функции век- S в точке Л/ с ради усом-вектором г и
„/ ч „ г длину */д£ = (г.. xrv)dudv = dS, численно
торной функции Vyr). Если L — замкнутая ' ' v '
равную элементу площади поверхности
кривая, то значение интеграла wV(r)dr на- (^> ^х» ^ху ""проекции S на координат-
L ные плоскости соответственно yOz,
зывают циркуляцией векторного поля V(r) zOx, xOy). Если S задана дифференцируемой
вдоль L . функцией z = z(x, у) , т.е. и = х и и = у ,
Представление двусторонней поверхности то </£ = (-!£* - jz'y + k)dxdy и </S =
iS1 в виде (2.13.4) эквивалентно заданию ее
*2 =^2+42 + 1-
функцией r(w, у) параметров w, ueGcK
определяющей радиус-вектор каждой точки Поверхностный интеграл I рода \\dS\ =
M(x\y,z)£ S. Тогда можно определить век- $
торный элемент поверхности (вектор площад- f JO 0
= яд равен площади поверхности о .
ки) </£ = (г/, х /£) tfwdfo = (М + у# + ЛС) х J
о
х</ш/г; - (i(^# ^ - г^ }£) + У(4 л£ - < 4) + Интегрирование по S функций
U(M) = U(r) V(M) = V(r), зависящих от
+ £ (дсм ^ ->>м x^)j лила = iutyz + /яг^ + положения точки М(х\ у\ z) e S , приводит
+ft^XJM имеющий направление нормали к к поверхностным интегралам II рода:
jU(r)dS = ijjU(x, у, z)dydZ + jjjU(x, у, z)dZdx + kjjU(x, у, z)dxdy,
j V(r) dS = i JJ Vx dy dz + j jj Vy dzdx + k jj Vz dx dy, (2.14.3)
jK(r)x</.S = i jjvydxdy- j Vzdzdx
+ J
jjVzdydz- j Vxdxdy
*xy
+k
jjVxdZdx- j Vydydz
*yz
Значение интеграла в (2.14.3) называют потоком векторного поля V(r) через поверхность S.
Если S задана функцией z = Z(x, у), то
jU(r)dS = JJ (-iz'x - jz'y + k)U (x, y, z(x, y))dxdy,
S Fxy
j V(r) dS = jj {-Vx 4 -Vyz'y + yz) dx dy,
S Fxy
jV(r)xdS=jj(i(Vy +yzz'y)-j{Vx+VzZx) + k(VyZ'x-Vxzfy))dxdy.
118
Глава 2.14. ВЕКТОРНЫЙ АНАЛИЗ
Если в пространственной области V
определена векторная функция У (г) =
= iVx(r) + JVy(r) + kVz(r), то jV(r)dV =
у
= i\vx(r)dV + jjVy(r)dV + kjVz(r)dV.
У У У
2.14.4. Дифференцирование функций
радиус-вектора. Производными скалярного
U(M) = U(г) или векторного V(M) = V(r)
поля по объему в точке М е V с радиус-
вектором г(М) называют пределы (если они
существуют) отношения поверхностных
интегралов от этих функций по замкнутой
поверхности S, которая охватывает объем V, к ^при
V —> 0 , когда S стягивается в точку М.
Векторную функцию
lim — Sl/(r)dS
y->oV
s
называют градиентом скалярного поля U(r)
и обозначают grad[/, что соответствует
градиенту скалярной функции U(r) трех
переменных, которыми являются координаты
текущей точки М е V . Пусть точка М
движется по кривой L, заданной вектор-функцией
r(s) скалярного аргумента s — длины дуги
кривой. Тогда единичный вектор s = dr/ds
определяет направление касательной к L в точке
М с радиус-вектором г(М), а выражение
s • grad U — производную скалярного поля по
направлению вектора s, которая соответствует
производной скалярной функции И (г) по этому
направлению. В каждой точке, где
grad(/ * 0, |grad(/| равен наибольшему
значению s grad(/ , а направление grad(/,
совпадает с направлением этой наибольшей
производной. Векторные линии поля,
задаваемого векторной функцией grad£/ ,
перпендикулярны к поверхностям уровня скалярного
поля, задаваемого функцией U(r). Функция
U(г) является скалярным потенциалом
векторного поля grad U (г).
Скалярную функцию
Um^-Sv(r)dS
y->oV У
s
именуют дивергенцией векторного поля V(r)
и обозначают div V. Если в каждой точке
М di\V - О , то поле V(r) является соленои-
дольным.
Векторную функцию
lim j-Sv(r)xdS
y-+oV
называют ротором (вихрем) векторного поля
V(r) и обозначают rot^ (иногда curlP).
Функция V(r) является векторным
потенциалом поля rot V(r). Если в каждой точке
М rot V = 0 , то поле V(r) называют
безвихревым (или потенциальным), а если еще и
div V = О , то это поле называют
гармоническим (или лапласовым). Проекцию
nrotV(M) на направление единичного
вектора п в точке М можно определить как
предел отношения циркуляции векторного поля
V(r) вдоль замкнутой кривой L, на которую
опирается поверхность с площадью S и
единичным вектором п нормали в точке М е S
к S, когда диаметр 5 поверхности
стремится к нулю, a L стягивается в точку М , т.е.
nrotV(M) = \\m-(l)V(r)dr
8->0 S J
L
(при интегрировании обход L вокруг вектора
п против движения часовой стрелки).
Если существует предел
\im(V(r + es)-V(r))/e, то его называют
е->0 /
градиентом векторного поля V(r) по вектору
s и обозначают (sgrad)F. Если s -
единичный вектор, то вместо (s grad)V пишут
dV/ds и говорят о производной векторного
поля V(r) no направлению вектора s .
В прямоугольной системе координат с
ортами i, у, к в каждой точке М(х;у;£)
можно определить оператор Гамильтона (или
набла-оператор) V = id/dx + jd/dy + kd/dz •
Тогда для дифференцируемых функций
ait viFT -dU .dU ,dU
grad U = VU = i — + j — + Аг —,
дх ду dz
div V
дх
dVv ЭК
rotV = VxV = i\^-^
ду dz
ду
+ J
dz
dV±
dz
dv^
дх
ДИФФЕРЕНЦИАЛЬНЫЕ ОПЕРАЦИИ ВТОРОГО ПОРЯДКА
119
+к
[дх ду )
I j к
д_ _Э_ _Э_
дх ду dz
V V V
(sgrad)V = (sA)V = i(sgradVx) +
+/ (s grad V + y) + A: (s grad ^).
В цилиндрических координатах р, (p, Z с
ортами соответственно в\, е2, е^ -к при
V = exVx + e2V2 + еъУъ
dU_
Эр
grad£/ = е, — + —*--— + е3
Р Эф
dz'
р Эр р Эф dz
.„ ,1ЭК3 ЭК,
rotF = e«lp^-lF
ЬМ>
« .'Э(Р^) 1ЭКД
31 р Эр р Эф Г
а в сферических координатах р,$,ф с ортами
соответственно е\9 е2, е$ при V - exVx +
dU e2 dU еъ dU
Эр р ЭО psind Эф
divr, 1 Э(рУд)| 1 Ш2*ъ*) ХЫ
р2 Эр р sin ^ I Эд Эф j
rot
Гг_ q p(r3sind) ЭМ
ЭО
Эф
р sin ОI
i«if 1 ЭК, д(рУ3)\е3(д(рУ2) дУЛ
р I sin О Эф Эр I р I Эр д& )
Градиент, дивергенция и ротор обладают
свойствами линейности:
grad(pU{ +lqU2) = p gradU] + q gradU2,
div(/7r/1 +qV2) = pdi\V{ + qd\\V29
rot(pV{ + qV2) = protV{ +qvotV2 Vp,qeR.
Кроме того,
grad(U{U2) = U{gmdU2 + U2&bd\J{,
grad/(tf) = fugradU, diwV(U) = ^gradC/,
grad (V{ V2) = (V{ grad)^ + (F2 grad)ri +
+V{ x rotr^ + V2 x rotr7,, div(l/F) = UdivV +
+ FgradU, div(Г, xP2) = F2xrotV{ -^rotF2,
(^ grad)(W2) = (^ grad£/)F2 + U(V{ grad) F2,
rot(£/rO = tfrot Г - Г х grad U,
юЩ xV2) = (V2grad)*7, -(V{ grad)^ + ^divV2-
- V2d\\ V{, 2(V{ grad)F2 = tot(V2 x Г,) +
+ grad(r/1 F2) - F2div V{ + Pjdiv F2 -
-r^Xrot^-^Xrotr^.
Если с — постоянный вектор и г = |г|,
то grad г = г/г, divr = 3, (V grad) г = г7,
grad(c г) = с , grad U(r) = £7^. г/г (градиент
центрального скалярного поля задает
центральное векторное поле),
dvvU(r)r = 1U + rU'r, roW(r)r = 0,
div(c х г) = 0, rot(c х г) = 2с,
(Fgrad)(cxr) = cxr/,
di\U(r)c = U'r(cr)/r,
rotU(r)c = (J'r(rxc)/r,
grad(c rIг3) = -rot(c x г/г3),
(V grad) U(r)c = U; (Vr)c/r.
2.14.5. Дифференциальные операции
второго порядка. Оператором Лапласа
называют дифференциальный оператор
V = div grad (иногда его обозначают А ). В
прямоугольной системе координат Oxyz с
ортами I, у, к этот оператор является скалярным
квадратом оператора Гамильтона (читают
«набла квадрат») V = V • V = (/Э/Эх +
j д/ду + k d/dz)2 = д2/дх2 + Э2/ду2 + d2/dz2 •
Для дважды дифференцируемых в точке
M(x\y\z) скалярной U(M) и векторной
V{M) = iVx +jVy+kVz функций V2U =
= d2u/dx2+d2u/dy2+d2u/dz2 и VV =
= iV2Vx+jV2Vy + kV2Vz.
В цилиндрических координатах р, ф, Z
Р Эр [^ Эр
а в сферических координатах р, $, ф
vv-ii-p^
1 ±^. э2£/
J+ р2 Эф2 + Э^2 '
120
Глава 2.14. ВЕКТОРНЫЙ АНАЛИЗ
д (. ?ил 1 д2и
— — SU1 О —— + -^ о Т-
ЪдЪ{ aoj p2sin20 Эф2
р2 sin
Выражение для V ^ в криволинейных
координатах громоздко и целесообразнее
использовать формулу V2V = grad div V - rot rot V .
Оператор Лапласа обладает
свойством линейности: Vp,q e К V2(/>(/| +#£/2) =
= pV2U{ +qV2(J2' Кроме того, V2(U{U2) =
= UXV2U2 + 2(grad U{) grad£/2 + (/2V2^/, ,
vV(^) = /</V2tf+ /J2(grad£/)2. Если с -
постоянный вектор и г = |г|, то V (сг) = 0,
V2U(r) = U"r2 + (2/r)U'nV2r = 0, V2(cxr) = 0.
Скалярное поле U(M), удовлетворяющее
условию V £/ = 0 , называют гармоническим
(или лапласовым).
Для дважды дифференцируемых
скалярной U(M) и векторной Р(Л/) функций
rot grad (/ = 0 и div rot F = 0 , т.е. любое
векторное поле, обладающее скалярным
потенциалом, является безвихревым, а любое
векторное поле, имеющее векторный потенциал,
будет соленоидальным. Всякое векторное поле
представимо суммой безвихревого, соленои-
дального и гармонического полей (теорема
Гельмгдльца).
Выражения (.sgrad)"^/ и (jgrad)'1?'
определяют производные порядка п
скалярного U(r) и векторного V(r) полей по
направлению единичного вектора s в точке М
с радиус-вектором г(М). Для точки М' с
радиус-вектором г(М) + Аг по формуле Тейлора
U(r + Аг) = U (г) + (Дг grad)tf(r) +
+ (1/2 !)(Дг grad)2 tf (r)+...,
V(r + Ar) = V(r) + (Дг grad) V(r) +
+ (l/2!)(Argrad)2r(r)+...
2.14.6. Интегральные формулы. Пусть
пространственная односвязная область V
ограничена замкнутой кусочно гладкой
поверхностью S с внешним направлением единичного
вектора п нормали. Если скалярная U(r) и
векторная V(r) функции радиус-вектора
г(М) точки М е V непрерывно
дифференцируемы в V , то справедливы интегральные
формулы Г div V d V = ф V ndS (формула
V S
Остроградского-Гаусса),
v s
Г rot V dV = ф V х п dS, связывающие обьем-
V S
ные и поверхностные интегралы в скалярном и
векторном полях (см. 2.14.3).
Если скалярные функции U(r) и W(r)
дважды непрерывно дифференцируемы в V ,
а на 5 непрерывны производные dU/dn и
Э W/дп по направлению вектора п , то
справедливы первая и вторая формулы Грина
f (grad £/grad WO</K+ \\VV2U dV =
V V
= j> ИЪ gradf/ dS = §W—dS,
s s
\{UV2W - WV2U)dV =(j)(tf/igrad W -
v s
-Wn%i2AU)dS = A>(u — -W—)dS.
В частных случаях VA/ e V W(M) = 1
и W(M) = U(M)
\v2UdV=j>ngradUdS = j>—dSi
v s s n
J|gradLf </K + Jv2£/</K =
v v
= j>UngTbdUdS = j)U—dS.
s s
Пусть кусочно гладкая двусторонняя
поверхность S ограничена кусочно гладкой
замкнутой кривой L. Если функции U(r) и
V(r) непрерывно дифференцируемы на 5 , то
Unrot)U(r)dS = j)Udr, jnrotVdS = j>Vdr
S L S L
(формула Стокса) и
s
= -<J>V xdr (обход L вокруг вектора п
L
против движения часовой стрелки). В частном
случае плоской области F, ограниченной в
плоскости хОу замкнутой кривой Г, для
ОТЫСКАНИЕ СКАЛЯРНОГО И ВЕКТОРНОГО ПОТЕНЦИАЛОВ
121
непрерывно дифференцируемых в F
функций Р(х, у) и Q (х, у) верна формула Грина
(при обходе Г область F остается слева).
2.14.7. Отыскание скалярного и
векторного потенциалов. Пусть в
пространственной области V , ограниченной замкнутой
поверхностью S, задано векторное поле V(r)
(г(М) — радиус-вектор точки М € V ). Если
VAf € V rot V(r) = 0, то поле безвихревое и в
V существует скалярный потенциал U(r),
такой, что V(r) = gradf/(r), a V(r)dr =
= t/rgrad U(r) = dU(r) - полный
дифференциал. Тогда
U(r) = U(ib) + jV(/)d/, (2.14.4)
L
где L — любая кривая в V , соединяющая
фиксированную точку Mq e V с радиус-
вектором /() и точку М, т.е. U(г) можно
найти с точностью до постоянного слагаемого
[/(/()). Из (2.14.4) следует, что циркуляция
безвихревого векторного поля вдоль любой
замкнутой кривой в V равна нулю. Если в V
d\\V(r) Ф О , то частное решение
™-Щтг%"««-<2,45,
где г = ix + jy + kz' и i, j, k - орты
прямоугольной системы координат.
Если VA/ е К divF(r) = 0, то заданное
поле V(r) соленоидально, и в V существует
векторный потенциал А(г) такой, что
V(r) = rot A(r), причем
2.14.8. Отыскание векторного поля по
его дивергенции и ротору. Если в
пространственной области V , ограниченной
замкнутой поверхностью S, в каждой точке М е V
с радиус-вектором г(М) заданы дивергенция
d\\V(r) = Q(r) и ротор rotV(r) = R(r)
векторного поля V(r), то векторную функцию
V(r) в V можно найти однозначно, если в
каждой точке на S заданы значения
V(r) n(r) = /(г) (п - единичный вектор
внешней нормали к S) при выполнении
дополнительного условия \Q(r)dV =
V
- ф f(r) dS • По теореме Гельмгольца
S
У(г) = Vx(r) + V2(r) + V3(r), где Vx(r) =
= grad U(г) — безвихревое поле со скалярным
потенциалом U(r), V2(r) = roiA(r) - соле-
ноидальное поле с векторным потенциалом А(г)
и ^з(г) = gradO(r) — гармоническое векторное
поле со скалярным потенциалом Ф(г) .
Если в (2.14.5) и (2.14.6) вместо
d'ivV(r') и rotV(r') подставить
соответственно Q(r) и R(r), то можно найти U(r)
и А(г), а для отыскания Ф(г) необходимо
решить вторую краевую задачу теории
потенциала для уравнения Лапласа V Ф(г) = 0 в V
с условием п gradO = / - (V{ + V2)п на S .
СПИСОК ЛИТЕРАТУРЫ
1. Бронштейн И.Н., Семендяев К.А.
Справочник по математике для инженеров и
учащихся втузов, 13-е изд., исправл. М.:
Наука, 1986. 544 с.
2. Гаврилов В.Р., Иванова Е.Е.,
Морозова В.Д. Кратные и криволинейные интегралы.
Элементы теории поля. М.: Изд-во МГТУ им.
Н.Э. Баумана, 2001. 492 с. (Сер. Математика в
техническом университете: Вып. 7).
3. Градштейн И.С., Рыжик И.М.
Таблицы интегралов, сумм, рядов и произведений.
М.: Наука, 1971. 1100 с.
4. Зарубин B.C., Иванова Е.Е., Кувыр-
кин Т.Н. Интегральное исчисление функций
одного переменного. М.: Изд-во МГТУ им.
Н.Э. Баумана, 2000. 528 с. (Сер. Математика в
техническом университете: Вып. 6).
5. Иванова Е.Е. Дифференциальное
исчисление функций одного переменного. М.:
Изд-во МГТУ им. Н.Э. Баумана, 1998. 408 с.
(Сер. Математика в техническом
университете: Вып. 2).
6. Ильин В.А., Садовничий В.А.,
Сеидов Бл.Х. Математический анализ: Начальный
курс / Под ред. А.Н. Тихонова, 2-е изд., пере-
раб. М.: Изд-во МГУ, 1985. 662 с.
7. Корн Г., Корн Т. Справочник по
математике для научных работников и
инженеров: Пер. с англ. М.: Наука, 1984. 832 с.
8. Математический энциклопедический
словарь / Гл. ред. Ю.В. Прохоров. М.: Сов.
энциклопедия, 1988. 848 с.
9. Морозова В.Д. Введение в анализ. М.:
Изд-во МГТУ им. Н.Э. Баумана, 2000. 408 с.
(Сер. Математика в техническом
университете: Вып. 1).
Раздел 3
РЯДЫ
Глава 3.1
ЧИСЛОВЫЕ РЯДЫ
3.1.1. Числовые ряды и их сходимость.
Выражение вида й\ + а2 + а^ +... + ап +...,
представляющее собой последовательность
действительных или комплексных чисел
а[,а2,...,ап,..., соединенных знаками плюс,
называют действительным или комплексным
числовым рядом. При этом члены
последовательности {ап} , называют членами ряда, а
общий член ап последовательности {ап} _. —
общим членом ряда. Для обозначения ряда
а\ + а2 + аЪ + ••• + ап + ••• применяют
следующую краткую форму записи: \\ап •
п=\
Обычно члены ряда нумеруют, начиная с
единицы. Однако иногда бывает удобно
начинать нумерацию членов ряда с нуля. В этом
случае ряд имеет вид V ап . Более того, чле-
ны ряда можно нумеровать, начиная с любого
номера. Так, при всех к е N выражения вида
]Гд„ =ак +ак+1 +д*+2+... + *„+... также
п=к
называют рядами.
Сходимость и расходимость числового ря-
п
да. Для всякого «gN сумму Sn = 2\ak
к=\
первых п членов ряда Vtf„ называют n-Pi
частичной суммой этого числового ряда.
Числовой (действительный или комплексный)
ряд 2\ап называют сходящимся, если суще-
ствует конечный предел S
последовательности {^}°°=| его частичных сумм. При этом
число S называют суммой числового ряда
/лап и пишут \^ап = S. Если числовой
я=1 п=\
ряд является сходящимся и его сумма равна
S, то говорят также, что имеет место
сходимость числового ряда к числу S .
Числовой (действительный или
комплексный) ряд \\ ап называют расходящим-
ся, если последовательность его частичных
сумм {'S/j}00, не имеет конечного предела
при п —» ©о , т.е. либо этот предел не
существует, либо он равен бесконечности. Если
числовой ряд является расходящимся, то
говорят также, что имеет место расходимость
этого числового ряда.
Уточним понятия сходимости и суммы
для комплексных числовых рядов. Комплекс-
сходится к ком-
ный числовой ряд у ап
п=\
плексному числу S = А + iB, А, В е R ,
тогда и только тогда, когда сходятся действи-
ЧИСЛОВЫЕ РЯДЫ И ИХ СХОДИМОСТЬ
123
тельные ряды V Retf/7 и Ylmflw , а их
/7=1 /7=1
суммы равны числам соответственно А
и В .
Связь рядов и последовательностей.
Существует тесная связь между теорией
числовых рядов и теорией числовых
последовательностей. Действительно, с одной стороны,
сходимость (расходимость) числовых рядов
эквивалентна сходимости (расходимости)
числовых последовательностей их частичных
сумм. С другой стороны, сходимость
(расходимость) всякой числовой
последовательности эквивалентна сходимости (расходимости)
некоторого числового ряда. Так, каждой
последовательности {sn} можно однозначно
поставить в соответствие некоторый ряд
lim S„ = lim
1-я"
\-q
\-q
, M<i;
ak , последовательностью частичных сумм
к=\
которого является последовательность {sn}.
Таким рядом является, очевидно,
«о, \q\>\.
При q - 1 получим lim Sn = lim n = ©о.
Наконец, при q = -1 рассматриваемый
ряд принимает вид
^(-\)"~[ =1 -1+1-1 + ... + 1-1 + ...
Последовательность частичных сумм данного
ряда предела не имеет, поскольку
$2к-\ =l,S2k=0,keN.
Таким образом, исходный ряд
расходится при |#| > 1 и сходится при \q\ < 1 , причем
q = .
i 1 - Q
Необходимым признаком сходимости ряда
является выполнение условия
ряд
S\ + \j (sk ~ sk-i) с членами d\ = S\,
k=2
a2 =s2 -sh..., ak =sk -sk_b.... Таким
образом, любой результат, полученный в теории
рядов, можно сформулировать на языке
теории последовательностей и наоборот.
Исследование ряда на сходимость. В
теории числовых рядов решают две основные
задачи: исследуют ряд на сходимость^ т.е.
выясняют, сходится ряд или расходится, и
вычисляют точно или приближенно сумму
сходящегося ряда.
Пример 3.1.1. Исследуем на сходимость
и (в случае сходимости) найдем сумму
геометрического ряда 2_,Qn~ , <7 ^ R . Используя
/7=1
формулу для вычисления суммы п первых
членов геометрической прогрессии, получаем
3.-5У-1-
к=\
= \+q + q2 +... + qn~l =
При \q\ Ф 1 имеем
яп-\
q-\
п, q = \.
к=\
lim ак = О. Отметим, что это условие не
к-+°°
является достаточным для сходимости
данного ряда. Например, для ряда V \/у[к не-
к=\
обходимый признак сходимости выполнен.
Однако он расходится, поскольку для
последовательности его частичных сумм
справедлива следующая оценка:
£ = 1 +-= + ... + -=?> п-Гг = у/п, neN ,
V2 >1п у/п
и lim Sn = -к».
Если необходимый признак сходимости
ряда не выполнен, т.е. предел lim ак не
к-*°°
существует или lim ак *0, то ряд / ак
расходится. Если же необходимый признак
выполнен, т.е. lim ак = О, то по одному
к-*°о
только этому условию ничего определенного
о сходимости ряда сказать нельзя — ряд
V ак может как сходиться, так и расходиться.
к=\
124
Глава 3.1. ЧИСЛОВЫЕ РЯДЫ
Пример 3.1.2. Для ряда > не
^Зл + 2
//=1
выполняется необходимый признак
сходимости, поскольку lim ап = 2/3 * 0 . Следова-
тельно, этот ряд расходится.
3.1.2. Свойства сходящихся рядов.
Числовой ряд \ ак > полученный из ряда
к=п+\
) ак путем отбрасывания первых п его чле-
к=\
или заменить конечное число членов
другими, то это не отразится на его сходимости
или расходимости.
Отбрасывание членов, равных нулю (с
сохранением порядка оставшихся членов), не
влияет на сходимость или расходимость ряда,
а в случае сходимости не изменяет сумму
ряда.
Если X е Ж (X е С) - некоторое число,
то ряд \. 0^ак) называют произведением ряда
к=[
V ак на число X . Если ряд V ак сходится
к=\
к=[
нов, называют п-ы остатком ряда 2\ак и
к=\
его сумму (при условии, что этот остаток
сходится) обозначают Rn = } ак .
к=п+[
и имеет сумму S, то ряд 2_. Хак ,
X е R (X е С), также сходится и имеет сумму
XS: ^(Хак) = Х^ак.
к=\
к=\
Если ряд У ак сходится, то сходится и ^
£* Ряд вида У(ак+"к)> членами кото-
kri \лп t*rr\ n^TnTvnD П^потип «шли nvr»nuT_ AC —I
любой из его остатков. Обратно, если
сходится хотя бы один из остатков ряда, то сходится
и сам ряд. При этом для всех п е N
справедливо равенство
оо Ц оо
X** = £Л + X °к ' ИЛИ S = Sn+Rn
к=\ к=\ к=п+\
Все остатки \ ак > л = 0,1,2,..., ряда
к=п+\
2_,ак сходятся и расходятся одновременно,
к=\
т.е. если сходится хотя бы один остаток, то
сходятся и все остальные остатки (в том числе
и сам ряд), а если хотя бы один из остатков
расходится, то расходятся и все остальные
остатки (в том числе и сам ряд).
рого являются суммы ск = ак + Ьк членов
рядов 2\ак и 2^^к с одинаковыми номе-
к=\ к=\
рами, называют суммой рядов 2\ак и 7,&к •
к=\ к=\
Говорят также, что ряд V (ак + Ьк) получен
к=[
почленным суммированием рядов /Lak и
к=\
У Ьк . Если ряды 2\ок и 2_.Ь/с сходятся и
к=\ к=\ к=\
имеют суммы соответственно А и В , то ряд
Если ряд > ак сходится, то последова- v^ , , ч
*-* К У.\ак + "к) также сходится, и его сумма
к=\
тельность {/?„} _, сумм его п-х остатков
сходится к нулю, т.е. lim Rn = О .
Основные операции над рядами. Если в
ряде \. ак отбросить конечное число членов
к=\
равна А + В: ]Г(^ + Ьк) = ]Гя* + £^ '
к=\ к=\ к=[
Если ряды 2^ак и У\Ьк сходятся, то
*=1 к=\
в их почленной сумме можно снять скобки.
ЗНАКОПОЛОЖИТЕЛЬНЫЕ РЯДЫ
125
Если каждый член ак сходящегося ряда 1 1 111 1
п +1 п + 2 2п~ 2п 2п 2п
V ак не превышает соответствующий член _ 1 _ 1 _
*=1 ~П2п~2~Е
Ьк сходящегося ряда ]Г^ > то с>™ма Ряда ЗЛЗ- Знакоположительные ряды.
к=\ °°
Признаки сравнения. Ряды V ял , все члены
2_.ак не превышает сумму ряда 2_j^k » те- *=*
£=1 £=1 которых неотрицательны: я^ > 0, к е N, на-
оо оо зывают знакоположительными (или рядами с
\ak<\bk . В частности, если д/7 > 0 , неотрицательными членами). Можно отдельно
£=J j^| рассматривать знакоотрицательные ряды (или
/деды с неположительными членами), однако
п е N , то У я„ > 0 . V1 / \ v*
^■f равенство > (-Дд.) = - > ^ позволяет све-
ж. /7~„ w. А;=1 А;=1
Критерии Кошм сходимости числового ря-
сти анализ знакоотрицательных рядов к ана-
^ лизу знакоположительных.
да. Числовой ряд У°к сходится тогда и м
к=1 Последовательность {^}°°=, частичных
только тогда, когда для любого е > 0 найдет- <»
ся такой номер N , зависящий от е , что для сумм знакоположительного ряда JJT ак не
всех п> N и для любого натурального т к=[
выполняется неравенство \ап+[ + ап+2 + ... Убывает, так как Sn+i - Sn = an+l > О, п е N .
Поэтому, согласно признаку Вейерштрасса,
/7+///I е- последовательность {Sn} имеет конечный
Используя приведенный выше критерий
Кош и сходимости рядов, получим критерий , V" ^
v v предел (и, следовательно, ряд > ак сходит-
оо *>я*Л
расходимости рядов: числовой ряд > ак ч
к v * Aj K ся) тогда и только тогда, когда
последовательность {Sn\ ограничена сверху. При этом для
расходится тогда и только тогда, когда наи- L J
„ ^ п \т обозначения сходимости знакоположитель-
дется такое е > 0 , что для всякого номера W
найдутся номер п > N и натуральное число ного ряда используют запись ]Г^<+оо.
m такие, что выполняется неравенство к=у
К+1 + */i+2+- +ап+т\ * С . ~
Пример 3.1.3. Докажем, что гармониче- Если знакоположительный ряд ^ак расхо-
к=[
ский ряд Yl/я расходится. Покажем, что дится, то lim5'w=+oo, и для обозначения
п=[ расходимости знакоположительного ряда ис-
для данного ряда выполняется критерий рас- ^
ходимости: пользуют запись V ак = +оо .
3e>0VjVe N3n>N3meN: k=l
Признак сравнения. Пусть для
знакоположительных рядов Л,#А:>Л,^ и некото_
к=\ к=\
Пусть е = 1/2 , и для любого натурального TV рого натурального числа N при всех к > N
положим п = N, т = п . Тогда выполняется неравенство ак < Ьк . Тогда:
1 1 1
■ + - + ... + -
n+i п+2 п+т
>е.
126
Глава 3.1. ЧИСЛОВЫЕ РЯДЫ
а) если сходится ряд V Ьк , то сходится
и ряд £ ак ;
б) если расходится ряд V ак , то расхо-
Пример 3.1.6. Поскольку
1
Ъп + п - In л
—, и геометрический ряд > — сходит-
я=1 •
*=1
ся, то, согласно предельному признаку срав-
1
'Зя+/1-1п/! '
нения, сходится и ряд >
и ряд У. Ьк .
дится и ряд > fy
Пример 3.1.4. Поскольку для любого
натурального числа п справедливо неравенство
< , а геометрический ряд
2" \п(п + 1) 2" In 2
оо j
7 — сходится, то, согласно признаку срав-
n=i L
оо .
нения, сходится и ряд > .
ti2wln(« + l)
Пример 3.1.5. При а < 1, Р > 0 и
п = 2,3,... справедливо неравенство:
1пр /7 . 1пр 2 т
. Так как гармонический ряд
например 3.1.7. Знакоположительный ряд
Y» In2 + П\Гп + 1
;£iV9/76+5/75+2
расходится в соответствии с предельным
признаком сравнения, поскольку
расходится, то в силу признака сходи-
In2 + п4п +1 _7_
Ьпв + 5п5 + 2 3"'
а гармонический ряд У 1/я расходится.
л=1
3.1.4. Интегральный признак
сходимости Коши. Пусть действительная
неотрицательная и непрерывная в промежутке
[1, + оо) функция f(x) не возрастает в этом
промежутке. Тогда для сходимости ряда
оо t
X1
Xm n *z ? f(n) необходимо и достаточно, чтобы
расходится при любых LaJ v '
п=2
значениях а < 1 и Р > 0 .
Предельный признак сравнения. Если для
оо оо
знакоположительных рядов V ак и V ^ с
k=i k=i
ненулевыми членами справедливо
соотношение lim -£- = С, 0<С<ооу то эти ряды
к-*™ Ьк
либо оба сходятся, либо оба расходятся.
Если знакоположительные
последовательности {ак} и {Ьк} с ненулевыми
членами являются эквивалентными бесконечно
малыми (ак ~ Ьк), т.е. lim — = 1, то ряды
к->°° Ьк
оо оо
2_,ак и zL ^к сходятся и расходятся одно-
к=\ к=\
временно.
сходился несобственный интеграл [ f(x) dx .
1
Если функция f(x) удовлетворяет
перечисленным выше условиям в промежутке
оо
[т, +°°), то для сходимости ряда V f{ri)
необходимо и достаточно, чтобы сходился
несобственный интеграл f(x) dx .
ряд
Пример 3.1.8. Исследуя на сходимость
при р > О , можно использо-
вать интегральный признак Коши. Для этого
рассмотрим несобственный интеграл
ПРИЗНАКИ ДАЛАМБЕРА
127
7 dx _ 7 d In x
\ x \np x " | In' x "
= 1 *L = J(ln 2>l_
J up I -
In 2 L
P<1.
3.1.5. Признаки Даламбера.
Достаточным признаком сходимости
знакоположительных рядов является следующий признак
Даламбера. Для числового ряда с
положительными членами
Таким образом, в силу интегрального
признака Коши для положительных значений
р имеем расходимость ряда у \/(п\пр п)
/7=2
при 0 < р < 1 и сходимость при р > 1 .
Ряд Дирихле. Исследуем на сходимость
ряд Дирихле
£д„, ап >0, ле N,
я=1
(3.1.1)
Х"7'^
/7=1
Если р < О , то lim l/ at * 0 , т.е.
справедливы утверждения:
1) если существует такое число
q е (0, 1), что для любого натурального
числа п> ttQ верно неравенство ап+\/ап < q, то
ряд (3.1.1) сходится;
2) если для любого натурального числа
п > aIq верно неравенство an+i /ап > 1 , то
ряд (3.1.1) расходится.
Следствием является предельный признак
Даламбера. Пусть для числового ряда (3.1.1) с
положительными членами существует предел
(конечный или бесконечный)
последовательности отношений ап+у/ап общего члена ряда
выполнен необходимый признак сходимости ап+\ к предыдущему члену ап:
оо .
ряда, и ряд "V— расходится.
/7=1 п?
При р > О можно использовать
интегральный признак Коши. Так как
несобственный интеграл
jl/x'dx
1
сходится при
/»>1 и расходится при р < 1 , то ряд
Дирихле сходится и расходится при этих же условиях.
Пример 3.1.9. Исследуем на сходимость
знакоположительный ряд
In 1 + sin
0+e'/«_cosI
п J п
£?{ п + In2 n + arctg п2
Поскольку
In 1 + sin— |+ е I - cos —
п + In2 n + arctg п2
и ряд "V \/п сходится (это ряд Дирихле с
/7=1
р = 2 > 1), то в силу предельного признака
сравнения сходится и исходный ряд.
lim ^ = q, q > О .
/7-»<» ап
Тогда справедливы следующие
утверждения:
а) если q < 1 , то ряд (3.1.1) сходящийся;
б) если q > 1 или q = +<» , То /?яд (3.1.1)
расходящийся.
В случае # = 1 ничего определенного о
сходимости ряда (3.1.1) заранее сказать
нельзя. Для выяснения вопроса о сходимости
такого ряда требуется дополнительное
исследование. Например, для расходящегося
гармонического ряда ^1/я и для сходящегося ряда
/7=1
оо
;Г 1/п (это ряд Дирихле с показателем сте-
/7=1
пени р - 2 > 1) пределы последовательностей
отношений ап+\/а„ равны единице.
Пример 3.1.10. Исследуем на сходимость
ряд с положительными членами
у (Зя)!
;Й(«!)343л"
Применим предельный признак
Даламбера:
128
Глава 3.1. ЧИСЛОВЫЕ РЯДЫ
lim£2±L =
= 1]т (З/i + 1)(3и н- 2)(3д| + 3) 27 ^
64(/i + 1Г
64
Таким образом, исследуемый ряд
сходится.
Пример 3.1.11. Исследуем на сходимость
знакоположительный ряд
\пп
N7 па п
л=1
Воспользуемся предельным признаком
Даламбера:
lim
ап+\
= lim
Л—»°° Я„ Л—>°° / J
1+-
п
Если а < е , то исходный ряд сходится; если
же а > е , то ряд расходится. Если а = е , то
предельным признаком Даламбера
воспользоваться нельзя. Известно, что
последовательность Ul + 1/n) >, предел которой равен е,
монотонно возрастает. Следовательно,
*/i+l е_
>1.
Следствием является предельный
радикальный признак Коши. Пусть для
знакоположительного ряда zLan существует
(конечный или бесконечный) предел
lim yf^n = Q • Тогда справедливы следующие
Л->ов
утверждения:
а) если q < 1 , то ряд V ап сходящийся]
б) если q > 1 или # = +<», то ряд V д/7
л=1
Если ^ = 1 , то предельный радикальный
признак Коши использовать нельзя.
Рассмотрим, например, ряды "V \/п и V \jrr .
/7=1 /7=1
Первый ряд — гармонический, он расходится;
второй — ряд Дирихле с параметром р = 2 , он
сходится. Однако для этих рядов q - 1 .
Пример 3.1.12. Исследуем на сходимость
ряд
п + 2
п
ш
Согласно признаку Даламбера исходный
ряд при а = е расходится.
3.1.6. Радикальные признаки Коши.
Достаточным признаком сходимости
знакоположительных рядов является следующий
радикальный признак Коши. Для
знакоположительна
Воспользуемся предельным радикальным
признаком Коши:
lim^= iim р-±-
= lim II 1—\ =e~l <1.
n + 3
ного ряда ^ап справедливы утверждения: Таким образом, исследуемый ряд сходится.
/7=1
1) если найдется число q < 1 , такое, что
для всех п, начиная с некоторого номера Hq ,
выполняется неравенство Ца^ <q, то ряд
/,ап сходится;
/7=1
2) если же для любого п > щ
выполняется неравенство Цс^ > 1 , то ряд V ап рас-
/7=1
ходится.
3.1.7. Абсолютная и условная
сходимости. Абсолютная сходимость ряда. Действи-
оо
тельный (комплексный) ряд /^п, ап е R
(ап е С), называют абсолютно сходящимся,
если сходится действительный ряд ) \ап\.
/7=1
Если числовой ряд является абсолютно
сходящимся, то говорят также, что имеет место
абсолютная сходимость этого числового ряда.
АБСОЛЮТНАЯ И УСЛОВНАЯ СХОДИМОСТИ
129
Комплексный ряд Vflrt =^\(oin + /'Р„)
п=\ п=\
является абсолютно сходящимся тогда и
только тогда, когда абсолютно сходящимися яв-
ляются действительные ряды У^сх„ и
/i=l
/1=1
Всякий (действительный или
комплексный) абсолютно сходящийся ряд сходится.
Анализ рядов на сходимость
целесообразно начинать с их анализа на абсолютную
сходимость. Причем поскольку исследование
рядов на абсолютную сходимость связано с
изучением сходимости знакоположительных
рядов (рядов из модулей их членов),
признаками абсолютной сходимости действительных
или комплексных рядов являются признаки
сходимости знакоположительных рядов.
Условная сходимость ряда. Действитель-
признаком Даламбера. Обозначая ап =
= я(3/ - \)п/Ьп , получаем
I | n\3i-\\" WlO"
fol+ll =
bn bn
(n + \)\l\0n+[
l/i+1
Следовательно,
ный или комплексный
ряд ^ап
называют
п=\
условно сходящимся, если он сходится, но не
является абсолютно сходящимся, т.е. если
/,ап сходится, а ряд ^Jtfw| расходится.
Если числовой ряд является условно
сходящимся, то говорят также, что имеет место
условная сходимость этого числового ряда.
Комплексный ряд 2^ап является ус-
я=1
ловно сходящимся тогда и только тогда, когда
оо оо
оба действительных ряда Уая и /Вл
п=\ п=\
сходятся, и хотя бы один из этих рядов
сходится условно.
Пример 3.1.13. Исследуем на сходимость
ряд
н— \а„\ я-*- Ьп+1п10"!2 Ь
Таким образом, если то ряд
Jjtfw| сходится и, следовательно, исходный
п=\
ряд сходится абсолютно. Если же , ТО
ряд /_Jtffl| расходится и, следовательно, ис-
/i-l
ходный ряд не является абсолютно
сходящимся. Более того, исходный ряд в этом
случае расходится в силу невыполнения
необходимого признака сходимости ряда. При
Ь = у/\0 предельный признак Даламбера
использовать нельзя. В этом случае |tf/7| = n и
не выполняется необходимый признак
сходимости как для ряда >МЯЛ|, так и для ряда
/i=l
/,ап • Следовательно, в этом случае исход-
/i=l
ный ряд не является абсолютно сходящимся и
не является сходящимся.
Перестановка членов сходящегося ряда.
/i=l
Ьп
Если ряд Vtf/j сходится абсолютно, то
/i=l
любой ряд У\Ьп , полученный из ряда
/i=l
Исследуем этот ряд на абсолютную
сходимость. Для выяснения сходимости ряда
V я(3/ - \)n/bn\ воспользуемся предельным
/i=l
/tQn перестановкой (изменением порядка
/i=l
суммирования) его членов, тоже абсолютно
сходится.
5 - 7706
130
Глава 3.1. ЧИСЛОВЫЕ РЯДЫ
Более того, он имеет ту же сумму, что и
мы всякого его остатка Rn = \\ (~ч ак
исходный ряд: ]£bn = ^ап . к=п+[
оценивается сверху числом апл.\ : |/?л| < д/1+1,
Имеет место теорема Римана: пусть дей-
пе
ствительный ряд 2^ап сходится условно. Пример 3.1.14. Исследуем на сходимость
„=1 знакочередующийся ряд
Тогда для любого действительного числа S ^ +[
можно надлежащей перестановкой членов V"H)
ряда > ап получить условно сходящийся
,/=1 Проверим сначала, сходится ли ряд абсолют-
но. Для этого составим ряд из модулей его
ряд > Ьп , сумма которого равна S . Теорема х^ 1 ^ -, „
*-* членов: > —рг. Этот ряд, как ряд Дирихле с
"={ ZiJ"
Римана верна и в том случае, когда S равно
-Их, или -оо . Можно так переставить члены параметром р = 1/2 < 1 , расходится. Итак,
условно сходящегося ряда, что последова- исходный ряд не является абсолютно сходя-
тельность частичных сумм полученного ряда щимся. Исследуем ряд на условную сходи-
будет иметь предел, равный +°о или -оо. «
Действительный ряд, у которого любые мость. Данный ряд имеет вид V (-\)п+{ап ,
два соседних члена имеют противоположные /7=1
знаки, называют знакочередующимся рядом. i г-
Знакочередующийся ряд можно представить в где ап = У^п » те- является знакочередую-
виде ]Г (-1)"+,я„, я„ > 0, л е N , или в виде ЩИМСЯ> пРичем последовательность {l/V^}~=|
п=1 монотонно стремится к нулю. Условия призна-
оо ка Лейбница выполнены. Таким образом, ис-
Y (-\)пап, ап > О, п е N . Оба ряда являют- следуемый ряд является условно сходящимся.
п=[ 3.1.8. Умножение рядов. Операция
умея сходящимися или расходящимися одновре- „ожения ряда на ряд. Рассмотрим два произ-
менно, поскольку первый ряд есть произведе- ^ ^
те второго на число -1. вольнш числовых ряда f a и fb Co.
Признак Лейбница. Пусть ряд *-f *-f
V/ i\w+l^ л ^л м тм ставим бесконечную таблицу (матрицу), эле-
> (-1) ani ап > О, пе N , удовлетворяет j7 J к у 3"
2Ldy ' ю " J K ментами которой являются всевозможные
произведения Qmbk членов этих рядов (рис.
условиям: 1) ах > а2 > ... >ап >ап+{...\ ^^
2) lim ап = О . Тогда этот знакочередующий-
"-*00 d\bi—+(1уЬ2 ai63—- аф4 ... ai6fc—...
ся ряд сходится. у у / у /
Если знакочередующийся ряд a2b{ a2b2 a263 а2ЬА ... a2bk
£(-l)"+4, а„ > О, Л€ N удовлетворяет «^ ^ а*Ь>у <*Ьу ^ ^ -
я=1 a4bi a4b2 a4bz a4b4 .. • а4Ьь
условиям признака Лейбница, то его сумма [ у S у у
S удовлетворяет неравенству 0 < S < щ . ... .. ...
Если знакочередующийся ряд ^ qJ^ qJ/ aJ)^ aJbf
V(-l)"+1fl„, ап>0, neN удовлетворяет
/7=1
условиям признака Лейбница, то модуль сум- Рис- 311
ОЦЕНКИ СУММ РЯДОВ
131
Элементы таблицы можно различными
способами занумеровать, представив таким
образом таблицу в виде некоторой
последовательности {^л}00.! • Например, нумерацию
можно начать с верхнего левого угла и далее
продолжить по диагоналям, как показано
стрелками на рис. З.1.1.:
v{ = a{b{, v2 = axb2, v3 = a2b{,v4 = a3b{,
v5 = a2^v6 = a\lh> v7 = аД' v% = fl2^3'
v9 =a3b2, v[0 =a4b{,...
Занумеровав элементы таблицы (см. рис.
3.1.1) каким-либо способом (не обязательно
продемонстрированным выше), получим
некоторую числовую последовательность
{г;,,}00,, любой член которой является
произведением некоторых членов ат и Ьк рядов
Теорема Коши. Если ряды ]>\ап и
/7=1
/,Ьп сходятся абсолютно и имеют суммы
/7=1
соответственно А и В , то любое
произведение этих рядов сходится абсолютно и имеет
сумму ЛВ .
Если ряды 2^ап и 5^ л не являются
/1=1 /7=1
абсолютно сходящимися, то сходимость и
сумма произведения этих рядов зависят от
способа нумерации членов атЬк ,
составляющих это произведение. На практике часто
используют правило умножения рядов,
которое заключается в том, что составляют ряд,
членами которого являются суммы элементов
таблицы на рис. 3.1.1, расположенных по ее
диагоналям:
/,а„ и у Ьп . В соответствии с этой после-
/i=l /i=l
довательностью {^/1}°°_, составим ряд V vn .
/i=l
Всякий числовой ряд 2и^п > полученный
/i=l
таким способом, называют произведением
рядов ]Гд„ и £*„.
/i=l /i=l
Сходимость произведения рядов.
Сходимость и сумма произведения рядов, вообще
говоря, зависят от последовательности
{t^}00,, т.е. от способа нумерации элементов
таблицы (см. рис. 3.1.1). Однако если какое-
оо оо
либо произведение рядов Уая и /гЬп
/i=l /i=l
является абсолютно сходящимся рядом и имеет
сумму S, то и любое другое произведение
оо оо
рядов V Д/7 и У\Ьп , использующее иную
/7=1 //=1
нумерацию слагаемых ambk , абсолютно
сходится и имеет ту же сумму S .
^сп=аЛ+(<а\Ь2+а2Ь0 +
/7=1
+(а{Ь3 + а2Ь2 + а{Ь3) +...
оо
Построенный таким образом ряд /tcn
/7=1
с общим членом сп - Q\bn + Oj^n-X + ••• + a,fy
оо оо
называют произведением рядов \ ап и Л, &„
/7=1 /7=1
в форме Коши.
Теорема Мертенса. Если из двух сходя-
оо оо
щихся рядов 2^ап и V^/7 хотя бы один
/7=1 /7=1
сходится абсолютно, то их произведение в
форме Коши сходится и имеет сумму, равную
произведению сумм этих рядов.
3.1.9. Оценю! сумм рядов. Часто, когда
вычислить точную сумму ряда не
представляется возможным, ограничиваются
приближенным значением этой суммы. Для
приближенного вычисления суммы S
произвольного ряда 2^^k с заДанн°й точностью 5 > О
к=\
находят его частичную сумму Sn с таким
номером п, для которого модуль суммы п-го
5*
132
Глава 3.1. ЧИСЛОВЫЕ РЯДЫ
остатка ряда не превышает заданной
точности:
где пе N таково, что \S- Sn\ = \Rn\ < 5 . Для
экономии вычислений номер п при этом
стараются выбрать минимально возможным.
Если знакочередующийся ряд
V(-l) я/7, ап >0 удовлетворяет условиям
признака Лейбница, то абсолютная
погрешность суммы ряда, вычисленной приближенно
с помощью некоторой /7-й частичной суммы
этого ряда, не превышает модуля первого
отброшенного члена ряда:
\S-Sn\ = \Rn\<an+v
Поэтому для обеспечения заданной
точности 5 оценки S ~ Sn достаточно найти
такой номер я, что я/|+1 < 5.
Пример 3.1.15. Докажем, что ряд
У,\ сходится, и вычислим
приближении +1
ное значение его суммы с точностью до 0,01.
Данный ряд сходится абсолютно,
поскольку сходится ряд Агл1 = 5-^ из
п=\ «=1 п + 1
модулей его членов. Это следует из
предельного признака сравнения, в котором в качестве
ряда сравнения нужно взять сходящийся ряд
Дирихле V 1/я3 .
/7=1
Вычислим теперь сумму исходного ряда
с заданной точностью. Для этого необходимо
найти такой наименьший номер пе N ,
при котором для исследуемого ряда
ЛД-1) /(я +1) будет выполняться нера-
//=1
венство
\S-Sn\<0,0\,
где
s = f>i)V(*3 + о, s„ = £н)7(*3+1) •
k=[ k=[
Поскольку исследуемый ряд является
знакочередующимся и удовлетворяет условиям
признака Лейбница, то
\S~Sn\-\Rn\<an+{
1
(п + \у + 1
Следовательно, достаточно найти
минимальное число пе N , для которого выполняется
неравенство
Ц < 0,01.
(л + I)3 + 1
Преобразуем это неравенство: (п +1) +
-hi > 100, п + \>Щ, п> 3/99-1 =3,62... .
В результате находим, что п = 4. Таким обра-
/1=1
л3 + 1
2 9 28 65
с точностью до 0,01.
Если сходящийся ряд не удовлетворяет
условиям признака Лейбница, то модуль
суммы Rn его я-го остатка, вообще говоря, уже
нельзя оценивать модулем первого
отброшенного члена. Для оценки \RA при этом
используют другие приемы. Например, если ряд
знакоположительный, то его остаток
оценивают сверху рядом, сумму которого можно
вычислить.
Пример 3.1.16. Оценим погрешность,
возникающую при замене суммы ряда
I—-
£>5нп1(2п + 1)
суммой его первых п членов. Вычислим
сумму ряда с точностью до 0,001.
Рассмотрим сумму Rn остатка с
номером п:
*«= I
1
1
4~,5**!(2* + 1) 5л+'(л + 1)!(2л + 3)
1 + 1-
2я + 3
( t^5K(n + 2)...(n + k + l)(2(n + k) + 3)j
Поскольку
2л+ 3
2{п + fc) + 3
<1,
1
1
(л + 2)(/! + 3)...(л + * + 1) (/1 + 2)*
, A:gN,
ПРИЗНАКИ СХОДИМОСТИ ДИРИХЛЕ И АБЕЛЯ
133
то имеем оценку
R„<
5"+1(" + 1)!(2л + 3) jS(5(/i + 2))*
1
1
5"+1(л + 1)!(2л + 3) i__J_
5л+ 10
1
5л+ 10
5"+[(п + \)\(2п + 3) 5/1 + 9
(см. пример 3.1.1, значение суммы
геометрического ряда при q = 1/(5я + 10)).
Используя полученную оценку,
определяем, сколько членов ряда необходимо
просуммировать, чтобы обеспечить заданную
точность:
/1 = 0, До<^у = ^~0,074(>0,001);
/1 = 1, Я <
1
1 25- 2-514 700
о о 1 20
л = 2, /с2 <
15 =-L«0,004(> 0,001);
12 125-3!- 7 19 9975
«0,0002 (< 0,001).
Следовательно, для достижения заданной
точности достаточно просуммировать три
члена ряда (я = 2), что дает
1—i
^5л/|!(2/1 + 1)
= 1 +
1
5-3 52-2!-5
-S2 =
•«1,070.
Признак Абеля — Дирихле. Пусть для ряда
оо
Yw^^ с действительными членами выпол-
k=l
няются условия:
1) последовательность {^}7 , является
невозрастающей, т.е. vk > vk+^,k e N ;
2) lim vk=0;
k—»«*>
3) последовательность {5^} частичных
©о
сулш /?ядя У^ик ограничена. Тогда ряд
оо
У ukvk сходится.
Признак Лейбница является следствием
признака Абеля — Дирихле. Действительно,
знакочередующийся ряд V (-1) vk , удовле-
k=l
творяющий условиям признака Лейбница (vk
монотонно стремится к нулю при к —> <*>),
удовлетворяет также и условиям признака
Абеля — Дирихле, если положить ик = (-1) .
Признак Абеля. Если ряд V" ик сходит-
к=\
ся, а действительная числовая
последовательность {^К_| монотонна и ограничена, то
3.1.10. Признаю! сходимости Дирихле
и Абеля. Преобразование Абеля. Пусть {м^УГ,
и {г^}. . ~ произвольные числовые
последовательности и Sk = Wj + Uj +... + ик,
к е N, Sq = 0 . Тогда для любых
натуральных р и q , таких, что q > р , имеем
q q-\
X UkVk = Y,Sk (Vk - Vk+i)-^qVq ~ Sp-iVp'
k=p k=p
ряд ^y\ukvk сходится.
k=i
Пример 3.1.17. Докажем, что если невоз-
растающая последовательность [аЛ
стремится к нулю, то ряд V ап sin n а сходится
«=1
при любом аеМ.
Если а = 2пт, т е Z , то sin 2ктп = 0
при всех п е N , и ряд сходится.
Пусть а Ф 2кт, т е Z . Докажем, что
последовательность {Sn} частичных сумм
оо
ряда У^ sin k а ограничена. Имеем
к=1
134
Глава 3.2. ФУНКЦИОНАЛЬНЫЕ РЯДЫ
. ОС с v1 • а • /
in — S„ = > sin — sin к а =
9 п w 9
S111
к=[
у1Гсо5(2^1)а-со5(2^1)а
йп 2 2
If а (2/1 + 1)а
= — cos—-- cos -—^
2^ 2 2
. (п + 1)а . па
= sin ——^— sin —.
2 2
Учитывая, что а Ф 2кт, me N, получаем
. (п + 1)ос . па
sin -——— sin —
2 2_
. а
sin —
2
S =
W*-
sin-
Таким образом, для любой невозрастающей
последовательности {я/7}, являющейся
бесконечно малой при п —> ©о } и любом аеМ
ряд У^ял sin «а удовлетворяет условиям
/?=1
признака Абеля — Дирихле и потому
сходится.
Иногда для исследования
знакопеременных рядов на сходимость применяют
признаки Абеля — Дирихле и Абеля не раздельно, а
в комбинации.
Пример 3.1.18. Исследуем на сходимость
ряд
/7=1
sin n a
~7Г
arctg n.
Из примера 3.1.17. следует, что ряд
sin n a
/i=l
Гп
сходится при любом осе
поскольку последовательность l/yfn не
возрастает и является бесконечно малой.
Возрастающая последовательность {arctg«}°°=.
стремится к я/2 при п —»сю . Следовательно, в
силу признака Абеля исследуемый ряд
сходится при любом а е R .
Глава 3.2
ФУНКЦИОНАЛЬНЫЕ РЯДЫ
3.2.1. Сходимость функциональных
последовательностей. Пусть U = {и(х)},
х е X — некоторое множество
действительных или комплексных функций и(х),
определенных на множестве А'сМ (А' с С).
Тогда последовательность элементов
множества U, т.е. всякое отображение множества
натуральных чисел N в множество if, при
котором каждому номеру п е N ставится в
соответствие некоторая функция un(x)eU ,
называют функциональной
последовательностью (или последовательностью функций) и
обозначают
Ы*)}Г=1' хеХ>
или и{(х), и2(х),...,ип(х),..., хе X.
Здесь будем использовать обозначение:
{#„(*)}, хе X . Множество X при этом
называют областью определения функциональной
последовательности {и,Дх)}, а функции
un(x)eU членами (элементами)
функциональной последовательности 1ип{х)\.
При фиксированном х0 е X всякой
функциональной последовательности {ил(х)},
хе X соответствует числовая
(действительная или комплексная) последовательность
{«w(x0)}, элементами которой являются
значения ип(х0) функций ип(х) в точке х0 .
Заданную на множестве Jfcl
[X с С) функциональную последовательность
{ип(х)} называют сходящейся в точке
Xq е X , если сходится числовая
последовательность |«л(х)}. В противном случае
функциональную последовательность {^(х)}
называют расходящейся в точке х0 .
Если последовательность {^(х)},
хе X сходится в каждой точке некоторого
СХОДИМОСТЬ ФУНКЦИОНАЛЬНЫХ РЯДОВ
135
множества Mel, то эту функциональную
последовательность называют сходящейся на
множестве М. Множество Xq с X всех
точек х е X , в которых последовательность
{«w(x)}, определенная на X, сходится,
называют областью сходимости функциональной
последовательности {ил(х)}.
Если функциональная
последовательность {w„(x)} сходится на множестве
М с X , то всякой точке х е М можно
поставить в соответствие предел числовой
последовательности значений функций ип(х)
в этой точке. Таким образом, на М
определена некоторая функция и(х) = lim и Ах),
которую называют предельной функцией
последовательности {#„(*)} на множестве М. В
этом случае говорят, что функциональная
последовательность {ип(х)\ является сходящейся
поточечно к функции и(х) на множестве М
или что имеет место поточечная сходимость
функциональной последовательности |«л(х)}
на множестве М к функции и(х), и при
этом используют следующие обозначения:
ип(х) -» и(х), х е М . Функциональная
последовательность {#„(*)} сходится поточечно
к функции и(х) на множестве М тогда и
только тогда, когда
Vxe MVe>037V(x,e)e N
Vai > N(x,e): \un(x) - u(x)\ < e.
Заметим, что номер W(x,e) зависит и
от элемента х е X , и от числа е > 0 .
Пример 3.2.1. Рассмотрим
последовательность функций ип(х) = хп, п е N ,
определенных на множестве X = К. Для всех
хе (-1,1] получаем
г / ч г п {О, хе (-1,1);
lim ип(х) = lim х =< v '
л->°о л->°о [1, X - 1,
а при х < -1 и х > 1 последовательность
\хп\ не имеет конечного предела. Таким
образом, областью сходимости
функциональной последовательности <хп\ является
множество Х0 = (-1,1], на котором эта
последовательность сходится поточечно к функции
и(х), равной нулю во всех точках хе (-1, 1)
и равной единице в точке х = 1.
3.2.2. Сходимость функциональных
радов. Пусть на множестве JcR (JifcC)
определена последовательность
действительных или комплексных функций {/„(*)} •
Выражение вида
X да=да+да+»•+да+•••> <з-2л)
в котором члены последовательности {/„(*)}
соединены знаками плюс, называют
функциональным рядом, определенным на множестве
X, а функции f{(x), /2(х),..., fn(x), ... -
членами этого функционального ряда.
Функциональный ряд (3.2.1) называют
сходящимся в точке Xq е X , если сходится
числовой ряд V/„(*()) из значений его чле-
л=1
нов в этой точке. В противном случае
функциональный ряд (3.2.1) называют расходящимся
в точке Xq е X .
Если функциональный ряд (4.2.1)
сходится в каждой точке некоторого множества
М с X , то говорят, что функциональный ряд
(3.2.1) является сходящимся (поточечно) на
множестве М или что имеет место
поточечная сходимость функционального ряда (3.2.1) на
множестве М. Множество Xq с: X всех
точек х из X , в которых ряд (3.2.1),
определенный на множестве X, сходится, называют
областью сходимости функционального ряда
(3.2.1).
п
Функцию Sn(x) = ^fk(x), хе X , на-
к=\
зывают я-й частичной суммой функционального
ряда *У\/п(х), хе X . Таким образом, каж-
л=1
дому функциональному ряду соответствует
функциональная последовательность {^(х)}
136
Глава 3.2. ФУНКЦИОНАЛЬНЫЕ РЯДЫ
его частичных сумм. Верно и обратное
утверждение: каждой функциональной
последовательности {$„(*)}, хе X можно поставить в
соответствие функциональный ряд /tf„(x),
п=[
х е X , последовательностью частичных
сумм которого является последовательность
{$„(*)} • Действительно, полагая /j(x) =
= s{(x) и fn(x) = sn(x)-sn_{(x), /1 = 2,3,...,
получаем Sn(x) = sn(x), пе N.
Указанное соответствие между
функциональными рядами и последовательностями
позволяет любое утверждение, справедливое
для функциональных последовательностей,
сформулировать в терминах теории
функциональных рядов, и наоборот.
Если функциональный ряд (3.2.1)
сходится на множестве X, т.е. существует
lim Sn(x) = S(x), x е X , то определенную
таким образом предельную функцию
называют суммой функционального ряда (3.2.1) на
множестве X и пишут /,fn(x) = S(x),
п=\
хе X .
Для всякого п е N функциональный
ряд \. fk(x)>xe % , называют /7-м остат-
к=п+\
ком функционального ряда V" fk (х), х е X .
к=\
оо
Функциональный ряд У^/^М сходится на
к=\
множестве X тогда и только тогда, когда в
каждой точке хе X сходится (к некоторому
числу Rn(x)) всякий /7-й остаток этого ряда.
При этом имеет место равенство
S(x) = Sn(x) + Rn(x), n e N, х е X,
где S(x) = \. fk (x) ~ сумма
функциональп
ного ряда; Sn(x) = V fk(x) - /7-я частичная
к=\
сумма этого ряда. Кроме того, если
функциональный ряд 2_. /fcM СХ°ДИТСЯ на множест-
к=\
ве X, то
lim Я (х) = 0, хе X.
Я-»оо
Критерий Коши сходимости функциональ-
оо
ного ряда. Функциональный ряд } fk (x)
к=\
сходится на множестве X тогда и только
тогда, когда для любых хе X и е > 0
найдется натуральное число N(x, e), зависящее от
х и е , такое, что для всех п > N(x,e) и
р е N выполняется неравенство
KPM-sn(xi
п+р
1
к=п+\
X /*(*)
< е.
Функциональный ряд £^fn(x) называют
п=\
абсолютно сходящимся на множестве X, если
на множестве X сходится функциональный
ряд V /^(х) из модулей его членов. Абсо-
п=\
лютно сходящийся на множестве
^функциональный ряд сходится на этом множестве.
Обратное утверждение, вообще говоря,
неверно. Функциональный ряд, сходящийся в
некоторой точке х е X , но не являющийся в
этой точке абсолютно сходящимся, называют
условно сходящимся в этой точке х е X .
Функциональный ряд обычно начинают
изучать с исследования его на сходимость,
которое сводится к определению области
сходимости этого ряда. При этом можно
использовать известные свойства числовых рядов и
признаки их сходимости. В результате такого
исследования, как правило, оказывается, что
в одних точках области сходимости
функциональный ряд сходится абсолютно, а в других —
условно. Поэтому для функциональных рядов
в области сходимости выделяют области
абсолютной и условной сходимости.
Пример 3.2.2. Исследуем на сходимость
функциональный ряд V (-\)п/пх , хеК.
/7=1
РАВНОМЕРНАЯ СХОДИМОСТЬ ФУНКЦИОНАЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ 137
Так как ряд Дирихле \* \/пх сходится при
/7=1
х > 1, то в этой области функциональный
©о
ряд V {-\)пIпх сходится абсолютно. В фик-
л=1
сированной точке хе (О, 1] числовой ряд
Л,("О"I" сходится условно по признаку
«=1
Лейбница.
Наконец, при х < О общий член
f„(x) = (-\)пп~х ряда не стремится к нулю
при п —> ©о (не выполнен необходимый
признак сходимости ряда), и, следовательно, ряд
расходится.
Использование признаков Даламбера и
Коши. При исследовании функциональных
рядов на сходимость наиболее часто
используют предельные признаки Даламбера и Коши
абсолютной сходимости числовых рядов.
Действительно, если для функционального ряда
(3.2.1) в его области определения
^существует один из пределов
lim
/!-»оо
/fl+lfr)
/„(*)
:<Р(Х)
или lim J\fn(x)\ = y(x),
то область абсолютной сходимости
функционального ряда (3.2.1) содержит точки,
удовлетворяющие соответственно неравенству
ф(х) < 1 или неравенству \|/(х) < 1. В тех
точках х е X, в которых выполняется
неравенство ф(х) > 1 или неравенство \|/(х) > 1,
функциональный ряд (3.2.1) расходится.
Чтобы установить сходимость или расходимость
функционального ряда в точках,
удовлетворяющих условию ф(х) = 1 или \|/(х) = 1,
необходимо провести дополнительное
исследование (в таких точках ряд может как
сходиться (абсолютно или условно), так и
расходиться).
Пример 3.2.3. Рассмотрим
функциональный ряд
Ш)"
хе R, х*-\.
Исследуем этот ряд на абсолютную
сходимость, используя предельный признак
Даламбера:
lim \Щ-
Ф(Х):
lim
/!->оо П + 1
х + 1
х-\
х + 1
Неравенство ф(х) > 1 справедливо при
х < О . Значит, исследуемый
функциональный ряд сходится абсолютно при х > О и
расходится при х < О . Если х = О , то полу-
©о
чаем знакочередующийся ряд V (-\)п/п , схо-
/i=l
дящийся условно в соответствии с признаком
Лейбница.
Пример 3.2.4. Исследуем на абсолютную
сходимость функциональный комплексный
ряд
/i=l
Z + n
Ъп
, zeC.
Используя предельный признак Коши,
получаем
lim Й
z + n
Ъп
■■- lim
3 Л-»оо
- + 1
-г1-
Следовательно, функциональный ряд
сходится абсолютно при всех z е С .
3.2.3. Равномерная сходимость
функциональных: последовательностей.
Функциональную последовательность {#„(*)} называют
равномерно сходящейся к функции и(х) на
множестве X, если для любого е > 0 найдется
такой номер А^(е) е N, что для всех
п > N(e) и х е X выполняется неравенство
L(x)- и(х)\ < е . В этом случае функцию
и(х) называют равномерным пределом
функциональной последовательности {«„(*)} на
множестве X, а также говорят, что сходимость
функциональной последовательности \ип(х)}
является равномерной на множестве X.
Равномерную на множестве X
сходимость последовательности {#„(*)} к функции
и(х) обозначают следующим образом:
138
Глава 3.2. ФУНКЦИОНАЛЬНЫЕ РЯДЫ
%(х) =$ "(*), п -> оо,
X
или ип(х) ^ и(х).
X
Запись ип(х) /$ и(х) означает, что
X
последовательность {^л(х)| не является
равномерно сходящейся на множестве X к
функции и(х).
Если функциональная
последовательность {#„(*)} сходится к функции и(х)
равномерно на множестве X, то эта
последовательность сходится к и(х) и поточечно на X.
Обратное утверждение, вообще говоря,
неверно: наличие поточечной сходимости
функциональной последовательности на множестве
X не гарантирует ее равномерную сходимость
на этом множестве. Если функциональная
последовательность {ww(x)j сходится к
функции и(х) поточечно на множестве X, но не
является равномерно сходящейся на этом
множестве, то говорят, что функциональная
последовательность \ип(х)\ сходится к и(х)
неравномерно на множестве X или что имеет
место неравномерная сходимость
функциональной последовательности {и„(х)} к функции
и(х) на множестве X.
Понятие равномерной сходимости
на множестве наглядно иллюстрируется
геометрически. Пусть хе X = [а,Ь] с R,
и (х) е R, n e N, и и (х) ^ и(х). По-
X
строим графики функций у = и(х) - е и
у = и{х) + е, где и(х) = lim и (х), х е X .
Тогда из равномерной на X = [а, Ь]
сходимости последовательности {#„(*)} к функции
и(х) следует, что для всякого достаточно
большого номера п и всех х е [а, Ь] будут
верны неравенства и(х) -е<ип(х)< и(х) + е.
Другими словами, это означает, что, начиная
с некоторого номера 7V(e), графики всех
функций ип(х), п> N(e), будут
расположены в «е -трубке», окружающей график
функции и(х) (рис. 3.2.1).
У* . , . -
01
ЩХ)+Е
У и(х)-е
а
ип(х) ё
- * * ^ГиЖ^
и(х)
—
Ъ х
Рис. 3.2.1
Для последовательности функций
|«л(х)} и функции и(х), определенных на
множестве X, справедливо следующее
утверждение:
ип(х) =$ и(х) <=> lim sup\un(x)-и(х)\ = 0.
X п-*~хеХ
Пример 3.2.5. Рассмотрим
функциональную последовательность \хп\, определенную
на X = [О, 1). Для любой точки хе X
имеем lim х" = 0 , т.е. данная последователь-
ность на множестве X = [О, 1) сходится
поточечно к нулевой функции. Эта сходимость
является равномерной на любом отрезке
[О, q], О < q < 1 , поскольку
sup \xn\ = qn, ne N,
хе[0,я]] '
lim sup \xn\ = lim qn = 0.
n->°°xe[Q,qy ' "~>~
Сходимость последовательности <хп> к
функции и(х) = 0 на всем множестве
^ = [0,1) не является равномерной,
поскольку
sup \х
xe[0,iy
1, пе
lim sup be" =1^0.
3.2.4. Равномерная сходимость
функциональных радов. Функциональный ряд
V fn(x) называют равномерно сходящимся на
п=\
РАВНОМЕРНАЯ СХОДИМОСТЬ ФУНКЦИОНАЛЬНЫХ РЯДОВ
139
множестве X, если функциональная
последовательность {^/7(-Х)} частичных сумм этого
ряда сходится равномерно на множестве X
Sn(x) jj S(x). В этом случае также гово-
X
рят, что имеет место равномерная сходимость
функционального ряда у fn (x) на множестве А".
Если функциональный ряд }\fn(x)
п=[
сходится на множестве X, но не является
равномерно сходящимся на этом множестве, то
говорят, что функциональный ряд /л/„(х)
п=[
сходится неравномерно на множестве X или
что имеет место неравномерная сходимость
функционального ряда на множестве X.
Если последовательность {^„(х)} час~
тичных сумм функционального ряда
2\ fn(x) сходится равномерно на множестве
//=1
X к некоторой функции S(x), то функция
S(x) является суммой этого функционального
ряда на множестве X.
Функциональный ряд У/„(х) сходит-
п=[
ся равномерно на множестве А" тогда и только
тогда, когда каждый его остаток сходится на X
и последовательность сумм этих остатков
|/?/;(х)} равномерно на множестве Хсходит-
sup|/?„(x)|<sup|/„+1(x)|:
xeR xeR
sup-
1
1
x1 + \n(n + 2) ln(/i + 2)
Поскольку lim l/lii (n + 2) = 0 , то
Л-»оо
lim sup /?;|(x) = 0. Это означает, что после-
"->~xeR
довательность сумм остатков
функционального ряда равномерно на X = R сходится к
тождественно равной нулю функции. Таким
образом, исходный функциональный ряд
сходится равномерно во всей области определения
X = R.
Необходимый признак равномерной
сходимости. Если ряд 2l,fn(x) сходится равно-
мерно на множестве X, то последовательность
его членов {/„(*)} равномерно сходится на
множестве Хк нулю: f„(x) jfr 0, п -> <*>.
X
Если для функционального ряда на
множестве X не выполнен необходимый
признак равномерной сходимости, то этот
функциональный ряд не является равномерно
сходящимся на X.
Пример 3.2.7. Рассмотрим функциональ-
ся к нулю Rn(x)
О
Пример 3.2.6. Рассмотрим
функциональный ряд
(-D
/;+1
JjTf х + 1п(я + 1)
В соответствии с признаком Лейбница
этот ряд сходится в каждой точке хе X = R .
Имеем следующую оценку суммы остатка
этого знакочередующегося ряда:
ный ряд 2LX"~ • ^тот геометрический ряд
при |х| < 1 сходится, но неравномерно. Для
общего члена fn(x) = xn~ этого ряда имеем
sup |/„(х)| = sup \хп = 1, п е N . Отсю-
хе(-1,1) *е(-1,1)' '
да следует, что lim sup |/w(x)| = 1*0 и,
"->~X€(-1,1)
значит, fn(x) —/-% 0. Необходимый при-
(-1,1)
знак равномерной сходимости
функционального ряда на X = (-1, 1) не выполняется,
следовательно, исходный ряд не является
равномерно сходящимся в интервале (-1, 1).
Достаточный признак равномерной
сходимости. Числовой ряд 2\ап с
неотрицательна
ными членами ап > 0, пе N, называют ма-
140
Глава 3.2. ФУНКЦИОНАЛЬНЫЕ РЯДЫ
жорирующим рядом или числовой мажорантой «>
на множестве X для функционального ряда нальный ряд V fn(x) также сходится на X
V//7(х), Х€ Jf, если для всех хе X спра- равномерно.
. , ^т 3.2.5. Свойства равномерно сходя-
ведливы неравенства |/„(х)| < я„, /i е N . ^^ радов Линейная комбинация равномер-
Имеет место следующий признак Вейер- но сходящихся рядов. Если оба функциональных
штрасса равномерной сходимости функцио- <*> оо
мольного ряда. Если функциональный ряд ряда V/w(*) и Уя„(х) сходятся равно-
оо П-\ /1=1
V fn{x) имеет на множестве А" сходящуюся мерно на множестве X, то всякая их линейная
и=1 °°
числовую мажоранту, то этот ряд сходится на
комбинация ]£ («/„(*) + pg„(x)), а, р е R
множестве X равномерно и абсолютно, при- "=1
оо (а,Ре С), также является равномерно схо-
чем ряд £|/„(х)| сходится на X также рав- дяЩИМСЯ на множестве X рядом. При этом
л-° для сумм рядов верно равенство
номерно.
Пример 3.2.8. Функциональный ряд у» /у / ч + о /х\\ =
Z°° cosaix „ я=1
2— сходится равномерно на всей чи-
п=1 п ~ ~
«та, =<0 /»(*) +Р> g„(x), хе X.
еловой прямой R. AuJny ' г^ьп^ />
_ _ _т /1=1 /1=1
Действительно, для всех хеК и я е N
■ , 7| , ? Предельный переход в рядах. Пусть
справедливо неравенство |cosaix/a2 | < 1//I . фунКции /„(*), /i € N , определены в интер-
~ 1 вале (д, £) и имеют в некоторой точке
Поскольку ряд Дирихле £ — сходится, то, ^е(а,Ь) конечные пределы Ит/,(*) = *„,
/1=1 П Х-М<)
согласно признаку Вейерштрасса, данный п е N. Тогда, если функциональный ряд
функциональный ряд сходится на всей число- ^
вой прямой равномерно и абсолютно. У/„(*) сходится равномерно в интервале
Имеет место критерий Коши равномерной ^
сходимости функционального ряда: функцио- (д> ^ ? то справедливы утверждения:
нальный ряд > /„(х) является равномерно ч Л v« ^
^ ^•'л4 ' *^ v а) числовой ряд Уап сходится,
/i=l -*-*
/i=l
сходящимся на множестве X тогда и только ^ ^
тогда, когда для любого числа е > 0 найдется б) lim \ f (x) = \ a
номер W(e) е N , зависящий только от е , х~*хо п=[ п=[
такой, что для любых п > N(e) , р е N и « ^,
или lim 2,//Д*) = 2, lim Мх)'
хе X выполняется неравенство /л+1(х)+ ... х~*хо~ ~*->*о
f , j Непрерывность суммы равномерно сходя-
••• + //i+p W| < e • щегося ряда. Если функциональный ряд
Если функциональный ряд £|/л(х)| £/#.(*) сходится равномерно в промежутке
/i=l "=1
сходится на X равномерно, то и функцио- X с R и все его члены fn(x) являются
КОМПЛЕКСНЫЕ СТЕПЕННЫЕ РЯДЫ
141
непрерывными на X функциями, то сумма
оо
S(x) функционального ряда ^//7(*) также
п=\
непрерывна на X.
Почленное интегрирование
функциональных рядов. Пусть ряд £,fn(x) 9
составление
ный из непрерывных на отрезке [а, Ь]
функций fn(x) , сходится равномерно на [а, Ь] и
имеет сумму S(x). Тогда функция S(x)
интегрируема на [а, Ь], и для произвольных
с, хе [а, Ь] верно равенство
X Х( оо Л оо X
JS№ = J £/„(/) \dt = J,jfn(t)dt,
w=i
(3.2.2)
причем последний ряд сходится равномерно
на [д, Ь]. В случае использования равенства
(3.2.2) говорят о почленном интегрировании
функционального ряда /,/„(*) •
/7=1
Почленное дифференцирование
функциональных рядов. Пусть fn{x), пе N, -
непрерывно дифференцируемые на отрезке [д, Ь]
функции; функциональный ряд /tf'n(x) ,
/7=1
составленный из производных этих функций,
сходится равномерно на [а, Ь\\
функциональный ряд ]?fn(x) сходится при некото-
/7=1
ром х0 е [а, Ь]. Тогда справедливы
следующие утверждения:
1) ряд У^/Я00 сходится равномерно
п=[
на [а, Ь];
2) сумма S(x) = 2\fn(x) этого ряда -
//=1
непрерывно дифференцируемая на [а, Ь]
функция;
3) верно равенство
S\x) =
/7=1 J /7=1
(3.2.3)
При использовании равенства (3.2.3)
говорят о почленном дифференцировании
функционального ряда /tf„(x).
/7=1
Глава 3.3
СТЕПЕННЫЕ РЯДЫ
3.3.1. Комплексные степенные ряды.
Комплексным степенным рядом (или рядом по
степеням Z - Zq) называют функциональный
ряд Т^^л(^~^о)Л> ZeC, членами которого
/7=0
являются комплексные многочлены fn(z) =
= cn(z- Zq)" от комплексного переменного
Z = х + iy е С . При этом комплексные числа
сп = ап + 7^л' п ~ 0> Ь 2,..., называют
коэффициентами этого степенного ряда, а точку
Zq = Xq + iyQ е С — центром степенного ряда.
Всякий степенной ряд определен на всей
комплексной плоскости С и сходится, по
крайней мере, в своем центре, т.е. в точке
^ = ^еС. Если в степенном ряде
2_,cn(z~ ^())Л с центром в точке Zq сделать
/7=0
замену переменного w = z - Zq , то получим
степенной ряд £^cnwn, we С, с центром в
/7=0
нуле. Поэтому в дальнейшем, не ограничивая
общности рассуждений, можно рассматривать
только ряды вида V cnzn, Z е С .
/7=0
Теорема Абеля. Пусть степенной ряд
*У\сп1п сходится в некоторой точке
/7=0
Z = Zq£ С, Zq *0 - Тогда он сходится абсо-
142
Глава 3.3. СТЕПЕННЫЕ РЯДЫ
лютно в каждой точке открытого круга
|z| < ко комплексной плоскости и сходится
равномерно в любом замкнутом круге Ы ^ г,
где г < \zq\. Если степенной ряд } cnzn
л=0
расходится в некоторой точке ^еС, то он
расходится во всех точках z е С , для которых
Для всякого степенного ряда ^ cnz"
п=0
существует действительное число R, 0 < R <
< -Н», такое, что справедливы следующие
утверждения:
1) при всех z е С , для которых \z\ < R ,
степенной ряд сходится, причем абсолютно;
2) в любом замкнутом круге \z\ < г, где
г < R , степенной ряд сходится абсолютно и
равномерно;
3) при всех z е С , для которых \z\ > R ,
ряд расходится.
Для каждого степенного ряда число R
определяется однозначно. Это число
называют радиусом сходимости степенного ряда
V cnzn , а открытый круг \z\ < R в ком-
п=0
плексной плоскости с центром в нуле и
радиусом R — кругом сходимости этого ряда.
Если радиус сходимости равен нулю
(R = 0) , то круг сходимости пуст (однако
область сходимости при этом не является
пустой — степенной ряд сходится в своем
центре £q = 0 ), а если R = -ь» t то кругом
сходимости является вся комплексная
плоскость С. Если же радиус сходимости
степенного ряда V cnzn является конечным
пололи
жительным числом (0 < R < -Н»), то этот ряд
сходится, причем абсолютно, в открытом
круге |z| < R и расходится при \z\ > R .
В точках границы круга сходимости, т.е.
при \z\ - R , ряд может как сходиться, так и
расходиться, поэтому необходимо
дополнительное исследование. Таким образом,
область сходимости любого степенного ряда
2_. cnZn c Центром в нуле представляет собой
л=0
объединение его круга сходимости (открытого
круга \z\ < R с центром в точке ^о = 0 и
радиусом R , равным радиусу сходимости
ряда) и некоторого множества (возможно,
пустого) точек комплексной плоскости,
принадлежащих границе круга сходимости
\z\ = R . Точками расходимости ряда \* cnz"
л=0
являются все остальные точки комплексной
плоскости С (рис. 3.3.1).
Если степенной ряд сходится абсолютно
в какой-либо точке Z\ , лежащей на границе
круга сходимости (ta = R), то ряд сходится
абсолютно на всей границе \z\ = R этого
круга.
Поскольку внутри своего круга
сходимости всякий степенной ряд V' cnzn сходится
л=0
абсолютно, то в этом круге ряд из модулей .
сходится, и к нему применимы
л=0
признаки сходимости знакоположительных
числовых рядов. Использование предельных
признаков Даламбера и Коши для рядов
2.\cnZ часто позволяет определить радиус
п=0
круга сходимости исходного степенного ряда.
Радиус сходимости степенного ряда
У с^л можно определить, используя фор-
л=0
мулы
R= lim
, R =
1
lim »\c
если пределы справа существуют.
Пример 3.3.1. Найдем область
сходимости степенного ряда ^5Л z" К ряду из
п=\
модулей этого ряда применим предельный
признак Коши:
lim
Л—>оо
/
5-V
= lim|5z|".
КОМПЛЕКСНЫЕ СТЕПЕННЫЕ РЯДЫ
143
Область
абсолютной
сходимости
Область
абсолютной
и равномерной
сходимости
Область
расходимости
Отдельные точки
сходимости на границе
круга сходимости
Рис. 3.3.1
При \z\< 1/5 последний предел равен
нулю (меньше единицы), и, значит, ряд
абсолютно сходится, а при \z\ > 1/5 предел равен
-и» (больше единицы), и, значит, ряд
расходится. Радиус сходимости R = 1/5 . На
границе круга сходимости ряд расходится, так как
при Ы = 1/5 все члены ряда по модулю
равны единице, и не выполняется необходимый
признак сходимости ряда.
Пример 3.3.2. Исследуем на сходимость
степенной ряд
/7=1
U-1+/T
п2п
с центром в точке Zq = 1 - ' • После замены
w = z-Zq=Z-\+i получаем ряд
\w"/(n2") с центром в нуле. Для него
/i=l
находим радиус сходимости
R= iim
//—»°о
'/7+1
->/7+1
= hm - = 2.
/7-4СО П2»
Отсюда получаем, что ряд } wn /(/12я)
/7=1
чит, ряд 2\(z-l +i)"/(n2") сходится абсо-
/7=1
лютно в круге \z - 1 + /| < 2 радиуса 2 с
центром в ^q = 1 - / (рис. 3.3.2). Выясним,
сходится ли ряд абсолютно на всей границе круга
сходимости, т.е. в точках, где \z - 1 + /| = 2.
Для всех таких точек ряд, составленный из
модулей членов исходного ряда, имеет вид
00 ^/7 °° 1
У—-Y--
Я «2" Й»
Полученный ряд является гармоническим и,
следовательно, расходится. Поэтому на
границе круга сходимости исследуемый
степенной ряд не является абсолютно сходящимся.
Однако среди точек этой границы могут быть
точки, где ряд расходится, и точки, где ряд
сходится условно. Выясним, сходится ли ряд в
конкретных точках Z\ = 3 - /', Z2 = -1 _ ' и
£j = 1 + /, лежащих на границе круга
сходимости.
При Z = Z\ = 3 - / имеем гармонический
ряд V —. Следовательно, в точке Z\ исход-
/7=1
ный ряд расходится.
Точка
условной
3^"^ сходимости
Точка
условной
сходимости
расходимости
Круг
абсолютной
сходимости
Рис. 3.3.2
сходится абсолютно в круге |н>| < 2 , и, зна-
144
Глава 3.3. СТЕПЕННЫЕ РЯДЫ
Пусть z = Zi = -1 - /. Тогда имеем ряд
v (-О"
> , который сходится условно в соот-
I п
ветствии с признаком Лейбница. Точка Zj ~~
точка условной сходимости исходного ряда.
Пусть теперь z = Z$ = 1 + /'. Тогда ряд
принимает вид
у (1 + / - 1 + /)" у /" =
k=\ ZK k=\ LK l
Действительная и мнимая части этого
ряда являются условно сходящимися
вследствие признака Лейбница. Следовательно, точка
Z3 — точка условной сходимости исходного
ряда.
3.3.2. Действительные степенные
ряды. Ряд Тейлора. Действительным
степенным рядом называют ряд вида У ап(х - х0)п ,
л=0
где хе!,а центр ряда Xq и коэффициенты
ряда ап - заданные действительные числа.
Для всякого действительного степенного ряда
yfln(x-x0)fl существует единственное
/7=0
число R, О < R < -и» , такое, что этот ряд
сходится, причем абсолютно, на интервале
(х0 - R, х0 + R) с R и расходится вне
отрезка [Xq - R, Xq + R]. При этом, если
R = 0 , то ряд 2\ ап(х ~ хо)Л сходится в
/7=0
единственной точке х0 = 0 , а при R = -н»
областью сходимости ряда является вся
числовая прямая R. Число R называют
радиусом сходимости действительного степенного
ряда V ап(х - Xq)" , а интервал (xQ - R,
/»=0
х0 + R) a R — интервалом сходимости этого
ряда.
Пусть R - радиус сходимости
действительного степенного ряда V" апхп .
л=0
Тогда этот ряд сходится равномерно и
абсолютно на любом отрезке [-г, г], целиком
лежащем в интервале сходимости:
[-г, г]с(-Л, R).
Сумма всякого действительного
степенного ряда 2^апхП является непрерывной
л=0
функцией в интервале сходимости.
Для всякого действительного степенного
ряда V апх" с суммой S(x) и радиусом
/7=0
сходимости R справедливо равенство
X Х( со \
W =
о о V л=о
js(t)dt = j £v"
0 0 \п=0
п « + 1
/1=0
причем радиус сходимости ряда справа также
равен /? .
Функцию f(x) , определенную в
некоторой окрестности точки Xq , называют
бесконечно дифференцируемой в этой точке, если в
ней она имеет производные любого порядка.
Функция f(x) бесконечно дифференцируема
в интервале, если она бесконечно
дифференцируема в каждой точке этого интервала.
Сумма S(x) действительного
степенного ряда У\ апх" с радиусом сходимости
/7=0
R является бесконечно дифференцируемой в
интервале (-R, R) функцией, причем имеет
место равенство
S\x) =
IV"
/1=0
= 2>V"~1' xe(-R, Л),
n=0
где радиус сходимости ряда справа также
равен R .
ДЕЙСТВИТЕЛЬНЫЕ СТЕПЕННЫЕ РЯДЫ. РЯД ТЕЙЛОРА
145
Ряд Тейлора. Пусть действительная
функция /(х) задана в некоторой
окрестности точки xQ и имеет в этой точке
производные любого порядка. Степенной ряд
~ f(")(x )
2^ -^- (х - х0)", хеШ, называют
/7=0 П '
рядом Тейлора функции /(х) в точке xQ.
При х0 = 0 ряд Тейлора называют рядом
Маклорепа.
Действительную функцию f(x)
действительного переменного называют
аналитической в точке х0 , если она определена в
некоторой окрестности точки х0 и ее можно
представить в этой окрестности некоторым
сходящимся степенным рядом: f(x) =
= X а"(<х " *о)" » хе(х0-е, х0+е),е>0.
Такое представление аналитической функции
называют ее разложением в степенной ряд в
окрестности точки х0 . При этом функция
f{x) бесконечно дифференцируема в этой
окрестности и ап = :
/("W
Я!
, я = 0, 1, 2,...
Таким образом, аналитическую в точке х0
функцию можно определить как функцию,
которая в некоторой окрестности точки xQ
является суммой своего ряда Тейлора.
Не всякая бесконечно
дифференцируемая в окрестности точки функция является
аналитической в этой точке, т.е. сумма ряда
Тейлора бесконечно дифференцируемой в
окрестности точки х0 функции может не
совпадать с ней ни в какой окрестности точки
х0 . Это иллюстрирует пример Коши. Функция
К(х) = \е~1/х2> х*°>
0, х = 0
бесконечно дифференцируема в любой точке
х е R , причем АТ(/7)(0) = 0 для всех п = 0,1,
2,... . Следовательно, сумма ряда Тейлора в
любой окрестности точки х0 = 0 равна нулю
и, значит, не совпадает с функцией К(х).
Таким образом, функция К(х) не является
аналитической в точке х0 = 0 .
Пусть функция /(х) бесконечно
дифференцируема в интервале (xQ -r, х0 + г).
Ее ряд Тейлора V
/(п)(*о)
(Х - XQ)" СХО-
л=0
дится в интервале (х0 - г, х0 + г) к функции
f(x) тогда и только тогда, когда остаточный
член Rn(x) формулы Тейлора
fM = ^^^(x-x0)k+Rn(x),
/1 = 0, 1, 2,...,
для любого х (= (х0 -г, х0 + г) стремится к
нулю при п —» оо .
Пусть функция /(х) бесконечно
дифференцируема в интервале (х0 - г, х0 + г) и
ее производные в этом интервале ограничены
в совокупности, т.е. существует такое М > 0 ,
что
хе (х0-г, х0+г), л = 0, 1, 2,...
Тогда /(*) = 2;2_^(X-V",
л=0
хе (х0 -г, х0+г).
Разложение основных элементарных
функций в ряд Маклорена.
//=0
п\
si
2!
2^— = 1+Х + — + ... + Г- + ..., хе (-оо, +оо);
п\
^ (-ly-'jc2"-' х3 х5
2. smx= > ^—± —— = х--^Т+-ГТ-... +
//=]
(2/1-1)!
3! 5!
(-!)"-'х2/;-1
(2/1-1)!
+ ..., Хе(-оо, +оо);
146
Глава 3.3. СТЕПЕННЫЕ РЯДЫ
3. cosx = y^-^x2n =[- — +—-... + ^^х2п+..., хе(-оо, +оо);
£<0(2п)\ 2! 4! (2/1)!
,. /1 \сс 1 v* а(а - 1)...(а - л + 1) Л , а(а-1) 2
/7=1
Я!
2!
+ а(а-1)...(а-^1)/+ >JC£(41);
5. —!— = У (-\)"хп = 1 - х + х2 - х3 +... + (-1)"*" +..., хе (-1, 1);
1 + х *-*
п=0
6. 1п(1 + х) = £
/1=1
(-1)Л+1ХП X2 X3 (-1)"+1X" . , ,.
-— = х + ... + -— + ..., хе(-\, 11.
я 2 3 л • V > J
е**-» = e'l
Способы разложения элементарных функ
ций в степенные ряды. Для разложения эле
ментарной функции в ряд Тейлора применяют у
два метода. Первый основан на
непосредственном разложении функции в ряд Тейлора.
Вычисляя производные всех порядков
функции f(x) в точке Xq , формально составляют
ряд Тейлора, затем находят его область
сходимости и выясняют, в каких точках из области
сходимости ряд сходится к данной функции.
Второй метод базируется на использовании
стандартных разложений. Рассмотрим
некоторые варианты этого метода.
/ = -(х - 1) . Тогда, для всех х е (-«>, + °°)
\t=-(x-[)
00 +п
£ои!
'=-(*-! Г
= 1
/1=0
(-!)"(*-1)
2/?
Арифметрические операции над рядами.
Замена переменного. Если f(x) = Если ряд ^ апхп - ряд Маклорена функ-
= g(ax^), ae R, ре N, a g(u) - функция с
известным разложением g(u) = \. Sku >
U€(/cR,TO
f(x) = g{axV) = g(u)\tt=axv =
п=0
= 5><А
*=0
г3 к=0
лх$к
ции /j(x) в интервале (-^,/^) и ^Д*л _
л=0
ряд Маклорена функции /2(х) в интервале
(-А*2, л*2) ' то при всех а' Ре ^ Ряд
V (аял + $Ьп) х'7 - это ряд Маклорена
/7=0
функции а/,(х) + р/2(л") в интервале
Полученное разложение функции f(x) ' а, л), л-тт|Л|, л2|.
справедливо для всех хе
ах$ е U .
таких, что Пример 3.3.4. Найдем разложение в
ряд Маклорена функции sin(x + 2). Для
Пример 3.3.3. Для нахождения разложе- этого представим* ее в виде sin(x + 2) =
ния в ряд Тейлора в окрестности точки х = 1 = sin х cos 2 + Cos x sin 2 . Зная разложения
функции е~(х~ ' воспользуемся известным функций sin x и cos л: в ряд Маклорена на
разложением в ряд Маклорена функции е* всей прямой R , получаем искомое разложе-
сделав в нем замену переменного ние функции sin(x + 2):
ДЕЙСТВИТЕЛЬНЫЕ СТЕПЕННЫЕ РЯДЫ. РЯД ТЕЙЛОРА
147
00 ( \\nJln+\
{-\fxz
i <
00 ( 1\Л-к-2л °°
sin(x + 2) = cos 2 Y v l) x
{-\)nxl
л=о
где
я„ =
(-D"/2
(_l)(«-D/2
-sin 2, n-2k\
« = 0,1,2,...
Я!
cos 2, n = 2k + \,
Интегрирование и дифференцирование
рядов. Эти способы основаны на свойствах
операций интегрирования и диффернцирования
степенных рядов.
Пример 3.3.5. Разложим в ряд Маклоре-
на функцию arcctg x. Для этого сначала
разложим в ряд Маклорена производную этой
функции:
(arcctg х)' = -=Ц- = - JT (-1)"х2" =
1 + х
/1=0
= ^(-1У'+,Х2»,ХЕ(-1,1).
Здесь использовано стандартное
разложение в ряд Маклорена степенной функции
(1 + у) , в котором сделана замена пере-
менного у = х . Проинтегрировав теперь
почленно полученный степенной ряд
^(-\)п+[х2п на отрезке [0, х],
л=0
хе (-1, 1), получим
arcctg х -1 = /-^ А = X (-D"+1 J'2" * =
Применение степенных рядов в
приближенных вычислениях. Если функция f(x)
является аналитической в точке Xq , т.е. в
некоторой окрестности точки х0 представима
оо
степенным рядом f(x) = 2_, ап(х ~ хо)" > то в
л=0
качестве приближенного значения функции
f(x) в точке х из окрестности точки Xq
можно взять частичную сумму этого ряда:
f(x)~Sn(x) = y£ak(x-x0)k .
*=о
Естественно, что при этом чем меньше
п , тем проще аппроксимирующая функция
Sn(x), но больше, вообще говоря,
погрешность такого приближения. Поскольку
f(x) = Sn(x) + Rn(x) , при каждом
фиксированном п точность приближения
f(x) ~ Sn(x) оценивается суммой остатка
ряда
|я*)-ад| = |ад| =
X ак(х-хоУ
к=п+1
л=0
(-1)л+1Х2л+|
л=0
Отметим, что на концах интервала
сходимости, т.е. в точках х = ±1, ряд сходится к
значениям функции arcctg л: в этих точках,
следовательно, областью сходимости
полученного ряда является отрезок [-1, 1].
Поэтому при заданной погрешности
5 > 0 число слагаемых в частичной сумме
SfJ(x) необходимо выбирать так, чтобы оно
было наименьшим среди таких я, для которых
выполняется оценка 1Кл(л:) < 5 .
Оценивать сумму остатка ряда можно
различными способами. Можно использовать
представления остаточного члена формулы
Тейлора в форме Лагранжа или Коши. Можно,
кроме того, строить для ряда числовую
мажоранту, сумму которой несложно вычислить. В
отдельных случаях можно применять признак
Лейбница, если ряд в интересующих нас
точках является знакочередующимся. Если
степенной ряд в некоторой точке х
удовлетворяет признаку Лейбница, то справедлива оценка
Пример 3.3.6. Вычислим с точностью до
10 определенный интеграл \е~х dx. Пер-
148
Глава 3.3. СТЕПЕННЫЕ РЯДЫ
вообразная подынтегральной функции е~х
не выражается явно через элементарные
функции, поэтому для оценки этого
интеграла поступим следующим образом. Разложим
Пусть Sn и Rn - соответственно п-я
частичная сумма и сумма п-го остатка этого
ряда. Тогда погрешность приближения
[ е~х dx = Sn будет 5 = \RfJ\. Полученный
О
для интеграла ряд является знакочередующимся
и удовлетворяет признаку Лейбница.
Следовательно, для суммы Rn остатка этого
ряда справедливо соотношение 8 = /? J <
< ((2я + 3)(я + 1)!) . Проведя вычисления,
получаем
WW10"4
Таким образом, заданная точность оцен-
1 2
ки е~х dx ~ Sn будет обеспечена, если вы-
0
числить сумму первых семи членов
полученного ряда (п = 6) :
Jo 6 Й (2- + DII!
-0,7468, 8<10"4.
3.3.3. Интегрирование обыкновенных
дифференциальных уравнений с помощью
радов. В том случае если обыкновенное
дифференциальное уравнение проинтегрировать в
квадратурах (т.е. выразить решение уравнения
через элементарные функции или интегралы
подынтегральную функцию в ряд Маклорена
в интервале (-«>, + ©о) и почленно
проинтегрируем этот степенной ряд:
от них) не удается или принципиально
невозможно, можно представить решение этого
уравнения в виде степенного ряда. Разберем
основные приемы представления решения с
помощью степенного ряда на примере
обыкновенных дифференциальных уравнений
второго порядка.
Рассмотрим обыкновенное
дифференциальное уравнение второго порядка,
разрешенное относительно старшей производной
/ = Г{х,у,У), (3.3.1)
а также уравнение более общего вида
p(x)/ = F[(x, у, yf). (3.3.2)
Уравнение (3.3.2) принципиально
отличается от (3.3.1) тем, что оно может иметь
особые точки, абсцисса Xq которых
удовлетворяет уравнению p(xQ) = 0 .
В окрестности таких точек уравнение
(3.3.2) нельзя разрешить относительно
старшей производной у" и свести к виду (3.3.1).
В окрестности остальных (неособых) точек
уравнение (3.3.2) можно привести к виду
(3.3.1).
Если функция F(x,y, у') из правой
части (3.3.1) в некоторой окрестности точки
P{xQ, у0,у^)е R удовлетворяет
определенным условиям гладкости по совокупности
независимых переменных х, у и у'
(например, является аналитической в
окрестности точки Р), то существует решение
(общее или частное) уравнения (3.3.1), и это
решение является действительной
аналитической функцией в некоторой окрестности точки
х0 , т.е. его можно представить в этой
окрестности в виде степенного ряда
/л./
,2^*:
Лп
1-,'+_-... + (-1Г — + ...
dx =
= х\
1 3
5-2!
-...+
(-\)пх
п „2//+1
(2л + 1)л!
1 1 1 (-0я
3 5-2!
(2/i + 1)/i!
ИНТЕГРИРОВАНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 149
у(х) = ^ап(х-х0)п . Для этого
необходимо
мо, по крайней мере, существование в
некоторой окрестности точки P(xQ, yQ, у^) всех
частных производных функции F(x, y9 у')
любого порядка по всем переменным.
Если точка P(xQ, yQ, у^) является
неособой для уравнения (3.3.2), т.е. p(xQ) * О ,
то при тех же ограничениях на функцию
I\(xi У* У) и ПРИ условии аналитичности
функции р(х) в некоторой окрестности
точки х0 существует решение у = у(х) (общее
или частное) уравнения (3.3.2), и это решение
является в этой окрестности действительной
аналитической функцией, т.е. его можно
представить степенным рядом У]ял(* - хо)"-
л=0
Если же р(х0) = О, то в указанных
условиях в окрестности точки Р(х0, у0, у^)
может существовать решение в виде
обобщенного степенного ряда
У(х) = ^ап(х-х0Г" =
п=0 то (3.3.3)
= (*-^)тЁвя(*-*оЛ
«=0
где у — некоторое (не обязательно целое и
положительное) действительное число.
Метод последовательных
дифференцирований. Этот метод проиллюстрируем на задаче
Кош и
l/ = F(x,y,y),
\Хх0) = Уо, (3.3.4)
[У(хо) = У{,
где функция F(x, у, у') такова, что решение
у = у(х) этой задачи в некоторой
окрестности точки х0 существует, единственно и
является аналитической функцией (в частности,
функция F(x, у, У) в некоторой области
D с R , содержащей точку Р(х0, у0, у{) ,
имеет все частные производные любого
порядка по всем переменным х, у и У).
Тогда решение у = у(х) можно
представить в этой окрестности своим рядом
Тейлора
у = ^У^31{х_Хо)П (33.5)
л=0 Пя
Чтобы явно найти это решение, достаточно
вычислить значения всех производных
У^"\хо) функции у(х) в точке xQ . В
соответствии с начальными условиями имеем
У(хо) = Уо> У(хо) = У[>
а используя дифференциальное уравнение
у' = F(x, у, У), находим
y"(x0) = F(x0, у(хц), У(х0)) = Р(х0,у0,у1).
Далее, продифференцировав уравнение
у" = F(x, у, у') по переменному х,
получим
y"(xQ) = Fx(x, у, у) +
+F'y(x, у, у)у + /у (х, у, у)У,
откуда при х = Xq
+^у(х0,у09у{)У(х0) + Fy,(x0,y0,y{)y"(x0),
где у\х0) = у^, а у"(Хц) — вычисленное
выше значение. Продолжая процесс
дифференцирования уравнения у" = F(x, у, у),
последовательно находим все производные
функции у(х), выраженные через частные
производные функции F(x, у, у') и
производные функции у(х) меньших порядков.
Подставляя в ряд Тейлора (3.3.5) значения
полученных производных в точке xQ ,
получаем полностью определенный степенной ряд
Тейлора функции у = у(х).
Наконец, остается найти интервал
(х0 - R, Xq + R) сходимости полученного
ряда и выяснить, при каких значениях х из
этого интервала сумма полученного ряда
(3.3.5) является решением задачи (3.3.4).
Полученное решение задачи Коши,
разумеется, существенно зависит от начальных
условий, т.е. у(х) = у(х, у0, ух). Если числа
150
Глава 3.3. СТЕПЕННЫЕ РЯДЫ
j>q и у^ в задаче Коши (3.3.4) рассматривать
как произвольные постоянные Cj и С2, то
полученная описанным выше способом
функция У = у(х,у0,у1) = у(х,С{,С2) будет
общим решением дифференциального
уравнения (3.3.1).
Этот способ можно применять и для
решения дифференциального уравнения
любого порядка, разрешенного относительно
старшей производной: у^п' = F(x,y,y\...
...у("-{)).
Пример 3.3.7. Найдем пять членов
разложения в ряд Маклорена решения задачи
Коши
[/ = ху/,
Ь(0) = 1,
[У(0) = 1.
Решение у(х) данной задачи имеет
разложение
у(х) = у(0) + у'(0)х +
/(0) 2 У{"\0) п
2! п\
Вычислим значения производных у (0),
п = 0,1,2,... Подставляя х = 0 , >>(0) = 1,
у'(0) = 1 в уравнение у" = хуу', находим
У(0) = 0 . Дифференцируя уравнение у" =
= хуу по х и учитывая при этом, что у и
у' являются функциями от х находим
у~ = уу+х{у)2+хуу\
и, следовательно, /"(0) = 1 .
Далее находим
/» = 2(/)2 + 2у/ + Ъху'у + хуу".
Подставляя сюда х = 0 и известные зна-
чения уф) = 1, /(0) = 1, /(0) = 0, Л0) = 1 ,
получаем у^ \0) = 2 . Затем находим
у& = 9уУ + Ъуут + 3jc(/)2 +
+Ъху'ут + ху'ут + хуу^\
откуда у^5\0) = 3 .
Таким образом, искомое разложение
решения задачи Коши имеет вид
, ч . х3 2х4 Зх5
у(х) = 1 + х + — + + +...
3! 4! 5!
Метод неопределенных коэффициентов.
Этот метод проиллюстрируем на примере
решения следующей задачи Коши:
\p(x)f = Fl(x, у, /),
\у(х0) = У0, (3.3.6)
[/(*b) = JV
Метод заключается в том, что решение
задачи ищут в виде обычного степенного ряда
(или обобщенного степенного ряда, если xQ
является нулем функции р(х)) с
неопределенными коэффициентами. Чтобы найти
неопределенные коэффициенты, нужно:
1) дважды продифференцировав ряд с
неопределенными коэффициентами, найти
разложения в степенной (или обобщенный
степенной) ряд для производных у\х) и
у"(х), а также найти разложение в степенной
ряд аналитической функции р(х);
2) подставить полученные для у(х),
у'(х), у'(х) разложения с неопределенными
коэффициентами и разложение р(х) в
уравнение p(x)f= F{(x, у, у);
3) представить получившееся при этом
выражение /*j(x, у, у) в виде степенного
ряда (это возможно, если функция
F\(x, у, у) как функция от трех
независимых переменных х, у и у' является
аналитической);
4) из полученного равенства степенных
рядов, приравнивая коэффициенты при
равных степенях х - xQ , получить рекуррентные
уравнения; из этих уравнений найти
коэффициенты ап;
5) если решение ищется в виде
обобщенного степенного ряда (3.3.3) то сначапа,
приравнивая коэффициенты при наименьшей
степени х - xQ , найти значение (или
несколько значений) неизвестного параметра у ;
после этого для каждого найденного значения
у определить неизвестные коэффициенты
ап , как описано выше;
6) полученные ряды необходимо
исследовать на сходимость; в области своей
сходимости ряды являются решениями задачи
Коши (3.3.6).
ИНТЕГРИРОВАНИЕ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 151
Как правило, этот метод применяют при
решении линейных дифференциальных
уравнений
Р0МУ + Р{(х)У + р2(х)у = f{x) (3.3.7)
с аналитическими коэффициентами Pq(x),
Pl(x), р2(х) и аналитической же правой
частью f(x) .
Пусть в уравнении (3.3.7)
коэффициенты Pq(x), Pi(x), р2(х) и правая часть f(x)
являются действительными аналитическими
функциями в окрестности точки xQ , причем
Pq (Xq ) *■ 0 . Тогда в некоторой окрестности
точки х0 решение задачи Коши
[/><)(*)/ + Р\(Х)У + Р2(*)У = /М>
Ыхо) = Уо>
[У(х0) = у1
существует, единственно и его можно
представить в виде действительного степенного
ряда >>(x) = ]£fl„(x-x0)".
/7=0
Точка Xq является нулем кратности
S € N аналитической в окрестности точки
Xq функции р(х), если в этой окрестности
функцию р(х) можно представить в виде
р(х) = (х - x0)sq(x), где д(х) - также
аналитическая функция в окрестности точки xQ
и q(x0)±0.
Пусть функции р0(х), рх{х) и р2(х)
являются действительными аналитическими
функциями в окрестности точки х0, и точка
х0 является нулем кратности s функции
р0(х). Пусть, кроме того, точка xQ является
нулем кратности не менее 5-1 функции
Ру(х) (при s > 1 ) и нулем кратности не
менее 5-2 функции р2(х) (при s > 2). Тогда
существует, по крайней мере, одно
нетривиальное решение уравнения
Р0МУ + рх(х)У + р2(х)у = 0,
которое можно представить в виде
обобщенного степенного ряда
УМ = ^ап(х-х0Гп =
/7=0
=(*-vY5X (х-*о)"'
/7=0
где <7q *■ 0, а у — некоторое действительное
число, не обязательно целое или
положительное.
Пример 3.3.8. Найдем решение задачи
Коши
Г/ + ху = 0,
Ы0) = 0,
[/(0) = 1
в виде суммы ряда и определим область
сходимости полученного решения.
Поскольку коэффициенты Pq(x) = 1,
/?j(x) = 0 и р2(х) = х уравнения у" + ху =
- 0 являются аналитическими функциями и
значение функции Pq(x) в точке xQ - 0
отлично от нуля, то решение этой задачи
можно представить в виде обычного
степенного ряда с центром в нуле:
У(х) = ^апх"' (318)
/7=0
Из начальных условий следует, что <?0 =
= у(0), ах = /(0) = 1 . Учитывая (3.3.8),
представляем функции ху(х) и у"(х) в виде
степенных рядов:
ху(х) = хУ£апх" = У£ак_1хк,
/7=0 k=\
оо
У(х) = ^п(п-\)апх"-2 =
/7=2
= 2а2+^(к + 2)(к + 1)ак+2хк.
к=\
Подставляя эти разложения в уравнение
у" + ху = 0 , получаем равенство
оо
2а2 + £ ((* + 2)(* + \)аш + ак_{) хк = 0,
152
Глава 3.4. РЯДЫ ФУРЬЕ
выполняющееся в некоторой окрестности
точки Xq = 0 . Это равенство верно только в
случае, когда а2 и все коэффициенты при
k
членах х равны нулю:
а2 = 0; (к + 2)(к + \)ак+2 + ак_{ = 0, к е N .
Осуществляя замену п = к - 1, а также
учитывая полученные ранее значения для aQ
и tfj , получаем систему
\aQ = 0, ах = 1, а2 = 0,
ап+3 = ~
(п + 3)(/i + 2)
,/i = 0, 1,...
Отсюда следует, что <73я = 0, Я3/1+2 = ^»
п = 0, 1, 2,... Методом математической
индукции можно доказать, что для любого
натурального п верна формула
(-о"
"Зл+1
(3-4)(6-7)...(Зя(Зя + 1))
Итак, решением задачи Коши является
(в области своей сходимости) ряд
у(х) ^х + ^
(-\)"x3n+l
п=\
3-4-6-7...3/i(3/i + 1)
Найдем область сходимости полученного
ряда, пользуясь предельным признаком Долам-
бера. Для всех хе R
lim
3(/7+1)+Г
гЗ(п+\)+\
„Зп+\
= lim
(3/i + 4)(3л + 3)
= 0<1.
Таким образом, ряд сходится (и является
решением задачи Коши) на всей числовой
прямой.
Глава 3.4
РЯДЫ ФУРЬЕ
Примерно с середины XVIII в. Д. Бер-
нулли, Ж. Даламбер, Ж. Лагранж и Л. Эйлер,
изучавшие некоторые проблемы
математической физики, оказались вовлеченными в
дискуссию по поводу возможности представления
«произвольной» 2я -периодической функции
в виде суммы тригонометрического ряда
оо
<70/2 + V (ak cos kx + bk sin кх). В начале
к=\
XIX в. работы французского математика
Ж.Б. Фурье открыли новую эпоху в развитии
теории тригонометрических рядов. Фурье мог
представить в виде суммы
тригонометрического ряда (в настоящее время называемого
рядом Фурье) любую функцию, которую ему в
то время могли предложить. В его книге
«Аналитическая теория тепла», вышедшей в
1822 г., содержится много частных примеров
таких представлений и их применения.
Попытки Фурье доказать, что любую функцию
можно разложить в тригонометрический ряд,
привели к углубленному исследованию
понятия функции и проблемы представимости
функций тригонометрическими рядами
такими учеными, как Дирихле, Лобачевский, Ри-
ман и др. Дальнейшее изучение рядов Фурье
способствовало развитию теории
интегрирования, послужило одной из предпосылок для
создания ряда современных математических
дисциплин, таких, как дифференциальные
уравнения с частными производными, теория
функций действительного переменного,
функциональный анализ.
3.4.1. Ортонормированные системы и
ряды Фурье. Пусть Е — бесконечномерное
евклидово пространство со скалярным
умножением (*, *). Евклидова норма в Е определена
формулой |/| = 7(/, /), feE.
Два элемента f и g евклидова
пространства называют ортогональными, если
(/,*) = о.
Пусть в евклидовом пространстве Е
задана некоторая бесконечная
последовательность элементов vj/|, vj/2, ..., *j///5... Эту
последовательность называют ортонормирован-
ной системой, если для любых натуральных
/ и у *
(V/. Уу) =
0, / * у;
1, / = У,
т.е. элементы этой последовательности
попарно ортогональны и все имеют единичную
норму.
Евклидово бесконечномерное
пространство EQ[a, b] образует множество всех
кусочно непрерывных на отрезке [а, Ь] функций, т.е.
ОРТОНОРМИРОВАННЫЕ СИСТЕМЫ И РЯДЫ ФУРЬЕ
153
функций, непрерывных всюду на отрезке
[а, Ь], за исключением конечного числа
точек, в которых эти функции имеют разрывы
первого рода, причем в каждой внутренней
точке разрыва х( значения этих функций
равны полусумме правого и левого пределов в
этой точке:
/w,/О.Ч-0)+ /(„-<,)_
а значения на концах отрезка [а, Ь]
одинаковы и равны полусумме односторонних
пределов функции в этих точках:
рье, определяемые равенством fk - (/, vj/.),
к е N . Чтобы подчеркнуть, что ряд \ /кук
А:=1
является не просто произвольным рядом по
ортонормированной системе {vj/^.} , а
именно рядом Фурье элемента / , будем
использовать запись
f(a) = f(b) =
f(a + 0) + f(b-0)
При этом под сложением элементов
евклидова пространства и умножением элемента на
число понимаются обычные операции
сложения функций и умножения функции на
число. Нулевым элементом в этом евклидовом
пространстве является функция, тождественно
равная нулю на отрезке [а, Ь]. Скалярное
умножение любым двум функциям / и g,
принадлежащим Е^[а,Ь\, ставит в
соответствие действительное число (/, g) :
Ь
(Ag) = jf(x)g(x)dx.
а
Норма элемента / определяется
следующим образом:
1И1=Л|/И2^
Ортонормированной системой в
EQ[a,b] является тригонометрическая
система:
1 cosx sinx cos шс shiAix
л/2я' л/тс ' л/гё ' ' vie ' л/гё
Ряды Фурье в евклидовых пространствах.
Назовем рядом Фурье элемента / е Е по
ортонормированной системе {vj/^.}., ряд
(формально записанную бесконечную сумму)
вида У\ fkVk » где Л ~~ коэффициенты Фу-
к=\
/~Х/л-
к=\
Для ряда Фурье элемента / определим
п
А2-ю частичную сумму Sn = V fk^k . Гово-
к=1
оо
рят, что ряд VA*j/£ сходится по норме к
некоторому элементу g e E, если
\\Sn ~ g\\ -> ° ПРИ п -> °° •
Пусть {vj/д.}., - ортонормированная
система евклидова пространства Е и / е Е.
Тогда
к \\к=\ II ||£=1
где Sn =2LfkVk п'я частичная сумма ряда
А:=1
Фурье элемента / по ортонормированной
системе {vj/^}._, • Следовательно, для любого
элемента / е Е и любой
ортонормированной в £ системы {vj/д.}., верно утверждение
1И12-Х/НХ/л-/ *
к=\ \\к=\ ||
при всех neN и c{,c2,...,cn e R.
154
Глава 3.4. РЯДЫ ФУРЬЕ
Для любого элемента / е Е и любой
ортонормированной в Е системы {у^К.
оо
ряд 2_jffc ' составленный из квадратов ко-
эффициентов Фурье элемента / , сходится.
При этом справедливо следующее неравенство
Бесселя: ^fi^ff.
к=\
Ряды Фурье по тригонометрической
системе. В евклидовом пространстве EQ[-K, к]
построим ряд Фурье по
тригонометрической системе для некоторой функции
f e Eq [-п, п]. Этот ряд имеет следующий
вид:
№>-7.£*
Е(-2 coskx Z sin foe
1 n
-к
1 K
Jk = —f= [ f(x) cos kx dx; k
-к
~ 1 K
fk - -t= Г f(x) sin kx dx; k
V7C J
(3.4.1)
a0=^ = ±]f(x)dx;
-к
ak = -^ = — Г f(x) cos kx dx, ke N;
y/n к J
-к
bk=^L = - \ f(x) sin kxdx, keN.
-к
(3.4.3)
Неравенство Бесселя в этом случае
принимает вид
# + 1(^ + «)^1я(дс)Л.
Z *=1 П-к
Для любой функции / из евклидова
пространства EQ[-n, к] коэффициенты ак и
Ьк ее ряда Фурье по тригонометрической
системе стремятся к нулю при п -> «>.
Для любого натурального к имеет место
тождество
е N;
Я^к
ак cos кх + Ьк sin кх =
ак ,
* cos кх + -
sin&x
Ряд (3.4.1) называют
тригонометрическим рядом Фурье.
Неравенство Бесселя для любой
функции f e Eq[-k, n] принимает следующий
вид:
*=1 -тс
Отметим, что наиболее употребительной
является другая форма записи
тригонометрического ряда Фурье:
f(x) ~-Q- + ^(akcoskx + bk sin kx), (3.4.2)
2 k=\
где коэффициенты aQ, ak и bk определяются
формулами:
= Ak (cos фд. cos kx + sin yk sin kx) =
= Akcos(kx-yk),
где Ak = ^ + ^, a yk , 0 < yk < 2n , -
величина, однозначно определяемая из
уравнений
= cos
Ф*>
Я^~ " Я^
■ = 81ПфЛ.
Следовательно, ряд (4.4.2) можно записать
также в виде функционального ряда
2 А:=1
члены ^ cos(kx - q>k) которого называют
гармоническими колебаниями (или гармоника-
ли|).,При этом Ак называют амплитудой ко-
лебания, к - циклической (круговой) часто-
ОРТОНОРМИРОВАННЫЕ СИСТЕМЫ И РЯДЫ ФУРЬЕ
155
той, а фд. — начальной фазой колебания.
Равенство
оо
1 k=\
если оно имеет место, называют разложением
функции f(x) в сумму гармонических
колебаний (гармоник).
Замкнутые и полные ортонормированные
системы. В бесконечномерном евклидовом
пространстве Е ортонормированную систему
называют замкнутой, если для л ю-
Мы
бого элемента / е Е и для любого числа
е > 0 существуют такой номер п е N и такие
числа с,, с2, ..., сп е R , что
Ортонормированная система {y*]y ■
замкнута в Е тогда и только тогда, когда для
любого элемента f e E верно равенство Парсе-
— ХЛНИ12-
к=[
В бесконечномерном евклидовом про-
странстве Е ортонормированную систему
{уЛ., называют полной, если
единственным элементом в Е, ортогональным всем
элементам vj/^. этой системы, является
нулевой элемент.
Любая замкнутая ортонормированная
система {vj/д.}.. бесконечномерного
евклидова пространства Е является полной.
Обратное, вообще говоря, неверно.
Если ортонормированная система
{у^} в евклидовом пространстве Е полна
(а тем более замкнута), то любые элементы
/ и g в Е, имеющие одинаковые ряды
Фурье по этой системе, совпадают: f = g .
Замкнутость тригонометрической системы.
Выражение вида
п
Т(х) = а0 + ^ (о^ cos кх + $к sin kx),
к=\
kl-Ф-И
называют тригонометрическим полиномом, а
параметр п в этом выражении — порядком
тригонометрического полинома. Говорят, что
действительную функцию f(x) ,
определенную на отрезке [д, Ь], можно равномерно
приблизить тригонометрическими
полиномами на указанном отрезке, если для любого
числа е > 0 найдется такой
тригонометрический полином Т(х),что
\Дх)-Т(х)\<г, хе[а,Ь].
Определение равномерного приближения
функции / тригонометрическими
полиномами эквивалентно существованию
последовательности тригонометрических полиномов
{^(х)}, равномерно сходящейся на [а, Ь] к
функции / .
Теорема Вейерштрасса. Если функция
f(x) непрерывна на отрезке [-тс, тс] и
удовлетворяет условию /(тс) = /(-л), то эту
функцию можно равномерно на отрезке
[-я, тс] приблизить тригонометрическими
полиномами.
Тригонометрическая система замкнута,
т.е. для любой функции / е Е0[-к, тс] и для
любого числа е > 0 существует такой
тригонометрический полином Т(х) , что
|/-Г||= 1}|Дх)-Г(х)|2</х<е.
Тригонометрическая система полна в
Eq[-k, тс], и имеет место равенство Парсе-
валя:
k=\ -K
где а^,ак,Ьк — коэффициенты
тригонометрического ряда Фурье функции f e EQ[-n, тс].
Если две функции / и g из евклидова
пространства Eq[-k, тс] имеют одинаковые
тригонометрические ряды Фурье, то для
любого х е [-я, тс] выполняется равенство
f(x) = g(x).
3.4.2. Комплексная форма записи
тригонометрического ряда Фурье. Общим
тригонометрическим рядом называют
функциональный ряд вида
156
Глава 3.4. РЯДЫ ФУРЬЕ
оо сходится абсолютно и равномерно на всей
-^- + У (ак cos kx + bk sin kx), (3.4.4) числовой прямой.
2 £~ Пусть тригонометрический ряд (3.4.6)
сходится равномерно на отрезке [-я, я] к
где xeR,a W }*=()' {^ К=1 ~ пРоизволь" некоторой функции f(x) . Тогда этот ряд
ные последовательности комплексных (дейст- является рядом Фурье функции f(x) по
вительных) чисел. тригонометрической системе.
Если функциональный ряд (3.4.4) сходится Частичные суммы ряда Фурье. Для любой
к какой-либо функции S(x) на всей число- 2л -периодической и кусочно непрерывной
вой оси, то предельная функция S(x) является на отрезке [-к, к] функции f(x) частичную
периодической с периодом 2л (возможно, с сумму
меньшим периодом), поскольку такой период
имеют все члены ряда (3.4.4) S{x) = 5i + y (а, cos kx + bk sin toe)
Согласно формулам Эйлера, для любого "v 7 2 ^
А: е N имеем k=l
ее тригонометрического ряда Фурье в форме
akcoskx + bksmkx = cke + c_ke , (3.4.2) можно представить следующим
образом:
_.. 1*г
х
где ck =-{ak-ibk), с k = -~{ak + ibk) или „ , * 1 f/,.,
k 2 k k ~k 2 * * £„(*) =-J (/(jc + ii) + /(jc-ii))
Если в дополнение к этим формулам х Dn(u)du, xe R.
обозначить с0 = <70/2 , то наряду с формой 1
Функцию АД*) = —+ cosx + cos2x + ...+
(3.4.4) любой тригонометрический ряд может 2
быть записан в комплексной форме: + cos /ис называют ядром Дирихле. Для всех
х * 2k/w, m e Z, ядро Дирихле можно запи-
-^ + ^Г (^ cos Ax + bk sin be) = сать в виде
2 *=1
А:=оо SH1
I(v/b«4e-to)=^^. />„(,) =
= cn+ > .[cte"~ +c_ke
Hi
*=1 *=-« 2 Sill -
(3.4.5) 2
Коэффициенты тригонометрического ря- \ Кг
да Фурье функции fe EQ[-n, к] в комплекс- причем ~ J ^Wrf* = l •
ной форме можно вычислить по формулам
тс Признак сходимости Диии и его следст-
ск = — f f(x)e~lkxdx, к е Z . вия. Признак Дини. Пусть функция f(x) оп-
-7с ределена на R , имеет период 2л и является
1 ^ 1 п лч кусочно непрерывной на отрезке [-я, я]. Если
3.4.3. Ряды Фурье по
тригонометрической системе. Равномерная сходимость в точке xeR ПРИ некотором значении
тригонометрических рядов. Если для последо- § > 0 существует (конечен) интеграл
вательностей коэффициентов {ап}~^ и | |/(х + и) +/(х - и) - 2/(Зс)| ф
ЮГ=1ряд X(KI+N) сходится> т° три_ *°
п= м . то тригонометрический ряд Фурье функции /
гонометрическии /?яд
сходится в точке л: к значению
оо
— + V (я„ cos до: + £я sin nx) (3.4.6) (/(* + 0) + /(х-0))/2.
А7=1 Приведем ряд следствий признака Дини.
РЯДЫ ФУРЬЕ ПО ТРИГОНОМЕТРИЧЕСКОЙ СИСТЕМЕ
157
Обобщенной левой производной функции
f(x) в точке Xq называют значение предела
Ит /(x0-/0-/(Xq-0)
/,_>+() -h
если такой существует, и обозначают его
fl(x0 ~ 0) • Аналогично обобщенной правой
производной функции f(x) в точке х0
называют значение предела
lim f(x0+h)-f(xQ+0)
л~>+о И
если такой существует, и обозначают его
/+(*0 + 0). Напомним, что f(xQ - 0) =
= lim /(xn - е) и f(xn + 0) = lim /(xn + e).
е-н-0 u u е-м-0 U
Если функция f(x) дифференцируема в
точке Xq , то обе обобщенные производные
существуют и равны производной f\xQ) , т.е.
/:(х0-о) = /;(х0 + о) = пх0).
Пусть функция f(x) удовлетворяет
следующим условиям: 1) f(x) определена
при всех xeR и имеет период 2я; 2) f(x)
кусочно непрерывна на отрезке [-к, п]; 3) в
любой точке х е R существуют конечные
обобщенные правая и левая производные.
Тогда тригонометрический ряд Фурье
функции f(x) сходится в любой точке х е R и
имеет в этой точке сумму, равную (/(х + 0) +
+f(x - 0))/2 . Таким образом, в каждой
точке, где функция f(x) непрерывна, ее
тригонометрический ряд Фурье сходится к
значению самой функции в этой точке, а в каждой
ее точке разрыва тригонометрический ряд
Фурье сходится к среднему арифметическому
значений пределов этой функции в точке
слева и справа.
Функцию называют кусочно
дифференцируемой на конечном отрезке [а, Ь], если
отрезок [а, Ь] можно разбить на конечное число
частичных промежутков, внутри которых эта
функция дифференцируема, на концах имеет
предельные значения и обобщенные левую и
правую производные соответственно. Если
функция / определена на R , имеет период
2я, кусочно дифференцируема на отрезке
fr-я, п], то ее ряд Фурье сходится в каждой
точке хеМ, и его сумма равна (/(х + 0) +
+/(х-0))/2.
Если 2я -периодическая функция всюду
дифференцируема на R , то ее
тригонометрический ряд Фурье всюду на R сходится к
функции f(x).
Признак сходимости Жордана и его
следствия. Функцию f(x) , заданную на отрезке
[а, Ь], называют функцией с ограниченным
изменением, если существует такая постоянная
М > 0, что, каково бы ни было разбиение
отрезка
[а,Ь]
а = Хп<
< Xj < ... < хп = b , справедливо неравенство
X|/(**)-/(**-i)|s"-
k=\
Всякая функция, монотонная на отрезке
[а, Ь], имеет ограниченное изменение,
причем сумма, стоящая в последнем неравенстве
слева, не зависит от выбора точек разбиения
и всегда равна \f{b) - f(a)\.
Функцию f{x) называют кусочно
монотонной на отрезке [а, Ь], если существует
конечное число точек а = xQ < Xj < ...
...<xn=b, таких, что в интервалах (х_,,х)
j = \,п , функция f{x) монотонна (не
убывает или не возрастает).
Ограниченная кусочно монотонная на
отрезке функция также имеет на этом отрезке
ограниченное изменение.
Признак Жордана. Пусть функция f(x)
определена на R , имеет период 2л и
является кусочно непрерывной на отрезке
[-я, п]. Если точка хе R такова, что при
некотором значении 5 > 0 функция f(x)
имеет ограниченное изменение на отрезке
[х - 5, х + 5], то тригонометрический ряд
Фурье функции / сходится в точке х к
значению (/(jc + 0) +/(х-0))/2. В частности,
если 2я -периодическая и кусочно
непрерывная на отрезке [-я, п] функция имеет на этом
отрезке ограниченное изменение, то ее ряд
Фурье будет сходиться в любой точке хе! к
значению (/(х + 0)+/(х-0))/2.
158
Глава 3.4. РЯДЫ ФУРЬЕ
Приведем ряд следствий признака Жор-
дана.
Признак Дирихле. Пусть функция f(x) ,
определенная на R , удовлетворяет условиям:
1) имеет период 2я ; 2) кусочно непрерывна
на отрезке [-я, я]; 3) кусочно монотонна на
отрезке [-я, я]. Тогда тригонометрический
ряд Фурье функции f(x) сходится в любой
точке xeR и имеет в этой точке сумму,
равную (/(х + 0)+/(х-0))/2.
Условия 2 и 3, накладываемые на
функцию f(x) , часто называют условиями Дирихле
и говорят, что функция f(x) удовлетворяет
условиям Дирихле. Условие 3 признака
Дирихле иногда заменяют требованием
конечности числа локальных экстремумов на отрезке
[-я, я], что для кусочно непрерывной
функции эквивалентно условию 3.
О порядке малости коэффициентов Фурье.
Говорят, что функция f(x) имеет на отрезке
[а, Ь] кусочно непрерывную производную, если
существует конечное число точек, таких, что в
интервалах (^,_j, *,■), у = 1, Л, существует и
непрерывна производная f\x) , а в самих
точках Xj существуют конечные
односторонние пределы lim f\x) и lim f\x).
х-*Х:+0
x-»jc-0
Будем говорить, что функция f(x) имеет на
отрезке [а, Ь] кусочно непрерывную
производную порядка п > 1 , если функция f*n~^{x)
(функция f(x) при п = 1) имеет на отрезке
[а, Ь] кусочно непрерывную производную.
Если функция f(x) непрерывна на
отрезке [-п> я], удовлетворяет условию
/(-я) = /(я) и имеет на [-я, я] кусочно
непрерывную производную, то
тригонометрический ряд Фурье функции f(x) сходится
равномерно на отрезке [-я, я] к самой
функции f(x) . Более того, ряд, составленный из
модулей членов тригонометрического ряда
Фурье функции f(x) , также сходится
равномерно на отрезке [-я, я].
Пусть функция f(x) имеет на отрезке
[-я, я] непрерывные производные до
порядка т включительно и кусочно непрерывную
производную порядка т + 1, причем
выполняются условия:
/(-я) = /(я), Л-я) =
= /,W,...,/(w)(-^) = /(w)(^)
Тогда сходится ряд ^L;km (\ak\ + |^|),
где ак и bk — коэффициенты
тригонометрического ряда Фурье функции f(x) .
Коэффициенты Фурье функции f(x) удовлетворяют
соотношениям:
а к = о
Т™*) Ьк=0[Т^)
А:-><
Дифференцирование и интегрирование
тригонометрических рядов Фурье. Пусть
функция f(x) имеет на отрезке [-я, я]
непрерывные производные до порядка m
включительно и кусочно непрерывную производную
порядка m + 1, причем выполняются условия:
/(-я) = fin), f'(-n) =
= /'(л),...,./"(т)(-гс) = /(т)(л).
Тогда тригонометрический ряд Фурье
функции f(x) можно m раз почленно
дифференцировать на отрезке [-я, я], т.е. для
любых х е [-я, я]
/<*>(*) = JT (дд. cos<5> кх + Ьк sin<5> /be),
к=\
s = 0, m,
где ак и Ьк — коэффициенты Фурье
функции f(x) .
Для любой кусочно непрерывной на
отрезке [-я, я] функции f(x) ее
тригонометрический ряд Фурье
Дх) ~ -jj- + £ (ап cos пх + bn sin nx)
1 /7=1
можно почленно интегрировать на любом
промежутке [я, Ь] из этого отрезка:
jf(x)dx=^x\
а
Т^( , COStlX sillAW:^
£\ " п п п )
, [a,b](z[-n,n].
РАЗЛОЖЕНИЕ ФУНКЦИИ В ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ НА ОТРЕЗКЕ 159
3.4.4. Разложение функции в
тригонометрические ряды на отрезке. Разложение
функций в ряды Фурье на отрезке [-я, я].
Пусть функция f(x) определена на отрезке
[-я, я] и удовлетворяет условиям: 1) f(x)
кусочно непрерывна на отрезке [-я, я]; 2) в
любой точке х е (-я, я) существуют
конечные обобщенные правая и левая производные, в
точке х - -я существует конечная
обобщенная правая производная, а в точке х = -я —
конечная обобщенная левая производная.
Тогда тригонометрический ряд Фурье
функции f(x) сходится в любой точке х е [-я, я],
и для его суммы S(x) справедливо равенство
S(x) =
/(дс + 0) + /(х-0)
2
Д-я + 0) + /(я-0)
хе (-л, я);
хе ±я.
(ЗА7)
Признак Дирихле, Пусть функция
f(x) = х, определена на отрезке [-я, я] и
удовлетворяет условиям: 1) кусочно
непрерывна на отрезке [-я, я]; 2) кусочно
монотонна на отрезке [-я, я]. Тогда
тригонометрический ряд Фурье функции f(x) сходится
в любой точке х е [-я, я] и для его суммы
S(x) справедливо равенство (3.4.7).
Пример 3.4.1. Разложим функцию
f{x) = х, заданную на отрезке [-я, я],
в тригонометрический ряд Фурье.
Вычислим коэффициенты Фурье этой
функции (см. (3.4.3)):
1 к
а - — Г х cos nx dx = О, п е {0} и N ,
я J
b„ = — Г х sin nxdx =
к J
-n
2 2
= —cos nn = (-1)"+1 -, ne N.
n n
Отсюда следует, что тригонометрический
ряд Фурье функции f(x) = х , заданной на
отрезке [-я, я], имеет вид
х ~ 2 sin х — sin 2x +
{ 2
1 . , (-1)"+1 . "I
+ — sin3x-... + -—-—smnx + ... \.
3 п )
Так как функция f(x) = х непрерывна
и дифференцируема в интервале (-я, я) , а
на концах отрезка [-я, я] имеет
соответственно левую и правую производные, то сумма
S(x) ее тригонометрического ряда Фурье в
интервале (-я, я) совпадает с f(x) :
S(x) = f(x) = х, хе (-я, я). На концах же
отрезка [-я, я] имеем -^(-я) = <5Хя) =
= (/(-л + 0) + /(я - 0))/2 = 0 . Рассматривая
функцию S(x) на всей числовой оси,
отметим, что она имеет период 2я. Графики
функций f(x) и S(x) представлены на рис.
3.4.1 и 3.4.2.
Заметим, что если продолжить функцию
f(x) = х с отрезка [-я, я] на всю числовую
прямую по той же формуле f(x) = х , то вне
отрезка [-я, я] сумма S(x) уже не будет
представлять собой функцию f(x) (будет от
нее существенно отличаться).
-я
У*
0 л х
Рис. 3.4.1
Рис. 3.4.2
160
Глава 3.4. РЯДЫ ФУРЬЕ
Сдвиг отрезка разложения. Рассмотрим будет полной ортонормированной в этом евкли-
евклидово пространство EQ[a, b] функций,
определенных на отрезке [a, b], b - а = 2л.
Система функций
11 1 .
-=г, -=cosx, -pSinx,...,
>/2л у/п yjn
1
1
-j^cosnx, —=smnx,
у/П у/К
довом пространстве. Если функция f(x)
определена на всей числовой прямой R и
является периодической с периодом 2л, то
коэффициенты Фурье по тригонометрической
системе на отрезке [а, а + 2 л] можно
вычислить с помощью значений функции f(x) на
отрезке [-л, л]:
f(x) ~ -О- + V (ak cosкх + bk sin foe), хе[а, а + 2л],
*=1
я+2тс
ак=— Г f(x) cos кх dx = — [ f(x) cos kx dx, к = 0,1,2,...,,
л J п J
а -к
а+2к к
hi, = — I f(x) sin kxdx = — | f(x) sin foerfx, k = 1, 2,...
* л J л J
Иногда удобно, наоборот, определять
коэффициенты тригонометрического ряда
Фурье (2л ^периодической функции f(x) с
помощью ее значения на каком-либо отрезке
[а, а + 2п].
Пример 3.4.2. Найдем разложение в ряд
Фурье на отрезке [-л, л] функции,
определенной следующим образом:
/(*) =
х + 2л, -л < х < 0;
х, 0 < х < л.
Продолжим функцию f(x) на всю
числовую прямую до периодической (с
периодом 2л) функции f(x) Тогда разложения
функций f(x) и f(x) в тригонометрический
ряд Фурье на отрезке [-л, л] будут совпадать.
В интервале (0, 2л] функция f(x)
совпадает с функцией х. Поскольку аналитическое
выражение функции f(x) на отрезке [0, 2л]
более простое (f(x) = х ), чем выражение
этой функции на отрезке [-л, л]
(/(*) = /(*))» то Для вычисления
коэффициентов Фурье функции f(x) (и, значит,
функции f(x) ) удобнее использовать
значения функции на отрезке [0, 2л]. При этом
значение функции f(x) в единственной
точке разрыва х = 0 на ее разложение в ряд
Фурье никак не влияет. В результате получаем:
яп = - f f(x) dx = — [ x dx = 2л,
л J n J
-71 0
71 - 27C
a„=— Г f(x) cos nx dx = — \ x cos nx dx = 0 ,
n J n J
-к 0
. к * 2к _
h =- f f(x)s'mnxdx = — I xsmnxdx = --.
Л Л J Л J Я
РАЗЛОЖЕНИЕ ФУНКЦИИ В ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ НА ОТРЕЗКЕ 161
Таким образом, функция f(x) на
отрезке [-71, к] имеет следующий ряд Фурье:
S(x) =
1
1
sin x + — sin 2x +... + — sin nx +
2 п
-)
Так как функция f(x) удовлетворяет
условиям признака Дирихле, то
х е [-л, к], х * 0;
х = 0,
*(*> = {/(Х)'
а вне отрезка [-я, я] функция ^(х)
продолжается периодически. Графики функций
/(*) » /(*) и *£(*) представлены на рис.
3.4.3 - 3.4.5 соответственно.
Разложение функций в
тригонометрические ряды Фурье на отрезке [-/, /]. Теорию
тригонометрических рядов Фурье 2к
-периодических функций и функций,
определенных на отрезке [-к, к], с помощью
линейного отображения (замены переменного)
у = — х (-/ <х<1 <=> - л < }> < л)
можно перенести на случай произвольных
2/ -периодических функций и функций,
определенных на произвольном отрезке [-/, /].
При этом ряд Фурье 2/ -периодической
функции f(x) имеет вид
г, ч ао v*f пкх , . пкхЛ
/w~y+2,KC0S—+bnsm— I
(3.4.8)
где коэффициенты Фурье ап и Ьп
вычислены по формулам:
1 пкх
ап=1 f/Wcos^rfr, n = 0,1,2,...;
'-/ '
^=yj/(x)sin^rfx, n =1,2,3,...
(3.4.9)
Этот же ряд можно получить иначе:
рассмотреть евклидово пространство EQ [-/, /] и
полную ортонормированную систему функций
1 1 лх 1 . кх
—j=, -t=COS—-, -pSlll ,...,
V27 V7 i yfJ i
1 Л7СХ 1 . ПКХ
_cos_ _sm_...
Поскольку между In -периодическими
функциями (функциями, определенными на
отрезке [-к, я]) и 2/ -периодическими
функциями (функциями, определенными на
отрезке [-/, /]) существует взаимно
однозначное соответствие, задаваемое строго
монотонной, сколь угодно раз
дифференцируемой линейной заменой переменных у = кх/1,
то все изложенные выше факты теории
тригонометрических рядов Фурье вида (3.4.2)
можно перенести на тригонометрические
ряды Фурье вида (3.4.8).
У
А
: я
-я 0
Рис
У=/(х)
А.
Я X
3.4.3
А
-2л
У
2л
0
У=/(х)
/ V
2л х
Рис. 3.4.4
y=S(x)
6 — 7706
162
Глава 3.4. РЯДЫ ФУРЬЕ
Комплексная форма тригонометрического
ряда Фурье (3.4.8) имеет вид
к=-оо
кюс
ск=^]/{х)е'1 / Л, *
-/
Пример 3.4.3. Найдем разложение в ряд
Фурье функции f{x) , заданной на отрезке
[-2, 2], где
/(*) =
0, -2 < х < -1;
1, -1 < х < 1;
х2, -1<х<2.
График функции /(*) изображен на
рис. 3.4.6. Функция fix) является кусочно
непрерывной на отрезке [-2, 2],
дифференцируемой в каждой точке интервала (-2, 2), за
исключением точек —1 и 1, в которых,
однако, существуют обобщенные левые и правые
производные. Кроме того, в точке х = -2
существует правая производная, а в х - 2 —
левая производная.
1 2 х
Рис. 3.4.6
Таким образом, функция fix) на
отрезке [-2, 2] удовлетворяет условиям
признака Дини, сформулированного для отрезка
[-2, 2], следовательно, ее ряд Фурье (3.4.8) в
любой точке хе (-2, 2), х * -1 (это точки
непрерывности функции fix)) будет
сходиться к значению функции fix) , во
внутренней точке разрыва х = -1 будет сходиться
к значению (/(-1 + 0) + /(-1 - 0))/ 2 =
= (0 + 1)/ 2 = 1/ 2 , а на концах х = -2 и
л: = 2 - к значению (/(-2 + 0) + /(2 -
-0))/2 = (0 + 4)/2 = 2.
По формулам (4.4.9) вычисляем
коэффициенты Фурье в разложении функции
fix):
1 2 1 [ 1 2 13
% = J J Л*>Л = 2 J Л + 2 J** Л = Т;
1 Г /v ч ЯГОС , 1 f ЛГОС , 1 Г 2 ПКК
а„ =— /(x)cos rfx = — cos——ох + — х cos
п 2]J\ > 2 2 J 2 2 J 2
-2 -1 I
-rfx =
1 . /271 8 / 14„ 4 /271 8 . /27C
= —sin —+ -T-T(-lr--TTcos — + —-sin —;
Л7С
2^2
« 7C
2 2
/Г7Г
^ =-J/(x)sin^Prfx
Л7ГХ
T
1 1 1 2
1 f . /27UC , 1
1 f . /27UC 1 f 2 ■
= — Sill -—-OX + — \X SI
2 J 2 2 J
. rnvc ,
sin ax =
1 ( 4/ n/7+l . A27C
4(-1)Л+1+С08 —
A27C( 2 j АГ7С
4 . /TO 8 Л |чЯ ПК
^mT+W H) cosT
Таким образом, тригонометрический ряд Фурье функции fix) , заданной на отрезке
[-2, 2], имеет вид
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ ФУРЬЕ ПО СИНУСАМ И ПО КОСИНУСАМ 163
/1=1
т 8(-l)"-4cos^
«v-smT+—7j
п2к2 + 8
пюс
COS +
2
л/ 1\П+1 ПК
4(-1) * +cos—-
ПК
4 . пк 0
2-2 2
(-1)" - COS
У
ЯЯ "^
П К
График суммы ^(х) этого рада
представлен на рис.3.4.7.
Разложение четных и нечетных функций.
Пусть на отрезке [-71, я] задана четная
кусочно непрерывная функция /(х) . Тогда при
любом натуральном п произведение /(x)sinrtx
является нечетной функцией, а произведение
f(x)cosnx является четной функцией, и
верны равенства:
1 п
ап = — | f(x) cos nxdx =
-к
1 п
= — I f (x)cos nxdx, n = 0,1,2...;
я J
0
1 n
bn=— \ f(x)sinnxdx = 0, n = 1,2...
я J
-к
Ряд Фурье четной на отрезке [-я, к]
функции принимает следующий вид:
/(*) ~ % + X ап cos ш • (3-41°)
2 /7=1
Если же кусочно непрерывная функция
/(х) определена на [-я, я] и нечетна, то
при любом натуральном п произведение
/(x)cosa*x является нечетной функцией, а
произведение /(х) sin nx - четной
функцией и верны равенства:
1 к
а =— f f(x) cos nxdx = 0, п = 0,1,2...;
к J
-к
1 П
b = — [ /(х) sin их */х =
я J
-f/w
sin nxdx, n = 1,2...
Ряд Фурье нечетной на отрезке [-я, я]
функции принимает следующий вид:
/2 Я
S111-
яях
У
Л':,
J
<j
2*^1 0
л f>
l :
t
' >
X
Рис. 3.4.7
/(x)~X^SillA2X.
л=1
(3.4.11)
Аналогично, если функция /(х)
определена на отрезке [-/, /], кусочно
непрерывна и является четной, то изложенные выше
рассуждения приводят к тому, что
тригонометрический рад Фурье (3.4.8) этой четной
функции с коэффициентами, вычисляемыми
по формулам (3.4.9), принимает следующий
вид:
/j=1
- /
2 г г. ч лях , л ,
я„ =-J/(x)cos—dx, л = 0,1,...
(3.4.12)
Если же кусочно непрерывная функция
определена на [-/, /] и является нечетной, то
ее тригонометрический ряд Фурье (3.4.8) с
коэффициентами, вычисляемыми по
формулам (3.4.9), принимает следующий вид:
/j=1 l
I
b„=jjf(x)sin?y-dx, n = \,2,...
(3.4.13)
3.4.5. Разложение функций в ряды
Фурье по синусам и по косинусам. Пусть
функция /(х) задана на отрезке [0, я] и
6*
164
Глава 3.4. РЯДЫ ФУРЬЕ
удовлетворяет на нем условиям признака Дини
или признака Дирихле.
Рассмотрим два специальных
разложения функции f(x) в 2л -периодические (т.е.
полученные с помощью разложения на
отрезке [-я, л]) тригонометрические ряды Фурье.
Первое разложение - это разложение в 2л -
периодический тригонометрический ряд
Фурье, не содержащий членов с синусами, т.е. в
ряд, у которого все коэффициенты Фурье Ьп
равны нулю. Такое разложение функции
называют разложением в тригонометрический
ряд Фурье по косинусам кратных дуг (или по
косинусам). Второе разложение — это
разложение в 2л -периодический
тригонометрический ряд Фурье, не содержащий свободного
члена и членов с косинусами, т.е. в ряд, у
которого все коэффициенты Фурье ап равны
нулю. Такое разложение функции называют
разложением в тригонометрический ряд Фурье
по синусам кратных дуг (или по синусам).
Для разложения функции f(x) ,
определенной на отрезке [0, л], по косинусам
кратных дуг (и с 2л -периодической суммой
ряда Фурье) необходимо продолжить
функцию f(x) на промежуток [-л, 0) по
четности, т.е. положить f(x) = /(-*), х е [-л, 0).
Построив на отрезке [-л, л]
тригонометрический ряд Фурье полученной четной функции
(см. (3.4.10)) и рассмотрев его сумму только
на отрезке [0, л], получим разложение
исходной функции f(x) на отрезке [0, л] по
косинусам.
Для разложения функции f(x) ,
определенной на отрезке [0, л], по синусам
кратных дуг (и с 2л -периодической суммой ряда
Фурье) необходимо продолжить функцию
f(x) на промежуток [-л, 0) по нечетности,
т.е. положить f(x) = -/(-*), х е [-л, 0).
При этом, возможно, потребуется
переопределить значение функции в нуле, поскольку
для всякой нечетной функции /(0) = 0 . Это
никак не повлияет на ряд Фурье функции
f{x) . Построим на отрезке [-л, л]
тригонометрический ряд Фурье полученной нечетной
функции (см. (3.4.11)) и, рассмотрев его
сумму только на отрезке [0, л], получим
разложение исходной функции f(x) на отрезке
[0, л] по синусам.
Аналогично можно разложить функции,
заданные на произвольном отрезке [0, /], в
2/ -периодические тригонометрические ряды
Фурье, содержащие только косинусы или
только синусы. В первом случае функцию
необходимо доопределить в промежутке
[-/, /] до четной функции и воспользоваться
формулами (3.4.12). Во втором случае
функцию следует доопределить до нечетной на
[-/, /] функции и применить формулы
(3.4.13).
Пример 3.4.4. Разложим в
тригонометрические ряды по косинусам и по синусам на
отрезке [0, 2] функцию
fix)-
1, 0<х<1;
0, 1<х<2.
Четная функция (рис. 3.4.8)
[0, -2<х<-1;
/ч(х)= 1, - 1 < х < 1;
[о, 1 < х < 2
определена на отрезке [-2, 2] так, что
f(x) = /ч (х), х е [0, 2]. Используя формулы
(3.4.12) при / = 2, получаем
1 1
а0 = \dx = 1, ап - Г cos dx =
2 . пк
— sin —,
пк 2
пе
Поскольку функция f4(x)
удовлетворяет условиям признака Дирихле и непрерывна
во всех точках интервала (0,2) , кроме точки
х = 1, то получаем
f(x) = f4(x) = S(x) =
1 \7 2 . ПК ПКХ ГЛ 1Ч ,. ~Л
= 7 + 2,—sm—cos-—, xe[0,l)u(l,2].
/i=i
ПК
В точке разрыва х = 1 имеем S(\) = 1/2, в то
время как /(1) = 1 . График периодической с
периодом Т = 4 функции S(x), являющейся
суммой ряда Фурье, представлен на рис. 3.4.9.
У-
; 1
-2 *-1
0
1
•rf»
1к
2 х
Рис. 3.4.8
РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ ФУРЬЕ ПО СИНУСАМ И ПО КОСИНУСАМ 165
г*
-3V
yf
• 1
: i/2
*-1 0
*г\
1
1
Iе
L,
"з
X
Рис. 3.4.9
У*
1
Г 2х
-1
Рис. 3.4.10
Разложим f(x) в ряд по синусам.
Функция (рис. 3.4.10).
/н«:
0, -2<х<-1;
-1, -1<х<0;
0, х = 0;
1, 0 < х < 1;
0, 1 < х < 2
нечетная и определена так, что f(x) - fH(x),
х е (0,2] . Кусочно постоянная на отрезке
[-2, 2] функция fH(x) удовлетворяет
условиям признака Дирихле. Используя формулы
(3.4.13) при / = 2, получаем
, г . пкх , 2 (Л пкЛ __
b = sin—-dx=— 1-cos— , neN.
J 2 *4 2J
Поскольку функция /н(х) непрерывна во
всех точках интервала (0, 2), кроме точки
х = 1, то при всех х е (0,1) и (1,2) получаем
= 1
п=\
f(x) = fH{x) = S(x)
2
ПК
1 -cos
пкЛ . пкх
— sin-—-.
2 J 2
В точке разрыва х =1 и на концах
х = 0 и х = 2 отрезка [0,2] имеем
S(\) = 1/2, S(0) = 0, S(2) = 0 , в то время как
/(1) = 1 , /(0) = 1, /(2) = 0 . График
периодической с периодом Т = 4 функции S(x) —
суммы тригонометрического ряда Фурье
функции fH(x) — изображен на рис. 3.4.11.
"Н*
•
-зС
У,
1
-1
>i о
•
<->
i
•
1С
-1
*Ъ
^3
•
к—
X
Глава 3.5
ДИСКРЕТНОЕ ПРЕОБРАЗОВАНИЕ ФУРЬЕ.
БЫСТРОЕ ПРЕОБРАЗОВАНИЕ ФУРЬЕ
Рассмотрим линейное пространство DN
комплексных сеточных функций,
определенных в узлах сетки х- = jT/N, j = 0,N - 1 ,
где N — фиксированное натуральное число.
Это TV -мерное комплексное линейное
пространство.
Отображение, которое всякой функции
/ е DN ставит в соответствие вектор ее зна-
чений / = ( Дх0) /(*,).../(*„_,)f e CN ,
устанавливает изоморфизм между линейным
пространством DN сеточных функций и
комплексным линейным арифметическим
пространством С
Введем в этом комплексном линейном
пространстве скалярное умножение
N-i
Ur,g) = -zFyZf(xJ)g(xJ),f,geDN9
У=0
Рис. 3.4. ]
где черта сверху означает операцию
комплексного сопряжения. Аксиомы скалярного
умножения для комплексных линейных
пространств те же, что и для действительных
линейных пространств, за исключением
аксиомы коммутативности, которую заменяют
следующей: (/, g) = (g, f). Комплексные
линейные пространства со скалярным
умножением называют унитарными
пространствами. Таким образом, линейное пространство
DN становится унитарным пространством.
Система сеточных функций (р{(х) = е шх' ,
/2 = -1, / = 0, N -1, где х принимает
значения jT/N, j =Q,N-\, является ортонорми-
рованным базисом в унитарном пространстве
DN. Для любой функции / е DN имеет
место разложение по этому базису:
166 Глава 3.5. ДИСКРЕТНОЕ ПРЕОБРАЗОВАНИЕ ФУРЬЕ. БЫСТРОЕ ПРЕОБРАЗОВАНИЕ ФУРЬЕ
/V-l N-i
/=0 /=0 (3.5.1)
JT
X = ■
N
J = 0,N-l,
где коэффициенты разложения С/, / =
= 0, N - 1 — координаты функции (вектора)
f в этом ортонормированном базисе, т.е.
Соотношение (3.5.1) обычно называют
дискретным (конечным) рядом Фурье сеточной
функции /е /)# , а коэффициенты С/ - ее /(*) = /,/(**-! )gft С*)» xj
дискретными коэффициентами Фурье.
Разложение сеточных функций в дис
кретный ряд Фурье (3.5.1) определяет линей
ное отображение $\ /)дг —> С , которое ка
ждой функции / из унитарного пространст
ва Dfq , т.е. сеточной функции / , опреде
ром, действующим из N-мерного унитарного
АГ
пространства D^ в С . Линейный оператор
9 называют прямым дискретным
преобразованием Фурье.
Пусть в пространстве Djsf выбран базис
из сеточных функций {ek(x)}k^i » гДе Для
любого k = \,N выполняются условия
ek(xj) = 0 пРи j = О, N - 1, j; * к - 1, и
ек(хк-[) = 1- Для любой сеточной функции
/ е Djs/ имеем разложение
N
к=\
N ''
j = 0,N-L
Столбец координат сеточной функции
/ е Dpi в ортонормированном базисе
{ek(x)}k=i унитарного пространства Dpi
имеет вид
ленной на сетке Xj = j T/N, j = 0, N - 1
ставит в соответствие комплексный вектор
f = (f(x0)f(xl)f(x2)...f(xN_l))T.
Согласно формулам (3.5.2), в
стандартном базисе арифметического пространства
Координатами этого вектора явля- С" столбец с координат образа сеточной
ются дискретные коэффициенты Фурье функции / при отображении ^(вектор
дисфункции /. Отображение $\ DN -> С^ кретных коэффициентов Фурье функции / )
является невырожденным линейным операто- можно представить следующим образом:
с =
CN-\
/V-l
^nxj)e-2Ki°Xj/T
7=0
/V-l
Х/(*У>
-ImYxjjT
7=0
/V-l
2n/ 0 jcq
2n/ 1 xq
2ni 2 xq
2ni 0 x\
2 л/ I x\
2ni 2 x\
2ni(N-\)xo 2ni(N-\)x\
2л/ О xs-i
i т
2ni 1 -Vyy-i
e т
2л/ 2 .ryv_i
e T
2ni(N-\)xN_l
Д*о) 1
f(xi)
f(*N-\)
c=Ff,
ДИСКРЕТНОЕ ПРЕОБРАЗОВАНИЕ ФУРЬЕ. БЫСТРОЕ ПРЕОБРАЗОВАНИЕ ФУРЬЕ 167
т
где / = ( Дх0) f{x{) f(x2)...f(xN_{)) .
Матрицу F называют матрицей прямого
дискретного преобразования Фурье. Учитывая
равенства xj = j T/N, j = О, N - 1, и вводя
параметр q = е~ ' , матрицу F прямого
дискретного преобразования Фурье можно
записать в виде
(\ 1 1 ... 1 ^
N
Я»'1
gN-i g2(N-l) q{N-\)1
Так как линейный оператор £ взаимно
однозначно отображает унитарное простран-
AT
ство Dj\f на С , то существует обратный к
нему оператор &~{: С —> D^ . Линейный
оператор &~{ каждому комплексному вектору
N
с е С ставит в соответствие сеточную
функцию / € Dn , для которой координаты
вектора с являются дискретными
коэффициентами Фурье функции / . Отображение $л
называют обратным дискретным
преобразованием Фурье. Оно определяется формулами
(3.5.1), которые эквивалентны следующему
матричному равенству: f = F~ с. Матрицу
F~ называют матрицей обратного
дискретного преобразования Фурье, она имеет вид
7-1
1
1
я'1 я~2 .
я'2 JT4
r(N-\) q-2(N-\)
1
,-2(7V-l)
-(N-\)z
Обратимся теперь к вычислительным
аспектам осуществления прямого и обратного
дискретных преобразований Фурье. Выполняя
прямое или обратное преобразование Фурье,
нам приходится умножать квадратную
матрицу F или F порядка N на столбец из
TV чисел. При этом для определения всех
дискретных коэффициентов Фурье сеточной
функции / из унитарного пространства D^
требуется порядка N арифметических
операций (матрицы F и F считаются
вычисленными заранее). Однако если N является
составным числом, то количество
выполняемых арифметических операций можно
значительно сократить. Существует алгоритм
вычисления дискретных коэффициентов Фурье
сеточных функций, называемый быстрым
дискретным преобразованием Фурье, который
позволяет уменьшить число производимых
арифметических операций до порядка
разложение числа N на простые сомножители.
Пусть N = N\N2 . Тогда, согласно
быстрому дискретному преобразованию Фурье,
для любого / = О, N - 1, используя
разложение / = l[N[ + /о, где 1[ < N2 и Iq < N[;
имеем формулы для вычисления дискретных
коэффициентов Фурье:
1 ^Г1
ci=chNl+lo =— ]Г c(l0J0)glj0,
Уо=0
где введено обозначение:
C(h,Л)) = ^~ £/(*лN2+JoWOJlN2,
^л=о
Уо=0,ЛГ2-ио=0,ЛГ, -1.
Рассмотрим быстрое дискретное
преобразование Фурье для случая N = 2т , те N .
Разложим числа / = 0, W - 1 и j = 0,N -1
по степеням числа 2, т.е. представим их в
виде
/и-1
/и-1
/=]Г/*2*, У = $>2Г, (3-5.3)
*=0 г=0
где все коэффициенты 4 и jr принимают
одно из двух значений: 0 или 1. Для
произвольной сеточной функции / е D^ положим
/(°4yo>---,./m-l) = /(*/), где j имеет
разложение (3.5.3). Пусть
/я-г-1
аг=д(/0,...,/да-г-1)= £ lk2k .
k=o
Тогда формулы для вычисления
дискретных коэффициентов Фурье имеют вид:
c/^i^0-
1
1
70=0
1 £ g^'-^f^Uo,...,]^).
Если ввести следующие обозначения:
168 Глава 3.5. ДИСКРЕТНОЕ ПРЕОБРАЗОВАНИЕ ФУРЬЕ. БЫСТРОЕ ПРЕОБРАЗОВАНИЕ ФУРЬЕ
С(0)(У(Ь Л Ут-l) = /(0)(У0,...,Л«-1) = /(*,) ,
с(1>(/о,Уо,..,У.-2)4 Z ^-l2W"lfl(/0)^0)Ob,yi,..,y,-i),
Ут-1=0
с(2)(/о,/ьУо,..,У.-з)4 X ^2*"2в(*'*М1>№,Л,...,У|И.2),
C(/W)(/0, 4 /m-l) = ^2 ^*,ik,"-,/*-l)^,"'1)(«).4.-'m-2,A),
^ 70=0
то процесс вычисления дискретных коэффи- .,.
Ак>(1 I i i ) =
циентов Фурье С/ сведется к быстрому алго- vo>—> k-[>J0>~->Jm-k-\'
ритму вычислений с использованием следую- 1 ш_*
щих рекуррентных формул: = V q т~к т~к х
Jm-k^
С (l0,.:,lk_{,J0,..',Jm_k_{)= /.(Л"!)// / I / Ч
ХС V'o»—'4-2'^0'—'^wi-A:/'
= 1 У qJm-k^Om-kv ™е
где
= Z,lr2> Q=e ' Л = 1,/Я.
т-к ~ v 0' 1»—> fc-1' ~ Начальными значениями (&=0) для этих
fc-1 формул являются значения дискретных ко-
= V/r2r, # = е~ я/' , к = 1,/и. эффициентов Фурье сеточной функции
Начальными значениями (А: = 0 ) для этих j
формул являются значения функции f e Dn с( 'UoJ\>—Jm-{) = ^/» У = S ^^'
в узлах сетки Ху = У Г/ЛГ, у = 0, N - 1 :
а конечными значениями (к = т) — значе-
ci0)U0Ji,..;Jm-i) = AXj), У = £Л2Г. НИЯ ФуНКЦИИ /€^ В уЗЛаХ СеТКИ
'=0 х/ =/Г/ЛГ, / = 0,ЛГ-1:
а конечными значениями (к = т) — иско- т-\
мые дискретные коэффициенты Фурье ^m\l0,l{,...,lm_{) = f(x{), l= V/^2 .
функции / : &=0
//яч _ Й ^ Вместо необходимых N операций при
с Ц)>'1>—>'w_i' = с/' 1 = 2^ к ' использовании обычного алгоритма преобра-
*=0 зования Фурье приведенный алгоритм быст-
Рассуждая аналогично, приходим к ре- Рого <пРямого и кратного) преобразования
куррентным формулам быстрого алгоритма фУРье тРебУет выполнения всего порядка
обратного преобразования Фурье: 2N log2# арифметических операций.
СПИСОК ЛИТЕРАТУРЫ
169
СПИСОК ЛИТЕРАТУРЫ
1. Бари Н.К. Тригонометрические ряды.
М: Физматгиз, 1961. 936 с.
2. Власова Е.А. Ряды / Под ред. B.C.
Зарубина, А.П. Крищенко. М.: Изд-во МГТУ
им. Н.Э. Баумана, 2000. 612 с. (Сер.
Математика в техническом университете; Вып. IX).
3. Воробьев Н.Н. Теория рядов. М.:
Наука, 1986. 408 с.
4. Градштейн И.С., Рыжик И.М.
Таблицы интегралов, сумм, рядов и произведений.
М.: Наука, 1971.1108 с.
5. Зигмунд А. Тригонометрические ряды:
Пер. с англ. В 2 т. Т. 1. М.: Мир, 1965. 611 с.
6. Зорич В.А. Математический анализ:
В 2 т. Т. 2. М.: Наука, 1984. 640 с.
7. Ильин В.А., Садовничий В.А., Сен-
дов Бл.Х. Математический анализ:
Продолжение курса / Под ред. А.Н. Тихонова. М.: Изд-
во МГУ, 1987. 358 с.
8. Никольский СМ. Курс
математического анализа: В 2 т. Т. 1. М.: Наука, 1990.
528 с; Т. 2. М.: Наука, 1991. 544 с.
9. Толстое Г.П. Ряды Фурье. М.: Наука,
1980. 382 с.
10. Фихтенгольц Г.М. Основы
математического анализа: В 2 т. Т. 2. М.: Наука, 1968.
464 с.
11. Шмелев П.А. Теория рядов в задачах
и упражнениях. М.: Высшая школа, 1983. 176 с.
12. Эдварде Р. Ряды Фурье в
современном изложении: Пер. с англ. В 2 т. Т. 1. М.:
Мир, 1985. 264 с; Т. 2. М.: Мир, 1985. 400 с.
Раздел 4
ТЕОРИЯ ФУНКЦИЙ
КОМПЛЕКСНОГО ПЕРЕМЕННОГО
Глава 4.1
КОМПЛЕКСНАЯ ПЛОСКОСТЬ
4.1.1. Алгебраическая форма записи
комплексного числа. На множестве R
упорядоченных пар z = (х, у) действительных
чисел jc,ye R введем совокупность
операций, превращающих его в поле, обозначаемое,
как правило, С и называемое полем
(множеством) комплексных чисел, а каждый его
элемент — комплексным числом.
Суммой Z\ + Z2 Двух комплексных чисел
Z[=(X[ty\) и 12={Х2>У2) называют
комплексное число
Z[+Z2={xhyl) + (x2,y2) =
= (х\ +*2.И+й)>
а произведением Z\Z2 этих комплексных чисел —
комплексное число
Ъ12={хьУ{)(х2,У2) =
= {Х[Х2-У\У2,Х\У2+Х2У\)'
Два комплексных числа (Х\9У{) и
{Х2>У2) считают равными, если Х\ = X2 и
У[ = У2 •
Операции сложения (4.1.1) и умножения
(4.1.2) обладают свойствами коммутативности
и ассоциативности, а умножение обладает
свойством дистрибутивности относительно
сложения.
Элемент О = (0,0) поля комплексных
чисел является нейтральным относительно
операции сложения, и его называют нулевым
элементом этого поля. Элемент (1,0)
является нейтральным относительно операции
умножения, и его называют единицей поля
комплексных чисел.
Особую роль играет комплексное число
(0,1), которое обозначают / и называют
мнимой единицей. Согласно (4.1.2), имеем
/2=(0,1)(0,1) = (-1,0),
i(y,0) = (0,l)(y,0) = (0,y).
Каждое комплексное число (х,0)eR
сопоставим с числом ХбК. Возникает взаимно
однозначное соответствие между множеством
R действительных чисел и множеством С
комплексных чисел вида (х, 0), при котором
сумме и произведению действительных чисел
отвечают сумма и произведение
соответствующих им комплексных чисел. Поэтому
каждое комплексное число вида (х,0)
отождествляют с действительным числом х.
Такое отождествление позволяет каждое
комплексное число (х, у) представить в виде
z = {x,y) = {x,0) + {0,y) =
= (дс,0) + (0,1)(з',0) = дс + /у.
Выражение z = х + iy называют
алгебраической (или декартовой) формой записи
(представления) комплексного числа (х, у).
При этом действительное число х называют
действительной частью комплексного числа Z
и обозначают Re z , а действительное число у
называют мнимой частью комплексного числа
Z и обозначают 1m z ■
Для сложения и умножения существуют
обратные операции: соответственно вычита-
ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА ЗАПИСИ КОМПЛЕКСНОГО ЧИСЛА
171
ние и деление. Разностью Z\ ~ Z2
комплексных чисел Zy и Zi называют такое
комплексное число г, для которого Z\ = Z + Zj-
Нетрудно убедиться в том, что при записи
комплексных чисел в алгебраической форме
вычитание выполняется следующим образом:
(*1 + '>!)" (*2 + iyi) = (*1 -х2) + ЦУ[-У2)-
(4.1.5)
Частным Z\/Z2 ДВУХ комплексных чисел Z\ и
%2 (*2 * 0) называется такое число z, для
которого Z\ = ZZ2- Записав числа в
алгебраической форме (Z\ = *i + iy\ , Z = х + iy ,
Z2= x2+ 1У2)» приходим к системе двух
линейных уравнений с двумя неизвестными:
х2х-у2у = х{,
У2х + х2у = уу.
2 2
Определитель системы А = х + у и
отличен от нуля при £2 * 0 . Поэтому система
имеет решение, и притом единственное. В
частном случае У2 =0 , т.е. когда делитель
является действительным числом, частное
Z[/Z2 получается делением на Z2 = х2
действительной и мнимой частей числа Z\ '•
Zi/x2=x[/x2+(y[/x2)i.
Алгебраическая форма записи удобна
для вычислений в комплексных числах. При
таких вычислениях с комплексными числами
в алгебраической форме можно обращаться
так же. как и с обычными алгебраическими
выражениями. Например, (2 + 3/)(3 - /) =
= 2 • 3 + (3/) -3-2-1 + (3i)(-i) = 6 + 9/ - 2/ -
-3/ = 6 + 7/ - 3/ . Учитывая, что / = -1,
окончательно получаем (2 + 3/)(3 - /) = 9 + 7/.
Элементы поля С комплексных чисел
можно отождествить с точками плоскости,
рассматривая действительную х и мнимую у
части комплексного числа х + /у как
координаты точки в некоторой фиксированной
прямоугольной системе координат Оху (рис. 4.1.1).
В этом случае плоскость хОу называют
комплексной плоскостью и обозначают либо
символом С (как и само поле), либо
заключенным в круглые скобки обозначением
комплексного числа: (z), (w). Произвольному
действительному числу х соответствует точка
У| С
гу\ --т
i
о| : 'х
I z-x-ixj
Рис. 4.1.1
(jc ; 0) комплексной плоскости, лежащая на
оси абсцисс, которую применительно к
плоскости С называют действительной (или
вещественной) осью. Чисто мнимому числу iy
соответствует точка (0; у) плоскости С,
расположенная на оси ординат, называемой в
данном случае мнимой осью.
Интерпретация комплексных чисел как
точек плоскости позволяет говорить о
геометрической форме представления комплексного
числа. Точки комплексной плоскости
обозначают так же, как и соответствующие
комплексные числа,, т.е. точку М(х;у) на
комплексной плоскости обозначают
комплексным числом Z = х + iy .
Числа Z = х + iy и z = х - iy называют
комплексно сопряженными. На плоскости С
им соответствуют точки, симметричные
относительно действительной оси (см. рис. 4.1.1.)
Сумма и произведение комплексно
сопряженных чисел являются действительными
числами, а разность — чисто мнимым числом:
z + z = 2х = 2 Re z,
ZZ=x2+y2, (4.1.6)
Z -Z= 2iy = 2/Imz.
Использование комплексно
сопряженных чисел позволяет упростить вычисление
частного двух комплексных чисел заменой
деления на комплексное число делением на
действительное число:
Z\ = *1*2 = *1*2 + У\У2 , i х2У\ - хху2
Z2 Z2Z2 х\ + у\ х\ + у\
z2*0.
(4.1.7)
4.1.2. Тригонометрическая форма
записи комплексного числа. Положение точки
на комплексной плоскости С можно
фиксировать не только декартовыми координатами
х и у (действительной и мнимой частями
комплексного числа), но и другими
координатами, например полярными координатами г
и ф, которые с декартовыми координатами
172
Глава 4.1. КОМПЛЕКСНАЯ ПЛОСКОСТЬ
связаны соотношениями х - г coscp, у=г sincp.
Если точка М на плоскости имеет полярные
координаты г и ф, то этой точке соответствует
комплексное число
Z - х + iy = r(cos (p + / sin (p). (4.1.8)
Такую форму записи комплексного числа
называют тригонометрической.
Полярными координатами точки,
изображающей комплексное число z, являются
полярный радиус г, равный расстоянию от
точки z до начала системы координат (или длине
радиус-вектора точки), и полярный угол <р,
равный углу между положительным
направлением оси Ох и радиус-вектором точки z (см.
рис. 4.1.2).
Полярные координаты г и <р точки,
изображающей комплексное число z на
комплексной плоскости, называют
соответственно модулем и аргументом комплексного числа и
обозначают \z\ и Arg z . Нетрудно увидеть,
что
\z\ = r = V*2 + У2>
tg(Argz) = tg(p = ^-.
х
(4.1.9)
При х = 0, у * 0 имеем мнимое число
Z = iy. В этом случае аргумент комплексного
числа имеет значения Arg z = — + 2nk,
я
keZ, при у > О и Argz = — + Ink при
у < 0. Поэтому второе равенство (4.1.9)
можно считать верным и при х = 0 , у * 0 . Для
комплексного числа z = 0 аргумент не
определен. Иногда этому числу приписывают
произвольное значение аргумента, так как это
позволяет в вычислениях избежать
дополнительных оговорок.
Модуль комплексного числа определен
однозначно, а аргумент — с точностью до
слагаемого, кратного 2л. Угол ф отсчитывают
так же, как в тригонометрии: положительным
направлением изменения угла считают
направление против часовой стрелки.
\УУ г
О
Рис. 4.1.2
Для модулей комплексных чисел Z\ и
Z2 справедливы неравенства
|*1+*2|£Ы + |*2|, 1*1-*2|ЧМ-|*2||.
(4.1.10)
Главное значение аргумента комплексного
числа, обозначаемое arg z , есть значение
аргумента комплексного числа,
удовлетворяющее условию
-ж arg ^ < я . (4.1.11)
Для каждого комплексного числа z * 0 главное
значение аргумента единственно. Так, argl =0 ,
arg(-3) = я, arg(-l + /) = Зя/4 , arg(-l -/) =
= - Зя/4 , arg(-/) = -я/2 . Очевидно, что
Argz = argz + 2kn, keZ. (4.1.12)
Иногда под главным значением
аргумента понимают то, которое попадает в
промежуток [0,2я) .
Главное значение аргумента
комплексного числа z = х + iy можно выразить
следующим образом:
arctg (>>/*), х>0;
я + arctg (у/х), х < 0 и у > 0;
arg z = \ -n + arctg (y/x), х < 0 и у < 0;
я/2, х = 0 и у>0;
-я/2, jc = 0 и ^<0.
(4.1.13)
Два комплексных числа, записанных в
тригонометрической форме, равны тогда и
только тогда, когда равны их модули, а
аргументы отличаются на слагаемое, кратное 2л
(или, что то же самое, равны главные
значения их аргументов).
Тригонометрическая форма записи
комплексных чисел удобна при их умножении и
делении. Действительно, при умножении
комплексных чисел их модули
перемножаются, а аргументы складываются:
Z\Z2 = r{r2 (cos(q>, + ф2) + /sin (q>, + (p2)).
(4.1.14)
При делении комплексного числа Z\ на
ненулевое комплексное число z2 делятся их
модули, а аргументы вычитаются:
& = -^(сс^ф, - ф2) + i sin (ф, - ф2)).
Z2 Г2
(4.1.15)
ТРИГОНОМЕТРИЧЕСКАЯ ФОРМА ЗАПИСИ КОМПЛЕКСНОГО ЧИСЛА
173
У сопряженных комплексных чисел
модули совпадают, а аргументы отличаются
знаком:
\t\ = \z\, ArgZ=-ArgZ. (4.1.16)
Отметим также важное тождество \zz\ = \z\ .
Простые правила умножения
комплексных чисел в тригонометрической форме
приводят к следующей формуле возведения
комплексного числа z в натуральную степень:
Zn = (r(cos (p + / sin (p))" =
= г" (cos жр + / sin жр)
(4.1.17)
Это соотношение называют формулой Муавра.
Из формулы Муавра вытекает
несложное правило извлечения корня л-й степени.
Если wn = Z , где z = r(cos ф + sin ф) и
w = p(cos # + / sin #), то
Р =
В итоге
2кп . . argz + 2kn
+ / sin —^
„Г . ф + 2А:я . j: г
Цг, -& = — , к = 0,п-\.
п
^=^fcos^±
Л: = 0» 1 /f — 1.
(4.1.18)
Соотношение (4.1.18) также называют
формулой Муавра.
Все п различных значений для yjz
имеют один и тот же модуль, а их аргументы
отличны на углы, кратные 2п/п. Значениям
yfz отвечают точки комплексной плоскости,
расположенные в вершинах правильного п-
угольника, вписанного в окружность радиуса
уг с центром в начале координат. При этом
риадиус-вектор одной из вершин образует с
осью Ох угол arg z/n •
Формулы Муавра возведения
комплексного числа в натуральную степень и
извлечения корня Ai-й степени можно объединить в
общую формулу возведения комплексного
числа в рациональную степень:
а а( margz + 2kn . . margz + 2kn\
zq =rq cos — + /sin ,
{ n n J
* = 0,l,...,/f-l.
(4.1.19)
Пример 4.1.1. а. Пусть z = l + Найдем
12
£ . Для этого запишем комплексное число z
в тригонометрической форме, вычислив
предварительно \z\ и arg z . Имеем
|г| = 7Г7з=2, argz = arctgV3=|
1\ cos— + /sin— .
I з 3j
,-4
Тогда согласно (4.1.17)
Z = 2IZ cos-— + / sin =
= 212 (cos An + / sin An) = 212.
б. Пусть Z = -l • Найдем tfz . Запишем z
в тригонометрической форме:
Z = -\= cos(rc + 2kn) + i sin(7i + 2kn).
В силу (4.1.18) запишем
а г 4ГТ n + 2kn . . я + 2А:я
yz =v-l =cos — + /sin .
4 4
Полагая А: = 0,1,2,3, выпишем все четыре
значения корня:
п . . к л/2 „ .ч
й = COS —+ IS1I1 —= —(1 + /),
4 4 2
я + 2я . . п + 2п л/2. , .ч
Z2=cos—-— + ism—-— = —(-1 + /),
4 4 2
п + Ак . . п + Ап л/2, . .ч
Z3=cos—— + /sm—— = —(-1-/),
^4 =COS-
4 4 2
я + 6я . . п + вп л/2
4
- + /S111-
—(1-0.
2 v '
Точки, изображающие эти комплексные
числа, являются вершинами квадрата и
расположены на окружности радиуса 1 с центром в
точке 2 = 0 (рис. 4.1.3)
,= £<-!*
*,= ^(1-н->
г3=Х("1_г)
Рис. 4.1.3
174
Глава 4.1. КОМПЛЕКСНАЯ ПЛОСКОСТЬ
4.1.3. Бесконечно удаленная точка.
Сфера Римана. Выберем в пространстве
прямоугольную систему координат 0£лх оси
О^ и Оц которой совпадают с осями Ох и Оу
системы координат Оху комплексной
плоскости (рис. 4.1.4), и рассмотрим сферу S
единичного диаметра
ew+u-\
4'
(4.1.20)
касающуюся плоскости С в начале
координат.
Каждому комплексному числу z = х + iy ,
изображаемому в плоскости С точкой
(х;у), поставим в соответствие точку
Z(^;t];x), в которой сфера S пересекается
лучом, соединяющим «северный полюс»
jV(0;0;1) сферы с точкой Z- Точку Z
называют сферическим изображением
комплексного числа Z ■ При такой геометрической
интерпретации комплексных чисел «южному
полюсу» сферы S соответствует комплексное
число Z = 0, ее «меридианам» — лучи
комплексной плоскости, исходящие из начала
координат и представляющие собой
множества комплексных чисел с одинаковым
значением аргумента, а «параллелям» —
окружности плоскости С с центром в начале
координат, т.е. множества комплексных чисел с
одинаковым значением модуля.
Соответствие между комплексными
числами и точками сферы S является взаимно
однозначным, причем каждая точка сферы
является изображением комплексного числа,
за исключением «северного полюса» N сферы.
Точка N не является сферическим
изображением какого-либо комплексного числа.
Условимся считать, что точка /V изображает
бесконечно удаленную точку z = °°- Комплексную
плоскость с добавленной точкой z = °°
называют расширенной комплексной плоскостью и
обозначают С . Сфера S дает геометрическое
*1Ш;0;1)
представление расширенной комплексной
плоскости, и ее называют сферой комплексных
чисел, или сферой Римана,
Декартовы координаты хну точки,
изображающей комплексное число Z = х + iy ,
связаны с координатами I;, т) и X
сферического изображения этого комплексного числа,
формулами:
$ =
■> Л =
х =
ж
4*1 4*1 4*1
1-х
1-х
(4.1.21)
(4.1.22)
Отметим, что бесконечно удаленную
точку используют только в геометрических
рассуждениях. В алгебраических операциях
она участвовать не может.
Отображение, ставящее каждому
комплексному числу в соответствие его
сферическое изображение, обладает важным
свойством: при этом отображении окружности на
комплексной плоскости переходят в
окружности на сфере Римана и, наоборот,
окружностям на сфере Римана, не проходящим через
«северный полюс», соответствуют окружности
на комплексной плоскости. Окружности на
сфере Римана, проходящие через «северный
полюс», являются изображениями прямых
комплексной плоскости.
4.1.4. Геометрия на комплексной
плоскости. Введем на множестве С евклидову
метрику
d(z\,z2) = \z2-zl\
(4.1.23)
Сферическое изображение комплексных чисел
позволяет ввести на комплексной плоскости и
иную метрику. В этой метрике, называемой
сферической метрикой, под расстоянием
р(*1»*2) между точками Z\,Z2e(E понимают
расстояние в R между их сферическими
изображениями. Это расстояние выражается
формулой
Р(*|,*2) =
\Zl~Z\\
f^^H2
(4.1.24)
Рис. 4.1.4
Введение каждой из двух метрик (4.1.23)
или (4.1.24) превращает С в метрическое
пространство. Важное отличие между двумя
метриками состоит в том, что сферическая
метрика определяет расстояние между произ-
ГЕОМЕТРИЯ НА КОМПЛЕКСНОЙ ПЛОСКОСТИ
175
вольной точкой z и точкой оо5 в то время
как с помощью евклидовой метрики такое
расстояние определить нельзя. Расстояние
p(Z,°°) выражается формулой
pfe~) = , ' , ■ (4-1.25)
т/ч?
Каждая из обсуждаемых метрик позволяет
ввести понятие е-окрестности U точки Zq •
Две метрики оказываются эквивалентными в
том смысле, что для любой евклидовой е-
окрестности U точки Zq*00 существует
сферическая 5-окрестность V точки Zq , целиком
содержащаяся в U, т.е. Vc U, и наоборот, для
любой сферической 5'-окрестности V точки
Zq ф оо существует евклидова е'-окрестность
U' этой точки, для которой (/' с Г.
Сферическая метрика позволяет ввести понятие е-
окрестности бесконечно удаленной точки —
множества \z е С: p(z,°°) < е} . Из формулы
(4.1.25) заключаем, что е-окрестность
бесконечно удаленной точки представляет собой
внешность круга радиуса Е с центром в начале
координат, где
£ = ^max{o,I-l}.
На расширенной комплексной
плоскости, как и в любом другом метрическом
пространстве, можно ввести такие понятия, как
внутренняя и граничная точка множества,
открытое и замкнутое множества и т.п.
Кратко опишем эти понятия.
Точка Zq£ M аС является внутренней
точкой множества М, если существует е-
окрестность этой точки, целиком включенная
в множество М. Множество М с С
открытое, если каждая точка Zo e M является
внутренней точкой М. Любое открытое
множество, содержащее данную точку ^о >
рассматривают как окрестность этой точки (в
широком смысле).
Точка. Zq является граничной точкой
множества М <zC, если в любой ее е-
окрестности есть точки как принадлежащие
М, так и не принадлежащие ему.
Совокупность всех граничных точек множества М
образует границу этого множества, обычно
ббозначаемую ЭМ . Точка z является
внешней точкой множества М, если у нее есть
окрестность, не пересекающаяся с М.
Точка Zq e С является предельной
точкой множества М с С , если в любой ее
окрестности есть точки множества Л/, отличные
от Zo . Предельные точки множества, как и
его граничные точки, могут принадлежать
множеству, а могут и не принадлежать ему.
Отметим, что предельная точка множества,
ему не принадлежащая, является граничной
точкой этого множества. Если множество М
содержит все свои предельные точки (или,
что то же самое, все свои граничные точки),
то такое множество называют замкнутым. Из
любого множества М можно получить
замкнутое множество М , присоединив к М все
его предельные (граничные) точки.
Множество М называют замыканием множества М .
Любое множество М с С само является
метрическим пространством с той же
метрикой, что и метрика, заданная в С. Поэтому
можно говорить о множестве F с М как об
открытом или замкнутом в М , рассматривая
F как подмножество метрического
пространства М . При этом множество F с М
является открытым в М, если любая точка
Zq£ F имеет такую е-окрестность £/(zo,e)>
что (б/(гь>б)ПА/)с F. Множество FaM
замкнуто в М, если его предельные
(граничные) точки, принадлежащие М ,
принадлежат и F . Каждое открытое (замкнутое)
множество в М можно представить как
пересечение с М некоторого открытого
(замкнутого) множества (в С).
Если множество F с М является
замкнутым в М , то его дополнение M\F
является открытым множеством в М. Если же
множество G с М открыто в М , то
множество М \G замкнуто в М .
Под кривой на плоскости С будем
понимать непрерывное отображение у:Т-*С
промежутка Т действительной оси в
комплексную плоскость С. Если Т = [а, р] —
отрезок, то точки А = у(а) и В = уф) будем
называть соответственно начальной и конечной
точками кривой. В этом случае кривую часто
обозначают ЛВ. Возрастание аргумента
вдоль промежутка задает направление обхода
этой кривой от начальной точки к конечной.
176
Глава 4.1. КОМПЛЕКСНАЯ ПЛОСКОСТЬ
Изменить направление обхода кривой можно,
заменив отображение y(t) отображением
у(-/), заданным на отрезке [-р,-ос]. Под
кривой на расширенной плоскости С будем
понимать отображение промежутка Т
действительной оси в С, непрерывное
относительно сферической метрики.
Отображение у:Г->С можно
представить в виде y(t) = x(t) + iy(t), где функции
действительного переменного x{t) и y(t)
определены на промежутке Т . При этом
непрерывность отображения y(t) означает,
что функции x(t) и y(t) непрерывны на
промежутке Т . Уравнение вида
Z = 7(0, teT,
называют комплексным уравнением кривой.
Если y(t) = x(t) + iy(t) , то комплексное
уравнение кривой можно преобразовать в
параметрические уравнения этой кривой на
комплексной плоскости:
\Х = ^' teT.
\y = y(t),
Две кривые, заданные уравнениями
£ = у,(0, /е[а,,р,],и г = Т2(т),те[а2,р2],
считают равными, а отображения Yi и Y2 ~
эквивалентными, если существует
действительная функция / = s(i), те [сх2,р2],
непрерывная и возрастающая на отрезке
[<х2,р2], такая, что $(<х2) = <ХЬ 5(р2) = Pi и
Yl (s(i)) = Y2(x), те [а2,р2]. Каждой из
равных кривых, очевидно, отвечает одно и то же
множество точек плоскости (z), а выбор
одной из этих кривых означает задание
конкретного параметра для кривой. Таким
образом, под кривой понимают не конкретное
отображение промежутка действительной оси
в комплексную плоскость, а некоторый класс
У
г
г
-г
(z)
[>
У
О
-г!
(г)
У,
г*
О
-г
(2)
t X
а) б) в)
Рис. 4.1.5
эквивалентных отображений. Переход от
одного отображения к другому, эквивалентному
исходному, представляет собой замену
параметра кривой.
Для любой кривой ЛВ с начальной
точкой Л и конечной точкой В параметр
можно выбрать так, что он будет меняться на
отрезке [0, 1]. В самом деле, если кривая ЛВ
определена как отображение у : [а, р] -> С ,
то можно заменить это отображение ему
эквивалентным отображением Yi(T) = Т(5(т))>
где / = s(i) = а + (р - а)т .
Если двум различным значениям t\ и
/2 параметра кривой y(t) соответствует одна
и та же точка комплексной плоскости (z),
т.е. y('i) = y{h) и h*h> то ЭТУ Т0ЧКУ
называют точкой самопересечения кривой. Кривую,
не имеющую точек самопересечения,
называют простой кривой, или кривой Жордана.
Кривая, у которой совпадают начальная и
конечная точки, является замкнутой (или
замкнутым контуром). Если у замкнутой кривой нет
других точек самопересечения, кроме
начальной (конечной) точки, то эту кривую
называют простым замкнутым контуром.
Пример 4.1.2. а. Кривая, заданная
уравнением z = / sin /, / е [- я/2, я/2], — это
отрезок мнимой оси, соединяющий точки
Z = -/ и z = i (рис. 4.1.5, а). Кривая имеет
направление от точки z = -/ (начальная
точка кривой) к точке z-i (конечная точка
кривой). Уравнение этой кривой можно также
записать в виде Z = it, /e [—1,1], или
Z = /(2/-l), /е [0,1].
б. Кривая, заданная уравнением
* = /sin/, /е[-я/2,Зя/2], представляет
собой тот же отрезок мнимой оси, проходимый
дважды: сначала от точки z = -/' к точке
Z = /, а затем от точки z = / к точке z = -/
(рис. 4.1.5, б). Хотя эта кривая и кривая из
пункта а определяют одно и то же множество
на плоскости (z), мы имеем две разные
кривые, так как ни одно представление первой
кривой не может быть сведено к
представлению второй заменой параметра.
в. Кривая, заданная уравнением
Z = Y(0 = cos/+ / sin /, / е [0,2я], — это
окружность \z\ = 1, проходимая против
часовой стрелки. У кривой совпадают начальная
Y(0) = 1 и конечная у(2п) = 1 точки
(рис. 4.1.5, в).
ГЕОМЕТРИЯ НА КОМПЛЕКСНОЙ ПЛОСКОСТИ
177
Кривую z = Y(0 = x(t) + />(/), teT
называют гладкой, если существуют
производные x\t) и У(/), непрерывные на
промежутке Т , одновременно не обращающиеся в
нуль, т.е.
Z'(t) = x'{t) + ix\t) * О, /6 Т.
У гладкой кривой в каждой точке существует
касательная к этой кривой, направление
которой меняется непрерывно при перемещении
точки по кривой (рис. 4.1.6, а).
Кривую называют кусочно гладкой, если
ее можно разделить на конечное число
гладких кривых. Кусочно гладкая кривая имеет
касательную во всех своих точках, кроме,
быть может, конечного числа точек. В этих
точках существуют односторонние
касательные, их называют угловыми (на рис. 4.1.6, б
угловой является точка М ).
Множество на расширенной
комплексной плоскости называют линейно связным,
если любые две его точки можно соединить
кривой, все точки которой принадлежат этому
множеству. Линейно связное открытое
множество называют областью. Таким образом,
все точки D являются внутренними, а любые
две точки области D можно соединить
кривой, целиком лежащей в D .
Понятие области можно рассматривать
как на комплексной плоскости, так и на
расширенной комплексной плоскости. Область в
комплексной плоскости в то же время есть
область в расширенной комплексной
плоскости, но область в расширенной комплексной
плоскости может содержать бесконечно
удаленную точку и выходить за пределы
комплексной плоскости. Чтобы такая область
стала областью комплексной плоскости,
достаточно из нее удалить точку <*>.
Области в комплексной плоскости
можно разделить на ограниченные области и
неограниченные. Область D ограниченная, если
существует такой круг К = [z e С : \z\ < R},
что D с К.
В С существует единственная область,
не имеющая границы, — вся расширенная
комплексная плоскость. Во всех остальных
случаях область имеет границу. Область D,
объединенная со своей границей,
представляет собой замкнутое множество D, которое
называют замкнутой областью. Обратим
внимание на то, что замкнутая область и область —
разные и в некотором смысле
противоположные понятия: единственное множество,
которое одновременно является и областью, и
У
О
<^м
/а
У-
X
У
О
м
ГУ
У
X
а)
б)
Рис. 4.1.6
замкнутой областью, — это расширенная
комплексная плоскость, так как она не имеет
границы. Отметим, что замкнутая область
является замкнутым множеством, но
существуют замкнутые множества, не являющиеся
замкнутой областью (например, любое
замкнутое множество, не имеющее внутренних
точек, не является замкнутой областью).
Область может не иметь внешних точек,
и можно привести много подобных примеров.
Так, областью без внешних точек является
расширенная комплексная плоскость без
отрезка [-1, 1] действительной оси, или, как
говорят, область С с разрезом по отрезку
[-1, 1]. В общем случае под разрезом области
понимают любую простую кривую в этой
области, точки которой удаляются из области.
Отметим, что в результате разреза области
получается снова область, если либо
начальная, либо конечная точка лежит внутри
области. Разрез может соединять две граничные
точки области. В этом случае исходная
область распадается на две области,
расположенные по разные стороны разреза.
Французский математик К. Жордан
(1838-1922) показал, что любая простая
замкнутая кривая на комплексной плоскости
делит ее на две не пересекающиеся области:
первая не ограничена, ее называют внешней
по отношению к кривой {внешностью кривой),
а вторая ограничена, ее называют внутренней
по отношению к кривой {внутренностью
кривой). Для обеих этих областей кривая является
границей.
Область D на комплексной плоскости
называют односвязной, если она обладает
следующим свойством: для любой простой
замкнутой кривой, лежащей в D, внутренность
этой кривой также целиком принадлежит D
(рис. 4.1.7). Область, не обладающую
указанным свойством, называют многосвязной.
Рис. 4.1.7
178
Глава 4.1. КОМПЛЕКСНАЯ ПЛОСКОСТЬ
Рис. 4.1.8
Например, область, внутренняя по отношению
к многоугольнику, является односвязной, а
внешность того же многоугольника есть
многосвязная область, так как окружность
достаточно большого радиуса будет целиком
лежать во внешности многоугольника, но
ограниченный этой окружностью круг
содержит также и внутренность многоугольника.
Граница области может иметь сложную
структуру, но на практике, как правило,
работают с областями с простой границей,
которая состоит из конечного числа кусочно
гладких кривых и изолированных точек.
Допускается также наличие разрезов. В этом случае
один или несколько контуров,
ограничивающих область, не являются простыми.
Пусть на комплексной плоскости даны
простые замкнутые кривые Q, С2, ••-, Сп ,
причем кривые С2, ..., Сп попарно не
пересекаются и все лежат внутри Q. Множество
точек плоскости, расположенных внугри Q и
вне С2, ...,С„, представляет собой
многосвязную область D, границу которой
составляют контуры Q, С2, ..., Сп . При этом
контур С| называют внешней границей
многосвязной области, а совокупность контуров
С2, ..., Сп — внутренней границей
многосвязной области. Область D указанного вида
часто называют п-связной Для контуров
Cj, C2, ..., Сп , ограничивающих
многосвязную область, часто фиксируют направление
обхода. Положительным обходом границы
области называют такое движение по границе,
при котором область все время остается слева.
Для внешней границы такой обход
противоположен движению часовой стрелки, а для
контуров внутренней границы
положительный обход соответствует движению по ходу
часовой стрелки. Движение в
противоположном направлении называют отрицательным
обходом границы. Границу многосвязной
области с положительным ее обходом часто
называют составным контуром.
Пример 4.1.3. а. Для области D = {ze С:
0 < \z - а\ < е} границей являются точка
Z = а и окружность \z - а\ - е . Эту
ограниченную двусвязную область называют кругом
радиуса е > 0 с выколотым центром —
точкой а , или проколотой в-окрестностью точки
а е С . Положительным обходом этой области
является движение по окружности \z - а\ = £
против часовой стрелки (рис. 4.1.8)
б. Область D = [z е С : 0 < \z\ < 1, arg z e
б (-я, я)} изображена на рис. 4.1.9. Она
является кругом \z\ < 1 с разрезом по отрезку
действительной оси, соединяющему точки
Z = -1 и 2 = 0. Граничная кривая этой
односвязной области состоит из следующих
частей (с учетом положительного обхода
области): отрезка [-1,0] действительной оси,
проходимого от точки z = 0 до точки z = -1
(нижний берег разреза); окружности \z\ = 1 ,
проходимой от точки z = -1 против часовой
стрелки до той же точки; отрезка [-1,0]
который проходится вторично, но уже от точки
Z - -1 до точки z = 0 (верхний берег разреза).
в. Граница области D = [z е С :
1 < \z\ < 2} состоит из двух кривых:
окружности \z\ = 2 , при положительном обходе
области проходимой против часовой стрелки, и
окружности \z\'= 1, проходимой при таком
обходе по часовой стрелке (рис. 4.1.10). Эта
область является двусвязной.
На расширенной комплексной
плоскости понятие односвязности (многосвязности)
области изменяется. Область D расширенной
комплексной плоскости считают односвязной,
если для любой простой замкнутой кривой,
лежащей в D, области целиком принадлежит
одна из областей, ограниченной этой кривой.
Так, внешность многоугольника, будучи
многосвязной (двусвязной) на комплексной
плоскости, становится односвязной на
расширенной комплексной плоскости. Точно так
ЗАДАНИЕ МНОЖЕСТВА ТОЧЕК НА КОМПЛЕКСНОЙ ПЛОСКОСТИ
179
же внешность круга радиуса R не является
односвязной на плоскости, но становится
односвязной на расширенной комплексной
плоскости. Односвязной на расширенной
плоскости будет и область D = {z е С : z * я} ,
т.е. вся расширенная комплексная плоскость
с выколотой точкой z = о . Многосвязными
на расширенной комплексной плоскости
являются, например, С с выколотыми точками
Z\ =1 и Zi = / и С с разрезами по двум
отрезкам, соединяющим пары точек z = 0 ,
Z = 1 и Z - /, Z = 2/ .
Отметим, что область, односвязная на
комплексной плоскости С, остается
односвязной и на расширенной комплексной
плоскости С.
4.1.5. Задание множества точек на
комплексной плоскости. Множества
комплексных чисел можно описывать как
множества (комплексной плоскости), описывая их с
помощью системы уравнений и неравенств, в
которые входят переменные координаты х и
у точки комплексной плоскости. Такие
уравнения и неравенства легко преобразовать
в комплексные, в которые вместо переменных
х и у входит комплексное переменное z •
Действительно, достаточно в уравнениях
и неравенствах выполнить замену
z + z if z-z D
х = , у = . Во многих случаях
комплексные уравнения и неравенства,
описывающие заданное множество, можно
получать непосредственно, опираясь на
геометрический смысл алгебраических понятий,
связанных с комплексным числом:
Ы — расстояние точки z e С от начала
координат;
к ~ £о| ~~ расстояние между точками z
и го;
Argz — угол, образованный радиус-
вектором точки Z с положительным
направлением оси Ох\
arg(z-Zo) ~ Угол> образованный
вектором, идущим из точки Zq в точку z , с
положительным направлением оси Ох,
причем этот угол удовлетворяет условию
-n<arg(z-Zo)<n.
Дальнейшее изложение построим на
примерах.
Пример 4.1.4. Установим множества точек
наг плоскости С, определяемые следующими
условиями: a) Re(/^2)<2; б) \z - 1| < \z - i\;
в) |z-2|-|* + 2|>3; г) arg(* -1) < я/4 ;
д) argz>|z|.
а. Полагаем z - х + iy . Тогда
iz2 = ilx2 + 2ixy - у2\ = -2ху + i(x2 - у2).
Следовательно, условие Re I/ z I < 2
эквивалентно неравенству -2ху < 2 , или ху > -1 .
Это условие определяет множество точек,
расположенных между ветвями гиперболы
ху - -1 . Соответствующая этому множеству
часть комплексной плоскости (z) на
рис. 4.1.11 выделена (штриховой линией
отмечена та часть границы множества точек,
которая этому множеству не принадлежит).
б. Множество точек, заданное
соотношением \z - l| < \z - /|, можно установить из
геометрического смысла неравенства. Дело в
том, что \z - l| — расстояние между точками
Z и 1, a \z - /| — расстояние между точками
Z и / . Известно, что на плоскости
геометрическим местом точек, равноудаленных от
двух заданных точек Z\ и Zi , является
прямая, которая проходит через середину
отрезка, соединяющего точки, и перпендикулярна
к этому отрезку. В данном случае Z\ - 1 и
Zi = i'. Точки, находящиеся на этой прямой,
удовлетворяют условию |z-l|=|z-/|, ее
уравнение у = х. Нас же интересуют точки
Z , расположенные ближе к точке z - 1, чем
к точке z = ' • Значит, множество,
удовлетворяющее условию \z - l| < \z - /|, имеет вид
{Z = x + iy\y<x}.
Г' '.
Рис. 4.1.11
шш
'///////4%/ш//'/х/'''' z^-~
Ш'&^- х
180
Глава 4.1. КОМПЛЕКСНАЯ ПЛОСКОСТЬ
Рис 4.1.12
Тот же результат можно получить, если,
как и в предыдущем случае, использовать так
называемый аналитический подход. Положим
Z = х + iy . Тогда
\z-l\ = J(x-lf + y
|,-/| = ^2+(у-1)2
и условие z - 1 < |г - /| приводит к
неравенству
^х-1)2+?<^+(у-1)2,
упрощая которое получаем у < х. На
рис. 4.1.12 искомое множество выделено.
в. По условию разность расстояний от
точки z , принадлежащей искомому
множеству, до точек Z\ = 2 и Zi = -2 должна быть
не меньше чем 3. Напомним, что множество
точек z , удовлетворяющих условию
\z ~ ^l| ~ \% ~ £г| = 2^, представляет собой
ветвь гиперболы с фокусами Z\ и Zi, причем
ту, которая ближе к фокусу Zj • Итак,
множество точек, для которых \z - 2| - \z + 2| = 3 ,
У'
\Г\ 2г
\ \ г
Г MlH "jV| * %1
-2 1 -1 /
ж * ""*
/' _2г
\ (2)
0 х
представляет собой левую ветвь гиперболы с
фокусами в точках Z\ - 2 и Zj - ~2 ,
действительной полуосью а , определяемой из
равенства 2а - 3, и расстоянием с = 2 каждого
из фокусов до центра гиперболы в начале
координат. Уравнение этой гиперболы
2 2
где а = 3/2 и Ь = Vc -a = V7/2 . Искомое
множество точек соответствует части
плоскости (z) , выделенной на рис. 4.1.13 (в данном
случае точки, лежащие на левой ветви
гиперболы, принадлежат искомому множеству, и
поэтому его граница отмечена на рис. 4.1.13
сплошной линией).
г. Величина arg(z - /) равна углу,
который вектор, идущий из точки £q = / в точку
Z , образует с положительным направлением
оси Ох. Поэтому точки z , удовлетворяющие
условию arg(z - /) = я/4 , лежат на луче,
выходящем из точки Zq = / под углом я/4 к оси
Ох. Учитывая ограничение -я < arg(z - /) на
главное значение аргумента комплексного
числа, получаем искомое множество точек
плоскости (z) (рис. 4.1.14).
д. Заданное условие arg z > \z\
определяет ограничение на угол (р, образованный
радиус-вектором точки z с положительным
направлением оси Ох: ф > г > 0 , где г —
модуль комплексного числа z (полярный
радиус точки z )• Соотношение г = ф
представляет собой в полярных координатах
уравнение архимедовой спирали. Архимедова спираль
является траекторией точки, которая движется
с постоянной скоростью по лучу,
вращающемуся с постоянной угловой скоростью вокруг
начала координат. При этом скорость
движения точки по лучу и угловая (в радианах)
скорость вращения луча совпадают. Искомое
множество точек изображено на рис. 4.1.15.
yf
. ...k**«4«i-
У* (2)
,$ , >>'&
-л
4^
Рис. 4.1.13
Рис 4.1.14
Рис. 4.1.15
ПОСЛЕДОВАТЕЛЬНОСТИ КОМПЛЕКСНЫХ ЧИСЕЛ
181
Глава 4.2
ПОСЛЕДОВАТЕЛЬНОСТИ И РЯДЫ
КОМПЛЕКСНЫХ ЧИСЕЛ
4.2.1. Последовательности
комплексных чисел. Последовательность {zn}
комплексных чисел можно рассматривать как
отображение в С множества натуральных чисел
N (иными словами — как функцию целого
положительного аргумента п , принимающую
комплексные значения zn - f{n), п е N ).
Как и в случае действительных чисел,
последовательность \zn) будет задана, если известно
правило / , которое позволяет найти любой ее
элемент ^„бС по его номеру п . Это
правило чаще всего задают при помощи формулы,
устанавливающей зависимость значения л-го
элемента последовательности от его номера
(например, zn - in, Zn = i/n и т.п.).
Комплексное число а называют
пределом последовательности [zn\ комплексных
чисел и записывают lim zn = a , или zn —> о
при п -> ©о f если для любого е > 0 можно
найти натуральное число N , такое, что при
п > N все элементы последовательности
попадают в е-окрестность точки а . Если
последовательность комплексных чисел имеет
предел, то эту последовательность называют
сходящейся, иначе расходящейся. Если предел
последовательности комплексных чисел равен
нулю, то эту последовательность называют
бесконечно малой. Отметим, что
последовательность комплексных чисел {zn} является
бесконечно малой тогда и только тогда, когда
бесконечно малой является
последовательность действительных чисел Ц^|}-
Определение предела
последовательности {zn} комплексных чисел формально
такое же, как и определение предела
последовательности действительных чисел. Более того,
предел последовательности комплексных
чисел можно рассматривать как частный случай
предела последовательности комплексных
чисел. Предел последовательности
комплексных чисел можно также интерпретировать как
предел последовательности элементов
двумерного линейного арифметического
пространства Ш . Для предела
последовательности комплексных чисел сохраняются обычные
свойства предела (единственность предела,
предел суммы, разности, произведения,
частного, теорема о связи последовательности,
предела и бесконечно малой и т.п.).
Сохраняются и основные свойства бесконечно
малых последовательностей.
Последовательность комплексных чисел
[zn] можно разделить на две
последовательности действительных чисел: последовательность
{Re£„} действительных частей и
последовательность {Imz/7} мнимых частей.
Последовательность {zn}, Zn = xn + iyn имеет своим
пределом комплексное число а = а + /р в
том и только в том случае, когда
последовательности {хп} и [уп] имеют своими
пределами соответственно числа аир.
Последовательность {zn} комплексных
чисел называют стремящейся к бесконечности
или бесконечно большой, если для любого
числа Е > О существует такой номер
N = N (Е), что при n>N выполняется
неравенство \zn\ > Е. В этом случае пишут
lim zn = °° или zn -> °° при п -> °о.
Неполное
средственно из сформулированного
определения вытекает, что следующие условия
эквивалентны:
1) последовательность {zn} бесконечно
большая;
2) последовательность ^\zn\\ бесконечно
большая;
3) последовательность {\/zn\
бесконечно малая.
Как и в случае последовательности
действительных чисел, можно сформулировать
критерий Коши сходимости
последовательности комплексных чисел: для сходимости
последовательности {zn} комплексных чисел
необходимо и достаточно, чтобы она была
фундаментальной, т.е. для любого е > 0
должен существовать такой номер /V = /V(e) ,
что при любых п > N и т> N будет
выполнено неравенство \zn - Zm\ < £ .
Последовательность {zn} комплексных
чисел называют ограниченной, если существует
182
Глава 4.2. ПОСЛЕДОВАТЕЛЬНОСТИ И РЯДЫ КОМПЛЕКСНЫХ ЧИСЕЛ
номеров п , т.е. все комплексные числа zn
расположены в замкнутом круге |^| < М
радиуса М с центром в точке z = 0 .
Из геометрической интерпретации
предела последовательности комплексных чисел
вытекает, что всякая сходящаяся
последовательность ограничена. Обратное утверждение,
вообще говоря, неверно. Однако, как и для
последовательностей действительных чисел,
имеет место теорема Больцано-Вейерштрасса:
из любой ограниченной последовательности
можно выделить сходящуюся
подпоследовательность.
С последовательностью {zn}
комплексных чисел можно связать последовательность
§Zn\} модулей и последовательность {arg£/7}
аргументов этих чисел. Относительно этих
последовательностей можно сформулировать
следующие свойства:
1) если lim z„ = а, то lim \z„\ = \o\;
2) если zn = rn (cos(p„ + /sinФ/7), п е N,
причем lim rn = р и lim ф„ = Ф, то
lim zn = p(cosfl + /sinfl).
Бесконечно большие
последовательности обладают следующими свойствами:
1) если lim zn = °° и lim wn = а * °s
л—»«> /i—»°°
то lim (zn + wn) = оо и lim (w„/zn) = 0.
/1-»оо /1—>оо
2) если lim zn = °° и lim wn =a, где
/1—»оо /!—»«>
а* 0 и а * оо5 то lim (z„ww) = «> и
/1—>°°
Iim(*/i/w/i) = °°-
/1—>°°
4.2.2. Комплексные числовые ряды.
Пусть дана последовательность комплексных
димый признак сходимости: если ряд /tZn
чисел {zn}• Символ Vz„ называют ком-
плексным числовым рядом. Значения
п
Sn = 2_.Z/c называют частичными суммами
к=[
ряда. Если последовательность частичных
сумм комплексного ряда сходится, то этот ряд
называют сходящимся, а предел
последовательности частичных сумм — суммой ряда.
Если последовательность частичных сумм не
сходится, то ряд называют расходящимся. Для
сходящихся комплексных рядов верен необхо-
п=1
сходится, то zn -> 0 при п -> 0 .
Каждому комплексному ряду ;Г Zn,
/i=l
Zn = xn + iyN можно поставить в соответствие
два действительных ряда У\хп У^Уп • Из
/i=l /;=1
свойств последовательности частичных сумм
вытекает, что сходимость комплексного ряда
равносильна сходимости обоих
действительных рядов.
Ряд > Zn называют абсолютно сходя-
л=1
щимся, если сходится ряд Vk/7| ■ Абсолютно
/i=l
сходящийся комплексный ряд является
сходящимся, т.е. условие абсолютной сходимости
более сильное, чем условие простой
сходимости. Если ряд сходится, но не является
абсолютно сходящимся, то его называют условно
сходящимся рядом. Для абсолютной
сходимости комплексного ряда необходимо и
достаточно абсолютной сходимости рядов из
действительных и мнимых частей.
Исследование комплексного ряда на
сходимость целесообразно начать с его
проверки на абсолютную сходимость, например,
при помощи признака Даламбера или радикал-
ного признака Коши. Если ряд не сходится
абсолютно, то он может сходиться условно.
Поэтому необходимо продолжить исследование ряда.
В этом случае может быть полезным
разделение ряда на действительные и мнимые части.
4.2.3. Степенные ряды. Пусть {сп} —
некоторая последовательность комплексных
чисел. Ряд вида
£ся(*-*ьЛ
(4.2.1)
//=0
где Z — комплексное переменное, называют
комплексным степенным рядом. При этом
комплексные числа сп называют
коэффициентами этого степенного ряда. В частном
случае Zq =0 получаем степенной ряд
п=0
(4.2.2)
КРУГ СХОДИМОСТИ
183
Комплексный степенной ряд является
частным случаем функционального ряда.
Сходимость такого ряда зависит от того, какое
значение приняло комплексное переменное.
Свойства сходимости функционального ряда
характеризуют такими множествами, как
область сходимости (абсолютной, условной
сходимости) ряда, т.е. множество точек
комплексной плоскости, для которых ряд
сходится (абсолютно, условно).
Для степенных рядов область
сходимости представляет собой открытый круг, к
которому, возможно, добавлена часть границы
круга. Такой круг называют кругом
сходимости степенного ряда, а его радиус R —
радиусом сходимости степенного ряда. Такое
свойство степенных рядов вытекает из
следующей теоремы Абеня. Если степенной ряд
z\cn{z ~ Zo)n сходится в некоторой точке
п=[
^*gC, z* * -So у то он сходится абсолютно во
всех точках z , удовлетворяющих неравенству
I* - *о| < |z* - *о| •
4.2.4. Круг сходимости. Отметим
прежде всего, что ряд Vc/7(z- Zq)" сходится в
/7=1
точке £о независимо от того, какие у него
коэффициенты. Существуют степенные ряды,
для которых эта точка является единственной
точкой сходимости. Для таких рядов радиус
сходимости равен нулю. Существуют
степенные ряды, которые сходятся в любой точке
комплексной плоскости. Для таких рядов
радиус сходимости бесконечен. В остальных
случаях радиус сходимости степенного ряда —
конечное положительное число.
Круг сходимости степенного ряда дает
важную информацию об области сходимости
этого ряда, но не позволяет определить
область сходимости точно: в точках окружности,
ограничивающей круг сходимости, степенной
ряд может и сходиться (в том числе,
абсолютно), и расходиться. Поэтому исследование
степенного ряда на сходимость включает два
этапа: определение круга сходимости и
исследование степенного ряда на границе круга
сходимости. При исследовании степенного
ряда на сходимость в точках границы круга
сходимости необходимо учесть следующее.
Если R — радиус сходимости степенного
ряда 2\сп {z ~ Zo) » то во всех точках
гранили
цы круга сходимости, т.е. при \z - Zq\ = Я,
ряд из модулей имеет один и тот же вид
Vlc^l^". Поэтому если степенной ряд схо-
дится абсолютно хотя бы в одной точке на
границе круга сходимости, то он сходится
абсолютно в остальных точках границы круга
сходимости. Если хотя бы в одной точке на
границе круга сходимости не выполняется
необходимый признак сходимости, т.е.
последовательность
{Ы*1
не стремится к нулю,
то необходимый признак не выполняется во
всех остальных точках на границе круга
сходимости, и область сходимости степенного
ряда совпадает с кругом сходимости
\z-Zo\< R-
Чтобы определить круг сходимости
комплексного степенного ряда, можно применить
к ряду из модулей признак Даламбера или
радикальный признак Коши, рассматривая
комплексное переменное как параметр. Для
вычисления радиуса сходимости можно также
использовать формулу Коши — Адамара
R
1
lim »\\сп
(4.2.3)
Формулу Коши — Адамара можно
получить, исходя из радикального признака Коши.
К аналогичной формуле можно прийти,
используя признак Даламбера. Пусть все
коэффициенты сп степенного ряда отличны от
нуля (по крайней мере, начиная с некоторого
номера). Тогда для радиуса сходимости R
степенного ряда верна формула
R= lim
Л-»оо
с«+1
(4.2.4)
где предполагается, что предел в равенстве
справа существует.
Пример 4.2.1. Найдем круг сходимости
у. (г-2/)"
степенного ряда > — и исследуем
этот ряд на сходимость в точках Z\ - 1 + /,
£2=3 + 2/ и Z3 = 5/.
Так как
.|Л+1 .
17 — /J
lim
»->~3"+1(rt + l)|z-2/f 3
\z-2i]n+l3nn _\z-2i\
184
Глава 4.2. ПОСЛЕДОВАТЕЛЬНОСТИ И РЯДЫ КОМПЛЕКСНЫХ ЧИСЕЛ
то, согласно признаку Даламбера, степенной
ряд сходится абсолютно при \z - 2/j < 3 и
расходится при \z ~ 2/j > 3. Следовательно,
круг \z - 2/j < 3 является кругом сходимости
рассматриваемого степенного ряда.
Для точки Z[ имеем \z\ - 2/j = |l + /j =
= V2 < 3, т.е. эта точка попадает в круг
сходимости. Следовательно, в точке Z\ ряд
сходится абсолютно.
Точки Z\ и Zi расположены на границе
круга сходимости, и поведение степенного
ряда в этих точках нужно исследовать
отдельно. В точке Zj = 3 + 2/ получаем числовой
ряд
у (3 + 2/ - 2/)" _ у 1
/1=1 J п л=1 "
т.е. гармонический ряд, который, как известно,
расходится. Таким образом, степенной ряд в
точке £| = 3 + 2/ расходится. В точке Zi = 5/
имеем числовой ряд
у (5/ - 2/)" _ у (3/)" _ у /"
П=[ J П /1=1 J П /7=1 "
Этот ряд сходится условно, т.е. исходный
степенной ряд в точке Zi - 5/ сходится
условно,
4.2.5. Двусторонний степенной рад.
Рассмотрим ряд
Областью сходимости ряда (4.2.5)
является внешность круга \z~ Zjq\>^/R,
дополненная некоторым множеством точек на
границе этого круга (возможно, пустым).
В теории функций комплексного
переменного часто возникает необходимость
рассмотрения степенных рядов, в которых
присутствуют как положительные, так и
отрицательные степени Z~ Zq , причем и тех и
других бесконечное количество. Такой ряд
называют двусторонним степенным рядом. Его
можно разделить на два самостоятельных
ряда, первый с неотрицательными степенями
Z~Zq, а второй — с отрицательными
степенями Z - Zq- Такое разделение аналогично
разделению несобственного интеграла по
промежутку (-ooj+oo) на два независимых
несобственных интеграла. Другими словами, будем
считать, что
X с/|(*-*Ь)Я=Х
=i{z-Zo)
z-zo
c-l
у с-п
~{(z-zq) z-Zq '
C_2 C_n
+ *—2" + ... + *_ + ...,
{z-zo) {z-zof
(4.2.5)
содержащий целые отрицательные степени
Z - Zq • Сделав подстановку \/(z~ Zq) = w>
получим степенной ряд с общим членом
C-nwn. Если R — радиус сходимости этого
степенного ряда, то для всех точек z ,
удовлетворяющих неравенству \z - Zq\ > \/R ,
исходный ряд (4.2.5) будет абсолютно сходящимся.
При \z - Zq\ < \/R этот ряд будет расходиться.
В точках Z на окружности \z - Zq\ = tyR РЯД
может как сходиться, так и расходиться.
+J;Cn{z-Z*)n=...+-±*—
«=0 (Z-Zq)
+с0 + с{ (z - Zo) +... + сп (z - zo)" + -
(4.2.6)
Ряд (4.2.6) называют сходящимся в точке
Z , если в этой точке сходятся оба
составляющих его ряда. Пусть часть степенного
ряда (4.2.6) с неотрицательными степенями
имеет круг сходимости \z - Zq \< R, а часть
этого ряда с отрицательными степенями
сходится во внешности круга \z - Zq \> г и
расходится в круге \z - Zq \< Г- Тогда:
1) при г > R двусторонний степенной
ряд (4.2.6) расходится всюду;
2) при г < R двусторонний степенной
ряд сходится в кольце г < £ - Zq < ^ и
расходится вне этого кольца, т.е. в круге
\Z ~ Zq\< Г и внешности круга \z - Zq > R-
Кольцо г < \z - Zq\ < R называют
кольцом сходимости степенного ряда. Кольцом
сходимости степенного ряда в частном
случаем может быть:
а) внешность окружности \Z ~ Zq\ - г,
если г > 0, R = oo;
ОПРЕДЕЛЕНИЕ И ГЕОМЕТРИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ФУНКЦИИ ПЕРЕМЕННОГО 185
б) проколотый круг (круг с выколотым
центром) 0 < \z - Zq\< R, если г - О,
О < R < -Юо;
в) проколотая плоскость (плоскость с
выколотой точкой) \z - Zq\> 0, если г = О,
R = ©о.
Пример 4.2.2. Определим кольцо
сходимости ряда
у 2"-1 , у(г + 1)"
£(* + !)" h (/ + /!)"'
Отрицательную часть двустороннего
степенного ряда исследуем с помощью признака
Даламбера:
(2--1)|г + 1Г
lim г-, - =
"*-\z + l\n+{(2n-\)
1 ,. 2-1/2" 2
lim
При
z +
|г + 1|и-*-1-1/2" |г + 1|'
< 1, т.е. при \z + l| > 2,
рассматриваемый степенной ряд сходится абсолютно,
а при |я + 1| < 2 — расходится.
Неотрицательную часть двустороннего
степенного ряда исследуем с помощью
радикального признака Коши:
lim n
Z + \
J' + Ч
= \z + l| lim
: hrnj^
«->«. / + п\
1
Vl+«2
0.
Это означает, что отрицательная часть
двустороннего ряда сходится абсолютно при
\Z + 1| > 0.
Итак, кольцом сходимости
двустороннего ряда является внешность круга
\z +1| > 2.
Глава 4.3
ФУНКЦИИ КОМПЛЕКСНОГО
ПЕРЕМЕННОГО
4.3.1. Определение и геометрическое
представление функции комплексного
переменного. На множестве /)сС задана
функция комплексного переменного z , если
задан закон / , по которому каждой точке
ZS D поставлено в соответствие
единственное комплексное число w e С. В этом случае
говорят также, что / является комплексно-
значной функцией на D, и пишут
/ : D -> С, или w = f(z), z € D с С.
Основные понятия теории функций
комплексного переменного являются
обобщением соответствующих понятий теории
функций действительного переменного.
Для функций f(z) и (p(z), Z£ D на
множестве D определена сумма / + ф,
разность / - ф, произведение /ф и частное
//ф, если ф(г) * 0, z e D.
Функцию / : D -> С называют
ограниченной на D, если множество R (/) ее
значений ограничено, т.е. если существует такая
константа М > 0 , что \f(z)\ < М, zs D.
Функцию комплексного переменного
можно рассматривать как отображение из R
2
в R , т.е. как пару функций двух
действительных переменных. Если z = х + iy и
w = и + iv, то функцию w = f(z) можно
представить в виде и(х,у) +iv(x,y), где
и(х,у) - Ref(z) — действительная часть, а
v(x,y) - lm f(z) — мнимая часть функции
w = f(z).
Функцию комплексного переменного
можно представить как график отображения
из R в R , но это неудобно, так как такой
график не является наглядным. В качестве
вспомогательных средств исследования
функции комплексного переменного f(z)
используют графики действительнозначных
функций Re f(z), Im/(z), |/U)|,
2
Arg/(z). Кроме того, отображение из R в
2
R — это преобразование плоскости.
Наглядное представление такого преобразования
можно получить, выбрав некоторую сетку
кривых в плоскости (z) и изобразив сетку
образов этих кривых в плоскости (и>).
Пример 4.3.1. Рассмотрим функцию
w = z2 • Полагая z = А*(со5ф + /sin ф) и
w = p (cos ft + / sin ft), получаем
ft = 2ф.
(4.3.1)
186
Глава 4.3. ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
У,
Уч
О
-Уо
1 (*)
X
w=z-
u + yl
V
2j>0
(рис. 4.3.1). Образом
произвольной вертикальной прямой х - Xq
является кривая, описываемая параметрическими
уравнениями и = Xq - у , v = 2х$у, у е R.
Исключив из параметрических уравнений
параметр .V, снова приходим к уравнению
Рис. 4.3.1
2
Отсюда следует, что при отображении w = z '
а) окружность г = /q переходит в ок-
2
ружность р = г0 ;
б) луч 0 < г < оо5 ф = фо, переходит в
луч 0 < р < °s ф = 2ф0.
Таким образом, преобразование плоско-
2
сти, определяемое функцией w - z ,
преобразует сетку из концентрических окружностей
с центром в начале координат и лучей,
выходящих из начала координат, в такую же сетку,
но при этом любой луч, составляющий с
действительной осью угол фо, поворачивается
против часовой стрелки на угол фд.
Иной вид имеет образ сетки, состоящей
из горизонтальных и вертикальных прямых.
2
Полагая z - х + iy, получаем w = (х + iy) =
= (х2 - у2 J + lixy. Следовательно, Re/(z) =
= и(х,у) = х2- у2, \mf(z) = v(x,y) = 2ху.
Из вида функций и(х,у) и v(x,y)
заключаем, что образом произвольной прямой у = у$
на плоскости (z) является кривая, которая
описывается параметрическими уравнениями
и- х - у0, v = 2ху0, xeR, в которых
параметром является переменное х.
Нетрудно убедиться в том, что эта кривая есть пора-
бола, так как, исключив х, получим
(г)
W = Z"
параболы Xq
2*0 J
(рис. 4.3.2).
В общем случае, если на плоскости (z)
кривая Г задана уравнением F(x,y) = 0, то
для нахождения уравнения кривой Т в
плоскости (w), на которую функция
w = f(z) = и(х,у) + iv(x,y) (4.3.2)
отображает кривую Г, нужно исключить х и
у из соотношений
F{x,y) = 0,
и = и(х,у),
v = v(x,y),
после чего получим уравнение вида
Ф(и,а) = 0 кривой Т. Если же кривая Г
задана на плоскости (z) параметрическими
уравнениями
x = x(t),
teTi
то параметрические уравнения образа этой
кривой при отображении (4.3.2) будут
Ui = u(x{t),y{t))9
[v = v(x(t),y(t))9
teT с:
Рис. 4.3.2
4.3.2. Предел и непрерывность
функций комплексного переменного. Пусть
функция f(z) комплексного переменного z
определена в проколотой окрестности точки
Zq € С. Точку А<е С называют пределом
функции f(z) комплексного переменного z о
точке Zq € С (или при z , стремящемся к
Zq ) и пишут
ПРЕДЕЛ И НЕПРЕРЫВНОСТЬ ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО 187
lim f(z) = Л или f(z) -> А при z -> Zo,
(4.3.3)
если для любой окрестности U точки А
можно найти такую проколотую окрестность
V точки Zq , что для всех z e V значения
f(z) принадлежат U.
Как и для действительной функции
действительного переменного, определение
предела равносильно следующему: точка А
является пределом функции / при Z —> Zq,
если для каждой последовательности {zn}
точек области определения /, Zn * Zq,
neN, имеющей своим пределом Zq,
соответствующая последовательность {/ (zn)}
имеет предел А .
Из определения предела функции
получаем, что утверждение lim f(z) = 0 (в этом
Z->Zq
случае f(z) называют бесконечно малой
(б.м.) функцией при z —> Zq ) равносильно
lim \f(zi = 0, а утверждение lim f(z) = °°
(в этом случае f[z) называют бесконечно
большой (б.б.) функцией при Z -> Zq)
равносильно lim |/(z)| = +°°-
г->го
Пусть А Ф оо. Положим А = А\ + /Л2,
Zq = Xq + /уд- Тогда существование предела
функции f(z) = u(x,y) + iv(x,y) в точке
£о , равного /4 , равносильно двум равенствам
lim u(x,y) = A\
и
lim v(x,y) = А2-
(х;у)^{х0;у0)
Если существует предел lim f(z) - А, то
Z^>Zq
lim |/(d = Ы|, lim argf(z) = arg/4.
*->V z^zo
Последнее равенство верно лишь при А фО
и argv4 * я. Наоборот, если существуют
пределы
lim \f(zi = r, lim arg/(z) = ф, (4.3.4)
то существует предел lim f(z) = A, где
Л = r(coS(p + / sill ф). Таким образом, в
случае А Ф О, argy4 Ф к равенства (4.3.4) можно
рассматривать как критерий существования
предела lim f(z)-A. При А = 0 для су-
шествования этого предела достаточно
выполнения лишь первого равенства.
Определение предела функции
комплексного переменного в случае А * °°
аналогично определению предела действительной
функции действительного переменного, а
алгебраические действия над комплексными и
действительными числами выполняются по
одним и тем же правилам. Поэтому в
комплексный анализ переносятся без изменений
основные теоремы о пределе функции в точке
и о свойствах функций, имеющих предел
(исключая те свойства, которые связаны с
отношением порядка действительных чисел).
Определение предела функции
комплексного переменного в точке Zq дано с
условием, что функция определена в
проколотой окрестности точки Zq . Это
определение можно обобщить, рассматривая функцию
f(z) только на некотором множестве
S а С из ее области определения и считая,
что точка Zq является предельной для
множества S. Пусть для любой окрестности U
точки А е С существует такая проколотая
о
окрестность V точки Zq, что f(z)^U для
любой точки z e Vf) S. В этом случае будем
говорить, что существует предел функции
(отображения) f (z) в точке Zq no
множеству S, равный А, и писать
lim f(z) = A или f(z)->A при z~>Zo-
s
(4.3.5)
Функцию комплексного переменного
f(z), определенную в некоторой
окрестности точки Zq, называют непрерывной в точке
Zq, если существует предел
«т /(?) = /(*)). (4.3.6)
z->zo
188
Глава 4.2. ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
Можно говорить о непрерывности
функции в смысле Сив смысле С, исходя
из того, какая метрика используется в
определении окрестности точки. Если /(Zq)* °°, то
оба подхода приводят к одному и тому же.
Однако сферическая метрика допускает,
чтобы значением функции была бесконечно
удаленная точка. При f(zo) = °° непрерывность
функции f(z) означает, что эта функция
является бесконечно большой при z ->
доопределение непрерывности функции
f(z) в точке Zq равносильно следующему:
функция f(z) непрерывна в точке Zq, если
для каждой последовательности {zn} точек из
области определения функции, сходящейся к
точке Zq, последовательность {/(£„)}
сходится к f(Zo)- Непрерывность функции
f(z) = u(x,y) + iv(x,y) в точке Zq = *о +
+ /у0 равносильна непрерывности обеих
функций и(х,у) и v(x,y) в точке (х$,Уо).
На функции комплексного переменного
переносятся все свойства непрерывных
функций действительного переменного, за
исключением тех, которые связаны с отношением
порядка среди действительных чисел
(например, теорема о сохранении знака
непрерывной функцией). В частности, сумма,
разность и произведение непрерывных в
точке Zq функций являются функциями,
непрерывными в этой точке. Частное двух
непрерывных в точке £q функций является
непрерывной в этой точке функцией, если делитель
в точке £q не обращается в нуль. Если
функция f[z) непрерывна в точке Zq , а функция
g(w) непрерывна в точке Щ = f (z$), то
сложная функция g(f(z)) определена в
некоторой окрестности точки Zq и непрерывна
в точке Zq-
Пусть £0 является предельной точкой
подмножества S области определения
функции f(z)- Если в точке Zq существует
предел функции f(z) по множеству S, то
говорят о непрерывности функции f(z) в точке
£0 по множеству S. Функцию комплексного
переменного, непрерывную в каждой точке
множества М по множеству М, называют
непрерывной на множестве М.
Укажем свойства функций комплексного
переменного, непрерывных на ограниченном
замкнутом множестве К а С.
1. Если функция f(z) непрерывна на
множестве К, то эта функция ограничена на
множестве К, т.е. существует такая
константа С > О, что |/(z)|<C, Ze К.
2. Модуль всякой функции f(z),
непрерывной на множестве К, достигает на К
своих наибольшего и наименьшего значений,
т.е. существуют такие точки Z\,Z2^ К, что
|/(Ф|/(*1)| Ч/(ф|/Ы|, zeK.
3. Любая функция f(zj, непрерывная
на множестве К, равномерно непрерывна на
этом множестве, т.е. для любого е > 0
существует такое 8 = ^//(е), что для любых точек
Z\,Z2^K, удовлетворяющих условию
1^1 ~ £г| < $' выполняется неравенство
|/Ы-/Ы|<е.
4.3.3. Элементарные функции
комплексного переменного. Элементарные
функции комплексного переменного строятся
как продолжения в комплексную плоскость
элементарных функций действительного
переменного. В основе такого продолжения
лежит представление функций степенными
рядами. По определению полагаем, что
= Т—.
/1=0
2л+1
sin z
= У(-1)Я*—
n (2/I +
(2/1 + 1)!
(4.3.7)
(4.3.8)
(4.3.9)
Поскольку ряды в правой части этих равенств
сходятся при любом z, равенства задают
функции комплексного переменного с
областью определения С : показательную функцию
комплексного переменного ez, а также триго-
ЭЛЕМЕНТАРНЫЕ ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
189
неметрические функции комплексного
переменного smz и cosz (синус и косинус).
Введенные функции при действительных
значениях z совпадают с соответствующими
элементарными функциями действительного
переменного.
В абсолютно сходящемся ряде можно
переставлять слагаемые произвольным
образом, его можно умножать на комплексное
число. Абсолютно сходящиеся ряды можно
складывать почленно. Умножив ряд (4.3.8) на
число / и сложив с рядом (4.3.9), мы
получим ряд (4.3.7), в котором вместо z
подставлено iz . Следовательно,
cosz + isinz ,
(4.3.10)
Эту формулу называют формулой Эйлера. Если
в (4.3.10) z заменить на -z, то получим
e~,z = cosz ~ isinz. (4.3.11)
Складывая и вычитая (4.3.10) и (4.3.11),
находим
cos z :
sin z
elz
eiz
+ e~
2
-e
-iz
-iz
2/
(4.3.12)
(4.3.13)
Иногда формулой Эйлера называют каждое из
соотношений (4.3.Ю)-(4.3.13).
Формула Эйлера позволяет перейти от
тригонометрической формы представления
комплексного числа к показательной, а именно:
если z = r (cos ф + / sin ф), то запись
Z = re^ (4.3.14)
называют показательной формой
представления комплексного числа. Теперь формулы
(4.1.17) и (4.1.18) Муавра приобретают
достаточно простой вид:
^ = ^<Ла1*г+2А:я)/'1
*=0,л-1.
(4.3.15)
Продолжение элементарных функций в
комплексную плоскость с помощью
степенных рядов сохраняет все функциональные
соотношения, которым удовлетворяет
элементарная функция действительного
переменного. Для показательной функции комплексного
переменного остается верным основное
функциональное соотношение
Для тригонометрических функций
комплексного переменного сохраняются все формулы
тригонометрии.
Оказывается, что функция комплексного
переменного ez является периодической с
мнимым периодом Т = 2/я. Это вытекает из
равенств
?Z+2iK _ eZe2in
■ ez (cos 2л + /sin 2л) = ez
Нетрудно показать, что любой период
функции ez является целым кратным периода Т ,
т.е. этот период является основным.
3. Если m — целое число, то
(ez) = (ex(cosy + ismy)) =
= emx {cos my + /sin my) = em{x+iy) = emz.
Как и в случае действительного
переменного, через синус и косинус определяют
еще две функции комплексного переменного
— тангенс и котангенс:
tgz =
sin?
cosz'
ctg£:
cosz
sin z
Первая из этих функций определена для всех
Z, кроме решений уравнения cos z - 0, а
вторая — кроме решений уравнения
sin z = 0.
Для вычисления значений функций
cosz и smz удобно использовать связь
между тригонометрическими и
гиперболическими функциями комплексного переменного.
По определению полагаем:
chz ■■
е*- +е
t\\Z =
cihz =
shz
chz
chz
shz
shz
ez
ez
_ez
ez
-e~z
+ e~z
+ e~z
-e
2
'
-z
Гиперболические и тригонометрические
функции комплексного переменного связаны
тождествами:
9Zi+Z2
(4.3.16)
sin iz = i sh z, sh iz = / sin z,
cos iz = ch z, ch iz = cos z,
tgiz = ithz, thiz = itgz,
ctg iz = -i cth z, cth iz = -i ctg z.
(4.3.17)
190
Глава 4.3. ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
Argsinz-const
Рис. 4.3.3
На рис. 4.3.3 представлена поверхность модуля
Р = \f(zt ФУНКЦИИ f{z) = sin г. Эта
поверхность в направлении действительной оси Ох
является периодической с периодом к, и ее
сечение вертикальной плоскостью, проходящей
через эту ось, дает график функции |sinx|, a
сечения плоскостями х - кп и х - я/2 +
+кк, k e Z, дают графики функций
соответственно |sh у\ и ch у. По мере удаления точки
Z от оси Ох значения р = |sin z\
неограниченно возрастают, и по форме поверхность
модуля приближается к цилиндрической
поверхности с уравнением р = е^/2. Ясно, что
при параллельном переносе системы координат
вдоль оси Ох так, чтобы ее начало перешло в
точку (я/2;0;0), поверхность на. рис. 4.3.3
будет рельефом функции cosz = sin (г + к/2).
Пример 4.3.2. Вычислим ez при
Z = in/2, z = in и z = In2 + /л/2 •
/тс/2 Л . . К
е ' = cos—+ /sm—= /,
2 2
elK = cos л + /sin к = -1 ,
eh\2+iK/2 _ е\1л2еЫ/2 _ ^ ш
4.3.4. Обратные тригонометрические
функции. Функции Arcsin z, Arccos z ,
Arctg z и Arcctg z определяют как обратные
соответственно к синусу, косинусу, тангенсу и
котангенсу и называют обратными
тригонометрическими функциями комплексного
переменного.
Например, если z = cos w, то w
называют арккосинусом числа z и обозначают
Arc cos Z- Для вычисления w при любом
Z € С воспользуемся представлением
cos w = (eiw + e~iw )J2. Обозначив eiw = t,
1
найдем
Z = cos w = ■
t + r
2 '
откуда / - 2z t + 1 = 0. Решив квадратное
уравнение относительно неизвестного t,
получим два его решения ^ и ^ которые
определяются формулой* ^12 = Z + yZ ~ 1- А так
как / € elw, то iw = Lnl z + yZ - 1 ]• Итак,
Arccosz = -iLniz + 4z2 - 1 ]. (4.3.18)
Поскольку для решений £i 2 квадрат-
ного уравнения / -2^/ + 1 = 0 верно
соотношение ^2=1» то MN = 1 и
В этой формуле квадратный корень имеет два
значения: в рамках комплексных чисел нет понятия
арифметического корня. Подчеркивая существование
у квадратного корня двух значений, иногда пишут
ПРОИЗВОДНАЯ ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
191
arg^ + arg£2 = 2£л, к е Z. Главное
значение аргумента комплексного числа есть число
из промежутка (-тс,тс], т.е. это число не
превосходит тс по абсолютной величине, причем
-тс исключается. Поэтому arg^i + arg £2 = 0>
либо arg^i + arg^2 = 2тс. Значит, либо два
аргумента отличаются лишь знаком, либо оба
равны тс.
Это рассуждение показывает, что из двух
значений £j и £2 одно имеет главное
значение аргумента, принадлежащее отрезку [0,тс].
Обозначим его через £. Ему соответствует
значение многозначной функции Arccos z,
равное -/ In £ = -/ In Щ + arg £, которое
называют главным значением арккосинуса и
обозначают arccos z.
Итак, по определению
arccos z = arg £ - / In Щ,
где £> = Z + 4Z -1, причем из двух
возможных значений выбирается то, аргумент
которого попадает в промежуток [0,тс]. Другие
значения Arccos £ либо отличаются от
главного значения арккосинуса слагаемым 2кк,
k е Z, либо формируются вторым значением
выражения Z + yZ - 1, равным 1/£:
Arccos z = -i Ln — =
= -/(-In|^| - /arg£ + 2km) =
= -arg^ + /ln|^| -2kn =
= - arccos z - 2&тс, к е Ъ.
Таким образом, все значения Arccos z
описываются формулой
Arccos z = ±arccos z + 2kn, ksZ. (4.3.19)
Аналогично с помощью
логарифмической функции можно выразить и другие
обратные тригонометрические функции:
Arcsin z = -/ Ln/f z + ylz2 - 1 ], (4.3.20)
Arctgz = -^Ln^^, (4.3.21)
2 1 -iz
Arcctgz = --Ln^-ii. (4.3.22)
2 z-i
Можно показать, что для любого
значения Arccos z существует такое Arcsin £, что
сумма этих значений равна тс/2. Аналогичное
утверждение справедливо для пары функций
Arctgz и Arcctgz. Именно в этом смысле и
следует понимать равенства
Arcsin z + Arccos z = —,
Arctg z + Arcctg z = —.
Глава 4.4
ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ
КОМПЛЕКСНОГО ПЕРЕМЕННОГО
4.4.1. Производная функции
комплексного переменного. Пусть функция
f(z) определена в некоторой окрестности
U точки Zq е €. Дадим Zq приращение Az
такое, что Zq+AzsU(zo)- Разность
f[Zo + Az)-/(zo), как и в случае
действительной функции, назовем приращением
функции и> = /(г) в точке Zq (соответствующим
заданному приращению Az аргумента z в этой
точке) и обозначим A/(£q), или просто Aw.
Если существует конечный предел
Д*->0 Az Д*->0 Az
(4.4.1)
то его называют производной функции f(z)
комплексного переменного Z в точке Zq и
обозначают /'(&)) ИЛИ —— •
dz
Функцию комплексного переменного Z
называют дифференцируемой в точке Zq, если
ее приращение A/(zq)b этой точке может
быть представлено в виде
Af(z0) = AAz + o(Az), (4.4.2)
где А — комплексное число, которое не
зависит от А£, но может зависеть от Zq\
o[Az) обозначает функцию, бесконечно
малую (б.м.) при Az —>0 более высокого по-
192 Глава 4.4. ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
рядка по сравнению с Az, т.е.
Ш„ 4*2-0.
Az->0 Az
Как и в случае действительной функции,
функция комплексного переменного f(z)
дифференцируема в точке Zq тогда и только
тогда, когда в этой точке существует
производная f'(Zo)-
Главную часть приращения Af(zo),
линейную относительно Az, называют
дифференциалом функции комплексного переменного
f(z)b точке Zq и обозначают df(zo)- Как и
в действительном случае, dffo) = f'(Zo)Az.
Полагая dz = Az, приходим к соотношению
df(Zo) = f'(Zo)dz.
4.4.2. Необходимые и достаточные
условия дифференцируемое™. Если
функция f(z) = и(х,у) + iv(x,y) имеет конечную
производную в точке Zq = х0 + iyQ, то
функции и(х,у) и v(x,y) являются
дифференцируемыми в точке (xq^o) ив этой точке
выполняются равенства
du(x0iy0) ^dv(x0,yQ)
дх ду
ди(х0,у0) _ dv(x0,y0)
( 4.4.3)
Ъу
дх
называемые условиями Коши — Римана или
условиями Даламбера — Эйлера, так как эти
условия можно встретить в работах Ж.
Даламбера и Л. Эйлера, относящихся к середине
XVIII в.
Используя действительное приращение
Az = Ах, а также формулы Коши — Римана,
можно получить следующие формулы для
вычисления производной функции
комплексного переменного по частным производным
действительной и мнимой частей:
,,/ ч ди(хо,у0) :dv(x0,y0)
f™ = —lx— + l—э7~- =
= ди(х0,у0) _ .ди(х0,у0) = (4 4 4)
Эх ду
_ ду(х0,уо) .dv(x0,yQ)
Если функции и[х,у) и v(x,y)
дифференцируемы в точке (х$\Уо) и в этой точке
выполнены условия Коши — Римана, то
функция / (z) = и (х, у) + iv (х, у) комплексного
переменного z = х + iy дифференцируема в
точке Zq = Xq + /у0. Таким образом, если
действительная и мнимая части функции
комплексного переменного дифференцируемы, то
условия Коши — Римана являются
необходимыми и достаточными для
дифференцируемости функции комплексного переменного.
Пример 4.4.1. Функция f(z) = ez
дифференцируема на всей комплексной
плоскости. Действительно, в соответствии с формулой
Эйлера имеем
ez _ ex+iy _ exeiy _ ех (C0Sy + ism у).
(4.4.5)
v{x,y) =
Значит, и (х, у) = ех cos у
= ех sin у. Эти функции дифференцируемы в
2
Ш , причем
ди х dv ди х . dv
— = е cosy = —, — = -е smy = ,
Эх ду ду дх
т.е. выполнены условия Коши — Римана.
Следовательно, функция ez
дифференцируема в каждой точке комплексной плоскости.
Согласно (4.4.4) и (4.4.5), находим
и-
ди .dv
— + / —
Эх Эх
ду
дх
ecosy + iesmy = е\
(4.4.6)
Из определения производной функции
комплексного переменного и свойств предела
получаем основные правила
дифференцирования, аналогичные соответствующим
правилам дифференцирования действительной
функции, а именно:
1) постоянная функция f(z) = A =
= const имеет производную в каждой точке
комплексной плоскости С, причем /'(z) = 0,
2) функция f(z) = Zm {те N)
дифференцируема в каждой точке комплексной
плоскости С, причем f'(z) = mzm~{, Z е С;
3) если функции f{z) и g(z) имеют
производные в точ*ке Zq, to функции
ГЕОМЕТРИЧЕСКИЙ СМЫСЛ АРГУМЕНТА И МОДУЛЯ ПРОИЗВОДНОЙ 193
«/(*) +р* (г) (о,реС), f(z)g(z) и
f{z)/g(z) (последняя при условии
g(Zo)^O) также имеют производные в точке
Zq, причем
(а/(*) + р*(г))'
г=го
= af(b) + W(zo);
= ГШЫ+/Ы*Ы',
'г=го
\2
г=го
(4.4.7)
4) если функция и> = /(г)
дифференцируема в точке Zq, а функция W - g(w)
дифференцируема в точке w0=/(Zo), то
сложная функция W = g(f(z))
дифференцируема в точке Zq, причем
»И*) = (*(/(*)))'
= ёЫГЫ-
Z=ZQ
(4.4.8)
4.4.3. Аналитические функции.
Функцию f(z) комплексного переменного z9
определенную в окрестности точки Zq £ С,
называют аналитической (также голоморфной
или регулярной) в этой точке, если f(z)
дифференцируема в некоторой окрестности
точки Zq- Функцию, аналитическую в каждой
точке области DcC, называют
аналитической (голоморфной, регулярной) в этой области.
Таким образом, функция, аналитическая
в области, — это просто функция,
дифференцируемая в этой области. Отметим, что
аналитичность функции в точке равносильна
аналитичности в некоторой окрестности этой
точки. Нарушение аналитичности функции в
точке £q означает не нарушение
дифференцируемое™ функции в этой точке, а
существование последовательности точек,
сходящейся к данной точке, в каждой из которых
функция не дифференцируема.
Часто говорят о функции, аналитической
в замкнутой области D (или о функции,
аналитической в области D и на ее границе),
подразумевая под этим, что все точки D
являются точками аналитичности f(z)- Это
значит, что функция является аналитической
в некоторой области G, включающей в себя
D. Существуют функции комплексного
переменного, аналитические во всей
комплексной плоскости С. Их называют целыми
функциями.
Для проверки функции комплексного
переменного на аналитичность достаточно
выделить действительную и мнимую части
этой функции, убедиться в их дифференци-
руемости и проверить выполнение условий
Коши — Римана. Установить аналитичность
функции можно также при помощи свойств
дифференцируемых функций. Например,
зная, что функция w = z является анали-
тичной, заключаем, что функция w = z"
также аналитична как произведение п анали-
тичных (т.е. дифференцируемых) функций.
С помощью свойств дифференцируемых
функций легко убедиться в том, что все
элементарные функции комплексного
переменного аналитичны в своей области
определения (например, функции ez9 sinz, cosz
аналитичны на всей комплексной плоскости).
При этом выражения для производных
элементарных функций совпадают с
выражениями для производных соответствующих
действительных функций действительного
переменного.
4.4.4. Геометрический смысл
аргумента и модуля производной. Предположим,
что w = f(z) — аналитическая в точке Zq
функция и f'(Zo) * О- Рассмотрим на
плоскости (z) кривую у, заданную уравнением
Z{t) = x(t) + iy(t), teT = [a,b], и
удовлетворяющую условию z(to) = Zo ДЛЯ
некоторого значения /q g Т. Считаем, что функция
аналитична во всех точках кривой у.
Пусть Z'{t0) = x'(t0) + iy'(t0)4t0. Тогда
лс'(/Ь) и /(to) одновременно не равны нулю
и в точке Zq существует касательная к
кривой у, вектор (х'(t0) /(t0)) является
направляющим вектором касательной. На
плоскости (и>) образом кривой у при отображе-
7 - 7706
194 Глава 4.4. ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
нии w = f(z) будет кривая Г (рис. 4.4.1),
заданная уравнением w = f(z(t)\ причем
кривая Г будет проходить через точку
*0=/(*о).
По правилу дифференцирования
сложной функции имеем
"'CoWUoKCo)- (4A9)
В силу сделанных предположений w'(/q) * О,
а это означает, что существует касательная к
кривой Г в точке щ. Поскольку аргумент
произведения комплексных чисел равен
сумме аргументов сомножителей, то, согласно
(4.4.9),
Arg w'(/0) = arg/'(zo) + Argz'^o)-
Обозначим arg/'(^o) = a. Тогда
Argw'(/0) = a + Argz'(/0).
Это равенство позволяет придать
производной функции комплексного переменного
следующую геометрическую интерпретацию:
аргумент производной равен углу а, на
который касательная к кривой у в точке Zo
поворачивается при отображении w = f(z) (см.
рис. 4.4.1). При ос>0 поворот происходит
против часовой стрелки, а при a < 0 — по
часовой стрелке.
Из сказанного следует, что при
отображении w = /(z), определяемом
аналитической функцией f(z), сохраняется угол
между кривыми, т.е. угол между касательными к
кривым, проходящим через точку Zq, равен
углу между касательными к образам этих
кривых, проходящим через точку w0 = /(Zq)-
Отображение, определяемое
дифференцируемой функцией многих переменных
/ : Ел —> Ел, называют конформным в точке
Xq е Шп, если оно сохраняет углы между
кривыми в этой точке. В соответствии с
геометрической интерпретацией производной
аналитической функции заключаем, что
аналитическая функция задает отображение
комплексной плоскости, конформное в каждой
точке, в которой производная функции не
обращается в нуль.
Конформные отображения,
определяемые аналитическими функциями, сохраняют
не только углы между кривыми, но и
направление их отсчета. Такие отображения
называют конформными отображениями первого
рода, противопоставляя их конформным
отображениям второго рода, меняющим
направление отсчета углов.
Геометрический смысла модуля
производной вытекает из равенств
|/'Ы =
Aw
lim —
Дг->0 Д^
: lim
Дг->0
Aw ,.
—Н = Ьт
AZ
У*
Уо
(z)
W = f(z)
V,
vo
О
1 %ы
<??
и0 и
Рис. 4.4.1
ДгнЮ |Дг| '
(4.4.10)
Отношение |Aw|/|Az| есть отношение
расстояний между точками WQ=f{Zo)n
w0 + Aw = /(zq + Az) в плоскости (w) и
точками Zq и Zq + &Z в плоскости (z). Оно
показывает, во сколько раз отображение
w = f(z) изменяет расстояния между
точками в окрестности точки Zq- Поэтому модуль
/'(^ОЛ производной естественно назвать
коэффициентом растяжения в точке Zq при
отображении w = f(z)-
Если /'(<Zb J > 1> то в достаточно малой
окрестности Zq расстояние между двумя
точками при отображении w = f(z)
увеличивается, т.е. отображение осуществляет
растяжение в окрестности точки Zq. Если же
/'(^ои<1, то это отображение приводит к
сжатию в окрестности точки £о, так как
расстояния между образами точек уменьшаются.
Отображение w> = /(z) комплексной
плоскости можно рассматривать как отображе-
1 1
ние из R в R , определяемое парой
функций и(х,у) = Re/(z) и v(x,y)= Im/(z),
ВОССТАНОВЛЕНИЕ АНАЛИТИЧЕСКОЙ ФУНКЦИИ ПО ЕЕ ЧАСТИ
195
где w = u + iv, a f (z) = и(х,у) + iv(xty).
Якобиан этого отображения с помощью
условий Кош и — Римана можно представить в виде
J(x,y)
\ди
дх
dv
dx
ди 1
Эу\
dv\
ду\
ди dv ди dv
= |/'Uf
Эх ду ду dx
С геометрической точки зрения якобиан
представляет собой коэффициент изменения
площади при отображении w = f(z)-
Используя формулу замены переменных в
двойном интеграле, для площади о^ области
W', являющейся образом области G при
отображении и> = /(г), получаем
°tv = \\dudv = jlJ (x9y)dxdy =
w
\\\f'{zfdxdy.
Через производную аналитической
функции можно также выразить связь между
дифференциалами длины дуги в плоскостях
(z) и (и>). Обозначив эти дифференциалы
через \dz\ и \dw\, т.е.
\dz\ = J(dx?+(dyf,
\dw\ = J(duf+(dvf,
с учетом условий Кош и — Римана получим
М2 = (К)2+(^)2)(^)2 +
+(K)2+K)2)w2=I/'W|2HI2-
Следовательно, \dw\ = \f'(z)\ \dz\. Используя
это равенство, для длины образа у* кривой
У при отображении w - f (z) получаем
формулу
r = j\dw\ = j\f(z)\\dZ[ (4.4.11)
4.4.5. Восстановление аналитической
функции по ее действительной или мнимой
части. Если функция /(z) = и (х, у) +
+iv(x,y) аналитична в области D, то ее
производная f'(z) также аналитична в этой
области (это вытекает из теоремы Коши,
используя которую можно доказать
существование разложения аналитической функции в
окрестности данной точки в степенной ряд).
Из этого утверждения вытекает, что
действительная и(х,у) = Re/(z) и мнимая части
v (х, у) = Im / (z) аналитической функции
являются бесконечно дифференцируемыми
функциями двух переменных. Кроме того,
дифференцируя условия Коши — Римана,
получаем
Э^ = _Э^_ д2и _ d2v
Эх2 ЭхЭу' Эу2 ЭуЭх'
Складывая эти равенства и учитывая, что
смешанные производные функции v не
зависят от порядка дифференцирования, находим
Аналогично
d2v d2v л
Эх2 Эу2
Дифференциальное уравнение (4.4.12)
называют уравнением Лапласа, а его решения,
определенные в области D —
гармоническими функциями в D. Уравнение Лапласа часто
записывают в виде Aw = 0 или V и = 0, где
Эх2 Эу2
обозначает оператор Лапласа.
Приведенные рассуждения показывают,
что действительная и мнимая части
аналитической функции являются гармоническими
функциями. Произвольная пара
гармонических функций образует аналитическую
функцию, если частные производные этих
функций связаны условиями Коши — Римана.
Такие функции называют сопряженными
гармоническими функциями. Если м(х, у) и
v(xyy) — сопряженные гармонические
7*
196 Глава 4.4. ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИЙ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
функции, то и функции v(x,y) и -и(х,у)
являются сопряженными гармоническими.
Действительно, легко увидеть, что условия
Коши — Римана для двух пар функций
эквивалентны.
Анализируя условия Коши — Римана,
нетрудно сделать вывод о том, что две
аналитические функции, у которых совпадают
действительные (мнимые) части, могут
различаться на постоянное мнимое
(действительное) слагаемое. Это означает, что
аналитическая функция восстанавливается по своей
действительной (мнимой) части с точностью
до постоянного слагаемого. Можно сказать
иначе: в паре сопряженных гармонических
функций одна функция определяется другой с
точностью до постоянного слагаемого.
Задача восстановления аналитической
функции по действительной или мнимой
части в приложениях теории функций
комплексного переменного встречается часто. Ее
можно решить различными способами. Для
определенности ограничимся восстановлением
аналитической функции по действительной
части. Восстановление функции по мнимой
части можно провести исходя из того, что
мнимая часть v(xyy) функции f(z)
является действительной частью функции -if (z)-
Отметим, что любая гармоническая в одно-
связной области функция имеет сопряженную
функцию. В случае многосвязных областей
это утверждение неверно: функция и (х, у) -
= 1п(х +у ), гармоническая в области
\z\ > 0, не имеет сопряженной функции.
Первый способ восстановления
аналитической функции f(z) по действительной
части и(х,у) основан на интерпретации
условий Коши — Римана как системы
дифференциальных уравнений относительно
неизвестной функции v(x,у), и сводится к
восстановлению мнимой части v(x,y)
аналитической функции по ее частным
производным.
Пример 4.4.2. Для функции и (х, у) =
= х - у + 2х имеем
ди - - д2и - ди
= 2х + 2, —т = 2, — =
дх
dxz
ду
. д2и
-2.
Видно, что функция и(х,у) имеет
непрерывные частные производные второго порядка, и
—у + —у = 0, xjgI,
Э* ду
т.е. эта функция гармоническая на всей
комплексной плоскости.
Гармоническая функция v(x,y),
сопряженная с w(x, y)t является решением
системы уравнений
dv ди - dv ди ~ -
— = = 2у, — = — = 2х + 2.
Эх Эу ду дх
Из второго уравнения системы заключаем, что
v(x,y) = ](2x + 2)dy + <p(x) =
= 2ху + 2у + у(х),
где ф(х) — некоторая неизвестная функция.
Дифференцируя это равенство по х и
подставляя в первое уравнение системы, получаем
или ф'(х) = 0. Следовательно, неизвестная
функция ф(х) постоянна, т.е. ф(х) = С.
Таким образом, v (х, у) = 2ху + 2у + С.
Итак, функция v(x,у), сопряженная с
w(x,у), определена. Теперь можно записать
аналитическую функцию f(z),
действительной частью которой является функция
и(х9у):
f{z) = u(x,y) + iv(x,y) =
= (х2 - у2 + 2х) + / (2ху + 2у + С).
Чтобы преобразовать полученное
представление функции, записанной через переменные
х и >>, в выражение с переменным Z,
достаточно в этом представлении заменить х на
Z, а у на 0:
f(z) = (x2-y2+2x) + i(2xy + 2y + ci =
Vv=o
= Z2 + 2z + iC, CeR.
ВОССТАНОВЛЕНИЕ АНАЛИТИЧЕСКОЙ ФУНКЦИИ ПО ЕЕ ЧАСТИ
197
Второй способ также сводится к
определению функции по ее частным производным,
но основан не на решении системы
дифференциальных уравнений, а на вычислении
криволинейного интеграла. Если функция
и{х,у) является гармонической, то
выражение
ди , ди ,
— dx + —dy
ду дх
(4.4.13)
является полным дифференциалом, а именно
дифференциалом неизвестной функции
v(x,у). В односвязной области
криволинейный интеграл от полного дифференциала не
зависит от пути. Более того, согласно
формуле Ньютона — Лейбница для криволинейного
интеграла
(*;>)
(Wo)
-^dx + -£dy = v(x>y>)-v(xo>y<>y
(4.4.14)
Из этого равенства можно найти функцию
v(x,y), рассматривая значение ^(*о>.Уо)
как произвольную постоянную.
Криволинейный интеграл можно вычислять по любому
пути, лежащему в рассматриваемой
односвязной области. Такой путь обычно составляют
из отрезков прямых, параллельных
координатным осям.
Третий способ восстановления
аналитической функции по ее действительной части
основан на неопределенном интегрировании.
Неопределенный интеграл в комплексном
случае вводится так же, как и в
действительном, техника комплексного интегрирования
не отличается от техники действительного
интегрирования. Зная частные производные
функции и (х, у) = Re / (z), можно записать
производную f'(z) согласно формуле
™-|-£
В правую часть равенства входят переменные
х и у. Заменяя х на z и >> на 0, перейдем
к переменному Z- Далее функцию f (z)
можно определить, исходя из найденной
производной.
Решая конкретную задачу
восстановления аналитической функции по
действительной части, необходимо учитывать следующее.
Если используется первый способ
восстановления, проверку гармоничности функции
и[х,у) можно не выполнять, так как при
нарушении условия гармоничности система
дифференциальных уравнений не будет иметь
решения. Это проявится в тот момент, когда
будет получено уравнение на промежуточную
функцию \|/(х). При нарушении условия
гармоничности в это уравнение будет входить
переменное у, ав этом случае уравнение не
будет иметь решений.
При использовании второго и третьего
способов восстановления необходима
непосредственная проверка гармоничности
и(х,у), так как эти способы приводят к
какому-либо результату в любом случае, даже
если функция и(х, у) не является
гармонической. В случае применения третьего
способа необходимо также уточнение постоянного
слагаемого. Это слагаемое появляется как
постоянная комплексного интегрирования и с
этой точки зрения может принимать
произвольное комплексное значение. Однако у
найденной функции задана действительная
часть, т.е. действительная часть постоянной
интегрирования имеет фиксированное
значение. Уточнить постоянное слагаемое можно,
сравнив действительную часть значения
найденной функции в некоторой точке со
значением в этой точке заданной действительной
части.
Пример 4.4.3. Легко убедиться в том, что
функция и (х, у) = ех cos у + х2 - у2 + Зх + 5
является гармонической в R . Найдем
аналитическую функцию f(z), для которой и(х,у)
является действительной частью. Так как
их = ех cos у + 2х + 3, иу = -ех sin у - 2у, то
f(z)-
(ди(х,у) .ди(х,у)
дх ду
= ez+2z + 3.
z
>=0
По найденной производной определяем
искомую функцию с точностью до
произвольной комплексной постоянной:
f(z) = j(ez+2z + 2)dz = ez+z2+lz + Ct
Се С.
Поскольку /(0) = 1 + С в то время как
и (О,0) = 6, заключаем, что 1 + Re С = 6,
откуда ReC = 5 и С = 5 + /С1, С{ е R.
Таким образом, /(z) = ez + z2 + 3z + 5 + iC{.
198 Глава 4.5. ИНТЕГРИРОВАНИЕ ФУНКЦИЙ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
Глава 4.5
ИНТЕГРИРОВАНИЕ ФУНКЦИЙ
КОМПЛЕКСНОГО ПЕРЕМЕННОГО
4.5.1. Понятие и вычисление
интеграла от функции комплексного переменного.
Пусть на плоскости (z) дана кусочно гладкая
кривая ЛВ (Л и В — начальная и конечная
точки этой кривой). Предположим, что в каждой
точке этой кривой определена функция
f(z)- Рассмотрим разбиение кривой ЛВ на
дуги 7,,у2, ...,у„ точками ^,г,,...,гл,
взятыми в порядке следования по кривой от Л к
Д причем точка Л совпадает с Zq, а точка В
— czn (рис. 4.5.1).
Обозначим через lk,k = l,n, длину
дуги yk (zk_\ и zk — соответственно
начальная и конечная точки этой дуги) и пусть
/ — максимальная из длин lk, k = l,/i.
На каждой дуге ук выберем точку zk и
составим интегральную сумму
п п
к=\
к=\
(4.5.1)
где Azk = Zk - Zk_i • Если при / —» 0
существует конечный предел / интегральной суммы
(4.5.1) (не зависящий ни от способа
разбиения кривой ЛВ на дуги ук, ни от выбора
промежуточных точек Zk £ Ук), то этот
предел называют интегралом от функции f (z)
комплексного переменного Z по кривой (или
вдоль кривой) ЛВ (или, коротко,
комплексным интегралом вдоль кривой) и обозначают
У<
о
1 (г)
/гк-\
/г'\"
z0=A
X
/= ff(z)dz.
ЛВ
Если кривая ЛВ является замкнутой, т.е. ее
начальная и конечная точки совпадают, то
комплексный интеграл называют контурным
интегралом и обозначают
j)f(z)dz.
АВ
Достаточными условиями существования
комплексного интеграла вдоль кривой ЛВ
являются кусочная гладкость кривой ЛВ и
непрерывность функции f(z)-
Непосредственно из определения
комплексного интеграла вытекает, что если
f (z) - u(x,y) + iv(x,y), то комплексный
интеграл сводится к двум криволинейным
интегралам:
j f(z)dz= j u(x,y)dx-v(x,y)dy +
лв
+ i [ v(x,y)dx + u(x9y)dy. (4.5.2)
AB
Эту формулу можно рассматривать как
результат формальной замены f (z) = и (х, у) +
+ iv (х, у) и dz = dx + i dy.
Если кривая ЛВ задана параметрически
комплексным уравнением z = z(t), te [a,p],
то для вычисления интеграла от непрерывной
функции f(z) вдоль этой кривой можно
использовать формулу
Р
jf(z)dz = jf(z(t))z'(t)dt.
АВ а
Из представления комплексного
интеграла в виде суммы двух криволинейных
интегралов и свойств криволинейного интеграла
вытекают следующие свойства комплексных
интегралов.
1. Линейность. Если функции f\(z) и
/2 (z) непрерывны на кусочно гладкой
кривой ЛВ, то для любых (вообще говоря,
комплексных) постоянных а и b
Jto(*) + */2(*))* =
АВ
= aj f{(z)dz + bj f2{z)dz.
(4.5.3)
Рис. 4.5.1
АВ
АВ
ИНТЕГРАЛЬНАЯ ТЕОРЕМА КОШИ
199
2. Аддитивность. Для любых кусочно
гладких кривых ЛВ и ВС и любой
непрерывной на кривой АС функции f (z) верно
равенство
j f(z)dz= j f(z)dz+ j f(z)dz.
AC AB ВС
(4.5.4)
3. Ориентированность. Для любой
непрерывной на кривой ЛВ функции f (z) верно
равенство
J f(z)dz = -j f{z)dz, (4.5.5)
yt s^~
(
0
л-
—V
-a
(г)
}
X
AB
BA
т.е. при изменении ориентации кривой
интеграл меняет знак.
4. Оценка интеграла. Для любой
функции f(z)t непрерывной на кривой ЛВ,
верно неравенство
Рис. 4.5.2
(z - a)n dz = Rn+{ (cos nt + / sin nt) x
x(-smt + icost)dt =
= iR"+{(cos(n + l)t + ism(n + l)t)dt.
Следовательно,
Jn=j(z-a)ndz = iRn+[ j (cos(n +1)/ +
J/(*)J< j|/(*)|H, (4.5.6) +ism(n + l)t)dt:
AB I AB
О, /i*-l;
2л/, л = -1.
где правая часть неравенства представляет
собой криволинейный интеграл первого рода.
Если, кроме того, функция f (z) на кривой
ЛВ удовлетворяет условию /(г)<М, то
верно неравенство
Обратим внимание, что полученный
результат не зависит от радиуса окружности. В
частном случае при а = 0 имеем
\z=R
\ 0, п*-1;
Zndz = (4.5.8)
[2л/, /i = -l.
\ f(z)dz\
АВ |
<ML
АВ>
(4.5.7)
где LAB — длина кривой ЛВ.
Пример 4.5.1. Вычислим интеграл
Jn=${z-a)ndz, neZ,
вдоль окружности L : \z - а\ = R, которая
обходится против часовой стрелки (рис. 4.5.2). Эту
окружность можно задать комплексным
уравнением z-Q = R (cos / + / sin t), ts [0,2л).
На окружности имеем
(z-a)n = Rn (cos nt + / sin nt),
dz = R(- sin / + / cos t)dt,
откуда
4.5.2. Интегральная теорема Коши.
Если функция f (z) аполитична в односвяз-
ной области Д то для любого кусочно
гладкого контура L в D
jf{z)dZ = 0. (4.5.9)
L
Это утверждение называют теоремой Коши
для односвязной области.
Теорема Коши верна в случае, когда
контур L является границей односвязной
области Д а функция f (z) аналитична в
D и непрерывна в замыкании D = D{J L
области D. В этом случае говорят, что
интеграл по границе односвязной области равен
нулю.
Теорема Коши распространяется на
общий случай области, которая ограничена
конечным числом кусочно гладких контуров и,
200 Глава 4.5. ИНТЕГРИРОВАНИЕ ФУНКЦИЙ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
У
О
X
Рис. 4.5.3
возможно, имеет разрезы вдоль кусочно
гладких кривых (рис. 4.5.3). В этом случае под
интегралом вдоль границы области понимают
сумму интегралов по всем граничным
контурам, причем каждый контур обходится так,
что область определения функции все время
остается слева (такое направление обхода
называют положительным). Разрезы также
включаются в путь интегрирования, но при
этом проходятся дважды в противоположных
направлениях (на рис. 4.5.3 путь
интегрирования показан стрелками). При таких
соглашениях утверждение теоремы Коши (ее в
этом случае называют теоремой Коши для
многосвязной области) будет гласить, что
интеграл от функции, аналитической в области
D и непрерывной вплоть до границы
области, вдоль границы области равен нулю.
Используя свойства аддитивности и
ориентированности комплексного интеграла,
можно показать, что комплексный интеграл
от аналитической в односвязной области D
функции f (z) не зависит от пути
интегрирования, соединяющего две произвольные
точки области. Поэтому комплексный
интеграл от аналитической функции часто
записывают в виде
Ч
//(*)*■
указывая в качестве пределов интегрирования
начальную точку zA и конечную точку Zr
пути интегрирования.
О
в
(z)
1 2
Рис. 4.5.4
Верно и обратное утверждение,
называемое теоремой Мореры: если функция
f (z) непрерывна в области D и интеграл от
этой функции в D не зависит от пути
интегрирования (или, что то же самое, интеграл по
любому замкнутому контуру в D равен нулю),
то функция f (z) является аналитической в
Z). В условиях теоремы Мореры можно ввести
интеграл с переменным верхним пределом
F(z)=jf(Qd^ zsD.
Возникающая при этом функция оказывается
первообразной функции f(z)- С помощью
этой функции можно выразить комплексный
интеграл от функции f (z) следующим
образом:
/(№ = Ф^2)-Ф(Ъ) = Ф^,
Z{,Z2£ D-
(4.5.10)
Формулу (4.5.10) называют формулой
Ньютона — Лейбница. Название подчеркивает
аналогию с одноименной формулой для
функций действительного переменного.
Пример 4.5.2. Вычислим интеграл от
функции z по ломаной ОАВ с вершинами в
точках О(0;0), А{\\\) и В(2\\) (рис. 4.5.4).
Эта функция является аналитической на всей
комплексной плоскости (z). Поэтому
интеграл от этой функции не зависит от пути
интегрирования, и его можно вычислить с
помощью формулы Ньютона — Лейбница.
Функция имеет первообразную Ф(г) = ^ /3,
поэтому
ОАВ
2+/
z2dz = ^\ =
(2 + /)3
8+ 12/-6-/ 2 11.
= з = з+Т'-
4.5.3. Интегральная формула Коши.
Если f(z) — аналитическая функция в одно-
связной области D, ограниченной кусочно
гладким контуром L, непрерывная вплоть до
границы области, то для любой точки Zo e D
верно равенство
КОМПЛЕКСНЫЙ ПОТЕНЦИАЛ ПЛОСКОГО ВЕКТОРНОГО ПОЛЯ
201
f{zo) = ^$^Ldz. (4.5.П)
2kiJlZ-Zo
Правую часть формулы (4.5.11) называют
интегралом Коши, а саму формулу (4.5.11) —
интегральной формулой Коши.
Если точка Zq лежит снаружи контура
L, то интеграл Коши, согласно теореме
Коши, равен нулю. Поэтому для односвязной
области D, ограниченной контуром L,
можно записать
-UZGU .(/(')•»«. (4,.|2)
2kiJl^-z [0, zг D.
Интегральная формула Коши
показывает, что теорема Коши перестает быть верной,
если подынтегральная функция не является
аналитической хотя бы в одной точке (такие
точки называют особыми точками
аналитической функции). Эта формула может
применяться для вычисления простейших
контурных интегралов, однако более универсальный
и удобный метод вычисления таких
интегралов предоставляет теория вычетов, которая
как раз и базируется на интегральной
формуле Коши.
Условие, что функция комплексного
переменного аполитична в точке Zq, оказывается
настолько сильным, что из него следует
существование в точке Zo всех производных
рассматриваемой функции. Таким образом,
производная аналитической функции сама
является аналитической функцией. Это
важнейшее отличие функций комплексного
переменного от функций действительного
переменного: в действительном случае функция
может иметь производную первого порядка,
но не иметь производной второго порядка.
Второе важное приложение интегральной
формулы Коши — обоснование утверждения
о том, что аналитическая функция является
бесконечно дифференцируемой и может быть
представлена в окрестности любой точки
аналитичности степенным рядом. Зафиксировав
контур L и рассматривая точку Zq как
параметр, мы превращаем интеграл Коши в
интеграл с параметром, который можно
дифференцировать по параметру под знаком
интеграла. Отсюда как раз и следует, что
аналитическую функцию можно дифференцировать
любое число раз.
4.5.4. Комплексный потенциал
плоского векторного поля. При помощи
функций комплексного переменного можно
описать стационарное (не зависящее от времени)
плоскопараллельное (плоское) векторное поле.
Все векторы такого поля в некоторой системе
координат Охуг имеют нулевую аппликату и
зависят только от координат х и у точки
приложения вектора. Две ненулевые
координаты векторного поля, абсциссу и ординату,
можно описать парой функций и(х,у) и
v(x,y), которые можно рассматривать как
действительную и мнимую части функции
комплексного переменного: f(z) = и(х,у) +
+iv(x,y), где z = x + iy.
С любым замкнутым контуром L на
комплексной плоскости z мы будем
ассоциировать тело, которое ограничено
цилиндрической поверхностью с направляющей L и
двумя плоскостями, параллельными
плоскости (z) и отстоящими друг от друга на
расстоянии 1. Такое тело далее будем называть
цилиндрическим.
Будем предполагать, что векторное поле
f(z) является лапласовым, т.е. одновременно
и потенциальным, и соленоидальным. Для
плоскопараллельных полей это означает, что
L. Г, ч Эй dv п
Г/(г) = ;* + эГ0'
(* а N (4513)
Условие соленоидальности векторного
поля по существу означает, что выражение
-v(x,y)dx + u(x,y)dy является полным
дифференциалом некоторой скалярной
функции ^(х,^), а уравнение векторных линий
является уравнением в полных
дифференциалах. Итак,
-v(x,y)dx + u(x,y)dy = dV(x,y). (4.5.14)
Функцию ^(х^у) называют функцией
тока (также силовой функцией) плоского
векторного поля f(z)- Векторные линии этого
поля являются линиями уровня функции
Ч*(х,у) и описываются уравнением
^{х,у) = С = const. (4.5.15)
Условие потенциальности векторного
поля f(z) означает, что выражение
202 Глава 4.5. ИНТЕГРИРОВАНИЕ ФУНКЦИЙ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
и (х, у) dx + v (х, у) dy тоже является полным
дифференциалом некоторой функции Ф(х, >>):
u(x,y)dx + v(x,y)dy = d<&(x,y). (4.5.16)
Функция Ф(х, у) представляет собой
потенциальную функцию (также называемую
потенциалом скоростей) векторного поля
/(<)■
Частные производные потенциальной
функции Ф(х,д>) и функции тока ^(х,^)
выражаются через функции и(х,у) и v(x,y)
следующим образом:
ЭФ
Эх
ЭФ
ъу
= и(х,д>),
= v(x,y);
ЭТ
Эх
ЭУ
ду
= -v(x,y),
(4.5.17)
Из этих выражений следует, что
потенциальная функция и функция тока являются
сопряженными гармоническими функциями в
области дифференцируемое™ функций
и(х,у) и v(x,y), а функция комплексного
переменного W (z) = Ф(х,д>) + iVfay) ана-
литична в этой области. Эту функцию
называют комплексным потенциалом лапласова
векторного поля. Комплексный потенциал и
векторное поле связаны соотношением
W'(z) = f(z). (4.5.18)
Отметим, что комплексный потенциал как
первообразная аналитической функции f(z)
определяется с точностью до аддитивной
постоянной.
Итак, каждое лапласово поле f{z)
можно описать его комплексным
потенциалом W (z)- Верно и обратное: каждую
аналитическую в некоторой области D функцию
W(z) можно рассматривать как
комплексный потенциал лапласова поля, которое
описывается функцией f(z) = W(z).
Через комплексный потенциал W (z)
можно записать основные характеристики
плоскопараллельного лапласова поля f(z)-
Во-первых, с помощью функции W{z)
можно записать поток плоского векторного поля:
Qy = f-v(x,y)dx + u(x,y)dy = jdV(x,y).
У У
(4.5.19)
Далее будем говорить о потоке
векторного поля через кривую у, имея в виду поток
плоскопараллельного векторного поля через
цилиндрическую поверхность с образующей
единичной длины и направляющей у.
Во-вторых, с помощью функции W (z)
можно записать линейный интеграл векторного
поля f(z) вдоль кривой у (циркуляцию в
случае замкнутой кривой):
Ту = ^u{x,y)dx + v(x,y)dy = ^d<S>{x,y).
У У
(4.5.20)
Поток и линейный интеграл являются
действительной и мнимой частями
комплексного интеграла от производной функции
W{Z):
Гу +/'0у = \u(x,y)dx + v(x,y)dy +
у
+ ij-v(x,y)dx + u{x,y)dy = flV'(z)dz.
У У
Функцию комплексного переменного
f(z) = и(х,у) + iv(x,y) можно рассматривать
как векторную функцию (u(x,y),v(x,y))
двух переменных х и у. С этой точки зрения
77777—: дФ(х,у) .ЭФ(х,>>) , , ч
W'(z) = —z^11 + /—y—^-L = grad Ф(х, у).
Эх ду
Линии равного потенциала
{эквипотенциальные линии) представляют собой линии
уровня потенциальной функции Ф(х,д>), а
линии уровня функции тока ^[х,у)
известны как линии тока (в некоторых приложениях
силовые линии). Линии равного потенциала и
линии тока в области D описываются
уравнениями соответственно:
Ф (х, у) = const и
(4.5.21)
Ч1 (х, у) = const, (x;y)e D.
Если в точке £Е D функция f(z) не
равна нулю, то W(z) = f(z) * 0. В этом
РАВНОМЕРНАЯ СХОДИМОСТЬ ФУНКЦИОНАЛЬНЫХ РЯДОВ
203
случае линия равного потенциала и линия
тока, проходящие через эту точку, взаимно
перпендикулярны. Отметим, что вектор
f{z) = gradO(x,j>) в точке z касается
линии тока. При графическом изображении
линий тока на них обычно указывают
стрелками направление возрастания
потенциальной функции.
Если функция f(z) задает лапласово
поле в односвязной области D на
комплексной плоскости (z), то функция f[z)
является аналитической в D и по теореме Коши
для односвязной области комплексный
интеграл от этой функции по замкнутому контуру
у с D равен нулю. Но действительная часть
этого интеграла есть циркуляция векторного
поля по контуру у, а мнимая часть есть
поток векторного поля через кривую у. Таким
образом, утверждение теоремы Коши
означает, что циркуляция лапласова поля по
замкнутому контуру и поток лапласова поля через
замкнутую кривую равны нулю. Первое
утверждение верно для всех потенциальных
полей, а второе — для всех соленоидальных
полей.
Глава 4.6
ФУНКЦИОНАЛЬНЫЕ РЯДЫ
НА КОМПЛЕКСНОЙ ПЛОСКОСТИ
4.6.1. Равномерная сходимость
функциональных рядов. Пусть на некотором
множестве А с С определена
последовательность {/„(*)} функций fn(z) {n = 0,1,2,...)
комплексного переменного Z- Функциональный
ряд
/»=0
называют сходящимся в точке Zq e А, если
сходится числовой ряд У^/л(^о)- Множество
/7=0
всех точек z e А, в которых
функциональный ряд сходится, называют областью
сходимости этого функционального ряда.
Отметим, что термин «область
сходимости» никак не связан с термином «область». В
общем случае областью сходимости
функционального ряда может быть множество самого
общего вида: связное или нет, открытое или
замкнутое. Частным случаем функциональных
рядов являются степенные ряды. Область
сходимости степенного ряда представляет собой
его круг сходимости \z - Zq\ = R, дополненный
некоторым множеством точек окружности
\z - Zq\ = Я (быть может, пустым).
Область сходимости степенного ряда,
состоящего из отрицательных степеней
Z - Zq, представляет собой внешность
окружности \z - Zq\ = г, дополненную некоторым
(возможно, пустым) множеством точек этой
окружности. Наконец, область сходимости
двустороннего степенного ряда представляет
собой кольцо г <\z- Zo\< R, быть может,
дополненное некоторым множеством точек
окружностей \z - Zq\ = г и \z - £q| = R.
Если D — область сходимости
функционального ряда (4.6.1), то в D определена
сумма ряда
S (z) = lim Sn {z) = lim f fk {z), (4.6.2)
где Sn (z) — п-я частичная сумма ряда (4.6.1).
Если ряд (4.6.1) сходится в каждой точке
множества G, то его называют сходящимся
поточечно на этом множестве. Такое название
указывает на то, что понятию сходимости
ряда на множестве можно придать различный
смысл. Так, наряду с поточечной сходимостью
рассматривают равномерную сходимость
функциональных рядов.
Функциональный ряд (4.6.1) называют
равномерно сходящимся на множестве
М с D к функции S(z), если для любого
числа 8 > 0 можно указать такой номер N,
что при п > N для любой точки zt M
выполняется неравенство \S(z) - Sn (z Л < 8, где
Sn (z) — п-я частичная сумма
функционального ряда.
Определение равномерной сходимости
похоже на определение поточечной
сходимости, но имеет важное отличие: номер N,
выбираемый в зависимости от числа 8, в
случае поточечной сходимости зависит и от
точки, в то время как при равномерной
сходимости выбор номера N от точки не
зависит, т.е. для заданного числа 8 этот номер
выбирается сразу для всех точек множества
204 Глава 4.6. ФУНКЦИОНАЛЬНЫЕ РЯДЫ НА КОМПЛЕКСНОЙ ПЛОСКОСТИ
М. Ясно, что условие равномерной
сходимости сильнее, чем условие поточечной
сходимости, т.е. если функциональный ряд
сходится равномерно на множестве М к функции
S(z), то он сходится и поточечно на М к
той же функции.
Определение равномерной сходимости
можно сформулировать следующим образом.
Ряд (4.6.1) сходится на множестве М
равномерно к функции S(z), если
lim sup|S„(*)-S(d = 0.
Если ряд (4.6.1) сходится на множестве
М поточечно к функции S(z), то
определена функциональная последовательность
остатков ряда Rn (z) = S(z) - Sn (z)- Можно
сформулировать следующий критерий
равномерной сходимости функционального ряда.
Для того чтобы функциональный ряд
сходился равномерно на множестве М, необходимо
и достаточно, чтобы, во-первых, он сходился
на М поточечно, а во-вторых, чтобы
последовательность остатков {7?л(х)} ряда
равномерно сходилась к нулю, т.е.
lim sup |/?„ (z)| = 0.
Если функциональный ряд (4.6.1)
сходится равномерно на множестве М, то он
равномерно сходится и на любом его
подмножестве М\ с М.
На равномерно сходящиеся
функциональные ряды комплексного переменного
распространяются многие свойства
равномерно сходящихся рядов действительных
функций. Сформулируем некоторые из них.
1. Если ряд (4.6.1) равномерно сходится
на множестве М и (p(z) — ограниченная по
модулю на множестве М функция, то ряд
V" ty(z)fn(z) равномерно сходится на М.
п=0
2. Для равномерной сходимости ряда
(4.6.1) на множестве М необходимо и
достаточно, чтобы для любого 8 > 0 существовал
такой номер N, что при п> N и р > 1 для
всех точек z e M выполнялось неравенство
\Sn+p(z)-S„(zi =
п+р
*=/7+1
X /Лфе <4-6-3)
(это утверждение, как и в действительном
случае, называют критерием Коши).
3. Если существует сходящийся знакопо-
такои,
ложительный числовой ряд /,вп>
/7=0
что, начиная с некоторого номера, выполнено
неравенство |/л(г)|<ял, £еМ, то ряд
(4.6.1) сходится равномерно на множестве М
(это утверждение называют признаком Вейер-
штрасса, а числовой ряд jT an — мажоран-
/;=0
той ряда).
4. Если члены функционального ряда
V/„ (z) непрерывны на множестве М, а
сам ряд сходится на этом множестве
равномерно, то сумма S(z) ряда также будет
непрерывной на М.
5. Пусть все члены функционального
ряда /\fn(z) непрерывны на некоторой
кусочно гладкой дуге у, и этот ряд сходится
на дуге у равномерно. Тогда этот ряд можно
почленно интегрировать, т.е.
\s{z)dz = \\fjfn{z)\z = fJ\fn{z)dz.
/7=1
л=Ь
Если функциональный ряд сходится
равномерно на любом ограниченном
замкнутом подмножестве данной области D, то
такой ряд называют равномерно сходящимся
внутри области D. Обратим внимание на то,
что новое понятие получается простым
добавлением слова «внутри» и по звучанию схоже с
понятием равномерно сходящегося ряда.
Однако смысл двух понятий разный. Если ряд
сходится равномерно в области D, то он
сходится равномерно и на любом подмножестве
D, в том числе на любом замкнутом
ограниченном подмножестве. Таким образом, из
равномерной сходимости в области D
вытекает равномерная сходимость внутри области
D, но обратное утверждение неверно.
РЯД ТЕЙЛОРА
205
Если функции fn(z), nsN аналитич-
оо
ны в области D, и ряд £^fn(z) сходится
/7=1
равномерно внутри D, то имеют место
утверждения:
1) сумма S[z) этого ряда является
аналитической функцией в области D\
2) функциональный ряд можно
дифференцировать почленно в области D любое
число раз, т.е. для любого к е N верно
равенство
/7=0
3) ряд в правой части (4.6.4) сходится
равномерно внутри D.
Равномерной сходимостью обладают
степенные ряды, а именно, если степенной
ряд сходится в круге (внешности круга,
кольце) D, то он сходится равномерно на любом
замкнутом множестве, целиком содержащемся
в D. Из свойства равномерной сходимости
степенного ряда вытекает, что сумма
степенного ряда является аналитической функцией
в круге его сходимости и что степенной ряд
можно почленно дифференцировать любое
число раз в круге сходимости, а также
интегрировать по любой кусочно гладкой кривой,
целиком лежащей в круге сходимости.
Из сказанного выше вытекает, что
степенной ряд сходится равномерно внутри
своего круга сходимости (внешности круга для
ряда с отрицательными степенями, кольца
для двустороннего ряда).
4.6.2. Ряд Тейлора. В теории функций
комплексного переменного важную роль
играет возможность представления
аналитической функции степенным рядом. Если
функция / (z) аналитична в круге \z - Zq\ < R, то
она в этом круге является суммой некоторого
степенного ряда, т.е.
/7=0
Дифференцируя это равенство и полагая
Z = Zq, приходим к следующим формулам
для коэффициентов степенного ряда:
- _/в)(*)
Отсюда, в частности, следует, что
представление функции степенным рядом единственно.
Степенной ряд, представляющий функцию
f(z), называют рядом Тейлора функции
f(z) по степеням Z-Zq (или с центром
разложения в точке ^о )• При этом
коэффициенты ряда Тейлора называют
коэффициентами Тейлора функции f(z)- Представление
функции ее рядом Тейлора называют
разложением этой функции в ряд Тейлора.
Коэффициенты Тейлора можно также
найти с помощью контурных интегралов по
формулам
a»=h\
1 f /(CK
l(C-Zo)'
/7+1
■, /i = 0,l,2,...,
п\
-, л = 0,1,2,.
где контур интегрирования L — это любой
простой контур в круге аналитичности
\z - Zjq\ < R, окружающий точку Zq,
например окружность \z - Zo\ = р, р < R.
Если функция f(z) аналитична в
замкнутом круге \z - Zq\ ^ г и ограничена,
т.е. \f(z\ £ A, \z - Zq\ ^ г, то коэффициенты
ряда Тейлора этой функции с центром в
точке Zo удовлетворяют неравенствам
|с„|<4> « = 0,1,2,..., (4.6.5)
г
называемым неравенствами Коши. Из
неравенств Коши вытекает, что аналитическая
ограниченная на всей комплексной плоскости
функция постоянна (это утверждение
известно как теорема Лиувилля).
Как следует из вышесказанного,
аналитическую функцию f(z) можно разложить в
степенной ряд в любом круге \z - Zq\ < R, в
котором нет особых точек. Естественно,
радиус R круга выбрать максимально большим.
При таком выборе радиус будет равен
расстоянию от точки Z до ближайшей особой
точки функции (а точнее, расстоянию от Z
до множества точек, в которых f(z) не
определена или не дифференцируема). Таким
образом, радиус сходимости ряда Тейлора
можно определить, анализируя множество
особых точек функции. Отметим, что этот
способ непригоден в действительном случае:
функция f(x) = l/(l + х2) бесконечно диф-
206 Глава 4.6. ФУНКЦИОНАЛЬНЫЕ РЯДЫ НА КОМПЛЕКСНОЙ ПЛОСКОСТИ
ференцируема на всей числовой оси, однако
ее ряд Маклорена имеет радиус сходимости 1
и не сходится при Ы > 1.
Для разложения аналитических функций
в степенной ряд можно использовать те же
приемы, что и в действительном случае.
Сохраняются все формулы для разложения в
степенной ряд всех элементарных функций.
Более того, если функция действительного
переменного представима степенным рядом,
то эту функцию можно рассматривать как
функцию комплексного переменного, и
продолжение ее в комплексную плоскость
осуществляется при помощи степенного ряда, в
котором достаточно заменить действительное
переменное х комплексным переменным Z-
4.6.3. Рад Лорана. Любую функцию
f(z), аналитическую в кольце г < \z - Zq\ < R,
можно в этом кольце представить суммой
двустороннего степенного ряда
/(г) = |>«(*-*ь)" (466)
с коэффициентами
где L — окружность \z - Zo\ = р, г < р < R.
Это утверждение называют теоремой Лорана.
Ряд (4.6.6), коэффициенты которого
вычислены по формулам (4.6.7), называют рядом
Лорана функции f(z) по степеням z - Zq
(или с центром в точке Zq )•
Говорят, что двусторонний степенной
ряд сходится абсолютно в точке Z, если в
этой точке абсолютно сходятся оба
составляющих его ряда. Аналогично двусторонний
степенной ряд сходится равномерно на
множестве М, если на этом множестве
равномерно сходятся оба составляющих его ряда.
Согласно этим определениям можно сделать
следующие выводы:
1) ряд Лорана функции, являющейся
аналитической в кольце г < \z - Zo\ < R,
сходится абсолютно в этом кольце;
2) ряд Лорана функции, аналитической
в кольце г < \z - Zo\ < R , сходится равномерно
внутри этого кольца, в частности, он сходится
равномерно в любом замкнутом кольце
г, < \z - Zq\ ^ R\, где r<r{<R{<R.
Определение равномерно сходящегося
двустороннего ряда позволяет на такие ряды
перенести теоремы о почленном
дифференцировании и интегрировании. Поэтому ряд
Лорана можно почленно дифференцировать
внутри кольца сходимости любое число раз и
можно почленно интегрировать по любой
дуге в кольце сходимости. Эти операции
фактически сводятся к их раздельному
выполнению для правильной и главной частей ряда
Лорана.
Наконец, подчеркнем, что функция
разлагается в ряд Лорана в любом кольце, в
котором она аналитична. В качестве такого
кольца можно взять максимально возможное
кольцо с центром в заданной точке Zq, в
котором сохраняется аналитичность функции.
Рассуждая так же, как и в случае ряда
Тейлора, заключаем, что и на внешней границе
максимального кольца, и на его внутренней
границе есть хотя бы одна особая точка
функции.
Отметим, что радиусы г и R,
определяющие кольцо, внутри которого сходится
ряд Лорана, могут принимать, в частности,
следующие значения:
1) г = 0, R < ©о (в этом случае имеем
круг с выколотым центром — точкой Zq, т.е.
проколотую окрестность этой точки);
2) г = 0, R = ©о (ряд Лорана сходится
во всей комплексной плоскости, за
исключением точки Zq );
3) 0 < г < оо? R = оо (в этом случае
кольцом сходимости ряда Лорана является
внешность окружности \z - Zq\ = r ).
Всякий сходящийся двусторонний
степенной ряд является рядом Лорана своей
суммы. Отсюда следует, что представление
функции двусторонним степенным рядом
единственно, и таким рядом является ряд
Лорана.
Формулы (4.6.7) для вычисления
коэффициентов ряда Лорана на практике
используют редко. Обычно лорановские разложения
функций получают, преобразовывая
подходящим образом функцию и используя
тейлоровские разложения основных элементарных
функций.
Для коэффициентов ряда Лорана верны
неравенства Коши, сформулированные ранее
для коэффициентов Тейлора.
4.6.4. Связь рада Лорана с радом
Фурье. Ряд Фурье для действительной функции
(р(/) действительного переменного /,
интегрируемой на отрезке [0,2л], имеет вид
НУЛИ АНАЛИТИЧЕСКОЙ ФУНКЦИИ
207
■у + ^ (ап cos nt + £„ sin Atf), (4.6.8)
п=\
где
1 2к
л„ =-Jq>(0cos/if</f, л2 = 0,1,2,...; (4.6.9)
о
2к
bn=-\q>(t)smntdt, /1 = 1,2,3,.... (4.6.
тс J
Ю)
Ряд Фурье можно представить в
комплексной форме. В этом случае он имеет вид
I Vй",
(4.6.11)
а его коэффициенты сп вычисляются по
формулам
2к
2л
/ф(0
e-m,dt, /i = 0,±l,±2...
(4.6.12)
Рассмотрим теперь функцию /(z)
комплексного переменного £, аналитическую
в кольце 1 - 8 < \z\ < 1 + е, £ > 0. В этом
кольце функцию f(z) можно представить
рядом Лорана:
/(*)= Хс^я (46,3)
Сравнивая (4.6.11) с (4.6.13) при z = е" и
(4.6.12) с (4.6.15), устанавливаем, что ряд
Лорана для функции f[z) в окрестности
единичной окружности L совпадает с рядом
Фурье для функции ф(/) = fie'*) на отрезке
[0,2л], которая получается сужением
функции f(z) на единичную окружность.
Глава 4.7
НУЛИ И ОСОБЫЕ ТОЧКИ
АНАЛИТИЧЕСКОЙ ФУНКЦИИ
4.7.1. Нули аналитической функции.
Точку ае С называют нулем функции f{z)
комплексного переменного Z, если /(<з) = 0.
Пусть функция f(z) аналитична в
точке as С. Тогда функцию f(z) можно
представить в некоторой окрестности точки а
рядом Тейлора
f(z)=t,cn(z-a)'\ (4.7.1)
/7=0
коэффициенты которого можно определить
по формулам
f(n){a)
(4.7.2)
с коэффициентами
-i№£-Z, (4.6.
2л/ J zn+]
14)
где L — окружность |z| = 1, целиком
лежащая в указанном кольце. Вводя для этой
окружности параметрическое представление
Z = e,t, t е [0,2л], при котором dz = ieltdt и
Z = е'^п+ ' , вместо (4.6.14) получим
2к
/(e^ie^dt
2л/
№
("+0'
_1_
2л
2к
пе
\f(elt)e-intdU
(4.6.15)
Если точка а является нулем функции
f(z), то с0=/(я) = 0. Пусть т — номер
первого по счету коэффициента
тейлоровского разложения, отличного от нуля. Число
т называют кратностью (иногда порядком)
нуля Z-CL аналитической функции f(z), а
саму точку z = а называют нулем кратности
т функции f{z). Из (4.7.2) следует, что
кратность нуля Z = a функции f(z) равна
наименьшему порядку отличной от нуля в
точке z = d производной этой функции.
Нуль кратности 1 называют простым нулем
аналитической функции.
Разложение (4.7.1) функции f(z),
имеющей в точке z = я нуль кратности т,
имеет вид
208
Глава 4.7. НУЛИ И ОСОБЫЕ ТОЧКИ АНАЛИТИЧЕСКОЙ ФУНКЦИИ
/(*)=2>|.(*-«Г =
(4.7.3)
где cw * 0.
Точка аеС тогда и только тогда
является нулем кратности т аналитической в
точке а функции f(z), когда эта функция
может быть представлена в виде
f(z) = (z-a)mq>(z), (4.7.4)
где (p(z) — аналитическая в точке z = a
функция, причем (р(д) Ф 0.
Сформулированное утверждение удобно
на практике при определении кратности нуля.
Кратность нуля можно также определить
исходя из асимптотической формулы
f(Z) ~ A(z-a)m, (4.7.5)
где Л * 0.
Бесконечно удаленную точку Z = °°
называют нулем функции f{z), если
существует предел
/(оо)= Hm/(z) = 0. (4.7.6)
Если функция f(z) аналитична в
окрестности точки z = °°, т.е. в некоторой
области \z\ > /?, R > 0, и точка z = °° является
нулем f(z), то кратность нуля в этом случае
определяют как номер первого по счету
ненулевого коэффициента в лорановском
разложении функции в окрестности точки z = °°.
Если z = °° является нулем кратности т, то
имеет место представление
где функция <p(z) аналитична в окрестности
точки оо и имеет конечный ненулевой предел
при Z —> °°. Из этого представления вытекает
асимптотическая формула
Пример 4.7.1. Функция f(z) = s'm(\/z)
имеет нули в точках, определяемых
равенством s'm(\/z) = 0. Отсюда \/z = кк, /се Ъ,
или z - l/(kn). Функция имеет нуль и в
точке Z = °°, поскольку /(°°) = Игл f(z) = 0.
Z—><*>
Точки z = \/(kn), k E Z, являются простыми
нулями, так как первой отличной от нуля
производной в каждой из этих точек будет
производная первого порядка. Действительно,
л«>-«4(-4г}
/' — =-(&л) coskn±0.
Точка z = °° также будет простым нулем,
поскольку s'm(\/z) ~ \/z при z —> °°.
Если функция f[z) аналитична в точке
аеС, являющейся нулем f(z), то либо
/(z) = 0, либо существует проколотая
окрестность этой точки, не содержащая нулей
функции f(z).
4.7.2. Изолированные особые точки.
Точку as С называют изолированной особой
тонкой функции f{z), если существует
проколотая окрестность U (а) = [z e С :
0 < \z - й\ < г\ точки я, в которой данная
функция аналитична, но в самой точке а
функция f(z) не определена или теряет
аналитичность. В зависимости от поведения
функции f(z) вблизи точки Z-Q
различают три типа изолированных особых точек.
Изолированную особую точку Z- а
функции f{z) называют:
1) устранимой особой точкой, если
существует предел lim f{z) = A * ©о;
Z->a
2) полюсом, если lim f(z) = °°;
Z->a
3) существенно особой точкой, если не
существует ни конечного, ни бесконечного
предела функции f(z) при z —> я.
Например, для функции точка
Z
Z = 0 является устранимой особой точкой,
ИЗОЛИРОВАННЫЕ ОСОБЫЕ ТОЧКИ
209
так как функция аналитична во всех точках
комплексной плоскости, кроме точки z = 0,
а в этой точке функция имеет предел, равный
единице. Для функции \/z точка z = 0 есть
полюс, поскольку эта функция является
аналитической всюду на комплексной плоскости,
за исключением точки z = 0, а в этой точке
имеет предел, равный °о. Для функции e'z
точка z = 0 существенно особая, так как
функция аналитична при z * 0, а в точке
Z = 0 не имеет предела ни конечного, ни
бесконечного.
1
Функция г~ГТ имеет полюсы в точ-
sm(n/z)
ках zn=\/n, п = ±1,±2,..., а точка z = 0 не
является для этой функции изолированной
особой точкой, так как в любой окрестности
точки z = 0 есть точки zn, в которых
функция не определена (точку такого типа часто
называют предельной точкой полюсов).
В проколотой окрестности
изолированной особой точки а е С функцию можно
разложить в ряд Лорана:
/(*)=!>„ (*-«)"=
"=~~ (4.7.7)
В этом случае говорят о лорановском
разложении функции f(z) в окрестности особой
тонки Z = о, причем ряд в правой части
представления (4.7.7) называют рядом Лорана в
окрестности этой особой точки.
Ряды
оо оо
л=о «=1 (Z - а)
на которые разделяется ряд Лорана, называют
соответственно правильной и главной частью
лорановского разложения (4.7.7) функции
/ (z) в окрестности точки z = о. Главная
часть есть сумма всех членов ряда Лорана с
отрицательными степенями Z - я, которые
стремятся к бесконечности при z —> а, и
представляет собой функцию, аналитическую
в проколотой окрестности точки а.
Правильная часть лорановского разложения функции
содержит члены с неотрицательными
степенями z - а и представляет собой
обыкновенный степенной ряд, т.е. аналитическую
функцию в окрестности точки z = а.
Тип (характер) изолированной особой
точки можно определить по виду
лорановского разложения функции в окрестности
этой точки. Устранимой особой точке
соответствует лорановское разложение, в котором
нет слагаемых отрицательных степеней, т.е.
ряд Лорана фактически является
обыкновенным степенным рядом. Полюсу соответствует
ряд Лорана, в котором присутствует (т.е.
отлично от нуля) лишь конечное число
слагаемых отрицательных степеней. В существенно
особой точке лорановское разложение имеет
бесконечное число слагаемых отрицательных
степеней.
Отметим, что если функция ограничена
в окрестности изолированной особой точки,
то эта точка является устранимой особой, т.е.
для аналитической функции из локальной
ограниченности вытекает существование
предела в изолированной особой точке. Если
изолированная особая точка Zq является
устранимой, то, доопределив функцию в этой
точке значением предела, получим функцию,
аналитическую в точке Zq- Таким образом,
устранимые особые точки связаны не с
поведением аналитической функции в
окрестности, а с тем, как эта функция была
определена. Часто предполагают неявно, что в каждой
устранимой особой точке аналитическая
функция доопределена и является
аналитической.
Изолированная особая точка Zjq
является полюсом функции f(z) тогда и только
тогда, когда для функции l//(z) эта точка
является нулем (а точнее, устранимой особой
точкой, которая после доопределения
функции ее пределом становится нулем). При этом
кратность нуля функции \/f(z) называют
порядком полюса функции f{z)- Полюс
первого порядка называют простым.
Если Zq — полюс порядка т функции
f(z), то существует конечный ненулевой
предел
Z->a
Этот предел равен нулю или °°, если число
т не совпадает с порядком полюса. Поэтому
порядок полюса условием (4.7.8) определяется
210
Глава 4.7. НУЛИ И ОСОБЫЕ ТОЧКИ АНАЛИТИЧЕСКОЙ ФУНКЦИИ
однозначно, и это условие часто берут за
основу определения полюса функции. Из
представления (4.7.8) вытекает асимптотическая
формула
f(z) , А±0,
z~>a (z - а)
по которой также можно найти порядок
полюса.
Порядок полюса можно также
определить по виду лорановского разложения
функции в этом полюсе. Порядок полюса
совпадает с максимальной по модулю отрицательной
степенью среди членов лорановского
разложения. Например, функция j в точке
Z
Z = 0 имеет полюс второго порядка,
поскольку, во-первых,
l\mz2f{z)=\iml-™SZ=±-*0,
а во-вторых,
1 - cos z _ 1 1
Z4 "2!?~4! + "'
и в лорановском разложении присутствует
отрицательная степень с показателем 2.
В окрестности существенно особой
точки аналитическая функция имеет сложное
поведение. Согласно теореме Сохоцкого, если
Zq е С — существенно особая точка функции
f{z), то для любого А Е С существует
последовательность точек zn e С, сходящаяся к
точке z = я, для которой f(zn)—>А при
п —> оо. Кратко теорему Сохоцкого можно
сформулировать так: в существенно особой
точке множество предельных значений
аналитической функции совпадает с расширенной
комплексной плоскостью. На самом деле
имеет место более сильное утверждение.
Согласно теореме Пикара, в любой сколь угодно
малой окрестности существенно особой точки
аналитическая функция принимает все
значения комплексной плоскости, кроме,
возможно, одного.
Бесконечно удаленная точка всегда
рассматривается как особая точка аналитической
функции. Точку Z = °° можно отнести к
изолированным особым точкам, если функция
определена и аналитична в некоторой
окрестности этой точки, т.е. в некоторой области
И > *•
Тип особой точки z = °° определяют
так же, как и любой конечной точки —
исходя из предела функции в этой точке.
Изолированную особую точку z = °° называют:
1) устранимой особой точкой функции
f(z), если существует и конечен предел этой
функции при z —» °°;
2) полюсом функции f(z), если
существует предел lim f(z) = °°;
z—>о°
3) существенно особой точкой функции
f(z), если эта функция не имеет ни
конечного, ни бесконечного предела при z —> °°-
Как и в случае конечных точек, если
Z = °° является устранимой особой точкой
функции f(z), то, доопределяя в ней
функцию пределом, ее причисляют к точкам
аналитичности функции.
Так как
lim/(«)=lim/fi\
то исследование функции f[z) в
окрестности особой точки z = °° можно свести к
исследованию функции /(1/w) в окрестности
конечной точки w = 0.
Лорановским разложением функции f(z)
в окрестности изолированной особой точки
I = оо называют ряд Лорана функции f(z)
по степеням Z, в который эта функция
разложена в области \z\ > R. При этом главной
частью лорановского разложения функции
f(z) в окрестности бесконечно удаленной
точки называют ту часть этого разложения,
которая содержит все положительные степени
Z (т.е. те, которые стремятся к оо при
Z —> °°), а правильной частью лорановского
разложения — ту часть лорановского
разложения, которая содержит нулевую и все
отрицательные степени (те, которые имеют
конечный предел при z —» °°).
Тип особой точки z = °° функции
f(z) совпадает с типом особой точки w = 0
функции /(1/и>). Но из лорановского
разложения функции f(z) в окрестности точки
Z = оо легко получить лорановское
разложение функции /(1/и>) в окрестности точки
ВЫЧЕТ В КОНЕЧНОЙ ТОЧКЕ
211
w = О простой заменой z = 1/w в ряде
Лорана. Отсюда нетрудно сделать следующие
выводы. Изолированная особая точка z = °°
функции f(z) является:
1) устранимой особой точкой, если ло-
рановское разложение функции / (z) в
окрестности z = °° не содержит положительных
степеней z (отсутствует его главная часть);
2) полюсом, если лорановское
разложение функции / (z) в окрестности z = °°
имеет конечное число слагаемых с
положительными степенями, причем порядок полюса
совпадает с максимальной степенью среди
ненулевых слагаемых лорановского
разложения;
3) существенно особой точкой, если
лорановское разложение функции f(z) в
окрестности z = °° содержит бесконечное число
слагаемых с положительными степенями.
Например, для функций ez, sinz,
cosz бесконечно удаленная точка является
существенно особой точкой. Действительно,
стандартные разложения этих функций по
степеням z можно рассматривать как их ло-
рановские разложения в окрестности z = °°,
а они содержат бесконечное число слагаемых
с положительными степенями z.
Целые функции, т.е. функции,
аналитические на всей комплексной плоскости,
можно разделить по типу особой точки z - °°-
Если Z - °° — устранимая особая точка
целой функции, то такая функция ограничена в
С и, согласно теореме Лиувилля, постоянна в
С. Если z = °° — полюс порядка те N
функции f(z), то главная часть G(z)
лорановского разложения функции f(z) в
окрестности точки z = °° имеет конечное число
слагаемых и представляет собой многочлен.
Функция f(z)~G(z) является целой и
имеет в оо устранимую особую точку, а значит,
постоянна. Таким образом, если у целой
функции точка z = °° является полюсом, то
эта функция — многочлен. Для целой
функции, не являющейся многочленом (т.е. целой
трансцендентной функции), точка z = °°
существенно особая.
Функцию, не имеющую в комплексной
плоскости, помимо полюсов, других особых
точек, называют мероморфной. В каждом
круге Ы < R мероморфная функция может
иметь лишь конечное число полюсов. Иначе
множество полюсов имело бы в этом круге
предельную точку, которую нельзя было бы
отнести к изолированным особым точкам.
Следовательно, мероморфная функция может
иметь в комплексной плоскости не более чем
счетное множество полюсов. Мероморфными
функциями с бесконечным множеством
полюсов являются tgz, ctgz, 1/sinz, \/(ez-\\.
Рациональная функция как отношение двух
многочленов является мероморфной
функцией и имеет на комплексной плоскости
конечное число полюсов. Точка z = °° для
рациональной функции является либо устранимой
особой (если степень числителя не превышает
степени знаменателя), либо устранимой
особой точкой, либо полюсом. Если функция
аналитична в С всюду, кроме конечного
числа точек, являющихся полюсами функции, то
эта функция рациональная. В самом деле,
достаточно из функции вычесть главные части
лорановских разложений в каждом полюсе, в
совокупности составляющих рациональную
функцию. Полученная разность не будет
иметь изолированных особых точек в С
(кроме устранимых особых), значит, будет
постоянной. Отсюда, в частности, получаем
метод разложения рациональной функции на
элементарные дроби: правильная
рациональная дробь есть сумма главных частей
лорановских разложений во всех нулях знаменателя
дроби, а каждое лорановское разложение есть
сумма элементарных дробей.
Глава 4.8
ВЫЧЕТЫ В ИЗОЛИРОВАННЫХ
ОСОБЫХ ТОЧКАХ
4.8.1. Вычет в конечной точке. Пусть
функция f(z) является аналитической в
некоторой проколотой окрестности 0 < \z - а\ < f
точки а е С. Вычетом функции f [z) в точке
а называют значение контурного интеграла
где L — некоторый замкнутый простой
кусочно гладкий контур, охватывающий точку а
и лежащий целиком в кольце 0 < \z ~ а\ < г.
Обозначают вычет, как правило, одним из
следующих символов:
Res/(z), Ksaf(z), Res[/(*),e].
212
Глава 4.8. ВЫЧЕТЫ В ИЗОЛИРОВАННЫХ ТОЧКАХ
Вычет аналитической функции можно
было бы рассматривать и в точке
аналитичности функции. Однако, согласно теореме Коши
для односвязной области, интеграл (4.8.1) по
контуру, окружающему точку аналитичности,
равен нулю, и понятие вычета в точке
аналитичности оказывается бессодержательным. По
тем же причинам можно не рассматривать
устранимые особые точки, так как такие
точки всегда можно считать точками
аналитичности функции.
Из теоремы Коши для многосвязной
области вытекает, что вычет не зависит от
формы контура L. Поэтому для вычисления
контурного интеграла (4.8.1) можно выбрать
простейший контур L, а именно окружность с
центром в точке Z-Q- Такой контур
описывается простым комплексным уравнением
Z = а + ре/(р, (ре [0,2л], а это облегчает
вычисления.
Основой в теории вычетов является
следующая теорема Коши о вычетах: если
функция f(z) является аналитической на простом
контуре L и в ограниченной этим контуром
области D, за исключением конечного числа
изолированных особых точек av e D, v = l,/i,
то
(bf{z)dz = 2niT Res f(z). (4.8.2)
v=l
Таким образом, вычисление контурного
интеграла от функции f(z) по контуру L
при выполнении условий теоремы Коши
сводится к вычислению вычетов этой функции в
изолированных особых точках, охватываемых
этим контуром. Вычет функции в особой
точке легко вычислить, если известно лорановское
разложение функции в окрестности этой особой
точки. Вычет функции f(z) в
изолированной особой точке z- Q равен коэффициенту
c_i лорановского разложения f (z) в
окрестности а (говорят: «при минус первой
степени z - а »).
Пример 4.8.1. Вычет функции е 'z в
точке z = 0 равен 1, так как
1
1
1!* 2\z2
sin2 z
и с_! = 1. Вычет функции f(z)= ^
Z
точке z = 0 равен 1, поскольку
2z3
1.
sin z _\-cos2z _
~1Г = ~~2^~ =
\2zf_ (2zf (2zf
2! 4! 6!
и c_[
4.8.2. Вычисление вычета в полюсе.
Если ае С — полюс функции f(z) порядка
/я, то существует конечный ненулевой
предел
lim(z-a)mf(z) = A*0.
Следовательно, для функции ф(^) =
-(z-d) f{z) точка а является
устранимой особой, лорановское разложение
функции является ее рядом Тейлора, причем
коэффициент с_\ в лорановском разложении
f(z) в точке а является коэффициентом
ряда Тейлора функции (p(z) в слагаемом
степени т-\. Отсюда получаем следующую
формулу вычисления вычета функции f(z) в
точке а, являющейся полюсом порядка т :
(4.8.3)
Отметим, что эта формула остается верной,
если в ней натуральное число т больше
порядка полюса. Например, функция
J {Z) = ? имеет в точке z = 0 полюс
Z
второго порядка. Поэтому вычет в точке
Z = 0 можно вычислить или по формуле
Res/(,) = I,im(l»l^l])
Z=a Iz^ay Z J
или по формуле
Res f(z) = — lim (sin z-z) •
z=o 4! z->tf
Вторая формула оказывается в вычислениях
более удобной.
В частном случае простого полюса
формула упрощается:
ВЫЧЕТ В БЕСКОНЕЧНО УДАЛЕННОЙ ТОЧКЕ
213
Res/(*)=lim ((*-*)/(*)).
Z=o z->a
Пусть а — простой полюс функции
f(z) и эта функция представлена в виде
f(Z) = ~(\9 Где ФУ"^1111 ф(*) и VW
аналитичны в точке а, причем ср(я) Ф О, а
для функции У (г) точка д является
простым нулем. Тогда
z=a у (а)
Например, чтобы найти вычет функции
в точке z = -1, положим
Vi)
ф(г) = -у и \р(г) = Г+1.
Тогда
Re-
S-',2(,4i)
ег
_ 1
z=-\
-1
Для вычета функции в существенно
особой точке общей формулы нет. В таком
случае необходимо либо найти лорановское
разложение функции в окрестности
рассматриваемой точки, либо, манипулируя
степенными рядами, непосредственно определить
коэффициент при минус первой степени лора-
новского разложения.
Пример 4.8.2. Для функции
/(*) =
sin(l/z)
\-z
точка z - 0 является существенно особой.
Используя стандартные разложения для
функций sinw = sin— и , в области
Z X-Z
О < |z| < 1 получаем
Sill (1/Z)
3!^ 5!*э
При произведении степенных рядов каждый
член первого ряда умножается на каждый
член второго. Выбирая такие произведения, у
которых суммарная степень равна —1, находим
представление коэффициента c_j в виде ряда
.ill f, (-1)"
С | =1 \- \-... = > — .
-' 3! 5! 7! £0(2« + 1)!
Нетрудно увидеть, что этот ряд есть ряд
Тейлора функции sinz при фиксированном
значении z = l- Поэтому Res/(z) = c_i =sinl.
4.8.3. Вычет в бесконечно удаленной
точке. Пусть функция f(z) является
аналитической в области |z| > R для некоторого
числа R > 0. Тогда z = °° для f(z)
является изолированной особой точкой. Вычетом
Res/(z) функции f(z) в бесконечно удален-
z=°°'
ной точке z = °° называют значение интеграла
Res f(z) = -±-j)f(z)dz, (4.8,
<(l + z + z2 +z3 +zA +...).
4)
вычисляемого по простому кусочно гладкому
контуру L, расположенному в области
\z\ > R. При этом контур обходится по
часовой стрелке (т.е. в отрицательном
направлении). Как и в случае конечной точки,
значение контурного интеграла не зависит от
выбора контура L, и в качестве такого контура
можно взять окружность |z| = р с р > R.
Вычет функции f(z) в бесконечно
удаленной точке равен -C_i, где c_j —
коэффициент лорановского разложения функции в
окрестности ©о при минус первой степени.
Отметим, что коэффициент с_\ в конечной
особой точке входит в главную часть
лорановского разлржения, а в бесконечно удаленной
точке — в правильную часть. Поэтому вычет в
©о может быть ненулевым в случае, когда эта
точка является устранимой особой. Вычет в
точке ©о равен нулю, если эта точка является
кратным нулем функции: в этом случае в
лорановском разложении функции
ненулевыми являются лишь слагаемые степеней
т < -2 и коэффициент c_j,
соответствующий т = 1, равен нулю. Отметим также, что
нулевой вычет в бесконечно удаленной точке
имеют четные функции, поскольку в их
лорановском разложении присутствуют лишь
четные степени Z-
214
Глава 4.8. ВЫЧЕТЫ В ИЗОЛИРОВАННЫХ ТОЧКАХ
Если точка z = °° является простым
нулем функции f{z), то вычет в этой точке
можно вычислить по формуле
Res/(*)= Kmzf(z).
z=°° z—>°°
Вычет в бесконечно удаленной точке
может использоваться для вычисления
контурных интегралов в тех случаях, когда
вычеты для конечных особых точек по каким-либо
причинам определить не удается. Если
функция имеет в С конечное число
изолированных особых точек, то сумма всех вычетов
функции, включая и бесконечно удаленную
точку, равна нулю. Следовательно, вычислить
контурный интеграл можно с помощью
вычетов для особых точек не внутри контура, а
вне его. Например, контурный интеграл
j) ^—T~dz
равен нулю. Действительно, его значение
равно сумме вычетов по всем точкам внутри
контура (это теорема Коши о вычетах) и
равно сумме вычетов с обратным знаком по всем
особым точкам, находящимся снаружи
контура. Но снаружи контура функция имеет
единственную особую точку — бесконечно
удаленную. В этой точке, как видно, функция
имеет нуль кратности 2 и вычет, равный
нулю. Значит, и интеграл равен нулю.
4.8.4. Логарифмический вычет. Пусть
f(z) является аналитической функцией в
проколотой окрестности 0 < |^ - а\ < г точки
Z = й и не обращается в этой окрестности в
нуль. Логарифмическим вычетом функции
f(z) в точке z = а называют вычет ее
логарифмической производной f'{z)/f(z) в
этой точке, т.е. значение
где контур интегрирования L — любой
простой контур, расположенный в окрестности
О < \z - а\ < а и охватывающий точку а.
Логарифмический вычет функции f(z)
может быть отличен от нуля как в
изолированных особых точках функции, так и в ее
нулях, поскольку именно эти точки являются
особыми точками функции f'{z)/f{z)- В
нуле функции f(z) логарифмическая
производная f'{z)/f(z) имеет простой полюс, а
логарифмический вычет равен кратности
этого нуля. В полюсе функции f(z) порядка
т логарифмическая производная f'{z)/f{z)
этой функции также имеет простой полюс, а
вычет в этой точке равен -т.
Логарифмический вычет — удобный
инструмент для подсчета в областях общего
числа нулей и полюсов с учетом их порядка.
Если функция f(z) является аналитической в
области D и на ограничивающем D кусочно
гладком контуре L, не является постоянной
в D и имеет в D конечное число нулей и
полюсов, в то время как на контуре L нет ни
нулей, ни полюсов функции, то интеграл по
контуру L от логарифмической производной
функции, деленный на 2л/, равен разности
между общим числом нулей с учетом их
кратности и общим числом полюсов с учетом их
порядка, т.е.
^Т7Т* = ^-/>' (4'85)
где N — общее число нулей, в котором
каждый нуль считается столько раз, какова его
кратность, а Р — общее число полюсов, в
котором каждый полюс считается столько раз,
каков его порядок.
Интеграл в равенстве (4.8.5) имеет
простой геометрический смысл: его значением
является приращение, которое функция
/ Arg/(z) получает при однократном обходе
контура против часовой стрелки.
Действительно, подынтегральная функция в любой
односвязной области имеет первообразную
Lnf(z) (можно выбрать любую ветвь этой
многозначной функции). При обходе контура
действительная часть Ln/(z) дает нулевое
приращение, а мнимая часть Ln/(z) как раз
и есть функция Avgf(z).
Таким образом, верно следующее
утверждение, называемое принципом аргумента:
приращение аргумента Arg/(z) функции
f(z) вдоль замкнутого контура L, деленное
на 2л, совпадает с разностью N - Р общего
числа нулей N и общего числа полюсов Р
внутри контура с учетом их порядка.
Приращение аргумента функции можно
представить следующим образом. Пусть
контур L в плоскости (z) при отображении
ВЗАИМНО ОДНОЗНАЧНЫЕ ОТОБРАЖЕНИЯ
215
w = f(z) переходит в контур Г в плоскости
(w). Тогда приращение аргумента функции,
деленное на 2л, равно количеству оборотов
вокруг начала координат, которые точка w
сделает при обходе контура Г. Оборот вокруг
начала координат положительный, если он
совершается против часовой стрелки, и
отрицательный - в противоположном случае.
Из принципа аргумента вытекает
следующее утверждение, называемое теоремой
Руше: если функции f(z) и ф(г) являются
аналитическими в области D и на
ограничивающем эту область кусочно гладком контуре
L, во всех точках контура L удовлетворяют
неравенству |ф(г)| > j/(*)|> то функции
<p(z) + f(z) и (p(z) имеют в D одинаковое
число нулей (с учетом их кратности).
При помощи теоремы Руше можно
находить число корней некоторых уравнений в
ограниченной области.
Пример 4.8.3. Найдем число корней
уравнения z + Z +1=0 внутри окружности
\z\ = 2. На этой окружности имеем \z\ = 4,
1 = 32 - 1 =
= 31 > \zr\- Поэтому, согласно теореме Руше,
у функций ф(г) = г5 + 1 и ф(г)+ /(^) =
= Z + Z + 1 внутри окружности \z\ = 2
одинаковое число нулей. Но у уравнения
Z +1=0 пять корней, и все они
расположены на окружности \z\ = 1, т.е. внутри
окружности |z| = 2. Таким образом, исходное
уравнение имеет пять корней внутри
окружности \z\ = 2.
Глава 4.9
ГЕОМЕТРИЧЕСКИЕ ПРИНЦИПЫ
ТЕОРИИ ФУНКЦИЙ
КОМПЛЕКСНОГО ПЕРЕМЕННОГО
4.9.1. Взаимно однозначные
отображения. Любая функция w = f(z)
комплексного переменного £, определенная на
некотором множестве D комплексной плоскости
(z), представляет собой отображение D в
и в силу (4.1.10) \z5 + 1 > \z5
комплексную плоскость (w). Ограничимся
здесь случаем, когда D является областью, а
функция f(z) ~~ аналитической в D.
Функцию, аналитическую в области D,
называют однолистной, если для любых точек
Z\ и Z2 в D из равенства f(z\) = f (Zi)
вытекает, что Z\ = Zj- Однолистность
функции f(z) в D означает, что
соответствующее отображение области D в плоскость (w)
инъективное.
Если функция является аналитической в
области D, то отображение из R в Ш ,
порождаемое этой функцией, будет
дифференцируемым в каждой точке области D. Из
теоремы об обратной функции для функций
многих переменных следует, что если
/'(Zo)*0 (тогда якобиан f(z) в точке £,
равный /'(z) ? отличен от нуля), то
существуют такие круги К = {z е С : \z - Zo\ < г} и
K' = {weC: Jw-w0|<n], что в круге К'
определено отображение z = g(w), обратное
к отображению w = f(z). При этом функция
комплексного переменного g(w) является
аналитической в К\ а ее производная может
быть вычислена по формуле
1
*» = "?
Если же f(z) является аналитической в
точке £q, а ее производная f'{z) в этой
точке имеет нуль кратности т - 1, то
существуют такие круги К = jz e С : \z - Zq\ < /*} и
К' = [w е С : \w - w0| < ц}, что для любого
числа w e K\ w * w0, уравнение f(z) = w
имеет в круге К ровно т различных
корней. Таким образом, в окрестности нулей
f'{z) Функция f(z) не может быть
однолистной, а необходимым условием
однолистности аналитической функции оказывается
отсутствие в области нулем у ее производной.
Говорят, что функция f(z) однолистна
в точке Z = я, если существует окрестность
216
Глава 4.9. ГЕОМЕТРИЧЕСКИЕ ПРИНЦИПЫ ТЕОРИИ
этой точки, в которой f[z) однолистна. При
этом точку а называют точкой
однолистности функции f(z)- Необходимым и
достаточным условием однолистности функции
f(z) в точке а является выполнение
неравенства f'(a)*0.
Понятие однолистности функции можно
распространить на случай бесконечно
удаленной точки. Аналитичность функции в точке
1 = ©о означает, что f(z) аналитична вне
некоторого круга на комплексной плоскости
(т.е. в проколотой окрестности точки z = °° )
и имеет конечный предел при z —» °°. Так
как функция £ = \/z осуществляет взаимно
однозначное отображение окрестности точки
Z = °° на окрестность точки С, = О, то
однолистность функции f(z) в точке z = °°
равносильна однолистности функции g(Q = f(\/Q
в точке £ = 0. В этом случае выполняется
условие g'(C)*0, означающее, что функция
f{z) в точке z = °° имеет ненулевой вычет.
Понятие однолистности можно
рассматривать в полюсе функции (конечном или
бесконечном). Полюс а функции f (z)
является нулем функции \jf(z)- Поэтому
однолистность f(z) в точке а равносильна
однолистности в этой точке функции \jf(z)-
Но функция \jf{z) имеет нуль в точке
Z = о, и ее однолистность в этой точке
означает, что нуль простой. Следовательно,
критерием однолистности функции f(z) в ее
полюсе z = а является условие, что этот полюс
простой.
Необходимым условием однолистности
функции в области является ее однолистность
в каждой точке области (т.е. локальная
однолистность). Однако это условие не является
достаточным. Например, функция ez
является локально однолистной на всей
комплексной плоскости, так как ее производная нигде
не обращается в нуль, но она не является
однолистной в плоскости, поскольку
принимает одинаковые значения, например, в
точках z и Z + 2 л/. Проверка однолистности
функции в области значительно сложнее, чем
в точке.
4.9.2. Свойства конформных
отображений. Если функция f(z) является
аналитической в точке Zq и /' (^о) Ф 0, то
отображение, осуществляемое функцией f(z),
сохраняет углы между кривыми,
проходящими через точку ^о, т.е. является конформным
в этой точке. Таким образом, если
аналитическая функция локально однолистна в области
D (т.е. однолистна в каждой точке D), то
соответствующее отображение является
конформным в D. Оказывается, что условие
локальной однолистности не только
достаточное, но и необходимое условие
конформности, т.е. если отображение w = /(z),
осуществляемое аналитической функцией /(г),
конформно в точке Zq, то в этой точке
Отметим два очевидных свойства
конформных отображений:
1) если отображение w = f(z)
конформно и однолистно, то обратное к нему
отображение Z-f~ (w) также конформно и
однолистно, причем, если при отображении
w = f(z) кривые в точке Zq поворачиваются
на угол (р, то при отображении z = f (w)
кривые в точке w0=/(Zo) поворачиваются
на угол -ф (т.е. на тот же угол, но в
противоположном направлении);
2) композиция / о g двух конформных
отображений fug есть конформное
отображение, причем угол поворота кривых в
точке Zq при отображении / о g равен
сумме угла поворота кривых в точке Zq при
отображении g и угла поворота кривых в точке
g(Zo) при отображении /.
Остановимся на понятии конформного
отображения в бесконечно удаленной точке. В
данном случае естественно в качестве модели
расширенной комплексной плоскости взять
сферу Римана, а кривые, проходящие через
бесконечно удаленную точку, рассматривать
как кривые на сфере Римана, проходящие
через «северный полюс». Углом между
кривыми Y) и Y2 в точке z = °° называют угол
между изображениями этих кривых на сфере
Римана в «северном полюсе».
СВОЙСТВА КОНФОРМНЫХ ОТОБРАЖЕНИЙ
217
Отображение w = \/z осуществляет
взаимно однозначное отображение расширенной
комплексной плоскости на себя, причем
точка z = °° переходит в точку w = 0. Это
отображение осуществляет поворот сферы Рима-
на на 180° вокруг оси, параллельной
действительной оси комплексной плоскости и
проходящей через центр сферы. Ясно, что при этом
отображении углы между кривыми в точке
Z = °° сохраняются. Другими словами, угол
между двумя кривыми в точке z = °° равен
углу между образами этих кривых в точке
w = 0 при отображении w = \/z. После
этого уточнения ясно, что следует понимать
под отображением, конформным в точке
Z = °° : такое отображение должно сохранять
углы между кривыми в точке z = °°.
Понятие угла между кривыми в
бесконечно удаленной точке позволяет определить
конформность отображения w = f(z)
расширенной комплексной плоскости в себя в
тех точках Z, для которых либо Z = °°, либо
f(z) = °°. Используя отображение w = 1/z,
можно показать, что критерием
конформности отображения в бесконечно удаленной
точке является однолистность функции f(z)
в этой точке.
Обычно под отображением,
конформным в области, понимают отображение,
осуществляемое аналитической функцией,
однолистной в этой области. В этом случае
отображение конформно в каждой точке области,
но, кроме того, является инъективным
отображением в этой области.
Если для областей G\ и (72
расширенной комплексной плоскости существует
конформное отображение G\ на (72, то эти
области называют конформно эквивалентными.
В теории конформных отображений
наиболее полно разработан случай односвяз-
ных областей. Согласно теореме Романа,
любая односвязная область, граница которой
содержит не менее двух точек, конформно
эквивалентна кругу. Таким образом,
конформная эквивалентность разделяет все одно-
связные области на три группы:
1) расширенная комплексная плоскость
(эта область не имеет границы);
2) комплексная плоскость и
расширенная комплексная плоскость с выколотой
точкой (граница состоит из одной точки);
3) все остальные области, эквивалентные
канонической односвязной области —
единичному кругу \т\ < 1.
Конформное отображение области <7]
на область (72 определяется неоднозначно. В
самом деле, если f(z) осуществляет
конформное отображение G\ на <72, a (p(z)
осуществляет конформное отображение (72
на (72 (такое отображение называют
конформным автоморфизмом области <72), то
сложная функция ф(/(г)) осуществляет
конформное отображение G\ и <72. Верно и
обратное: если функции f\{z) и /2 (z)
осуществляют конформное отображение <7] на
<72, то имеет место представление
/2(z) = <p(/i(z)), где ф — функция,
осуществляющая конформный автоморфизм
области <72.
Как следует из сказанного, важно знать
строение множества автоморфизмов для
различных областей. Отметим, что множество
конформных автоморфизмов данной области
G относительно операции композиции
образует группу. Группа конформных
автоморфизмов комплексной плоскости С — это
группа всех дробно-линейных функций
w = , ad - be ф0. Конформные авто-
cz + d
морфизмы единичного круга |z| < 1 также
являются дробно-линейными функциями, а
их множество описывается формулой
w = eia Z ^ , ссеМ, яеС, Ы<1.
\ + aZ
Укажем также группу конформных
автоморфизмов верхней полуплоскости Im z > 0 :
w = , a,b,c,d e
cz + d
а Ь
с d
>0.
Из приведенных формул следует, что
конформный авторморфизм единичного круга
(верхней полуплоскости) однозначно
определяется тремя действительными параметрами.
Значит, для однозначного определения
конформного отображения области G на
единичный круг (верхнюю полуплоскость)
необходимо задать три условия, равнозначных
заданию трех действительных параметров.
Например, достаточно задать образ w0 одной
218
Глава 4.9. ГЕОМЕТРИЧЕСКИЕ ПРИНЦИПЫ ТЕОРИИ
точки Zo e G и значение arg/'(zo) д<пя
функции f(z), осуществляющей
конформное отображение. Задание трех
действительных параметров для однозначного
определения конформного отображения называют
нормировкой конформного отображения.
4.9.3. Принцип соответствия границ.
В теории конформных отображений важную
роль играет исследование поведения
аналитической функции вблизи границы области.
Ясно, что при отображении области G\ на
область Gj должно устанавливаться
соответствие в каком-либо смысле и между
границами этих областей. Сформулируем два
утверждения, которые характеризуют указанное
соответствие в случае конформных
отображений и которые имеют важное практическое
значение.
Первое утверждение, известное как
теорема Каратеодори, а также как принцип
соответствия границ, гласит следующее: пусть D
и D* — односвязные области, ограниченные
простыми кусочно гладкими контурами Г и
Г*, а функция f(z) однолистно и
конформно отображает область D на область
D*. Тогда:
1) функция f(z) имеет непрерывное
продолжение на границу Г области Д т.е.
ее можно так доопределить в точках контура
Г, что получится функция, непрерывная в
замыкании D области Д
2) функция f(z), доопределенная на
границе, отображает контур Г взаимно
однозначно на контур Г , причем так, что
положительному обходу контура Г будет
соответствовать положительный обход контура Г*.
Второе утверждение в некотором смысле
является обратным к принципу соответствия
границ, и его иногда называют обратным
принципом соответствия границ.
Пусть функция f(z) аналитична в од-
носвязной области D с С, ограниченной
кусочно гладким контуром Г, и непрерывна
в замыкании D этой области. Если функция
f(z) осуществляет взаимно однозначное
отображение контура Г на некоторый
простой кусочно гладкий контур Г*, то f(z)
отображает область D конформно и
однолистно на область D*, ограниченную контуром
Г , причем обходу контура Г в
положительном направлении соответствует обход контура
Г* также в положительном направлении.
Отметим также принцип сохранения
области, согласно которому образ D* = / (D)
области D при отображении,
осуществляемом аналитической в D функцией f(z),
является областью.
4.9.4. Принцип максимума модуля
функции. Если функция f(z) аналитическая
в области Д а ее модуль \f{z\ достигает
локального максимума в некоторой точке
Zq е Д то f{z) постоянна в D. Это
утверждение известно как принцип максимума
модуля.
Из принципа максимума модуля
вытекает, что функция f(z), аналитическая в
области D и непрерывная в замыкании D
этой области, достигает наибольшего
значения в D на границе области.
Аналогичное утверждение для
наименьшего значения модуля функции, вообще
говоря, неверно. Действительно, любой нуль
функции f(z) является точкой локального
минимума модуля функции /(z)L
Например, функция f(z) = Z в круге \z\ < 1
Достигает минимального значения модуля в точке
Z = 0. Однако если аналитическая в области
D функция f(z) не имеет в D нулей, а ее
модуль достигает в D локального минимума,
то / (z) постоянна в этой области.
Принцип максимума модуля приводит к
следующему результату, называемому леммой
Шварца. Если аналитическая в круге
D = {ze С:|г|<1} функция f(z)
удовлетворяет условиям /(0) = 0 и /(И<1,
ZeD, то |/'(0)|<1 и |/(ф|г| при
Z£ D. При этом равенство /'(О) = 1 или
/(ZoH = |zo| возможно в некоторой точке
Zo^D лишь тогда, когда f(z) = zeia,
осе М.
ПРИНЦИП СИММЕТРИИ
219
Известен принцип максимума для
гармонических функций. Согласно этому
принципу, функция и(х,у)у гармоническая в
ограниченной области Д непрерывная в
замыкании этой области и не являющаяся
постоянной в D, достигает наибольшего и
наименьшего значений только на границе этой
области.
4.9.5. Принцип симметрии. Пусть две
односвязные области Д и ^ в расширенной
комплексной плоскости не пересекаются, но
имеют общий участок границы в виде простой
кусочно гладкой дуги у (рис. 4.9. \). Если
функция /А (z) является аналитической в
области D[ и непрерывной на множестве
A U У, а функция /2 {z) ~ аналитической в
А и непрерывной на множестве A U У,
причем f\(z) = /2 (z) при z е У, то функция
/(*) =
fi(z), zeD{;
/2 (*), zefy;
A{z) = f2{z)> zey,
(4.9.1)
области
является аналитической е
Z) = AUyUA-
Сформулированное утверждение
называют принципом непрерывности. Функцию
f(z), определенную соотношением (4.9.1),
можно рассматривать как аналитическое
продолжение в область D каждой из функций
f[ (z) и /2 (z) из областей А или А.
Поэтому принцип непрерывности можно
сформулировать так: если дута у является общим
участком границы непересекающихся
областей D\ и А> а Функции /j (z) и /2 {z)
являются аналитическими соответственно в
А и А' непрерывными и равными на дуге
у, то эти функции будут аналитическими
продолжениями друг друга.
Принцип непрерывности можно
использовать при продолжении функции через
отрезок прямой. В результате придем к
следующему утверждению, называемому принципом
симметрии: пусть А ~~ односвязная область,
лежащая в верхней полуплоскости Im Z > О,
граница Г[ которой содержит интервал у
У| /<бГ-\ 00
О
гУ0Щг\ь
\fSl/Y
\^£г^У *
Рис. 4.9.1
действительной оси Im z = 0, а А ~" °б-
ласть, симметричная А относительно этой
оси (рис. 4.9.2). Если функция /j {z) является
аналитической в области А> непрерывной в
замыкании А этои области и принимает
действительные значения при Z е У, то эту
функцию можно аналитически продолжить в
область D = A U У U А по формуле
/(*) =
f/l(*), Ze AUy,
ТИП ^А-
(4.9.2)
Принцип симметрии в ряде случаев
позволяет упростить построение конформных
отображений областей, симметричных
относительно действительной оси. Использование
этого принципа основано на следующем
рассуждении. Пусть функция f(z) конформно
отображает односвязную область А на °б-
ласть А*» граница области А содержит
интервал прямой или дугу окружности у,
причем при отображении w = f(z) интервал
(дуга) у переходит в интервал (дугу
окружности) у*. Если область А' симметричная А
относительно у, не пересекается с А? то
функцию f(z) можно аналитически
продолжить в область D - A U У U А так' что
Рис. 4.9.2
220
СПИСОК ЛИТЕРАТУРЫ
точки, симметричные относителоно у будут
отображаться в точки, симметричные
относительно у*. Полученная функция будет
конформно отображать область D на область
D* = D[ U Y* U D2, где Dj — область,
симметричная D\ относительно у .
В силу сказанного для построения
конформного отображения области D на область
D* достаточно построить конформное
отображение области Д («половинки» D) на
область D\ («половинки» D*), которое
переводит интервал у в интервал у*. А
построение конформного отображения лишь
части области может оказаться более простой
задачей.
СПИСОК ЛИТЕРАТУРЫ
1. Араманович И.Г., Лунц ГЛ., Эльс-
голыдЛ.Э. Функции комплексного
переменного. Операционное исчисление. Теория
устойчивости. М.: Наука, 1968. 416 с.
2. Бугров Я.С., Никольский СМ.
Высшая математика: Дифференциальные
уравнения. Кратные интегралы. Ряды. Функции
комплексного переменного. М.: Наука, 1984.
448 с.
3. Волковыский Л.И., Лунц Г.Л.,
Араманович И.Г. Сборник задач по теории функций
комплексного переменного. М.: Физматгиз,
1961. 368 с.
4. Лаврентьев М.А., Шабат Б.В. Методы
теории функций комплексного переменного.
М.: Наука, 1987. 688 с.
5. Маркушевич А.И. Краткий курс
теории аналитических функций. М.: Наука, 1978.
416 с.
6. Морозова В.Д. Теория функций
комплексного переменного / Под ред. B.C.
Зарубина, А.П. Крищенко. М.: Изд-во МГТУ
им. Н.Э. Баумана, 2000. 520 с. (Сер.
Математика в техническом университете; Вып. X).
7. Привалов И.И. Введение в теорию
функций комплексного переменного. М.:
Высшая школа, 1999. 432 с.
8. Радыгин В.М., Голубева О.В.
Применение функций комплексного переменного в
задачах физики и техники. М.: Высшая
школа, 1983. 160 с.
9. Шабат Б.В. Введение в комплексный
анализ: В 2 т. Т. 1. М.: Наука, 1985. 336 с.
ЧАСТЬ II
АЛГЕБРА И ГЕОМЕТРИЯ
Раздел 5
ВЫСШАЯ АЛГЕБРА
Глава 5.1
АЛГЕБРА МНОГОЧЛЕНОВ
5.1.1. Многочлены одной переменной.
Многочленом одной переменной (полиномом)
называют выражение вида
P(x) = Oq + а{х + ... + апхп, (5.1.1)
получаемое из набора коэффициентов
многочлена %,..., ап и переменной х при помощи
операций умножения и сложения.
Коэффициенты многочлена могут быть
элементами любого кольца. Но обычно в
качестве области значений коэффициентов
рассматривают более узкий класс алгебраических
структур — поля. При этом говорят о
многочленах над данным полем S, что означает:
коэффициенты многочлена являются
элементами поля S и S является областью
изменения переменной х. Мы будем рассматривать
два варианта полей: поле действительных
чисел и поле комплексных чисел. Ясно, что
многочлен над полем действительных чисел
является частным случаем многочлена над
полем чисел комплексных. Два многочлена
равны, если их коэффициенты при
одинаковых степенях попарно равны.
В дальнейшем будем считать, что в
записи (5.1.1) коэффициент ап {старший
коэффициент) отличен от 0. Тогда натуральное
число п определяет максимальную степень
переменной в слагаемых многочлена. Это
число называют степенью многочлена. Степень
многочлена Р (х) обозначают deg P .
Коэффициент при нулевой степени переменной
(точнее, коэффициент единственного
слагаемого, не зависящего от переменной) принято
называть свободным членом.
В зависимости от ситуации понятию
многочлен может придаваться и более
конкретный смысл. Например, многочлен может
быть отождествлен с функцией
действительного или комплексного переменного, которую
многочлен определяет. Равенство
многочленов означает и равенство соответствующих
функций. Это дает основание (не
единственное, однако) для такого отождествления.
Формально в выражении (5.1.1) все
коэффициенты могут быть нулевыми. В этом
случае получается нулевой многочлен,
соответствующий функции, тождественно равной 0.
Если только первое слагаемое а$ отлично от
0, то мы получаем многочлен нулевой степени,
который соответствует постоянной функции.
Многочлен нулевой степени естественно
отождествлять с действительным либо
комплексным числом - его свободным членом.
5.1.2. Операции над многочленами.
Над многочленами можно выполнять две
операции: сложение и умножение. Суммой
многочленов
Р (х) = а0 + а{х +... + апхп, (5.1.2)
Q(x) = bo + t\x +... + bsxs (5.1.3)
называют многочлен Я(х) = Р (х) + Q (х) =
= Cq + С\Х +... + qx с коэффициентами ск =
= ак+ Ьк , к = 0,..., / = max {я, s}
(недостающие коэффициенты считаются равными 0).
Степень суммы многочленов не превосходит
максимальной из степеней слагаемых.
Произведением многочленов Р(х) и
Q(x) называют многочлен
Т(х) = Р (х) Q (x) = dQ+d{x + ... + dmxm
степени m = n + s с коэффициентами
222
Глава 5.1. АЛГЕБРА МНОГОЧЛЕНОВ
к
ск = Х*А-л к = °>->п
(опять-таки, недостающие коэффициенты
считаются равными 0). При умножении
многочленов их степени складываются.
Относительно указанных операций
множество всех многочленов с
коэффициентами из данного поля Р образует кольцо
многочленов, являющееся кольцом с единицей (роль
единицы играет многочлен нулевой степени
1).
Сложение имеет обратную операцию —
вычитание (это общее свойство колец).
Однако операция деления, обратная к умножению,
может выполняться не всегда, т.е. кольцо
многочленов не является полем. Например,
ненулевой многочлен обладает обратным,
только если он имеет степень 0.
5.1.3. Деление многочленов. Для
любых двух многочленов Р(х) и Q(x) имеет
место представление
P(x) = a(x)Q(x) + $(x), (5.1.4)
где сс(х) и Р(х) — многочлены, причем
degp<deg(?. Представление (5.1.4)
единственно и называется делением Р(х) на Q(x)
с остатком. В этом представлении многочлен
а(х) называют частным, а многочлен р(х) -
остатком.
Представление (5.1.4) может быть
получено при помощи процедуры деления "в стол-
бик" подобно делению целых чисел.
Например, если Р(х) = Зх2 + 2х +1, Q(x) = -5х + 2,
то:
Зх2 + 2х +1
Зх2-1,2 I "5х + 2
—— 1-0,6*-0,64
3,2х +1
~ 3,2s-1,28
2,28
Таким образом, P(x)=(-0,6x-0,64)Q(x)+Z2S.
Частный случай деления многочлена
Р(х) на многочлен х — с первой степени в
столбик известен как схема Горнера. Если
Р (х) = Яд + а\х + ••• + апх" » то в
представлении Р(х) = (х -c)Q(x) + $ коэффициенты
Ьц,...,Ьп_1 многочлена Q(x) находят по
формулам Ьп_\ = аюbt_\ = щ +сЬ^ i = n-\..., 1,
Р = oq + cbo .
Если в представлении (5.1.4) р(х) = 0,
то говорят, что многочлен Р(х) делится на
многочлен Q{x) (или Q(x) является
делителем Р (х)). Обозначают эту ситуацию так:
P(x)\Q(x) (или Q(x)\P(x)). Если
многочлен не делится ни на какой многочлен
меньшей положительной степени, то его
называют неприводимым. Многочлен Р(х)
тогда и только тогда делится на многочлен
х - с, когда Р (с) = 0 (т.е. значение
соответствующей функции в точке с равно 0).
Вообще, остаток от деления Р(х) на х — с есть
многочлен степени 0, равный Р(с) (теорема
Безу).
5.1.4. Наибольший общий делитель.
Многочлен R [х) называют общим делителем
многочленов Р(х) и Q(x), если он является
делителем каждого из этих многочленов.
Понятие общего делителя распространяется на
произвольное число многочленов. Среди всех
общих делителей Р(х) и Q(x) имеются
делители наибольшей степени. Все делители
наибольшей степени получаются друг из друга
умножением на число. Тот из них, который
имеет старший коэффициент 1, мы будем
называть наибольшим общим делителем
многочленов Р{х) и Q(x) и обозначать
НОД(/>, Q). Наибольший общий делитель
двух многочленов делится на любой другой
общий делитель этих многочленов.
Многочлены всегда делятся на
многочлены степени 0. Поэтому у любых
многочленов есть общие делители. Если два
многочлена Р (х) и Q(x) не имеют общих
делителей положительной степени, т.е. НОД(Р,
Q) — 1, то их называют взаимно простыми.
Если d (х) = НОJX(P, Q), то существует
представление
d(x) = a(x)P(x) + t{x)Q{x),
(5.1.5)
КОРНИ МНОГОЧЛЕНОВ 223
где сс(х) и Р(х) - многочлены. Это
представление неединственно, так как из него
можно получить другое представление,
например, так: d(x) = [a(x) + Q(x))P(x) +
+ (t(x)-P(x))Q(x).
Получение представления (5.1.5), равно
как и вычисление наибольшего общего
делителя, основано на алгоритме Евклида, суть
которого в следующем:
1) делим первый многочлен Р(х) на
второй Q(x) c остатком: Р(х) =
= Р\ (х) Q (х) + г± (х); получаем частное
Р\ (х) и остаток /j (х);
2) делим второй многочлен (?(х) на
многочлен i\(x) c остатком: (?(х) =
= /?2(x)r1(x) + r2(x);
3) процесс продолжаем, деля многочлен
/; (х) с остатком на многочлен ri+\ (x):
П {х) = А+2 (х)п+\ (х) + ri+2 (x).
Поскольку deg Q > deg /j > deg r2 > ...,
то процесс завершится через конечное число
шагов, когда очередной остаток окажется
делителем предыдущего. Этот последний
остаток будет наибольшим общим делителем Р
и Q или будет отличаться от него числовым
множителем. Формулы деления с остатком,
используемые в обратном порядке, приводят
к представлению (5.1.5).
5.1.5. Наименьшее общее кратное.
Многочлен, который делится и на Р(х), и
на Q(x), называют общим кратным Р (х) и
Q(x). Общим кратным двух многочленов,
например, является их произведение. Среди
всех общих кратных Р(х) и Q(x) есть
многочлен наименьшей степени со старшим
коэффициентом 1, который называют
наименьшим общим кратным Р (х) и Q(x) и
обозначают НОК(Р, Q).
Наибольший общий делитель и
наименьшее общее кратное двух многочленов Р (х) и
Q (х) связаны соотношением
нод(ло)-нок(ло) = ^МОМ,
где коэффициент X равен произведению
старших коэффициентов многочленов Р и Q.
5.1.6. Корни многочленов. Число с
называют корнем многочлена Р (х), если
значение многочлена Р(с) при значении
переменной х = с равно О, Р (с) = О . Задача
определения корней многочлена тесно
связана с разложением его на неприводимые
множители, так как каждый корень с многочлена
соответствует линейному (т.е. 1-й степени)
делителю этого многочлена х - с.
Если с — корень многочлена Р (х), то
Р (х) делится на х - с. Максимальную
степень к, при которой Р{х) делится на
(х - с) , называют кратностью корня с.
Корень кратности 1 называют также простым.
Сумма кратностей всех корней многочлена
(или, как говорят, количество корней с
учетом кратности) не превосходит степени этого
многочлена.
Если для многочлена Р (х) = а$ + щх +
+... + ап_\Х + хп со старшим
коэффициентом 1 сумма кратностей всех его корней равна
степени многочлена, то он может быть
представлен в виде Р(х) = (х -q)(x -с2)...
...(х-сп). Раскрывая скобки, получаем фор-
мулы Виета:
к)=Н)'1с1с2-Ся,
L ={-l)"~l (q...c„_| +сЛ...сп_2сп +...),
Наиболее просто эти формулы выглядят
при п = 2 : 0Q = с\с2> а\ = ~(с1 + сг)' и ПРИ
я = 3 : а0= -с{с2с3, а{ = схс2 + с{с3 + с2с3,
а2=-(с{ +с2+съ).
Если все коэффициенты многочлена
являются целыми числами, причем старший
равен 1, то все рациональные корни этого
многочлена являются на самом деле целыми,
а согласно формулам Виета они являются
делителями свободного члена. Например,
рациональные корни многочлена х - 5х + 4
224
Глава 5.1. АЛГЕБРА МНОГОЧЛЕНОВ
следует искать среди чисел ±1, ±2, ±4.
Выяснив, что 1 является корнем этого многочлена,
делим многочлен на х -1 и приходим к
многочлену х + х - 4 , который не имеет
рациональных корней.
5.1.7. Разложение на неприводимые
множители. Любой многочлен может быть
представлен в виде произведения (разложен в
произведение) неприводимых многочленов
1 = 1
Если дополнительно предположить, что
старшие коэффициенты у многочленов /?,- (х)
равны 1, то такое представление единственно
с точностью до перестановки сомножителей,
причем параметр а будет равен старшему
коэффициенту Р(х). Характер
неприводимых многочленов в общем случае зависит от
поля, над которым строятся многочлены.
Согласно основной теореме алгебры,
любой многочлен над полем комплексных чисел
имеет корни. Из этого утверждения вытекает,
что неприводимый многочлен над полем
комплексных чисел всегда имеет степень не
в котором С/ определяют корни многочлена с
кратностями k\\ Р/с) Як ~ действительные
числа, к\ + ... + kj + 2 [гп\ + ... + ms) = п .
5.1.8. Рациональные дроби.
Рациональной дробью называют алгебраическое выражение
вида
Р(х)= а0+... + апх"
Q(x) b,+... + bmx»r
где ап,Ьт *0. Относительна операций
сложения и умножения множество рациональных
дробей образует поле. Как и во всяком поле,
над рациональными дробями можно
выполнять четыре арифметические операции.
Каждая рациональная дробь определяет функцию,
которую также называют рациональной. С
точки зрения арифметических операций
рациональные дроби и представляемые ими
функции неразличимы.
выше 1. Поэтому любой многочлен с
комплексными коэффициентами представим в
виде
P(x) = a(x-c{fl...(x-c,)kl
и притом единственным образом, если не
учитывать порядок сомножителей.
Коэффициенты С/ этого представления являются
корнями многочлена с кратностями кх. Сумма
кратностей корней многочлена с
комплексными коэффициентами равна его степени.
Многочлен над полем действительных
чисел как частный случай многочлена с
комплексными коэффициентами всегда имеет
корни, хотя бы комплексные. Если
комплексное число с является корнем многочлена
Р(х) с действительными коэффициентами,
то число ~с , комплексно сопряженное к с,
также является корнем этого многочлена, а
Р(х) делится на многочлен 2-й степени
х -(с + ^х + сс с действительными
коэффициентами. Следовательно, неприводимый
многочлен над полем действительных чисел
не может иметь степень выше 2. Разложение
многочлена степени п над полем
действительных чисел на неприводимые множители
имеет вид
Рациональную дробь P{x)/Q(x)
называют правильной, если deg Р < deg Q .
Правильную рациональную дробь P(x)/Q(x)
называют простейшей, если Q [х) = q (x) ,
где многочлен я{х) неприводим, а
deg Р < deg q .
Любая рациональная дробь P{x)/Q[x)
может быть представлена в виде суммы
многочлена и правильной рациональной дроби.
Такое представление единственно и может
быть получено в результате деления числителя
дроби Р (х) на знаменатель Q(x) с
остатком: если Р(х) = ol(x)Q(x) + $(x), то
Q(x) a(X) + Q(xY
Любая правильная рациональная дробь
Р(х) = а(х -с{ fx ...(х -q fl (x1 + А* + tfl) ' ...[х2 + psx + qs)
ВИДЫ МАТРИЦ
225
может быть разложена в сумму простейших.
Знаменатели простейших составляющих
правильной рациональной дроби являются
делителями знаменателя этой дроби. Поскольку
максимально возможная степень числителя
простейшей дроби ограничивается степенью
ее знаменателя, коэффициенты в числителе
могут быть найдены методом неопределенных
коэффициентов. Применение метода поясним
на примере. Рассмотрим правильную дробь
х2 + 4х + 2
х3 + \
х2 + 4х + 2 = А [х2 - х + l) + (Вх + С)(х
Приравнивая коэффициенты при
одинаковых степенях переменной, получаем
систему линейных алгебраических уравнений. Такая
система всегда является определенной. Решая
систему, находим окончательный вид
разложения:
х2 + 4х + 2 = 1 ( 1 t 4х + 7 ^
х3 + 1 ~ l{x + i + х2-х + \)
Глава 5.2
МАТРИЦЫ И ОПЕРАЦИИ НАД НИМИ
5.2.1. Виды матриц. Матрицей типа
(или размера) тхп называют
прямоугольную числовую таблицу, состоящую из тп
чисел, которые расположены в т строках и п
столбцах. Числа, составляющие матрицу,
называют элементами этой матрицы. Как
правило, их обозначают строчной буквой с двумя
индексами, например ах;, где / — номер
строки (/' = 1,т), у' — номер столбца (у = 1, п), в
которых расположен этот элемент.
Матрицы обозначают
(ап ап ... а1п\
а2{ а22 ... а2п
{ат\ ат2 •• атп)
или
Ihl а\2 ■•• а\п\
L2l a22 ... а2Л
\ат\ ат2 ••• атп\
в которой числитель и знаменатель
рассматриваются как многочлены над полем
действительных чисел.
Так как х3 + 1 = (х + \)(х2 - х + l), то
указанная дробь имеет следующий вид
разложения
х2 + 4х + 2 _ А Вх + С
х3 +1 х + \ х2 - х +1'
Умножив записанное представление на
х + 1, получим равенство двух многочленов:
1) = (А + В)х2 +(В + С-А)х + (С + А).
Используют и другие сокращенные
обозначения: (я#),"." или просто (<3,yV, если
по тексту ясно, в каких пределах изменяются
индексы / и у. Матрицу как единый объект
обозначают прописной буквой: А, В и т.д.
Элемент матрицы А, стоящий в /-й строке и
у'-м столбце, можно записать в виде [А]...
Элементами матриц могут быть не
только действительные числа, но и комплексные и
даже другие математические объекты.
Например, используют матрицы, элементами
которых являются многочлены или матрицы.
Множество всех матриц типа тхп,
элементами которых являются
действительные числа., обычно обозначают Мтп (Ш).
Если матрица имеет тип 1 х п , т.е. если
у матрицы всего одна строка, А =
= (а[ Ь а\ 2> • • • > а\п ) » то матрицу называют
матрицей-строкой. В этом случае индекс
строки в обозначении элементов матрицы
можно опустить: A = (ai,a2,...,an). Число
элементов в матрице-строке называют ее
длиной. Если матрица имеет тип т х 1, т.е. у
матрицы один столбец, то ее называют
матрицей-столбцом. Число элементов в матрице-
столбце называют ее высотой и индекс
столбца в обозначении элементов матрицы тоже
обычно опускают.
При т = п , т.е. когда матрица имеет
столько же столбцов, сколько и строк, ее
называют квадратной порядка л, а при т ■$■ п —
прямоугольной. Множество всех квадратных
матриц порядка п, элементами которых
являются действительные числа, обозначают
Мп (Е). У квадратных матриц выделяют
последовательности элементов Щ\,о22,...,апп —
8 - 7706
226
Глава 5.2. МАТРИЦЫ И ОПЕРАЦИИ НАД НИМИ
главную диагональ, и апЪап-\2*—>а\п ~ по~
бочную диагональ. Элементы главной
диагонали называют диагональными. Понятия
диагонального элемента и главной диагонали
распространяют и на прямоугольные матрицы.
Если в квадратной матрице порядка п
все элементы, стоящие вне главной
диагонали, равны нулю, т.е. если матрица имеет вид
<ахх 0 ... О Л
О а22 ... О
О 0 ... О
* ° °
то ее называют диагональной и обозначают
diag(<3jj,...,ann). Если в диагональной
матрице порядка п на диагонали стоят единицы,
то ее называют единичной и обозначают
обычно Е или /. Матрицу типа тхп , все
элементы которой равны нулю, называют нулевой
матрицей соответствующего типа и
обозначают буквой 0 или цифрой 0 (иногда 0пт,
указывая этим тип нулевой матрицы).
Часто используют матрицы и других
видов, например верхние треугольные матрицы —
такие квадратные матрицы, у которых
элементы, расположенные под главной
диагональю, равны нулю, и нижние треугольные
матрицы, у которых, наоборот, элементы над
главной диагональю равны нулю. Первая из
матриц
О >*
О
является верхней треугольной, а вторая —
нижней треугольной. Диагональные матрицы
относятся одновременно и к верхним
треугольным, и к нижним треугольным
матрицам.
К трехдиагональным матрицам относят
такие квадратные матрицы, у которых
ненулевыми элементами могут быть лишь
диагональные элементы и соседние с ними в
строке или столбце:
0\\
0
0
0
ап .
а22 •
0 .
0 .
•■ а\п
.. а2п
.. а3п
■■ апп
ап 0
а2\ а12
Д/il Я„2
0
0
я„з
«11
«21
0
0
0
«12
«22
«32
0
0
0
«23
«33
0
0
0 ..
0 ..
«34 ••
0 ..
0 ..
«л
0
0
0
-I.//-2
0
«л
«
0
0
0
-1./I-1
я.л-1
0
0
0
ап-1,п
«/ш
Прямоугольные матрицы вида
*11
0
0
0
ап
*22
0
0
а{3 .
а23 .
а33 .
0 .
.. а1т .
.. а2т .
• аЪт •
®тт
• а\п
• «2/1
• аЪп
С*тп
у которых элементы, расположенные под
главной диагональю, равны нулю, называют
верхними трапециевидными.
Важную роль играют ступенчатые
матрицы (матрицы ступенчатого вида). Так
называют матрицу типа тхп , если для любой ее
строки выполнено следующее условие:
количество лидирующих нулей любой ненулевой
строки (т.е. нулевых элементов строки,
расположенных в ее начале, вплоть до первого
ненулевого элемента) превышает количество
лидирующих нулей предшествующей строки.
Ступенчатой матрицей является верхняя
треугольная матрица с ненулевыми
диагональными элементами. Ступенчатый вид имеют
матрицы
(0 2 3 (П
0 0-11
0 0 0 3
(3 1 3 3^
0 0 2 1,
0 0 0 0
(113 3^
0 3 0 1
0 0 1-1:
5.2.2. Линейные операции над
матрицами. Две матрицы называют равными, если
они имеют один и тот же тип и если у них
совпадают соответствующие элементы.
Суммой матриц А = (ау ) и В = (by)
типа тхп называют матрицу С = [су) того
же типа с элементами Су = а-у + by, i = \,m ,
j = 1, /l . Для суммы матриц используют
обозначение: С = А + В . В подробной записи
'ап а[2 ... а[п^
а2[ а22
<*2п
ат\ ат2
rh
1 ^12 •• ^п
h\ hi ••• hn
Dm\ °m2
(an+b[[
a2\+h\
an + bl2
#22 + ^22
am\ + bm\ am2 + bm2
a\n + bin 1
a2n + hn
amn ~*~ *mn
УМНОЖЕНИЕ МАТРИЦ
227
Произведением матрицы А = (щ;) типа
т х п на число а е R называют матрицу
С = \Су) типа тхп с элементами сх; = (ХДл .
В подробной записи:
а\\ а\2
а2\ д22
[°ml ат2
ал,,
аа21
™пц
аа12 .
аа22 .
а«ш2 •
■ аД1и
• ШЬп
• адия
По своим свойствам операции сложения
матриц и умножения матрицы на число
аналогичны одноименным операциям над
векторами, и их также называют линейными.
Линейные операции обладают следующими
свойствами. Для любых матриц А = 1аА,
В = (bjj) и С = (су) типа тхп и A,, |i e R :
А + В = В + А (сложение матриц
коммутативно);
(А + В) + С = А + (В + С) (сложение
матриц ассоциативно);
существует такая матрица 0 е Мтп (R),
что для любой матрицы Л е Мтп (R)
выполнено равенство А + О = А;
для любой матрицы А е Мтп (R)
существует единственная матрица
2? е Л/от/7 (R), удовлетворяющая равенству
А + В = 0 (эту матрицу называют
противоположной А и обозначают -А);
(X[i)A = X([iA) (умножение матрицы на
число ассоциативно);
(X + \\) А = ХА + \iA (умножение на
число дистрибутивно относительно сложения
по числам);
X (А + В) = ХА + ХВ (умножение на
число дистрибутивно относительно сложения
по матрицам);
I А = А и (-\)А = -А.
Из сформулированных свойств вытекает,
что для любых матриц А и В одного типа
матричное уравнение А + X = В имеет
единственное решение X = В + (-А) • Матрицу X
называют разностью матриц В и А и
обозначают В - А .
5.2.3. Транспонирование матриц.
Пусть А — матрица типа тхп. Матрицу С
типа пхт с элементами Су = д.,-,/ = 1,/1,
j = 1, т , называют транспонированной мат-
рицей и обозначают А . При
транспонировании матрицы А ее строки становятся столб-
цами матрицы А с сохранением их порядка,
а столбцы матрицы А — строками матрицы
А . Транспонирование можно рассматривать
как преобразование симметрии матрицы
относительно ее главной диагонали. Подробнее:
(п., п.. п. Лт Гап а2{ ... aml\
ап ап
а2\ а22
а2п
Ы "ml
ап а22
а\п а2п
атг
Операция транспонирования обладает
свойствами:
(Л^-А,
(А + В)Т = АТ +ВТ;
(ХА)Т=ХАТ, ХеШ.
Если А = А , то матрицу А называют
симметрической, а если А = -А — кососим-
метрической. И в том и в другом случае
матрица должна быть квадратной. У
симметрической матрицы элементы, расположенные на
местах, симметричных относительно главной
диагонали, равны между собой. У кососим-
метрической матрицы элементы,
расположенные симметрично относительно главной
диагонали, отличаются знаком, а все
диагональные элементы равны нулю. Например,
матрицы
-2 0
1 -4
2 3
1 ^*
-4
2
симметрические, а матрицы
0 2
-2 0
'0
2
-1
1 ^
-4
0
кососимметрические.
5.2.4. Умножение матриц.
Произведением матриц А типа тхп и В типа пхр
называют матрицу С = АВ типа т х р с
элементами
<&=£<%**#./=1'"' j=^p-
k=[
228
Глава 5.2. МАТРИЦЫ И ОПЕРАЦИИ НАД НИМИ
Произведение определено лишь в том
случае, когда количество столбцов первого
сомножителя равно количеству строк второго. В
формировании элемента Су произведения АВ
участвуют элементы z-й строки матрицы А и у-го
столбца матрицы В. Поэтому правило
умножения матриц называют также правилом
умножения "строка на столбец". Это правило можно
представить графически следующим образом:
/
V
^
/
(
V
1 ^
)
— 1
(
\
Например, произведением прямоугольной
матрицы и матрицы-столбца является
матрица-столбец:
ап ап
а2\ а22
ат\ ат2
а2п
'~Л ' Щ\Х\+Щ2Х2 + ... + а{пхп ^
х\
х2
\ in v ill i. mil i \ ii i
Умножение матрицы-строки Х типа
1 x n на матрицу-столбец Y типа п х 1 дает
матрицу типа 1x1, которую отождествляют с
числом. Это отождествление объясняется тем,
что для числовых матриц типа 1x1 операции
сложения, вычитания и умножения матриц,
умножения матрицы на число совпадают с
соответствующими арифметическими
операциями.
Чтобы матрицу А типа тхп можно
было умножить на матрицу В и слева, и
справа (т.е. чтобы были определены оба
произведения В А и АВ), матрица. В должна иметь
тип пхт. Квадратные матрицы А и В
можно перемножить, если они имеют один
порядок, причем в этом случае определены оба
произведения (АВ и ВА), хотя равенство
АВ — ВА обычно нарушается, например,
О 1
О О
о о
о о
С ijp :)■(: i)C :i
Обратим внимание на то, что во втором
случае произведение двух ненулевых матриц
оказалось равным нулевой матрице 0 .
Если определены оба произведения АВ
и ВА и выполнено равенство АВ — ВА, то
матрицы А и В называют коммутирующими,
или перестановочными. Коммутирующие
матрицы всегда квадратные и одного порядка.
Произведение диагональных матриц
одного порядка есть диагональная матрица,
элементами которой являются произведения
соответствующих элементов перемножаемых
матриц. Диагональные матрицы одного
порядка являются перестановочными.
Умножение матриц имеет следующие
свойства:
(АВ)С = А [ВС) (умножение
ассоциативно);
^21х[+а22х2+-- + а2пхп
Kamlxi + ат2х2 + • • • + атпхп j
(А + В)С = АС + ВС (умножение
дистрибутивно относительно сложения матриц);
существует такая матрица Е е Мп (К),
что для любой матрицы А е Мп (1R)
выполнены равенства АЕ = ЕА = А ;
для любой матрицы А е Мп (R) и
нулевой матрицы 0 е Мп (М) выполнено
равенство AQ = 0;
для любой матрицы А типа тхп и
любой матрицы В типаг п х к выполнено
равенство (АВ)Т = ВТАТ .
Операция умножения матриц позволяет
ввести операцию возведения квадратной
матрицы в натуральную степень. Положим
А1 = А , А"+{ =АА", п = 1,2,... Отметим,
что две степени Ап и Ат одной и той же
матрицы являются матрицами одного порядка
и перестановочны: АпАт = АтАп = А"+т .
Введем также нулевую степень квадратной
матрицы, полагая А = Е, где Е —
единичная матрица того же порядка. Введенная
степень матрицы позволяет для квадратной
матрицы вычислять выражения вида
апАп +ап_хАп~х +... + a0A°)ai e R,i = 0^h~,
т.е. многочлены от одного матричного
аргумента. Например, значение квадратного
трехчлена р (х) = Зх - 4х + 5 для квадратной
матрицы
А =
О 2
-1 1
равно
БЛОЧНЫЕ МАТРИЦЫ
229
р(А) = 3
-2 2
-1 -1
О
-1
-1
+ 5
О
-1 -2
1 -2
5.2.5. Блочные матрицы. Если
разделить некоторую матрицу А на части
вертикальными и горизонтальными прямыми, то
получаются прямоугольные ячейки,
являющиеся сами по себе матрицами. Эти ячейки
называют блоками матрицы. Сама матрица А
может рассматриваться как таблица,
элементами которой являются более мелкие
матрицы Л/ар : А = (Л/ар) • При таком построении
матрица А составляется из блоков, и поэтому
ее называют блочной. Например, разбив
матрицу на блоки
«11
а2{
«31
«41
«51
ах2
а22
«32
а42
«52
«13
а23
а33
а43
«53
и обозначив их
(
А/.,=
Л/-
21
«11
а2{
{аз\
а4[
«51
а[4
а24
а34
а44
а54
ап
а22
«32
а42
а52
«15 |
«25
«35
«45
«55 J
/
=
V
«11
«21
«31
«41
«51
«12
«22
«32
«42
«52
«13
«23
«33
«43
«53
«14
«24
«34
«44
«54
«15
«25
«35
«45
«55
«13
«23
«33 J
«43
«53
AT,
12
AT-
22
(«14
«24
«34
«44
«54
«15^
«25
«35
«45
«55 J
запишем ее в виде блочной матрицы,
элементами которой будут матрицы Маа :
<("«!>) =
л/12
Л/22
Для составления блочной матрицы из
серии матриц Мар необходимо, чтобы
подмножества матриц из серии с одинаковым
Л/,
значением индекса а имели одинаковое
количество строк, а подмножества матриц с
одинаковым значением индекса (3 —
одинаковое количество столбцов. Эти
подмножества образуют соответственно "блочные" строки
и "блочные" столбцы (соответствующие
нескольким строкам или столбцам обычной
записи матрицы).
Пример 5.2.1. Указанным требованиям
удовлетворяют следующие четыре матрицы:
М>
21
«11
[«21
(си
Ъ\
|*31
«12
«22
С\2
с22
сп
«13
«23
С\3
с2з
с33
м.
12
м22 =
hx
d2i
«31
hi)
«"|2Л
«"22
«32 J
Поэтому из них можно составить блочную матрицу
А =
М2Х
Л/12
Л*22
(«И
«21
С\\
Ъ\
сз.
«12 «13
«22 «23
с\2 С13
с22 с23
СЪ2 С33
*ll
*21
dxx
d2{
«31
^
hi
dn
d22
«32 j
Основное свойство блочных матриц
состоит в том, что операции над блочными
матрицами совершаются по тем же правилам, что
и операции над обычными матрицами. Это в
230
Глава 5.2. МАТРИЦЫ И ОПЕРАЦИИ НАД НИМИ
достаточной степени очевидно для суммы
матриц и произведения матрицы на число, хотя
относительно суммы это можно утверждать
лишь в том случае, когда размеры слагаемых
блочных матриц, равно как и размеры
отдельных блоков с равными индексами у
слагаемых, совпадают.
Подробнее рассмотрим ситуацию с
умножением блочных матриц. Пусть блочные
матрицы А = (А0а} и В = уВаЛ
удовлетворяют двум условиям: число "блочных"
столбцов матрицы А совпадает с числом "блочных"
строк матрицы В (т.е. индекс (3 для А и В
изменяется в одинаковых пределах); для
любых индексов а, (3, у число столбцов у матри-
,. Тогда АВ = (Сау}, Сау = \
у •
цы Аа^ совпадает с числом строк у матрицы
Указанные два условия довольно сложны, но
все упрощается, если блоки матриц - это
квадратные матрицы одного порядка. В этом
случае условия близки к обычным: число
"блочных" столбцов множимого должно
совпадать с числом "блочных" строк множителя.
Представление матриц в блочном виде
часто оказывается удобным при нахождении
суммы и произведения, если матрицы имеют
достаточно большие размеры, а их
согласованные разбиения на блоки содержат нулевые,
единичные, диагональные, треугольные
матрицы.
Пример 5.2.2. Найдем произведения
следующих блочных матриц, предполагая, что
все операции определены:
(А
0
'АС"*
©
А ЪЕ
-Е В
е
Е
D
Е\(А В
6ДС D
AC + 3D
-C + BD
С D
А В
При транспонировании блочной матрицы
транспонированию подлежат и ее элементы.
Например,
м21
м22
Mj2
A/2V
Л/.
22 )
Использование блочных матриц
позволяет ввести еще одну операцию для
квадратных матриц. Прямой суммой квадратных
матриц А порядка т и В порядка п называют
блочную матрицу
га в"
;е в
С=А®В=
где 0 обозначает нулевой блок (нулевую
матрицу типа тхп вверху справа и п х т
внизу слева). Блочная матрица С = А® В
имеет порядок т + п .
Отметим основные свойства прямой
суммы матриц:
{А Ф В) 0 С = А 0 (В е С)
(ассоциативность);
если квадратные матрицы А\ и А2
имеют порядок т, а квадратные матрицы В\
и В2 - порядок п, то (Ах е В{) + (А2 0 В2) =
= (А1®А2) + (В1®В2) и {A®B\){Al®Bi) =
= AlA2®BlB2.
5.2.6. Операции над строками и
столбцами матрицы. Строки и столбцы
матриц можно рассматривать как матрицы-строки
и соответственно матрицы-столбцы. Поэтому
над ними, как и над любыми другими
матрицами, можно выполнять линейные операции.
Ограничение на операцию сложения состоит
в том, что строки (столбцы) должны быть
одинаковой длины (высоты), но это условие
всегда выполнено для строк (столбцов) одной
матрицы.
Линейные операции над строками
(столбцами) дают возможность составлять
выражения щщ + ... + asas , где щ,...,а5 -
произвольный набор строк (столбцов)
одинаковой длины (высоты), а а1?...,а5 -
действительные числа. Такие выражения называют
линейными комбинациями строк (столбцов).
Строки (столбцы) flj,...,fl5 называют
линейно независимыми, если равенство
ct|fl| +... + asas =0, где 0 в правой части -
нулевая строка (столбец), возможно лишь при
Ctj = ... = ос5 = 0 . В противном случае (когда
существуют такие действительные числа
0Cj,...,cc5 , не равные нулю одновременно, что
выполняется указанное равенство) эти строки
(столбцы) называют линейно зависимыми.
Отметим следующий критерий линейной
зависимости: строки (столбцы) щ,...,а8 ли-
ОБРАТНАЯ МАТРИЦА
231
неино зависимы тогда и только тогда, когда
хотя бы одна (один) из них является
линейной комбинацией остальных.
Во многих алгоритмах, характерных для
матричной алгебры, используют
преобразования матриц, в которых над строками или
столбцами матрицы выполняются линейные
операции. Следующие три операции
называют элементарными преобразованиями строк
матрицы:
умножение 1-й строки матрицы на число
перестановка двух строк в матрице;
добавление к /-Й строке матрицы ее к-й
строки с коэффициентом X, т.е. / -я строка
ttj матрицы заменяется строкой щ + Хак .
Аналогичные операции над столбцами
матрицы называют элементарными
преобразованиями столбцов.
Каждое элементарное преобразование
строк или столбцов матрицы имеет обратное
элементарное преобразование, которое
преобразованную матрицу превращает в исходную.
Например, обратным преобразованием для
перестановки двух строк является
перестановка тех же строк.
Каждое элементарное преобразование
строк (столбцов) матрицы А можно
трактовать как умножение А слева, (справа) на
матрицу специального вида. Такая матрица
получается, если то же преобразование выполнить
над единичной матрицей. Отметим, что с
помощью элементарных преобразований строк
любую матрицу можно преобразовать в
матрицу ступенчатого вида (или, как говорят,
привести матрицу к ступенчатому виду). Этот
факт, как и конкретные алгоритмы
приведения к ступенчатому виду, играет большую
роль во многих задачах матричной алгебры.
5.2.7. Обратная матрица. Пусть А -
квадратная матрица порядка п. Квадратную
матрицу В того же порядка называют
обратной к /4, если АВ = ВА = Е, где Е -
единичная матрица порядка п. Если обратная
матрица существует, то она единственна.
Обратную матрицу обозначают А~ .
Она позволяет определить целую
отрицательную степень матрицы А. А именно, для п > О
полагают А п = lA J .
Если квадратные матрицы А и В
порядка п имеют обратные матрицы, то и их
произведение имеет обратную матрицу, причем
(АВ)~ = В А~ . Если матрица А порядка п
имеет обратную, то транспонированная матри-
т
ца А тоже имеет обратную, причем
К)~'=К')Т-
Квадратную матрицу с ненулевым
определителем называют невырожденной или
неособой. В противном случае, когда
определитель матрицы равен нулю, ее называют
вырожденной. Невырожденность матрицы
означает, что ее строки (столбцы) линейно
независимы, а ранг матрицы равен ее порядку.
Невырожденность матрицы А является
необходимым и достаточным условием
существования обратной матрицы А~[. Отметим,
что для невырожденной матрицы А из
равенства АА~ = Е и свойств определителей
вытекает равенство 6ttA =(det>4)~ .
Для вычисления обратной матрицы
применяют два основных метода. Первый
состоит в следующем. Для квадратной
матрицы А составляют матрицу А* ,
транспонированную к матрице (Ду) алгебраических
дополнений (матрицу А называют присоединенной
матрицей). Обратная матрица А (если она
существует) связала с присоединенной матри-
- а* л-1 ^*
цеи А равенством А = .
det^
В изложенном методе для нахождения
матрицы, обратной к квадратной матрице
порядка /7, необходимо вычислить один опре-
делитель п-го порядка и п определителей
(/7-1)-го порядка. Метод присоединенной
матрицы эффективен при /7 = 2 или /7 = 3,
но при увеличении п становится слишком
трудоемким. В случае /7 = 2 присоединенная
матрица получается из исходной в результате
перестановки двух диагональных элементов и
изменения знака двух недиагональных
элементов.
Пример 5.2.3. Выясним, имеет ли
матрица
\ 2
А =
3 4
обратную и если имеет, то найдем ее.
Поскольку det A = -2 , матрица А
является невырожденной и поэтому имеет
обратную. Для ее вычисления последовательно
находим
232
Глава 5.3. ХАРАКТЕРИСТИКИ МАТРИЦ
Чз 1)
A-l--U4 ~2)-(-2 1 )
2{-3 I) (1,5 -0,5/
Второй метод вычисления обратной
матрицы состоит в преобразовании исходной
матрицы к более простому виду с помощью
элементарных преобразований строк. Чтобы
найти матрицу А , обратную к А,
фактически надо решить матричное уравнение
АХ = Е . Отметим, что если над матрицей А
выполняется какое-либо элементарное
преобразование строк, го это же преобразование
осуществляется и над матрицей АХ,
поскольку любое элементарное преобразование строк
матрицы эквивалентно умножению ее слева
на соответствующую матрицу специального
вида. Таким образом, если в уравнении
АХ = Е над матрицами А и Е одновременно
выполнить какое-либо элементарное
преобразование строк, т.е. домножить это равенство
слева на некоторую матрицу специального
вида, то в результате получится новое
матричное уравнение А[Х = В[ . Оба эти
матричные уравнения имеют одно и то же
решение, так как любое элементарное
преобразование строк имеет обратное элементарное
преобразование строк. Последовательность
элементарных преобразований строк надо
подобрать так, чтобы матрица А превратилась
в единичную матрицу. В результате получается
уравнение вида ЕХ = В', откуда X = В .
Итак, поскольку А~ является решением
уравнения АХ = Е , то А~ - В'.
Чтобы синхронно выполнять
преобразования над матрицами в левой и правой частях
матричного уравнения АХ - Е , записывают
блочную матрицу (А\ Е) и выполняют такие
элементарные преобразования строк этой
матрицы, чтобы вместо А получить
единичную матрицу Е.
Глава 5.3
ХАРАКТЕРИСТИКИ МАТРИЦ
5.3.1. Перестановки. Всякое
расположение чисел 1,2,3,..., п в определенном
порядке называют перестановкой. Из п чисел
можно образовать п\ различных
перестановок. Обычно перестановку записывают в виде
матрицы-строки а = (а^.-.а,,).
Перестановку (1,2,3,..., п) называют нормальной.
Два числа а; и а,- в перестановке
а = (aj, а 2,.. •, аЛ) образуют инверсию, если
a j > а,-, но при этом а; стоит в
перестановке правее (Ху (т.е. / > j). Общее количество
инверсий в перестановке а обозначают |а|, и
если это число четное, то перестановку
называют четной, а если оно нечетное — нечетной.
Например, перестановка а = (4,5,1,3,6,2)
является четной, так как общее количество
инверсий в перестановке равно |а| = 3 + 3 +
+0 + 1 + 1 = 8, т.е. четно.
Транспозицией перестановки называют
такое ее преобразование, при котором в ней
меняются местами какие-либо два элемента, а
другие остаются на своих местах. Любая
транспозиция меняет четность перестановки.
Из двух перестановок (а1,(Х2,...,ал) и
(Pl,p2,...,P„) одних и тех же чисел можно
составить новый объект
o = fPl Р2 - Ч, (5.3.1)
\а{ а2 ... ап)
который называют подстановкой /7-й степени.
Подстановку называют четной, если
перестановки, из которых она состоит, имеют
одинаковую четность, и нечетной в
противоположном случае. Четность подстановки
(5.3.1) совпадает с четностью числа |р| + |а| -
общего количества инверсий в строках
подстановки, которое обозначают |о| .
Транспозицией подстановки называют
любую перестановку ее столбцов. Поскольку
транспозиция подстановки вызывает
транспозиции и в образующих ее перестановках, то
транспозиция подстановки не меняет ее
четность.
Каждая подстановка вида (5.3.1) задает
взаимно однозначное отображение множества
чисел 1,2,3,..., п на себя, при котором Pi
отображается в (Xi,p2 _ в а 2 и тд- В
соответствии с интерпретацией подстановок как
отображений две подстановки считают
равными, если они отличаются только порядком
записи своих столбцов. Например,
подстановки
СВОЙСТВА ОПРЕДЕЛИТЕЛЕЙ
233
0 3 4 2
2 4 13
12 3 4
2 3 4 1
о =
1 2
щ а2
равны, так как вторая получается из первой
перестановкой столбцов.
Соглашение о равенстве подстановок
позволяет записать любую подстановку так,
чтобы первая строка являлась нормальной
перестановкой. Поэтому различных
подстановок /7-й степени имеется ровно п!
5.3.2. Определители /1-го порядка.
Определителем п-го порядка, соответствующим
квадратной матрице
Определитель матрицы А часто
называют просто определителем, или
детерминантом, и обозначают
а21 а22
<*2п
А =
а2[
ап
а22
ап\ ап2
а2п
(5.3.2)
порядка п (определителем квадратной
матрицы) называют сумму п! слагаемых
det А = X ("1)'°' "lai*2a2 -*>пая>
\ап[ ап2 ... а
или det A , называя А матрицей этого
определителя.
Каждое слагаемое в сумме (5.3.3)
представляет собой произведение п элементов
матрицы (5.3.2). При этом все сомножители
находятся в разных строках и в разных
столбцах матрицы, по одному в каждой строке
(каждом столбце).
В частном случае /7 = 2 формула (5.3.3)
упрощается:
ап аХ2
а2[ а12
= апа22 - а[2а21.
* " Если /7 = 3, то формула (5.3.3) содержит уже
которая берется по всевозможным подстанов- 3! = 6 слагаемых-
кам вида
ап ап а{3
а2[ а22 а23
a3i аъг аъъ
■ а\\а22аЪЪ ~ а\\аЪ2а2Ъ ~ а2\а\2аЪЪ + а2\аЪ2а\Ъ + ^31^12^23 " ^31^22^13-
Такую формулу запомнить сложно, и
здесь помогает так называемое правило Саррю-
са, или правило треугольника. Оно состоит в
следующем: со знаком плюс берут слагаемые,
являющиеся произведением элементов
главной диагонали и произведением элементов,
лежащих на параллелях к этой диагонали.
Члены, имеющие знак минус, формируются
таким же образом относительно побочной
диагонали. Схематически это правило
выглядит так:
ап ап а[3
а2\ <*22 а2Ъ
аЪ\ аЪ2 аЪЪ
= +
о о о
о о о
о о о
-
о о о
о о о
о о о
Линиями соединены элементы
определителя, произведения которых дают
слагаемые с соответствующим знаком.
5.3.3. Свойства определителей.
Поскольку определители соответствуют
квадратным матрицам, в их теорию легко
переносится матричная терминология (порядок,
элементы, строки, столбцы, диагональ, диагональные
элементы, виды матриц и определителей,
транспонирование, элементарные
преобразования строк и столбцов, линейные комбинации
строк и столбцов и др.). При изучении
определителей используют эту возможность,
подразумевая, однако, что терминология
относится к матрице определителя. Перечислим
основные свойства определителей.
1. Определитель не меняется при
транспонировании (это свойство означает, что
строки и столбцы определителя равноправны:
любое доказанное утверждение о строках
определителя сразу переносится на столбцы и
наоборот).
2. При перестановке двух строк
(столбцов) определитель изменяет свой знак.
3. Если все элементы у-го столбца
определителя представлены в виде суммы двух
слагаемых, то определитель можно
представить в виде суммы двух определителей:
234
Глава 5.3. ХАРАКТЕРИСТИКИ МАТРИЦ
«11 •
«21 •
«/»1 •
•• «l'y+«fy •
•• «2у+«2у •
•• «лу+«/'./ •
■• «1/1
•• «2/7
• Я/т
=
«11 •
«21 •
ап\ •
•• «2У •
■• anj •
■■ «l/i
.. я2л
• «/1/1
+
«11 •
«21 •
«/il •
.. «о •
0
■■ «2У •
.. anj .
■■ «l/i
.. а2п
■ «/i/i
Аналогично свойство можно сформулировать для строк определителя:
«11 «12 ••• «l/i I |«11 «12 ••• «l/il |«11 «12
«Л + «/1 «/2 + «/2 ••• «//1 + «ш = «/1
"/2
«/i2
«/1 «/2
«/il «/i2
«l/i
4. Общий множитель элементов строки
или столбца может быть вынесен за знак
определителя. Для умножения определителя на
число достаточно умножить на это число
элементы любой строки или любого столбца. В
частности, если А — квадратная матрица
порядка я, то det (ХА) = Хп det A .
5. Определитель равен нулю, если он
имеет: а) нулевую строку (столбец); б) две
одинаковые строки (столбца); в) две строки
(столбца), элементы которых
пропорциональны; г) строку (столбец), являющуюся
линейной комбинацией других строк (столбцов).
6. Определитель не изменится, если к
любой его строке (столбцу) прибавить
линейную комбинацию других строк (столбцов).
7. Определитель произведения двух
квадратных матриц А и В одного порядка
равен произведению их определителей, т.е.
det (АВ) = det A det В.
В квадратной матрице А вычеркнем /-ю
строку и у'-й столбец (на их пересечении стоит
элемент д,у). Оставшиеся элементы образуют
квадратную матрицу (/7-1)-го порядка,
определитель которой Му называют минором
матрицы А (ее определителя),
соответствующим элементу Щ:. Число А- = (-1) Му
называют алгебраическим дополнением,
соответствующим этому же элементу а у .
Понятие минора позволяет свести
вычисление определителя «-го порядка к
вычислению нескольких определителей (/7-1)-го
порядка. Верна формула
deti4 = X^=S(-1)/+yfl^'
y=i y=i
(5.3.4)
где индекс / строки можно выбрать
произвольным образом. Эту формулу называют
разложением определителя по /-Й строке.
Аналогично представление определителя в
виде
^Хм^ХИ)'
}+J
dtjMij,
1=1
(5.3.5)
где индекс у столбца может быть выбран
произвольно, называют разложением
определителя noj-щ столбцу.
Вычисление определителя с помощью
его разложения по строке или столбцу в
общем случае очень громоздкое и в конечном
счете приводит к формуле (5.3.3). Однако
такое разложение удобно, если среди
элементов определителя много нулевых. В частности,
эффективно разложение определителя по
строке (столбцу), в которой один или два
ненулевых элемента.
Используя разложение определителя по
строке или столбцу, нетрудно установить, что
определитель верхней (нижней) треугольной
матрицы равен произведению ее
диагональных элементов (элементов ее главной
диагонали). В частности, это верно и для
диагональной матрицы. Так, определитель единичной
матрицы Е равен единице.
Разложение определителя по строке или
столбцу в сочетании с методом
математической индукции позволяет также доказать, что
определитель блочно-треугольной матрицы
(т.е. блочной матрицы, у которой блоки под
главной диагональю нулевые, а диагональные
блоки — квадратные матрицы) равен
произведению определителей диагональных блоков.
Например,
det 1= det A det В.
0 В)
МЕТОДЫ ВЫЧИСЛЕНИЯ ОПРЕДЕЛИТЕЛЕЙ
235
В частности, det (АФВ) = det A det В .
Отметим два важных тождества,
связанных с понятием алгебраического дополнения
и разложения определителя:
п п
^аиАк] = о, * ф /; ХМ* = о, * ф j.
7=1 /=1
5.3.4. Методы вычисления
определителей. При вычислении определителей
применяют различные методы, основанные на
свойствах определителей. Часто используемый
метод состоит в том, чтобы с помощью
элементарных преобразований строк и столбцов
привести определитель к более простому виду.
С помощью элементарных преобразований
строк любая матрица приводится к
ступенчатому виду. Квадратная матрица ступенчатого
вида является частным случаем верхней
треугольной матрицы, у которой диагональные
элементы, начиная с некоторого, могут быть
равны нулю. Определитель такой матрицы,
как уже сказано, равен произведению
диагональных элементов. В алгоритме приведения
к ступенчатому виду используются
элементарные преобразования, при которых
изменение значения определителя легко учесть: при
добавлении к строке линейной комбинации
других строк определитель не изменяется, при
умножении строки на ненулевое число
определитель умножается на это число, а при
перестановке строк определитель меняет знак.
Изложенный метод часто называют
методом Гаусса вычисления определителей.
Этот метод пригоден для определителей,
элементами которого являются числа. Но в
разных областях математики часто встречаются
определители, элементами которых являются
алгебраические выражения. Для вычисления
таких определителей используют разные
методы, зачастую комбинируя вместе несколько
различных методов.
Основой одного из подходов является
получение некоторого соотношения,
связывающего значение определителя Ап порядка
п с определителями, например, той же
структуры, но более низких порядков:
Д/i =/(Vl.V2 V*). k<n-
(5.3.6)
Такого рода соотношения называют
рекуррентными, а. метод, основанный на их
использовании, - рекуррентным.
Рекуррентный метод часто реализуют
следующим образом. Чтобы использовать
соотношение (5.3.6), напрямую вычисляют
определители Ai,...,Aw_j. Затем, используя
рекуррентное соотношение, находят
несколько определителей А|, Ая+| и т.д., стараясь
уловить закономерность в последовательности
их значений. Если такая закономерность
найдена, можно записать общую формулу для
значения определителя произвольного
порядка и проверить, верна ли эта формула,
используя метод математической индукции.
Общую формулу, выражающую
определитель Ап непосредственно через его
элементы, можно получить и другим путем. Для
этого в рекуррентное соотношение,
выражающее определитель /7-го порядка,
подставляют выражение определителя (/7-1)-го
порядка из того же рекуррентного
соотношения с заменой п на (/7 - 1) и т.д.
Так можно вычислить часто
встречающийся в приложениях определитель Вандер-
монда
Д„ =
*i
п-2
х\
.я-1
1
х2
у/1-2
х2
уЯ-1
х2
1
хп-\
v/i-2
хп-\
v./1-l
ХП-\
1
,./1-2
y/i-1
5.3.5. Ранг матрицы. В матрице А
типа тх п выделим к строк с номерами
/] < /*2 <... < iK и к столбцов с номерами
h < h <•■■< J к • Из элементов cpq = aipjq
матрицы А, стоящих на пересечении
выбранных строк и столбцов, можно составить
определитель c«J к -го порядка. Этот
определитель называют минором порядка к
матрицы А. Его обозначают следующим
образом: MJ.yJ2".Jk . Отметим, что индексы /'„
ПЧ-'к р
строк и индексы jq столбцов в обозначении
минора идут по возрастанию.
О миноре Mjy2"jJk говорят, что:
строки i[, /'2, ..., iK и столбцы j\ , у2»
..., jk матрицы входят в него;
он образован этими строками и
столбцами;
236
Глава 5.4. СИСТЕМЫ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ
он располагается на пересечении этих
строк и столбцов;
он располагается в этих строках и
столбцах матрицы.
Рангом матрицы называют число,
которое равно максимальному порядку среди ее
ненулевых миноров. Ранг нулевой матрицы
полагают равным нулю. Ранг матрицы А
обозначают RgA. Используют также
обозначения г(А), raiik/4 , rang^l.
Если квадратная матрица порядка п
невырождена, то ее ранг равен ее порядку п :
ненулевым является единственный минор
максимального порядка п, совпадающий с
определителем матрицы. Если квадратная
матрица вырождена, то ее ранг меньше ее
порядка: единственный минор максимального
порядка, равного порядку матрицы, является
нулевым, и в этом случае ненулевые миноры
имеют меньший порядок.
Ранг ступенчатой матрицы равен
количеству ее ненулевых строк. В частности, ранг
диагональной матрицы равен количеству ее
ненулевых диагональных элементов.
Ранг матрицы не меняется при
элементарных преобразованиях ее строк и столбцов, а
также при ее транспонировании.
Ранг произведения матриц АВ не
превосходит ранга каждого из сомножителей, т.е.
Rg {АВ) < min {Rg^, RgB} . Если А —
квадратная невырожденная матрица, то Rg АВ =
= Rgi?. Аналогично для квадратной
невырожденной матрицы В имеем Rg(y4Z?) =
= Rg A . Таким образом, умножение матрицы
на квадратную невырожденную матрицу не
изменяет ее ранг.
Любой ненулевой минор матрицы А
порядка, равного рангу А, называют
базисным минором матрицы А. Строки и столбцы
произвольного базисного минора матрицы А
называют базисными.
Если минор М матрицы А получается
из минора М добавлением одной строки и
одного столбца, то М называют
окаймляющим минором для минора М. Порядок
окаймляющего минора М на единицу
больше, чем порядок минора М .
Если М — базисный минор, то все его
окаймляющие равны нулю, так как их
порядок превосходит ранг матрицы. Верно и
обратное: если для минора М все
окаймляющие равны нулю (или у этого минора нет
окаймляющих, поскольку в него входят все
строки или столбцы), то этот минор является
базисным.
Согласно теореме о базисном миноре,
базисные строки (столбцы) матрицы,
соответствующие любому ее базисному минору М ,
линейно независимы, а любые строки (столбцы)
матрицы, не входящие в базисный минор М ,
являются линейными комбинациями базисных
строк (столбцов). Из этой теоремы следует,
что ранг матрицы равен максимальному
количеству ее линейно независимых строк
(столбцов).
Для вычисления ранга матрицы
используют два метода. В методе элементарных
преобразований исходную матрицу А с помощью
элементарных преобразований строк приводят
к ступенчатому виду. Поскольку при
элементарных преобразованиях ранг матрицы не
изменяется, ранг А совпадает с рангом новой
матрицы ступенчатого вида, т.е. равен
количеству ненулевых строк в матрице
ступенчатого вида.
В методе окаймляющих миноров строят
цепочку ненулевых миноров матрицы, в
которой каждый минор является окаймляющим
минором предыдущего, а первый минор есть
просто ненулевой элемент матрицы.
Построение цепочки ненулевых миноров прервется в
тот момент, когда очередной минор не будет
иметь окаймляющих или все его
окаймляющие будут равны нулю. Этот минор будет
базисным, а его порядок будет равен рангу
матрицы.
Метод элементарных преобразований в
общем случае менее трудоемкий, чем метод
окаймляющих миноров. На практике метод
окаймляющих миноров можно использовать
при небольших размерах матрицы. В то же
время метод окаймляющих миноров
позволяет определить не только ранг матрицы, но и
выбрать ее базисный минор. Базисный минор
можно выбирать на основе метода
элементарных преобразований, но для этого метод
необходимо определенным образом
модифицировать.
Глава 5.4
СИСТЕМЫ ЛИНЕЙНЫХ
АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ
5.4.1. Основные определения.
Система т линейных алгебраических уравнений с п
неизвестными (сокращенно СЛАУ)
представляет собой систему вида
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
237
апх{ +апх2+...+а[пхп = Ьь
(5.4.1)
Числа д,у е E называют
коэффициентами СЛАУ. Их нумеруют двумя индексами:
номером уравнения / и номером
неизвестного j . Действительные числа by , ..., bm
называют свободными членами уравнений, или
правыми частями уравнений.
СЛАУ называют однородной, если Ь\ =
= bi =...= bm = 0. Иначе ее называют
неоднородной.
Решением СЛАУ, да и вообще всякой
системы уравнений, называют такой набор
значений неизвестных х\,...,х°п, при
подстановке которых каждое уравнение системы
превращается в тождество. Любое конкретное
решение СЛАУ также называют ее частным
решением. Любое решение СЛАУ обычно
записывают как матрицу-столбец, элементами
которой являются значения неизвестных.
СЛАУ называют совместной, если она
имеет какие-либо решения. В противном
случае ее называют несовместной. Однородная
СЛАУ всегда совместна, поскольку нулевой
набор значений ее неизвестных всегда
является решением.
Если СЛАУ (5.4.1) имеет решение, и
притом единственное, то ее называют
определенной, а если решение неединственное, то —
неопределенной. При т = п , т.е. когда в (5.4.1)
количество уравнений совпадает с
количеством неизвестных, СЛАУ называют
квадратной.
СЛАУ можно записать не только в виде
(5.4.1) (в координатной записи), но и другими
способами.
Рассматривая коэффициенты atj СЛАУ
при одном неизвестном Xj как элементы
столбца, а х, как коэффициент, на который
умножается столбец, из (5.4.1) получаем
новую форму записи СЛАУ:
а2\
\ат\ J
bCj +
ап
а22
рс2+...+
(п Л
а2п
\^тП;
*#» =
(Ь)
h
\bm)
или, обозначая столбцы соответственно flj.
.... а„, Ь,
х{а{+.. .+хпап = b.
(5.4.2)
Это представление СЛАУ называют
векторной записью СЛАУ. Оно позволяет
трактовать решение СЛАУ как представление
столбца b в виде линейной комбинации столбцов
а{, ..., ап .
Взяв за основу произведение матриц,
СЛАУ (5.4.1) можно записать в виде
fau ап ... аХп\(хх\
а2\ °22 ••• а2п
ат\ ат2
*2
*2
\bmJ
или Ах = b , где А — матрица типа тх п ;
х — столбец неизвестных; b — столбец
свободных членов:
А =
ап ап
а2\ а22
\ат\
'V
лт2
*2
а2п
amnJ
*2
\bmJ
Представление СЛАУ в виде Ах = b
называют матричной записью СЛАУ. При этом
матрицу А называют матрицей СЛАУ, а блочную
матрицу [Alb) — расширенной матрицей
СЛАУ Расширенная матрица полностью
характеризует СЛАУ.
Приведенные виды записи СЛАУ
показывают, что решение СЛАУ (5.4.1),
представление столбца в виде линейной комбинации
данных столбцов, решение матричного
уравнения вида Ах - b являются различными
формулировками одной и той же задачи.
Согласно теореме Кронекера — Капелли,
для совместности СЛАУ Ах = b необходимо
и достаточно, чтобы ранг ее матрицы А был
равен рангу ее расширенной матрицы [A\bj.
Совместная СЛАУ имеет единственное
решение тогда и только тогда, когда ранг ее
матрицы равен количеству ее столбцов (в этом
238
Глава 5.4. СИСТЕМЫ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ
случае иногда говорят, что матрица имеет
максимальный столбцовый ранг).
Из сказанного вытекает, что СЛАУ
Ах = b с квадратной невырожденной
матрицей А имеет единственное решение в том и
только в том случае, когда матрица А
невырождена. В этом случае решение можно
представить с помощью обратной матрицы А
следующим образом: х = А~ Ъ.
Если использовать представление
обратной матрицы с помощью присоединенной, то
из матричной записи решения можно ПОЛу-
Ay
чить формулы Крамера X: = —±- , j = \,п ,
J A
где А = det A — определитель матрицы
системы, а А,- — определитель, получающийся
из определителя А заменой у-го столбца
столбцом свободных членов.
5.4.2. Общее решение системы
линейных уравнений. Основным свойством
однородной СЛАУ Ах = 0 является следующее:
если JCj , *2 , ..., хк — решения СЛАУ, то и
любая линейная комбинация СХ|ЛГ| -ь.. .-ьсх^д:^
является решением СЛАУ. Таким образом,
множество решений однородной СЛАУ
является линейным подпространством линейного
арифметического пространства R" , где п —
количество неизвестных в системе. Описать
множество решений однородной СЛАУ
можно, используя какой-либо базис в этом
подпространстве.
Пусть у однородной СЛАУ Ах = 0
матрица А имеет тип тх п и ранг г . Любой
набор из к - п- г линейно независимых
решений СЛАУ Ах = 0 называют ее
фундаментальной системой решений. Если Х\ , дс2 ,
..., хк — какая-либо фундаментальная
система решений однородной СЛАУ, то все
множество решений этой СЛАУ можно записать
формулой
*оо = с\х\ +с2х2+...+скхк,
в которой коэффициенты С\ , ..., ск могут
принимать любые действительные значения.
Эту формулу называют общим решением
однородной СЛАУ.
Нетрудно увидеть, что фундаментальная
система решений однородной СЛАУ — это
базис в линейном подпространстве всех
решений этой СЛАУ и количество образующих
ее решений определяется размерностью этого
подпространства решений.
Решение неоднородной СЛАУ общего
вида Ах = b можно свести к решению
соответствующей однородной СЛАУ Ах = 0 .
Действительно, если хч — некоторое решение
неоднородной СЛАУ Ах = Ь (его называют
частным решением СЛАУ), то любое другое
решение х этой же СЛАУ можно представить
в виде х = хч + Xq , где Xq — решение
однородной СЛАУ Ах = 0 . Наоборот, любой
столбец, который можно представить в виде
такой суммы, является решением
неоднородной СЛАУ Ах = b .
Из этих соображений вытекает, что
множество всех решений неоднородной
СЛАУ Ах = b можно представить формулой
*он = *ч + с\х\ + с2*2 + - + скхк >
где хч — частное решение неоднородной
СЛАУ Ах = b , JCj , ..., хк -
фундаментальная система решений соответствующей
однородной СЛАУ Ах = 0 , а коэффициенты q ,
..., ск могут принимать любые
действительные значения. Приведенную формулу
называют общим решением неоднородной СЛАУ
5.4.3. Как решать СЛАУ? Чтобы
решить однородную СЛАУ Ах = 0 , т.е. описать
все множество решений этой СЛАУ,
достаточно для нее построить фундаментальную
систему решений. Это позволяет записать
общее решение однородной СЛАУ.
Зафиксируем в матрице А некоторый
базисный минор. Этому минору соответствует
набор базисных столбцов и, следовательно,
набор неизвестных, отвечающих этим
столбцам. Указанные неизвестные называют
базисными, или зависимыми, а остальные
неизвестные — свободными, или независимыми.
Базисные строки, т.е. строки выбранного
базисного минора, определяют те уравнения
системы, из которых вытекают остальные
уравнения. Поэтому в системе можно
оставить лишь тс уравнения, которым в матрице
системы соответствуют базисные строки.
Сокращенная система уравнений относительно
базисных неизвестных является
определенной, так как имеет квадратную
невырожденную матрицу (матрицу выбранного базисного
минора). Это значит, что базисные
неизвестные однозначно определяются через
свободные неизвестные.
КАК РЕШАТЬ СЛАУ?
239
Пусть матрица А СЛАУ Ах = 0 имеет
тип т х п , ранг г , а выбранному базисному
минору соответствуют базисные неизвестные
Ху , ..., хг , и свободные неизвестные xr+j,
..., хп . Задав одной из свободных
неизвестных значение 1, остальным свободным
неизвестным значение 0 и определив по
свободным неизвестным значения базисных,
получим решение однородной СЛАУ. Поскольку
существует к - п- г вариантов выбора
свободной неизвестной, принимающей значение
1, мы подобным образом можем получить к
решений системы. Эти решения оказываются
линейно независимыми и потому образуют
фундаментальную систему решений
однородной СЛАУ. Ее часто называют нормальной
фундаментальной системой решений.
Главная сложность изложенного подхода
к решению однородной СЛАУ состоит в том,
что для определения фундаментальной
системы решений необходимо решить к систем,
имеющих одну и ту же матрицу и
различающихся лишь правыми частями уравнений. Эту
сложность можно обойти, вычислив матрицу,
обратную к матрице выбранного базисного
минора, но еще лучше поступить следующим
образом.
При элементарных преобразованиях
строк расширенной матрицы СЛАУ (или
матрицы однородной СЛАУ) множество решений
СЛАУ не изменяется. Выполняя
элементарные преобразования строк, приведем матрицу
однородной системы к ступенчатому виду.
Это позволит в новой, преобразованной
системе легко выбрать базисный минор. Выбрав
базисный минор, продолжим элементарные
преобразования таким образом, чтобы
выбранный базисный минор преобразовался в
единичную матрицу. В результате мы получим
систему, эквивалентную исходной, причем
базисные переменные в этой системе будут
явно выражаться через свободные
неизвестные, а это позволяет сразу выписать все
столбцы фундаментальной системы решений.
Теперь видно, что для преобразованной
матрицы минор М^2 является базисным (в
такой минор входят все ненулевые строки и
столбцы, в которых находятся первые ненуле-
Решение неоднородной СЛАУ Ах = b
можно проводить по аналогичной схеме.
Записываем расширенную матрицу Ы\Ь) этой
СЛАУ и с помощью элементарных
преобразований строк приводим к ступенчатому виду.
Это позволяет выбрать в матрице А (она —
часть расширенной матрицы) базисный
минор и проверить, будет ли он базисным в
расширенной матрице, т.е. совпадают ли
ранги основной и расширенной матриц
системы. Совпадение рангов является критерием
существования решений у системы.
Пусть ранги совпадают. Выбрав
базисный минор, продолжим элементарные
преобразования строк расширенной матрицы,
добившись, чтобы выбранный базисный минор
стал единичной матрицей. Полученная СЛАУ
будет эквивалентна исходной, но для нее не
составляет труда получить общее решение.
Действительно, задав нулевые значения
свободным неизвестным и вычислив значения
базисных неизвестных, получим частное
решение неоднородной СЛАУ. Затем, заменяя
правые части уравнений нулевыми
значениями и задавая свободным неизвестным
значения так, что одно из них равно единице, а
остальные равны нулю, мы придем к набору
столбцов нормальной фундаментальной
системы решений соответствующей однородной
СЛАУ. Имея частное решение и
фундаментальную систему решений, мы можем
записать общее решение неоднородной СЛАУ.
Пример 5.4.1. Решим неоднородную
СЛАУ
\х{ -х2 +х3-х4 =4,
\х{ + х2 + 2х3 +3х4 = 8,
12х{ + 4х2 + 5х3 + Ю*4 = 20,
[2х{ - 4х2 +х3- 6х4 = 4.
Преобразуем расширенную матрицу
этой СЛАУ при помощи элементарных
преобразований строк к ступенчатому виду:
вые элементы базисных строк; этот минор
является верхним треугольным с ненулевыми
диагональными элементами и поэтому
отличен от нуля). Он базисный и в основной, и в
расширенной матрице. Поэтому Rg A =
'1
1
2
,2
-1 1
1 2
4 5
-4 1
-1
3
10
-6
4^
8
20
4J
'\
0
0
,о
-1
2
6
-2
1
1
3
-1
-1
4
12
-4
4^
4
12
-4J
_
г\ -1 1 -1
0 2 14
0 0 0 0
^0 0 0 0
4>
4
0
о,
240
Глава 5.5. МУЛЬТИПЛИКАТИВНЫЕ РАЗЛОЖЕНИЯ
= Rg(A\b) = 2 = г , и, согласно теореме Кро-
некера — Капелл и, СЛАУ совместна.
Нулевые строки расширенной матрицы
можно вычеркнуть. Разделив вторую строку
расширенной матрицы на 2 и добавив
результат к первой строке, получим
(\ 0 1,5 II 6"!
[о 1 0,5 2 | 2)'
Записанной расширенной матрице
соответствует СЛАУ
Х[ + 1,5*3 + *4 = 6,
х2 + 0,5х3 + 2х4 = 2.
Перенося свободные неизвестные х$»
*4 в правые части уравнений, получаем
Xj = 6 - 1,5х3 -*4>
*2 = 2 - 0,5х3 ~ 2х4 •
Полагая х$ = х^ = 0 , находим Х[ = 6 ,
*2 = 2, т.е. в качестве частного решения
можно взять столбец (6200). Затем,
отбросив в уравнениях свободные члены 6 и
2, решаем систему дважды, полагая х^ = 1,
*4 = 0 и *з = 0» *4 = 1 • В результате
находим решения однородной системы
(-1,5 -0,5 1 0)Т и (-1 -2 0 1),
составляющие для однородной СЛАУ
фундаментальную систему решений.
Итак, общее решение рассматриваемой
СЛАУ имеет вид
f6]
2
0
W
+ q
Г-1,5]
-0,5
1
1 о J
+ с2
(~Ч
-2
0
И J
5.4.4. СЛАУ с комплексными
коэффициентами. Изложенный выше материал
относится к «действительному» случаю, т.е. к
случаю, когда элементы матриц и
определителей, коэффициенты СЛАУ являются
действительными числами. В качестве решений СЛАУ
также рассматривались наборы
действительных чисел.
На самом деле специфика
действительных чисел в теории систем линейных
алгебраических уравнений никак не используется,
а все определения, понятия и утверждения
без изменения переносятся на «комплексный»
случай, т.е. на случай, когда в матрицах,
определителях и СЛАУ используются
произвольные комплексные числа. Чтобы получить
комплексный вариант того или иного
определения, понятия или утверждения, достаточно
в тексте заменить термин «действительный»
термином «комплексный».
Еще раз подчеркнем, что для матриц и
систем уравнений с комплексными
коэффициентами сохраняется вся теория СЛАУ. В
частности, остаются справедливыми: условия
совместности СЛАУ и свойства их решений;
формулы Крамера для квадратных СЛАУ с
невырожденной матрицей; понятие
фундаментальной системы решений однородной СЛАУ;
метод решения СЛАУ на основе приведения
расширенной матрицы к ступенчатому виду.
Глава 5.5
МУЛЬТИПЛИКАТИВНЫЕ
РАЗЛОЖЕНИЯ
Под мультипликативным разложением
квадратной матрицы понимают
представление ее в виде произведения нескольких матриц
(обычно не более трех), имеющих более
простую структуру. В качестве простых матриц
рассматривают те, для которых можно легко
построить обратную матрицу: диагональные,
треугольные {верхние и нижние),
ортогональные. Опишем наиболее распространенные
виды мультипликативных разложений.
5.5.1. L{/-разложение. Представление
квадратной матрицы А в виде произведения
А = LU нижней треугольной матрицы L на
верхнюю треугольную матрицу U называют ее
LU-разложением. Такое представление
определено однозначно, если задать диагональные
элементы одной из матриц. Например, можно
положить, что все диагональные элементы
матрицы U равны 1. В дальнейшем будем
основываться на этом предположении, LU-
разложение матрицы А существует, если все
ее ведущие {угловые) миноры не равны 0
(ведущими называют миноры, расположенные в
верхнем левом углу, т.е. на пересечении
первых / строк и первых / столбцов матрицы).
Если известно Z {/-разложение А = LU
матрицы А , то решение СЛАУ Ах = Ь ,
записанной в матричной форме, равносильно
последовательному решению двух систем:
Ly - Ь и Ux = у . Решение первой системы
равносильно прямому ходу метода Гаусса, так
как этот процесс преобразует расширенную
QR- РАЗЛОЖЕНИЕ
241
матрицу {A\b} системы к виду (U\y), причем
это преобразование фактически означает
умножение расширенной матрицы слева на
17 : 17 (A\b) = (U\y) • Решение системы
Ux = у равносильно обратному ходу метода
Гаусса. Обратный ход преобразует
расширенную матрицу {U\y) к виду (#|х) (Е —
единичная матрица), что равносильно
умножению слева на U~l :U~^{U\y} = (E\x}.
L(/-разложение матрицы А можно
получить последовательными вычислениями для
г = 1, 2, ..., п по формулам:
г-\
W = я/г "Xfow*r > ' = '. >* + 1> ...,/1,
к=\
г-\
arj ~YjlrkakJ
к=\
L
■ , / = Г + 1, Г + 2, ...,А1,
в которых /л и «л обозначают элементы
матриц L \\ U, суммы имеют значение О,
если верхний индекс меньше нижнего.
Результаты вычислений могут быть записаны в
единую матрицу, так как вычисляются только
нетривиальные элементы матриц: на
диагонали и под ней для L , над диагональю для U .
L (/-разложение может использоваться
для обращения матриц, для решения
квадратных СЛАУ с невырожденной матрицей
(особенно это удобно, если решается
несколько систем с одной матрицей и разными
правыми частями), а также для вычисления
определителей (согласно формуле det(L(/) =
= /||...//m).
5.5.2. LDU-разложение. Это
разложение представляет собой симметричную
модификацию LU-разложения, в которой
диагональные элементы /„• матрицы L выведены
в отдельную диагональную матрицу
D = diag(/j 1 ,...,//,„) • Это приводит к
представлению А = LU = L DU , где L = LD~ ,
в виде произведения нижней треугольной,
диагональной и верхней треугольной матриц,
причем диагональные элементы треугольных
матриц равны 1. Такое разложение
единственно и называется LDU-разложением.
Если матрица А является
симметрической, то в ее LDU- разложен и и L= U . В
этом случае мы имеем представление
А = LDL , определяемое двумя матрицами
L и D.
5.5.3. SS т-разложение. Для
симметрической положительно определенной
матрицы А диагональные элементы матрицы D в
ее LDI7 -разложении положительны.
Поэтому возможно представление D = В , где В ~
диагональная матрица, на диагонали которой
стоят значения ^du — квадратные корни из
элементов D . Полагая S = LB , получим
представление А = SS , где S — это
нижняя треугольная матрица. Это представление
называют SS J-разложением матрицы А .
Модификация формул для вычисления
LV-разложения приводит к методу квадрат-
Т"
ного корня (методу Холецкого) для SS -
разложения:
Н
aij ~2^siksjk
М
Ь/"Х4' SV='
k=\
) k=\ "J/
i = J + 1,У + 2,,..., n ,
где вычисления по формулам проводятся
последовательно для j -\, 2, ... ,п в
предположении, что суммы в формулах имеют
значение 0, если верхний индекс меньше
нижнего.
5.5.4. (^-разложение. Любая
невырожденная матрица А имеет представление
А = QR, где Q — ортогональная, a R —
верхняя треугольная матрицы. Это
представление называют QR-разложением матрицы А .
Указанное представление определено
однозначно.
(?/?-разложение может быть построено
при помощи процесса, аналогичного прямому
ходу метода Гаусса, в котором каждый шаг
формирует один столбец верхней треугольной
матрицы, обнуляя элементы под главной
диагональю, и может интерпретироваться как
умножение исходной матрицы на некоторую
нижнюю треугольную матрицу слева,
(^-разложение строится путем последовательного
умножения матрицы А слева на
ортогональные матрицы Q\ , Q2 , ..., Qn специального
вида. Умножение на матрицу Q\ приводит к
242
Глава 5.5. МУЛЬТИПЛИКАТИВНЫЕ РАЗЛОЖЕНИЯ
тому, что столбцы с 1-го по (/ — 1)-й не
изменяются, а в /-м столбце обнуляются
элементы под главной диагональю. Обозначив,
QnQn_\...Q\A = R , получаем верхнюю
треугольную матрицу R и представление
А = QR, где матрица
е = (<2„...<2,г' = $...$
является ортогональной как произведение
ортогональных матриц. Изложим алгоритм
описанного процесса.
1. В начале выбираем первый столбец
а\ = {а\Ь а2 Ь • • • > ап\) матрицы А ,
вычисляем его норму |fl]| = ^Яц+---+Ял1 и строим
столбец /?, = [а{, + е, \ах |, а1Ъ..., апХ) , где
6j = sgn(<7jj) = Яц/|яц| — знак числа Яц
(при <7ц =0 полагаем sgn(tfu) = l).
Матрица Qi имеет вид
2. Умножаем А на Qj слева и получаем
матрицу А\ = Q[A с элементами а и . Берем
2-й столбец матрицы А\ , обнуляем его
первую компоненту. Для полученного столбца
х
а2 = 10, ^22, • • •, лЯ2) вычисляем норму |fl21 =
= v(a22) + • + (<7/i2) и строим вспомогатель-
т
ный столбец Р2 =(0,^2 + е2 Н'^'"*'^) '
где 62 = sgnl^22)- Вычисляем матрицу
hi2
3. На к -м шаге после умножения на
£?£_! слева получаем матрицу А^_\ с
элементами ац~ . Выбираем А: -й столбец A^i,
обнуляем в нем первые к -1 компонент,
получая столбец а^ . Вычисляем его норму, а
затем строим столбец рк , добавляя к к -й
компоненте вектора ак число |а^| с тем же
знаком, что и у самой компоненты. По
столбцу рь вычисляем матрицу
Qk=E-2
РкРк
А
|2 *
4. После п шагов получим верхнюю
треугольную матрицу R = Ап = QnAn_\ .
Ортогональная компонента QR -разложения
может быть вычислена по формуле Q = AR~
либо по формуле Q = (^ Q2 ...Qn .
5.5.5. Сингулярное разложение.
Невырожденная матрица А может быть
представлена в виде А = QMCI, где М —
диагональная матрица, a Q и Q — ортогональные
матрицы. Действительно, для произвольной
матрицы А матрица А А является
симметрической с положительными собственными
числами. Поэтому ее, используя преобразование
подобия с помощью некоторой ортогональной
матрицы U , можно привести к
диагональному зиду, причем на диагонали будут стоять
положительные собственные числа.
Следовательно, можно записать U (A AVj = М ,
или A A- UM U , где диагональными
элементами диагональной матрицы М
являются квадратные корни из собственных чисел
матрицы А. Матрица Q = (A I UM
является ортогональной, поскольку из тождества
А1 А = UM2UT вытекает, что QQJ = Е .
Поэтому получаем представление А =
= QMUT = QMQ., где Q = UT .
Диагональная матрица М
сформирована из положительных чисел р.) , р.2» •■•» №п*
квадраты которых являются собственными
числами матрицы А А . Такие числа
называют сингулярными числами квадратной
матрицы А . Представление А = QMQ ,
использующее матрицу сингулярных чисел М ,
называют сингулярным разложением матрицы
А.
Сингулярное разложение может быть
получено стандартным алгоритмом
приведения симметрической матрицы
преобразованием подобия к диагональному виду.
ПЕРВИЧНЫЕ ПОНЯТИЯ
243
Глава 5.6
АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
5.6.1. Первичные понятия. Алгебра в ее
современном понимании — это отрасль
математики, изучающая системы объектов
произвольной природы, в которых определены
алгебраические операции, т.е. операции, по
своим свойствам более или менее сходные с
обычными операциями сложения и
умножения чисел. Алгебра классифицирует такие
системы по свойствам заданных операций, а
также предлагает методы решения задач,
естественно возникающих в таких системах
(например, преобразование выражений,
формируемых на основе заданных операций,
решение уравнений).
Алгебраическая система в самом
широком смысле представляет собой сочетание
< X, О, R > из некоторого множества X ,
семейства алгебраических операций О на
нем и семейства отношений R . При этом
множество X называют носителем, или
основным множеством алгебраической системы,
а набор всех операций и отношений —
сигнатурой. Изначально заданные операции и
отношения могут в свою очередь порождать
новые операции и отношения (например, как
операция вычитания порождается операцией
сложения). Поэтому операции из сигнатуры
системы называют основными или главными.
Алгебраическая система может не иметь
отношений, тогда ее называют универсальной
алгеброй (или просто алгеброй). Точно так же
система может не иметь операций, а только
лишь набор отношений. Тогда ее называют
реляционной системой или моделью.
Алгебраическая операция на множестве
X представляет собой отображение w:
Хп —> X п -й прямой степени множества
X (т.е. прямого произведения п экземпляров
множества X) в множество X . Параметр
степени п называют арностью операции.
Таким образом, операция — это закон, по
которому любой упорядоченной совокупности
из п элементов множества X ставится в
соответствие некоторый элемент того же
множества. Участвующие в операции элементы
мы будем называть операндами. В наиболее
распространенных операциях операнды могут
иметь специальные названия {слагаемые для
операции сложения, сомножители для
операции умножения).
Исторически первыми возникли
операции с арностью 1 или 2, которые называют
соответственно унарными и бинарными
(например, операции сложения и умножения
— бинарные, а операция получения
противоположного элемента, «унарный минус», —
унарная). Операции с тремя операндами
называют тернарными.
Отношение на множестве X — это
подмножество R в X". Параметр п
называют арностью отношения R . Наиболее
известны бинарные отношения (арности 2),
которые обозначают apb. Понятие отношения
служит в математике для описания связей
между объектами. Пример отношения:
отношение порядка среди действительных чисел,
которое записывается а > b. Это отношение
определяет все пары чисел а и b , для
которых первое больше второго.
Классификация алгебраических систем
строится на основе понятия изоморфизма.
Две системы <X,0,R> и < X ,0 ,R >
называют изоморфными, если существуют
такие биективные отображения w:X —>Х ,
ф: О —> О , \|/ :/?—>/? , что сохраняются
операции и отношения, т.е.
w(o(xl,...ixn)) = <p(o)(w(xl),...iw(xn)),
г(х, ,...,*,)<=> v|/(r)(w(x1),..., w(xf))
для каждой операции о е О и каждого
отношения г е R . Если ослабить требования,
допустив, что в изоморфизме отображение ф
может не быть биективным, а каждое
отношение г е R отображается (как
подмножество) на подмножество отношения \|/(г), то мы
получим гомоморфизм алгебраических систем.
Изоморфные алгебраические системы
неразличимы с точки зрения выполняемых
операций и отношений между элементами
системы. Природа элементов алгебраической
системы и конкретный вид операций не
являются для алгебры существенными.
Типовые алгебраические системы
получаются, если перечислить основные
операции, дав им условные названия, и указать
основные свойства, которыми должны
обладать эти операции или отношения (эти
основные свойства называют аксиомами
алгебраической системы). Для бинарной операции
(обозначим ее условно символом «0»)
наиболее общеупотребительными являются:
1) коммутативность а 0 b = b 0 а;
2) ассоциативность (а 0 b)Oc = a 0
0 (Ь 0 с).
244
Глава 5.6. АЛГЕБРАИЧЕСКИЕ СТРУКТУРЫ
Две операции (обозначим их «0» и «Ф»)
могут быть связаны свойством
дистрибутивности: а 0 (6 8 с) = (а 0 b) e (а 0 с).
Распространенными свойствами,
которыми наделяют бинарные отношения, являются:
1) транзитивность (если apb и Ьрс , то
аре);
2) симметричность (если apb , то £ря );
3) рефлексивность (ара для любого а ).
Если отношение обладает всеми этими
тремя свойствами, его называют отношением
эквивалентности. Примерами отношений
эквивалентности является отношение
равенства, отношение параллельности прямых.
Если отношение является транзитивным,
рефлексивным и антисимметричным (если
apb и Ьра , то а и b совпадают), то его
называют отношением порядка (пример:
отношение а < b на множестве действительных
чисел).
5.6.2. Группа. Группой называют алгебру
,о) с единственной бинарной операцией
о , которая подчиняется групповым аксиомам:
1) ассоциативность: (а о Ь) о с =
= а о (bo с);
2) наличие единицы (нейтрального
элемента), т.е. такого элемента е е G, что
аое = еоа = а для любого а е G ;
3) наличие обратного: Уае G 3a~ e G
а о а~х = а~1 о а = е .
Примерами групп являются:
1) множество всех целых чисел —
относительно операции сложения чисел;
2) множество всех ненулевых
действительных чисел — относительно операции
умножения;
3) линейное пространство —
относительно сложения векторов пространства;
4) множество всех взаимно однозначных
отображений множества на себя —
относительно операции композиции отображений;
5) множество всех подстановок из п
символов образует группу относительно
умножения подстановок, которую называют
симметрической группой;
6) множество всех движений плоскости
(пространства), которые преобразуют данную
фигуру (тело) Ф снова в себя, образуют
группу относительно операции композиции
движений, группу называют группой
симметрии фигуры (тела) Ф .
Если дополнительно групповая операция
обладает свойством коммутативности: а о b =
= b о а , то группу называют абелевой, а
операцию часто называют сложением и
обозначают знаком «+». В приведенных выше
примерах к абелевым относятся группы 1, 2, 3.
Группы, связанные с отображениями или
преобразованиями, как правило не являются
абелевыми (группы 4 и 6, группа 5 при п > 3
также не является абелевой). Если групповая
операция называется сложением, то
нейтральный элемент именуют также нулем, а
обратный — противоположным.
Группа конечная, если она состоит из
конечного набора элементов. Число
элементов в конечной группе называют ее порядком.
Пример конечной группы — симметрическая
группа (пример 5), порядок ее равен п\
Группа симметрии также может быть
конечной (например, группа симметрии квадрата),
но это необязательно (например, группа
симметрии круга не является конечной).
Основная групповая операция в абеле-
вых группах порождает обратную операцию.
Если первую называют сложением, то вторую
называют вычитанием. Вычитание — это
операция получения разности х - а - b или,
другими словами, решения уравнения
X + b = а , которое всегда существует и
единственно.
5.6.3. Кольца и поля. Алгебраическую
систему < К,+, > с двумя бинарными
операциями + и • называют кольцом, если:
1) она является абелевой группой
относительно операции +;
2) операции связаны свойством
дистрибутивности: Vx,y,z e К
(x + y)-z = (xz) + (yz),
z-(x + y) = (z-x) + (z-y).
Кольцо — одно из основных понятий
современной алгебры. Операции кольца
принято называть сложением (+) и умножением
(•), а результаты этих операций называют
суммой и произведением. Поскольку
множество элементов кольца с операцией сложения
образует (абелеву) группу, то говорят об
аддитивной группе кольца. Операция сложения
имеет обратную операцию — вычитание.
В выражениях, получаемых при помощи
операций кольца, используют соглашения,
общепринятые для числовых выражений: знак
операции умножения обычно опускают, при
этом операция умножения имеет приоритет,
СПИСОК ЛИТЕРАТУРЫ
245
т.е. при отсутствии скобок, регулирующих
порядок операций, в первую очередь
выполняется умножение.
Нейтральный элемент по сложению
называют нулем кольца и обозначают 0. Как и в
случае числовых операций, нуль обладает
свойством Vx е К х0 = 0 . Кольцо может
иметь элементы, которые при умножении
дают 0 : ху = 0. Такие элементы называют
делителями нуля.
Кольцо может содержать элемент 1,
называемый единицей кольца, который для
каждого элемента х е К удовлетворяет
соотношениям X • 1 = 1 • X = 1. Такой элемент, если
существует, определяется однозначно. Если
кольцо имеет единицу, то говорят о кольце с
единицей, иначе говорят о кольце без единицы.
Кольцами являются:
1) множества целых, рациональных,
действительных, комплексных чисел
относительно обычных операций сложения и
умножения;
2) множество всех целых чисел, кратных
данному числу т относительно обычных
операций сложения и умножения (это пример
кольца без единицы при т Ф 1);
3) множество всех векторов в
трехмерном пространстве относительно операций
сложения векторов и векторного умножения
векторов;
4) множества всех многочленов от одной
или нескольких переменных с
рациональными, действительными или комплексными
коэффициентами;
5) множество всех квадратных матриц
одного порядка относительно операций
сложения и умножения матриц.
Часто операции кольца обладают
дополнительными свойствами. Например, если
умножение ассоциативно: (xy)z - x(yz), то
кольцо называют ассоциативным (иногда
ассоциативность умножения включают в состав
аксиом кольца, т.е. считают, что кольцо
всегда ассоциативно). Если умножение
коммутативно, т.е. ab - Ьа , то кольцо называют
коммутативным. Ассоциативное
коммутативное кольцо с единицей без делителей нуля
называют областью целостности. Если в
ассоциативном кольце при а * 0 разрешимы оба
уравнения ах = b и ха = b , то такое кольцо
называют телом. Тело всегда имеет единицу и
не имеет делителей нуля. Множество
элементов тела без нуля образует группу
относительно операции умножения, которую называют
мультипликативной группой тела.
Примером некоммутативного кольца
является кольцо квадратных матриц. Это кольцо
к тому же обладает делителями нуля; нулем
является матрица, состоящая из одних нулей,
она может быть получена как произведение
двух вырожденных матриц.
Тело называют полем, если его
мультипликативная группа абелева. Примеры полей
дают числовые системы: рациональные числа,
действительные числа, комплексные числа
образуют поля относительно обычных
операций сложения и умножения.
СПИСОК ЛИТЕРАТУРЫ
1. Беклемишев Д.В. Курс аналитической
геометрии и линейной алгебры. 4-е изд., пе-
рераб. М.: Наука, 1930. 336 с.
2. Беллман Р. Введение в теорию
матриц. М.: Наука, 1969. 268 с.
3. Бронштейн И.Н., Семендяев К. А.
Справочник по математике для инженеров и
учащихся втузов, 13-е изд., исправл. М.:
Наука, 1986. 544 с.
4. Гантмахер Ф.Р. Теория матриц, 4-е
изд. М.: Наука, 1988. 576 с.
5. Ефимов Н.В. Квадратичные формы и
матрицы, 4-е изд. М.: Наука, 1967. 160 с.
6. Канатников А.Н., Крищенко А.П.
Аналитическая геометрия: Учеб. для вузов / Под
ред. B.C. Зарубина, А,П. Крищенко. М.: Изд-
во МГТУ им. Н.Э. Баумана, 1999. 392 с. (Сер.
Математика в техническом университете;
Вып. III).
7. Кострикин А.И. Введение в алгебру.
Основы алгебры: Учебник для ВУЗов. М.:
Физматлит, 1994.
8. Курош А.Г. Курс высшей алгебры. М.:
Наука, 1965. 432 с.
9. Ланкастер П. Теория матриц. М.:
Наука, 1978. 280 с.
10. Математический энциклопедический
словарь / Гл. ред. Прохоров Ю.В. М.: Сов.
энциклопедия, 1988. 848 с.
П. Фрид Э. Элементарное введение в
абстрактную алгебру. М.: Мир, 1979.
Раздел 6
АНАЛИТИЧЕСКАЯ ГЕОМЕТРИЯ
Глава 6.1
ЛИНЕЙНЫЕ ОПЕРАЦИИ
НАД ВЕКТОРАМИ
6.1.1. Векторные и скалярные
величины. В прикладных науках оперируют
величинами различного характера. Такие
величины, как массу и объем, характеризуют
количественным значением, которое по
отношению к некоторому эталону (единице
измерения) задают действительным числом. Поэтому
их называют скалярными. Напротив, скорость,
ускорение, сила характеризуются не только
количественным значением, но и
направлением. Их называют векторными величинами.
Геометрическим вектором (также
направленным отрезком) называют любой
отрезок, на котором выбрано одно из двух
возможных направлений. Любой отрезок
однозначно определяется своими концами,
поэтому одно из двух возможных направлений для
данного отрезка можно задать, указав от
какого конца отрезка надо начать движение в
заданном направлении для того, чтобы,
двигаясь по отрезку, попасть в его другой конец.
Первую точку называют началом
геометрического вектора, а вторую — его концом. Начало
геометрического вектора называют также
точкой его приложения. Геометрический
вектор обозначают АВ или АВ , где точки А и
В — его начало и конец. Модуль, или длина
АВ\
геометрического вектора АВ равна
длине \АВ\ отрезка, соединяющего его
начало А и конец В . Геометрический вектор
называют ненулевым, если его длина
положительна. Длина, равная нулю, соответствует
ситуации, когда начало и конец
геометрического вектора совпадают. В этом случае
геометрический вектор называют нулевым или
нуль-вектором и обозначают 0. Если длина
геометрического вектора равна единице, его
называют ортом, или единичным. Для нуль-
вектора понятие направления теряет смысл,
так как начало и конец у него совпадают.
Однако такому геометрическому вектору
удобно приписать произвольное направление,
которое устанавливают в зависимости от
конкретной ситуации.
6.1.2. Типы векторов и их взаимное
расположение. Два геометрических вектора
называют коллинеарными, если они лежат на
одной прямой или на параллельных прямых.
Все пары коллинеарных геометрических
векторов можно разделить на две группы:
однонаправленные (или сонаправленные) коллинеарные
геометрические векторы, имеющие
совпадающие направления; противоположно
направленные коллинеарные геометрические
векторы, имеющие противоположные
направления. По определению считаем, что нуль-
вектор коллинеарен любому другому.
Определение коллинеарных векторов
распространяется на любое число геометрических векторов.
Три геометрических вектора называют
компланарными, если эти векторы лежат на
прямых, параллельных некоторой плоскости.
Два геометрических вектора называют
равными, если они коллинеарны, однонаправ-
лены и их длины совпадают. Равные
геометрические векторы могут иметь различные
точки приложения, но задают одно и то же
направление и имеют одинаковые длины. В
этом случае, т.е. когда заданы направление и
длина, но не фиксируется точка приложения,
говорят, что задан свободный вектор. В
дальнейшем для удобства свободные векторы мы
будем называть просто векторами. Векторы
обозначают одной строчной буквой с допол-
ЛИНЕЙНЫЕ ОПЕРАЦИИ И ИХ СВОЙСТВА
247
нительной чертой или стрелкой вверху: а
или а , а также с использованием
полужирного шрифта а.
Разный характер действия векторов в
прикладных задачах приводит к
необходимости рассматривать другие типы векторов.
Например, вектор угловой скорости и вектор
силы, действующей на абсолютно твердое
тело, можно перемещать только вдоль
прямых, на которых они находятся. Такие
векторы называют скользящими векторами.
Наконец, геометрические векторы, точка
приложения которых не может изменяться, называют
еще связанными векторами. К ним относят
скорости в потоке жидкости или газа.
Понятия, связанные с геометрическими
векторами, переносятся на свободные
векторы. Так, говорят о начале (точке приложения)
вектора, конце вектора, модуле (длине)
вектора. Различают векторы ненулевые (включая
единичные, или орты) и нулевые (нуль-
векторы), векторы коллинеарные и векторы
компланарные. Коллинеарные векторы могут
быть однонаправленными (сонаправленными) и
противоположно направленными.
6.1.3. Линейные операции и их
свойства. Суммой а + b двух векторов а и Ъ
называют вектор с, построенный по
следующему правилу параллелограмма. Выбрав для
векторов а и b общее начало, строим на этих
векторах параллелограмм. Тогда диагональ
параллелограмма, выходящая из их общего
начала, определяет их сумму (рис. 6.1.1).
Наряду с правилом параллелограмма
существует и правило треугольника. Совместим
начало вектора b с концом вектора а. Тогда
суммой этих векторов будет вектор с, начало
которого совпадает с началом а, а конец — с
концом b (рис. 6.1.2). Отметим, что если
векторы а и b коллинеарны, то их сумму по
правилу параллелограмма определить нельзя, а
правило треугольника в этом случае
применимо.
Сложение векторов коммутативно
а + Ь=Ь+ан ассоциативно (а + Ь) + с =
= а + (Ь + с). Для нулевого вектора 0 и
любого вектора а выполняется равенство а + О =
= а. Для любого вектора а существует такой
вектор b, что а + b =0. Для любых
векторов а и b существует такой вектор х, что
а + х = b . При этом вектор х определен
однозначно. Последнее свойство позволяет
ввести операцию вычитания векторов.
Разностью Ь- а двух векторов а и b называют
такой вектор х , что а + х = b . Переход от
Рис. 6.1.1
Рис. 6.1.2
а + х = b к х = Ь- а в соответствии с этим
определением с алгебраической точки зрения
означает, что при переносе вектора в другую
часть равенства перед ним надо менять знак.
Для вычисления разности векторов
можно воспользоваться правилом
треугольника. Совместим начала векторов а и b , тогда
вектор с началом в конце вектора а и
концом, совпадающим с концом b, равен
разности b-а этих векторов (рис. 6.1.3).
Произведением вектора а на число X
называют вектор Ха , коллинеарный вектору а ,
с длиной \Х\ \а\, однонаправленный с а при
X > 0 и противоположно направленный при
X < 0. Произведение вектора на число 0 есть
нулевой вектор. Произведение вектора а на
число —1 есть вектор, противоположный к а ,
т.е. {-\)а = (-а). Умножение вектора на
число ассоциативно (X\i)a = Х(у.а),
дистрибутивно относительно векторов Х(а + А) =
-Ха + Xb и чисел (X + ц)а = Ха + \ла .
Рис. 6.1.3
248
Глава 6.1. ЛИНЕЙНЫЕ ОПЕРАЦИИ НАД ВЕКТОРАМИ
Операции сложения векторов и
умножения вектора на число объединяют общим
термином линейные операции.
6.1.4. Ортогональная проекция. Пусть
на плоскости заданы прямая L и точка А .
Опустим из точки А на прямую L
перпендикуляр (рис. 6.1.4, а). Тогда его основание
(точку О) называют ортогональной проекцией
точки А на прямую L. Если прямая L и
точка А заданы в пространстве, то в этом
случае ортогональной проекцией точки А на
прямую L называют точку О пересечения
прямой L с перпендикулярной к ней
плоскостью, проходящей через точку А (рис.
6.1.4, б).
Для вектора АВ (на плоскости или в
пространстве) можно построить
ортогональные проекции на прямую L его начала и
конца. Тогда вектор ОдОд , соединяющий
проекции 0А и Од и лежащий на прямой
L, называют ортогональной проекцией
вектора АВ на прямую L .
Прямую, на которой задано одно из двух
возможных направлений, называют осью.
Выбранное направление на оси изображают с
помощью стрелки на соответствующем конце
оси. Ортогональную проекцию ОдОд
вектора АВ на ось / можно полностью описать
длиной вектора ОдОд , приписав ей знак,
указывающий направление вектора. Если
направление 0А0д совпадает с заданным
направлением оси, то берут знак плюс, а если
направление вектора противоположно
направлению оси, то берут знак минус. Длину
вектора ОдОд со знаком, определяющим
\А Л
\ ( А. I
К90' ^3)L
О L \ /
а) б)
Рис. 6.1.4
направление этого вектора, называют
ортогональной проекцией вектора АВ на ось I и
обозначают np/fl .
Каждый ненулевой вектор I однозначно
определяет ось: его можно рассматривать
расположенным на некоторой прямой и
задающим на ней направление. Поэтому
ортогональную проекцию вектора на такую ось
называют ортогональной проекцией вектора па
направление вектора / .
Угол между направлениями двух
ненулевых векторов называют углом между этими
векторами. Угол может изменяться в пределах
от 0 до к. Конкретное значение,
приписываемое углу между нулевым вектором и
каким-либо другим, выбирают исходя из
конкретной ситуации.
Ортогональная проекция вектора а на
направление ненулевого вектора / равна
длине |я|, умноженной на косинус угла ф между
векторами ни/, т.е. Гф/Я = \а\ coslfl, /1, где
а,1\ — угол между векторами awl.
Ортогональная проекция суммы векторов на
направление ненулевого вектора равна сумме
их ортогональных проекций на направление
этого вектора, а при умножении вектора на
число его ортогональная проекция на
направление ненулевого вектора умножается на то
же число: прДл + b) = npjfl + пр/А, пр/(Ал) =
= Хпр/а .
6.1.5. Линейная зависимость и
независимость векторов. Исходя из набора
векторов щ,...,ап, можно составить выражение
п
вида Vcx/ii/ = ЩЩ+..лапап , где щ,...,ап —
/=1
произвольные действительные числа. Это
выражение называют линейной комбинацией
векторов flj,... ,ап . Числа а,-, / = 1,п ,
представляют собой коэффициенты линейной
комбинации. Набор векторов называют еще
системой векторов.
Векторы й[,...,ап называют линейно
зависимыми, если существует такой набор
коэффициентов щ,...,ап, что а.\а\+...+апап =
= 0 и при этом хотя бы один из этих
коэффициентов ненулевой. Если указанного набо-
БАЗИС
249
pa коэффициентов не существует, то векторы
называют линейно независимыми. Если
а| = .. = аЛ = 0, то, очевидно, ща[+...+
+OLnan = 0. Имея это в виду, можем сказать
так: векторы а^...,ап линейно независимы,
если из равенства ща^.. .+апап = 0
вытекает, что все коэффициенты щ,...,а„ равны
нулю. Критерий линейной зависимости: для
того чтобы векторы были линейно зависимы,
необходимо и достаточно, чтобы один из них
являлся линейной комбинацией остальных.
Понятие линейной зависимости имеет
простую геометрическую интерпретацию: два
вектора линейно зависимы тогда и только
тогда, когда они коллинеарны (в этом случае
один из них представляется как произведение
другого на число); три вектора линейно
зависимы тогда и только тогда, когда они
компланарны; любые четыре вектора линейно
зависимы.
6.1.6. Базис. Аналогично трем моделям
геометрии (геометрии на прямой, на
плоскости и в пространстве) рассмотрим три
множества свободных векторов, или, как говорят, три
пространства векторов: пространство V\ всех
коллинеарных между собой векторов, т.е.
параллельных некоторой прямой, пространство
У2 всех компланарных между собой векторов,
т.е. параллельных некоторой плоскости, и
пространство У$ всех свободных векторов.
Любой ненулевой вектор пространства
V\ называют базисом в У у . Любой вектор
х е V\ представляется в виде х = Хе . Это
равенство называют разложением вектора х в
базисе е, а число X — координатой вектора х
в этом базисе. Коэффициент X определен
однозначно и равен X = ±|jc| / \е\, где знак
плюс (минус) соответствует случаю
однонаправленных (противоположно направленных)
векторов х и е.
Любую упорядоченную пару неколлинеар-
ных векторов в\ , е2 в У2 называют базисом
в У2 . Любой вектор х еУ2 выражается через
е± и е2 в виде их линейной комбинации:
х = Х\в\ + Х2е2 • Эту запись называют
разложением вектора х в базисе ву , е2 , а
коэффициенты Х\,Х2 — координатами вектора х в
базисе в| , е2 . Координаты вектора
определены однозначно.
Любую упорядоченную тройку
некомпланарных векторов е\ , е2 , е3 в ^з
называют базисом в У$. Любой вектор х е У$
является линейной комбинацией базисных
векторов: х = Х\в\ + Х2е2 + ^-3^3 • Это
представление вектора называют разложением
вектора в базисе в\ , е2 , е3 , а коэффициенты
х называют его Х\,Х2 и Х$ разложения —
координатами вектора х в базисе е\ , е2 , е^.
Координаты определены однозначно.
Разложение вектора d в базисе, скажем а, Ь, с,
показано на рис. 6.1.5. Координатами вектора
d будут отношения
\0А\
WV
dh = ±
\ОВ\
\ос\
ов\
dr = ±
\ос\
где знаки выбирают в зависимости от того,
является соответствующая пара коллинеарных
векторов (например, ОА и ОА для da)
однонаправленной или нет.
Векторы в базисах пространств У2 и
У$, согласно определению базисов, являются
упорядоченными. Порядок векторов в базисе
устанавливает порядок среди координат
любого вектора, и поэтому координаты всегда
считают тоже упорядоченными. Если базис
фиксирован, то векторы можно рассматривать
как упорядоченные наборы их координат в
этом базисе. Эту возможность часто
используют, отождествляя векторы с
упорядоченными наборами их координат. Например, если
вектор х из К3 в базисе е^ , е2 , е3 имеет
разложение х = 2в\ + Зе2 - 4е3 , то этому
вектору соответствует упорядоченная тройка
250
Глава 6.2. ПРОИЗВЕДЕНИЯ ВЕКТОРОВ
его координат, которую часто записывают так:
{2; 3; —4}. Более того, отождествляют вектор
с упорядоченной тройкой координат и пишут
х = {2; 3; —4}, вкладывая в это равенство
указанный выше смысл.
6.1.7. Вычисления в координатах. При
сложении двух векторов их координаты в
одном и том же базисе складываются. При
умножении вектора на число координаты
этого вектора умножаются на это число. Для
того чтобы два вектора были коллинеарны,
необходимо и достаточно, чтобы их
одноименные координаты в одном и том же
базисе были пропорциональны (или были равны
отношения их одноименных координат в
одном и том же базисе).
Пример 6.1.1. Пусть векторы в|,е2 об~
разуют базис в К2 . Векторы а = 2в| - Зе2 ,
Ъ - -в| + Зе2 линейно независимы, так как
2/(-1)*-3/3. Поэтому они тоже образуют
базис в К2. Найдем разложение в этом базисе
вектора с = Ъв\ - 6е2 •
Пусть с = Х^а + Х2£ . Подставив в это
равенство разложения векторов с,а,Ь в
базисе £|,е2, приведем подобные слагаемые в
правой части равенства. Получим, что
Зв| - 6е2 = Х| (2в| - Зе2 ) + ^2 {-е\ + Зе2 ) =
= (2Х| -Х2)е] +(-ЗХ| +3\2)е2-
Поскольку каждый вектор в любом
базисе имеет единственное разложение, то
Х| Д2 должны удовлетворять системе
уравнений 2Х\ -%2 =3, ЪХ\ -ЗХ2 =6. Решая
эту систему, находим, что Х\ = 1 , Х2 = -1 .
Это значит, что с = а - Ъ .
Базис называют ортогональным, если он
состоит из векторов, лежащих на взаимно
перпендикулярных прямых. Базис называют
ортонормированным, если он ортогональный и
состоит из единичных векторов. Ортонормиро-
ванный базис в пространстве V^ принято
обозначать, с учетом порядка, буквами I, у,
Аг, в К2 - соответственно /, j и в V\ - i .
Для длины вектора х е У3 , имеющего в
некотором ортонормированном базисе
координаты {Х|; х2; х3 }, верна формула
\х\ = \Х\ + х2 + хъ ' Аналогичным образом
можно вычислить длину вектора х е К2 по
его координатам Xj,x2 в
ортонормированном базисе: |х| = JX| + х2 .
Пусть ненулевой вектор xeV^ образует
с направлениями векторов ортонормирован-
ного базиса /, j, к углы соответственно
а, р, у. Величины cos а, cosp, cosy
называют направляющими косинусами вектора х.
Они удовлетворяют тождеству cos cc +
+ cos P + cos у = 1 . Любые три угла а, Р, у
из отрезка [0,л], удовлетворяют этому
соотношению, являются направляющими
косинусами некоторого вектора. В качестве примера
можно взять вектор {cosa; cosp; cosy}.
Если ненулевой вектор х е У^ имеет в
ортонормированном базисе координаты
{Х|;х2;хз} и направляющие косинусы
cos a, cosp, cosy, то х\ =|x|cosa, x2 =
= |х| cos р, х3 = |х| cos у,.
В случае ортонормированного базиса в
пространстве К2 направление вектора удобно
указывать одним углом ф, который отсчиты-
вается от первого вектора базиса против хода
часовой стрелки (в случае положительного
значения). Угол ф, длина вектора х и его
координаты {Х|;х2} связаны
соотношениями: Х| =|х|со8ф, х2 = |jc| si ii cp .
Глава 6.2
ПРОИЗВЕДЕНИЯ ВЕКТОРОВ
6.2.1. Скалярное произведение.
Скалярным произведением двух векторов а и Ъ
называют число, равное Ы|#|со5ф —
произведению длин Ы и 1^1 этих векторов на
косинус угла ф между ними. Скалярное
произведение обозначают ab или (а,Ь).
Величину да называют скалярным квадратом векто-
ра а и обозначают а . Если вектор а
ненулевой, то аЪ = \а Пря Ъ . Аналогично при
Ъ * 0 имеем равенство аЬ - |Л| пр/, а .
ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ
251
Если угол между двумя ненулевыми
векторами прямой (т.е. равен 90°), то такие
векторы называют ортогональными. Нулевой
вектор считают ортогональным любому другому
вектору. Для того чтобы два вектора были
ортогональны, необходимо и достаточно,
чтобы их скалярное произведение равнялось
нулю.
Скалярное произведение коммутативно
ab = Ьа, совместно с умножением на число
операция скалярного умножения
ассоциативна (Ха)Ь = 'k(ab), a(\b) = \{ab), скалярное
умножение и сложение векторов связаны
свойством дистрибутивности (а + Ь)с = ас +
+Ьс, а(Ь + с) = ab + ас , и скалярный
квадрат любого вектора а неотрицателен, т.е.
а > 0 , причем а = 0 только при а = 0.
Свойства ассоциативности и
дистрибутивности скалярного умножения называют
свойством линейности скалярного произведения.
Пример 6.2.1. Найдем длину вектора
а = Зс -2d при условии, что |с| = 5,
\d\ = 4, а угол ф между векторами с и d
равен 60°.
Поскольку Ы = yjaa , то, вычисляя
скалярный квадрат вектора а , находим, что
аа = (Зс - 2d)(3c - 2d) = 9сс - \2cd +
+4Л/ = 9|с|2 -12|c||rf^os(p + 4|rf|2 =
= 9 25-12 5 4 0,5 + 4 16 =
= 225-120 + 64 = 169.
Следовательно, \а\ = уаа = 13.
Скалярное произведение векторов
а = {*а i У a i Za } и * = {хЬ ', Уь \ Ц ) > заданных
своими координатами в ортонормированном
базисе в У$, равно сумме попарных
произведений одноименных координат ab = xaxb +
+УаУь + ZaZb, а критерием ортогональности
векторов а и b является равенство хахь +
+УаУЬ + ZaZb =0-
Если у = (а,Ь) — угол между
ненулевыми векторами а и b , то
ab xaxb+yayb+zaZb
COS ф = , ,, , = . .— — .
\a\\b\ Y2 , .2 , Л /r2 , v2 , Л
1111 V** +-Уя +^ V А + -^> +Zb
В случае, когда а,Ае К2 и известны
координаты этих векторов в
ортонормированном базисе /, J : а = xai + yaj, b = xbi +
+УьЗ-> справедливы аналогичные формулы
для вычисления скалярного произведения
ab = xaXjj + уаУь у Для критерия
ортогональности хахь + уаУь =0 и для косинуса угла
между ненулевыми векторами a, b
cos(a7b)= х°хь+У°У* .
Пример 6.2.2. Найдем значения
параметра / , при которых векторы а = {/; 1 -г; 7}
и # = {/ + 1; 2; - 2}, заданные своими
координатами в ортонормированном базисе,
ортогональны.
Используя критерий ортогональности
векторов, получаем уравнение
г(/ + 1) + 2(1-О-14 = 0
относительно параметра / . Решая это
квадратное уравнение, находим, что лишь при
/ = -3 и t = 4 данные векторы ортогональны.
6.2.2. Векторное произведение.
Упорядоченную тройку некомпланарных векторов
а,Ь,с называют правой, если направление
вектора а совмещается с направлением
вектора b при помощи кратчайшего поворота
вектора а в плоскости этих векторов,
который со стороны вектора с совершается
против хода часовой стрелки. В противном случае
(поворот по ходу часовой стрелки) эту тройку
называют левой.
Так как три некомпланарных вектора
образуют базис в V-$ , то также говорят о
правых и левых базисах. Все базисы в V^
разделяются на два класса: класс правых базисов и
класс левых базисов. Класс, к которому
относится фиксированный базис, называют его
ориентацией.
Векторным произведением векторов а и
Ь называют такой вектор с , который
удовлетворяет следующим трем условиям: вектор
с ортогонален векторам а и b ; длина
вектора с равна |с| = |a||#|sir^, где ф - угол
между векторами а и b; упорядоченная
тройка векторов а,Ь,с является правой (рис.
6.2.1). Векторное произведение векторов а и
b обозначают ахb или [а,Ь].
252
Глава 6.2. ПРОИЗВЕДЕНИЯ ВЕКТОРОВ
Если векторы а и b коллинеарны, то
третье условие становится неопределенным,
так как тройка векторов будет компланарна.
Однако при этом, согласно второму условию,
длина векторного произведения должна
равняться нулю. Это однозначно определяет
векторное произведение как вектор, равный нуль-
вектору.
Векторное произведение используют,
например, в механике. Момент силы F,
приложенной к точке Л/, относительно
некоторой точки О равен ОМ х F (рис. 6.2.2).
Отметим некоторые геометрические
свойства векторного произведения.
Для того чтобы два вектора были
коллинеарны, необходимо и достаточно, чтобы их
векторное произведение равнялось нуль-
вектору;
если векторы а и b не коллинеарны,
то модуль \а х b\ их векторного произведения
равен площади параллелограмма, построенного
на этих векторах как на смежных сторонах;
если ненулевые векторы а и b
ортогональны, то для геометрического построения
вектора а х b достаточно совместить их
начала и в плоскости, перпендикулярной к
вектору b , повернуть вектор а на 90° вокруг
вектора b по ходу часовой стрелки (если
смотреть с конца вектора b ), а затем умножить
повернутый вектор на число \b\.
Последнее свойство можно обобщить на
случай любых неколлинеарных векторов.
Проекцией прл а вектора а = А В на плоскость
к назовем вектор, соединяющий
ортогональные проекции на плоскость я начала А и
конца Б вектора а (рис. 6.2.3).
OMxF
Рис. 6.2.3
Рис. 6.2.4
Проекция вектора на плоскость
сохраняет свойства проекции вектора на прямую:
проекция суммы векторов равна сумме их
проекций, при умножении вектора на число
его проекция на плоскость умножается на это
число.
Пусть к — плоскость,
перпендикулярная к вектору b . Тогда axb = (npn a)xb .
На рис. 6.2.4 векторы a, b и а'=(прка)
изображены с общим началом в некоторой
точке плоскости к.
Учитывая сказанное, можно следующим
геометрическим способом построить
векторное произведение векторов а и b .
Совместив их начала, спроектируем вектор а на
плоскость п, перпендикулярную к вектору
b . Полученную проекцию в плоскости,
перпендикулярной к вектору b , повернем вокруг
вектора b на угол 90° по ходу часовой
стрелки (если смотреть с конца вектора b ) и
результат поворота умножим на число Щ. В
результате этих трех преобразований вектора
а получим вектор axb .
Важнейшими алгебраическими
свойствами векторного произведения являются
следующие: свойство антикоммутативности
axb = -bxa; свойство ассоциативности
совместно с умножением на число
(Xa)xb = X(axb), ах(ХЬ) - X(axb);
свойство дистрибутивности относительно
сложения (a + b)xc = axc + bxcy ax(b +
+с) = axb + axc .
Свойства ассоциативности и
дистрибутивности векторного произведения объеди-
ДВОЙНОЕ ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ
253
i
ха
Ч
J
Уа
Уь
к
Za
Zb
няют в свойство линейности векторного
произведения.
Рассмотрим правый ортонормированный
базис i,j,k. Векторные произведения
всевозможных пар векторов базиса (всего 9 пар)
выглядят следующим образом: / х j = k и
jxi = -k; jxk = i и кх j - -i; kxi = j
и ixk = -j. Векторные произведения
базисных векторов на себя не приведены, так
как все они равны нуль-вектору.
Для векторов а = {ха ; уа ; za } и b =
= {хь 5 Уь '■> Zb }» заданных своими
координатами в ортонормированном базисе /, j, к ,
axb =
6.2.3. Смешанное произведение.
Смешанным произведением трех векторов а, Ь, с
называют число, равное (axb)c —
скалярному произведению векторного произведения
первых двух векторов и третьего вектора.
Обозначают смешанное произведение трех
векторов а, Ь, с так: abc .
Смешанное произведение трех векторов
abc имеет простой геометрический смысл:
оно равно объему параллелепипеда,
построенного на этих векторах, взятого со знаком
плюс, если тройка векторов а,Ь,с — правая,
и со знаком минус, если эта тройка — левая.
Если векторы а,Ь,с компланарны, то
параллелепипед, построенный на них, вырождается
(лежит в плоскости) и имеет нулевой объем,
но и (axb)с = О . Для смешанного
произведения действует правило циклической
перестановки: (а х b)c = (bx c)a = (cxa)b =
= -(Ьха)с = -(схЬ)а = -(ахс)Ь . Отсюда,
в частности, следует, что порядок двух
операций, дающих смешанное произведение, не
является существенным. Это объясняет,
почему в обозначении смешанного
произведения знаки образующих операций опускаются.
Три вектора а,Ь,с компланарны тогда
и только тогда, когда их смешанное
произведение равно нулю. Для смешанного
произведения выполняются свойства ассоциативности
относительно умножения векторов на число и
свойство дистрибутивности по каждому
сомножителю, например, (Xa)bc = X(abc),
(И| + aj)bc = a\bc + ajbc . Эти свойства
смешанного произведения называют
свойством линейности смешанного произведения.
Если векторы а = {ха ; уа ; za }, b = {xb ;
Уь \ Zb }, с = {хс\Ус'^} заданы своими
координатами в ортонормированном базисе, то
abc =
*а У a Za
Ч УЬ Zb
хс ус zc
Таким образом, необходимым и
достаточным условием компланарности трех
векторов, заданных координатами в
ортонормированном базисе, является равенство нулю
определителя третьего порядка, строками которого
являются координаты этих векторов.
Пример 6.2.3. Найдем объем треугольной
пирамиды, построенной на векторах
а = {-2;1;-2}, 4 = {1;0;-1} и с = {1;1;1}
как на смежных ребрах.
Трем векторам с общим началом можно
сопоставить как треугольную пирамиду, так и
параллелепипед, причем объем пирамиды
будет в 6 раз меньше объема
параллелепипеда, равного модулю смешанного произведения
abc данных векторов. Итак, объем пирамиды
V = \abc\/6 = l.
6.2.4. Двойное векторное
произведение. Трем векторам a, b и с можно
поставить в соответствие вектор, равный
ах(Ьхс). Этот вектор называют двойным
векторным произведением векторов a, b и с .
Оно выражается через линейную комбинацию
двух из трех своих сомножителей по формуле
ax(bxc) - b(ac)-c(ab).
Глава 6.3
СИСТЕМЫ КООРДИНАТ
В основе аналитической геометрии
лежит возможность однозначного описания
точек при помощи наборов чисел,
называемых координатами. Описание множества с
помощью соотношений между координатами
входящих в него точек позволяет привлечь
для его исследования алгебраические методы.
Наоборот, зависимости (уравнения,
неравенства и их системы) можно интерпретировать
как зависимости между координатами точек и
ассоциировать с ними множество,
составленное из точек, координаты которых
удовлетворяют этим зависимостям, и, следовательно,
получить наглядное представление чисто
алгебраической задачи (например, в случае по-
254
Глава 6.3. СИСТЕМЫ КООРДИНАТ
иска решений уравнений и их систем). Таким
образом, возникает своеобразный мостик,
связывающий алгебру и геометрию.
Решающую роль в возникновении такой связи
играет система координат.
6.3.1. Декартова система координат.
Декартовой (аффинной) системой координат
называют пару, состоящую из фиксированной
точки О и некоторого базиса.
Соответственно трем пространствам Kj, V2, У3 получаем
три варианта декартовой системы координат:
на прямой, на плоскости и в пространстве.
Декартовыми (аффинными) координатами
произвольной тонки М являются координаты
вектора ОМ в заданном базисе.
С декартовой системой координат
связаны следующие понятия: начало (системы)
координат — точка О в составе декартовой
системы координат; репер — базис в составе
декартовой системы координат, для векторов
которого выбрана общая точка приложения в
начале координат; оси координат
(координатные оси) — прямые, на которых лежат
векторы репера, задающие направление на
этих прямых. Оси имеют специальные
названия (в порядке нумерации): ось абсцисс, ось
ординат и ось аппликат. Координаты точки
именуются по осям: абсцисса, ордината и
аппликата. На плоскости отсутствует ось
аппликат, на прямой также нет оси ординат.
Координатные плоскости — плоскости,
определяемые парами векторов репера. Понятие
используется для декартовой системы
координат в пространстве; радиус-вектор точки
М — вектор ОМ , соединяющий начало
координат О с этой точкой.
Декартову систему координат общего
вида часто называют косоугольной системой
координат. Если репер декартовой системы
координат является ортонормированным
базисом, то такую систему координат называют
декартовой прямоугольной системой
координат, или просто прямоугольной системой
координат, а декартовы координаты точки — ее
прямоугольными координатами.
Часто под системой координат
подразумевается прямоугольная система координат с
правым базисом, а под координатами точки -
ее прямоугольные координаты.
Использование других систем координат, как правило,
специально оговаривают. Для обозначения
декартовых систем координат, например в
пространстве, используют обозначения типа
Oijk, где О — начало системы координат, а
I, j', к — ортонормированный репер (базис),
или Oxyz, указывая координатные оси.
6.3.2. Преобразование прямоугольных
координат. Использование различных систем
координат ставит задачу вычисления
координат точки в одной системе координат по ее
координатам в другой системе.
Пусть Oijk и O'i'j'k' - прямоугольные
системы координат в пространстве (старая и
новая) и известны координаты точки
0 (Ь[; bi; b$ ) и векторов i = {щ j; а2\; (Х31},
/ = {а12; а22; а32}, к' = {а13; а23; а33} в
старой системе координат. Координаты
(x\y;z) точки М в старой системе
координат и координаты (*';y'\z) этой же точки в
новой системе координат связаны равенствами:
х = апх' + щ2у + a{3z +1\ ,
у = а21х + а22/ + a23z' + Ь, (6.3.1)
г = а31х' + а32/ + а33г, + ^.
Набор коэффициентов а,у в системе
(6.3.1) отражает положение репера новой
системы координат, а свободные члены b\, tfy, &3
характеризуют изменение начала координат.
Если репер системы координат не изменился,
а поменялось лишь начало координат, то
формулы преобразования выглядят более
просто: х = х +bi, y = y' + t>2, Z = Z + £3 •
Такое преобразование называют параллельным
переносом системы координат в пространстве
на вектор 00'.
Все вышеизложенное относится к
прямоугольной системе координат в
пространстве. Прямоугольная система координат на
плоскости отличается от пространственной
лишь тем, что репер состоит из двух векторов,
а точки имеют всего две координаты.
Преобразование системы координат на плоскости
описывается уравнениями х = vl\\X +
+<*12J;' + ^l> У = Ъ-г\х' + У-22У' + ^2 » где
{oti/ ;а2/-}, / = 1,2, — координаты векторов
1 ,7 нового репера относительно старого
(i,y), a (t\\bi) — координаты точки О'
начала новой системы координат в старой
системе координат.
Преобразование параллельного переноса
системы координат на плоскости выглядит
так: х = х + Ь\ ,у = у' + t>i. Если начала
новой и старой систем координат на плоскости
совпадают, то возможны два случая. В первом
ПРОСТЕЙШИЕ ЗАДАЧИ АНАЛИТИЧЕСКОЙ ГЕОМЕТРИИ
255
из них новый репер может быть получен из
старого поворотом последнего на некоторый
угол ф вокруг общего начала систем
координат, причем полагают, что ф > 0(ф < 0) при
повороте против хода (по ходу) часовой
стрелки (рис. 6.3.1). В этом случае
преобразование называют поворотом системы
координат на плоскости на угол ф, координаты
векторов i и j нового репера относительно
старого выражаются через угол поворота ф:
Г = {со5ф; втф}, /' = {-sin9; соБф} (см.
рис. 6.3.1), и поэтому х = х'соБф-Узшф,
у -х sinф + у cosф. Если преобразование
состоит в последовательном выполнении
поворота и параллельного переноса, то х =
= xcos<p-y'sm<p + b\, у = х'8тф + }>'со8ф +
+^2 Во втором случае с помощью поворота
старого репера вокруг начала координат на
некоторый угол ф можно совместить лишь
векторы i и /', но при этом векторы j и
у' окажутся противоположными, и для их
совмещения потребуется выполнение
преобразования зеркального отражения плоскости
относительно первой оси координат.
В первом случае о двух реперах на
плоскости говорят, что они имеют одинаковую
ориентацию, а во втором — противоположную.
Аналогичную терминологию используют
и для пространства. Если начало новой и
старой прямоугольных систем координат в
пространстве совпадают и изменяется лишь репер
системы координат, то формулы
преобразования координат имеют вид:
х = апх' + щ2у' + Щз1,
у = а21х' + а22 / + (Х2з£'> <6-3-2)
Z = a3[x' + a32y' + a33z'-
Преобразование (6.3.2) называют
поворотом системы координат в пространстве,
если реперы новой и старой систем координат
имеют одинаковую ориентацию, т.е. являются
оба правыми или левыми. Как и в случае
плоскости, это связано с тем, что реперы с
одинаковой ориентацией можно совмещать с
помощью поворотов. Если же реперы имеют
разную ориентацию, то для их совмещения
кроме поворота требуется выполнение
зеркального отражения.
Рис. 6.3.1
6.3.3. Простейшие задачи
аналитической геометрии. Векторы и точки. Для
вектора в пространстве или на плоскости
справедливы правила: координаты вектора получают
вычитанием из координат его конца
координат его начала; координаты конца вектора
получают сложением координат вектора с
координатами его начала; координаты начала
вектора получают вычитанием из координат
его конца координат вектора.
Деление отрезка в заданном отношении.
Пусть концы М[ и М2 отрезка М\М2
заданы своими координатами в произвольной
прямоугольной системе координат Oijk в
пространстве: М{ (х{; у{; Z\), М2 (х2 \ У2 \
Z2) • Если обозначить координаты точки М,
делящей отрезок в заданном отношении
|A/iA/|: |AfA/2| = Р 'Я через (x;y;z), то
x = px2+QX\ ? у_РУ2+1У\
p+q ' p+q
Z=PZ2 + <К\
p + q
Если точка М - середина отрезка
М[ М2, то р - q = 1, и поэтому
Y _ *1 + *2 ,. _ У\ + У2
2 'У~ 2 '
2 '
В случае плоскости верны аналогичные
формулы, которые получаются из
приведенных исключением третьей координаты
(аппликаты).
Пример 6.3.1. В вершинах Л(4;4;4),
Я(-2;6;4), С(-4;4;2) треугольника ЛВС
расположены материальные точки равной
массы. Центр масс этой системы совпадает с
256
Глава 6.3. СИСТЕМЫ КООРДИНАТ
точкой М пересечения медиан треугольника
АВО. Пусть точка N — середина стороны
ВС. Тогда ее координаты (x;y,z) равны
полусумме соответствующих координат точек
В и С, следовательно, х = -3, у = 5, £ = 3.
Медиану AN точка М делит в отношении
\АМ|: \MN\ = 2:1, поэтому координаты
(х0 i Уо \ Zq ) Центра масс рассматриваемого
треугольника равны:
_ 2 (-З)-н! 4 2
х° = 271 = ~з'
2-5 + 1-4 14
Уо=_Т7Г~ = Т'
_ 2-3 + 1-4 _ 10
*° = 2 + 1 = Т'
Длина отрезка. Пусть концы отрезка М\ и
Mj заданы своими координатами: М\ (xj;
у{; Z[) , М2 (х2 ; у2 ; ^2 ) • Тогда длина отрезка
М\ М2 вычисляется по формуле \М\ М2 \ =
= J(x2 - х{ )2 + (у2 - у{ )2 + (z2 - Z\ )2 • А в
случае плоскости нет аппликат.
Вычисление площадей и объемов.
Вычисление площадей многоугольников и объемов
многогранников, заданных координатами
своих вершин в прямоугольной системе
координат, основывается на использовании скаляр-
ного, векторного и смешанного произведений
векторов.
Если параллелограмм задан в
пространстве координатами своих вершин, то для
вычисления его площади нужно найти
координаты двух векторов, соответствующих
смежным сторонам параллелограмма, а затем
вычислить модуль их векторного произведения.
Аналогично определяется площадь
треугольника, равная половине модуля векторного
произведения векторов, на которых он
построен как на смежных сторонах. Для
вычисления объема параллелепипеда, заданного
координатами своих вершин, нужно найти
координаты трех векторов, соответствующих
смежным ребрам, а затем вычислить модуль
смешанного произведения этих векторов.
Через смешанное произведение находят и
объем произвольной треугольной пирамиды
SABC , поскольку он равен 1/6 объема
параллелепипеда, построенного на ребрах АВ,
~АС и AS .
6.3.4. Кривые и поверхности.
Множество точек на плоскости или в пространстве
можно описать системой уравнений и (или)
неравенств, связывающих координаты точек
из этого множества. И одна из важнейших
задач аналитической геометрии — построение
уравнения или системы уравнений и
неравенств, описывающих заданное множество.
Если уравнению F(x,y,z) = Q
удовлетворяют те и только те тройки чисел х, y,Z, для
которых точка M(x,y,z) принадлежит
множеству S в пространстве, то это
уравнение называют уравнением множества S, а
само множество S — геометрическим образом
этого уравнения. Если уравнению
F(x, у) = 0 удовлетворяют те и только те
пары чисел х и у, для которых точка М(х\у)
принадлежит множеству Г на плоскости, то
уравнение F(x,y) = Q называют уравнением
множества Г, а само множество Г —
геометрическим образом этого уравнения.
В рамках аналитической геометрии
рассматривают уравнения F(x,y,z) = 0
(F{x,y) = 0) на плоскости), для которых
функция F является многочленом своих
переменных. Многочленом от п переменных
Х[,...,хп называют функцию вида
т
F(xl9...,xn)= £ ah^inx[x ,...,xlnn ,
/l+...+!„ =0
где /|,...,/Л - целые неотрицательные числа;
щ jn — действительные числа, причем хотя
бы один из коэффициентов щ } / , для
которых i[ + ... + /„ = т , не равен нулю. Число
т называют степенью многочлена от п
переменных. Многочлены нулевой степени имеют
вид F = uq о и являются постоянными
функциями. Вид многочленов первой степени
зависит от количества переменных.
Например, /r = 2x-4j + 5z-l ~ многочлен
первой степени от трех переменных, а
F = х - у + 3 — многочлен первой степени
от двух переменных. При п < к любой
многочлен степени т от п переменных можно
рассматривать как многочлен той же степени
от к переменных, т.е. от большего числа
переменных. Уравнение F(x\ ,...,хп) = 0 , в
левой части которого стоит многочлен от п
ПОЛЯРНАЯ СИСТЕМЫ КООРДИНАТ
257
переменных, называют алгебраическим.
Алгебраической поверхностью называют
геометрический образ в пространстве, соответствующий
уравнению F(x,y,z) = 0, где F -
многочлен от трех переменных x,y,z. Степень
многочлена F в уравнении F = О называют
порядком уравнения, или его степенью.
Алгебраической кривой (или линией) на плоскости
называют геометрический образ на плоскости,
соответствующий уравнению F(x, у) = 0 , где
F — многочлен от двух переменных х, у.
При преобразовании системы координат
уравнение поверхности (кривой) изменяется.
Чтобы получить уравнение поверхности в
новой системе координат, необходимо в
исходное уравнение подставить вместо старых
переменных их выражения через новые
переменные. В случае алгебраической поверхности
(алгебраической кривой) преобразование
координат в уравнении приводит к многочлену
той же степени, что и степень
первоначального уравнения. Степень многочлена в
уравнении, описывающем данную алгебраическую
поверхность (кривую на плоскости),
определяется неоднозначно. Минимальный порядок
уравнения, описывающего алгебраическую
поверхность (алгебраическую кривую на
плоскости) в прямоугольной системе
координат, называют порядком этой поверхности
(кривой).
Кривую в пространстве можно
рассматривать как линию пересечения двух
поверхностей. Описывая каждую из таких
поверхностей уравнением в одной и той же системе
координат, мы получим систему двух
уравнений, описывающую линию пересечения
поверхностей.
6.3.5. Полярная система координат.
Кроме прямоугольной системы координат на
плоскости часто используют полярную систему
координат, которая полностью определяется
упорядоченной парой точек О и 0\ . Первую из
них — точку О — называют полюсом полярной
системы координат. Из полюса в
направлении второй точки 0[ проводят луч Ор ,
называемый полярной осью (рис. 6.3.2).
Расстояние между точками О и Оу выбирают в
качестве единицы масштаба.
Положение точки М в полярной системе
координат фиксируется расстоянием р между
точкой М и полюсом О, называемым
полярным радиусом, и углом ф между полярной
осью и вектором ОМ — полярным углом.
Полярный радиус и полярный угол
составляют полярные координаты точки М на
плоскости, которые записывают так: Л/(р;ф).
Полярный угол измеряют в радианах и
отсчитывают от полярной оси. Если значение угла
положительно, то его отсчитывают против
хода часовой стрелки, в противном случае —
по ходу часовой стрелки (см. рис. 6.3.2). Для
полюса р = 0 , а угол ф не определен. Для
остальных точек плоскости р > 0 , а
полярный угол ф определен с точностью до 2л.
Поэтому для полярного угла иногда
фиксируют промежуток его изменения, например
(-л, л], [-к,к) или [0,2л).
Координаты точки на плоскости часто
записывают как в полярной, так и в
прямоугольной системах координат и используют
преобразования этих координат друг в друга.
Если нет специальных указаний, то при этом
подразумевают следующее взаимное
расположение прямоугольной и полярной систем
координат (рис. 6.3.3): полюс полярной
системы координат совмещен с началом
прямоугольной системы координат; полярная ось
совпадает с положительной частью оси
абсцисс, а масштаб в полярной системе для
вычисления расстояний берется равным единице
длины в прямоугольной системе координат. В
этом случае прямоугольные координаты
(х;у) точки М на плоскости выражаются
через ее полярные координаты (р,ф) с
помощью соотношений (см. рис. 6.3.3):
Х = рС05ф, у = р51Пф.
(6.3.3)
Рис. 6.3.2
У<
У
ji
О
1
1 jy^^
Ун»
К 1_. ^
I J
>м
С X
Рис. 6.3.3
7706
258
Глава 6.3. СИСТЕМЫ КООРДИНАТ
С учетом ограничения фе (-я, я] на
полярный угол полярные координаты точки
определяются через ее прямоугольные координаты
следующим образом:
-i
х2 + у2
ф =
arctg(j/x), x>0;
к + arctg(у/х), х < О, у > О
-я + arctg(у/х), х < О, j < О
я/2, jc = 0, у>0
-я/2, л = 0, у<0
(6.3.4)
6.3.6. Цилиндрическая и сферическая
системы координат. Для введения
цилиндрической системы координат в пространстве
выберем плоскость Р и зафиксируем на ней
некоторую полярную систему координат с
полюсом О и полярной осью Ор. Через точку О
перпендикулярно плоскости Р проведем ось
Oz , выбирая ее направление таким образом,
чтобы возрастание полярного угла со стороны
положительного направления оси Oz
происходило против хода часовой стрелки (рис.
6.3.4, а). Фиксируем единицу масштаба для
расстояния между точками.
Цилиндрическими координатами точки М
в пространстве называют упорядоченную
тройку чисел р,ф, Z, в которой (р;ф) —
полярные координаты ортогональной проекции
точки М на плоскость Р, a z ~ ортогональная
проекция вектора ОМ на ось Oz (см. рис.
6.3.4, а). Координата р точки М равна ее
расстоянию до оси Oz . Название этой
системы (цилиндрическая) связано с тем, что
точки с одинаковой первой координатой р
образуют прямой круговой цилиндр радиуса р .
На рис. 6.3.4, б показано стандартное
взаимное расположение цилиндрической и
прямоугольной систем координат в
пространстве, при котором первые координаты любой
точки в этих системах связаны
соотношениями (6.3.3) и (6.3.4), а ее третьи координаты
совпадают.
Сферическая система координат в
пространстве вводится аналогично
цилиндрической системе. Сферическими координатами
точки М в пространстве называют
упорядоченную тройку чисел р, ф, D, в которой р -
длина вектора ОМ , ф - полярный угол
ортогональной проекции точки М на плоскость
Р, а Ф — угол, который образует вектор ОМ
с положительным направлением оси Oz (рис.
6.3.5, а). Иногда используют и другой вариант
сферической системы координат, в которой в
качестве угла Ф берется угол между вектором
ОМ и плоскостью Р.
а)
Рис. 6.3.4
б)
а)
б)
Рис. 6.3.5
АЛГЕБРАИЧЕСКИЕ КРИВЫЕ ПЕРВОГО ПОРЯДКА
259
Отметим, что Фе[0,л], а сферическая
координата р точки равна ее расстоянию до
точки О. Название системы (сферическая)
связано с тем, что точки с одинаковой первой
координатой р образуют сферу радиуса р с
центром в точке О.
Для стандартного взаимного
расположения сферической и прямоугольной систем
координат в пространстве (рис. 6.3.5, б)
преобразования координат имеют вид:
х = psintfcosq),
у - psintfsinq),
Z = р cos Ф
Р = V*2 + У1 + z2 >
(6.3.5)
Ф = arccos
у]х2 + у2 +z2
arctg(у/х), х > 0;
к + arctg(у/х), х < 0, у > 0;
-к + arctg(j;/x), х < 0, у < 0;
л/2, х = 0, j>>0;
-я/2, х = 0, у<0.
(6.3.6)
В цилиндрической и сферической
системах координат могут накладываться
ограничения на возможные значения угла ф,
отмеченные выше для полярной системы
координат, с тем чтобы этот угол определялся для
каждой точки однозначно. Значение второй
координаты ф в этих системах для точек оси
Oz не определено, и положения таких точек
полностью определяются значениями двух
других координат.
Глава 6.4
ПРЯМАЯ НА ПЛОСКОСТИ
6.4.1. Алгебраические кривые первого
порядка. Любая алгебраическая кривая первого
порядка на плоскости, т.е. кривая, которая в
заданной прямоугольной системе координат
описывается алгебраическим уравнением первого
порядка ах + by + с = 0 , где хотя бы один из
коэффициентов а или b отличен от нуля,
есть прямая. Любая прямая на плоскости
представляет собой алгебраическую кривую
первого порядка.
Рис. 6.4.1
Уравнение вида ах + by + с = 0 ,
а + b Ф 0 , называют общим уравнением
прямой. Его коэффициенты а и b являются
координатами вектора п = {а\Ь),
перпендикулярного к прямой L на плоскости
(рис. 6.4.1). Такой вектор называют
нормальным вектором прямой. Он, как и общее
уравнение прямой, определяется с точностью до
(ненулевого) числового множителя.
Если известна точка Л/0 (xq 1.Уо )' ле~
жащая па прямой L, то общее уравнение
прямой можно записать в виде а(х - xG) +
+Ь(у - уц ) = 0 . Такое уравнение позволяет
по координатам точки на прямой L и
координатам нормального вектора п = {а\Ь)
прямой L записать уравнение прямой без
промежуточных вычислений.
Если точки Л/| и Л/2 расположены по
одну сторону от прямой L, то, подставив их
координаты в левую часть общего уравнения
этой прямой, мы получим значения с одним
знаком. Если такая подстановка приводит к
значениям с разными знаками, то эти точки
лежат по разные стороны от прямой L .
6.4.2. Специальные виды уравнения
прямой. Уравнение вида у = kx + b
называют уравнением прямой с угловым
коэффициентом. Параметр к (угловой коэффициент
прямой) равен tgф — тангенсу угла наклона
прямой, а параметр b — ординате точки
пересечения прямой с осью Оу (рис. 6.4.2).
Прямую L на плоскости, для которой
известна точка М^(х^\у^) на этой прямой
и ненулевой вектор s = {/;/w}, параллельный
ей (рис. 6.4.3), можно описать уравнениями
х = xq + It, у = Уо + mt, которые называют
параметрическими уравнениями прямой L.
Вектор 5 , используемый в параметрических
уравнениях прямой, называют направляющим
вектором прямой L.
9*
260
Глава 6.4. ПРЯМАЯ НА ПЛОСКОСТИ
Рис. 6.4.2
Рис. 6.4.3
Записав параметрические уравнения
прямой в векторной форме через радиус-
векторы /|) и г точек Mq и М , получим
векторное уравнение г - r§ + ts прямой L .
Точка M(xq ;_Уо ), лежащая на прямой,
соответствует значению параметра / = 0.
Уравнение
х-х0 у-у0
I
т
называют каноническим уравнением прямой L .
Его можно также получить, исключив из
параметрических уравнений параметр /.
Прямую L, на которой известны две
точки М\ (х\; ^ ) и Мг (х2; у2 )» можно
описать уравнением
х-х] _ у-у]
Х2 _ Х{ у2- ух
которое называют уравнением прямой,
проходящей через две точки.
В каноническом уравнении и в
уравнении прямой, проходящей через две точки, в
одном из знаменателей может появиться
нулевое значение. Нуль в знаменателе дроби
указывает на то, что и числитель этой дроби
равен нулю.
Прямую L можно определить ее
точками А(а,0) и В(0,Ь) пересечения с осями
координат (предполагается, что эти две точки
не совпадают с началом системы координат,
т.е. что а Ф 0 и b Ф 0 , рис. 6.4.4). Такой
способ задания прямой приводит к уравнению
a b
(6.4.1)
которое называют уравнением прямой в
отрезках.
Определим прямую L при помощи
перпендикулярного к ней единичного вектора
п и расстояния р > 0 до прямой от начала
системы координат. Существуют два
единичных вектора, перпендикулярных к прямой L .
Из этих двух выберем тот, который имеет
начало в точке О и направлен «в сторону
прямой» L (рис. 6.4.5).
Выбранный вектор п однозначно
определяется своим углом ф с осью Ох,
п = {cos ф; sin ф} . Уравнение хсо8ф +
+ j^ sin ф — /> = 0 называют нормальным
уравнением прямой L. Общее уравнение прямой
ах + by + с = 0 можно преобразовать в ее
нормальное уравнение делением на норми-
±\[а
рующий множитель ±^а" + b , знак
которого выбирается противоположным знаку с.
По абсолютной величине нормирующий
множитель представляет собой длину
нормального вектора {а\Ь} прямой. Если с = 0,
то прямая проходит через начало координат
(р = 0). В этом случае знак нормирующего
множителя можно выбирать любым.
Взаимное расположение двух прямых.
Для параллельности прямых Ц : щх +
+Ь\у + С\ = 0, Li: а2х + Ь}у + С2 = 0
необходимо и достаточно, чтобы были коллинеар-
ными их нормальные векторы щ ={Q\\b\) и
п2 ~ ia2 > ^2 } > что можно записать в виде
= 0.
Эти прямые перпендикулярны тогда и
только тогда, когда ортогональны их
нормальные векторы, что можно записать в виде
ЩП2 =0 или Q\Q2 + b\t>2 =0.
Sl
а2
= — или
bi
"1
*1
а2
h
АЛГЕБРАИЧЕСКИЕ ПОВЕРХНОСТИ ПЕРВОГО ПОРЯДКА
261
Ф = arctg
Рис. 6.4.5
И условие параллельности, и условие
перпендикулярности можно записать через их
угловые коэффициенты: к\ = к2 - условие
параллельности; к^к2 --\ - условие
перпендикулярности.
Значение ф меньшего из углов между
пересекающимися прямыми Ц и Ь±
вычисляется согласно формуле
1*1*21 |*1*2 + bih\
С05ф =
ЫЫ ^i+b^aj+q '
Этот угол представляет собой разность
углов наклона прямых. Если к\ = tgy\,
к2 = tg<p2 > то
к{ -к2
tg<p = tg(9i - ф2 )=
1 + к[к2
Значение острого угла поворота вокруг
точки пересечения прямых, при котором
прямая Z/2 совмещается с прямой Ц ,
определяется по формуле
к\ — к2
1 + kik2
Расстояние от точки до прямой. Для
вычисления расстояния от данной точки
М(х,у) до прямой L, заданной своим
общим уравнением ах + by + с = О, используют
формулу
P(M,L) =
\ах + by + с\
Глава 6.5
ПРЯМАЯ И ПЛОСКОСТЬ
В ПРОСТРАНСТВЕ
6.5.1. Алгебраические поверхности
первого порядка. Любая алгебраическая
поверхность первого порядка в пространстве, т.е.
поверхность, которая в заданной
прямоугольной системе координат Oxyz описывается
алгебраическим уравнением первого порядка
Ax + By + Cz + D = Q, где хотя бы один из
коэффициентов А, В, С отличен от нуля,
является плоскостью. Любая плоскость в
пространстве представляет собой алгебраическую
поверхность первого порядка.
Уравнение Ах + By + Cz + D - О, А2 +
+В + С * 0 называют общим уравнением
плоскости. Коэффициенты А, В,С при
неизвестных в этом уравнении имеют наглядный
геометрический смысл: вектор п-{А\В\С)
перпендикулярен к плоскости и его называют
нормальным вектором плоскости.
Если точка MQ (x0 ;y0 ;Zq )
принадлежит плоскости я, то ее координаты
удовлетворяют общему уравнению, которое
можно записать в виде А(х - Хц ) + В(у -
-Уо ) + C(Z~ Zq)-Q • Уравнение плоскости в
таком виде можно записать по известным
координатам точки плоскости и ненулевого
вектора, перпендикулярного к плоскости, без
каких-либо вычислений.
Если точки М\ и М2 расположены по
одну сторону от плоскости к , то, подставив их
координаты в левую часть общего уравнения
этой плоскости, мы получим значения с одним
знаком. Если такая подстановка приводит к
значениям с разными знаками, то эти точки
лежат по разные стороны от плоскости к .
262
Глава 6.5. ПРЯМАЯ И ПЛОСКОСТЬ В ПРОСТРАНСТВЕ
6.5.2. Специальные виды уравнения
плоскости. Векторное и параметрические
уравнения плоскости. Пусть /& и г — радиус-
векторы точек соответственно Mq и М
(рис. 6.5.1, а). Тогда MqM = /•-/{), и
уравнение плоскости, проходящей через точку
Mq перпендикулярно к ненулевому вектору п,
можно записать в виде /|(г-/()) = 0, которое
называют векторным уравнением плоскости.
Выберем пару неколли неарных векторов
е\ ={e[x'>eiy'>eiZ}> е2 ={e2x'>e2y\e2z}> па~
раллельных рассматриваемой плоскости, и
точку Mq (x0 ;>>o ',Zq ) на плоскости. Если
точка M{x\y\z) принадлежит плоскости, то
это эквивалентно тому, что существует
разложение вектора MqM в базисе e±,e2 (рис.
6.5.1, б), т.е. существуют такие числа /j и t2 ,
для которых MqM = /f^i + t2e2, откуда
получаем векторное параметрическое уравнение
плоскости г = /fo + t{ e{ + t2e2» *1»*2 G ^ •
Приравнивая одноименные координаты
векторов г и /J) + /j в| + /2е2 » получаем /ш/ш-
метрические уравнения плоскости: х = Xq +
+ /^1х + /2е2х, у = у0 + t{ely + t2e2y ,
Z = Zq + /i«?u + /2<?2<.
Плоскость, проходящая через три точки.
Предположим, что три точки М\, Л/2 и М?>
не лежат на одной прямой. Тогда существует
единственная плоскость я, которой эти
точки принадлежат. Ее уравнение записывают в
виде определителя
х-х{ у-у{ z-Z[
х2 -х{ у2- у{ z2 - Z{
*з-*1 Уъ-У\ Ъ-Zi
= 0,
где (xi\yi\Zi) — координаты точек Л/,-,
/ = 1,2,3, a (x\y\z) — координаты
произвольной точки М плоскости. Например, три
точки Aft(a;0;0), Л/2(0;£;0), Л/З(0;0;с)
при abc Ф 0 не лежат на одной прямой и
задают плоскость, которая отсекает на осях
координат отрезки ненулевой длины (рис.
6.5.2). Здесь под «длинами отрезков»
понимают значение ненулевых координат радиус-
векторов точек Mj , / = 1,2,3. Уравнение
этой плоскости можно записать в виде
х/а + y/b + z/c = 1 , которое называют
уравнением плоскости в отрезках.
Нормальное уравнение плоскости.
Фиксируем для плоскости я в пространстве
единичный нормальный вектор п , направленный из
начала координат «в сторону плоскости»,
л = {cos ос; cos p; cos у}, где cos а, cos р,
cos у — направляющие косинусы вектора п .
Обозначим через р расстояние от начала О
системы координат до плоскости я (рис.
6.5.3). Если плоскость проходит через начало
системы координат, то р = 0, а в качестве
направления для нормального вектора п
можно выбрать любое из двух возможных.
Если точка M{x\y\z) принадлежит
плоскости к, то это эквивалентно тому, что
для ее координат выполнено нормальное
уравнение плоскости х cos a + у cos р +
+Z cos у - р = 0.
Рис. 6.5.1
УРАВНЕНИЯ ПРЯМОЙ В ПРОСТРАНСТВЕ
263
Ъ У
Рис. 6.5.2
Общее уравнение плоскости в пространстве
всегда можно преобразовать в ее нормальное
уравнение делением на нормирующий
множитель ±у1А + В +С , знак которого
выбирается противоположным знаку D .
6.5.3. Уравнения прямой в
пространстве. Прямую в пространстве можно
рассматривать как линию пересечения двух
плоскостей. Объединяя их уравнения в систему
\A{x + Bxy + C{z + A =0,
[A2x + B2y + C2z + I>i =0,
получаем общие уравнения прямой в
пространстве.
Векторное уравнение прямой. Прямую L
в пространстве можно однозначно задать
любой ее точкой Mq и параллельным ей
ненулевым вектором s , который называют
направляющим вектором прямой (рис. 6.5.4). Условие
принадлежности точки М прямой L можно
записать в виде векторного уравнения прямой в
пространстве г = /fo + ts , где г и /& -
радиус-векторы точек соответственно М и
Mq , а параметр /gR.
Параметрические уравнения прямой в
пространстве. Используя координаты {1\т\п}
направляющего вектора s прямой L и
координаты точек Mq (xq ;.у0 \Zq ) и Л/(х;
у\ z), запишем векторное уравнение прямой в
координатной форме и получим
параметрические уравнения прямой в пространстве:
х = *о+//, у = у0 +mt, z = Zq + nt.
Канонические уравнения прямой в
пространстве. Из параметрических уравнений
прямой можно исключить параметр t и
записать результат в виде канонических
уравнений прямой в пространстве
*-*о У-Уо z-zq
I
т
Если в канонических уравнениях один
из знаменателей (или два, но не все три)
равен нулю, то соответствующий числитель
тоже равен нулю.
Уравнения прямой, проходящей через две
точки. Каждая прямая в пространстве
однозначно задается любыми двумя своими
различными точками М\ (х\; у\; Z\) и
М2 (х2 ; у2 ; Z2 ), а ее уравнение
х-х{ _ у-у{
Z~Z[
х2~хх у2-у\ z2-z\
называют уравнением прямой, проходящей через
две точки.
264
Глава 6.5. ПРЯМАЯ И ПЛОСКОСТЬ В ПРОСТРАНСТВЕ
Пример 6.5.1. Найдем координаты точки
Д симметричной точке Л(2;3;-1) относи-
м , х-1 у + 2 z-l
тельно прямой L : = = .
1-12
В вычислениях будем опираться на
следующее геометрическое построение точки В:
а) через точку А проводим плоскость к ,
перпендикулярную к прямой L ; б) находим
точку М пересечения прямой L и плоскости к;
в) отрезок AM удлиняем до отрезка АВ так,
чтобы точка М оказалась в середине отрезка
АВ (рис. 6.5.5). Так как плоскость я
перпендикулярна к прямой L, то в качестве нор-
мольного вектора п плоскости можно выбрать
направляющий вектор п = {1;-1;2} прямой
L. По известным координатам нормального
вектора плоскости к и принадлежащей ей
точки А записываем уравнение плоскости я:
1(х - 2) + (-\)(у - 3) + 2U + 1) = 0 . Чтобы
найти координаты точки М пересечения
прямой и плоскости по их уравнениям, запишем
параметрические уравнения прямой L:
х = 1 + t, у = -2-t, z = l+2t. Подставив
эти выражения для координат точки на
прямой в уравнение плоскости, получим
уравнение для параметра /(1 +1 - 2) - (-2 -1 - 3) +
+2(1 + 2f +1) = 0 , решение которого дает
значение параметра для точки М. Найдя это
значение t = -4/3 и подставив его в
параметрические уравнения прямой, получим
координаты точки пересечения х = -1/3,
у = -2/3, z = -5/3 . Поскольку эта точка
должна делить отрезок АВ пополам, ее
координаты равны полусумме соответствующих
координат точек А и В. Следовательно,
обозначив через (x',y',z) координаты точки Д
получим равенства:
2±^ = _1/3jl±/ = _2/3,zi±L = _5/3.
Отсюда х' = -8/3, / = -11/3,
*' = -7/3.
6.5.4. Взаимное расположение прямых
и плоскостей. Взаимное расположение
плоскостей. Пусть даны две плоскости, заданные в
прямоугольной системе координат. своими
общими уравнениями, щ: А\Х + В±у + С^ +
+D{ = 0, л2 : A2x + B2y + C2z +fy =0.
Один из двух углов между этими плоскостями
(обозначим его через ф) равен углу между их
нормальными векторами щ = {Д ;Д ;Q } и
п2 = {Л2;Д;С2} (Рис- 6.5.6), а другой угол
равен я - ф и
СОБф =
/!,/!2
АХА2 + ДД +QC2
yJA? +B? +Cj2 ^А£+В%+С
Если две данные плоскости взаимно
перпендикулярны, то это эквивалентно тому,
что их нормальные векторы ортогональны, т.е.
А\А2 + В\В2 +С\С2 = 0. Аналогично две
плоскости параллельны, если их нормальные
векторы коллинеарны, т.е. А\ /А2 = Д /В2 =
= С\/С2 . Если в этом двойном равенстве в
знаменателе одной из дробей стоит нуль, то
считают, что и в числителе той же дроби
стоит нуль. Параллельные плоскости могут
совпадать или быть различными, что через
коэффициенты их уравнений можно записать в
виде Ах /А2 = Д / В2 = С, /С2 = Д /D2 и,
соответственно, А\ /А2 = Д /В2 = С\ /C2 *
*Dy/D1.
Угол между прямыми. Если для прямых
L\ и Li известны их направляющие векторы
Рис. 6.5.5
Рис. 6.5.6
ВЗАИМНОЕ РАСПОЛОЖЕНИЕ ПРЯМЫХ И ПЛОСКОСТЕЙ
265
S[ и s2, то острый угол ф между этими пря-
>ез скг
\s\Si\
мыми определяется через скалярное
произведение:
cos ф = |
Например, для 5,- = {/,; т{r9 щ;}, / = 1,2,
|/j/2 + т{т2 + п{п2\
С08ф =
^/j2 + /я2 + nf ^/| + m2 + /*2
Взаимное расположение прямых. Пусть
прямые Ц и Lq заданы каноническими
уравнениями:
Л
ч
X
л:
~*2
= у_-_У2,
_Z-Z\
_Z~Z2
h
m2 n2
Тогда точка Mj {xx\y{\Z\)£ Ц и
S/ ={/,-; /W/; /i/} — направляющий вектор
прямой Ц, / = 1,2.
Если прямые совпадают или
параллельны, то их направляющие векторы S[ и s2
коллинеарны, т.е.
L-OL.HL. (6.5..)
12 т2 п2
Если прямые совпадают, то
направляющим векторам коллинеарен и вектор М\М2 :
*2 " *1 _ Уг ~ У\ _ *2 " *i
/.
"*1
«1
(6.5.2)
а условием совпадения прямых является
выполнение равенств (6.5.1) и (6.5.2)
одновременно.
Если прямые пересекаются или
скрещиваются, то их направляющие векторы некол-
линеарны, т.е. условие (6.5.1) нарушается.
Пересекающиеся прямые лежат в одной
плоскости и, следовательно, векторы S[, s2 и
М\М2 являются компланарными, т.е.
А =
Х2 -Х{ у2- у{ Z2 ~ Z\
12 т2 п2
= 0. (6.5.3)
При А * 0 прямые скрещиваются.
Расположение прямой и плоскости. Если
плоскость я задана общим уравнением Ах +
+Bx + Cz + D = 0 , а прямая L -
каноническими уравнениями
x-Xq _У-У0 Z-Zq
I
т
п
то все случаи взаимного расположения
прямой и плоскости разделяются путем проверки
соответствующих условий:
L принадлежит к <=>
L параллельна я <=>
Ах0 + Ву0 +Czq +Z) = 0,
Al + Bm + Cn = 0;
Л*о + ДУо +Czq + D * 0,
[Al + Bm + Cn = 0;
L пересекается с я <=» А1 + Вт + Сп * 0.
Угол между прямой и плоскостью. Угол
ф между прямой
x-Xq у-у0 Z-Zq
I m n
и плоскостью
n:Ax + By + Cz + D = 0
находится в пределах от 0 (в случае
параллельности) до 90° (в случае
перпендикулярности прямой и плоскости). Синус этого угла
равен |cos\|/|, где \|/ - угол между
направляющим вектором прямой s и нормальным
вектором п плоскости (рис. 6.5.7).
Следовательно,
266
Глава 6.5. ПРЯМАЯ И ПЛОСКОСТЬ В ПРОСТРАНСТВЕ
Рис. 6.5.7
sin ф = |cos \|/| =
\Л1 + Вт + Сп\
4л2 + В2 +С2 yjl2 + т2 +п2
Перпендикулярность прямой и плоскости
эквивалентна тому, что нормальный вектор
плоскости и направляющий вектор прямой
коллинеарны, т.е. А/1 = В/т = С/п .
6.5.5. Расстояние от точки до
плоскости и до прямой. Расстояние от точки до
плоскости. Если плоскость я задана в
прямоугольной системе координат своим общим
уравнением Ax + By + Cz + D = 0 и известны
координаты (xq ; у$ ; Zq ) точки Mq , то для
расстояния от точки Mq до плоскости я
справедлива формула
tki \ \AxQ+By0+Czo+D\
р(М0 , я) = J =====—i . (6.5.4)
JA2 +В2 +С2
Расстояние от точки до прямой.
Расстояние от точки My (*j ,yi ,Z\) до прямой L,
заданной каноническими уравнениями
х-х0 ^у-у0 ^Z~Zq
I m n
Рис. 6.5.8
может быть вычислено при помощи
векторного произведения. Действительно,
канонические уравнения прямой дают нам точку
Mq (xq ; yQ ; Zq ) на прямой и направляющий
вектор 5 = {/;/я;я} этой прямой. Построим
параллелограмм на векторах 5 и MqM\ .
Тогда расстояние от точки М\ до прямой L
будет равно высоте h параллелограмма (рис.
6.5.8). Значит, нужное расстояние может быть
вычислено по формуле p(Afj,Z,) =
= \ MqMi X5 /|$|, где числитель
представляет собой площадь этого параллелограмма.
Расстояние между прямыми. Если прямые
пересекаются, то расстояние между ними
равно нулю. Случай совпадающих прямых
также малосодержателен. Поэтому о
расстоянии между прямыми имеет смысл говорить,
только если они параллельны или
скрещиваются. Чтобы найти расстояние между
параллельными прямыми, достаточно вычислить
расстояние от произвольной точки второй
прямой до первой прямой. Расстояние
р(£|,1з) между скрещивающимися
прямыми равно высоте И параллелепипеда,
построенного на направляющих векторах S\, 52
прямых и векторе М\М2 , соединяющем
точки на этих прямых (рис. 6.5.9). Эту
высоту параллелепипеда можно вычислить
как отношение объема параллелепипеда к
площади его основания, построенного на
направляющих векторах S\, s2, поэтому
Р(А > h) = |*i*2^i^|/|*i х s2\ •
Смешанное и векторное произведения в
этой формуле можно выразить через
координаты векторов 5), 52 , и точек М\, М2 •
Рис. 6.5.9
эллипс
267
Расстояние между прямой и плоскостью.
Если прямая и плоскость пересекаются, то
расстояние между ними равно нулю. Если же
они параллельны, то расстояние от прямой до
плоскости есть расстояние от любой точки
прямой до плоскости.
6.5.6. Пучки и связки. Пучок
плоскостей. Пучком плоскостей в пространстве
называют семейство всех плоскостей,
содержащих фиксированную прямую. Пучок
однозначно определяется любой парой своих
различных плоскостей, Любые две
непараллельные плоскости однозначно определяют
некоторый пучок плоскостей. Для того чтобы
плоскость принадлежала пучку плоскостей,
определяемому парой непараллельных плоскостей
A[x + Bly + Clz + A =0, A1x + B1y-¥C2z +
+Z>2 = 0 » необходимо и достаточно, чтобы ее
общее уравнение можно было записать в виде
ос( Ах х + Вху + С, z) + ${А2х + В2У + &2) = 0 >
т.е. в виде «линейной комбинации»
уравнений этих плоскостей.
Пучок прямых на плоскости. Пучком
прямых на плоскости называют семейство всех
прямых, проходящих через фиксированную
точку плоскости. Пучок однозначно
определяется любой парой своих прямых. Для того
чтобы прямая входила в пучок прямых,
определяемый парой непараллельных прямых,
необходимо и достаточно, чтобы ее общее
уравнение можно было записать в виде
«линейной комбинации» общих уравнений
этих прямых.
Связка плоскостей. Связкой плоскостей
называют семейство всех плоскостей в
пространстве с одной общей точкой. Связка
плоскостей однозначно определяется любой
тройкой своих плоскостей, не принадлежащих
у*
А\ F2 О
одному пучку плоскостей. Три различные
плоскости могут не иметь общих точек, иметь
их бесконечно много или иметь
единственную общую точку. В первых двух случаях
нормальные векторы плоскостей
компланарны. Если же нормальные векторы трех
плоскостей некомпланарны, то о таких плоскостях
говорят, что они находятся в общем
положении. Три плоскости, находящиеся в общем
положении, пересекаются в единственной
точке и однозначно определяют связку
плоскостей. Для того чтобы плоскость входила в
связку плоскостей, определяемую тройкой
плоскостей общего положения, необходимо и
достаточно, чтобы ее общее уравнение можно
было записать в виде «линейной комбинации»
уравнений этих плоскостей.
Глава 6.6
КРИВЫЕ ВТОРОГО ПОРЯДКА
Опишем основные типы кривых второго
порядка и их свойства.
6.6.1. Эллипс. Множество точек
плоскости, для которых сумма расстояний до двух
фиксированных точек F\ и F2 есть заданная
постоянная величина, называют эллипсом.
Определение эллипса дает следующий способ
его геометрического построения. Фиксируем
на плоскости две точки F\ и F2 , а
неотрицательную постоянную величину обозначим
через 2а. Пусть расстояние между точками F\
и F2 равно 2с. Представим себе, что
нерастяжимая нить длиной 2а закреплена в точках
F\ и F2 , например, при помощи двух
иголок. Ясно, что это возможно лишь при а > с.
Натянув нить карандашом, начертим линию,
которая и будет эллипсом (рис. 6.6.1).
Па
N Ft JB х
Рис. 6.6.1
268
Глава 6.6. КРИВЫЕ ВТОРОГО ПОРЯДКА
При а - с эллипс представляет собой
отрезок с концами /J и F2 , а при с - О , т.е.
если указанные в определении эллипса
фиксированные точки совпадают, он является
окружностью радиуса а. Фиксированные
точки F[ и 7*2 в определении эллипса (см. рис.
6.6.1) называют фокусами эллипса, расстояние
между ними, обозначенное через 2с, -
фокальным расстоянием, а отрезки F\M и
7*2 М , соединяющие произвольную точку М
на эллипсе с его фокусами, - фокальными
радиусами. Вид эллипса, полностью
определяется фокальным расстоянием I/J /^ I = 2с и
параметром а, а его положение на
плоскости - парой точек F\ и F2 . Из определения
эллипса следует, что он симметричен
относительно прямой, проходящей через фокусы /J
и F2 » a также относительно прямой, которая
делит отрезок F\F2 пополам и
перпендикулярна к нему. Эти прямые называют осями
эллипса. Точка О их пересечения является
центром симметрии эллипса, и ее называют
центром эллипса, а точки пересечения эллипса
с осями симметрии (точки А, В, С и D на
рис. 6.6.1) — вершинами эллипса. Число а
называют большой полуосью эллипса, а
b = yja -с — его малой полуосью. При
с > 0 большая полуось а равна расстоянию
от центра эллипса до тех его вершин, которые
находятся на, одной оси с фокусами эллипса
(вершины А и В ), а малая полуось b равна
расстоянию от центра эллипса до двух других
его вершин (вершины С и D).
Выберем прямоугольную систему
координат Оху на плоскости так, чтобы ее начало
совпало с центром эллипса, а фокусы
находились на оси абсцисс (см. рис. 6.6.1) Такую
систему координат называют канонической для
рассматриваемого эллипса, а соответствующие
переменные — каноническими.
В выбранной системе координат
уравнение эллипса имеет вид
2 2
±Т+У- = 1,а>Ь = у1а2-с2 > 0.(6.6.])
а2 Ь2
Его называют каноническим уравнением
эллипса.
Есть еще один способ построения
эллипса. Окружность радиуса а с центром в
начале канонической системы координат
эллипса (6.6.1) описывается уравнением
2 2 2
х + у = а . Если ее сжать с
коэффициентом а/b > 1 вдоль оси ординат, то получится
кривая, которая описывается уравнением
х + (уа/b) = а , т.е. эллипс. Если ту же
окружность сжать с коэффициентом а/b < 1
вдоль оси ординат, т.е. фактически растянуть
в этом направлении, то получится кривая,
которая описывается уравнением (6.6.1), в
котором а < b . Это тоже эллипс, но в
системе координат Оху его фокусы расположены
на. вертикальной оси симметрии.
Отношение фокального расстояния
эллипса к его большой оси называют
эксцентриситетом эллипса и обозначают через е . Для
эллипса, заданного каноническим уравнением
(6.6.1), е = с/а . Если же в (6.6.1) параметры а
и b связаны неравенством а < b , то фокусы
расположены на вертикальной оси симметрии
эллипса, с-\Ь - а" , е = с/b. Для длин
фокальных радиусов точки М(х; у) эллипса
справедливы равенства \F\M\ - а - ех,
|/^М| = а + ех , и каждое из этих уравнений
является уравнением эллипса.
6.6.2. Гипербола. Множество точек
плоскости, для которых модуль разности
расстояний до двух фиксированных точек есть
величина постоянная, называют гиперболой.
Фиксированные точки в определении
гиперболы (обозначим их /J и F2) называют
фокусами гиперболы. Расстояние между ними
(обозначим его 2с) называют фокальным
расстоянием, а отрезки F\M и F2M,
соединяющие произвольную точку М на
гиперболе с ее фокусами, — фокальными радиусами.
Вид гиперболы полностью определяется
фокальным расстоянием m/^l = 2с и
значением постоянной величины 2а, равной
разности фокальных радиусов, а ее положение на
плоскости — положением фокусов F\ и F2 •
Из определения гиперболы следует, что
она симметрична относительно прямой, про-
ходящей через фокусы, а также относительно
прямой, которая делит отрезок /J F2 пополам
и перпендикулярна к нему (рис. 6.6.2).
Первую из этих осей симметрии называют
действительной осью гиперболы, а вторую - ее
мнимой осью. Постоянную величину а,
участвующую в определении гиперболы, называют
ГИПЕРБОЛА
269
действительной полуосью гиперболы. Середина
отрезка F^Fj, соединяющего фокусы
гиперболы, лежит на пересечении ее осей
симметрии и поэтому является центром симметрии
гиперболы, который называют просто
центром гиперболы. Для гиперболы
действительная ось 2а должна быть не больше, чем
фокальное расстояние 2с, так как для
треугольника /jM/<2 (см. рис. 6.6.2) справедливо
неравенство | l/^l-|F2Af| | £ |^/72|.
Равенство а = с выполнено только для тех точек М ,
которые лежат на действительной оси
симметрии гиперболы вне интервала FyFj.
Отбрасывая этот вырожденный случай, далее
будем предполагать, что а < с. Отметим
также, что случай а = О соответствует
геометрическому месту точек, равноудаленных от
фиксированных точек F\ и Fj . Это
геометрическое место представляет собой прямую,
перпендикулярную к отрезку F{F2 и
проходящую через его середину. Этот случай мы
также не будем рассматривать.
Выберем прямоугольную систему
координат Оху так, чтобы центр гиперболы
находился в начале координат, а фокусы
располагались на оси абсцисс.
Такую систему координат для
рассматриваемой гиперболы называют канонической, а
соответствующие переменные -
каноническими. В канонической системе координат
уравнение гиперболы имеет вид
2 2
4г-^=1, Ь2=с2-а2>0, (6.6.2)
и его называют каноническим уравнением
гиперболы. Величину Ь называют мнимой
полуосью гиперболы.
Гипербола состоит из двух
симметричных ветвей, расположенных по разные
стороны от ее мнимой оси симметрии. Эти ветви
не ограничены с обеих сторон, причем
прямые у = ± (plot) х являются одновременно
асимптотами и правой и левой ветвей
гиперболы. Оси симметрии гиперболы различаются
тем, что действительная пересекает
гиперболу, а мнимая, будучи геометрическим местом
точек, равноудаленных от фокусов, — не
пересекает (поэтому ее и называют мнимой).
Две точки пересечения действительной оси
симметрии с гиперболой называют вершинами
гиперболы (точки А(а\ 0) и В(~а; 0) на
рис. 6.6.2).
Построение гиперболы по ее
действительной (2а) и мнимой (2Ь) осям следует
начинать с прямоугольника с центром в начале
координат и сторонами 2а и 2Ь,
параллельными соответственно действительной и
мнимой осям симметрии гиперболы. Асимптоты
гиперболы являются продолжениями
диагоналей этого прямоугольника, а вершины
гиперболы - точками пересечения сторон
прямоугольника с действительной осью
симметрии. Этому прямоугольнику соответствуют две
гиперболы и эллипс. Первая гипербола
описывается каноническим уравнением (6.6.2), а
вторая - уравнением
а2 Ъ2
(6.6.3)
"Ч^
>;•
У
У,
.d'
4 ч
-5 ..''О
1
d
+ * .^г Ж
f —£_ , _^_
VFi х
v ч ^^^.
ч v ^^^.
Рис.
6.6.2
270
Глава 6.6. КРИВЫЕ ВТОРОГО ПОРЯДКА
Вторую гиперболу называют
сопряженной по отношению к первой, а уравнение
(6.6.3) — каноническим уравнением сопряженной
гиперболы. Действительная и мнимая оси
первой гиперболы являются соответственно
мнимой и действительной осями
сопряженной гиперболы, а асимптоты у них общие.
Если в уравнениях (6.6.2), (6.6.3) все минусы
заменить на плюсы, то получится
каноническое уравнение эллипса, вписанного в этот же
прямоугольник. Отметим, что прямоугольник
и его положение на плоскости однозначно
определяют форму и положение гипербол и
эллипса. Отношение Ь/а сторон
прямоугольника определяет степень сжатости этих
кривых, но вместо этого параметра обычно
используют эксцентриситет. Эксцентриситетом
гиперболы называют отношение ее фокального
расстояния к действительной полуоси и
обозначают через е . Для гиперболы,
описываемой уравнением (6.6.2), е = с/а , а для
гиперболы, описываемой уравнением (6.6.3),
г = с/Ь . Отметим, что если эксцентриситет
эллипса может принимать значения из
полуинтервала [0, 1) (значение 0 соответствует
предельному варианту эллипса —
окружности), то эксцентриситет гиперболы всегда
попадает в интервал (1, +оо).
Гипербола, приведенная к асимптотам.
Если у гиперболы совпадают действительная
и мнимая полуоси, т.е. а-Ь, то угол
между асимптотами равен 2arctg(Z>/tf) =
= 2arctgl = 7с/2 , т.е. является прямым. Такую
гиперболу называют равнобочной. Для нее
кроме канонической системы координат, в
которой оси координат совпадают с осями
симметрии гиперболы, рассматривают также и
другую, осями которой являются асимптоты.
В этой системе координат Оху уравнение
равнобочной гиперболы записывается в виде
ху = а /2 и его называют уравнением
гиперболы в асимптотах. Сопряженная гипербола
для этой равнобочной гиперболы имеет
уравнение ху = -а /2 .
6.6.3. Парабола. Множество точек,
равноудаленных от фиксированной точки и от
фиксированной прямой, называют параболой.
Фиксированную точку называют фокусом
параболы, а прямую — директрисой параболы.
При этом полагают, что эксцентриситет
параболы равен единице. Обозначим расстояние
от фокуса до директрисы через р. Его
называют фокальным параметром параболы.
Парабола симметрична относительно прямой,
Рис. 6.6.3
перпендикулярной к директрисе и
проходящей через фокус параболы. Эту прямую
называют осью симметрии параболы, или просто
осью параболы. Парабола пересекается со
своей осью симметрии в единственной точке —
вершине параболы. Она расположена в
середине отрезка, соединяющего фокус параболы с
точкой пересечения ее оси с ее директрисой
(рис. 6.6.3).
Выберем на плоскости начало координат
в вершине параболы, в качестве оси абсцисс —
ось параболы, положительное направление на
которой задается положением фокуса (см.
рис. 6.6.3). Эту систему координат называют
канонической для рассматриваемой параболы,
а соответствующие переменные —
каноническими. Тогда парабола будет описываться
уравнением
у2 = 2рх, (6.6.4)
которое называют каноническим уравнением
параболы.
Если параболу у - х, вид которой
считаем известным, сжать с коэффициентом
1/(2р) вдоль оси абсцисс, то получится
парабола общего вида, которая описывается
уравнением (6.6.4).
6.6.4. Оптические свойства. У
эллипса, гиперболы и параболы есть
геометрические свойства, которые имеют наглядный
физический смысл. Расположим в фокусе
этих кривых источник света и предположим,
что лучи света, выходящие из этого фокуса,
отражаются от кривой. Тогда после такого
отражения в случае эллипса все лучи
сконцентрируются во втором фокусе, и наоборот
(см. рис. 6.6.1), в случае гиперболы лучи
распространятся так, будто вышли из другого
ПОЛЯРНЫЕ УРАВНЕНИЯ
271
е>\ {гипербола)
е -1 (парабола)
е <1 {эллипс)
Рис. 6.6.4
фокуса (см. рис. 6.6.2), а в случае параболы
все световые лучи будут параллельны оси
параболы (см. рис. 6.6.3).
Исходя из данной интерпретации, это
свойство называют оптическим свойством
эл/iunca, гиперболы и параболы.
6.6.5. Полярные уравнения. Часто
используют уравнения эллипса, гиперболы и
параболы в полярной системе координат. На вид
этих уравнений влияет взаимное
расположение канонической системы координат кривой и
полярной системы координат. Мы фиксируем
полюс полярной системы координат в фокусе
кривой. При этом для эллипса выбираем
левый фокус, а для гиперболы — правый, если
рассматривать их расположение в
канонической системе координат. Полярную ось
выбираем так, чтобы ее направление совпадало с
положительным направлением оси абсцисс
канонической системы координат.
Все три вида кривых описываются
общим свойством: для любой их точки
отношение расстояний до фокуса и до директрисы
постоянно и равно эксцентриситету кривой.
Значение эксцентриситета определяет тип
кривой. Если зафиксировать фокальный
параметр так, что положение директрисы в
выбранной системе координат будет оставаться
неизменным, мы, варьируя эксцентриситет,
получим единый ряд эллипсов, параболы,
правых ветвей гипербол (рис. 6.6.4).
Конкретная кривая определяется своим
эксцентриситетом е при помощи уравнения р =
= /?е/(1 - coscp). Это уравнение называют
полярным уравнением эллипса, параболы и
правой ветви гиперболы. Полярное уравнение
левой ветви гиперболы имеет вид р =
= -рг/(\ +е coscp).
Глава 6.7
ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА
Описание основных типов поверхностей
второго порядка предварим понятиями
поверхности вращения и преобразования сжатия.
Поверхность ft называют поверхностью
вращения, если она образована окружностями
с центрами на некоторой прямой L (оси
вращения), которые расположены в
плоскостях, перпендикулярных к L (рис. 6.7.1).
Уравнение поверхности вращения ft
имеет наиболее простой вид, когда начало О
прямоугольной системы координат лежит на
оси вращения, а ось Oz совпадает с ней. Тогда
пересечение поверхности ft с координатной
плоскостью Oxz ~ это некоторое множество S
(см. рис. 6.7.1), вращение которого образует ft .
Если множество S в плоскости Oxz
описывается уравнением ф(х, z) = 0 , то уравнение
(p(±yjx +y , z) = 0 и есть уравнение
поверхности ft .
Под преобразованием сжатия к
координатной плоскости Oxz мы понимаем такое
преобразование, при котором точка М (х;
у\ Z) смещается в точку М'(х\ у/k; z),
к > О . Параметр к называют коэффициентом
сжатия. При к > 1 точки пространства,
расположенные на одной прямой,
перпендикулярной к плоскости Oxz , в результате такого
преобразования сближаются, т.е.
преобразование - действительно сжатие. При 0 < к < 1
преобразование фактически является
растяжением.
Рис. 6.7Л
272
Глава 6.7. ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА
Пусть в пространстве в прямоугольной
системе координат Oxyz некоторое
множество Q задано своим уравнением F{x, у,
Z) = 0 . При преобразовании сжатия к
координатной плоскости Oxz с коэффициентом
к это множество превратится в новое
множество Q' с уравнением F(x, ку, z) = 0 .
6.7.1. Эллипсоиды. Поверхность,
которая получается при вращении эллипса вокруг
одной из его осей симметрии, называют
эллипсоидом вращения. Уравнение эллипсоида
вращения запишем, расположив начало
прямоугольной системы координат в центре эллипса
и совместив ось аппликат Oz с осью
вращения, а координатную плоскость Oxz -
с плоскостью эллипса. Тогда уравнение
эллипсоида вращения с осью вращения
Oz будет иметь вид х2/а +у2/а +
+ z2/b2=l.
Применив к эллипсоиду вращения
преобразование сжатия к координатной
плоскости Oxz , получим эллипсоид общего вида с
каноническим уравнением (после
переобозначения параметров)
2 2 2
а2 Ь2 с2
Три параметра я, b и с, входящие в
него — это полуоси эллипсоида (рис. 6.7.2).
Если все три полуоси эллипсоида попарно
различны, то эллипсоид называют трехосным.
При совпадении каких-либо двух полуосей
эллипсоид является поверхностью вращения
(эллипсоидом вращения). Если равны все три
полуоси (а = b = с = г), то эллипсоид
превращается в сферу радиуса г .
6.7.2. Гиперболоиды. При вращении
гиперболы вокруг одной из ее осей симметрии
получается поверхность, называемая
гиперболоидом вращения. Выбор оси вращения влияет
на тип гиперболоида. Если осью вращения
является действительная ось симметрии
гиперболы, то поверхность вращения будет состоять
из двух частей (полостей). Это двуполостный
гиперболоид вращения. При вращении
гиперболы вокруг ее мнимой оси симметрии
поверхность будет состоять из одной полости. Такую
поверхность называют однополостным
гиперболоидом вращения.
Для записи уравнений гиперболоидов
вращения расположим прямоугольную систему
координат так, чтобы ось вращения,
являющаяся осью симметрии гиперболы, совпадала
с осью аппликат Oz , а сама гипербола
располагалась в координатной плоскости Oxz
с центром в начале системы координат.
Тогда уравнение двуполостного гипербо-
х2/а2
+
•2/a2-z2/b2=-\,
однополостного
х2/а2+у2/а2-
лоида вращения будет иметь вид
+ Г/я2 -Z
гиперболоида вращения
-Z /Ь =1 . Гиперболоиды вращения
преобразованием сжатия к координатной плоскости
Oxz превращаются в двухполостный и однопо-
лостный гиперболоиды общего вида (рис. 6.7.3
и 6.7.4) с каноническими уравнениями
соответственно
.,2
■ + ■
~ = -1
- + ^-^ = 1
Рис. 6.7.2
ПАРАБОЛОИДЫ
273
Рис. 6.7.4
Рис. 6.7.6
6.7.3. Параболоиды. При вращении
параболы вокруг ее оси получаем параболоид
вращения (рис. 6.7.5). Для записи его
уравнения выберем прямоугольную систему
координат с началом в вершине параболы, направив
ось Oz по оси вращения и совместив
координатную плоскость Oxz с плоскостью
параболы. Тогда уравнение параболоида вращения
запишется в виде 2pz-x + у .
Преобразование сжатия параболоида вращения к
координатной плоскости Oxz дает поверхность
более общего вида — эллиптический параболоид
с каноническим уравнением
■ = 2z.
а
При вращении прямой L,
пересекающейся с осью вращения, образуется прямой
круговой конус (рис. 6.7.6). Точка пересечения
вращающейся прямой с осью вращения
остается неподвижной, ее называют вершиной
конуса.
274
Глава 6.7. ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА
Уравнение
2 2
а2 Ъ2
(6.7.1)
отличается от канонического уравнения
эллиптического параболоида лишь знаком
одного слагаемого и тоже задает поверхность
второго порядка. Ее называют гиперболическим
параболоидом, а само уравнение (6.7.1) —
каноническим уравнением гиперболического
параболоида. Выбор названия поверхности (6.7.1)
объясняется характером сечений:
горизонтальные сечения гиперболического
параболоида плоскостями z = с при с * О являются
гиперболами (при с = О - парой
пересекающихся прямых), а два других семейства
рассмотренных сечений, параллельных
координатным плоскостям Oxz и Oyz , - параболы.
6.7.4. Конусы. Рассмотрим
прямоугольную систему координат, ось Oz которой
совладает с осью вращения, а начало системы
координат — с вершиной конуса. Ось Ох
расположим так, чтобы прямая L находилась в
координатной плоскости Oxz . В этой системе
координат каноническое уравнение прямого
2+у2/а2 =
*ы
кругового конуса имеет вид х
= Z IС . Преобразование сжатия прямого
кругового конуса к координатной плоскости
Oxz дает эллиптический конус с
каноническим уравнением
6.7.5. Цилиндрические поверхности.
При вращении прямой вокруг оси вращения,
параллельной этой прямой, образуется
поверхность, которую называют круговым
цилиндром. Эта поверхность является частным
случаем цилиндрической поверхности,
получающейся при движении прямой в
пространстве, которая остается параллельной своему
исходному положению. Если на движущейся
прямой фиксировать точку, то она опишет
кривую, которую называют направляющей
цилиндрической поверхности. Можно также
сказать, что цилиндрическая поверхность
представляет собой множество точек на
прямых, параллельных фиксированной прямой.
Эти параллельные прямые называют
образующими цилиндрической поверхности. Выберем
прямоугольную систему координат так, чтобы
образующие цилиндрической поверхности
были параллельны оси Oz . В качестве
направляющей выберем кривую, являющуюся
пересечением цилиндрической поверхности с
координатной плоскостью хОу (рис. 6.7.7).
Направляющая в плоскости хОу
описывается некоторым уравнением двух
переменных у(х,у) = 0. В выбранной системе
координат цилиндрическая поверхность
описывается этим же уравнением, которое
трактуется как уравнение трех переменных х, у
и z ■ Верно и обратное утверждение: если в
некоторой прямоугольной системе координат
в пространстве поверхность описывается
уравнением, не содержащим одного из
переменных, то эта поверхность является
цилиндрической.
Цилиндр второго порядка — это
цилиндрическая поверхность, направляющая которой
в плоскости, перпендикулярной к
образующим, представляет собой кривую второго
порядка. В выбранной выше прямоугольной
системе координат цилиндр второго порядка
описывается уравнением второй степени
Ах2 + 2Вху + Су2 + 2Dx + 2Еу + F = О , где
А2 + В2 + С2 * 0 .
Рис. 6.7.7
МЕТОД СЕЧЕНИЙ
275
Это уравнение можно упростить
подходящим выбором системы координат.
Канонические уравнения кривых второго порядка
приводят к трем видам цилиндров второго порядка:
эллиптическому (рис. 6.7.8, а) с канони-
х2 у2
ческим уравнением —- + —
я2 £2
гиперболическому (рис. 6.7.8, б) с кано-
2 2
X У
ническим уравнением —— - ■=-— = 1;
а2 Ь2
параболическому с каноническим
уравнением у2 = 2рх (рис. 6.7.8, в).
6.7.6. Метод сечений. Для выяснения
формы поверхности в пространстве по ее
уравнению Ч*(х, у, z) = 0 используют
метод сечений. Он состоит в анализе
пересечений поверхности с плоскостями,
параллельными координатным плоскостям,
например с плоскостями вида z = с, где параметр с
пробегает все действительные значения. Для
каждого значения с система уравнений
*(x,y,z) = 0, Z = c, (6.7.2)
задает соответствующее пересечение.
Критерием принадлежности точки М(х\ у\ z)
этому пересечению являются следующие
условия: a) z = с; б) координаты х и у ее
проекции на координатную плоскость хОу, т.е.
координаты точки N(x\ y\ 0),
удовлетворяют уравнению
Т(х, у, с) = 0. (6.7.3)
Зная эти пересечения, т.е. кривые (6.7.3),
можно представить форму поверхности.
Отметим, что указанный «рентген» поверхности
можно проводить другими плоскостями, но
они должны быть параллельными между собой.
При исследовании формы поверхности
методом сечений используют две точки зрения
на уравнение (6.7.3). Первая состоит в том, что
его интерпретируют как уравнение проекции
о
о
Рис. 6.7.8
276
Глава 6.7. ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА
на координатную плоскость хОу сечения
(6.7.2). Согласно второй точке зрения
предполагают, что в секущей плоскости имеется
прямоугольная система координат с началом в точке
О пересечения секущей плоскости с осью Oz
и осями Ох и Оу, которые проектируются
на соответствующие оси Ох и Оу системы
координат Oxyz. Это позволяет говорить о
(6.7.3) как об уравнении сечения (6.7.2) в
секущей плоскости.
6.7.7. Конические и линейчатые
поверхности. Поверхность, которая образуется
при движении прямой, проходящей через
некоторую фиксированную точку А ,
называют конической. Точка А — это вершина
конической поверхности, а всевозможные прямые
на поверхности, представляющие собой
положения движущейся прямой, — это
образующие конической поверхности (рис. 6.7.9).
Примеры конических поверхностей дают прямой
круговой и эллиптический конусы.
Траекторию у некоторой
фиксированной точки В на движущейся прямой (но не
вершины) можно рассматривать как
направляющую конической поверхности. При этом
коническую поверхность можно определить
как множество всевозможных прямых,
проходящих через фиксированную точку А
(вершину) и пересекающих заданную кривую
у (направляющую).
Если начало прямоугольной системы
координат Oxyz совпадает с вершиной
конической поверхности, то уравнение F(x, у,
Z) = 0 этой поверхности будет иметь
следующее свойство. Если F{xq, Уо, ^о ) = 0 ,
то и F(7<Xq , \уц , \zq ) = 0 для любого
действительного числа X. Уравнения с
описанным свойством называют однородными.
Коническая поверхность относится к
более широкому классу линейчатых
поверхностей, образуемых движущейся прямой (рис.
6.7.10). Если движущаяся прямая все время
проходит через фиксированную точку (что,
вообще говоря, необязательно), то линейчатая
поверхность будет конической. Если прямая
движется поступательно, оставаясь
параллельной своему исходному положению, мы
получаем другой вид линейчатой поверхности —
цилиндрическую поверхность.
Линейчатыми, но не коническими,
поверхностями являются однополостный
гиперболоид и гиперболический параболоид. Так,
однополостный гиперболоид х /а +у /Ь -
-Z /с =1 представляет собой множество
прямых, описываемых общими уравнениями:
■И)
-ч'-1ИИ-М
где X и т - параметры. Эти прямые
называют прямолинейными образующими однополо-
стного гиперболоида. Однополостный
гиперболоид имеет также второе семейство
прямолинейных образующих (рис. 6.7.11):
^\=Х
N}
х Z ,
- + - |=х
а с
1-2-
В случае однополости ого гиперболоида
вращения, т.е. при а = b, каждое из двух
семейств прямолинейных образующих
получается вращением одной прямой семейства
вокруг оси вращения поверхности.
Следовательно, однополостный гиперболоид
вращения можно получить вращением прямой,
которая является скрещивающейся по
отношению к оси вращения.
Наглядным примером однополостного
гиперболоида с двумя семействами
прямолинейных образующих являются секции
Шаболовской телебашни. Автор оригинальной
идеи, заложенной в конструкцию телебашни,
он же ее конструктор — русский инженер
В.Г. Шухов (1853 - 1939).
В случае гиперболического параболоида
х /а - у Ib =2pz каждая из систем
а
••\р,
XlJ*f|-2«,
х у .
a b
a b ,
2z
Рис. 6.7.9
задает семейство его прямолинейных
образующих (рис. 6.7.12).
КОНИЧЕСКИЕ СЕЧЕНИЯ
277
Рис. 6.7.10
Рис. 6.7Л1
Рис. 6.7.12
Z*
Рис. 6.
6.7.8. Конические сечения. Важнейшей
особенностью прямого кругового конуса
х + у - z = 0 является то, что все кривые
второго порядка трех типов: эллипсы,
гиперболы, параболы — могут быть получены как
конические сечения, т.е. сечения конуса
различными плоскостями. В силу круговой
симметрии этой поверхности можно ограничиться
только сечениями при помощи плоскостей,
перпендикулярных к координатной плоскости
xOz . Таким плоскостям соответствуют
уравнения Ах + Bz + D = 0, А2 + В2 Ф 0 .
Если В = 0 , то секущая плоскость
описывается уравнением х = Xq , а сечение в
2 2 2
плоскости х = Xq - уравнением Z - У - *0
и при Xq Ф 0 представляет собой равнобочную
гиперболу (рис. 6.7.13, а), а при Xq = 0 — пару
прямых, которые являются образующими
конуса (рис. 6.7.13, б).
Если В Ф 0 , то плоскость можно
представить уравнением Z = kx + b . В силу
симметрии конуса относительно плоскости Оху
достаточно ограничиться случаем, когда
к < 0 . Коническое сечение для
рассматриваемой плоскости в пространстве описывается
системой двух уравнений
х2 + у2 - z2 = 0, z = kx + b. (6.7.4)
б)
.13
278
Глава 6.7. ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА
Чтобы получить уравнение кривой в секущей
плоскости, рассмотрим прямоугольную
систему координат O'vu , взяв в качестве
координатных осей О'и и O'v прямые,
являющиеся пересечениями секущей плоскости с
координатными плоскостями xOz и хОу
(рис. 6.7.14).
Координаты и и v произвольной точки
в секущей плоскости будут связаны с ее
координатами х, у и z в пространстве
соотношениями:
х = Xq + и cos ф = Xq -
Vl + к2 '
(6.7.5)
у = v , z = и sin ф = -
ки
■*2„2
26
1 + &J
bz 9
г w + — + v1 = О . (6.7.6)
Wl + A:2 *
При к = -1, когда секущая плоскость
образует с плоскостью хОу тот же угол, что
и образующие конуса, конические сечения
будут представлять собой параболы (рис.
6.7.15, а) и описываться уравнением
v = Ьу/2 I и - Ь/\12I. Варьируя параметр b в
уравнении секущей плоскости, в качестве
конического сечения можно получить любую
параболу.
При к Ф -1 {к < 0) уравнение (6.7.6)
примет вид
\-к*
l + kz
и +
ьу[Г7>
к(\-к2)
+ v2=-
\-к1
.(6.7.7)
где ф — угол между коническим сечением,
перпендикулярным к координатной
плоскости xOz , и координатной плоскостью хОу
(см. рис. 6.7.14), причем k = tg(p, a
Xq = -b/k . Подставляя (6.7.5) в первое
уравнение системы (6.7.4), получаем уравнение
конического сечения в системе координат
Рис. 6.7.14
•о
о
о
Рис. 6.7.15
ИЗМЕНЕНИЕ СИСТЕМЫ КООРДИНАТ
279
Здесь возможны два варианта. При
-1 < к < О, т.е. когда секущая плоскость
образует с плоскостью хОу меньший угол, чем
образующие конуса, выполнено неравенство
1 - к > 0, и поэтому уравнение (6.7.7)
конического сечения является уравнением
эллипса (рис. 6.7.15, б). И здесь, варьируя
параметры b и к в уравнении секущей
плоскости, мы можем получить в сечении любой
эллипс.
При к < -1, т.е. когда секущая
плоскость образует с плоскостью хОу больший
угол, чем образующие конуса, имеем
1 - к < 0, так что коническое сечение,
описываемое уравнением (6.7.7), является
гиперболой (рис. 6.7.15, в). Варьируя параметры b
и к, можно получить в коническом сечении
любую гиперболу.
Глава 6.8
ИССЛЕДОВАНИЕ УРАВНЕНИЯ
ВТОРОГО ПОРЯДКА
6.8.1. Поверхности второго порядка.
Рассмотрим линейное арифметическое
пространство Шп , являющееся евклидовым
пространством со стандартным скалярным
произведением (х, у) = ххух + х2У2 +..- + хпУп>
где х = (х{,...,хп), У = (У1,...,Уп). Векто-
ры из М или R можно рассматривать как
геометрические векторы в «точечном»
трехмерном пространстве или соответственно
двухмерном пространстве (плоскости).
Зафиксировав в трехмерном пространстве точку, мы
можем считать ее стандартным началом
каждого вектора, а тогда каждая точка
пространства определяется как конец некоторого
геометрического вектора.
Эту точку зрения можно обобщить на
линейное арифметическое пространство
произвольной размерности. Векторы в Шп будем
трактовать как точки. Некоторую
фиксированную точку О (другими словами, вектор) и
ортонормированный базис е в R" назовем
прямоугольной системой координат в R",
точку О — началом системы координат.
Координатами произвольной точки М (это тоже
вектор из Rn) в этом пространстве назовем
координаты вектора М — О относительно
базиса е .
Приведенное обобщение позволяет с
единых позиций анализировать геометрию
плоскости и трехмерного пространства. Оно
также позволяет дать геометрическую
интерпретацию некоторым объектам
арифметического пространства. Например, множество
всех решений однородной системы линейных
алгебраических уравнений с геометрической
точки зрения представляет собой линейное
подпространство арифметического
пространства соответствующей размерности.
Поверхностью второго порядка в Шп
называют множество точек х е Мл , координаты
х = {х\...хп) которых в данной
прямоугольной системе координат удовлетворяют
уравнению
п п
£ <%'"*? +2 X aUXiXJ+2^bkxk +C = 0,
/=1 \<i<j<n k=\
(6.8.1)
где ац ,Ь/с, с — действительные
коэффициенты, причем хотя бы один из коэффициентов
йу , 1 < / < j < п , отличен от нуля.
Поверхность второго порядка в Шп при п = 3
представляет собой обычную поверхность в
пространстве, а при п = 2 — кривую на
плоскости. Уравнение (6.8.1) удобно записывать в
матричной форме, полагая а-у = ау{ при
i > j и сводя все коэффициенты а-у в
симметрическую матрицу Л = (ay ) порядка п , а
т
слагаемые Ь^ — в столбец b = (b\ ...bn) :
xTAx + 2bTx + c = 0. (6.8.2)
В левой части уравнения (6.8.2)
слагаемые естественным образом распались на три
т
группы: квадратичную форму х Ах от
координат точки — квадратичную форму
поверхности (6.8.1) (кривой при п =2) второго поряд-
ка\ линейные слагаемые 2b x и слагаемое с .
6.8.2. Изменение системы координат.
Пусть даны старая прямоугольная система
координат, состоящая из ортонормированного
базиса b = (b\...bn) и ее начала в точке Ь$ ,
и новая система координат, состоящая из
ортонормированного базиса с = (с\ ...сп ) и
начала Cq . Рассмотрим произвольную точку
х с координатами х^ и хс соответственно в
старой и новой системах координат.
280
Глава 6.8. ИССЛЕДОВАНИЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА
Пусть U — матрица перехода из орто-
нормированного базиса Ь старой системы
координат в ортонормированный базис с
новой системы координат. Тогда U —
ортогональная матрица. Координаты вектора Cq - by
относительно базиса b представляют собой
координаты точки с0 (начала новой системы
координат) относительно старой системы
координат, которые мы обозначим через
С0,Ь '• с0 ~ А) = Ьс0,Ь ■
Тогда соотношение xb = Uxc + Cq ^
представляет собой формулу преобразования
координат при изменении прямоугольной
системы координат.
По аналогии с двухмерным и
трехмерным случаями преобразование координат
X/, = Uxc условно называют поворотом
системы координат при det U = I и поворотом
системы координат с отражением
(симметрией) при det£/ = -1, а
преобразование координат Xfj = хс + Cq^ — параллельным
переносом системы координат.
Любое преобразование координат вида
X{j = Uxc + Cq /j можно представить как
последовательное применение двух
преобразований х = Uxc и хь = х + Cq b , которые
означают поворот (возможно, с отражением)
исходной системы координат, определяемый
матрицей U , и последующий ее
параллельный перенос в точку с .
6.8.3. Упрощение уравнения
поверхности второго порядка. Наиболее
естественный способ упрощения уравнения (6.8.2)
базируется на предварительном преобразовании
квадратичной формы поверхности.
Существует новый ортонормированный базис, в котором
квадратичная форма имеет канонический вид.
Этот базис состоит из собственных векторов
матрицы Л квадратичной формы, записанных
в исходном ортонормированном базисе.
Матрица перехода от старого ортонормирован-
ного базиса к новому ортонормированному
базису является ортогональной. Изменяя,
если необходимо, направление одного
собственного вектора на противоположное, можно
считать, что определитель этой ортогональной
матрицы положителен и потому равен
единице. Значит, существует такой поворот
исходной системы координат, что квадратичная
форма поверхности (6.8.2) в новых
переменных будет иметь канонический вид.
Пусть У\,...,уп — новые координаты, в
которых квадратичная форма поверхности
(6.8.2) имеет канонический вид. Начало
системы координат при этом не изменяется, а
уравнение поверхности примет вид
п п
Х^,2+2£</,уу+с = 0, (6.8.3)
/=1 у=1
где (d{...dn)T = d = UTb, a Xifi = l9n,
представляют собой собственные значения
матрицы А квадратичной формы поверхности,
соответствующие векторам нового ортонор-
мированного базиса. Дальнейшее
определяется возможными значениями Х{ и df. Для
каждого значения индекса /, / = \,п ,
возможен один из четырех случаев:
1) \j *0, */,- *0; 2) \j *0, rf, =0;
3) \j =0,4*0; 4) X, = 0, £// = 0 . Если
реализуется случай 4), то соответствующая
переменная у, вообще не входит в уравнение
и мы имеем случай цилиндрической
поверхности в Шп (при п = 3 такая поверхность
действительно является цилиндрической). В
остальных случаях дальнейшее упрощение
уравнения (6.8.3) сводится к упрощению вида
линейных слагаемых. Если в уравнении (6.8.3)
для / -й переменной у{ реализуется случай
1), то по этой переменной можно выделить
полный квадрат: Х/уг + 2diyi =
= ^7 (У/ +^/А/) ~dj /^i • После
параллельного переноса системы координат у, - у, +
+ dj /Xj, уj = у:, j Ф /, этот случай сводится
к случаю 2).
Реализуем все такие параллельные
переносы и, если необходимо, изменим порядок
переменных (это равносильно перестановке
векторов в базисе). Тогда уравнение
поверхности (6.8.3) в новых переменных z примет
вид
]ГХ/Л2+2£ diZi +/2 = 0, (6.8.4)
i=l i=r+\
где параметр г определяет количество
переменных,- для которых реализовался случай
2) (возможно, после выделения полного
квадрата и соответствующего параллельного
переноса). В остальных случаях реализуется слу-
УПРОЩЕНИЕ УРАВНЕНИЯ ПОВЕРХНОСТИ ВТОРОГО ПОРЯДКА
281
чай 3) (после перестановки индексы от г +1
до s ) или случай 4) (индексы от s + 1 до п).
Если s = г , то случай 3) не встречается
и в уравнении (6.8.4) линейные слагаемые
будут отсутствовать. При s > г + 1 случай 3)
реализуется для нескольких переменных.
Тогда необходим дополнительный поворот,
который преобразует ситуацию к случаю
s = г + 1 . Этот поворот сводится к замене
переменных zr+\,---,Zs новыми
переменными z'r+i ,~-,z's , при которой
Zr+\ = X d'iZl' d* = ydj'
yl/2
i=r+\
/ = r + l,j, y =
I Ю2
а остальные переменные подбираются так,
чтобы соответствующая замена переменных
имела ортогональную матрицу U'. Эта
матрица при указанной замене переменных
имеет блочно-диагональную структуру:
U' = diag (E,V,E), в которой блоки Е
представляют собой единичные матрицы порядков
г и п - s , а блок V порядка s - г отвечает
переменным zr+\,---,Zs и должен быть
ортогональной матрицей. Элементами первого
столбца в этой матрице являются числа
d'r+\ ,...,d's . Такую матрицу можно построить,
взяв вектор (dr+i ,...,ds) из (s - г )-мерного
линейного арифметического пространства и
дополнив его в указанном пространстве до
ортонормированного базиса.
Итак, после выделения квадратов и
выполнения параллельного переноса мы можем,
если нужно, выполнить дополнительный
поворот так, что в конечном счете уравнение
поверхности (6.8.2) преобразуется к виду
^jZ? +d;+{Zr+{ +/2 = 0, (6.8.5)
в котором г > 0 (должно быть хотя бы одно
слагаемое второго порядка), а коэффициент
d"+[ может быть нулевым.
Если d"+i ф0 и И Ф 0, то еще одним
параллельным переносом, который
определяется заменой переменного zr+\ по формуле
Zr+\ = Zr+\ + V^r+1 можно «убрать»
слагаемое И . Учитывая, что умножение уравнения
на произвольное ненулевое число не меняет
поверхности, мы заключаем, что исходное
уравнение (6.8.2) путем замены системы
координат приводится к одному из следующих
видов:
г г г
ZW=0' Х^ = 1> Х^ =^+1-
1=1 /=1 1=1
(6.8.6)
В представлениях (6.8.6) параметр г
является рангом квадратичной формы
поверхности второго порядка, который не зависит от
выбора системы координат и при описанных
преобразованиях не меняется. В первом и
втором случаях ранг может иметь любые
значения от 1 до п , в последнем случае г < п ,
т.е. этот случай возможен для поверхности
второго порядка с вырожденной квадратичной
формой.
Уравнения (6.8.6), к одному из которых
приводится уравнение произвольной
поверхности второго порядка в Жп , назовем
уравнениями канонического вида, а переменные, в
которых они записаны, — каноническими.
Описанный выше процесс упрощения
уравнения поверхности второго порядка в R"
реализуется и для кривых второго порядка на
плоскости, и для поверхностей второго
порядка в пространстве.
Пример 6.8.1. Приведем к каноническому
виду уравнение кривой второго порядка
\4xf +24^*2 +21*2
+18х2 -139 = 0,
■4х{ +
(6.8.7)
выпишем все использованные преобразования
и построим эту кривую в исходной системе
координат.
Квадратичная форма кривой имеет вид
14 xj[+ 24x^2 + 21*2 > а матрицей этой
квадратичной формы является
'14 12'
А =
12 21
Чтобы найти ортогональное
преобразование, приводящее квадратичную форму кривой
к каноническому виду, выпишем
характеристическое уравнение матрицы АХ
+150 = 0 и найдем его
Х{ = 30, Х2 = 5 .
-35Х +
корни:
282
Глава 6.8. ИССЛЕДОВАНИЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА
Собственному значению Х\ = 30
соответствует единичный собственный вектор
1 т
6!=—(34) , а А,2 = 5 — единичный собст-
1 т
венный вектор е^ = — (-4 3) . Из
найденных координат собственных векторов
составляем матрицу ортогонального преобразования
5(4 3
которое является поворотом, так как
det U = 1. Этому ортогональному
преобразованию соответствует линейная замена
переменных
3 4 4 3 ,,ооч
*1 = д-Л -у». х2 = уЛ —$Уг- (6-8-8>
Подставим выражения (6.8.8) для
переменных Xj и х2 в (6.8.7) и получим
30>f + Ъу\ +12^ +14>>2 -139 = 0 . (6.8.9)
Следует отметить, что мы сразу можем
записать канонический вид квадратичной формы
кривой по известным собственным числам:
30 у^ + 5у2 . Линейные же слагаемые -4ху +
+18*2 = 2£ х новых переменных надо
пересчитывать, а свободный член в процессе
преобразования поворота не изменится.
По каждому из переменных выделяем
полный квадрат:
3oL+ij +5L+|j =150.
Теперь параллельный перенос системы
координат, определяемый соотношениями
1 7
(6.8.10)
приводит к уравнению, которое преобразуется
к каноническому уравнению эллипса:
М
+ т^- = 1.
5 30
Чтобы построить эллипс в исходной
системе координат Ох^, изобразим в этой
системе координат векторы е\, в2 , которые
являются собственными для матрицы
квадратичной формы поверхности. Эти векторы
откладываем от начала О системы координат,
они задают координатные оси новой системы
координат Оу\У2 . В этой системе координат
строим точку 0j (-1/5; - 7/5), которая
должна быть началом следующей
канонической системы координат Оу Z\ Z2 • Оси этой
системы координат параллельны осям Оу\ и
Оу2.
Определив положение канонической
системы координат 0\Z\Z2 относительно
исходной 0x^X2 , строим в ней эллипс (рис.
6.8.1).
уГ,
Z^K~
X2i
0/
Ч -1
1
••'■' 1 /
/Ол*
/yi
/ч
X
Рис. 6.8.1
КЛАССИФИКАЦИЯ ПОВЕРХНОСТЕЙ ВТОРОГО ПОРЯДКА
283
6.8.4. Классификация кривых второго
порядка. Кривая второго порядка на
плоскости в системе координат Оху описывается
уравнением
аих2 +2а[2ху + а22У2 + 2b[x + 2b2y + c = 0,
в котором хотя бы один из коэффициентов
при слагаемых второй степени отличен от
нуля. Это уравнение может быть
преобразовано к одному из канонических видов (6.8.6).
В нашем случае п = 2, так что при
г = 2 возможны лишь два варианта: аХ +
+рГ2 =1, аХ2 + рГ2 =0, где через X, Y
обозначены канонические переменные, а
параметры а, р одновременно не равны нулю. В
зависимости от знаков коэффициентов а и
рис учетом возможного переименования
канонических переменных приходим к
следующим вариантам:
1_
а2
X2
■ + -Ц-=1
эллипс,
у2 ,
2 Ь2
пустое множество
а
(мнимый эллипс),
X2 Y2
а
li
а2
эллипс),
= 1 - гипербола,
■ = 0 - точка (вырожденный
X2 Y2
— — = 0 — пара пересекающихся
а2 Ь2
прямых.
Если г = 1, то квадратичная форма
кривой второго порядка вырождена и имеет одно
слагаемое. В этом случае возможны три
варианта: аХ2 = 0, аХ2 = 1, аХ2 = Y, где а * 0.
В последнем варианте можно считать, что
а > 0, так как иначе достаточно поменять
направления векторов базиса и тем самым
изменить знак переменной Y в правой части.
Кривые с рангом квадратичной формы г = 1
дают еще четыре канонических уравнения:
X = 0 — двойная прямая,
X2 = а2, а Ф 0
пара параллельных
9 9
X - -а , а ф0 — пустое множество
(пара мнимых прямых),
X =2pY, р ф0 - парабола.
6.8.5. Классификация поверхностей
второго порядка в пространстве.
Классификация поверхностей второго порядка в
пространстве аналогична классификации кривых второго
порядка на плоскости. Но количество уравнений
канонического вида при этом возрастает.
Если ранг квадратичной формы
поверхности второго порядка равен трем (г = 3), то
возможны два варианта (см. (6.8.6)):
аХ2 +рГ2 + yZ2 = 1 ,аХ2 + рГ2 +yZ2 =0,
где коэффициенты а, р, у ненулевые. С
учетом возможных комбинаций знаков
коэффициентов и перестановки переменных
получаем следующую таблицу канонических видов:
а
X2
Yl Z1 .
Ь2 с2
= 1
а1 Ь1
гиперболоид,
эллипсоид,
однопол остныи
—г- л—— = -1 — пустое множе-
Ъ2 с2
ство (мнимый эллипсоид),
прямых,
X2 Y2
——- + —- - -^—- = -1 — двуполостный
а2 Ъ2 с2
гиперболоид,
X2 Y2 Z2 л
+ о - конус,
а2 Ь2 с2
-— + —г- + —г- = 0 — точка (вырож-
а2 Ь2 с2
денный эллипсоид).
Если ранг квадратичной формы
поверхности равен двум (г = 2), то из уравнений
канонического вида (6.8.6) получаем два
варианта: ctAr2+pr2=y, aZ2+pr2=Z,
где a, P Ф 0. В первом варианте одно из
переменных, Z , не входит в уравнение, и мы
получаем цилиндрическую поверхность с
образующей, параллельной оси OZ, и
направляющей в плоскости XOY, которая является
кривой второго порядка с квадратичной
формой ранга 2. Направляющая определяет тип
поверхности согласно классификации кривых
второго порядка:
284
Глава 6.9. ОСНОВНЫЕ ПОНЯТИЯ ПРОЕКТИВНОЙ ГЕОМЕТРИИ
*1
линдр,
X2 Y2 ,
а2 Ь2
(мнимый цилиндр),
X2 Y2
эллиптический ци-
пустое множество
— — = 1 - гиперболический
цилиндр,
X2 Y2
— пара пересекающихся
а1 Ь1
плоскостей,
X2 Y2
—т- + —г- = 0 - прямая (вырожденный
а2 Ъ2
эллиптический цилиндр).
Во втором варианте мы получаем
параболоиды. С учетом возможного изменения
знаков приходим к двум каноническим
уравнениям, различающимся знаками в
квадратичной форме поверхности:
а
болоид
У2 У2
2 Ъ2
X2 Y2 _
эллиптический пара-
гиперболический
параболоид.
Если ранг квадратичной формы
поверхности равен единице (г = 1), то уравнения
канонического вида (6.8.6) приводят к двум
случаям: аХ2 = у, аХ2 =Y, в которых
а Ф О . В этих двух случаях в уравнении также
отсутствует переменное Z . Значит, это
цилиндрические поверхности с образующей,
параллельной оси OZ, и направляющей,
которая расположена в плоскости XOY и
представляет собой кривую второго порядка с
квадратичной формой ранга 1. Всего
получается четыре варианта канонических
уравнений:
X = 0 — двойная плоскость,
X = а , а Ф О - пара параллельных
плоскостей,
X - -а , а фО — пустое множество
(мнимая пара плоскостей),
X =2pY, р фО - параболический
цилиндр.
Глава 6.9
ОСНОВНЫЕ ПОНЯТИЯ
ПРОЕКТИВНОЙ ГЕОМЕТРИИ
Проективная геометрия изучает
проективные свойства геометрических объектов, т.е.
такие свойства, которые сохраняются при
проективных преобразованиях. Проективное
преобразование возникает, например, при
центральном проектировании, играющем
ключевую роль в начертательной геометрии.
Пусть S — некоторая фиксированная
точка в пространстве, а к — фиксированная
плоскость, не содержащая S. Тогда
центральной проекцией произвольной точки М на
к называется точка пересечения прямой
SM с плоскостью к (рис. 6.9.1). Легко
увидеть, что при такой проекции произвольная
плоскость к , не параллельная п,
отображается на к не взаимно однозначно. Поэтому
объекты проективной геометрии - прямые,
плоскости и пространство — расширяют
добавлением к ним несобственных элементов: к
прямым добавляют бесконечно удаленную
точку, к плоскостям — бесконечно удаленную
прямую, а к пространству — бесконечно
удаленную плоскость, получая тем самым новые
объекты ~ проективную прямую,
проективную плоскость и проективное пространство.
Рис. 6.9.
6.9.1. Объекты проективной
геометрии. Проективная геометрия, как и
большинство других геометрических теорий, может
быть построена аксиоматически. Первичными
понятиями такой формальной теории
являются точка, проективная прямая и проективная
плоскость.
Объекты проективной геометрии могут
быть также построены в рамках евклидовой
геометрии.
Проективную прямую образует пучок
прямых на плоскости с центром в некоторой
точке S , т.е. множество всех прямых
плоскости, проходящих через S. «Точками»
проективной прямой являются прямые пучка. Если
/ — некоторая прямая, не проходящая через
S, то каждой прямой пучка отвечает ее точка
ПРОЕКТИВНЫЕ КООРДИНАТЫ
285
пересечения с / . Тем самым мы получаем
соответствие между прямыми пучка и
точками / . Для единственной прямой пучка,
параллельной / , точки соответствия на / нет.
Эта прямая играет роль несобственной точки
проективной прямой.
Проективная плоскость может быть
представлена как пучок прямых в
пространстве с центром в данной точке S , т.е.
множество всех прямых в пространстве, проходящих
через S. Роль «точек» в этой модели
проективной плоскости играют прямые пучка, а
роль «прямых» - совокупности прямых пучка,
лежащих в одной плоскости. Если к —
произвольная плоскость, не содержащая S, то
каждой точке к может быть поставлена в
соответствие прямая пучка, проходящая через
эту точку. Мы тем самым получаем вложение
евклидовой плоскости в проективную. Для
прямых, параллельных плоскости к, нет
точек соответствия на плоскости к. Эти
прямые образуют проективную прямую,
играющую роль несобственной прямой
проективной плоскости.
Проективное пространство может
строиться по аналогии с проективной прямой и
проективной плоскостью, но для реализации
модели требуется четырехмерное аффинное
пространство, аналогичное евклидовой
плоскости и евклидовому пространству, т.е.
арифметическое пространство R . Это
пространство образовано строками длиной 4 вида
х = (х\ , JC2 , *з > х4 ) > играющими роль
точек, а прямыми в этом пространстве
являются, например, множества строк вида
х = Xq + mt, где Xq и т - заданные
элементы R . Проективное пространство может
быть представлено как пучок прямых в R с
центром в данной точке S .
Уравнение вида tfjXj +#2*2 + fl3x3 +
+я4х4 = b , составленное относительно
компонент х,- строки х, описывает множество в
R , эквивалентное евклидовому
пространству. Рассмотрим такое пространство Р, не
содержащее S. Тогда каждой точке
пространства Р соответствует прямая пучка, проходящая
через эту точку. Прямым пучка,
параллельным пространству Р, т.е. таким прямым / :
х = S + mt, что tfjШ\ + а2т2 + Язтз +
+04^4 = 0> в пространстве Р нет
соответствия. Эти прямые лежат в одной евклидовой
плоскости, которая играет роль
несобственной плоскости проективного пространства.
Разделение объектов проективной
геометрии на собственные и несобственные
носит условный характер и определяется
способом построения этих объектов. Все точки,
прямые, плоскости в проективной геометрии
равноправны и не имеют какого-либо
преимущества друг перед другом. Разделение их
на собственные и несобственные возникает,
когда задано отображение проективной
прямой, плоскости или пространства на
евклидову прямую, плоскость или пространство.
6.9.2. Проективные координаты.
Рассмотренные модели проективных объектов
позволяют ввести следующие координаты для
описания точек и различных фигур
проективной геометрии.
Рассмотрим проективную прямую как
пучок прямых плоскости к. Введем на
плоскости к аффинные координаты, выбрав начало
координат в центре пучка S и задав
произвольный векторный базис в V2. Тогда каждая
прямая пучка однозначно определяется
направляющим вектором т , координаты
которого /И| и ^2 в заданном векторном базисе
называют проективными координатами на
проективной прямой.
Точно так же можно ввести проективные
координаты на проективной п/юскости,
рассматривая проективную плоскость как пучок
прямых в пространстве и выбирая в этом
пространстве аффинную систему координат с
началом в центре пучка S. Каждая точка
проективной плоскости будет определяться
координатами направляющего вектора
соответствующей прямой пучка.
Наконец, точка проективного
пространства задается направляющим вектором пря-
4
мой пучка в R , четверку координат
которого называют проективными координатами
тонки проективного пространства.
Проективные координаты однозначно
задают точку проективной прямой, плоскости
или пространства, но координаты точки
определяются неоднозначно, лишь с точностью до
числового множителя. Например, пары (1, 2)
и (3, 6) проективных координат прямой
определяют одну и ту же точку, так как эти строки
координат пропорциональны.
Если на проективной плоскости заданы
проективные координаты (Х|,Х2,Хз), то
любая проективная прямая описывается
линейным однородным уравнением а\Х[ +
+а2х2 +язхз =0-
286
Глава 6.9. ОСНОВНЫЕ ПОНЯТИЯ ПРОЕКТИВНОЙ ГЕОМЕТРИИ
Если в проективном пространстве
заданы проективные координаты, то любая
проективная плоскость будет описываться
линейным однородным уравнением а\Х\ +
+02*2 + дз*3 + 04*4 =0> а любая
проективная прямая - парой таких уравнений.
Проективная система координат
определяется выбором векторного базиса в
объемлющем аффинном пространстве (имеются в
виду модели проективных объектов,
построенные выше). Длины векторов базиса могут
быть одновременно увеличены в заданное
число раз, при этом значения координат не
изменятся.
Прямые, на которых расположены
векторы базиса трехмерного пространства
(предполагается, что их общее начало — это начало
координат), представляют собой три точки
проективной плоскости, не лежащие на одной
прямой. Обозначим их А\, А2, А$ .
Соотношения длин векторов и их направлений на
прямых могут быть заданы указанием точки Е
проективной плоскости с координатами (1, 1,
1). В качестве точки Сможет быть любая
точка проективной плоскости, не лежащая на
проективных прямых А\А2, А\А^, А2А-$.
Таким образом, выбор проективной системы
координат на проективной плоскости
однозначно определяется четырьмя точками этой
плоскости, никакие три из которых не лежат
на одной прямой. Эти четыре точки называют
базисными. Прямые А[А2, А[А^, А2А$ ,
задаваемые парами трех базисных точек,
называют координатными осями. Точку Е,
определяющую соотношение масштабов, называют
единичной.
Аналогично проективная система
координат в проективном пространстве задается
выбором пяти точек, называемых базисными,
никакие четыре из которых не лежат в одной
плоскости. Первые четыре из них А\, А2,
А$, Л\ определяют прямые в R , на
которых лежат векторы базиса, а последняя,
единичная точка Е, определяет соотношения
длин векторов базиса.
Проективная система координат на
проективной прямой задается указанием трех
различных точек.
6.9.3. Преобразование проективной
системы координат. Пусть на проективной
плоскости задана проективная система
координат, которую мы назовем старой. Зададим
новую проективную систему координат,
указав четыре точки А[, А2, А$, Е с
координатами А} (хп , xi2, */з ) > / = 1, 2, 3 , и
£(*01 > *02» *03 ) в стаР°й системе
координат. Составим из координат точек А;
квадратную матрицу X, расположив координаты
одной точки по общепринятому правилу в
одном столбце:
Х =
*11 *21 *31
*12 *22 *32
*13 *23 *33
Пусть U = (иу) - матрица, обратная к
X: U = X . Тогда формулы перехода от
старых координат (Х[, Х2 , *з ) произвольной
точки М к ее новым координатам
(У\> У2 » Уъ ) имеют вид:
У\ =А.
0Ц*1 + 0|2*2 +Д)3*3
fll 1*01 + 0|2*О2 + 013*03
, 021*1 +022*2 +^23*3
021*01 +022*02 +023*03
, 031*1+032*2+033*3
Уз =Л' »
031*01 +032*02 +033*03
где X — произвольный числовой множитель.
Отметим, что прямые А\А2, А\А^, А2А$
являются координатными осями новой
системы координат и потому задаются
уравнениями уз = 0, у2 = 0> У[ = 0 > или> учитывая
формулы перехода к новым координатам:
А{А2 :я31*| +032*2 +0зз*з =°>
АХАЪ : я21*1 +022*2 +023*3 =°i
А2А3 'а\\Х\ +^12*2 +013*3 = ®-
Формулы перехода в пространстве и на
прямой выглядят аналогично. Если точки
А[, А2, Аз , А$, Е определяют новую
систему координат (т.е. никакие четыре из них
не лежат в одной плоскости), а их
координаты в старой системе координат есть А^(хц ,
ПРОЕКТИВНЫЕ ПРЕОБРАЗОВАНИЯ
287
xi2 > xi3 » xi4 ) » / = 1,4, И ^(Xqi , *02 ,
x03 j -*04 ) > составляем матрицу Хиз столбцов
координат точек Д и берем обратную к ней
матрицу U = Х~ . Тогда формулы перехода
от старых координат (Х\, ^2 , *з » х4 )
произвольной точки Л/ проективного пространства к
ее новым координатам (^ ,д>2 >.Уз ->У4 ) имеют
вид:
д,,х, + я,2*2 + *13*3 + Я|4*4
у 2 =Х
у3=Х
У4 =Х
а\\х0\
<*2\Х\
fl21*01
а31х{
а3[х0[
441*,
+ а12^2
+ ^22*2
+ д22*02
+ «32 х2
+ fl32*02
+ Я42*2
+ а[зХоз
+ а{4х4 '
+ а23х3 + а24х4
+ a23XQ3
+ #24*04
+ д33х3 + д34х4
+ язз*оз
+ д43*3 "
+ д34*04
\- 0/\/\Х/\
«41*01 + fl42x02 + а43х03 + #44*04
Формулы перехода для проективной
прямой имеют аналогичный вид.
6.9.4. Проективные преобразования.
Проективным преобразованием, или
коллимацией плоскости (пространства), называют
такое взаимно-однозначное отображение этой
плоскости (пространства), при котором
каждая прямая преобразуется в прямую.
На проективной плоскости выберем
четыре точки Д, А2, А3, А\, никакие три из
которых не лежат на одной прямой. Тогда,
каковы бы ни были четыре точки
Д', А2, А3, А^, существует, и притом
единственное, проективное преобразование,
переводящее точку Д в точку Д', / = 1,4 . Это
означает, что проективное преобразование
однозначно определяется образами
произвольных четырех точек, никакие три из
которых не лежат на одной прямой. Аналогично
проективное преобразование пространства
определяется указанием произвольных пяти
точек, никакие четыре из которых не лежат в
одной плоскости, и их образов.
Понятие проективного преобразования
является двойственным к понятию замены
координат, которая возникает при переходе
от одной проективной системы координат к
другой. Именно, каждому проективному
преобразованию соответствует такой переход из
данной (старой) системы координат в другую
(новую), что образом любой точки М при
проективном преобразовании будет точка
М , имеющая в новой системе координат те
же координаты, что и М в старой. Наоборот,
для любой пары систем координат, старой и
новой, существует такое проективное
преобразование, что произвольная точка, заданная
своими координатами в старой системе,
переходит в точку с теми же координатами, но в
новой системе.
Примером проективного преобразования
на плоскости является гомология. Гомология —
это такое проективное преобразование,
которое имеет одну неподвижную точку S (центр
гомологии) и одну прямую / (ось гомологии),
переходящую в себя. Различают два варианта
гомологии. Если точка S принадлежит / , то
гомологию называют особенной, или
параболической. Если же точка £ не лежит на прямой
/ , то гомологию называют неособенной, или
гиперболической.
Если с проективной плоскостью
ассоциирована евклидова плоскость, то в частном
случае гомология может свестись к
аффинному преобразованию евклидовой плоскости.
Например, если ось / гиперболической
гомологии является несобственной, то эта
гомология сводится к гомотетии, а если центр
гиперболической гомологии является
несобственной точкой, то гомология сводится к
растяжению или сжатию к прямой. В случае,
когда у гомологии несобственными являются
и центр, и ось, то гомология является
параболической и сводится к параллельному переносу.
Особая роль гомологии состоит в том, что
любое проективное преобразование является
композицией некоторой гомологии и
некоторого движения (ортогонального преобразования).
Основным инвариантом проективного
преобразования является двойное отношение
четырех точек прямой. Двойным отношением
точек М\, М2 , М3 , М4 > лежащих на одной
прямой, называют число, обозначаемое
(М\ М2 М3 М4 ) и равное
(М]М2М3М4) =
МгМъ MXMt
м3 м2 м4 м2
При этом простое отношение, например,
Л/,Л/3
М3М2
считается положительным, если
векторы М\М3 и М3М2 имеют одно
направление, и отрицательным - в
противоположном случае.
288
СПИСОК ЛИТЕРАТУРЫ
Двойное отношение зависит от порядка
перечисления точек. Двойное отношение —
один из инвариантов центрального
проектирования. Например, если точки М\, М2,
Л/3, М$ получены на пересечении прямой
т с прямыми l[, 12, /3, /4, а точки
М{, М2, Мз, М\ — на пересечении той же
четверки прямых с прямой т , то
(М{М2М3М4) = {М[М2М'ЪМ\).
Четверку точек М\, М2 , М3, М^ на
прямой называют гармонической четверкой,
если (М\ М2 М-$ М$ ) = -1 • Гармоническая
четверка точек может быть получена без
использования понятия длины. Если точки
Рис. 6.9.2.
А, В, С, D не лежат на одной прямой (рис.
6.9.2), то полученные при помощи
пересечения прямых точки Mi, М2 , М-$, М$
образуют гармоническую четверку.
Проективные преобразования прямой
могут быть получены, если рассмотреть
прямую как часть проективной плоскости.
Проективные преобразования прямой
характеризуются тем, что переводят любую
гармоническую четверку снова в гармоническую четверку.
СПИСОК ЛИТЕРАТУРЫ
1. Беклемишев Д.В. Курс аналитической
геометрии и линейной алгебры. 4-е изд., пе-
рераб. М.: Наука, 1980. 336 с.
2. Бронштейн И.Н., Семендяев К.А.
Справочник по математике для инженеров и
учащихся втузов. 13-е изд., испр. М.: Наука,
1986. 544 с.
3. Ефимов Н.В. Краткий курс
аналитической геометрии, 12-е изд., стереотип. М.:
Наука, 1975. 272 с.
4. Ильин В.А., Позняк Э.Г.
Аналитическая геометрия. - М.: Наука, 1981. 232 с.
5. Математический энциклопедический
словарь / Гл. ред. Ю.В. Прохоров. М: Сов.
энциклопедия, 1988. 848 с.
Раздел 7
ЛИНЕЙНАЯ АЛГЕБРА
Глава 7.1
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
7.1.1. Определение линейного
пространства. Множество С элементов
jc,j>,z,... любой природы называют линейным
пространством, если выполнены три условия:
1) задано сложение элементов С, т.е.
закон, по которому любым элементам х,уе С
ставится в соответствие элемент z e С,
называемый суммой элементов х и у и
обозначаемый z = х + у ;
2) задано умножение элемента на число,
т.е. закон, по которому любому элементу
хе С и любому числу Xе R ставится в
соответствие элемент z е С , называемый
произведением элемента х на (действительное) число
и обозначаемый z = Хх ;
3) указанные законы (линейные операции)
подчиняются следующим аксиомам линейного
пространства:
сложение коммутативно: х + у = у + х ;
сложение ассоциативно: (х + у) + z =
= x + (y + z);
существует такой элемент 0 е С, что
jc + 0 = jc для любого jc e С ;
для каждого элемента jc множества С
существует такой элемент (-х)е С, что
jc-h(-jc) = 0;
произведение любого элемента: jc из £
на единицу равно этому элементу: 1 • х = х;
умножение на число ассоциативно:
X(\uc) = (X\i)x;
умножение на число и сложение
связаны законом дистрибутивности по числам:
(>* + ji)jc = Хх + \\х;
умножение на число и сложение
связаны законом дистрибутивности по элементам:
Х(х + у) = Хх + Ху.
Элементы линейного пространства
принято называть векторами, 0 - нулевым
вектором, a (-Jc) — вектором, противоположным
вектору jc . В понятии «линейное
пространство» важно не только рассматриваемое
множество С, но и заданные операции сложения
элементов и умножения на число. Одно и то
же множество С при одних операциях может
быть линейным пространством, а при других -
нет. Если говорят, что С — линейное
пространство, то, как правило, очевидно, что
понимается под операциями линейного
пространства.
Примеры линейных пространств:
множество ^з (^2 ) всех свободных
векторов в пространстве (на плоскости) с
линейными операциями над векторами;
множество Mmn(R) матриц типа
тх п, элементами которых являются
действительные числа, с линейными операциями
над матрицами;
множество всех решений данной
однородной системы линейных алгебраических
уравнений (СЛАУ);
множество функций, непрерывных
(интегрируемых, дифференцируемых, кусочно
непрерывных и т.п.) на отрезке, с обычными
операциями сложения функций и умножения
функции на число.
Особо отметим множество R'7
упорядоченных совокупностей х = (xi,...,xn) из п
произвольных действительных чисел, в
котором введены операции
!0 — 7706
290
Глава 7.1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА
х + у = (х{ + у{,...,х„ + уп),
Хх = (Хх{ ,...,Хх„), XeR.
Множество Шп с этими операциями
является линейным пространством, которое
называют линейным арифметическим
пространством.
Операция умножения вектора на число в
определении линейного пространства задана
только для действительных чисел. Но точно
так же можно ввести линейное пространство с
умножением элементов множества С на
произвольные комплексные числа. Два способа
определения линейного пространства
различают, используя термины «линейное
пространство над полем действительных чисел»
(действительное линейное пространство) и
«линейное пространство над полем
комплексных чисел» (комплексное линейное
пространство). Теории в этих двух случаях очень близки,
но различия все-таки есть. Важный пример
комплексного линейного пространства -
комплексное арифметическое пространство
Сп = {z : Z = (Z[, ••-, Zn )} , элементами
которого являются упорядоченные наборы из п
комплексных чисел. Операции в этом
пространстве задаются по тем же правилам, что и
в случае действительного арифметического
пространства.
Отметим несколько простейших свойств
линейных пространств:
в любом линейном пространстве
существует только один нулевой вектор;
для каждого вектора линейного
пространства существует только один
противоположный вектор;
если вектор (-х) противоположен
вектору х, то вектор х противоположен вектору
для любых двух векторов а и Ь
уравнение а + х = b относительно х имеет
решение, и притом единственное;
произведение произвольного вектора на
число 0 равно нулевому вектору: 0 • jc = 0 ;
произведение нулевого вектора на любое
число равно нулевому вектору: А,0 = 0 ;
вектор (—1) jc является
противоположным вектору х : (-1)* = (-х).
Решение уравнения а + jc = Ь легко
получить, добавив к обеим частям равенства
вектор (-л) . В результате получим
х = b + (-а). Этот вектор называют
разностью векторов b и а и обозначают b - а .
Таким образом, по определению b - а =
= b + (-а). Эквивалентность равенств
а + х= b и х = b - а вводит правило,
согласно которому при переносе слагаемого в
другую часть равенства оно меняет свой знак.
7.1.2. Линейная зависимость. Из
набора векторов JCj, JC2 ,...,JCjt линейного
пространства С можно составить выражение
вида щх{ +ct2*2 +... + а/сХ/с, где оц ,
Ct2,...,Ct£ ~ действительные числа. Такое
выражение называют линейной комбинацией
векторов Jtj ,jc2,...,Jty > а числа а^о^,...
...,0С£ — коэффициентами линейной
комбинации. Если все коэффициенты линейной
комбинации равны нулю, то ее называют
тривиальной, а в противном случае —
нетривиальной. В дальнейшем набор векторов Jtj,
x2i — ixk из ^ будем называть системой
векторов, предполагая, что векторы в наборе
не упорядочены. Любую часть системы
векторов будем называть подсистемой.
Систему векторов Jtj, jc2 ,..., xk
называют линейно зависимой, если существует
нетривиальная линейная комбинация этих
векторов, равная нулевому вектору. Если же
линейная комбинация этих векторов равна
нулевому вектору только лишь в случае, когда она
тривиальна, систему векторов называют
линейно независимой.
Слово «система» часто опускают, говоря:
векторы jq ,jc2 ,...,xk линейно зависимы или,
соответственно, линейно независимы.
Линейная зависимость векторов
xl>x2i — 9xk означает, что существуют такие
коэффициенты щ , СС2,..., сс^ е R,
одновременно не равные нулю, для которых
выполнено равенство ЩХ[ + «2^2 + ••• + akxk = 0 •
Если векторы jq , x2 ,...,** линейно
независимы, то из равенства линейной комбинации
этих векторов нулю (нулевому вектору)
вытекает, что все коэффициенты линейной
комбинации равны нулю. Для линейной
зависимости векторов JCj, jc2 ,...,*£ необходимо и
достаточно, чтобы один из них являлся
линейной комбинацией остальных.
Например, в линейном пространстве
С[0,2л] функций, непрерывных на отрезке
[0,2тс], функции 1, sin x, cos2x линейно
БАЗИС ЛИНЕЙНОГО ПРОСТРАНСТВА
291
зависимы, поскольку справедливо тождество
.2 1 - cos 2х
sin х = .
2
Отметим некоторые свойства систем
векторов, связанные с понятием линейной
зависимости (независимости):
если среди векторов jq ,jc2 ,...,**. есть
нулевой вектор, то эта система векторов
линейно зависима;
если система векторов содержит
линейно зависимую подсистему, то она линейно
зависима;
если система векторов линейно
независима, то и любая ее подсистема тоже линейно
независима;
если векторы в\ ,...,ет линейно
независимы и вектор у не является их линейной
комбинацией, то расширенная система
векторов £[,...,ет,у является линейно
независимой;
два вектора линейно зависимы тогда и
только тогда, когда один из них может быть
получен произведением другого на число.
7.1.3. Базис линейного пространства.
Базисом линейного пространства С называют
любую упорядоченную систему векторов, для
которой выполнены два условия:
1) эта система векторов линейно
независима;
2) каждый вектор в линейном
пространстве может быть представлен в виде линейной
комбинации векторов этой системы.
Представление произвольного вектора в
виде линейной комбинации векторов базиса
называют разложением вектора по базису.
Согласно определению базиса, разложение
вектора по базису единственно.
Поскольку базис — упорядоченная
система векторов, то и коэффициенты
разложения вектора можно упорядочить, расположив
их в том же порядке, что и векторы базиса.
Такой упорядоченный набор называют
координатами вектора в базисе.
Координаты вектора х в базисе обычно
записывают в виде матрицы-столбца
т
x = (xi ... хп) . В этом случае базис
b[,...,bn удобно записывать как матрицу-
строку b = (b\ ... bn), а разложение х =
= Х[Ь\ +... + хпЬп вектора х по базису
b[,...,bn — как произведение матрицы-
строки на матрицу-столбец: х = Ьх . Такая
запись позволяет легко доказать основные
свойства координат векторов.
При сложении произвольных векторов
х и у в линейном пространстве их столбцы
координат в одном и том же базисе
складываются (как матрицы-столбцы).
Действительно, JC + у = bx + by = b(x +у), откуда
заключаем, что столбец х + у есть столбец
координат вектора х + у . Аналогично можно
доказать, что при умножении вектора на число
его столбец координат умножается на это
число.
Из сформулированных утверждений
вытекает, что линейная независимость
(зависимость) векторов линейного пространства
эквивалентна линейной независимости
(зависимости) их столбцов координат, записанных
в одном и том же базисе.
В линейном арифметическом
пространстве Rn векторы
е{ =(1,0 0),
*2=(0,1,...,0),
е„=(0,0,...,1)
образуют базис, так как эти векторы линейно
независимы и любой вектор х = (Х[,...
...,хп)е R" может быть представлен в виде
х = Х\в\ +... + хпеп . Этот базис называют
стандартным базисом в Жп .
Отметим, что для произвольного вектора
х = (xi ,...,xn ) его столбец координат х в
т
стандартном базисе совпадает с х . Часто
удобно при фиксированном базисе
отождествлять вектор с его координатами. Для
стандартного базиса это равносильно записи
вектора не как матрицы-строки, а как матрицы-
столбца.
Пример 7.1.1. Покажем, что в R
система векторов
а, =(1,-1,2), а2= (2,1,0), а3 =(4,-1,1)
образует базис, и найдем в этом базисе
координаты вектора с = (2,1,3).
Из столбцов координат векторов
а1»а2 »а3 составим матрицу
(\
А =
2 4
-1 1 -1
2 0 1
Поскольку det A = -9 , то матрица А
невырожденная, ее ранг равен 3, а столбцы
линейно независимы. Значит, и векторы щ , а^ , Яз
ю*
292
Глава 7.1. ЛИНЕЙНЫЕ ПРОСТРАНСТВА
линейно независимы. Так как матрица А
невырождена, квадратная система линейных
алгебраических уравнений (СЛАУ) Ах = Ь ,
где х = (х{ х2 х3 )т , Ь = (l\ l>2 b$ )Т , при
любом столбце Ъ правых частей имеет
единственное решение х = (х[ х2 х3) . Записав
СЛАУ в векторной форме ауХ\ + а2х2 +
+#3*3 = b > заключаем, что имеет место
равенство х[щ + х2а2 + *3fl3 = ^ » те- любой
вектор А имеет представление в виде
линейной комбинации векторов щ , а2 , а3 .
Следовательно, эти векторы образуют базис. В
частности, решив СЛАУ Ах = с, где с —
столбец координат вектора с в стандартном
базисе, находим координаты вектора с в базисе
(а, а2 а3): xj =2, х2= 2, х3 = -1.
7.1.4. Размерность линейного
пространства. Максимальное количество линейно
независимых векторов в линейном
пространстве называют размерностью линейного
пространства. Если размерность линейного
пространства С равна п, т.е. существует линейно
независимая система из п векторов, а любая
система векторов, содержащая я + 1 вектор
или более, линейно зависима, то говорят, что
С n-мерно и пишут п = dim С .
Существуют бесконечномерные линейные
пространства, в которых можно выбрать
линейно независимую систему, содержащую
сколь угодно большое количество векторов. В
отличие от них, п -мерные линейные
пространства называют конечномерными.
Например, линейное пространство
С [0, 1] функций, непрерывных на отрезке
[О, 1], является бесконечномерным, так как
для любого натурального п система многочле-
нов 1, х,х ,...,х , являющихся элементами
этого линейного пространства, линейно
независима.
Размерность линейного пространства
тесно связана с количеством векторов,
которое может иметь базис линейного
пространства. В конечномерном линейном пространстве
любые два базиса содержат одно и то же
количество векторов, и это количество равно
размерности линейного пространства.
В линейном арифметическом
пространстве Шп стандартный базис состоит из п
векторов, поэтому dim Rn = n . Множество
решений однородной СЛАУ образует линейное
пространство, размерность которого равна
разности количества неизвестных и ранга
матрицы системы, а базисом является любая
фундаментальная система решений.
7.1.5. Преобразование координат
вектора при замене базиса. Пусть dim С = п и
заданы два базиса: старый Ь = (b\...bn) и
новый с = (q ...cn ). Каждый вектор из
базиса с можно представить в виде линейной
комбинации векторов базиса Ъ : q = a^bi +...
... + anib„ , i = 1, n . Запишем эти представле-
ния в матричной форме: с,- = Ь(а^ ...сст ) ,
/ = 1, п , или с = Ы1, где /-й столбец
матрицы перехода U от старого базиса b к новому
базису с есть столбец координат 1-го вектора
нового базиса в старом. Часто говорят, что
матрица перехода состоит из координат
векторов нового базиса в старом, записанных по
столбцам.
Матрица перехода обладает следующими
свойствами:
матрица перехода является невырожденной
и для нее существует обратная матрица;
для любой невырожденной матрицы U
порядка п и любого базиса b в С существует
такой базис с в С , что U~ есть матрица
перехода от базиса b к базису с;
если U — матрица перехода от базиса
b к базису с, то U~ — матрица перехода от
базиса с к базису b ;
если U — матрица перехода от базиса
b к базису с, а V — матрица перехода от
базиса с к базису d , то произведение этих
матриц UV является матрицей перехода от
базиса b к базису d .
Чтобы получить координаты х вектора
х в старом базисе b , необходимо столбец
координат х' этого вектора в новом базисе
с умножить слева на матрицу перехода из
старого базиса в новый: х = Ux\ что эквива-
' тт-\
лентно равенству х = и х .
Пример 7.1.2. Рассмотрим в V2 орто-
нормированный базис b = (ij) из векторов
I, j . Пусть новый базис е = (в\ е2)
получается поворотом старого базиса b на заданный
угол ф. Найдем координаты векторов
в\, е2 нового базиса относительно старого
(рис. 7.1.1): е{ = (cos ф sin ф)т., е2 =
= (-8Шф ссюф) • Эти разложения позволяют
ПРЕОБРАЗОВАНИЕ КООРДИНАТ ВЕКТОРА ПРИ ЗАМЕНЕ БАЗИСА
293
Рис. 7.1.1
Xj = Х{ COS (р + Х2 S111 ф,
х2 = ~xl sm Ф + х2 cos Ф>
Пример 7.1.3. Пусть в пространстве
заданы два ортонормированных базиса: старый
(I у к) и новый (/ Ук'). Тогда старый
базис можно преобразовать в новый при
помощи трех поворотов.
Рассмотрим единичный вектор s ,
который одновременно лежит в плоскостях пар
векторов /, j и /', У. Повернем базис
(I j к) вокруг оси вектора к на некоторый
угол \|/ так, что вектор / совпадет с
вектором s . Отметим, что вектор s ортогонален и
вектору к , и вектору к , так как является
линейной комбинацией и пары /, j , и пары
/', У. Значит, поворотом вокруг оси вектора
s на некоторый угол ft можно добиться
совмещения вектора к с вектором к .
Наконец, поворотом вокруг оси вектора к на
некоторый угол ф совместим вектор s с
вектором /' (рис. 7.1.2).
~ Матрицы перехода, соответствующие:
первому повороту вокруг оси вектора к на
угол \|/ (матрица U[); повороту нового
базиса вокруг оси вектора s на угол ft (матрица
U2); третьему повороту вокруг оси вектора
к' на угол ф (матрица Ui,) имеют вид:
составить матрицу перехода U из старого
базиса Ь в новый е и обратную матрицу:
^ = |С08ф -5111ф| и_{
sin ф cos ф
cos ф sin ф
-5Шф С05ф
а также записать соотношения между старыми
Ху, х2 и новыми х[, х2 координатами
произвольного вектора х из V2:
Х{ = JCj COS ф - Х2 S111 ф,
х2 = х[ sin ф + x2 cos ф.
Ux
U, =
U-г
^cos\j/ — sill \[/ 0^
sin\|/ cos\|/ 0
0
0
1
0 ^
0 cos ft —sin^
0 sin тЭ^ cos ft
^со8ф — sin q> 0^
sin ф cos ф 0
0
0
1
Перемножая три матрицы, получим
матрицу перехода U = U\U2U^ из базиса
(i j к) в базис (/' j' к'):
U =
^cos \|/ cos ф - sin \j/ cos ftsin ф
sin у cos ф + cos \|/ cos ftsin ф
shift sin ф
-со8\|/8тф-8т\|/со81^со8ф sin\(/sinft Л
- sin \|/ sin ф + cos \|/ cos ft cos ф - cos \|/ sin ft
sin ft cos ф cos ft
294
Глава 7.2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА
Глава 7.2
ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА
7.2.1. Определение и примеры. В
любом линейном пространстве С можно
выделить такое подмножество Н векторов,
которое относительно операций из С само
является линейным пространством. Его называют
линейным подпространством. Подмножество
Н в С является линейным
подпространством, если:
1) сумма любых векторов в Н
принадлежит Н , т.е. х, уеН=$х + уеН;
2) произведение любого вектора в ТС на
любое действительное число снова
принадлежит Н , т.е. хеН, ХеШ^ТисеН.
Имея в виду выполнение этих условий,
говорят, что подпространство — это любое
подмножество данного линейного
пространства, замкнутое относительно линейных
операций, так как выполнение линейных операций
не выводит за пределы этого множества.
В любом линейном пространстве С
всегда имеются два линейных
подпространства: само С и нулевое подпространство {0},
состоящее из единственного элемента 0. Их
называют несобственными.
В качестве примера рассмотрим
линейное пространство У^ свободных векторов. В
Кз линейное подпространство образуют:
а) все векторы, параллельные данной
плоскости; б) все векторы, параллельные данной
прямой.
Любое решение однородной системы
линейных алгебраических уравнений от п
неизвестных можно рассматривать как вектор
в линейном арифметическом пространстве R" .
Множество всех таких векторов является
линейным подпространством в Rn .
В линейном пространстве Мп (R)
квадратных матриц порядка п линейное
подпространство образуют: а) все симметрические
матрицы; б) все кососимметрические
матрицы; в) все верхние (нижние) треугольные
матрицы.
В линейном пространстве С [0, 1]
функций, непрерывных на отрезке [0, 1],
можно выделить следующие линейные
подпространства: а) множество функций,
непрерывных на отрезке [0, 1] и непрерывно
дифференцируемых в интервале (0, 1); б)
множество всех многочленов. Множество всех
монотонных функций, непрерывных на отрезке
[0, 1], — подмножество С [0, 1], но это
подмножество не является линейным
подпространством, так как сумма двух монотонных
функций может и не быть монотонной
функцией.
В линейном пространстве С
рассмотрим систему векторов е\, ^, ...,ек .
Множество Н= span \в\, в2 , ..., е^ } всех векторов в
С , которые могут быть представлены в виде
линейной комбинации этих векторов,
является линейным подпространством в С. Это
подпространство называют линейной оболочкой
системы векторов в\, е2, ...,в£ .
Любое линейное подпространство
можно представить как линейную оболочку
некоторой системы его векторов или как
множество решений некоторой однородной системы
линейных алгебраических уравнений.
7.2.2. Пересечение и сумма линейных
подпространств. Пусть Ti\, Hj ~ линейные
подпространства в линейном пространстве С .
Множество ?4 п 7^2 называют пересечением
линейных подпространств Н\ и Н2 (рис.
7.2.1). Оно является линейным
подпространством в С .
Множество Н\ +Н.2 всех векторов х
вида х = х{ + х2 , где х] е Н\, х2 е Н2 ,
называют суммой линейных подпространств 7^
и Н2 . Сумма линейных подпространств
является линейным подпространством. На рис.
7.2.2 линейные подпространства Н[ и ТС2
представлены несовпадающими прямыми,
проходящими через фиксированную точку О.
Их сумма представляется плоскостью,
содержащей обе прямые.
Рис. 7.2.1
РАНГ СИСТЕМЫ ВЕКТОРОВ
295
%1+?£2
Рис. 7.2.2
Множества решений двух однородных
систем линейных алгебраических уравнений
относительно одних и тех же п переменных
представляют собой линейные
подпространства 1\ и Hj линейного арифметического
пространства Rn . Объединив обе системы в
одну, получим новую однородную систему,
множеством решений которой будет линейное
подпространство Н\ r^ty-
Рассмотрим две системы векторов
£|,...,££ и f[,...,f/ в некотором линейном
пространстве С . Линейные оболочки этих
систем представляют собой линейные
подпространства 7i\ = span{i| ,...,££} и 'Щ -
- span \f\ ,...,//} в С. Если мы объединим
обе системы в одну, то у новой,
объединенной системы, линейной оболочкой будет
линейное подпространство 7^ + 7i2 •
Сумму 7i\ + 7i2 двух линейных
подпространств Н\ и Hj называют прямой суммой и
обозначают Ц 0 7i2» если Для каждого
вектора хеУ] + 7i2 его представление х = JCj +
+ х2, где х{ е Н\, х2 б 7^2 , единственно.
Прямая сумма как частный случай
суммы линейных подпространств является
линейным подпространством. Для того чтобы
сумма двух линейных подпространств Н\ и
Н.2 была прямой, необходимо и достаточно,
чтобы пересечение этих линейных
подпространств было нулевым подпространством, т.е.
ЦпП2={0}.
Поскольку линейное подпространство
является линейным пространством
относительно операций объемлющего линейного
пространства, то по отношению к нему
можно говорить о размерности и базисе. Любой
базис собственного линейного подпространства
может быть расширен до базиса объемлющего
линейного пространства добавлением новых
векторов. Если ТС — линейное подпространство
линейного пространства С, то dim H <
< dim С . Если к тому же Н ф С , то dim 7i <
< dim С . Размерности линейных
подпространств, их суммы и пересечения связаны
соотношением д\т(Н{ + Щ) = dim Щ + dimft2 -
-dim(Wi пЧ>)- в частности, <&т(П{ ®Щ) =
= dimft1 + dimft2.
Если линейные подпространства 1\ и
Hi в линейном пространстве С образуют
прямую сумму, причем 7"4 Ф 7i2 = £ > то
говорят, что Н\ является прямым дополнением для
7-^2, а ?^2 "~ прямым дополнением для 1\.
Любое линейное подпространство в
конечномерном линейном пространстве имеет прямое
дополнение. Но при этом прямое дополнение
определено неоднозначно.
7.2.3. Ранг системы векторов. Рангом
системы векторов в линейном пространстве
называют размерность линейной оболочки этой
системы векторов. Ранг системы векторов
a = (flj...a^) линейного пространства С
равен:
а) максимальному количеству линейно
независимых векторов в системе а ;
б) рангу матрицы, составленной по
столбцам из координат векторов в|,...,и^ в
каком-либо базисе линейного пространства С .
Чтобы определить ранг системы
векторов и найти базис в линейной оболочке этой
системы, достаточно сформировать матрицу
А , столбцы которой являются столбцами
координат векторов системы в каком-либо
базисе, и выделить в этой матрице базисный
минор. Базисные столбцы, соответствующие
выбранному базисному минору, определяют
подсистему рассматриваемой системы
векторов, являющуюся в линейной оболочке
системы базисом. В самом деле, согласно
теореме о базисном миноре, базисные столбцы
линейно независимы, а другие столбцы матрицы
А являются линейными комбинациями
базисных. Из этого следует, что любой вектор
линейной оболочки системы векторов может
быть представлен как линейная комбинация
векторов, столбцы координат которых входят
в базисный минор.
Рассмотрим пример. Пусть даны
векторы а|,а2,аз,Д4 в четырехмерном линейном
пространстве С, имеющие в некотором
базисе столбцы координат Щ = (1 2 0 6) ,
296
Глава 7.2. ЛИНЕЙНЫЕ ПОДПРОСТРАНСТВА
а2 =(2031)т,о3 =(3237)т,а4 =(7299)т.
Соответствующая матрица А имеет вид
(\ 2 3 7"|
2 0 2 2
0 3 3 9'
[б 1 7 9J
Ее ранг равен 2. Следовательно, ранг
системы векторов равен 2. Ее любой минор
второго порядка является базисным и поэтому
базисом линейной оболочки этой системы
векторов будут любые два вектора системы.
Пусть С — линейное пространство,
в котором выбраны векторы щ,...,ак,Ь.
Для вектора b возможны два случая: 1)
вектор b принадлежит линейной оболочке
span {flj ,...,flfc}; 2) вектор b не
принадлежит span {flj ,...,ak}.
В первом случае добавление к системе
векторов щ,...,ак вектора b не приводит
к расширению линейной оболочки системы
и, следовательно, dim span {flj,..., ak } =
= dim span{fl[,...,ak ,b}. Во втором случае,
наоборот, добавление вектора b к системе
векторов щ,...,ак приводит к расширению
линейной оболочки, причем dim span{щ ,...,
ак , A} = dimspan{fl1, ..., bk}+l , так как
spanjfl!,..., ак, b} = span {а,,..., ак } 0 span {b}.
Выясним теперь, что означают эти два
случая на «координатном уровне».
Выберем в С базис е = {е^...еп) и
запишем разложение векторов щ,...,ак, b no
базису е : aj = eaj , j = \,к, b - eb , где
aj =(aij...anjjT , j = l,k9 b = (b[...bn)T -
столбцы координат соответствующих
векторов. Пусть А — матрица типа пхк ,
составленная из координатных столбцов векторов
щ ,...,ak , a (A\b) - матрица, полученная из
матрицы А добавлением справа еще одного
столбца b .
В первом случае условие
b е span {fl|,..., ак } означает существование
разложения
х{ах +... + хкак =Ь (7.2.1)
с некоторыми действительными
коэффициентами Xi,...,xk. Записывая это векторное
равенство в координатной форме, получаем
систему линейных алгебраических уравнений
(СЛАУ)
\апх{ +... + а[кхк =^,
(7.2.2)
[anlx{ +... + ankxk =bn
относительно неизвестных х = (xj ...xk ) ,
которая в матричной форме имеет вид
Ах = b . Существование разложения (7.2.1)
означает, что полученная система имеет
решение. Во втором случае представление
(7.2.1) невозможно, т.е. система (7.2.2) не
имеет решений.
Итак, следующие четыре утверждения
эквивалентны между собой:
bespm{ai9...,ak};
dim span [ax,..., ак , b] = dim span {a{,
Rg(A\b) = RgA;
система Ах = b из п линейных
алгебраических уравнений относительно к
неизвестных совместна.
Эквивалентность последних двух
утверждений составляет содержание теоремы Кро-
некера — Капелли. Таким образом, эту теорему
можно переформулировать следующим
образом: для того чтобы линейная оболочка
системы векторов щ,...,ак совпадала с
линейной оболочкой расширенной системы
Щ ,-,ак )Ь необходимо и достаточно, чтобы
были равны размерности этих линейных
оболочек.
Из приведенных рассуждений вытекает,
что квадратная СЛАУ Ах = b тогда и только
тогда имеет решение при любой правой
части, когда матрица А системы невырождена.
Действительно, если А невырождена, то
система Ах = b имеет единственное решение
х = А Ь. Наоборот, если система Ах = b
имеет решение при любой правой части, то
векторное равенство (7.2.1) может быть
получено для любого вектора b . Это значит, что
линейная оболочка системы векторов
flj,...,fl£ совпадает с линейным
пространством, а ранг матрицы А совпадает с высотой
столбцов. В случае квадратной матрицы это
равносильно ее невырожденности.
НОРМИРОВАННЫЕ ПРОСТРАНСТВА
297
Глава 7.3
ЕВКЛИДОВЫ ПРОСТРАНСТВА
7.3.1. Определение евклидова
пространства. Линейное пространство £
называют евклидовым пространством, если в £
задано скалярное умножение, т.е. каждой паре
векторов х,уе£ поставлено в соответствие
действительное число (х,у), называемое
скалярным произведением, причем выполняются
следующие аксиомы скалярного умножения: а)
(х,у) = (у,х); б) (x + y,z) = (x,z) +
+ (у, z); в) (Хх, у) = Х(х, у), XeR;
г) (jc,jc) > 0, причем (дг,дг) = 0 лишь в
случае, когда х = 0 . Скалярное произведение
часто обозначают ху, а скалярное
произведение вектора х на себя, называемое
скалярным квадратом, обозначают х .
В линейном арифметическом
пространстве Rn скалярное умножение можно ввести
формулой (дг, у) = ХуУ\ + ... + х„уп . Это
скалярное умножение называют стандартным, а
Rn с этим скалярным умножением —
евклидовым арифметическим пространством.
В произвольном п-мерном линейном
пространстве С всегда можно ввести скалярное
умножение, причем различными способами.
Например, фиксировав в С некоторый базис
в[,...,еп и положив (х,У) = Х[У\ + .-•
... + хпуп, где х = х1е[ + ... + х,7е„ и у =
= ууву +... + упеп , получим скалярное
умножение в С .
Непосредственно из аксиом скалярного
умножения следует ряд его простейших
свойств:
(х,Ху) = Х(х,у);
(x,y + z) = (x,y) + (x,z)\
(*,0) = 0;
f m \ m
^а<кхк,у \=^ак(хк,у).
{к=[ J k=i
В этих соотношениях x,y,z -
произвольные векторы евклидова пространства, а
X , ак , к = \,т , — действительные числа.
Для любых векторов х,у евклидова
пространства £ справедливо неравенство Коши—
Буняковского
(х,у)2 <(х,х)(у,у).
В случае евклидова арифметического
пространства Rn неравенство Кош и-Буняковского
трансформируется в неравенство Коши
(a{b{ +... + anbn)2 <
<(а2+... + а?,)(Ь2+... + $),
а в евклидовом пространстве С [0, 1], в
котором скалярное умножение задано равенством
I
(/,#) = J f(x)g(x)dx - в неравенство Бу-
0
няковского (называемое также неравенством
Шварца):
I
1
jf(x)g(x)dx\ <\f2(x)dx\g2(x)dx.
о Jo о
7.3.2. Нормированные пространства.
Функцию, заданную на линейном
пространстве С, которая каждому вектору х е С
ставит в соответствие действительное число |дг|,
называют нормой, если она удовлетворяет
следующим аксиомам нормы:
|jtj > 0 , причем равенство |дг|| = 0
возможно только при х = 0 ;
|дг + у\\ < |jt|| + \\yj (неравенство
треугольника).
Линейное пространство, в котором
задана норма, называют нормированным
пространством.
Евклидовы и нормированные
пространства представляют собой примеры линейных
пространств с дополнительными структурами:
скалярным умножением и нормой
соответственно. Эти два понятия совершенно
различны, однако скалярное умножение в
евклидовом пространстве позволяет ввести норму
|jc| = >](х,х) и превратить евклидово
пространство в нормированное. Эту норму,
порожденную скалярным умножением,
называют евклидовой, или сферической, нормой. Когда
говорят, не уточняя, о норме в евклидовом
пространстве, обычно имеют в виду именно
эту норму.
Следующие нормы в Rn не связаны с
каким-либо скалярным произведением:
298
Глава 7.3. ЕВКЛИДОВЫ ПРОСТРАНСТВА
октаэдрическая или 1± -норма;
ЦдсЦ^ = max J]*! |,..., \xn \\ - кубическая,
или l^ -норма.
Две нормы I • ||fl и I • ||д в линейном
пространстве С называют
эквивалентными, если существуют такие
положительные действительные числа С\ и С2, что для
любого вектора хе С верно неравенство
Cl IMI - \\х\\ь - С2 IHL • В конечномерном
линейном пространстве две любые нормы
эквивалентны. Например, нормы ЦдсЦ^ ,
|*||» 1*1, эквивалентны, так как
»4.Ф1Ф1ИННЬ
Множество S тех векторов х
нормированного пространства, которые удовлетворяют
равенству ||дг| = 1 (единичных векторов),
называют единичной сферой. Множество S зависит
от линейного пространства, выбранной в нем
нормы и однозначно определяет норму.
7.3.3. Ортогональные системы
векторов. Углом ф между ненулевыми векторами
х и у в евклидовом пространстве £
называют значение ф на отрезке от 0 до я,
определяемое равенством
(х,у) (х,у)
ССЮф:
НИ >/(^)Vovjo
Если один из векторов нулевой, то угол
между векторами не определен. Однако часто
в этом случае углу приписывают то значение,
которое наиболее удобно в конкретной
ситуации.
Два вектора х и у в евклидовом
пространстве называют ортогональными и пишут
х _L у, если их скалярное произведение равно
нулю.
Евклидово пространство — это частный
случай линейного пространства, и поэтому
можно говорить о его линейных
подпространствах. Каждое из таких линейных
подпространств является евклидовым пространством
относительно скалярного умножения,
заданного в объемлющем евклидовом пространстве.
Говорят, что вектор х в евклидовом
пространстве £ ортогонален подпространству Н ,
и обозначают х _L H , если он ортогонален
каждому вектору этого подпространства. Если
Н = span [о[,..., а/с}, то условие х _L H
равносильно тому, что вектор х ортогонален
каждому вектору щ,...,ак .
В произвольном евклидовом
пространстве справедлива теорема Пифагора: если
*±,,TO|*+Jf =|ММИ2-
Систему векторов евклидова
пространства называют ортогональной, если любые два
вектора из этой системы ортогональны.
Любая ортогональная система, не содержащая
нулевых векторов, линейно независима.
Евклидовы пространства, как и любые
линейные, можно разделить на
бесконечномерные и конечномерные. Если базис евклидова
пространства представляет собой
ортогональную систему векторов, то этот базис называют
ортогональным. Поскольку произвольная
ортогональная система ненулевых векторов
линейно независима, то она является базисом в
том и только в том случае, когда количество
векторов в ней совпадает с размерностью
евклидова пространства. Ортогональный базис
называют ортонормированным, если каждый
вектор этого базиса имеет евклидову норму
(длину), равную единице. Любой
ортогональный базис легко преобразовать в ортонорми-
рованный, разделив каждый вектор базиса на
его длину.
Пусть в евклидовом пространстве £
задан некоторый базис е = (еу ... еп). Тогда
скалярное произведение любых векторов
х = хуе{ +... + *„<?„ и у = у{е{+... + упеп
из £ может быть выражено через скалярные
произведения векторов базиса:
(*, у) ■
п п
;=i
У=1
/=1 j=\
или (х,у) = хТГу, где Г = ((«?,,<?,)) -
симметрическая матрица порядка п, которую
называют матрицей Грома системы векторов
в[,...,еп. В ортонормированном базисе
матрица Г является единичной. Поэтому
(х, у) = хТЕу = хту = xYyY + х2у2 +... + хпуп.
Из этой формулы легко получить формулы
для длины вектора и косинуса угла между
векторами.
ОРТОГОНАЛЬНОЕ ДОПОЛНЕНИЕ
299
В ортонормированном базисе в[,...,еп
также упрощается вычисление координат
вектора: если х = Х\ву +... + хпеп , то (дс, ег) =
= *,-, / = 1,/1.
При помощи следующего алгоритма,
который называют процессом ортогонализации
Грома — Шмидта, в евклидовом пространстве
можно построить ортонормированный базис,
отталкиваясь от некоторого исходного базиса.
Пусть / = (f[ ... fn) - некоторый
базис в n-мерном евклидовом пространстве 8.
Новый базис g = (gj ...gn ) строится в
соответствии с соотношениями:
ft = /l>
f (Л,ft) „ (fk,8k-l)„
* A"hT*-—иг
xftt-i, к=Хп.
Новый базис g оказывается ортогональным,
а ортонормированный базис е из базиса g
легко получить нормировкой векторов:
7.3.4. Ортогональное дополнение.
Ортогональным дополнением линейного
подпространства Н в евклидовом пространстве 8
называют множество Н всех векторов
х е 8, ортогональных каждому вектору
линейного подпространства Н . Ортогональное
дополнение является линейным
подпространством, причем 8=НФН1~ и dim H +
+ dim7i1 =dim£.
В качестве примера рассмотрим
евклидово пространство V^ свободных векторов.
Если 7i — линейное подпространство
векторов, параллельных данной плоскости, то
ортогональным дополнением Н1 будет
множество векторов, перпендикулярных к этой
плоскости. Отметим, что это лишь один из
возможных вариантов прямого дополнения к
Н. Любое линейное подпространство Н\
векторов, коллинеарных произвольной
прямой, пересекающейся с плоскостью, является
прямым дополнением к Н . Продолжая
пример, выберем в качестве линейного
подпространства Н множество векторов,
параллельных данной прямой. Тогда Н1 - это
множество векторов, перпендикулярных к этой
прямой (или параллельных плоскости,
перпендикулярной к этой прямой).
Пусть Н — линейное подпространство в
евклидовом пространстве 8. Тогда любой
вектор хе 8 можно однозначно представить
в виде х = h + h , где he H —
ортогональная проекция вектора х на Н , a h e H —
ортогональная составляющая вектора х
относительно Н .
Рассмотрим случай, когда линейное
подпространство Н задано как линейная
оболочка системы векторов: 7i = span{fl1, ...
..., ат]. Тогда условие х ± Н равносильно
условиям х _L щ■, i = \,п . Таким образом,
линейное подпространство Н1 - это
множество всех решений системы уравнений
(в,-, х) = 0, / = 1,/и.
Запишем ее в координатах в
ортонормированном базисе е = (в[... еп ). Пусть
векторы щ в этом базисе имеют разложения
щ = апе{ +... + aine„, / = 1,п, а х = х{е{ +
... + хпеп . Тогда система принимает вид
апх{ +... + ainxn = О, / = 1, т ,
т.е. представляет собой однородную систему
из т линейных алгебраических уравнений с п
неизвестными. Строки матрицы А этой
системы совпадают с наборами координат
векторов щ,...,ат. Поэтому матрица А имеет
ранг, равный рангу системы векторов
fl|,..., ат, т.е. этот ранг совпадает с
размерностью линейного подпространства Н .
Каждое решение системы представляет собой
набор координат некоторого вектора из ТС и
наоборот. Поэтому можно сказать, что
множество всех решений этой системы есть
линейное подпространство Н . Это
подпространство имеет размерность п - dim H =
= «-Rg/l.
Множество решений однородной
системы линейных алгебраических уравнений
(СЛАУ) описывается при помощи фундамен-
300
Глава 7.3. ЕВКЛИДОВЫ ПРОСТРАНСТВА
шальной системы решении, которая по-
существу является базисом в подпространстве
всех решений данной однородной СЛАУ.
Каждый столбец фундаментальной системы
решений представляет собой координатную
запись вектора линейного подпространства
ТС1 в выбранном базисе е , и все такие
векторы в совокупности образуют базис
подпространства 7i
7.3.5. Нормы матриц. В линейном
пространстве Мп (R) квадратных матриц
порядка п норму можно задавать различными
способами. Например, это линейное про-
2
странство можно трактовать как п -мерное
линейное арифметическое пространство со
стандартным скалярным умножением и
соответствующей этому умножению евклидовой
нормой. Для матрицы А = (ау)е Мп (R) эта
норма имеет вид
Говорят, что норма • | в линейном
пространстве матриц Mn(R) является
матричной, или кольцевой, если ||Afl| < |<4|||/?||.
Примером кольцевой нормы является любая
индуцированная норма.
Задавая различные нормы в R'7 , мы
получаем индуцированные нормы в линейном
пространстве матриц Mn{R). Евклидова
норма
14=4
Ее называют евклидовой нормой матрицы
или /2 -нормой.
Пусть в линейном арифметическом
пространстве Шп задана норма || • ||+. Норму
ВЦ в линейном пространстве Mn(R)
называют согласованной с нормой I • , если для
любой матрицы Ае Mn(R) и любого столбца
х е R" выполняется соотношение || Ах ||+ <
Каждая норма || • ||+ векторов из R"
имеет согласованную с ней норму | • ||.
матриц из Мп (R), например норму
II Л* II
**° IIх II* IML=1
которую называют индуцированной (или
подчиненной, операторной) и используют для нее то
же обозначение |у4||+ , что и для
порождающей ее исходной нормы векторов в R" .
Индуцированная норма является наименьшей
из всех норм, согласованных с данной нормой
в R".
= (Xj ,...,хп ) , индуцирует в Mn(R)
спектральную норму, для произвольной
квадратной матрицы А равную у/Х , где X ~
максимальное собственное значение матрицы
А А. Октаэдрическая норма ЦдгЦ. =|.*i| + ...
... + |дсЛ| в Rn индуцирует максимальную
столбцевую (или октаэдрическую) норму матрицы
14 =,™« h jI+•••+К1}'где А={а»} е
е Mn (R). Кубическая норма |Ы| =
= тах{|х||, ..., |х,7|} в R" индуцирует
максимальную строчную (или кубическую) норму
матрицы ||4 = maxfle,,| +... + \аш\}.
В Мп (R), интерпретируя это линейное
пространство как п -мерное
арифметическое, можно задать /j -норму |Ы I. =
п п
= ХХЫ и ^-норму 1К| = тах/)У{|^|},
А = (ау)е Мп (R). В приложениях теории
матриц первая из этих двух норм заметного
интереса не представляет. Вторая норма
оценивает величину матрицы по максимальному
из абсолютных величин ее элементов и
необходима при изучении свойств различных
методов вычислений. Можно показать, что /^ -
норма в Мп (R) не является кольцевой, а
потому она не согласована ни с какой нормой
в R" . Этот недостаток можно
нейтрализовать, модифицировав эту норму. Например,
норма ЦлЦ^ = птах,у <\ау }, отличающаяся
от /^ -нормы корректирующим множителем п ,
ПСЕВДОРЕШЕНИЯ И ПСЕВДООБРАТНАЯ МАТРИЦА
301
равным порядку матрицы, уже является
кольцевой и согласована с тремя основными
нормами в R" : евклидовой, /j -нормой и /то -
нормой. Евклидова норма матриц | • L не
является индуцированной, но она кольцевая.
7.3.6. Псевдорешения и
псевдообратная матрица. Рассмотрим систему линейных
алгебраических уравнений (СЛАУ) Ах = Ъ с
матрицей А типа тхп . Для любого столбца
х е Шп евклидову норму вектора d = Ъ - Ах
называют невязкой СЛАУ. Невязка СЛАУ
равна нулю, если столбец х является решением
этой СЛАУ, и положительна в противном
случае.
Если система Ах = Ъ несовместна, то во
многих приложениях интерес представляет
такой вектор х, который дает минимальную
невязку. Такой подход к решению
несовместных систем называют методом наименьших
квадратов, поскольку квадрат невязки СЛАУ
равен сумме квадратов координат вектора d .
Пусть а[,...,ап е Rm - столбцы
матрицы А . СЛАУ Ах-Ъ может быть записана в
векторной форме X\d\ + ... + хпап = Ъ .
Несовместность СЛАУ означает, что Ь £ ТС, где
Н = span {flj,..., ап }. Разложим вектор b в
сумму Ь = h + /i , где /i — ортогональная
проекция вектора Ъ на линейное
подпространство Н , a h — ортогональная составляющая
этого вектора. Тогда d = (h- Ax) + h и по
теореме Пифагора \\d\\ = ||Л - Ах\\ + Л1 .
Минимальное значение величина ш
принимает, когда Ах = h , или Ъ - Ах _L 7i .
Последнее условие равносильно матричному
равенству А (Ь - Ах) = 0 , или А Ах =
= АТЬ.
СЛАУ А Ах = A b, соответствующую
системе Ах = b , называют нормальной СЛАУ.
Нормальная СЛАУ всегда совместна, а
множество ее решений совпадает с множеством
решений СЛАУ Ах = h, где h -
ортогональная проекция b на Н . Нормальная
СЛАУ имеет единственное решение, если
квадратная матрица А А невырождена, или,
что то же самое, ранг матрицы А совпадает с
количеством ее столбцов (она имеет
максимальный столбцовый ранг).
Вектор х, который дает минимальную
невязку СЛАУ, может быть определен
неоднозначно: такие векторы представляют собой
наборы коэффициентов разложения вектора
h по системе векторов щ,...,ап, а такое
разложение не единственно, если указанные
векторы линейно зависимы. В этой ситуации
выбор останавливают на том векторе х,
который имеет минимальную евклидову норму.
Такой вектор называют псевдорешением СЛАУ
Ах = b. Таким образом, псевдорешение
СЛАУ Ах = b — это решение х нормальной
СЛАУ А Ах = A b , имеющее
минимальную норму. Условие минимальности нормы
вектора х эквивалентно условию, что х
является линейной комбинацией столбцов
матрицы А , или, что то же самое, х
ортогонален каждому столбцу фундаментальной
системы решений однородной СЛАУ Ах = 0 .
Любая СЛАУ имеет псевдорешение, и притом
единственное. Если СЛАУ совместна, то
псевдорешение является одним из ее
решений. Если матрица СЛАУ имеет
максимальный столбцовый ранг, то псевдорешение —
это единственное решение нормальной СЛАУ
АтАх= АТЬ.
Пусть А — произвольная матрица типа
тхп. Матрицу А+ называют
псевдообратной матрицей к матрице А , если она
удовлетворяет условию АА+А = А и может быть
представлена в виде А+ = А Р ив виде
А+ = QA , где Р и Q - некоторые
матрицы. Для любой матрицы А типа тхп
существует псевдообратная матрица А+ , и
притом единственная. Она имеет тип пхт .
Если А — нулевая матрица, то А+ —
также нулевая матрица, получающаяся из А
транспонированием. Если А - квадратная
невырожденная матрица, то А+ = А~ , т.е.
псевдообратная матрица совпадает с
обратной. Если А имеет максимальный
столбцовый ранг, то матрица А А невырождена и
А+ = (АТА)~] АТ . Если А имеет
максимальный строчный ранг (ранг равен
количеству строк матрицы), то А+ = А (АА )
302
Глава 7.4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ
Псевдорешение любой СЛАУ Ах = Ъ
можно записать в виде х = Л¥Ь, где А+ —
псевдообратная матрица.
Псевдообратная матрица обладает
свойствами:
MT)+=U+)T;
(А+Г=А;
(А+А)т =А+А,(А+А)2 =А+А;
(АА+)Т =АА+,(АА+)2 =АА+.
Любую ненулевую матрицу А можно
представить в виде А = UV , где U —
матрица максимального столбцового ранга, а V —
матрица максимального строчного ранга.
Такое представление называют скелетным раз-
ложепием матрицы А . Столбцы матрицы U
можно рассматривать как базис в линейной
оболочке столбцов щ , / = 1,л , матрицы А .
При такой трактовке матрица V содержит
столбцы координат в указанном базисе
векторов я,-, / = 1,/1 . Из этой интерпретации
вытекает, что ранги матриц A, U, и V
совпадают. Кроме того, это дает способ построения
скелетного разложения ненулевой матрицы.
Достаточно в матрице А выбрать базисный
минор. Тогда базисные столбцы образуют
базис в линейной оболочке столбцов
матрицы. Совокупность этих столбцов дает матрицу
U . Остается разложить в этом базисе
оставшиеся столбцы матрицы А и сформировать из
коэффициентов разложений матрицу V.
Если А = UV — скелетное разложение
ненулевой матрицы А , то Ал = V+U+ ,
причем это равенство является скелетным
разложением матрицы А+ .
Псевдообратную матрицу А+ для
данной матрицы А можно найти через
скелетное разложение матрицы А . Можно также
использовать следующую процедуру,
называемую алгоритмом Гревилля. Обозначим
через ak , к = \,п , столбцы матрицы А и
рассмотрим матрицы Ак =(Л| ... dfr ),
образованные первыми к столбцами матрицы А .
Алгоритм Гревилля основан на построении
матрицы А£ исходя из известной матрицы
/l^j . Изложим его шаги.
На
первом шаге
находим
Ai =fllT/lbf ' если а\ *0' и А\ =Г°Т'
если Я] = 0 .
2. На к -м шаге известна матрица А^ .
Если ак = 0 , то к матрице А£ _j достаточно
добавить нулевую строку, т.е. At =
лк-\
0
Если же а^ Ф 0, то находим вектор
dfr = А^^а^ и вычисляем с^ = а^ - A^_\d^ .
3. Если fy = 0, то находим матрицу-
строку Qk =
4WI2
Если же Сд. Ф 0, то
полагаем Q^ = ct .
4. Определяем А£ =
(A+k_t-dkQk)
Qk
Глава 7.4
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
7.4.1. Определение и примеры
линейных операторов. Отображение А: С -> С'
из линейного пространства С в линейное
пространство С' называют линейным
отображением, или линейным оператором, если
выполнены следующие условия:
А(х + у) = А(х) + А(у), х,уе С;
А(%х) = ХА(х), хе £, Хе R.
Свойства линейности отображения
делают более удобной запись линейного
оператора в виде Ах.
Линейный оператор А: £^>£,
отображающий линейное пространство С в себя,
называют также линейным преобразованием и
говорят, что линейный оператор А действует
в линейном пространстве С .
Примерами линейных преобразований
являются тождественный оператор I ,
который каждый вектор переводит в себя
(/x = jc), и нулевой оператор 0, который
каждый вектор отображает в нулевой
(0jc = O). В пространстве К2 свободных
векторов на плоскости линейным оператором
является поворот вектора на заданный угол ф
против часовой стрелки.
МАТРИЦА ЛИНЕЙНОГО ОПЕРАТОРА
303
В R" , рассматривая векторы как
матрицы-столбцы высотой п, можно определить
с помощью квадратной матрицы А порядка
п отображение А: Rn —> Rn , которое
столбцу х ставит в соответствие столбец
Ах (Ах = Ах). Это отображение является
линейным оператором.
Каждому линейному оператору
А: С -> С' соответствуют его ядро ker A -
множество тех векторов х е С, для которых
Ах - 0 , где 0 — нулевой вектор в £ и его
образ \xx\A — множество векторов уе С\
являющихся значениями этого оператора.
Ядро кет А является линейным
подпространством в С, а образ im A — линейным
подпространством в С'. Для линейного
оператора А в R", который представляет собой
умножение столбца х е Rn слева на
квадратную матрицу А (см. выше), ядром является
множество решений однородной системы
линейных алгебраических уравнений с
матрицей А , а образом - линейная оболочка
векторов Л|,...,я;|, являющихся столбцами
матрицы А.
Размерности ядра и образа — важнейшие
характеристики линейного оператора. Число
• dim(ker А) называют дефектом линейного
оператора А, а число dim(inb4) - его ран-
гом. Дефект d(A) и ранг Rg(A) оператора
А: С -> С связаны с размерностью
пространства С соотношением d(A) + Rg(A) =
= dim С .
Если для линейных пространств С
и С! существует линейный оператор
А С -> С , являющийся биективным
отображением (взаимно однозначным
отображением С на все с!), то С и С' называют
изоморфными линейными пространствами, а
оператор А — изоморфизмом линейных
пространств С и С!. Для того чтобы линейный
оператор А был изоморфизмом, необходимо и
достаточно, чтобы он имел нулевой дефект и
ранг, равный размерности С'.
Два конечномерных линейных
пространства изоморфны тогда и только тогда, когда они
имеют одинаковую размерность. В частности,
все п -мерные линейные пространства
изоморфны линейному арифметическому
пространству Rn , которое можно рассматривать
как каноническое представление п -мерного
линейного пространства. Хотя любые два п -
мерных линейных пространства изоморфны,
соответствующий изоморфизм в общем случае
связан с выбором базисов в линейных
пространствах. Это не позволяет во всех случаях
отождествлять линейные пространства
одинаковой размерности, так как соответствие
между ними, установленное изоморфизмом, при
замене базисов нарушается.
Приведем пример изоморфизма. В
линейном пространстве Аз[х] многочленов
переменного х степени не выше трех элемен-
9 3
ты 1, х, х , х образуют базис. Этому
базису соответствует изоморфизм между Аз[х] и
R , при котором многочлену а$ + щх +
2 3
+^2* +^3* сопоставлен арифметический
вектор (oq , flj, a-i, а$ ). Любой линейной
операции над многочленами соответствует
такая же операция над арифметическими
векторами и наоборот.
7.4.2. Матрица линейного оператора.
Пусть задан линейный оператор А : С —> С .
Выберем базис Ь - (by ... bn) в С.
Обозначим столбцы координат векторов Aty в
базисе Ь через я,-, щ = (а^ ... ain) , / = 1, п .
Матрицу А = (щ ... я„ ), составленную из
координатных столбцов векторов АЪ\ ,...,АЬп
в базисе b = (b\ ... Ъп) называют матрицей
линейного оператора А в базисе Ь . Это
квадратная матрица порядка dim С . Отметим, что
в любом базисе матрицей нулевого оператора
является нулевая матрица, а матрицей
тождественного оператора — единичная матрица.
Матрица линейного оператора позволяет
дать простое описание действия этого
оператора: столбец у координат вектора у - Ах в
заданном базисе Ь равен произведению Ах
матрицы А оператора А в том же базисе на
столбец х координат вектора х: у - Ах.
Запись у = Ах часто называют матричной
формой записи действия линейного оператора
А в заданном базисе.
Различным линейным операторам А и
В, действующим в С соответствуют различ-
304
Глава 7.4. ЛИНЕЙНЫЕ ОПЕРАТОРЫ
ные матрицы в базисе Ь . Любая квадратная
матрица А порядка п является матрицей
некоторого линейного оператора,
действующего в С. Ранг линейного оператора
совпадает с рангом его матрицы.
Если СЛАУ записать в матричной форме
Ах = b , то матрицу А можно связать с
некоторым линейным оператором А , а столбцы
х и b интерпретировать как столбцы
координат векторов х и b . Мы приходим к
операторному уравнению Ах = b , решить
которое означает определить вектор х по его
образу b. В частном случае b = 0 СЛАУ
однородна, а множество решений
операторного уравнения составляет ядро оператора.
Отметим, что тривиальное решение х = 0
однородной СЛАУ Ах = 0 соответствует
нулевому вектору, всегда входящему в ядро
оператора.
Замена базиса в линейном пространстве
приводит к изменению матрицы линейного
оператора (тождественный и единичный
операторы — исключение, а не правило).
Матрицы Afy и Ае линейного оператора
А : С —» С , записанные в базисах b и е
линейного пространства С, связаны друг с
другом соотношением Ае = U~ A^U , где
U = Ufy_>e — матрица перехода от базиса b к
базису е.
Квадратные матрицы А и В порядка
п называют подобными, если существует
такая невырожденная матрица Р, что
Р АР - В . Подобные матрицы всегда
можно рассматривать как матрицы одного
оператора, записанные в разных базисах.
Понятие подобия матриц позволяет в
рамках матричной алгебры выделить те
свойства матриц, которые характеризуют сам
линейный оператор, а не его представление в
каком-либо базисе. В частности, из
определения подобия матриц вытекает, что подобные
матрицы имеют одинаковые определители.
Следовательно, определитель матрицы
линейного оператора не зависит от выбора базиса и
характеризует сам линейный оператор. Этот
определитель называют определителем
линейного оператора.
7.4.3. Операции с линейными
операторами. Пусть в линейном пространстве С
действуют два линейных оператора А и В .
Отображение А + В:С -> С, заданное
равенством (А + В)х = Ах + Вх , называют суммой
линейных операторов А и В . Отображение
ХА'.С —» С , заданное равенством (ХА)х =
= ХАх , где X е R , называют произведением
линейного оператора А на число X .
Отображение ВА :С^>С, заданное равенством
(ВА)х = В(Ах), называют произведением
линейных операторов В и А. Введенные
отображения А + В, ХА и АВ являются
линейными.
Если А и В — матрицы линейных
операторов А и В в некотором базисе b , то
линейному оператору А + В в базисе b
соответствует матрица А Л- В , линейному
оператору ХА — матрица ХА , а линейному
оператору ВА — матрица ВА.
Если линейный оператор А : С —> С
представляет собой биективное отображение,
то существует обратное отображение А :
С —> С , которое линейно, причем если
матрицей А в данном базисе b является А, то
матрицей линейного оператора А~ в том же
базисе является А .
Операции сложения линейных операторов
и умножения линейного оператора на
действительное число можно перенести на множество
L(C, С ) всех линейных операторов,
действующих из линейного пространства С в
линейное пространство С'. С этими
операциями множество L(C, С') становится
линейным пространством. Нулевым элементом
этого линейного пространства является
нулевой линейный оператор 0 , который любой
вектор хе С отображает в нулевой вектор
0 е С'. Каждый линейный оператор
А : С —> С! имеет противоположный линейный
оператор (-А), определяемый соотношением
(-Л)х = -Ш-
Линейное пространство L(C,C)
называют линейным пространством линейных
операторов (преобразований) пространства С.
Пусть b — базис в п -мерном линейном
пространстве С. Отображение Ф :£(£,£)->
—> Мп (R) , сопоставляющее линейному one-
СОБСТВЕННЫЕ ВЕКТОРЫ ЛИНЕЙНОГО ОПЕРАТОРА
305
ратору его матрицу в базисе Ь , является
изоморфизмом линейных пространств L(C,C) и
Af„(R).
Для любых двух линейных операторов А
и В, действующих в линейном пространстве
£, верно неравенство Rg(AB) <
<m'm{RgA,RgB}.
Глава 7.5
СОБСТВЕННЫЕ ВЕКТОРЫ
И СОБСТВЕННЫЕ ЗНАЧЕНИЯ
7.5.1. Характеристическое уравнение.
Для произвольной квадратной матрицы
А = (ау ) порядка п определитель 6ct(A -
-ХЕ), где Е — единичная матрица, а X —
действительное переменное, относительно
переменного X является многочленом
степени л и может быть записан в виде
XAW = dst(A-\E) = %(-l)kdk\k .
*=о
(7.5.1)
Этот многочлен называют
характеристическим многочленом матрицы А, а уравнение
Х^(^) = 0 — характеристическим уравнением
матрицы А.
Квадратную матрицу можно
использовать в качестве значения переменного в
произвольном многочлене. Значением
многочлена я0 + Qyt + ...asts на квадратной матрице А
является квадратная матрица, заданная
выражением
а0Е + щА + а2А2 + ... + asAs
и имеющая тот же порядок, что и исходная.
Интерес представляют такие многочлены,
значение которых от данной матрицы есть
нулевая матрица. Их называют
аннулирующими многочленами. Согласно теореме Кэ-
ли—Гамильтона характеристический
многочлен матрицы является ее аннулирующим
многочленом, т.е. Ха (^) = 0 •
Характеристические многочлены
подобных матриц совпадают. Это значит, что
характеристический многочлен матрицы А
линейного оператора А: С —> С не зависит от
базиса и поэтому характеризует сам оператор, а
не матрицу оператора. Его называют
характеристическим многочленом линейного оператора
А, а характеристическим уравнением
оператора — характеристическое уравнение матрицы А.
Коэффициенты d^ характеристического
многочлена (7.5.1) матрицы линейного
оператора А также не связаны с используемым
базисом, т.е. являются инвариантами
относительно выбора базиса. Таким образом, хотя
коэффициенты матрицы линейного оператора
меняются при замене базиса, некоторые
выражения от этих коэффициентов
остаются неизменными. Наиболее просто
выражается коэффициент dn_\ = ац + ^ + ... + #„„,
равный сумме диагональных элементов
матрицы А. Этот коэффициент называют следом
линейного оператора А (следом матрицы А) и
обозначают trA (trA) или spA (spA).
Коэффициент do характеристического
многочлена совпадает со значением этого
многочлена при X = 0 и равен определителю
линейного оператора А.
7.5.2. Собственные векторы
линейного оператора. Ненулевой вектор х в
линейном пространстве С называют собственным
вектором линейного оператора А: С —> С ,
если для некоторого действительного числа X
выполняется соотношение Ах = Тис. При
этом число X называют собственным
значением (собственным числом) линейного оператора А.
Множество всех собственных значений
линейного оператора в конечномерном
линейном пространстве называют спектром
линейного оператора.
Часто говорят о собственных значениях
(числах), спектре и собственных векторах
квадратной матрицы порядка п , фактически
подразумевая, что эта матрица задает
линейный оператор в линейном арифметическом
пространстве Шп, отображающий вектор со
столбцом координат х в вектор со столбцом
координат Ах.
Для того чтобы действительное число X
являлось собственным значением линейного
оператора, необходимо и достаточно, чтобы
оно было корнем характеристического
уравнения этого оператора.
Каждому собственному значению X
матрицы (линейного оператора) сопоставляют
его кратность, полагая ее равной кратности
корня X характеристического уравнения этой
матрицы (этого линейного оператора).
306
Глава 7.5. СОБСТВЕННЫЕ ВЕКТОРЫ И СОБСТВЕННЫЕ ЗНАЧЕНИЯ
Множество 3(Л, X) всех собственных
векторов линейного оператора А в линейном
пространстве С, отвечающих собственному
значению X , с добавленным к этому
множеству нулевым вектором, является линейным
подпространством в С. Его называют
собственным подпространством линейного
оператора. Оно является частным случаем
инвариантного подпространства линейного оператора А —
такого линейного подпространства Н, что
для любого вектора хеН вектор Ах также
принадлежит Н . Линейный оператор
А : С —> С можно рассматривать как линейное
отображение любого своего инвариантного
пространства Н в себя. Такое отображение,
но сути, есть результат сужения отображения
А на линейное подпространство Н , и его
называют ограничением линейного оператора на
инвариантное подпространство Н .
Размерность собственного
подпространства линейного оператора А, отвечающего
заданному собственному значению X, не
превосходит кратности этого собственного
значения, причем эти характеристики могут и
не совпадать.
Характеристическое уравнение
линейного оператора А : С —> С, действующего в
п -мерном линейном пространстве С, — это
алгебраическое уравнение я-й степени с
действительными коэффициентами. Среди его
корней могут быть и комплексные числа, и
действительные. Комплексные корни не
относятся к собственным значениям линейного
оператора, так как, согласно определению,
собственное значение линейного оператора -
действительное число. Комплексные корни
характеристического уравнения будут
собственными значениями линейного оператора
только в случае, когда рассматривается
комплексное линейное пространство, т.е. в этом
линейном пространстве задано умножение
векторов на любые комплексные числа.
Чтобы вычислить собственные значения
линейного оператора А и найти его
собственные векторы, нужно выполнить следующие
операции:
выбрать в линейном пространстве базис
и сопоставить линейному оператору А его
матрицу А;
составить характеристическое уравнение
dct(A-XE) -0 и найти все его
действительные корни Х/с , которые и будут
собственными значениями линейного оператора;
для каждого собственного значения Хк
найти фундаментальную систему решений для
однородной системы линейных
алгебраических уравнений (СЛАУ) (А-Х/сЕ)х = 0.
Столбцы фундаментальной системы решений
представляют собой координаты векторов
некоторого базиса в собственном
подпространстве 3(А, Xfr) линейного оператора А.
7.5.3. Свойства собственных
векторов. Определение собственных векторов и
собственных значений линейного оператора
позволяет выбрать такой базис, в котором
матрица линейного оператора имеет более
простую структуру. Если для данного
линейного оператора существует базис из
собственных векторов, то матрица линейного
оператора в этом базисе является диагональной.
Наоборот, базис, в котором матрица линейного
оператора диагональна, состоит из
собственных векторов этого оператора.
Отметим, что система собственных
векторов е± ,...,er данного линейного оператора,
отвечающих различным собственным
значениям Х[ ,...ДГ , является линейно независимой.
Поэтому при построении базиса из
собственных векторов достаточно проверять линейную
независимость только тех векторов, которые
отвечают одному и тому же собственному
значению. Отсюда, в частности, вытекает
следующее утверждение. Если
характеристическое уравнение линейного оператора имеет п
попарно различных действительных корней,
то существует базис, в котором матрица этого
оператора является диагональной.
Действительно, каждому собственному значению
можно сопоставить собственный вектор.
Система таких векторов будет линейно
независимой, а количество векторов в системе будет
равно размерности линейного пространства.
Сформулированное утверждение можно
отнести к матрицам: если характеристическое
уравнение квадратной матрицы порядка п
имеет п попарно различных действительных"
корней, то эта матрица подобна некоторой
диагональной. Замену матрицы А подобной
ей диагональной матрицей называют
приведением матрицы А к диагональному виду.
Поэтому можно сказать так: квадратная матрица
порядка п , имеющая п различных собственных
значений, приводится к диагональному виду.
Задача приведения матрицы к
диагональному виду может рассматриваться
самостоятельно, вне зависимости от изучения
конкретного линейного оператора. Она
состоит в подборе для данной матрицы А такой
ЖОРДАНОВА НОРМАЛЬНАЯ ФОРМА
307
невырожденной матрицы Р, что матрица
А = Р~ АР является диагональной.
Если характеристическое уравнение
линейного оператора имеет кратные
действительные корни, то такой линейный оператор
может иметь диагональную матрицу в
некотором базисе, но так бывает не всегда. Матрицу
линейного оператора можно привести к
диагональному виду, если сумма размерностей
всех собственных подпространств линейного
оператора равна порядку матрицы
(размерности линейного пространства). В этом случае,
выбрав в каждом собственном
подпространстве базис и объединив все эти базисы в единую
систему, мы получим базис из собственных
векторов всего линейного пространства.
7.5.4. Жорданова нормальная форма.
Линейный оператор, матрица которого ни в
одном базисе не является диагональной,
имеет характеристическое уравнение, у которого
есть комплексные или кратные
действительные корни.
Приведение матрицы линейного
оператора к простому виду связано со структурой
его инвариантных подпространств. Если
?^,...,?^ — инвариантные подпространства
линейного оператора А : С —> С , причем
1\ Ф ... Ф Hs = С , то в некотором базисе
матрица оператора А имеет блочно-
диагональный вид А = diag(#j,..., Hs), где
блок Hi имеет порядок dim Ц , / = 1,5.
Простые корни. Пусть
характеристическое уравнение линейного оператора имеет
И
0
0
0
1
м-
0
0
0
1
0
0
V
Матрицу вида А' = diag(Cr| (ct| ,|3|),...,
(am^m),Jsl([il)i...,Jsk([ik))9 где а.-,
Py- (j = 1,m) и [ij (I = 1, к) -
действительные числа, называют жордановой, ее
диагональные блоки — жордановыми клетками.
Среди жордановых клеток жордановой
матрицы могут встречаться одинаковые. Если две
жордановы матрицы подобны, то одна
получается из другой перестановкой диагональных
блоков.
лишь простые корни, среди которых, вообще
говоря, есть и комплексные. Каждому
комплексному корню a + /p этого уравнения
соответствует комплексно сопряженный
корень a - /р той же кратности. Любой паре
комплексно сопряженных корней
характеристического уравнения линейного оператора
соответствует двумерное инвариантное
подпространство этого оператора.
Если характеристическое уравнение
линейного оператора А : С —> С (квадратной
матрицы М) имеет р различных пар
комплексно сопряженных корней a,- ± /р,-,
/ = \,р , и q различных действительных
корней \ij , j = l,q , причем 2p + q =
п = dim С , то в некотором базисе матрица А
этого оператора А (матрица М) имеет блочно-
диагональный вид (подобна блочно-диаго-
нальной матрице) А = diag(C((X| ,P|),...,
C(ap,flp),\Li,...,\iq)9 где
<*-»-(д :\
Кратные корни. Для произвольных
действительных чисел \1 и комплексных чисел
X = а + /'Р(Р * 0) введем матрицы Js (\i)
порядка 5 и блочные матрицы Сг(сс,Р)
порядка 2 г :
0 Л
0
Е
C(a,P)J
Жорданову матрицу А\ подобную данной
матрице А , называют жордановой нормальной
формой (жордановой канонической формой)
матрицы А. Каждая матрица имеет жорданову
нормальную форму и для любого линейного
оператора существует базис, в котором его
матрица имеет жорданову нормальную
форму. Жорданова нормальная форма
определяется неоднозначно — с точностью до
перестановки жордановых клеток.
0Л (C(a,p) E 0
0 0 C(a,P) E
... L Сг(а,Р)=
1 0 0 0
J I 0 0 0
308
Глава 7.6. САМОСОПРЯЖЕННЫЕ И ОРТОГОНАЛЬНЫЕ ОПЕРАТОРЫ
Глава 7.6
САМОСОПРЯЖЕННЫЕ И
ОРТОГОНАЛЬНЫЕ ОПЕРАТОРЫ
7.6.1. Сопряженный оператор. Пусть
8 — евклидово пространство. Линейный
оператор А* : 8 —> 8 называют сопряженным к
линейному оператору А : 8 —> 8 , если для
любых векторов х,уе8 верно равенство
(Ах,у) = (х,А*у).
Любому линейному оператору
А : 8 —> 8 соответствует единственный
сопряженный оператор А* , причем его
матрицей в любом ортонормированном базисе явля-
ется матрица А , транспонированная
матрице А линейного оператора А в том же
базисе.
В некоторых случаях линейный
оператор, сопряженный к данному линейному
оператору, можно найти, не вычисляя матрицы
этого оператора. Например, множество
0°[я,£] бесконечно дифференцируемых на
отрезке [а,Ь] функций, у которых в точках
а и b производные любого порядка равны
нулю, является линейным пространством
относительно обычных операций сложения
функций и умножения функции на
действительное число, а формула (/, g) =
1
= f(t)g(t)dt задает в этом линейном про-
0
странстве скалярное произведение.
Отображение Af = /', которое каждой функции
/ е Cq° [a,b] ставит в соответствие ее
производную, является линейным оператором.
Оператором, сопряженным к А, будет -А,
поскольку, согласно правилу интегрирования
по частям, имеем (Af,g) = (/, - Ag) .
Линейный оператор А, действующий в
евклидовом пространстве, называют
самосопряженным, если А* = А, т.е. если для
любых векторов х и у верно равенство
{Ах, у) = (х,Ау). Самосопряженными
являются простейшие линейные операторы:
нулевой 0 и тождественный I.
Матрица самосопряженного оператора в
любом ортонормированном базисе является
симметрической. Наоборот, если матрица
линейного оператора в некотором
ортонормированном базисе является симметрической,
то этот оператор самосопряженный.
Важнейшей особенностью
самосопряженных операторов является то, что все
корни характеристического уравнения такого
линейного оператора действительны. Поэтому
самосопряженный оператор в п -мерном
евклидовом пространстве имеет п собственных
значений, если каждое из них считать с
учетом кратности (т.е. собственное число
кратности г считается г раз).
Собственные векторы самосопряженного
оператора также имеют ряд особенностей.
Собственные векторы самосопряженного
оператора, отвечающие различным
собственным значениям, ортогональны. С этим
утверждением тесно связано следующее
утверждение. Если Н — инвариантное
подпространство самосопряженного оператора А,
действующего в 8, то его ортогональное дополнение
ТС1 также является инвариантным
подпространством линейного оператора А .
Размерность собственного
подпространства 3(А, X) , отвечающего собственному
значению X , совпадает с кратностью этого
собственного значения. Отсюда вытекает, что
для любого самосопряженного оператора
существует ортонормированный базис из
собственных векторов этого линейного оператора.
Матрица линейного оператора в этом базисе
является диагональной, причем ее
диагональными элементами являются собственные
значения, повторенные в соответствии с их
кратностью.
Любую симметрическую матрицу можно
рассматривать как матрицу самосопряженного
оператора в ортонормированном базисе.
Такая точка зрения позволяет
переформулировать свойства самосопряженного оператора
для симметрических матриц. Так, любая
симметрическая матрица М порядка п подобна
некоторой диагональной, т.е. существует
такая невырожденная матрица Р порядка п, что
Р~ MP = diag(Xj ,...,Хп ).
Последовательность Х\,...,Хп из п чисел представляет
собой перечень всех корней
характеристического уравнения матрицы М с учетом их
кратностей.
7.6.2. Ортогональные матрицы и
операторы. Квадратную матрицу О называют
ортогональной, если она удовлетворяет
соотношению О О-Е, где Е — единичная
матрица.
ПРИВЕДЕНИЕ СИММЕТРИЧЕСКОЙ МАТРИЦЫ К ДИАГОНАЛЬНОМУ ВИДУ 309
Простейшей ортогональной матрицей
является единичная матрица Е. Другой
пример — матрица
fcoscp -sin((Л
I sin(p cos(p I
Укажем простейшие свойства
ортогональных матриц:
ортогональная матрица невырождена,
причем определитель такой матрицы может
иметь одно из двух возможных значений:
1 и -1;
матрица, обратная к ортогональной
матрице О , совпадает с ее транспонированной
— I X
матрицей, т.е. О = О ;
для любой ортогональной матрицы О
т
верно равенство 00 = Е ;
если О — ортогональная матрица, то и
— I Т
О vi О - ортогональные матрицы;
произведение ортогональных матриц
является ортогональной матрицей.
Линейный оператор А : £ —> £ ,
действующий в евклидовом пространстве £,
называют ортогональным оператором (или
ортогональным преобразованием), если он сохраняет
скалярное произведение в £, т.е. для любых
векторов х,уе£ выполняется равенство
(Ах,Ау) = (х,у).
Так как ортогональный оператор
сохраняет скалярное произведение, то он сохраняет
и евклидову норму (длину) вектора, т.е.
||Лх|| = |jc|| , х е £, а также угол между
ненулевыми векторами. Отметим, что сохранение
нормы линейным оператором является не
только необходимым, но и достаточным
условием его ортогональности.
Пусть А - ортогональный оператор в
евклидовом пространстве £ и е = (в[ ... еп) —
произвольный ортонормированный базис в £.
Тогда система векторов Ае = (Ав\ ... Аеп )
является ортонормированным базисом в £.
Наоборот, если линейный оператор А
переводит ортонормированный базис в
ортонормированный, то этот оператор является
ортогональным. Таким образом, ортогональный
оператор можно определить как оператор,
переводящий ортонормированный базис в
ортонормированный.
Пусть А — ортогональный оператор и
А — его матрица в ортонормированном
базисе е\,...,еп. Тогда матрицей Грома системы
векторов Aei,...,Aen является матрица
т
А А. Так как эта система является
ортонормированным базисом, то А А = Е, т.е.
матрица ортогонального оператора в
ортонормированном базисе является ортогональной.
Верно и обратное утверждение: если в
ортонормированном базисе матрица оператора
ортогональна, то этот оператор
ортогональный.
Ортогональные матрицы связаны не
только с особым типом линейных операторов,
но и с заменой ортонормированного базиса.
В евклидовом пространстве матрица перехода
от одного ортонормированного базиса к
другому является ортогональной. Наоборот, если
базис Ь ортонормированный, матрица
перехода U из базиса Ь в базис е ортогональна,
то базис е является ортонормированным.
Иногда говорят, что ортогональная
матрица состоит из ортонормированных столбцов
и строк. Эта терминология мотивируется
следующим. Равенства О 0 = Е,00 =Е,
верные для любой ортогональной матрицы,
означают, что системы столбцов и строк
матрицы О , рассматриваемых как элементы п -
мерного евклидова арифметического
пространства, являются ортонормированными.
7.6.3. Приведение симметрической
матрицы к диагональному виду. Матрица А
линейного оператора А при замене базиса
преобразуется согласно формуле A' -U~ AU ,
где U — матрица перехода. Если речь идет о
евклидовом пространстве и переходе из одного
ортонормированного базиса в другой, матрица
перехода U является ортогональной и
удовлетворяет соотношению U = U . Поэтому
для случая ортонормированных базисов
формулу преобразования матрицы линейного
оператора можно записать следующим
образом: А' = U AU . Такое преобразование с
ортогональной матрицей U иногда называют
ортогональным преобразованием матрицы А.
Любая симметрическая матрица подобна
диагональной. При этом саму
симметрическую матрицу можно рассматривать как
матрицу самосопряженного оператора в
ортонормированном базисе, а подобную ей
диагональную матрицу — как матрицу того же
оператора в другом ортонормированном базисе.
Это означает, что симметрическая матрица
приводится к диагональному виду
ортогональным преобразованием, т.е. для любой
симметрической матрицы М существует такая
310
Глава 7.7. КВАДРАТИЧНЫЕ ФОРМЫ
ортогональная матрица U , что U MU = Л,
где Л = diag(Xi,..., А,„ ) — диагональная
матрица, диагональными элементами которой
являются собственные значения матрицы Л/,
повторяющиеся согласно их кратности.
Чтобы найти соответствующую матрицу
U, необходимо:
найти собственные значения матрицы М
(этого достаточно, чтобы записать матрицу
Л);
для каждого собственного значения
найти набор собственных векторов,
соответствующих этому собственному значению, при
этом эти собственные векторы должны быть
линейно независимыми и их количество должно
равняться кратности собственного значения;
преобразовать системы собственных
векторов, полученные для каждого
собственного значения, в ортонормированные при
помощи процесса ортогонализации Грома-
Шмидта',
объединить ортонормированные
системы для каждого собственного значения в
единую систему, которая будет ортонормирован-
ным базисом евклидова пространства;
записать матрицу U , столбцами
которой являются координаты векторов
построенной ортонормированной системы.
Глава 7.7
КВАДРАТИЧНЫЕ ФОРМЫ
7.7.1. Определение квадратичной
формы. Однородный многочлен второй
степени от п переменных с действительными
коэффициентами
п
^аих}+2 £ aijXiXj , fl^R, (7.7.1)
/=l \<i<j<n
называют квадратичной формой. Если в п-
мерном линейном пространстве С выбрать
некоторый базис, то квадратичную форму
(7.7.1) можно трактовать как функцию,
значение которой определено через координаты
Х[ ,...,хп вектора х. Эту функцию часто
отождествляют с квадратичной формой.
Квадратичную форму (7.7.1) можно за-
т
писать в матричном виде: х Ах, где
х = (Х\ ... хп ) — столбец, составленный из
переменных; А = (ау) — симметрическая
матрица порядка п, называемая матрицей
квадратичной формы (7.7.1). Ранг матрицы А
квадратичной формы называют рангом
квадратичной формы. Если матрица А имеет
максимальный ранг, равный числу переменных п,
то квадратичную форму называют
невырожденной, а если Rg/4 < п, то ее называют
вырожденной. Например, квадратичная форма от
трех переменных х{ +4Х[Х^ является
вырожденной.
Пусть квадратичная форма х Ах
представляет функцию f(x) в п -мерном
линейном пространстве С , записанную в базисе Ь .
Координаты х вектора х в базисе Ъ связаны с
координатами у того же вектора в базисе е
формулой х = Uy , где U - матрица перехода
из базиса Ъ в базис е . Используя эту связь,
функцию f(x) можно записать в виде
хТ Ах = уТ (UT AU)y , т.е. если функция
f(x) в базисе е представлена квадратичной
формой с матрицей А, то она в базисе е
также представлена квадратичной формой с
матрицей А' = U AU . Именно это свойство и
позволяет не различать квадратичную форму
и представленную этой квадратичной формой
функцию в линейном пространстве. При этом
формулу A'-U AU рассматривают как
преобразование матрицы квадратичной
формы при замене базиса.
Среди квадратичных форм выделим те,
которые не содержат попарных произведений
переменных: ctjXj[ +... + OLnx„ , a, g R ,
/ = 1,/I. Такие квадратичные формы
называют квадратичными формами канонического
вида. Переменные Xi,...,xn, в которых
квадратичная форма имеет канонический вид,
называют каноническими переменными.
Один из методов преобразования (или,
как говорят, приведения) квадратичной
формы к каноническому виду путем замены
переменных состоит в последовательном
выделении полных квадратов. Такой метод
называют методом Лагранжа. Например, выделим
в квадратичной форме х^ -4хуХ2 полный
квадрат по х{ : х{ -4х{х2 = х£ - 4х{х2 +
+4х\ - 4х\ = (х{ - 2х2 )2 - 4х\ • Введя но-
ОРТОГОНАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ КВАДРАТИЧНЫХ ФОРМ
311
вые переменные ц = Ху - 2х2, Z2 = 2x2 ,
получим квадратичную форму канонического
вида zf - z\.
Предложенный способ требует, чтобы
исходный вид квадратичной формы содержал
хотя бы один квадрат переменной. Если
квадратов переменных в квадратичной форме нет,
то перед выделением полного квадрата
выполняют промежуточную замену переменных,
превращающую имеющееся произведение
переменных в разность квадратов. Например,
квадратичная форма Х[Х2 заменой
переменных Х[ = х[ + х2 , х2 = х[ - х2
преобразуется в разность квадратов (х{ ) - (х2 ) .
Канонический вид, к которому можно
привести заданную квадратичную форму,
определяется неоднозначно. Но при этом
некоторые характеристики квадратичной формы
при замене переменных сохраняются. Так,
ранг квадратичной формы, совпадающий с
рангом ее матрицы, при замене переменных,
вызванной переходом к другому базису, не
изменяется. Это объясняется тем, что в этом
случае преобразование матрицы квадратичной
формы заключается в ее умножении на две
невырожденные матрицы, а такое умножение
не меняет ранга матрицы. Сохранение ранга
квадратичной формы означает, что
количество ненулевых слагаемых в любом ее
каноническом виде одно и то же. Это количество
равно рангу квадратичной формы.
Неизменным в каноническом виде
остается и количество положительных
(отрицательных) слагаемых. Другими словами, если
даны два канонических вида
Л (У1,-,Ут ) = Ь\У\ + - + КУт >
Xt• ф О , / = 1,/и,
/2 Ub->Z* ) = l-4£i2 +... + Д**£,
\Ljг * 0 , j = TJc ,
одной квадратичной формы, то количество
положительных (отрицательных)
коэффициентов Xi равно количеству положительных
(отрицательных) коэффициентов |1у.
Отметим, что общее количество коэффициентов в
двух этих видах одно и то же, т.е. т = к (это
количество равно рангу квадратичной формы).
Свойство сохранения в каноническом
виде квадратичной формы количества
слагаемых одного знака известно как закон инерции.
7.7.2. Ортогональные преобразования
квадратичных форм. Если рассматривается
евклидово пространство, а старый и новый
базисы выбраны ортонормированными, то
матрица перехода U является ортогональной, и
мы имеем дело с ортогональным
преобразованием квадратичной формы. Любую
симметрическую матрицу можно ортогональным
преобразованием привести к диагональному виду.
Это означает, что любую квадратичную форму
можно ортогональным преобразованием
привести к каноническому виду.
Диагональными элементами матрицы
А' квадратичной формы канонического вида,
получающейся в результате ортогонального
преобразования, являются собственные
значения матрицы А квадратичной формы.
Поэтому можно записать матрицу А
канонического вида, не находя соответствующего
ортогонального преобразования.
Пример 7.7.1. Найдем канонический вид
квадратичной формы /(Xj ,х2 ) = 5*j +
+8x1X2+5X2, к которому она приводится
ортогональным преобразованием, и укажем
одно из таких ортогональных преобразований.
Характеристическим уравнением
матрицы А квадратичной формы является
utt(A - ХЕ) = (5 - X)2 -16 = 0 , а
собственными значениями Х\ = 1, Х2 = 9 .
Следовательно, квадратичная форма приводится
ортогональным преобразованием к
каноническому виду f(y{ ,У2) = У? + 9>>2 • Для
построения ортогонального преобразования
найдем собственные векторы матрицы А. Из
однородной системы линейных
алгебраических уравнений (А-ХЕ)х = 0 при ^. = 1
т
находим собственный вектор е{ = (1 -1) .
Тогда вектор е2 = (1 1) , ортогональный
вектору е± , будет собственным вектором с
соответствующим собственным значением
Х2 =9 . Пронормировав эти векторы,
составляем из столбцов их координат матрицу
ортогонального преобразования
Единообразное поведение
самосопряженных операторов и квадратичных форм при
переходе от одного ортонормированного
базиса к другому объясняется следующей свя-
312
Глава 7.7. КВАДРАТИЧНЫЕ ФОРМЫ
зью. Пусть А : S —> S — самосопряженный
оператор, действующий в евклидовом
пространстве S. Функция f(x) = (Ax,x),
определенная на евклидовом пространстве,
является квадратичной формой. Наоборот, для
любой квадратичной формы f(x) на
евклидовом пространстве S существует такой
самосопряженный оператор А, что
f(x) = (Ax,x). Этот оператор определен
однозначно.
7.7.3. Типы квадратичных форм.
Квадратичные формы подразделяют на
различные типы в зависимости от множества их
значений. Квадратичную форму f(x) = х Ах,
х
х = (Х| ... хп ) , будем называть:
первая положительно определена, так как
принимает только положительные значения,
если переменные одновременно не
обращаются в нуль. Квадратичная форма /2
неотрицательно определена: будучи суммой двух
квадратов она не принимает отрицательных
значений, но при Х[ = х2 = 0 и х3 ^ 0 она
принимает нулевое значение. Квадратичные
формы fa и /а знакопеременны. Первая из
х
них положительна при х = (1 0 0) и отри-
Тип квадратичной формы
Положительно определенная
(Vx*0 :/(*)> 0)
Отрицательно определенная
(Vx*0:/(x)<0)
Знакопеременная
(3x3y:f(x)>0, 3f(y)<0)
Вырожденная
Тип квадратичной формы f(x) =
х
= х Ах, где А = (ау) — симметрическая
матрица, можно определить, не вычисляя
собственных значений ее матрицы.
положительно (отрицательно)
определенной, если для любого ненулевого столбца х
выполняется неравенство /(х) > 0
(/(*)<0);
неотрицательно (неположительно)
определенной, если f(x) > 0 (/(*) < 0) для
любого столбца х, причем существует ненулевой
столбец х, для которого f(x) = 0 ;
знакопеременной (неопределенной), если
существуют такие столбцы х и у, что
/<х)>0 и/О0<0.
Например, среди четырех квадратичных
форм от трех переменных
цательна при х = (0 1 О)1 . Вторая положи-
х
тельна при х = (1 0 0) и отрицательна при
х
х = (0 -1 0) . Квадратичные формы fa и
fa являются вырожденными, так как ранг
каждой из них равен двум.
Тип квадратичной формы полностью
определяется множеством собственных
значений ее матрицы:
Множество собственных значений
Все собственные значения положительны
(X, >0, i = lJt)
Все собственные значения отрицательны
(X,- < 0, 1 = Пя)
Есть собственные значения разных знаков
(ЗХ,- >0, ЗХу <0)
Есть нулевое собственное значение
(ЗХ,=0)
Метод состоит в вычислении и проверке
знаков определенных миноров матрицы А.
Минор А^ = М^'"1 у образованный первыми
к строками и первыми к столбцами матри-
/l (х[ > х2 > х3 ) = х\ + х2 + х3 ' h (х1' *2 »х3 ) = xi + х2 ;
/з (*1»*2 » *3 ) = xi - х2 + х3 > Л (*Ь *2 » *3 ) = xi - х2
БИЛИНЕЙНЫЕ ФОРМЫ
313
цы А, называют угловым минором. Минор
М1У.2"\к , расположенный на пересечении
произвольных к строк и к столбцов с теми
же номерами, что и строки, называют
главным минором.
Согласно критерию Сильвестра,
квадратичная форма положительно определенная
тогда и только тогда, когда все ее угловые
миноры положительны.
Отрицательно определенную
квадратичную форму можно преобразовать в
положительно определенную умножением на -1. В
этом случае матрица квадратичной формы
также умножается на -1. Отсюда вытекает
следующее утверждение: квадратичная форма
отрицательно определенная, если все ее
угловые миноры Д^ ненулевые и имеют
чередующиеся знаки, начиная со знака «минус»,
т.е. (-1)*Д* >0, к = \7п.
Для того чтобы невырожденная
квадратичная форма была знакопеременной,
необходимо и достаточно, чтобы выполнялось
одно из условий: один из угловых миноров
равен нулю; один из угловых миноров
четного порядка отрицателен; два угловых
минора нечетного порядка имеют разные знаки.
Критерием невырожденности квадратичной
формы является невырожденность ее
матрицы, т.е. условие Ап Ф О .
Если квадратичная форма вырождена, то
для анализа ее типа необходимо использовать
не только угловые миноры, но и главные.
Верен следующий критерий: квадратичная
форма неотрицательно определенная тогда и
только тогда, когда все главные миноры ее
матрицы неотрицательны. Наконец, для того
чтобы квадратичная форма была
неположительно определена, необходимо и достаточно,
чтобы все главные миноры ее матрицы
четного порядка были неотрицательны, а все
главные миноры нечетного порядка —
неположительны.
Критерий Сильвестра и его следствия
показывают, что тип квадратичной формы
полностью определяется свойствами ее
матрицы. Поэтому можно перенести термины с
квадратичных форм на симметрические
матрицы. В частности, симметрическую матрицу
А называют положительно {отрицательно)
определенной и пишут А > О (А < 0), если
положительно (отрицательно) определена
соответствующая квадратичная форма.
Переформулируя критерии различных
типов квадратичных форм для матриц,
получим утверждения:
симметрическая матрица положительно
определена, если все ее угловые миноры
положительны;
симметрическая матрица отрицательно
определена, если у ее угловых миноров знаки
чередуются, начиная со знака минус;
симметрическая матрица неотрицательно
определена, если у нее неотрицательны все
главные миноры;
симметрическая матрица
неположительно определена, если у нее все главные
миноры четного порядка неотрицательны, а все
главные миноры нечетного порядка
неположительны.
Отметим, что изменением порядка
переменных (т.е. изменением порядка векторов
в базисе) любой главный минор матрицы
квадратичной формы можно сделать угловым.
Поэтому у положительно определенной
квадратичной формы (матрицы) положительны не
только угловые миноры, но и все главные.
В частности, у такой квадратичной
формы (матрицы) положительны все
диагональные элементы.
7.7.4. Билинейные формы. Функцию
Ь(х, у) от двух переменных, определенную в
линейном пространстве С , называют
билинейной формой, если эта функция линейна по
каждому из своих аргументов, т.е. для любых
действительных а и р и любых векторов
x,y,ze С выполняются равенства:
£(ocjc + Pj,z) = ab(x,z) + $b(y,z),
b(x,ay + pz) = ab(x,у) + р£(дс, z).
Частным случаем билинейной формы
является скалярное произведение.
Выберем в n-мерном линейном
пространстве С базис е = (е{ ... еп ). Для билинейной
формы Ь(х,у) обозначим Ьц = b(ej , ву),
/, j = 1, /1,. Тогда для любых векторов х и у со
столбцами координат х = (х\ ... хп) и
т
у = (у[ ... уп) в базисе е
b(x,y) = b
( п п ^^
Х*'е"Х^
1=1 7=1
=X X WW* > eJ>=X Ё bvXiyj ■
i=\ 7=1 <=1 7=1
314
Глава 7.8. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ
Используя квадратную матрицу В = (Ьц)
порядка п, можем записать полученное
представление в матричном виде:
b(x,y) = x By. Матрицу В называют
матрицей билинейной формы.
Пусть билинейная форма b имеет в
базисе Ь матрицу Bfj, а в базисе е матрицу
Ве . Обозначим через U матрицу перехода из
базиса Ь в базис е . Тогда Ве = U B^U .
Если Ь(х,у) — билинейная форма, то
функция Ь(х,х) в заданном базисе
записывается в виде Ь(х,х) = х Вх . Это матричное
произведение представляет собой
квадратичную форму от координат вектора х.
Матрицей этой квадратичной формы является
матрица А = 0,5(В + ВТ).
Билинейную форму Ь(х,у) называют
симметрической (кососимметрической), если
Ь(х,у) = Ь(у,х), (Ь(х,у) = -Ь(у,х)) для
любых векторов х и у. Примером
симметрической билинейной формы является
скалярное произведение. Для симметричности
билинейной формы необходима и достаточна
симметричность ее матрицы. Если
билинейная форма имеет симметрическую матрицу в
одном базисе, то ее матрица будет
симметрической и в любом другом базисе. Случай ко-
сосимметрической билинейной формы
аналогичен. Для того чтобы билинейная форма
была косое и мметр и ческой, необходимо и
достаточно, чтобы ее матрица в каком-либо
базисе была кососимметрической.
Для любой квадратичной формы f(x)
в линейном пространстве С существует, и
притом единственная, симметрическая
билинейная форма Ь(у,х), для которой f(x) =
= b(x,x),xe£. По квадратичной форме
соответствующая ей билинейная форма легко
восстанавливается по формуле
,(JC,^/(*^)-/(*)-/w.
Глава 7.8
ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ
7.8.1. Сопряженное пространство.
Отображение /: £ —> R , определенное на
линейном пространстве £ и принимающее
действительные значения, называют линейной
функцией (также линейной формой, линейным
функционалом), если f(x + у) = f[x) + f(y),
х,у е £ , /(Тис) = Щх), jc е £ , X е R.
Вместо записи /(■*) часто пишут (/,*)•
Линейные формы можно складывать и
умножать на действительные числа, как обычные
функции, и эти операции превращают
множество линейных форм в пространстве £ в
линейное пространство, которое называют
сопряженным пространством по отношению к
линейному пространству £ и обозначают £ .
При совместном рассмотрении £ и £
элементы каждого из этих пространств
называют векторами, но элементы сопряженного
пространства £ именуют ковариантными
векторами (ковекторами), а элементы из
линейного пространства £ — контравариант-
ными векторами (или просто векторами).
Базисы еь...,еп (в £) и У1,...,/'1 (в
£ ) называют биортогональными, или
взаимными, если f'{ej) = Slj» гДе 8у = 0 при
i Ф ) и 5у = 1 при / = j . Координаты
векторов из £ и £ определяются
преимущественно во взаимных базисах, при этом у
координат контравариантных векторов индекс
ставится вверху, а у ковариантных — внизу.
Координатами произвольной линейной
формы в некотором базисе являются ее значения
на векторах взаимного базиса. Если Ь и с —
базисы в £ , a U — матрица перехода из Л в с,
то взаимные базисы Ь и с в £ связаны
* */ т \—I + * т
соотношениями с = b Ш \ , b = с U .
Если линейное пространство £
евклидово, то любую линейную форму f(x) можно
представить с помощью скалярного
произведения (•, •) в виде f(x) = {xf, x), где
Xf е £ — некоторый фиксированный вектор.
По линейной форме f(x) вектор Xj-
определяется однозначно. Тем самым между
линейными пространствами £ и £
устанавливается соответствие, оказывающееся
изоморфизмом. Поскольку этот изоморфизм не
связан с выбором базиса, то евклидовы
пространства £ и £ можно отождествить.
ТЕНЗОРЫ
315
7.8.2. Полилинейные формы. Пусть
£ — n-мерное линейное пространство и £ —
сопряженное к нему пространство. Функцию
<р( ДС|,..., хр; / ,...,fg), аргументами
которой являются р векторов X; е £ и д ковекто-
ров fJe£, называют полилинейной формой,
если она линейна по каждому отдельно
взятому аргументу. Пару чисел (p,q) называют
типом полилинейной формы. Полилинейная
форма типа (1, 0) — это ковектор, а
полилинейная форма типа (0, 1) — это вектор.
Полилинейная форма типа (2, 0) — это
билинейная форма на £. Аналогично полилинейная
форма типа (0, 2) представляет собой
билинейную форму на £ .
Полилинейную форму <р(лс; /) типа (1,
1) можно рассматривать как линейный
оператор, действующий в £. Действительно, для
любого линейного оператора Л функция
Фл(■*,/) = /(Л(дс)) является полилинейной
формой типа (1,1). Наоборот, полилинейная
форма <р(лс;/) при фиксированном х
является вектором. Значит, возникает
отображение х —> ф(лс; /) из £ в £, оказывающееся
линейным оператором.
Множество Vpq полилинейных форм
типа (p,q) в £ является линейным
пространством относительно обычных операций
сложения функций и умножения функции на
число, dim Vpq = np+q .
Пусть е = [в\ ... еп) — базис в £, а
е =1е ... е" I — взаимный базис в £ . Тогда
для дс/ =Х/£| + ... + х"еп , i = \,p, и /' =
= f\le + ... + flnen, i = \,q, значение
полилинейной формы ф типа (p,q) равно
<р(*ь...,*,;/',...,/') =
'1=1 '> = 1>|=1 У<; = 1
Набор чисел (р^1'"/" = фЦ ,...,eip;
*Л .-У')
называют координатами
полилинейной формы.
В тензорном исчислении используют
правило суммирования по умолчанию, или
правило индексов: если в выражении какой-либо
верхний индекс и какой-либо нижний индекс
обозначены одинаково, то подразумевается,
что по этому индексу проводится
суммирование в пределах от единицы до размерности
линейного пространства, а знак I
суммирования опускается. Далее мы будем использовать
это правило.
Пусть Ь = (Ь\ ... Ьп) и с = (с| ... сп) -
базисы в £, а Ь* = (Ь1 ... Ьп ) и с =
= (с ... сп\ — базисы в £ , взаимные с Ь и
с. Если 6/ — матрица перехода из базиса Ь в
базис с, то координаты Ф)]"; полилинейной
i\.ip
формы ф в базисе с связаны с координатами
Ф;';Я этой же формы в базисе Ь соотноше-
i\...ip
ниями:
где lu'j ) = U — матрица перехода из базиса Ь
в базис с; lv'j)=V = U — матрица
обратного перехода (верхний индекс соответствует
номеру строки).
7.8.3. Тензоры. Говорят, что в п-мерном
линейном пространстве £ задан тензор типа
{Р>я) (Р Раз ковариантный, q раз контра-
вариантный)*, если каждому базису Ь в £
сопоставлена упорядоченная система чисел
а.]'". q(b), называемых компонентами тензо-
Ч •••'/> v '
ра, причем системы чисел, соответствующие
разным базисам Ь и с, связаны между собой
соотношениями:
aJx"JUc) = vh...vJqax"S4b)^...ui
l\-lp V > St Sq l\...rp V / ,, /
В литературе встречается и другой порядок
составляющих в типе тензора: для р раз ковариант-
ного и q раз контравариантного тензора тип
обозначают (q, p).
316
Глава 7.8. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ
где U = lu'j I — матрица перехода из базиса Ь
в базис с; V = Iv) I — обратная к U матрица
(верхний индекс у u'j и v'j обозначает номер
строки в матрице). Сумму p + q называют
валентностью тензора (или его рангом).
Тензор типа (p,q) образуют координаты
полилинейной формы типа (p,q), и любой
тензор можно интерпретировать как
совокупность координат некоторой полилинейной
формы.
Тензор типа (р,0) называют ковариант-
ным, а тензор типа (0,^) — контравариант-
ным. Тензор типа (p,q) смешанный (р раз
ковариантный и q раз контравариантный),
если р > 0, q > 0. Тензор типа (0, 0) называют
инвариантом, и он является скалярной
величиной. Тензор типа (0,1) образуют координаты
вектора. Ковектор (линейную форму) можно
рассматривать как тензор типа (1,0), а
линейный оператор — как тензор типа (1,1).
Символ Кронекера — это тензор Ъ1: типа
(1,1), который в любом базисе имеет значения
8J = 1 для любого / и S'j = 0 , если / Ф j .
Он соответствует тождественному линейному
оператору.
В евклидовом пространстве £ скалярное
произведение представляет собой билинейную
форму, т.е. тензор gy типа (2,0). Этот тензор
называют ковариантным метрическим
тензором. Роль такого тензора (иначе, скалярного
произведения) может играть любая
симметрическая билинейная форма, порождающая
положительно определенную квадратичную форму.
Евклидово пространство £ изоморфно
своему сопряженному £ , причем
изоморфизм, определяемый скалярным
произведением, не связан с выбором базиса. Этот
изоморфизм переносит скалярное произведение
из £ в £ , порождая тензор gJ типа (0,2).
Этот тензор называют контравариаитным
метрическим тензором. Компонентами кова-
риантного метрического тензора в данном
базисе е являются элементы матрицы Грома Г.
Матрицей контравариантного метрического
тензора glJ в е является матрица, обратная
матрице Грама.
7.8.4. Операции с тензорами.
Линейные операции. Суммой тензоров А- а. '". q и
'1 —1р
B = b.l".q типа (p,q) называют тензор
С—АЛ-В = с.1'". q с компонентами
/, ...1р
CJ\ "Jq
'1 -lp
= aJl~\Jq +ft*~/'
/, ...ip /, ...ip
Произведением тензора А = a. '.q на
i\ ...ip
действительное число X называют тензор ХА
с компонентами Ха. '". q . Множество &D a
1\...1р У>*
всех тензоров типа (p,q) в n-мерном линейном
пространстве £ относительно этих операций
является линейным пространством
размерности np+q .
Транспонирование. У полилинейной
формы можно переставить какие-либо два
аргумента одного типа (два вектора или два ко-
вектора). В результате мы получим, вообще
говоря, новую полилинейную форму.
Например, при перестановке аргументов
билинейной формы мы получаем новую билинейную
форму, матрица которой является
транспонированной к матрице исходной формы. Такая
операция не меняет билинейную форму лишь
в случае, когда эта форма симметрическая.
Транспонирование матрицы в тензорной
записи выглядит как перестановка местами
индексов, указывающих номер строки и
номер столбца.
Тензор В = Ь.]'". q , полученный из тен-
зора А = а. '". q перестановкой двух первых
/| ...1р
нижних индексов: Ь.'.'" ? =a.l.'q , назы-
i\i2...ip 124-ip
вают транспонированным к тензору А.
Транспонированными называют также тензоры,
полученные перестановкой любой другой
пары верхних или нижних индексов.
Пусть среди верхних индексов выбрана
группа из s индексов. Используя различные
перестановки в этой группе индексов, можно
расставить эти s индексов в любом порядке.
Операцию такой перестановки тоже называют
транспонированием, выделяя элементарное
транспонирование, заключающееся в
перестановке пары индексов.
Тензор называют симметрическим по
группе индексов, если он не изменяется при
ОПЕРАЦИИ С ТЕНЗОРАМИ
317
любой перестановке в этой группе индексов.
Тензор кососимметрический по группе индексов
{антисимметрический по группе индексов),
если при перестановке любой пары индексов
из группы он меняет знак. Симметрический
тензор — это ковариантный (контравариант-
ный) тензор, симметрический по группе всех
индексов. Аналогично понятие кососимметри-
ческого тензора, относящееся к ковариантным
или контравариантным тензорам.
Симметрирование и альтернирование.
Рассмотрим группу из г верхних (нижних)
индексов у тензора А типа (/?,#), где r<q (г <р).
Перестановкой этой группы индексов можно
получить г! тензоров А^ , а = (i[,..., ir),
включая исходный, соответствующий
тождественной перестановке (1, 2, ... , г). Тензор
As = —- V Aq будет симметрическим по
а
выделенной группе из г индексов. Описанную
операцию преобразования тензора,
приводящую к тензору, симметрическому по группе
индексов, называют симметрированием.
В частном случае пары индексов
симметрирование выглядит наиболее просто.
Например, для тензора а у симметрирование
состоит в получении нового симметрического
тензора (а*).. = (а*)„ = (ау + ам)/2 .
Аналогично тензор Аа = — х
IHt'U,
является кососимметрическим
по рассматриваемой группе индексов, и
операцию его получения называют
альтернированием по указанной группе индексов. В случае
тензора а у типа (2,0) альтернирование
выглядит наиболее просто:
Произведение тензоров. Произведением
тензоров А = a.l'.q и В = Ь}'" s, типов
(p,q) и (r9s) называют тензор С = А® В
типа (/? + r9q + s) с компонентами
y'l-Vi-d =ah-Jq bh-ls
i\...ipkx...kr ix...ip kx...kr '
Произведение тензоров не является
коммутативным, но умножение тензоров
является ассоциативным и дистрибутивным по
отношению к сложению.
Произведение тензоров открывает
возможность получать новые тензоры из
тензоров более низкой валентности. Используя
векторы и ковекторы, мы можем получать
тензоры любого типа. Однако не каждый
тензор может быть представлен в виде
произведения тензоров. Например, билинейная
форма, являющаяся произведением двух ковекто-
ров, имеет матрицу специального вида, ранг
которой равен единице. В качестве
контрпримера достаточно взять билинейную форму
с рангом, равным 2.
В то же время любой тензор типа (p,q)
может быть представлен в виде линейной
комбинации элементарных тензоров вида
х ®...®хр <8> jj®...®yg , являющихся
произведением р ковекторов х1 и q векторов jy .
Свертывание. Сверткой тензора
A-a}".q типа (p,q) по одному верхнему
ч ~lp v '
и одному нижнему индексам, например по
индексам /j и j[, называют тензор
В = Ь2'". q типа (р - l,q - 1) с компонен-
тами b2".q = a2".q (наличие одинаковых
12 —1р К12 ~1р
верхнего и нижнего индексов
предусматривает суммирование по этому индексу).
Сверткой тензора типа (1,1) является
тензор валентности 0, т.е. инвариант. Тензор
типа (1,1) представляет собой совокупность
элементов матрицы линейного оператора, а
его свертка — это сумма диагональных
элементов матрицы оператора, т.е. не что иное,
как след матрицы линейного оператора,
который от выбора базиса не зависит.
Говорят также о свертке двух тензоров,
подразумевая под этим свертку произведения
этих тензоров, причем один из двух индексов?
по которым выполняется свертка, относится к
первому тензору, а второй -— ко второму.
Например, выражение аиЬ™ означает свертку
тензоров А типа (2,1) и В типа (1,2), в
результате которой получается тензор типа (2,2).
Свертка может выполняться по
нескольким парам индексов. Например,
произведением тензора а{ типа (1,1) на себя будет
тензор а\ а^ типа (2,2). Это произведение
можно свернуть по двум парам индексов.
Получим инвариант (тензор типа (0,0))
318
Глава 7.8. ЭЛЕМЕНТЫ ТЕНЗОРНОЙ АЛГЕБРЫ
а{ a'j, который называют инвариантом
второго порядка в отличие от инварианта
первого порядка — следа линейного оператора.
Отметим, что другой вариант свертки по двум
парам индексов а\ aj дает квадрат
инварианта первого порядка.
В евклидовом пространстве выделен ко-
вариантный метрический тензор gy и кон-
травариантный метрический тензор g'J .
Свертка тензора А типа (p,q) с gy приводит
к тензору типа (/7 + 1,^-1) и представляет
собой операцию опускания индекса тензора, а
свертка А с glJ приводит к тензору типа
(р-1,<7 + 1),т.е. к поднятию индекса тензора.
Компоненты метрического тензора в
ортонормированием базисе составляют единичную
матрицу. Поэтому в таком базисе опускание
(поднятие) индекса выглядит как простая
перестановка индекса сверху вниз (снизу
вверх), т.е. различие между верхними и
нижними индексами исчезает. Если
рассматривается евклидово пространство и в нем только
ортонормированные базисы, то все индексы
можно записывать или только вверху, или
только внизу. Возникающий при этом объект
называют евклидовым тензором.
Поливекторы. Поливекторами
(мультивекторами) называют ковариантные и контра-
вариантные косоеимметрические тензоры.
Контравариантный кососимметрический
тензор типа (0,<7) называют также ^-вектором, а
ковариантный кососимметрический тензор
типа (р,0) — /ьформой. В частном случае
2-форма, т.е. кососимметрический тензор
типа (2,0), представляет собой кососимметри-
ческую билинейную форму с кососимметриче-
ской матрицей. Валентность ненулевого
поливектора не может превышать размерности п
линейного пространства.
У любого кососимметрического тензора
имеются компоненты, которые различаются
лишь знаком или совпадают. Чтобы
определить тензор, достаточно указать те
компоненты, у которых индексы упорядочены,
например, по возрастанию. Таких ведущих
компонент у кососимметрического тензора валент-
ности р имеется СЦ = —; г-.
р\(п- р)\
Произведение АВ кососимметрического
тензора А типа (р,0) на кососимметрический
тензор В типа (/*,0) будет тензором типа
(/? + /*,0), который является кососимметри-
ческим по первым р индексам и по
последним г индексам, но не по всем индексам
вместе. Чтобы получить кососимметрический
тензор, нужно выполнить операцию
альтернирования по всем индексам. В результате
получится кососимметрический тензор С типа
(р + /%0), который обозначают АлВ и
называют внешним произведением тензоров А и
В.
СПИСОК ЛИТЕРАТУРЫ
1. Беклемишев Д.В. Курс аналитической
геометрии и линейной алгебры. 4-е изд., пе-
рераб. М.: Наука, 1980. 336 с.
2. Воеводин В.В. Линейная алгебра. М.:
Наука, 1980.
3. Гельфанд И.М. Лекции по линейной
алгебре. М.: Наука, 1971. 272 с.
4. Ильин В.А., Позняк Э.Г. Линейная
алгебра. М.: Наука, 1984. 296 с.
5. Канатников А.Н., Крищенко А.П.
Линейная алгебра: Учеб. для вузов. 2-е изд. /
Под ред. B.C. Зарубина, А.П. Крищенко. М.:
Изд-во МГТУ им. Н.Э. Баумана, 2001. 336 с.
(Сер. Математика в техническом
университете; Вып. IV).
Раздел 8
ДИФФЕРЕНЦИАЛЬНАЯ ГЕОМЕТРИЯ
Дифференциальной геометрией называют
дисциплину, в которой для изучения
геометрических объектов применяют наряду с
другими методами методы дифференциального
исчисления. Для этого на геометрическом
объекте вводят координаты и рассматривают
характеристики объекта, представляющие
собой функции этих координат.
Одним из недифференциальных
методов, применяемых в геометрии, является
групповой метод. Главную роль в нем играют
группы преобразований объекта,
сохраняющие исследуемые свойства. Если некоторая
характеристика объекта сохраняется при
преобразованиях из данной группы, то эту
характеристику называют инвариантной, или
инвариантом относительно данной группы
преобразований. Именно инварианты используют
для описания исследуемых свойств объектов.
При этом стараются выделить такой
минимальный набор инвариантов, который
определяет объект однозначно.
В теории пространственных кривых и
поверхностей такую группу преобразований
образуют движения пространства, т.е. такие
его преобразования, при которых
сохраняются расстояния между точками. Любое
движение пространства — это либо поворот, либо
преобразование симметрии относительно
плоскости, либо параллельный перенос, либо
композиция указанных преобразований.
Таким образом, мы не различаем объект
(кривую или поверхность) L и объект Ц,
полученный из L поворотом, симметрией или
параллельным переносом.
Для описания свойств кривых и
поверхностей вводят характеристики, инвариантные
относительно движений пространства. Для
кривых — это кривизна и кручение, для
поверхностей — это первая и вторая
квадратичные формы. Эти характеристики однозначно
определяют кривую (соответственно
поверхность), т.е. две кривые (поверхности), у
которых совпадают указанные характеристики,
преобразуются одна в другую движением
пространства.
Глава 8.1
ГЕОМЕТРИЯ КРИВЫХ
Термины «кривая» и «поверхность»
широко используют в математике и технических
науках, и при этом им придают различное
толкование. Здесь мы изложим
дифференциально-геометрическое толкование.
8.1.1. Гладкая кривая. Фиксируем в
пространстве прямоугольную систему
координат Oxyz с ортонормированным базисом /, у,
к. Каждой точке пространства сопоставим ее
координаты и отождествим его с R .
Кривой у называют образ интервала
(a,b)<zR при непрерывном его отображе-
нии в пространство R . (Здесь возможно
а = -сю и (или) b = + сю ). Одну и ту же
кривую можно представить с помощью
непрерывных отображений различными способами.
Выбор какого-либо конкретного отображения
определяет параметризацию кривой.
Параметризованной кривой называют
непрерывное отображение интервала (а,Ь) в
R . Векторную форму этого отображения:
r(t) = x(t)i + y(t)j + z{t)k, te(a,b), (8.1.1)
называют векторной функцией
параметризованной кривой, а аргумент t отображения —
параметром параметризованной кривой.
320
Глава 8.1. ГЕОМЕТРИЯ КРИВЫХ
Кривая может быть представлена как
линия пересечения двух поверхностей. Такое
представление соответствует заданию кривой
системой двух уравнений
Fl(x,y,z) = 0, F2(x,y,z) = 0. (8.1.2)
Для получения параметризации такой кривой
(возможно, только части кривой) достаточно
взять в качестве параметра одну из координат
(например, х) и из системы (8.1.2) выразить
через этот параметр остальные координаты (у
и z).
Концевыми точками кривой у называют
две точки с радиус-векторами
lim r(t) и lim r(t),
/->о+ ' t-*b- v'
где r(t), te(a,b) — векторная функция
какой-либо параметризации кривой у .
Кривую называют гладкой, если
существует такая ее параметризация (8.1.1), что
векторная функция /*(/) имеет непрерывные
производные в каждой точке интервала
(а,Ь).
Точку Р гладкой кривой у называют
регулярной точкой кривой у , если при
некотором выборе параметризации векторная
функция r(t) имеет в окрестности Р
ненулевые непрерывные производные. Кривую,
состоящую из регулярных точек, называют
регулярной.
8.1.2. Длина дуги спрямляемой
кривой. Если Р[ и Pi — точки кривой у или
ее концевые точки, то дугой Р\Р2 кривой у
называют кривую, состоящую из точек
кривой у , лежащих между /\ и Р2 .
Ломаной, вписанной в кривую у ,
называют кривую, состоящую из отрезков PqP[ ,
Р[Р2, ... , Рп-\Рп , где Pq и Рп — концевые
точки кривой у , а Р[ , Р2 , ... , Рп_\ ~
точки, лежащие на кривой у .
Длиной L(y) кривой у называют предел
длины ломаной, вписанной в кривую у , при
условии, что длина наибольшего звена этой
ломаной стремится к нулю. Если указанный
предел существует и не зависит от способа
выбора вписанных ломаных, то дугу называют
спрямляемой.
Гладкая кривая всегда спрямляема, и ее
длина Z(y) может быть вычислена по
формуле
L(y) = ]ilx2+y2+z'2dt.
а
Параметризацию кривой у называют
натуральной (или естественной), если в
качестве параметра взята длина дуги кривой.
Иначе говоря, параметризация определяется
таким отображением s -> P(s) интервала
(0, b) в R3 , что длина дуги P(0)P(s) равна
s , а Р(0) есть концевая точка кривой у .
Натуральный параметр обозначают через s .
_ dr (dx dy dz\
Вектор — = —,-^-,— является единич-
ds \ds ds ds)
ным, и он ортогонален вектору
d2r = (d2x d2y d2z)
ds2 (ds2 ' ds2 ' ds2 )
8.1.3. Касательная к кривой.
Касательной к кривой у в ее точке Р называют
прямую, являющуюся предельным
положением секущей, проходящей через Р и через
отличную от нее точку Pj этой кривой, при
стремлении Р± к Р .
В регулярной точке кривой касательная
существует. Уравнение касательной к кривой с
параметризацией (8.1.1) в регулярной точке
^(*(ь.К(ъ£о) имеет вид
* ~ Хр = У - Ур = Z - Zp
*'(>о) у {to) z\t0) '
где /о — значение параметра,
соответствующее точке Р, т.е. x(t0) = х0 , y(t0) = у0 ,
г('о) = *о •
8.1.4. Соприкасающаяся плоскость и
соприкасающаяся окружность.
Соприкасающейся окружностью кривой у в ее точке
Р называют предельное положение
окружности, проходящей через Р и две соседние
точки Ру и Р2 кривой, при стремлении Ру и
Р2 к Р . Плоскость этой окружности
называют соприкасающейся плоскостью кривой у в
точке Р ; она содержит касательную к кривой
ПЛОСКАЯ КРИВАЯ
321
у в точке Р . Внутренность
соприкасающейся окружности называют кругом кривизны
кривой у в точке Р , а радиус (центр)
соприкасающейся окружности — радиусом (центром)
кривизны кривой у в точке Р .
Кривая у имеет в точке Р
соприкасающуюся плоскость, если существует такая
ее параметризация (8.1.1), что /0 ~ значение
параметра, соответствующего точке Р ,
векторная функция r(t} имеет в точке /q
непрерывную вторую производную и векторы
r'(t0) = (x'(t0),y'(t0),z'{tQ)) и /'(/„) =(х"(/0)>
у (/o),Z (<*о)) неколлинеарны. В этом случае
уравнение соприкасающейся плоскости кривой
у имеет вид
(Л-г(/о),г>о)/'(/о)) = 0,
где R — радиус-вектор произвольной точки
соприкасающейся плоскости.
8.1.5. Подвижный трехгранник. Нор-
малью кривой у в точке Р называют любую
прямую, проходящую через точку Р
перпендикулярно к касательной к кривой у в точке
Р .
Нормальной плоскостью кривой у в
точке Р называют плоскость, проходящую через
точку Р перпендикулярно к касательной.
Главной нормалью кривой у в точке Р
называют нормаль, лежащую в
соприкасающейся плоскости кривой у в точке Р .
Бинормалью кривой у в точке Р
называют прямую, проходящую через точку Р
перпендикулярно к соприкасающейся
плоскости кривой у в точке Р .
Спрямляющей плоскостью кривой у в
точке Р называют плоскость, проходящую
через касательную к кривой у в точке Р
перпендикулярно к соприкасающейся
плоскости.
Соприкасающаяся, нормальная и
спрямляющая плоскости кривой у в точке
Р называются подвижным трехгранником
(или основным триэдром) кривой у в точке Р
(рис. 8.1.1). Подвижный трехгранник
определяется тройкой единичных векторов t,n,b,
отложенных от точки Р и направленных
соответственно по касательной, главной нор-
Касательная
Бинормаль
Рис. 8.1.1
мали и бинормали. Направление этих
векторов зависит от выбора параметризации
кривой. В случае натуральной параметризации
они выражаются через производные
векторной функции r(s) следующим образом:
t = — (единичный касательный вектор),
ds
= 1 d2r
П~ k ds2
(единичный вектор главной нор-
ds"
мали),
Ъ = t х /i (единичный вектор бинормали),
где к — кривизна кривой у в точке Р . Три
вектора t,n,b называют сопутствующим
репером (или сопровождающим базисом Френе)
кривой у в точке Р .
8.1.6. Плоская кривая. Кривую у
называют плоской, если она лежит в некоторой
плоскости пространства R .
Соприкасающаяся плоскость плоской кривой Y в любой ее
точке совпадает с плоскостью, в которой
лежит кривая Y • Выбор координат x,y,z на
R таким рбразом, что х,у являются
координатами на данной плоскости, а также
выбор параметризации кривой позволяет задать
плоскую кривую уравнениями:
х = *(/), У = y{t\ te(a,b). (8.1.3)
Уравнение касательной к плоской
параметризованной кривой (8.1.3) в регулярной
точке Р(хо,Уо) имеет вид
х-хр =у-у0
*'('о) /Со) '
11 - 7705
322
Глава 8.1. ГЕОМЕТРИЯ КРИВЫХ
а уравнение главной нормали —
x(tQ\x - х0) + у'(ьХу ~ Уо) = 0,
где /q — значение параметра,
соответствующее точке Р , т.е. x(tQ) = х0 , y(tQ) = у0 .
8.1.7. Кривизна кривой. Кривизной
регулярной кривой у в точке Р называют
неотрицательное число к , равное пределу отно-
шения — при Q -> Р , где # — меньший
As
из углов между двумя касательными кривой
у в точках Р и Q , a As — длина дуги
PQ.
Кривизна регулярной кривой у ,
заданной дважды непрерывно дифференцируемой
векторной функцией г(/), может быть
вычислена по формуле
|г'(/)х/»|
в случае натуральной параметризации
*w-K«l
и связана с радиусом кривизны р(/)
формулой
Кривизна к плоской кривой с
параметризацией (8.1.3) может быть вычислена по
формуле
к =
\х'у"-х"у]
J*'2*/2}
,2\3/2'
отношения — при Q -> Р, где Ь —
As
меньший из углов между соприкасающимися
плоскостями кривой у в точках Р и Q , а
As — длина дуги PQ . Угол # считается
положительным, если, скользя по кривой в
направлении увеличения параметра,
соприкасающаяся плоскость вращается по часовой
стрелке, и отрицательным, если - против
часовой стрелки.
Кручение регулярной кривой у ,
заданной трижды непрерывно дифференцируемой
векторной функцией rty, вычисляется по
формуле
\r{t)xr{t\
а в случае натуральной параметризации
г-ф)-
"(*)■
(r\s),r\s),r"\s))
уц2
8.1.9. Формулы Френе. Векторы
t,n,b сопутствующего репера кривой
удовлетворяют соотношениям
f® ■
ds
— = kn, — = -kt + Xb,
ds ds
-K/l,
а кривизна к графика функции у = f(x) -
по формуле
к=-
О*/'2)
,2\3/2 '
8.1.8. Кручение кривой. Кручением
(или второй кривизной) регулярной кривой у в
точке Р называют число К, равное пределу
где к и К — кривизна и кручение кривой, а
S — натуральный параметр. Эти
соотношения называются формулами Френе. Им можно
придать следующий механический смысл. При
возрастании s точка Р движется по кривой
у и при этом:
1) касательная вращается вокруг
мгновенного положения бинормали с
положительной угловой скоростью, равной кривизне к ;
2) бинормаль вращается вокруг
мгновенного положения бинормали с угловой
скоростью, равной кручению К;
3) трехгранник вращается как твердое
тело вокруг мгновенной оси, направление
которой определяется вектором Дарбу
Q = Kt + kb, с положительной угловой
скоростью, равной |ft| = vN + к (полная
кривизна кривой у в точке р ).
Из формул Френе следуют три важных
факта:
ГЛАДКАЯ ПОВЕРХНОСТЬ
323
1) кривая является плоской тогда и
только тогда, когда ее кручение в каждой
точке равно нулю;
2) кривая является прямой линией тогда
и только тогда, когда ее кривизна в каждой
точке равна нулю;
3) гладкая кривая однозначно
определяется с точностью до движений пространства
своими кривизной и кручением.
Точная формулировка последнего
утверждения следующая. Пусть заданы две
гладкие функции k(s) и N(.s) при а < s < b
и функция k(s) не равна нулю для всех s .
Тогда в пространстве существует регулярная
кривая, для которой k(s) является
кривизной, a N(s) — кручением. Таких кривых
несколько, любые две преобразуются одна в
другую движением пространства.
Глава 8.2
ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
8.2.1. Гладкая поверхность. Если
функция многих переменных f'.AczR" -> Rm
является инъекцией, то на множестве
В = f(A) определено обратное отображение
/~ : В -> А , представляющее собой
функцию многих переменных. Если обе функции
f и /~ непрерывны в своих областях
определения (т.е. на множествах соответственно
А и В ), то функцию / называют
гомеоморфизмом.
Фиксируем прямоугольную систему
координат Ouv на некоторой плоскости и
отождествим плоскость с R . Пусть (/с! —
открытое множество на плоскости,
Ф: U —> R — некоторый гомеоморфизм.
Будем говорить, что этот гомеоморфизм
задает в пространстве поверхность S = Ф(£/)
(рис. 8.2.1).
Каждая точка Р е S является образом
только одной точки Мр € U . Координаты
и, v точки Мр = Ф~ (/*) в системе
координат Ouv будем называть координатами тонки
Р на поверхности S или внутренними
координатами точки Р . Если x,y,z —
координаты точки Р , то
vi
0
!
«' \
\ и:
U
ф
Рис. 8.2.1
х = х(и,v\ у = y(u,v), z = z(u,v), (и,v) e U ,
(8.2.1)
где x(u,v),y(u,v),z(u,v) являются коорди-
натными функциями функции Ф: U -> R .
Уравнения (8.2.1) называют параметрически-
ми уравнениями поверхности S. Поверхность
S можно также задать векторным уравнением
г = Ф(и,и), если значение функции Ф в
точке (u,v) интерпретировать как радиус-
вектор точки Р(х\y\z).
В случае, когда поверхность задана
уравнением вида
H(x,y,z) = 0,
(8.2.2)
для получения параметрических уравнении
поверхности (возможно, только части
поверхности) достаточно взять в качестве
параметров и и v две координаты пространства R
(например, х и у) и из уравнения (8.2.2)
выразить третью координату (z ) через эти
координаты.
В этой главе мы будем изучать только
локальные свойства поверхности, т.е. свойства
той части поверхности, которая лежит в
достаточной близости от заданной точки. Это
позволяет рассматривать поверхность по
частям, представляя каждую часть в виде образа
своего гомеоморфизма.
Пример 8.2.1. Рассмотрим прямой кру-
говой цилиндр х + у = Я (рис. 8.2.2).
Этот цилиндр без прямой х = Я, у = 0
можно задать параметрическими уравнениями
х - Я cos ф , у = Я sin ф , z - t,
(8.2.3)
ф е (0,2л), / € R .
Чтобы рассмотреть ту часть цилиндра,
которая содержит прямую х = Я , у = 0 , можно
II*
324
Глава 8.2. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Рис. 8.2.2
взять те же уравнения (8.2.3), изменив область
изменения координат: ф е (-я, л), t e R .
Поверхность S будем называть гладкой,
если она определяется функцией
Ф: [/cR -> R , дважды непрерывно
дифференцируемой на множестве U . Точку
(*0» .Уо»£о) гладкой поверхности S
называют регулярной, если в точке (wq,^o) =
= Ф~ (xq ,yo,Zo) ран г матрицы Якоби
Ф (#0,^0) Функции Ф, задающей эту
поверхность, равен двум. В этом случае векторы
частных производных
(x'u(uQ,v0))
Гц{"0,Щ)-
l(wo^o):
хТ)
4("o^o)J
совпадающие со значениями частных
производных ф'нЦ^о) и ФуЦ^о) Функции
ф(и, v) в точке (uq,Vq) , линейно
независимы. Регулярной поверхностью будем называть
гладкую поверхность, у которой все точки
регулярные.
8.2.2. Касательная плоскость и
нормаль к поверхности. Касательной плоскостью
к поверхности S в точке Р е S называется
плоскость, проходящая через точку Р ,
которая содержит все касательные к кривым,
проходящим через точку Р и лежащим на
поверхности S.
Касательная плоскость к поверхности S
в ее регулярной точке Р существует.
Уравнение этой плоскости имеет вид
(R - *b)ru(uQivoyv(uQiv0) = 0 , (8.2.4)
где xyz — смешанное произведение векторов
х, у, z, R — радиус-вектор произвольной
точки; ff) — радиус-вектор точки Р ; Uo,Vq —
внутренний координаты точки Р .
Нормалью к поверхности S в точке
Р е S называется прямая, проходящая через
Р и перпендикулярная к касательной
плоскости. Направляющим вектором нормали
является нормальный вектор касательной
плоскости, т.е. вектор п = ru x rv .
8.2.3. Первая квадратичная форма
поверхности. Квадратичную форму
ds2 = Edu2 + IFdudv + Gdv2, (8.2.5)
где E = г2 , F = rurv , G = r* ,
представляющую квадрат дифференциала длины дуги
кривой на регулярной поверхности S как
функцию дифференциалов внутренних
координат поверхности, называют первой
квадратичной формой поверхности S. Эта форма
является инвариантом относительно движений
пространства. Коэффициенты E,F,G при
9 9
du , dudv и dv в ее записи называются
коэффициентами первой квадратичной формы
и зависят только от точки поверхности, в
которой рассматривается дифференциал
длины дуги, и никак не связаны с выбором дуги.
Форма (8.2.5) представляет собой
семейство квадратичных форм, определяемое двумя
действительными параметрами: в каждой
точке поверхности своя квадратичная форма. В
регулярной точке поверхности эта форма
положительно определена.
Пример 8.2.2. Плоскость является
частным случаем поверхности. Действительно,
выберем систему координат x,y,z в
пространстве так, чтобы уравнение плоскости
было £ = 0. Векторная функция ф(и,v) =
= (и v 0) , (и, v) e U = Ш2, задает
рассматриваемую плоскость. В этом случае
первая квадратичная форма плоскости есть
ds2 = du2 + dv2 .
ВТОРАЯ КВАДРАТИЧНАЯ ФОРМА ПОВЕРХНОСТИ
325
Пример 8.2.3. Первая квадратичная
форма прямого кругового цилиндра,
заданного параметрическими уравнениями (8.2.3),
имеет вид I = R d(p + dt . Перейдя к
новым координатам и = У?ф , v = t, получим,
как и в случае плоскости, I = du + dv .
Поверхности, у которых при некотором
выборе систем координат первые
квадратичные формы совпадают, называют изометрич-
пыми. Таким образом, прямой круговой
цилиндр и плоскость изометричны.
Рассмотрим следующие три задачи:
а) вычисление длины кривой на
поверхности;
б) вычисление угла между двумя
пересекающимися кривыми на поверхности;
в) вычисление площади некоторой
области на поверхности.
Эти задачи можно решать, используя
описание кривых или области во внутренних
координатах и , v , а также первую
квадратичную форму поверхности. При таком
подходе реальное положение поверхности в
пространстве не является существенным и
пространственные координаты не используются.
Длина кривой. Кривую на
поверхности S можно задать уравнениями
и = u(t), v = v(t) , t е [/, ,/2], (8.2.6)
где и и v — внутренние координаты на
поверхности S. Длина гладкой кривой (8.2.6)
может быть вычислена по формуле
t2 I
/у = J ^E[u(t)f + 2Fu\t)v\t) + G[v\t)fdt,
'i
(8.2.7)
где коэффициенты первой квадратичной
формы E,F,G вычисляются в точке
(w(/),l>(/)) и рассматриваются как функции
переменного / .
Угол между кривыми. Угол ф
между гладкими кривыми Y| и У2 >
лежащими на регулярной поверхности S и
пересекающимися в точке Р е S , равен углу между
их касательными векторами в этой точке (рис.
8.2.3). В случае, когда кривые заданы парами
уравнений и - #,(/) , v = u,-(f), / = 1,2 ,
верна формула
Рис. 8.2.3
СОБф =
Еи[и2 + F[u\V2 + u2v\\) + Gv\v2
+ 2Fu{v{ +Gv{ x
+ 2Fu2v2 + Gv2
в которой коэффициенты первой
квадратичной формы E,F,G вычисляются в точке
пересечения кривых, а производные i/j,Uj и
w2»y2 "~ ПРИ значениях параметров кривых,
соответствующих точке пересечения.
Площадь поверхности.
Площадь а регулярной поверхности S,
заданной отображением с областью определения
U с R , вычисляется по формуле
o = jj^EG-F2dudv.
и
8.2.4. Вторая квадратичная форма
поверхности. Из примеров 8.2.2 и 8.2.3
следует, что плоскость и цилиндр имеют
одинаковые первые квадратичные формы. Но эти
поверхности нельзя совместить друг с другом с
помощью движений пространства. Это
свидетельствует о том, что первая квадратичная
форма не определяет поверхность однозначно.
Введем еще одну характеристику поверхности.
Рассмотрим поверхность S, заданную
дважды непрерывно дифференцируемой
функцией ф(и, v). Пусть Р = Ф (wq , Vq ) - регулярная
точка поверхности. В касательной плоскости
п к поверхности S, построенной в точке
Р , выберем вектор х. Этот вектор является
касательным вектором к некоторой кривой у ,
лежащей на поверхности S и проходящей
через точку Р : если кривая у задана вектор-
функцией r(t) и /> = г(/0), то дс = г(/0).
326
Глава 8.2. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Рассмотрим функцию Q(x), которая вектору
х ставит в соответствие проекцию вектора
г (/о) на направление вектора ru x rv, где
Ъ = Ф«(Ць^о)» Ъ =&v{uo,v0) (рис. 8.2.4).
Вектор х касательной плоскости тс
может быть касательным вектором разных
кривых, лежащих на поверхности S. Значение
Q(x) не зависит от выбора кривой у, и
функция Q определена корректно. Точнее,
если х = оти + $rv , то Q(x) = La2 + 2Мх|3 +
+ N$2 , где
VEG - F2 ' 4EG - F2 '
N = . Грр1?/Гр • , (8.2.8)
4EG - F2
E,F,G — коэффициенты первой
квадратичной формы в точке Р, г1Ш = ФИМ(Ц),Ц)),
Ъи = Фии(Ц).Ц)). г™ = Ф^Ц.Ч)). 1/ =
Функцию Q(jc) , которая определена в
линейном пространстве векторов касательной
плоскости, построенной в данной точке Р ,
называют второй квадратичной формой
поверхности S. Величины L,M,N,
вычисленные по формулам (8.2.8), называют
коэффициентами второй квадратичной формы.
Как и в случае первой квадратичной
формы, вторую квадратичную форму можно
записать в дифференциалах переменных
координат и , v :
Рис. 8.2.4
Q = Ldu2 + 2Mdu dv + Ndv2 . (8.2.9)
Коэффициенты L,M,N второй
квадратичной формы зависят от точки
поверхности и представляют собой функции координат
и , v на поверхности. Движения
пространства не изменяют вторую квадратичную форму
поверхности, или, другими словами, вторая
квадратичная форма поверхности не зависит
от положения поверхности в пространстве.
Пример 8.2.4. Вторая квадратичная
форма плоскости равна нулю.
Пример 8.2.5. В случае цилиндра (8.2.3)
имеем Q = -Я dip . Значит, вторая
квадратичная форма цилиндра не обращается в нуль
ни в одной точке, и с помощью замены
координат на поверхности ее нельзя свести ко
второй квадратичной форме плоскости,
которая равна нулю во всех точках.
Отметим, что если первая квадратичная
форма в каждой точке поверхности
положительно определена, то вторая квадратичная
форма может иметь значения произвольного
знака. Она, например, может быть
вырожденной, как в примере 8.2.5, тождественно
равной нулю, как в примере 8.2.4, или
знакопеременной.
8.2.5. Классификация точек
поверхности. Вблизи регулярной точки поверхность
отличается от графика своей второй
квадратичной формой, деленной на 2, только на
элементы порядка малости выше второго. Для
точной формулировки этого факта введем
следующие понятия.
Если две поверхности Sy и S2
проходят через точку Р и имеют в этой точке
общую касательную плоскость п, то S\ и 5*2
называют поверхностями, касающимися в
точке Р . Восстановим перпендикуляр в
произвольной точке А касательной плоскости к
до пересечения с поверхностями S[ и S2 в
точках соответственно Р[ и Р2 (рис. 8.2.5).
Тогда для некоторых значений г > 1 верно
соотношение
\РхР2\ = о{\РЛ\г\а-^Р (8.2.10)
(во всяком случае это соотношение верно при
г = 1). Точную верхнюю грань таких значений
г назовем порядком касания поверхностей S\
и S2 в точке Р .
НОРМАЛЬНАЯ КРИВИЗНА ПОВЕРХНОСТИ
327
Рис. 8.2.5
Пример 8.2.6. Поверхность и касательная
плоскость касаются с порядком не менее 1.
Пусть S — регулярная поверхность, а
п — ее касательная плоскость в точке Р . В
каждой точке А касательной плоскости я
восстановим перпендикуляр и отложим на
нем отрезок АР\ длиной, равной половине
модуля значения квадратичной формы Q на
векторе РА . Отрезок расположим по одну
сторону с вектором ru х rv относительно
касательной плоскости к, если значение
Q\ PA положительно, и по разные стороны,
если это значение отрицательно. Множество
точек Р[ для различных А ек образуют
поверхность, которую называют
соприкасающимся параболоидом поверхности S в точке
Р.
Векторное уравнение соприкасающегося
параболоида имеет вид
г = Ц) + arM + pry + -Q(a,РК ,
где г — радиус-вектор произвольной точки в
пространстве; Fft — радиус-вектор точки Р ;
->
(Х,Р — координаты вектора РА в базисе ги ,
rv ; G(ot,P) — вторая квадратичная форма,
/1° — орт вектора ги X rv. Числа а и Р
можно рассматривать как внутренние
координаты на соприкасающемся параболоиде.
Соприкасающийся параболоид является
поверхностью второго порядка. Тип этой
поверхности определяется типом квадратичной
формы. В то же время поверхность S и ее
соприкасающийся параболоид в точке Р
касаются в этой точке с порядком не менее 2.
А значит, в окрестности точки Р
поверхность S во многом определяется своим
соприкасающимся параболоидом. И поэтому
точки поверхности различают по типу
соприкасающегося параболоида.
Точку Р поверхности S называют
эллиптической, если соприкасающийся
параболоид в этой точке есть эллиптический
параболоид. Точка Р гиперболическая, если
соприкасающийся параболоид есть
гиперболический параболоид. Наконец, точка Р
параболическая, если соприкасающийся
параболоид есть параболический цилиндр. Отдельно
выделяется случай, когда соприкасающийся
параболоид поверхности совпадает с
касательной плоскостью. В этом случае точку Р
называют точкой уплощения.
Тип точки можно определить по дискри-
минанту D = LN - М второй квадратичной
формы. При D > О точка эллиптическая, при
D < О она гиперболическая, а при D = О и
L + N Ф О — параболическая. В точке
уплощения вторая квадратичная форма
поверхности равна нулю.
Пример 8.2.7. У эллипсоида и
двуполостного гиперболоида все точки
эллиптические, у однополостного гиперболоида все
точки гиперболические. У любого цилиндра
(эллиптического, гиперболического,
параболического) все точки параболические.
В эллиптической точке поверхности
касательная плоскость лежит по одну сторону от
поверхности (точнее, от ее части в некоторой
окрестности точки, рис. 8.2.6, а). А если точка
гиперболическая, то касательная плоскость
расположена частично с одной стороны
поверхности, частично с другой, пересекаясь с
поверхностью по двум кривым (рис. 8.2.6, б).
а) б)
Рис. 8.2.6
8.2.6. Нормальная кривизна
поверхности. В регулярной точке Р поверхности S
построим плоскость, проходящую через
нормаль к поверхности S в точке Р
параллельно заданному вектору / в касательной
плоскости. Эта плоскость пересекает поверхность S
по некоторой кривой у/ , которую называют
нормальным сечением поверхности S в точке
Р в направлении вектора / (рис. 8.2.7).
Кривизну нормального сечения в точке Р
называют нормальной кривизной поверхности S в
точке Р в направлении вектора /. При этом
328
Глава 8.2. ГЕОМЕТРИЯ ПОВЕРХНОСТЕЙ
Рис. 8.2.7
кривизну берут со знаком плюс (по модулю),
если направление вектора главной нормали V/
кривой У/ совпадает с направлением вектора
п ~ ru x rv » нормального к поверхности. В
противном случае нормальная кривизна имеет
отрицательное значение.
Нормальная кривизна кп поверхности
S в точке Р в направлении вектора /
касательной плоскости к поверхности S может
быть вычислена по формуле
Ео? + 2/чхр + GP2
где а,р — координаты вектора /в базисе ги ,
rv , a E,F,G и L,M,N - коэффициенты
соответственно первой и второй квадратичных
форм поверхности 5.
Кривизна произвольной кривой у » ле_
жащей на поверхности S, в точке Р
вычисляется по формуле Менье*
к = -
cos О
где кп — нормальная кривизна поверхности
S в точке Р в направлении касательного
вектора кривой у в этой точке, а О — угол
между главным нормальным вектором у и
нормальным вектором к поверхности в точке
Р.
8.2.7. Главные направления и главные
кривизны поверхности. В регулярной точке
поверхности нормальная кривизна достигает
своего наименьшего и наибольшего значений.
Регулярную точку поверхности, в которой
нормальная кривизна имеет одно и то же
*Ж. Менье (1754-1793) — французский матема-
значение в любом направлении, называют
омбилической (или точкой округления).
Остальные регулярные точки называются
неомбилическими.
Наибольшее и наименьшее значения к\
и &2 нормальной кривизны в данной точке
называют главными кривизнами поверхности в
этой точке. В омбилической точке к± = к2 . В
неомбилической точке &j * k2, и
направления, в которых нормальная кривизна
достигает своих наибольшего и наименьшего
значений, называют главными направлениями в
данной точке. В неомбилической точке
существуют ровно два главных направления,
причем эти направления взаимно
перпендикулярны. В омбилической точке поверхности
будем называть главными любые два взаимно
перпендикулярных направления.
Главные кривизны поверхности S в
регулярной точке Р являются корнями
уравнения
L-kE M-kF\
M-kF N-kG
О,
(8.2.12)
где E,F,G — коэффициенты первой, a L,
М , N — коэффициенты второй
квадратичных форм поверхности в точке Р .
Координаты а,р в базисе ru , rv вектора главного
направления со значением главной кривизны
ki удовлетворяют системе линейных
алгебраических уравнений
(L-kiE)a + (M-kiFf = 0,
(М - ktF)a + {N- Щ$ = 0.
(8.2.13)
8.2.8. Внутренняя и внешняя
геометрии поверхности. Можно представить себе
поверхность, сделанную из нерастяжимого
материала. Тогда при деформировании этой
поверхности (если она возможна) длины
кривых, площади не будут меняться, но
поверхность при этом может изгибаться. Например,
цилиндрическая поверхность может быть
получена из плоскости в результате такого
деформирования. Математическая
формулировка понятия изгибания следующая.
Пусть Р\ и Pi — точки поверхности
S. Расстоянием по поверхности между
точками Pj и Pi называют наименьшую из длин
кривых, лежащих на поверхности S и
имеющих концы в точках Р\ и Р2 . Изгибани-
ПОНЯТИЕ МНОГООБРАЗИЯ
329
ем поверхности называют такое ее
отображение в другую поверхность, при котором не
изменяются расстояния по поверхности
между любыми двумя ее точками. Иначе говоря,
изгибание — это деформация поверхности без
сжатий и растяжений.
Внутренней геометрией поверхности
называют совокупность геометрических свойств
поверхности, сохраняющихся при ее
изгибаниях. Например, внутреннюю геометрию
плоскости изучает планиметрия. Все
геометрические факты о поверхности, которые
можно получить при помоши ее первой
квадратичной формы, и только они составляют
внутреннюю геометрию поверхности.
Плоскость и цилиндр имеют одинаковые первые
квадратичные формы, а значит, имеют
одинаковые внутренние геометрии.
Свойства поверхности, связанные с
взаимным расположением ее частей в
объемлющем пространстве, называют внешней
геометрией поверхности. К внешней геометрии
относят все свойства поверхности, которые не
изучаются в рамках внутренней геометрии, в
частности, искривленность поверхности.
Поверхность однозначно определяется
своими первой и второй квадратичными
формами. Точнее, если на двух поверхностях
можно выбрать координаты, в которых первая
и вторая квадратичные формы первой
поверхности совпадают соответственно с первой
и второй квадратичными формами второй
поверхности, то эти две поверхности можно
совместить движением пространства.
Глава 8.3
ГЛАДКИЕ МНОГООБРАЗИЯ
Здесь и в следующей главе мы изучаем
понятия, определяемые на любых
геометрических объектах (пространствах, поверхностях и
т.д.), на которых задана система координат.
Точное определение "объектов, допускающих
введение координат" приводит к понятию
гладкого многообразия.
8.3.1. Понятие многообразия. Картой
(локальной системой координат) на
произвольном множестве М называют пару
(U ,/*), где U — подмножество М , а И —
взаимно однозначное отображение U на
некоторую область пространства R" .
Подмножество U называют областью определения
(или носителем) карты, число п —
размерностью карты, а координаты точки h^P) в Rn —
координатами точки Р е М в локальной
системе координат (U, /*) .
Существует различие в введении
координат в теории кривых и поверхностей и в
теории многообразий. В первом случае (см.
гл. 8.1 и 8.2) координаты вводят
отображением из области пространства R" на
соответствующее подмножество пространства R , т.е.
на кривую при п - 1 или на поверхность при
я = 2. Во втором случае (см. гл. 8.3 и 8.4)
оперируют обратными отображениями из
множества М в область изменения
координат. Это различие несущественно, так как и
те и другие отображения предполагаются
взаимно однозначными. Оно лишь отражает
сложившиеся традиции в этих теориях.
Другое отличие указанных теорий
заключается в том, что на многообразии вводят
несколько систем координат, полностью
покрывая его картами (рис. 8.3.1). Это позволяет
рассматривать многообразие Л/ как единый
объект, по необходимости переходя от одной
системы координат к другой в тех частях Л/ ,
где действуют несколько систем координат.
Карты (U,Л) и (УЛ) на Л/ , носители
которых пересекаются по непустому
множеству W = U f)V , называют согласованными,
если множества h(\V} и k{\V} являются
открытыми в R" , а взаимно обратные
функции многих переменных к о h и Л о к
являются гладкими* (рис. 8.3.2). Карты,
носители которых не пересекаются, также будем
считать согласованными.
Рис. 8.3.1
Рис. 8.3.2
* Гладкими класса /• называются функции,
непрерывно дифференцируемые г раз. Для простоты мы
будем рассматривать только бесконечно
дифференцируемые функции, т.е. г = ©о
330
Глава 8.3. ГЛАДКИЕ МНОГООБРАЗИЯ
Функции многих переменных ко И и
h о к называются отображениями перехода,
а их координатные функции — функциями
перехода. Если координаты точек в системе
координат (U,И) обозначить через х±, ... ,
хп , а в системе координат (У, к) — через
У[ , ... , уп , то отображения перехода можно
записать в виде
yi=yi(xl>~->xn)> ' = !.«.
xi=xi(yh...9yn), / = l,/i.
Здесь функции х,(^,...,уп) и ^(хь...,хл),
связывающие две системы координат, и есть
функции перехода.
Набор карт (^а,/^) на множестве М
называют атласом этого множества, если все
карты набора согласованы, имеют
одинаковую размерность, а их носители в
совокупности накрывают множество М, т.е.
LK = м.
а
Пример 8.3.1. Обозначим через х0 , Х[ ,
... , хп координаты в R и рассмотрим
множество Sn точек, координаты которых
удовлетворяют уравнению
JC(f+jc,2+...+x;J =1 . (8.3.1)
Множество Sn представляет собой п-
мерную сферу. Введем в Sn стереографические
координаты. Рассмотрим в R п-мерную
плоскость х0 = 0. Отметим на сфере S"
северный полюс N , имеющий координаты (1,
0, ..., 0), и южный полюс S с координатами
(—1, 0, ..., 0). Пусть Р — произвольная точка
сферы, отличная от N . Поставим точке Р в
соответствие точку Q пересечения прямой
NP с плоскостью Xq = 0 . Таким образом,
задано отображение h: U -> Rn , где U =
= Sn \{N}. Нетрудно показать, что это
отображение является взаимно однозначным и
тем самым вводит на /j-мерной сфере S"
карту (U,А) размерности п (на рис. 8.3.3
изображен двухмерный случай). Эта карта не
покрывает всю сферу, так как за пределами ее
носителя осталась точка N . Построим
аналогичным образом карту (V, А:), заменив
северный полюс N южным S. В этом случае
V = S"\{S}. Две карты (U,h) и (V,k) в
совокупности покрывают я-мерную сферу и
образуют ее атлас.
Пусть М — множество с заданным на
нем атласом. Для произвольной точки
Р е М можно выбрать карту (U,h), в
носитель которой входит точка Р. Множество
h(U) в Rn является областью и потому
открыто. Рассмотрим некоторую окрестность
О с h{U) точки А(Р). Полный прообраз
h~ (О) множества О назовем окрестностью
точки Р на множестве М .
Множество М с атласом удовлетворяет
условию отделимости, если любые две точки
множества М имеют непересекающиеся
окрестности (точки Р и Q на рис. 8.3.4).
Точки, имеющие непересекающиеся окрестности,
называют отделимыми точками. Таким
образом, условие отделимости на множестве М
означает, что любые две точки этого
множества являются отделимыми.
Так как любые две точки в R"
отделимы, то условие отделимости на множестве с
атласом может нарушаться только для тех пар
точек, которые нельзя накрыть одной картой
атласа.
Множество М с заданным на нем
конечным или счетным атласом*,
удовлетворяющее условию отделимости, называют
(гладким) многообразием. Размерность п карт
атласа, заданного на М , называют
размерностью многообразия М. При этом М
называют n-мерным многообразием.
Примеры: 1. Пространство Rn и любое
его открытое подмножество есть гладкие п-
мерные многообразия.
2. Сфера Sn с атласом из двух карт (см.
пример 8.3.1) является л-мерным
многообразием.
3. Регулярная гладкая кривая,
непересекающая сама себя, является одномерным
многообразием. В качестве координаты на
Атлас называют конечным (счетным), если
он, как множество карт, есть конечное или счетное
множество.
ГЛАДКИЕ ОТОБРАЖЕНИЯ МНОГООБРАЗИЙ
331
Рис. 8.3.3
Рис. 8.3.4
этом многообразии можно взять параметр
кривой.
4. Регулярная поверхность есть
двухмерное многообразие. Координаты этого
многообразия есть внутренние координаты на
поверхности.
5. Конфигурационное пространство
произвольной механической системы (в том
числе системы со связями), как правило,
является гладким многообразием. Его
размерность есть число степеней свободы системы.
На многообразии помимо карт из
заданного атласа можно вводить и другие карты.
Если карта (£/,/*) согласована со всеми
картами заданного атласа многообразия М , то
мы будем называть ее картой на многообразии
М . Множество всех карт на многообразии
М образует атлас, который содержит в себе
как часть изначально заданный атлас.
Совокупность всех карт на многообразии мы будем
называть максимальным атласом этого
многообразия, или гладкой структурой.
8.3.2. Гладкие отображения
многообразий. Пусть М и N — гладкие
многообразия и F : М —» N — некоторое отображение.
Предположим, что существуют карта (U,/*)
на многообразии М , накрывающая точку Р ,
и карта (У,1с) на многообразии N ,
накрывающая точку Q = F(P), для которых
F(U)aV . Тогда в области h(U),
содержащей точку h(P), определено «сквозное»
отображение /с о F о И~ , которое, как нетрудно
заметить, координатам точки в локальной
системе координат (U\Н) ставит в соответствие
координаты ее образа при отображении F в
карте (V, fc) (рис. 8.3.5). Если это
отображение является гладкой (бесконечно
дифференцируемой) функцией многих переменных в
некоторой окрестности точки И[Р) , то отображение
F называют гладким отображением в точке
Р . Отображение F называют гладким, если
оно является гладким в каждой точке
многообразия М .
Композиция гладких отображений
многообразий есть гладкое отображение
многообразий.
Диффеоморфизмом многообразия М на
многообразие N называют биективное
гладкое отображение М на N , обратное к
которому также является гладким. Многообразия
М и N , для которых существует
диффеоморфизм М на N , называют диффеоморф-
ными.
Диффеоморфизм многообразий
устанавливает взаимно однозначное соответствие
между картами двух многообразий. Это
означает, что диффеоморфные многообразия с
точки зрения их внутренней структуры не
различаются. Поэтому их, как правило,
отождествляют. Кроме того, диффеоморфизмы
многообразия М на М локально
представляют собой переходы от одних координат на
М к другим координатам. Поэтому мы
рассматриваем только характеристики
многообразия М , инвариантные относительно
группы диффеоморфизмов М на М . Они
характеризуют собственно многообразие М , а не
выбранную систему координат на нем.
Гладкой функцией на многообразии М
называют гладкое отображение из М в R .
Отметим, что на числовой оси R есть
естественный атлас из единственной карты.
Поэтому координатное представление функции
связывают не с парой карт (первая на много-
Рис. 8.3.5
332
Глава 8.3. ГЛАДКИЕ МНОГООБРАЗИЯ
образии М , вторая в R), а лишь с картой
на многообразии М. Множество гладких
функций на М будем обозначать через
C°°(Af). Операции сложения и умножения
гладких функций дают вновь гладкие
функции. Постоянные функции являются
гладкими. Умножение функции / е С°°{М} на
постоянную функцию g(x) з с, дающее
гладкую функцию на М , можно
интерпретировать как умножение функции на
действительное число. Множество C°°(Af) с
операциями сложения функций и умножения
функции на действительное число является
линейным пространством.
Если F'.M-tN - гладкое
отображение многообразий М и N , то отображение
F : С°°(N)-* С°°(М), определенное
формулой F (g) = g о F, является линейным
оператором, удовлетворяющим условию
F,(fg) = F,(f)F(g), f,geC~(M).
Кроме того, для любых гладких
отображений F:М -» N и G.N -» К имеет
место тождество
(G о F)* = F* о G*.
Отображение F множества гладких
функций на многообразии N в множество
гладких функций на многообразии М ,
порождаемое гладким отображением
F: М —» N , называют индуцированным
отображением.
Множество С°°(М) состоит из
функций, определенных на всем многообразии
М . Однако представляют интерес и
функции, которые определены лишь в некоторой
окрестности заданной точки многообразия.
Таковы, например, координатные функции
отображения И, которое на многообразии
М задает карту (U\Н) (такие функции
называются координатными функциями карты
((/,Л)). Если окрестность на многообразии
достаточно мала, то гладкую функцию,
заданную лишь в этой окрестности, можно
продолжить на все многообразие так, что
продолженная функция будет гладкой на всем
многообразии. В таких случаях функцию,
заданную локально, можно рассматривать как
элемент множества C°°(Af) .
8.3.3. Подмногообразия и задание
многообразий уравнениями. Пусть F:M ->
-> N — гладкое отображение /и-мерного
многообразия М в л-мерное многообразие
N . Рассмотрим произвольную точку
Р е М , карту (U\h) на многообразии М ,
накрывающую точку Р , и карту {V,k) на
многообразии N , накрывающую точку
Q = F(P}. В окрестности точки Р
отображение F имеет координатное представление
F},k = k о F о /Г , являющееся гладкой
функцией многих переменных, определенной
в окрестности точки h[P) e Rm со
значениями в R" . Ранг матрицы Я/соби функции F^
в точке h(P) не зависит от выбора карт
(U,h) и {V,к), а зависит только от выбора
точки Р и отображения F . Указанный ранг
называют рангом отображения F в точке Р .
Гладкое отображение F:M ~> N
химерного многообразия М в л-мерное
многообразие N называют вложением многообразия
М в многообразие N , если оно
удовлетворяет трем условиям:
1) это отображение является инъекцией;
2) обратное отображение F~[:F[M)-^
-> М непрерывно на множестве F(M);
3) ранг отображения в каждой точке
Р е М равен т.
Подмножество А многообразия М
называют подмногообразием многообразия М ,
если множество А является образом
некоторого вложения F. Ранг вложения F, т.е.
размерность области определения этого
вложения, называют размерностью
подмногообразия А .
Пример 8.3.2. Регулярная гладкая
кривая, непересекающая сама себя, и регулярная
поверхность являются подмногообразиями
многообразия R .
Всякое подмногообразие является
многообразием. Более того, подмногообразие
можно понимать как такое подмножество А
многообразия М, которое само является
КАСАТЕЛЬНЫЕ ВЕКТОРЫ
333
многообразием и его гладкая структура
согласована в смысле условий 1)-3) с гладкой
структурой М . При этом вложение F.A-*
—» М отображает каждую точку А в себя
как в точку М .
Во многих случаях многообразия
возникают как множество решений некоторой
системы, вообще говоря, нелинейных уравнений.
Нельзя утверждать, что произвольная система
нелинейных уравнений определяет
многообразие: множество решений такой системы
может состоять из частей разной размерности
или вообще быть пустым. Чтобы система
нелинейных уравнений определяла
многообразие, левые части уравнений должны
удовлетворять определенным условиям.
Пусть F:Rm -> Шк , т > к - гладкое
отображение и ceR . Если множество
Мс = F~ (с) решений уравнения F(x) = с
непусто и во всех его точках матрица Якоби
имеет максимальный ранг, равный к , то
множество Мс является подмногообразием
размерности т- к многообразия Шт.
Построение координат на многообразии Мс
связано с решением системы F(x) = с
относительно части переменных, причем решение
такой системы строится в целом по той же
схеме, что и решение системы линейных
алгебраических уравнений. А именно, в
заданной точке Р е Мс нужно вычислить матрицу
Якоби и выделить в ней базисный минор.
Этот минор позволяет разделить переменные
на две группы: базисные и свободные.
Свободные переменные и есть координаты в
окрестности точки Р на многообразии Мс .
8.3.4. Касательные векторы.
Касательным вектором в точке Р к я-мерному
многообразию М называют соответствие,
которое каждой локальной системе координат
в окрестности точки Р сопоставляет
упорядоченный набор из п чисел. При этом если
локальной системе координат Х[ , ... , хп
поставлен в соответствие набор чисел
0э1»---»£л)» а локальной системе координат
у,, ... , уп - набор чисел (гц,--,Лл)> то
выполняются соотношения
Л/=1|^К-.^%-./- = й, (8-3.2)
7=1 dXJ
где Xj , ... , хп — координаты точки Р в
системе координат Ху , ... , хп . Точку Р , с
которой связан касательный вектор, называют
точкой приложения касательного вектора,
набор чисел (^,..., £,„ ) — координатами
касательного вектора в системе координат Х\ ,
... , хп . Касательные векторы будем
обозначать греческими буквами с надстрочным
знаком «стрелка», например £ .
Для задания касательного вектора
достаточно указать координаты лишь в одной
локальной системе координат. Тогда его
координаты в другой системе координат можно
вычислить по формулам (8.3.2).
Касательный вектор £ можно также
задать, задав параметризованную кривую,
касательную к Ъ,. Более точно, гладким путем на
многообразии М (или гладкой
параметризованной кривой на многообразии М) будем
называть гладкое инъективное отображение
У '• {h'h) ~* M некоторого интервала (fi,^)
числовой оси в это многообразие. Образ
такого отображения будем называть гладкой
кривой на многообразии М . В оистеме
координат (U\И) гладкая параметризованная
кривая у определяет функцию Л о у из
интервала (t[J2) в ^П • Каждая гладкая
параметризованная кривая, проходящая через точку
Р - у (to) , определяет в точке Р
касательный вектор, координаты которого в системе
координат (U,Л) равны производным
векторной функции h о у в точке tQ . Этот
вектор называют касательным вектором к
гладкой параметризованной кривой у :(#,£)-> М
на многообразии М в точке Р .
Любой касательный вектор к
многообразию М в точке Р является касательным
вектором к некоторой параметризованной
кривой на М в точке Р .
Рассмотрим произвольную гладкую
параметризованную кривую у: (/], *2) -> М ,
проходящую через точку Р = у(^о)» и
касательный вектор Ъ, к кривой у в этой точке.
Для произвольной гладкой функции / на
334
Глава 8.3. ГЛАДКИЕ МНОГООБРАЗИЯ
М композиция / о у есть функция на
(fbh) ■ Обозначим
$(/) = (/° У)'('о)- (8-3.3)
В координатах Х\ , ..., хп , определенных в
окрестности точки Р на многообразии М ,
функцию / можно записать как функцию
многих переменных /(xi,... ,хл) и получить
где Х[ , ... , х„ — координаты точки J? , a
(^1,...,^л) — координаты касательного
вектора t, в этой системе координат. Таким
образом, из формулы (8.3.4) следует, что число
£(/) не зависит от выбора кривой у , а из
формулы (8.3.3) — то, что оно не зависит от
выбора системы координат. Число £(/)
называют производной функции f вдоль вектора
Ъ,. Операцию вычисления этой производной
называют дифференцированием функции f
вдоль вектора Ъ,.
Операция дифференцирования функций
на многообразии вдоль касательного вектора
обладает следующими свойствами:
1. l{Xf + W) = Щ/) + vJi(g), Kii e R,
f9geC~(M).
2.%Jg)=f(PWg) + %f)g(P),f,ge
eC~(M).
Пусть N — некоторое подмножество
многообразия М и Р е N . Будем говорить,
что касательный вектор £ к Л/ в точке /*
является касательным к подмножеству N на
многообразии М , если он является
касательным вектором к некоторой
параметризованной кривой, образ которой целиком лежит в
множестве N . Остановимся на случае, когда
подмножество N может быть задано как
подмножество всех точек Q многообразия М ,
удовлетворяющих системе уравнений //(G) =
= 0 , / = \,к , где fi — гладкие функции на
многообразии М . В этом случае, вектор £ в
точке Р , касательный к подмножеству N ,
удовлетворяет системе уравнений £, (/,-) = 0 ,
/ = 1, к . Наоборот, если £ (//) = 0, / = 1, к ,
причем для некоторой системы координат
(U,Л) в окрестности точки Р ранг матрицы
Якоби системы функций /jo/Г , ... , /^o/i"
в точке /*(/>) е R" максимален и равен к , то
вектор £, является касательным к
подмножеству N .
8.3.5. Касательное расслоение.
Рассмотрим множество всех касательных
векторов к л-мерному многообразию М в точке Р .
В этом множестве можно ввести операции
сложения двух векторов % + Г| и умножения
вектора на действительное число TJz,.
Производные по направлению этих векторов
удовлетворяют равенствам
(^л)/) = ^(/) + л(/),(ц)(/) = Ц(/).
В координатах эти операции выполняются
как сложение и умножение на число векторов
линейного арифметического пространства
R" . Введенные операции превращают
множество касательных векторов в точка Р в
л-мерное линейное пространство,
изоморфное Rn . Это линейное пространство
называют касательным пространством к
многообразию М в точке Р и обозначают ТрМ .
Множество всех касательных пространств
ТрМ , Р е М , к многообразию М
называется касательным расслоением.
Пример 8.3.3. Многообразие R"
является л-мерным линейным пространством.
Касательное пространство TpRn , Р е Rn , можно
отождествить с Rn. Однако более удобна
другая точка зрения. Касательный вектор к
многообразию Rn в точке Р по аналогии с
геометрическими векторами можно
интерпретировать как связанный вектор, имеющий
фиксированное начало Р , поскольку разли-
ТЕНЗОРНЫЕ ПОЛЯ
335
чаются любые касательные векторы с
разными точками приложения. С этой точки зрения
касательное пространство к многообразию
М в точке Р представляет собой множество
связанных векторов с общим началом Р .
Пример 8.3.4. Регулярная поверхность S
является двухмерным подмногообразием
многообразия R . Касательное пространство
к многообразию S в произвольной точке
Р е S можно отождествить с линейным про-
странством векторов из R , коллинеарных
касательной плоскости к поверхности S в
точке Р .
8.3.6. Дифференциал отображения.
Пусть F.M-^N — гладкое отображение
гладких многообразий, а у - произвольная
гладкая параметризованная кривая на
многообразии М . Тогда F о у является гладкой
параметризованной кривой на многообразии
N . Дифференциалом (или касательным
отображением) dFp гладкого отображения F в
точке Р называется отображение
касательного пространства ТрМ в касательное
пространство TqN , Q = F(P) , которое
касательный вектор к гладкой кривой у в точке
Р отображает в касательный вектор к кривой
F о у в точке Q (рис. 8.3.6).
Глава 8.4
ПОЛЯ НА МНОГООБРАЗИИ
8.4.1. Тензорные поля. Пусть М —
гладкое многообразие размерности п , a q, s —
целые неотрицательные числа. Говорят, что
на М задано тензорное поле Т типа (q,s)
ранга q + s, если в каждой точке Р
многообразия М для любой системы координат
(Х],...,хп) указан упорядоченный набор
Отображение dFp есть линейное
отображение линейных пространств. Матрица
этого отображения называется матрицей Яко-
би отображения F в точке Р . Если х±, ... ,
хп — координаты в окрестности точки Р на
М , а у у , ... , уп — координаты в
окрестности точки Q на N, то отображение F в
этих координатах задается функциями вида
yi(x{,...,xn), ... , Уп(хь...,хп), а матрица
Якоби этого отображения в точке Р совпада-
ет с матрицей частных производных —L(P)
ОХ:
этих функций в точке Р . Поэтому вектор
dFp\ t, ] не зависит от выбора кривой у , а
зависит только от касательного вектора £ к
кривой у •
Производная по направлению вектора
dFp\ £ 1 вычисляется по формуле
dFP\\yf) = i{foF),
где / — гладкая функция на N , а
композиция / о F есть гладкая функция на М .
nq+s чисел
Tj\Zj, C^l^ IZiaZn,
1 < jy < П , ..., 1 < js < П)
— компонент тензорного поля, который при
переходе к другой системе координат
{Z[,--.,Zn) в окрестности точки Р
преобразуется по правилу
Рис. 8.3.6
336
Глава 8.4. ПОЛЯ НА МНОГООБРАЗИИ
/,,...л Z, л,..,л ах,.'"^ а?,, ""эч '
где У/ i ч — компоненты тензорного поля
в системе координат (Z\,---,Zn), а сумма
рассматривается по всем значениям индексов
'1»• • • > lq>7*1 > • • • > Л от 1 Д° л- Верхние индексы
называются контравариантными, нижние —
ковариантными.
Тензорное поле Т на многообразии Л/
называется гладким, если в каждой локальной
системе координат на М его компоненты
71.1'""'? есть гладкие функции на Л/ .
7l»-,7s
Тензорное поле Т типа (<7,s) на
многообразии М задает в каждом касательном
пространстве ТрМ , Р е М , тензор типа
М-
Примеры: 1. Любая гладкая функция на
многообразии есть тензорное поле типа (0,0).
2. Дифференциал функции на
многообразии есть тензорное поле типа (0,1).
3. Первая и вторая квадратичные формы
поверхности есть тензорные поля типа (0,2).
Тензорные поля можно конструировать
из известных тензорных полей, применяя к
ним следующие алгебраические операции.
Пусть даны два тензорных поля Т и R
одинакового типа (q,s) ранга q + s . Тензорное
поле С типа (<7,s) с компонентами
71 ,-Js 71 .-,7s 71 ,-Js
называется суммой тензорных полей Т и R и
обозначается С -Т + R .
Произведением тензорного поля Т типа
(q,s) на гладкую функцию f называют
тензорное поле /Г типа (q,s) с компонентами
f(P)TjlZ'!l ВТОЧке Р
Пусть Т — тензорное поле типа (q,s).
Фиксируем два индекса разного типа — кон-
травариантный /а и ковариантный у'р.
Тензорное поле С типа (q -1,5-1) с
компонентами
^,'1 ,-Лх-1 ''а+1 >-iq _ ^ J1*! »-»'а-1 .'а^'»'а+1 >•''?
71 ,-,7р-1 ,7р+|,-,7л ~ ^г* 7|,-,7p-l,7p=',7p+l ,-,7s
называют сверткой тензорного поля Т по
индексам /а и у'р.
Наконец, пусть даны два тензорных
поля Т и R типа (<7,s) и (p,t)
соответственно. Тензорное поле С типа (q + p,s +1) с
компонентами
у /v.Pi Р/ " л у. Pi Э/
называют тензорным произведением тензорных
полей Т и R и обозначают С = Т <8> R .
8.4.2. Векторные поля. Векторным по-
лем называют тензорное поле типа (1,0).
Векторное поле X на многообразии М в
каждой точке Р е М задает касательный вектор
ХР е 7>А/ .
Пусть X — гладкое векторное поле,
/ - гладкая функция на многообразии М .
Производной функции f no направлению век-
торного поля X называют новую гладкую
функцию ^(/), значение которой в точке
Р равно производной / по направлению
вектора Xр :
x(/XP) = xP(f)
Производная функции по направлению
векторного поля обладает следующими
свойствами:
1. X(Xf + vg) = XX(f) + VLX(g), Х,цеК,
f,geC"(M).
2- X{fg) = fX{g)+X(f)g, f,gs(T(M).
Отображение Х:С°°(М) -> C°°(M) ,
обладающее свойствами 1 и 2, называют
дифференцированием на М . Любое
дифференцирование D на А/ порождается некоторым
гладким векторным полем X , т.е. функция
/)(/) есть производная функции / вдоль
векторного поля X .
Пусть F.M-^N — диффеоморфизм.
Тогда для любого гладкого векторного поля
X на многообразии М определено гладкое
векторное поле dF(X) на N , причем это
векторное поле как дифференцирование на
многообразии N может быть представлено в
виде
ФАЗОВЫЙ ПОТОК ВЕКТОРНОГО ПОЛЯ
337
dF(X) = (f-[)) 0X0F*.
8.4.3. Фазовый поток векторного
поля. Понятию векторного поля на
многообразии можно придать физическую
интерпретацию, представляя его как поле скоростей
частиц потока жидкости. Предположим, что
жидкость заполняет все многообразие, в
каждой точке Р многообразия в каждый момент
времени находится частица, которая движется
со скоростью v(P) . В разные моменты
времени в точке Р могут находиться разные
частицы, но скорость их движения будет одна
и та же, т.е. скорость движения частиц
определяется положением на многобразии и не
зависит от времени (такое движение называют
стационарным). Эта гидродинамическая
интерпретация векторного поля приводит к новым
геометрическим понятиям. Например,
траектории частицы жидкости соответствует
следующее геометрическое понятие.
Гладкую параметризованную кривую у
на многообразии М называют интегральной
кривой векторного поля X , если касательный
вектор к этой кривой в каждой ее точке Р
совпадает с Xр . Если в локальной системе
координат Х\ , ... , хц векторное поле X
имеет вид
АГ = Х*|(*Ь-».*я)
/=1
Эх,
то координатные функции Xj(/), ... , xn(t}
интегральной кривой поля X удовлетворяют
системе обыкновенных дифференциальных
уравнений
*I(0 = fll(*l-"'*n)>
(8.4.1)
x'„(t) = <in(x\,.--,xn).
Рассмотрим векторное поле X на
многообразии М. Выберем произвольную
карту (U ,h) на многообразии М . В области
Л((/) 6 R" векторному полю X
соответствует задача Коши для системы (8.4.1) с
начальным условием х(0) = х . Для любой точки
х е h(U) решение задачи Коши определено
в некоторой окрестности точки г = 0 и
является функцией как параметра t , так и
начального положения х . Это решение
определяет интегральную кривую у(*»^о)
векторного поля X , проходящую через точку
/>0=у(0,/>о) с координатным
представлением х в карте (U,h). Зафиксировав / ,
сопоставим точке Pq точку у(/,/^). Получим
отображение At: М -» М . Таким образом,
векторное поле X порождает семейство
отображений {/4,} многообразия М в себя.
Отметим, что при заданном / отображение
Af может быть определено не на всем
многообразии М . Однако для любой точки Р
многообразия М можно выбрать такую
достаточно малую ее окрестность U и такое
5 > 0 . что при всех |/| < 5 отображение At
будет определено в окрестности U . Далее
через Ut будем обозначать область
определения отображения At , рассматриваемого при
фиксированном t .
Семейство отображений At\Ut —» М
обладает свойствами:
1. Uq = М , a Aq — тождественное
отображение.
2. Ut с Us при 0 < s < t или при
/<5<0.
3. \JUt={JU,=M.
/>0 t<0
4. At(U s) a U s_t, где 0</<s или
5</<0.
5. At+S = AtoAs.
6. A_t=(Atf.
7. Af'.Uf ->U_t -диффеоморфизм.
Семейство отображений At:ilt —> M
называют фазовым потоком векторного поля
X .
Если гладкому векторному полю X на
многообразии М соответствует фазовый
поток {At} \\ f — гладкая функция на М , то
*(л=!КИ|
|/=0
338
Глава 8.4. ПОЛЯ НА МНОГООБРАЗИИ
^K(/)) = |rK(/))^;H/)). (8-4.2)
8.4.4. Алгебра Ли векторных полей.
Коммутатором [X,Y] двух векторных полей
X и Y называют векторное поле,
производная по направлению которого произвольной
функции / есть
[X,Ylf) = X(V(f))-Y(X(f)).
Пусть векторные поля X и Y в
некоторой локальной системе координат Х\ , ... ,
хп имеют компоненты соответственно а\, ... ,
ап и by, ... , bn. Рассмотрим векторные
функции многих переменных Х(х) =
= (ai(x)...an(xf и Г(х) = (*,(*)..А(х))Т,
составленные из компонент векторных полей
(здесь х = (xj,...,xw)). Тогда для векторной
Т
функции Z(x) = (q(x)...cw(x)) ,
составленной из компонент векторного поля [X, Y],
имеем
Z(x) = Y\x)X(x) - X\x)Y(x), (8.4.3)
где X (х) и Y (х) — матрицы Якоби
функций Х(х) и Y(x).
Коммутатор векторных полей обладает
следующими свойствами:
1. [X,aY + VZ] = a[X,Y] + V{X,Z],
ос,Р е R (линейность).
2. [Л^К] = -[К,^]
(антикоммутативность).
3. [[X, Y], Z] + [[Y, Z], X] + [[Z, X], Y] =
= 0 (тождество Якоби).
Линейное пространство Л , в котором
задана операция, удовлетворяющая свойствам
1-3, т.е. линейная, антикоммутативная,
подчиняющаяся тождеству Якоби, называют
алгеброй Ли. Линейное пространство гладких
векторных полей на многообразии М с
коммутатором векторных полей есть алгебра Ли.
Примером алгебры Ли может также служить
линейное пространство К3 свободных
векторов с операцией векторного умножения.
Дадим геометрическую интерпретацию
коммутатора векторных полей. Пусть X и Y -
векторные поля на многообразии М и
Р е М. Обозначим через {Лх} и {Вх}
фазовые потоки векторных полей X и Y .
Тогда {Л_х} и {i?_t} — фазовые потоки полей
-X и -Y. Пусть / — достаточно малое
число. Построим в точке Р интегральную
кривую Yi(x)=: ^т(^) векторного поля X , из
точки Yl(0 = ^/(^) проведем интегральную
кривую Y2 (х) = Вх \At (/*)) векторного поля
Р. Затем из точки Уг(0 проведем
интегральную кривую Уз(х) векторного поля
-X , а из точки Уз(0 "" интегральную
кривую Y4(x) векторного поля -Y . Рассмотрим
отображение, которое числу / ставит в
соответствие точку Y4(0 (Рис- 8.4.1). Это
отображение задает на поверхности М
параметризованную кривую у(0, которую можно
представить в виде
У(>2) = (Д-/ о A_t о Bt о At\P). (8.4.4)
Вектор [A^Kjo является касательным
вектором к параметризованной кривой y(t} в
точке Р .
Таким образом, коммутатор векторных
полей с геометрической точки зрения
характеризует степень разомкнутости
четырехугольника, получающегося при
последовательном смещении точки на одну и ту же
величину вдоль полей X,Y -X -Y (см. рис.
8.4.1).
Пусть X и Y — гладкие векторные
поля на многообразии М , векторному полю
X соответствует фазовый поток {Л,} и
Р е М . Тогда
Рис. 8.4.
РАСПРЕДЕЛЕНИЯ И ТЕОРЕМА ФРОБЕНИУСА
339
[X,Y],
dt
<щ
т
1/=0
Если отображение F:M-*N —
диффеоморфизм многообразия М в многообразие
N , а X и Y — гладкие векторные поля на
М , то
df([XJ]) = [dF(X),dF(Y)].
8.4.5. Распределения и теорема Фро-
бениуса. Говорят, что на многообразии М
задано распределение (или дифференциальная
система, или структура Пфаффа) Т , если в
каждой точке Р е М задано линейное
подпространство Тр касательного пространства
ТРМ (рис. 8.4.2).
Если размерность линейных
подпространств Тр постоянна для всех точек Р из
некоторой окрестности точки Q е М , то
распределение Т называют регулярным в
точке Q , а размерность каждого линейного
подпространства Тр называют размерностью
распределения Т в окрестности точки Q и
обозначают dim T .
Распределения можно задавать с
помощью семейств векторных полей. Пусть на
многообразии М задано семейство {Ха}
векторных полей. Тогда в каждой точке
Р е М определено множество JA^L}
касательных векторов к многообразию М в точке
Р , т.е. подмножество линейного
пространства ТрМ . Сопоставив точке Р линейное
подпространство Тр, являющееся линейной
оболочкой span(AraLj множества JA^L},
получим распределение Т на многообразии
М . В этом случае мы будем называть
семейство {Ха} семейством, порождающим
распределение Т . Распределение Тр, порожденное
семейством {Ха} гладких векторных полей,
называют гладким.
Наиболее распространенным является
случай конечного семейства векторных полей
Xj , i = \,k . Если в каждой точке Р систе-
ггг
ма
касательных векторов Xj\p , i = \,k , ли-
Рис. 8.4.2
нейно независима, то dim Тр = к , Р е М ,
и мы имеем дело с регулярным
распределением на многообразии М размерности к .
Однако в практических приложениях возникают
системы векторных полей Xt , линейно
независимые на всем многообразии, за
исключением относительно небольшого (возможно, и
конечного) множества точек, в которых
свойство линейной независимости теряется. В
этом случае система X,- , / = \,к , порождает
нерегулярное распределение. Это
распределение становится регулярным, если его
ограничить на открытом подмножестве
многообразия, не содержащем точки нерегулярности.
На л-мерном многообразии М
рассмотрим некоторое А>мерное подмногообразие
N . Подмногообразие N имеет структуру
гладкого многообразия, а касательное
пространство TpN к многообразию N можно
рассматривать как линейное подпространство
касательного пространства ТрМ к
многообразию М в точке Р . Любое распределение
Т на многообразии М порождает
распределение Т на подмногообразии N , для
которого ТР = Tpf)TpN , P eN .
Если распределение Т на
многообразии М и подмногообразие N многообразия
М в любой точке Р е N связаны условием
TpN a Тр , то мы будем называть
распределение Т по отношению к N
распределением, касающимся подмногообразия N , а
подмногообразие N по отношению к
распределению Т — интегральным многообразием.
Интегральное многообразие N
распределения Т будем называть максимальным
интегральным многообразием, если не существует
интегрального многообразия большей
размерности, содержащего N .
Регулярное распределение Т на
многообразии М называют интегрируемым, если
через каждую точку Р е М проходит
максимальное интегральное многообразие размер-
340
Глава 8.4. ПОЛЯ НА МНОГООБРАЗИИ
ности dim Тр, причем два любых таких
многообразия, проходящих через точку Р , в
некоторой окрестности этой точки совпадают.
Будем говорить, что векторное поле X
принадлежит распределению Т, и писать
X е Т , если Хр е Тр в каждой точке
Р е М. Множество всех гладких векторных
полей, принадлежащих данному
распределению Т , обозначим Т>(Т) . На этом
множестве определены операции сложения векторных
полей и умножения векторного поля на
гладкую функцию. Это множество будем называть
модулем распределения Т .
Кроме операций сложения и умножения
на функцию, для гладких векторных полей
имеется еще одна операция — коммутатор
векторных полей. Модуль распределения
может быть не замкнут относительно
коммутатора векторных полей, т.е. могут существовать
векторные поля, принадлежащие
распределению, коммутатор которых не принадлежит
распределению.
Распределение Т на многообразии М
называют инволютивным, если его модуль
Т>(Т} замкнут относительно коммутатора
векторных полей, т.е. [A^Kje.^ для любых
гладких векторных полей X е Т и Y е Т .
Модуль инволютивного распределения
является алгеброй Ли.
Пусть гладкое распределение Т на п-
мерном многообразии М порождено
системой векторных полей Z\ , ..., Z^ , линейно
независимых в каждой точке Р е М. Для
инволютивности распределения Т
необходимо и достаточно, чтобы распределению Т
принадлежали все векторные поля \Zj,Zj\,
т.е. чтобы существовали такие гладкие
функции с™ на многообразии М , что
[Z,,Zy]=£4?Zm,/,y = U. (8.4.5)
/и=1
Теорема Фробениуса: гладкое регулярное
распределение Т интегрируемо тогда и
только тогда, когда оно инволютивно.
Если Т — гладкое регулярное
интегрируемое распределение размерности к , то в
некоторой окрестности U произвольной
точки Р е М существует такая система
координат Z[, • • •, Zn , что распределение Т
порождается координатными векторными полями
э • 77
, / = 1,/с , а максимальные интегральные
многообразия распределения Т в
окрестности U описываются уравнениями
%к+1 = ск+\ » - » %п =сп >
где ск+[,...,сп — постоянные. Отсюда
функции Z/c+[,---<>Zn удовлетворяют системе
уравнений
Xj(z) = 0, 1 = 1,*. (8.4.6)
Функцию / , которая для данного
гладкого векторного поля X удовлетворяет
уравнению X(f) = 0 , называют первым
интегралом векторного поля X . Таким образом,
задачу описания максимальных интегральных
многообразий интегрируемого распределения,
порожденного системой векторных полей Х\ ,
... , Xfc , можно интерпретировать как задачу
поиска общих первых интегралов векторных
полей Х[ , ... , Хь .
Если распределение Т не является ин-
волютивным, то нужно рассмотреть его инво-
лютивное замыкание Т, т.е. наименьшее
инволютивное распределение, включающее в
себя распределение Т .
Чтобы построить инволютивное
замыкание распределения, порожденного гладкими
векторными полями Х[ , ... , Х^ ,
необходимо расширить систему векторных полей
следующим образом. Сначала к системе
векторных полей добавим коммутаторы Uf/,Jfy],
для которых нет представления вида
[Xi.Xj]=%cfXm.
/11=1
Для пополненной таким образом
системы повторим процедуру пополнения,
добавляя коммутаторы векторных полей, входящих
в систему, причем те коммутаторы, которые
представляются в виде линейной комбинации
исходных векторных полей, игнорируются.
Процедуру пополнения системы векторных
полей продолжаем до тех пор, пока на
очередном шаге не окажется, что все
коммутаторы векторных полей являются линейными
комбинациями векторных полей последней
пополненной системы.
Раздел 9
ДИСКРЕТНАЯ МАТЕМАТИКА
Глава 9.1
ОТНОШЕНИЯ
9.1.1. Соответствия и бинарные
отношения. Отображение / из множества А
в множество В считается заданным, если
каждому элементу х е А сопоставлен
единственный элемент у е В . Пишут f.A-^B.
Каждое отображение однозначно определяет
множество упорядоченных пар ^х,у}\х е А ,
у = /(*)} , являющееся подмножеством
декартова произведения Ах В множества А на
множество В и называемое графиком
отображения f .
Обратно, если в декартовом
произведении А х В фиксировано подмножество
упорядоченных пар / , такое, что для любых
двух пар (х,у) и (х , v J множества / из
х-х следует равенство у = у , то /
единственным образом определяет некоторое
отображение из А в В . Это отображение,
обозначаемое также / , элементу х е А
сопоставляет такой элемент у е В , что (х,у) е
е f. Таким образом, мы можем отождествить
отображения и их графики и считать, что
отображение есть подмножество декартова
произведения.
Понятие отображения можно обобщить.
Во-первых, можно отказаться от полной
определенности отображения, полагая, что образ
определен не для каждого элемента
множества А , а для некоторых элементов этого
множества. Во-вторых, можно отказаться от
однозначности отображения, полагая, что данному
х е А сопоставлен не один, а несколько
образов (множество образов) в множестве В .
В этом случае говорят, что задано
соответствие из множества А в множество В .
Если задано соответствие р из А в В ,
используют обозначение р(лс) по аналогии с
обозначением f(x) для отображений,
понимая при этом, что р(х) есть подмножество
множества В .
График соответствия р из множества
А в множество В есть множество Ср
упорядоченных пар (х, у), таких, что х е А у
у е В и элементы х,у связаны
соответствием р , т.е. у е р(х). При этом Ср с А х В .
Как и для отображений, можно
отождествить соответствие с его графиком и считать,
что соответствие из множества А в
множество В есть некоторое подмножество р
декартова произведения Ах В , т.е. р с Ах В . В
частности, при р = 0 получаем пустое
соответствие, а при р, совпадающем со всем
указанным декартовым произведением, —
универсальное соответствие.
При этом пишут (jc, у) ер для
упорядоченных пар, связанных соответствием р .
Пример 9.1.1. Рассмотрим множество
программистов А = {И,П, С} и множество
программ В = {п{, п2, пъ, щ, п5 } . Зададим
соответствие т из А в В , связывающее
программистов и разрабатываемые ими
программы:
342
Глава 9.1. ОТНОШЕНИЯ
Т = {(Я,/21),(Я,/23),(Я,/25),(Я,/22),
(П,п4), (С,л2), (C,n5)}czAxB.
Область определения соответствия
р с Ах В из множества А в множество
В — это множество всех первых компонент
упорядоченных пар из р :
D(p) = {x:(3yeB)(x,y)ep}.
Область значения соответствия р —
это множество всех вторых компонент
упорядоченных пар из р :
R(p) = {y:(3xeA)(x,y)sp}.
Из определения вытекает, что Щр) с
с А , R(p) £ В . Соответствие из А в В
называют всюду определенным, если его
область определения совпадает с множеством
A:D(p) = A.
Сечением соответствия р £ А х В для
фиксированного элемента х е А будем
называть множество р(х) = {.У :(*,>>) е р} .
Сечением соответствия р ло множеству
С с: А будем называть множество р(С) =
= {у:(х,у)ер,хеС}.
Пример 9.1.2. Область определения
соответствия т из примера 9.1.1 есть все
множество А , а область значения — все
множество В . Сечением соответствия т по
элементу Л будет множество т(/7) = {/*2> fy} •
Соответствие р cz Ах А из множества
Л в себя называют бинарным отношением на
множестве А .
Пример 9.1.3. Простейшим примером
бинарного отношения является отношение
нестрогого неравенства на множестве
действительных чисел R. Здесь каждому х eR
поставлены в соответствие такие у eR, для
которых справедливо х < у .
Для произвольного бинарного
отношения на некотором множестве часто
используют запись хру вместо (х,у)ер, говоря
при этом, что элементы х,у связаны
бинарным отношением р.
Бинарное отношение на множестве А ,
состоящее из всех пар [х, х), называют
диагональю множества А и обозначают id^.
Диагональ А есть тождественное
отображение А на себя.
Для наглядного изображения
соответствий из А в В (бинарных отношений в
частности) будем использовать два способа.
Первый из этих способов состоит в
интерпретации соответствия как подмножества декартова
произведения, которое можно изображать
примерно так же, как на плоскости можно
изображать подмножества декартова квадрата
числовых множеств. Второй способ,
применяемый для конечных множеств А и В , —
построение так называемого графа
соответствия. В этом случае элементы множеств А
и В изображаются на плоскости
кружочками. Если и только если пара (w, v)
принадлежит соответствию р , то в графе соответствия
из кружочка, обозначающего элемент и е А ,
проводим стрелку к кружочку,
обозначающему элемент v e В . Для бинарного отношения
на конечном множестве А часто удобнее
использовать граф другого вида. Элементы
множества А изображаются кружочками
только 1 раз, а стрелки проводятся по тем же
правилам, что и в графе соответствия.
Заметим, что при таком построении возможно
соединение кружочка стрелкой с самим собой
(петля).
Пример 9.1.4. а. На рис. 9.1.1, а
изображены график и граф бинарного соответствия
из примера 9.1.1.
б. Пусть А = {1,2,3,4}. Бинарное
отношение р на А определим как множество
всех упорядоченных пар (х9у), таких, что
х > у. Тогда
р ={(1,1), (2,1), (2, 2),
(3, 1), (3, 2), (3, 3), (4, 1), (4, 2), (4, 3), (4, 4)}.
График и два варианта графа отношения
р изображены на рис. 9.1.1, б.
Соответствие р с А х В называют
функциональным по второй (по первой)
компоненте, если для любых двух упорядоченных
пар (*,>>) ер и lx,j>)ep из равенства
х = х следует у - у (и из у = у следует
ОПЕРАЦИИ НАД СООТВЕТСТВИЯМИ
343
А
П4
п3
п2
П1
ш
ш
•
•
•
•
И П С
4
3
2
1
i
•
■■■ ■ i
•
,• •
• • •
• • •
—t i i »
12 3 4
х - х ). Можно сказать, что соответствие,
функциональное по второй компоненте, есть
отображение (возможно, частичное).
Соответствие / с А х В является
отображением из А в В , если и только если
оно всюду определено (т.е. £(/) = А ) и
функционально по второй компоненте.
Отображение из А в В является инъекцией
тогда и только тогда, когда оно
функционально по первой компоненте.
Рассмотрим обобщение понятия
соответствия.
Определение 9.1.1. Произвольное
подмножество р декартова произведения А\ х...
... хАп называют (n-арным или п-местным)
отношением на множествах А\ , ... , Ап . Если
(#|,...,#„)€ р , то говорят, что элементы а\,
... , ап связаны отношением р .
В случае если А\ =... - Ап - А , говорят
об n-арном отношении на множестве А .
Замечание 9.1.1. При п = 2 получаем
бинарное отношение на множествах А\ , А^ ,
т.е. соответствие из А\ в А^ .
При А\ = A-i - А получаем введенное
ранее бинарное отношение на множестве, т.е.
подмножество декартова квадрата А .
Таким образом, в общем случае (при
произвольном п>2) следует, строго говоря,
различать термины «л-арное отношение» и
«л-арное отношение на множестве».
Пусть я-арное отношение р с А\ х ... х
хАп удовлетворяет условию: для любых двух
кортежей (х,,...,*/,... ,xn) e p и (y\9...,yi9
...,уп)ер из выполнения равенств х^ = Уь
для любого к * i (0 < к < п) следует, что и
Xj = У} . Тогда отношение р называют
функциональным по / -й компоненте (1 < / < п).
Пример 9.1.5. Представим строку
учебного расписания как кортеж вида
(преподаватель, группа, дисциплина,
аудитория, день, час).
Тогда расписание можно рассматривать
как секстарное (шестиместное) отношение на
соответствующих множествах. Оно будет
функционально по первой компоненте, если,
конечно, предположить, что несколько
преподавателей не проводят одно и то же занятие
одновременно в одном и том же месте. Оно
также будет функционально по третьей
компоненте, по четвертой и не будет, вообще
говоря, функционально по второй, пятой и
шестой компонентам.
9.1.2. Операции над соответствиями.
Поскольку соответствия можно считать
344
Глава 9.1. ОТНОШЕНИЯ
множествами, то все операции над
множествами (пересечение, объединение, разность,
дополнение и т.д.) можно применить и к
соответствиям. Заметим, что, говоря о
дополнении соответствия из А в В , мы имеем в
виду дополнение до универсального
соответствия из А в В , т.е. до декартова
произведения Ах В . Естественно, что и равенство
соответствий можно трактовать как равенство
множеств.
В то же время на соответствия можно
распространить операции, определяемые для
отображений.
Композиция соответствий. Следуя
аналогии с композицией отображнений,
композицией (произведением) соответствий р с
с: А х В и а с В х С называют
соответствие
р о а = {(х9у): (3z е В\(х, z) е р) л ((г,у) е а)}.
(9.1.1)
Поясним построение композиции двух
соответствий. Полагая, что область
определения D(p) соответствия р не пуста, возьмем
произвольный элемент х е D(p). Пусть
сечение р(х) с В соответствия р не пусто и
найдется такой элемент z e р(*), что сечение
o(z) с С также не пусто. Тогда непустое
множество {(*,/):/ е o(z)\ будет
подмножеством сечения соответствия р о а в точке х .
Сечением соответствия р о а в точке х будет
непустое в силу сделанных предположений
множество всех таких упорядоченных пар
(jc, /) е А х С , что х е Z>(p) ,a /g o(z) для
некоторого z е р(*) .
Пример 9.1.6. Соответствие р возьмем
из примера 9.1.1. Соответствие а зададим
как соответствие из множества программ
{л1,Л2>яз»я4»я5} в множество заказчиков
программного обеспечения {з\, з2, з$, з4 } .
Пусть
<* = {(m>%)>{n\>34)>(nb3l)>
("З>з2), (п4,з4), (п5,з3)}.
Рассмотрим построение композиции
соответствий р и а . Начнем с элемента И.
Имеем р(Я) = {п{, пъ , л5 } , о(п{) = {з3, з4 },
а(/2з)={32} и а(/25)={3з}- Отсюда
получаем
а(/21)иа(/2з)иа(/25) = {з2,зз,з^} -
сечение композиции по элементу И.
Рассуждая аналогично, получим (р о а)(/7) = {31,34}
и (роаХС) = {з,,з3}.
Построение графа композиции р о а
проиллюстрировано на рис. 9.1.2.
К определению композиции
соответствий можно подойти с более общих позиций.
Пусть р с Ах В и ocCxD. При этом на
множества А, В, С и D априори не
накладывается никаких органичений. Композиция
р о а соответствий р и а в этом случае
также определяется соотношением (9.1.1).
Композиция соответствий р с: А х В и
а с С х D не коммутативна, т.е. в общем
случае р о а * а ° р , поскольку р°ос
с Л х Z), a а° р с Сх Z?.
Бинарное отношение на множестве
является частным случаем соответствия. Для двух
бинарных отношений р и а , заданных на
множестве А , их композиция р°а (9.1.1)
как соответствий является бинарным
отношением на том же множестве А . В этом случае
говорят о композиции бинарных отношений на
множестве А .
Композицию pop бинарного
отношения р на некотором множестве с самим
собой называют квадратом бинарного отношения
р и обозначают р .
В общем случае для двух бинарных
отношений тиф также имеет место
неравенство т о ф * ф о т , хотя обе композиции, в
отличие от аналогичных композиций двух
"1
"Х^-
*Ov
П4
Л/
^оЗ,
^о32
у>з3
-4>з4
Рис. 9.1.2
ОПЕРАЦИИ НАД СООТВЕТСТВИЯМИ
345
произвольных соответствий, заданы на одном
и том же множестве.
Приведем некоторые свойства
композиции соответствий:
1) ро(оот)= (роо)от;
2) для любого соответствия р имеет
место ро0=0ор=0;
3) ро(аит) = (роа)и(р°т);
4) для любого бинарного отношения на
множестве А имеет место равенство
р о \dA = \dA о р = р .
Можно доказать, что имеет место лишь
включение
р°(аПт)сроаПр°т.
Обратное соответствие. Соответствие,
обратное соответствию рс/lx^, есть
соответствие из В в А , обозначаемое р~ и
равное, по определению,
Р~{={(У>х)-(х>У)ер}-
Для соответствия т из примера 9.1.1
Г1 = {(я,,Я),(я2>/7),(я2,С),(я3,Я),
(я4,Л),(я5,Я),(я5,С)}.
Обратное соответствие обладает
следующими свойствами:
1>И~,=Р:
2) (роа)"1 = а~| ор"1.
Для бинарного отношения р на
множестве А обратное соответствие есть бинарное
отношение на том же множестве. В этом
случае говорят о бинарном отношении р~ на
множестве А , обратном к р .
Соответствия р ° р~ и р" °р в общем
случае не совпадают. Даже для бинарного
отношения р на множестве Ар о р~ *
* р о р , а также р ° р~ * id^ и
Если /': А —> В — отображение, то оно
является соответствием. Обратное к /
соответствие из В в А в общем случае не
является отображением. Если отображение f
инъективно, то обратное соответствие есть
частичное отображение из В в А . Если
отображение f биективно, то обратное
соответствие является отображением из В в А ,
причем имеют место равенства
Отображение /" в этом случае называют
отображениему обратным к / .
Ограничение соответствия. Пусть р с
с Ах В — соответствие из А в В , и
С с А , D с В . Ограничением соответствия
р на подмножества С ч D (или (С, D)-
ограничением соответствия р) называется
соответствие из С в D , обозначаемое pL ~ ,
такое, что
(х,у) е р|с D <=> ((*,>>) е р) л (х е С) л (у е D).
Можно записать
р|С0=рП(Сх/>).
Так, «малый» арксинус, т.е. функция
у = a resin х , есть ограничение «большого»
арксинуса у = Arc sin x , который является
соответствием на подмножества [-1,1] и
Г 7С я]
Всякое (С, Z?) -ограничение
соответствия р с А х Z? называют сужением
соответствия р /ш подмножество С (коротко — С-
сужением соответствия р), а всякое
(С, р(С))-ограничение соответствия р —
строгим сужением соответствия р на
подмножество С (строгим С-сужением
соответствия р). С-сужения соответствия р будем
обозначать pL , а строгое сужение — р\оС .
Для бинарного отношения р е А и
любого подмножества М с А (Л/, М)
-ограничение бинарного отношения называют
ограничением бинарного отношения р на
подмножество М и обозначают р|^ . Можно
346
Глава 9.1. ОТНОШЕНИЯ
Рассмотрим, например, отношение
естественного порядка < на множестве
действительных чисел. Тогда отношение <L =
= [(/w, п): т < п\ т, п е Z} есть ограничение
этого порядка на подмножество целых чисел.
Нельзя путать это отношение с Z-сужением
отношения <! Последнее состоит из всех
таких упорядоченных пар (т,х), что weZ,
х е R и х < т .
9.1.3. Специальные свойства
бинарных отношений. Построим определенную
классификацию бинарных отношений на
множестве. В основе этой классификации лежат
вводимые ниже специальные свойства
отношений.
Бинарное отношение р на множестве
А называют рефлексивным, если диагональ
множества А содержится в р : id^ с р , т.е.
х р х , для любого элемента х множества А .
Если же id^ Пр = 0 , то бинарное
отношение р на множестве А называют ир-
рефлексивным.
Указанные свойства бинарных
отношений на множестве А называют
рефлексивностью и иррефлексивностью.
Бинарные отношения равенства и
подобия на множестве геометрических фигур
рефлексивны: каждый треугольник равен самому
себе и подобен самому себе. На самом деле
рефлексивны все отношения равенства: чисел,
векторов, множеств и т.п. Также
рефлексивными являются, например, бинарное
отношение нестрогого неравенства на множестве
действительных чисел, поскольку для любого
числа х всегда х < х, и отношение с
включения множеств, так как для любого
множества X всегда X с X .
Напротив, бинарное отношение на
множестве действительных чисел, задаваемое
строгим неравенством х < у , иррефлексивно,
равно как и отношение с строгого включения
множеств.
Не следует путать иррефлексивное
отношение с нерефлексивным, т.е. не
являющимся рефлексивным, отношением. Ирреф-
лексивному отношению на А не
принадлежит ни один элемент диагонали id^ , а
нерефлексивное отношение может содержать
некоторые (но не все!) элементы диагонали.
Бинарное отношение р на множестве
А называют:
1) симметричным, если для любых
х,у е А из хру следует урх ;
2) антисимметричным, если для любых
х9у е А из одновременной справедливости
хру и урх следует, что х = у .
Соответствующие свойства бинарных
отношений на множестве А называют
симметричностью и антисимметричностью.
График симметричного бинарного
отношения на множестве А симметричен
относительно диагонали.
Теорема 9.1.1. Бинарное отношение р
на множестве А симметрично, если и только
если бинарное отношение на множестве А ,
обратное к р , совпадает с р: р" = р .
Теорема 9.1.2. Бинарное отношение р
на множестве А антисимметрично, если и
только если рПр с id^ .
Отметим, что для антисимметричного
бинарного отношения на множестве А
может иметь место равенство рПр = 0 .
Все бинарные отношения в геометрии
типа равенства или подобия симметричны.
Бинарные отношения неравенства чисел и
включения множеств, как строгие, так и не
строгие, антисимметричны.
Бинарное отношение р на множестве
А называют транзитивным, если для любых
x,y,z £ А из того, что хру и у рz ,
следует х р z • Соответствующее свойство
бинарного отношения называют транзитивностью.
Пример 9.1.7. Пусть М — некоторое
множество населенных пунктов. Зададим на
нем бинарное отношение достижимости: из
пункта А достижим пункт В , если есть
дорога, по которой можно доехать из А в В .
Это отношение транзитивно, поскольку если
из пункта А можно доехать до пункта В , а
из В есть дорога до С, то из А можно
проехать в С.
Теорема 9.1.3. Бинарное отношение р
на множестве А транзитивно тогда и только
тогда, когда его квадрат содержится в нем,
т.е. р о р с р .
Это свойство целесообразно
использовать для проверки транзитивности бинарного
отношения р на некотором множестве в тех
случаях, когда построение квадрата р
является более легкой задачей по сравнению с ис-
ОТНОШЕНИЯ ЭКВИВАЛЕНТНОСТИ
347
следованием свойства транзитивности р на
основе определения.
Бинарное отношение р на множестве
А называется плотным, если для любых
х,у е А , отличных друг от друга и таких, что
хру , найдется z , отличный и от х и от у,
такой, что xpz и Zpy •
Можно показать, что если р — плотное
бинарное отношение на множестве А , то
р с р . Если бинарное отношение р
одновременно плотно и транзитивно, то р = р .
Среди всех бинарных отношений на
произвольном множестве выделяют классы
отношений в зависимости от свойств,
которыми эти отношения обладают.
Бинарное отношение на некотором
множестве называют:
1) эквивалентностью, если оно
рефлексивно, симметрично и транзитивно;
2) толерантностью, если оно
рефлексивно и симметрично;
3) порядком (или частичным порядком),
если оно рефлексивно, антисимметрично и
транзитивно;
4) предпорядком (или квазипорядком),
если оно рефлексивно и транзитивно;
5) строгим порядком, если оно ирреф-
лексивно, антисимметрично и транзитивно;
6) строгим предпорядком, если оно ир-
рефлексивно и транзитивно.
Определенные выше бинарные
отношения называют отношениями эквивалентности,
толерантности, порядка (частичного порядка),
предпорядка (квазипорядка), строгого порядка,
строгого предпорядка.
Пример 9.1.8. а. Бинарное отношение
параллельности двух прямых или двух
плоскостей в евклидовой геометрии, если считать
каждую прямую (плоскость) параллельной
самой себе, есть отношение эквивалентности.
б. Бинарное отношение р на множестве
всех непустых подмножеств некоторого
множества U , для которого Ар В тогда и только
тогда, когда А П В * 0 , является
толерантностью.
в. Примером отношения порядка
является естественный числовой порядок.
г. Рассмотрим множество 2 всех
подмножеств множества А . Отношение
включения с на множестве 2 есть порядок.
д. Отношение строгого неравенства на
числовом множестве, равно как и отношение
строгого включения множеств, есть
отношение строгого порядка.
Для любого бинарного отношения
р с А можно построить отношение р сле-
*
дующим образом: хр у тогда и только
тогда, когда х = у или существует
последовательность Xq , Х[ , ... , хп , п > 1, такая, что
Xq = х , хп = у и для каждого / = 0, п - 1
выполняется xt px,+i. Отметим, что р с р .
Отношение р называют рефлексивно-
транзитивным замыканием бинарного
отношения р на соответствующем множестве.
Можно также обозначить
Р° = id^, р'=р, Р^рор""1, п>\,
и тогда
оо
р*=0'-
1=0
Отношение р является рефлексивным
и транзитивным.
9.1.4. Отношения эквивалентности.
Пусть А — произвольное множество.
Семейство (Bi). j непустых и попарно не
пересекающихся множеств называют
разбиением множества А , если объединение
множеств семейства (Д)- г равно А , т.е.
/б/
Сами множества Вг называют
элементами (или членами) разбиения (Д). ,.
Например, множества [0,1/3), [1/3,2/3)
и [2/3,1] образуют разбиение отрезка [0,1].
Тривиальными разбиениями А являются, по
определению, разбиение {^}, состоящее
только из самого А , и разбиение, состоящее
из всех одноэлементных подмножеств
множества А .
Пусть р — эквивалентность на
множестве А и х е А . Множество всех элементов
А , эквивалентных х, т.е. множество
{j>:j>px} называют классом эквивалентности
по отношению р и обозначают [х] . Отме-
348
Глава 9.1. ОТНОШЕНИЯ
тим, что в силу рефлексивности для любого
элемента х е А класс эквивалентности не
пуст, так как х е [х] .
Теорема 9.1.4. Для любого отношения
эквивалентности на множестве А множество
классов эквивалентности образует разбиение
множества А. Обратно, любое разбиение
множества А задает на нем отношение
эквивалентности, для которого классы
эквивалентности совпадают с элементами разбиения.
Теорема 9.1.4 позволяет отождествлять
отношения эквивалентности и разбиения:
любая эквивалентность определяет
единственное разбиение и наоборот.
Множество всех классов
эквивалентности по данному отношению эквивалентности
р на множестве А называют
фактор-множеством множества А по отношению р и
обозначают А/р .
Пример 9.1.9. На множестве целых чисел
Z определим отношение равенства по модулю
к , где к Е N . Положим х =/mod м У » если
и только если х - у делится на к . Легко
проверяется, что это отношение
эквивалентности.
Равенство чисел т и п по модулю к
означает, что при делении на к эти числа
дают одинаковые остатки. Поскольку всего
различных остатков может быть ровно к :
0,1,..., к - 1 , получаем ровно к попарно
различных классов эквивалентности по
данному отношению: [0]=(modA:), [l]=(mod*)»
- > lk-l]=(modk)> ™е шасс И=(тос1*)
состоит из всех целых чисел, дающих при
делении на к остаток г .
Отметим, что мы установили
взаимнооднозначное соответствие между
фактормножеством Z/ =(modA:) и множеством Z^ ,
состоящим из чисел 0, 1, ... , к—\.
Заметим, что для любого отношения
эквивалентности р на множестве А можно
определить отображение /р: А —> А / р,
положив /р(х) = [х] , т.е. сопоставив каждому
х е А содержащий его класс
эквивалентности. Это отображение сюръективно, так как
каждый элемент множества А принадлежит
некоторому классу эквивалентности, т.е. для
каждого [х] еА/р справедливо [У] =/р(х).
Отображение /р , определенное таким
образом, называют канонической сюръекцией
множества А .
Любое отображение однозначно
определяет некоторое отношение эквивалентности.
Теорема 9.1.5. Пусть f:A—> В —
произвольное отображение. Отношение ру на
множестве А , для которого х ру у , если и
только если f(x) - f(y), является
отношением эквивалентности, причем существует
биекция фактор-множества А / р г на
множество f(A).
Следовательно, в силу теорем 9.1.4 и
9.1.5 существует связь между тремя
понятиями — отображением множества, отношением
эквивалентности на множестве и разбиением
множества. Однако неверно, что существует
взаимно однозначное соответствие между
отображениями и отношениями
эквивалентности. Два разных отображения могут
определять одно и то же разбиение отображаемого
множества, тем самым задавая на нем одно и
то же отношение эквивалентности. Так,
например, любое биективное отображение
/:А->В задает на А одно и то же
разбиение — тривиальное разбиение на
одноэлементные множества.
9.1.5. Упорядоченные множества.
Теорема о неподвижной точке. Множество
вместе с заданным на нем отношением
порядка называют упорядоченным множеством.
Отношение порядка будем, как правило,
обозначать < (или значками ^, с и т.п.,
похожими на <). Множество М с заданным на
нем отношением порядка < будем
записывать как пару (М, < ). Записывая х < у , мы
будем говорить, что элемент х не больше
элемента у.
Каждому отношению порядка < на
множестве М можно сопоставить следующие
отношения.
1. Отношение, которое будем обозначать
<, получается из исходного отношения
порядка < выбрасыванием всех элементов
диагонали id^/, т.е. х < у для любых
х, у е М тогда и только тогда, когда х < у и
х * у . Отношение < является отношением
строгого порядка.
2. Двойственный порядок. Это бинарное
отношение на множестве М, называемое
также и отношением, двойственным к отноше-
УПОРЯДОЧЕННЫЕ МНОЖЕСТВА
349
нию порядка <, определяется как бинарное
отношение на множестве М , обратное к
отношению <. Его обозначают > . Тогда для
любых х, у условие х > у равносильно тому,
что у < х. Отношение > тоже является
отношением порядка.
3. Отношение доминирования. Для двух
элементов х и у, по определению, х < у
тогда и только тогда, когда х строго меньше
у и не существует такого элемента z , что
х < Z < У . Отношение < называют
отношением доминирования (или просто
доминированием), ассоциированным с отношением
порядка <. Если имеет место х < у, то
говорят, что элемент у доминирует над
элементом х.
Отношение доминирования иррефлек-
сивно, антисимметрично, но не транзитивно.
Оно может быть и пусто.
Пример 9.1.10. Рассмотрим множество
действительных чисел с естественным
числовым порядком. Это отношение порядка на
множестве действительных чисел является
плотным. Поэтому отношение
доминирования будет пустым.
На множестве целых чисел (с
естественным числовым порядком) отношение
доминирования не пусто. Так 1 < 2 , -5 < -4 .
Рассмотрим упорядоченное множество
(Л/,<) и его произвольное непустое
подмножество В с М . Упорядоченное множество
В,<\в), где <|д — ограничение отношения <
на подмножество В , называют упорядоченным
подмножеством упорядоченного множества
(М,<).
Как правило, вместо <L будем писать
просто < (если ясно, о каком подмножестве
В идет речь). Порядок <L на подмножестве
В называют также порядком, индуцированным
исходным порядком < на всем множестве
А.
Элементы х и у упорядоченного
множества (Л/,<) называют сравнимыми по
отношению порядка < , если х < у или у < х .
В противном случае элементы х и у
называются несравнимыми.
Упорядоченное множество, все
элементы которого попарно сравнимы, называют
линейно упорядоченным, а соответствующее
отношение — отношением линейного порядка
(или просто линейным порядком). Если
индуцированный порядок на подмножестве
упорядоченного множества является линейным, то
это линейно упорядоченное подмножество
называют цепью. Любое подмножество
попарно не сравнимых элементов данного
упорядоченного множества называют антицепью.
Пример 9.1.11. а. Отношение
естественного числового порядка на множестве Ш
действительных чисел является отношением
линейного порядка, поскольку для любых
двух чисел а, Ь имеет место или неравенство
а < b, или неравенство b < а .
б. Отношение включения с на В(А)
(см. пример 9.1.8, д) не является линейным
порядком, за исключением случая, когда А
— одноэлементное множество.
Пусть (А9<) — упорядоченное
множество. Элемент а е А называют наибольшим
элементом множества А , если для всех
х е А выполняется неравенство х < а .
Элемент b называют максимальным
элементом множества А , если для всякого
х е А имеет место одно из двух: или х < b ,
или х и b не сравнимы.
Аналогично определяются наименьший и
минимальный элементы упорядоченного
множества, а именно, наименьший элемент
упорядоченного множества А — это такой его
элемент а , что а < х для каждого х е А , а
минимальный элемент — это такой элемент
b е А , что для любого х е А элементы b и
х не сравнимы или b < х .
Наибольший (наименьший) элемент
множества, если он существует, является
единственным.
Максимальных (минимальных)
элементов может быть сколько угодно. Заметим, что
если у множества есть наибольший
(соответственно наименьший) элемент, то он
является единственным максимальным
(соответственно минимальным) элементом данного
множества.
Пусть (А,<) — упорядоченное
множество и В с А . Элемент а е А называется
верхней (соответственно нижней) гранью
множества В , если для всех элементов х е В
имеет место (х < а) (соответственно
(х>а)).
Наименьший элемент множества всех
верхних граней (соответственно наибольший
элемент множества всех нижних граней)
множества В называют точной верхней гра-
350
Глава 91. ОТНОШЕНИЯ
нью В (соответственно точной нижней гранью
В ) и обозначают sup В (inf В).
Множество всех верхних (нижних)
граней множества В называют верхним
(нижним) конусом В и обозначают В
(соответственно В ).
В отличие от наибольшего и
наименьшего элементов множества В элементы
sup В и inf 2? не обязаны принадлежать
множеству В . Точная верхняя (нижняя)
грань множества существует не всегда.
Пример 9.1.12. На числовой прямой с
«выколотой» точкой b для полуинтервала
[я,£) множество верхних граней есть (£,+°о),
но точной верхней грани нет.
Упорядоченное множество (Л/,<)
называют вполне упорядоченным, если его любое
непустое подмножество имеет наименьший
элемент.
Множество натуральных чисел с
отношением естественного числового порядка
вполне упорядочено, а множество целых
чисел не вполне упорядочено, поскольку оно не
имеет наименьшего элемента.
Можно показать, что справедлив принцип
двойственности для упорядоченных множеств.
Пусть (Л/, <) — произвольное упорядоченное
множество. Тогда любое утверждение,
доказанное для порядка < , останется
справедливым для двойственного порядка >, если в
нем:
1) порядок < заменить на порядок > и
наоборот;
2) наименьший (минимальный) элемент
заменить наибольшим (максимальным)
элементом и наоборот;
3) inf заменить на sup и наоборот.
{а,Ь} <
{а)1
{а,
Ь,с)
^а.сК
>}/
{с}
0
Рис. 9.1.3
Например, если для некоторого а е М
и для В с М мы доказали, что а = sup В
при заданном отношении порядка, то для
двойственного порядка а = inf В.
Конечное упорядоченное множество
можно графически изобразить в виде так
называемой диаграммы Хассе. На этой
диаграмме элементы множества изображаются
кружочками. При этом если элемент b
доминирует над элементом а , то кружочек,
изображающий элемент b , изображается выше
кружочка, изображающего элемент а , и
соединяется с ним прямой линией.
На рис. 9.1.3 приведена диаграмма Хассе
для упорядоченного множества всех
подмножеств трехэлементного множества {я,£,с} по
отношению включения (см. пример 9.1.8, г).
Последовательность {*/}. N элементов
упорядоченного множества называют
неубывающей, если для каждого / е N справедливо
неравенство Xj < x/+J .
Элемент а упорядоченного множества
(Л/,<) называют точной верхней гранью
последовательности \хЛ. ^ , если он есть точ-
ная верхняя грань множества всех членов
последовательности. Двойственно
определяется точная нижняя грань последовательности.
Упорядоченное множество (Л/,^)
называют индуктивным, если:
1) оно содержит наименьший элемент;
2) всякая неубывающая
последовательность элементов этого множества имеет
точную верхнюю грань.
Например, множество всех подмножеств
некоторого множества по отношению
включения будет индуктивным. Наименьший
элемент — пустое множество, а точной верхней
гранью произвольной неубывающей
последовательности множеств будет объединение всех
членов этой последовательности (наименьшее
по включению множество, содержащее в
качестве подмножества любой член
последовательности).
Определение 9.1.2. Пусть (М\,<) и
(^2>^) — индуктивные упорядоченные
множества. Отображение /: М\ —> Л/2
одного индуктивного упорядоченного
множества в другое называют непрерывным, если для
любой неубывающей последовательности а\,
... , ап, ... элементов множества М\ образ ее
точной верхней грани равен точной верхней
ПОЛУКОЛЬЦА. ОСНОВНЫЕ ПРИМЕРЫ
351
грани последовательности образов /(^i), ••• ,
f(an), .., т.е. справедливо равенство
f(sup an) = sup f(a„).
Определение 9.1.3. Отображение /:
М[ -> М2 упорядоченных множеств (М\,<)
и (Mi, :<) называют монотонным, если для
любых а,Ь е М\ из а < b следует f(a) ■<
*/(*).
Теорема 9.1.6. Всякое непрерывное
отображение одного индуктивного
упорядоченного множества в другое монотонно.
Заметим, что функция /: R -> R ,
непрерывная в смысле определений
математического анализа, не обязана быть монотонным
отображением упорядоченных множеств R с
естественным числовым порядком, т.е.
приведенное выше определение 9.1.2
непрерывности не вполне аналогично определению
непрерывности в анализе.
В общем случае монотонное в смысле
определения 9.1.3 отображение не является
непрерывным в смысле определения 9.1.2.
Не следует путать отображение,
монотонное в смысле определения 9.1.3, с
монотонными функциями из курса
математического анализа. Функция /: R —> R будет
монотонной в смысле определения 9.1.3 тогда
и только тогда, когда она является
неубывающей.
Для приложений особенно важны
непрерывные отображения индуктивного
упорядоченного множества в себя.
Определение 9.1.4. Элемент а
множества А называют неподвижной точкой
отображения f:A->A, если f(ai) = а .
Элемент а упорядоченного множества
М называют наименьшей неподвижной
точкой отображения f:M—>M, если он
является наименьшим элементом множества всех
неподвижных точек отображения / .
Теорема 9.1.7 (теорема о неподвижной
точке). Любое непрерывное отображение /
индуктивного упорядоченного множества
(Л/,<) в себя имеет наименьшую
неподвижную точку.
Поиск неподвижной точки отображения
/: М —> М можно рассматривать как задачу
решения уравнения
* = /(*)• (9.1.2)
Пример 9.1.13. Приведем простой
пример вычисления наименьшей неподвижной
точки. В качестве индуктивного
упорядоченного множества Л/ возьмем отрезок [0,1] с
естественным числовым порядком < .
Рассмотрим на этом множестве уравне-
1 1 г,
ние JC = —JC ч— . Правая часть данного урав-
2 4
нения непрерывна. Наименьшим элементом
рассматриваемого множества является число
0. Вычисляем:
/°(0) = 0, /'(<>)= 1/4,
/2(0) = (1/2)(1/4) + 1/4 = 3/8,
/3(0) = (1/2)(3/8) + 1/4 = 7/16,...
получая последовательность приближений к
наименьшей неподвижной точке.
2п -1
Можно проверить, что /я(0) = г- ,
я е N . Предел этой последовательности
равен 1/2. Таким образом, наименьшая
неподвижная точка отображения / , стоящего в
правой части уравнения, равна 1/2. Это
единственная в данном случае неподвижная точка
отображения / .
Приложения теоремы о неподвижной
точке связаны с теорией графов.
Глава 9.2
ПОЛУКОЛЬЦА И БУЛЕВЫ АЛГЕБРЫ
Полукольцо является одной из
важнейших алгебр в современной дискретной
математике. Изучаемые ниже методы, прежде
всего метод решения систем линейных
уравнений в полукольцах, имеют большое
значение для теории графов.
9.2.1. Полукольца. Основные
примеры. Определение 9.2.1. Полукольцо — это
алгебра с двумя бинарными и двумя нульарными
операциями
S = (Sy +,-,0,1),
такая, что для произвольных элементов
а,Ь,с множества S выполняются
следующие равенства, называемые аксиомами
полукольца:
1) a +(b + c) = (a + b) + c ;
352
Глава 9.2. ПОЛУКОЛЬЦА И БУЛЕВЫ АЛГЕБРЫ
2) а + b = b + a ;
3) я+ 0 = я ;
4) a (b • с) = (а Ь) с;
5) аЛ = \-а = а\
6) а • [Ь + с) = а ■ b + а • с;
7) (6 +с) я = 6 а + с- а;
8) а0 = 0а = 0.
Первую операцию + называют сложены-
ем полукольца, а вторую операцию —
умножением полукольца S ; элементы 0 и 1
называют соответственно нулем и единицей
полукольца S .
Аксиомы полукольца называют также
основными тождествами полукольца.
Таким образом, операция сложения
полукольца ассоциативна и коммутативна, а
нуль полукольца является нейтральным
элементом относительно операции сложения;
операция умножения полукольца
ассоциативна и единица полукольца является
нейтральным элементом относительно операции
умножения. Кроме этого имеет место свойство
дистрибутивности (двусторонней) операции
умножения относительно сложения
полукольца. Аксиому 8 полукольца называют
аннулирующим свойством нуля полукольца.
Используя понятие моноида,
определение 9.2.1 можно переформулировать так.
Полукольцо S = (£,+, ,0,1) — это алгебра с
двумя бинарными и двумя нульарными
операциями такая, что
1) алгебра (£,+,0) является
коммутативным моноидом (его называют аддитивным
моноидом полукольца);
2) алгебра (5,-,1) является моноидом
(его называют мультипликативным моноидом
полукольца);
3) имеют место свойства (двусторонней)
дистрибутивности операции сложения
относительно операции умножения;
4) выполняется аннулирующее свойство
нуля
Сравнивая определение полукольца с
определением кольца, видим, что кольцо есть
частный случай полукольца: если кольцо по
сложению является абелевой группой, то
полукольцо — лишь коммутативный моноид.
Выделим два вида полуколец:
коммутативное полукольцо с коммутативной операцией
умножения и идемпотентное полукольцо с
идемпотентной операцией сложения.
Пример 9.2.1. Рассмотрим алгебру
7г+ = ш+ U{+ ~}, min, +, + во, 01,
где Ш+ — множество неотрицательных
действительных чисел, min — операция взятия
наименьшего из двух данных чисел, + —
операция сложения действительных чисел, -И» —
«плюс бесконечность» (в том же смысле, что
и в математическом анализе), 0 — число
«нуль».
Эта алгебра — полукольцо, носителем
которого является полуось Ш+ = [х: х > 0} ,
пополненная элементом +©о (множество всех
неотрицательных действительных чисел
вместе с «плюс бесконечностью»).
Необычность полукольца 71+ состоит в
том, что в качестве его умножения взято
сложение действительных чисел, тогда как в
качестве сложения выбрана операция взятия
наименьшего из двух чисел. Элемент -н»
рассматривается как нуль полукольца.
Пример 9.2.2. Рассмотрим алгебру
В - ({0, 1},+, ■, 0,1), в которой операции + и
заданы таблицами Кэли (табл. 9.2.1 и 9.2.2).
Таблица 9.2.1 Таблица 9.2.2
+
0
1
0
0
I
1
1 1
1
0
1
0
0
0
I
о
li
Проверка аксиом полукольца основана
на этих таблицах и легко выполняется.
Рассматриваемое полукольцо является
коммутативным и идемпотентным.
Операции полукольца В можно
трактовать как логические связки «или» и «и», а
элементы 0 и I— как «ложь» и «истина»
соответственно.
В дальнейшем нас будут интересовать
только идемпотентные полукольца, поскольку
именно на их основе разрабатываются
алгебраические методы анализа ориентированных
графов.
На носителе идемпотентного полукольца
S = (S, +, •, 0,1) может быть введено
отношение порядка, которое, естественно согласуется
со свойствами операций полукольца: для
произвольных х,у е S положим х < у тогда и
только тогда, когда х + у - у , т.е.
х<у&>х + у = у. (9.2.1)
Его будем называть естественным
порядком идемпотентного полукольца и говорить,
что он задан в этом полукольце.
ЗАМКНУТЫЕ ПОЛУКОЛЬЦА
353
Поскольку для любого элемента х
произвольного идемпотентного полукольца
5 = ($,+,-,0,1)
имеет место 0 + х = х , то для любого х е S
выполняется неравенство 0 < х , т.е. нуль
идемпотентного полукольца есть наименьший
элемент относительно естественного порядка
идемпотентного полукольца.
Пример 9.2.3. В полукольце В (см.
пример 9.2.2) выполняется равенство 0+1=1
и, следовательно, 0 < 1.
В полукольце Л+ (см. пример 9.2.1)
х < у , если и только если п\т(х,у) = у .
Обозначим через <к естественный
числовой порядок на множестве действительных
чисел. Порядок в полукольце 71+ — это
двойственный порядок для отношения <к .
Теорема 9.2.1. Если А — конечное
подмножество (носителя) идемпотентного
полукольца, то sup А относительно естественного
порядка этого полукольца равен сумме всех
элементов множества А .
9.2.2. Замкнутые полукольца. Можно
выделить специальный класс идемпотентных
полуколец, в которых удается находить
решения систем уравнений, рассматриваемых в
качестве аналогов систем линейных
алгебраических уравнений.
Определение 9.2.2. Полукольцо S = (5,+,
•, 0,1) называют замкнутым, если:
1) оно идемпотентно;
2) любая последовательность элементов
множества S имеет точную верхнюю грань
относительно естественного порядка < этого
идемпотентного полукольца;
3) операция умножения полукольца S
сохраняет точные верхние грани
последовательностей, т.е. для любого а е S и любой
последовательности X = {хп} N элементов
множества S
a sup X ~ sup aX , (sup X)а = sup(Afl).
Теорема 9.2.2. Любое конечное идемпо-
тентное полукольцо замкнуто.
В любом идемпотеитном полукольце
сумма произвольного конечного множества
элементов является его точной верхней
гранью. В силу этого в замкнутом полукольце
естественно точную верхнюю грань
последовательности {хп} называть суммой
элементов последовательности, полагая, по
определению,
JTx^supfoi/ieN}. (9.2.2)
/7=1
Согласно условию 2 определения 9.2.2, всегда
/t xn есть элемент множества S. Иногда,
/7=1
если это не приводит к недоразумению, будем
писать просто \\ хп или У\хп ■ Подчерки-
neN
вая, что в (9.2.2) множество элементов хп в
общем случае бесконечно, будем сумму,
стоящую в левой части (9.2.2), называть
бесконечной суммой. В частных случаях
бесконечная сумма может свестись к конечной
(если множество всех элементов
последовательности {хп} конечно).
Итак, согласно определению 9.2.2,
замкнутое полукольцо является индуктивным
упорядоченным множеством, в котором
наименьшим элементом служит нуль полукольца,
точной верхней гранью произвольной (в
частности, неубывающей) последовательности
{хп} ц является бесконечная сумма V*„ ,
причем операция умножения на
произвольный фиксированный элемент а непрерывна в
смысле определения 9.1.2, поскольку,
согласно определению 9.2.2, сохраняет точные
верхние грани. Это свойство умножения в
замкнутом полукольце можно рассматривать как
аналог дистрибутивности (см. свойство 7 в
определении 9.2.1) для бесконечной суммы:
Для бесконечной суммы также
справедливы аналоги свойств идемпотентности и
коммутативности.
Можно показать, что имеет место
бесконечный аналог ассоциативности.
Содержательно ассоциативность бесконечной суммы
означает возможность произвольной
группировки слагаемых без изменения результата.
Следующая теорема устанавливает связь
между конечной и бесконечной суммами.
Пусть {xn}neN и {yn}neN -
произвольные последовательности в замкнутом
12 —770Ь
354
Глава 9.2. ПОЛУКОЛЬЦА И БУЛЕВЫ АЛГЕБРЫ
полукольце S. Образуем последовательность
{*Л+.УЛ} N, называемую суммой исходных
последовательностей.
Теорема 9.2.3. В любом замкнутом
полукольце точная верхняя грань суммы двух
произвольных последовательностей равна сумме
точных верхних граней этих
последовательностей, т.е.
Х(**+>>*)=Xх*+Х^ • (923)
Если в (9.2.3) Уп-а для всех п , то
получаем следствие.
Следствие 9.2.1. Для любой
последовательности [хп] N элементов замкнутого
полукольца и любого элемента а этого
полукольца выполняется равенство:
* + Х*"=Х(*+*")- (92'4)
Тождество (9.2.4) можно рассматривать
как утверждение о непрерывности операции
сложения в замкнутом полукольце.
Одним из важнейших понятий в
замкнутых полукольцах является понятие итерации
(или замыкания) элемента замкнутого полу-
*
кольца. Итерация х элемента х
определяется как точная верхняя грань
последовательности всех степеней элемента х, т.е.
/7=0
где, по определению, х = 1, а хп = х"~ х ,
/1 = 1,2,....
Пример 9.2.4. а. Из теоремы 9.2.2 сразу
получаем, что идемпотентное полукольцо В
(см. пример 9.2.2) замкнуто, причем точная
верхняя грань любой последовательности
элементов этого полукольца равна 1, если
хотя бы один ее член равен 1, и равна 0 в
противном случае. В частности, итерация
любого элемента полукольца В равна
единице полукольца.
б. В идемпотентном полукольце 71+
(см. пример 9.2.1) любая последовательность
есть последовательность неотрицательных
действительных чисел. Такая
последовательность ограничена снизу и, как известно из
курса математического анализа, имеет точную
нижнюю грань относительно естественного
числового порядка, которая является точной
верхней гранью относительно двойственного
к нему естественного порядка идемпотентного
полукольца 71+. Следовательно, для любой
последовательности хп элементов полукольца
71+ точная верхняя грань существует.
Непрерывность операции умножения в этом
полукольце также можно доказать, опираясь на
естественный числовой порядок.
Таким образом, полукольцо И+
является замкнутым.
Итерация х элемента х в полукольце
71+ есть точная верхняя грань
последовательности степеней элемента х и равна
единице полукольца, т.е. числу 0.
Всякое замкнутое полукольцо является
индуктивным упорядоченным множеством.
Следовательно, согласно теореме 9.1.7, любое
непрерывное отображение f замкнутого
полукольца в себя имеет наименьшую
неподвижную точку, т.е. в любом замкнутом
полукольце всякое уравнение вида х = f(x), где
/ — непрерывное отображение носителя
этого полукольца в себя, имеет наименьшее
решение.
Особенно важными для приложений
являются линейные уравнения в замкнутом
полукольце, имеющие вид
х = ах + Ь (9.2.5)
или
х = ха + Ь. (9.2.6)
В силу непрерывности операций
сложения полукольца (см. тождество (9.2.4)) и
умножения полукольца (см. определение 9.2.2)
правые части уравнений (9.2.5) и (9.2.6) есть
непрерывные отображения. Поэтому, согласно
теореме 9.1.7 о неподвижной точке,
существуют наименьшие решения этих уравнений.
Теорема 9.2.4. Наименьшими
решениями уравнений (9.2.5) и (9.2.6) в замкнутых
полукольцах являются соответственно
х = аЪ (9.2.7)
и
х = Ьа*, (9.2.8)
*
где а — итерация элемента а .
Формулы (9.2.7) и (9.2.8) дают именно
наименьшие решения уравнений (9.2.5) и
(9.2.6), а не все возможные их решения.
Например, в полукольце В (см. пример 9.2.2)
рассмотрим уравнение х = X + 0. Его реше-
РЕШЕНИЕ СИСТЕМ ЛИНЕЙНЫХ УРАВНЕНИЙ
355
нием является любой элемент полукольца —
как 0, так и 1. Но по формуле (9.2.7) получим
х = 1 0 = 0, что есть наименьшее решение
уравнения.
9.2.3. Решение систем линейных
уравнений. Результат раздела 9.2 можно
распространить на системы линейных уравнений
вида
[*1 = *11*1+»-+*1#Л|+*к.
| (9.2.9)
[хп=ап1х{+...+аппхп + Ьп,
где все элементы а^, 1 < /', j < n,bj, \<i<n
суть элементы некоторого замкнутого
полукольца и речь идет о решении системы (9.2.9)
в этом полукольце.
Для этого введем в рассмотрение
множество Mmxn(S) прямоугольных матриц типа
т х п с элементами из произвольного идем-
потентного полукольца S = (S, +, •, 0,1) .
Множество всех квадратных матриц л-го
порядка с элементами из полукольца S
обозначим Мл(5). Через Matr(tS) обозначим
множество всех матриц любого типа с элементами
из S.
Операции сложения и умножения
матриц определяют точно так же, как и в
числовом случае — с учетом того, что сложение и
умножение элементов матриц понимаются в
смысле данного идемпотентного полукольца
S . Нулевая (О) и единичная (is) матрицы
любого порядка определяются с помощью
единицы и нуля полукольца.
На множестве M„(S) всех квадратных
матриц фиксированного порядка п можно
определить алгебру
Мя(5) = (Мя(5)>+>->0>£).
Теорема 9.2.5. Алгебра M„(»S) есть
идемпотентное полукольцо. Если полукольцо
S замкнуто, то полукольцо Мя(5) тоже
замкнуто.
Полукольцо Мя(5) будем называть
полукольцом матриц над полукольцом S .
Приведенная теорема позволяет нам применять к
замкнутым полукольцам матриц над
некоторым замкнутым полукольцом 5 теорему 9.2.4
и решать произвольные уравнения вида
Х = АХ + В (9.2.10)
или
Х = ХА + В (9.2.11)
относительно неизвестной матрицы X .
Наименьшие решения этих уравнений
есть соответственно
Х = А*В (9.2.12)
и
Х = ВА\ (9.2.13)
где А — итерация матрицы А в M„(«S).
Итерация А матрицы А играет в теории
линейных уравнений в замкнутых
полукольцах такую же роль, как обратная матрица в
классической линейной алгебре.
Основную роль при решении задач
теории ориентированных графов играют праволи-
нейные уравнения вида (9.2.10), поэтому мы
будем, как правило, рассматривать только их.
Леволинейное уравнение (9.2.11) может быть
проанализировано аналогично.
Перейдем к технике поиска решений
систем вида (9.2.9).
Полагая, что £ ,• — j -й столбец
матрицы X , а Ру — j -й столбец матрицы В ,
уравнение (9.2.10) можно переписать как
систему уравнений относительно неизвестных
столбцов матрицы X :
§у=^у+Ру. 0<у</1. (9.2.14)
Наименьшее решение этой системы, как
следует из (9.2.12), есть
%j = А% . (9.2.15)
Для поиска решения системы вида
(9.2.14) можно воспользоваться методом
последовательного исключения неизвестных,
аналогичным классическому методу Гаусса.
Поскольку система уравнений вида
(9.2.9) имеет решение, мы можем подставить
его в систему и работать с уравнениями как с
тождествами.
Рассмотрим процедуру решения системы
уравнений (9.2.9). Запишем первое уравнение
системы так:
Х{ = апх{ + (Я|2*2+- • -+ainxn +bl)-
Из первого уравнения системы выразим Ху
через остальные неизвестные,
воспользовавшись формулой (9.2.7):
12*
356
Глава 9.2. ПОЛУКОЛЬЦА И БУЛЕВЫ АЛГЕБРЫ
Х{ = а*\{а\2х2+---+а1пхп + *0- (9-216)
В формуле (9.2.16) выражение в скобках не
содержит неизвестного Х[ . Подставляя
(9.2.16) вместо jq в остальные уравнения,
Первое уравнение этой системы перепишем
так:
Х2 =(fl2l*lVl2+fl22)*2+Y2.
где
72 = *21*п (*13*3+- -.-Wlii^i, + М +
+ fl23*3+»-+*2#i*#i+*2-
Заметим, что у2 не содержит Xj и л:2 .
Воспользовавшись соотношением (9.2.7), будем
иметь
*2=<Х2У2> (9.2.18)
*
где а2 = ^2 \а\ \а\2 + fl22 не содержит
неизвестных. Используя полученное выражение,
исключаем х2 из остальных уравнений.
Действуя подобным образом, на / -м
шаге (1 < / < п) получаем
*/ =«*Т/) (9.2.19)
где выражение щ не содержит неизвестных,
а выражение у, может содержать только
неизвестные, начиная с (/ + 1) -го: л;/+1,..., хп .
При / = п имеем
х„ = а*пУп , (9-2.20)
где выражения ап и уп не содержат
неизвестных. Таким образом, исходная система
(9.2.9) преобразована к «треугольному» виду.
На этом завершается первый этап алгоритма,
который называют прямым ходом метода
Гаусса.
получаем систему из п - 1 уравнений,
которая уже не содержит Х[ . Приводя подобные
члены в каждом уравнении системы,
получаем:
Второй этап алгоритма, называемый
обратным ходом метода Гаусса, состоит в
последовательном нахождении значения всех
неизвестных Х[ , ... , xn_i, начиная с хп_[.
Подставив в выражение для хп_[ вместо хп
правую часть (9.2.20), найдем хп_[. Затем
определим хп_2 , подставив полученные значения
хп и хп_[ в правую часть выражения (9.2.19)
при / = п - 2 , и так далее до тех пор, пока не
найдем Х[ .
Положив В = Е в уравнении (9.2.10),
получим X - А Е - А . Таким образом,
чтобы вычислить итерацию матрицы А ,
достаточно решить матричное уравнение (9.2.14)
для всех j = 1,/t при Ру, равном j -му
столбцу единичной матрицы Е .
Пример 9.2.5. Проиллюстрируем
приведенную схему решения системы из двух
линейных уравнений. Имеем
*1 = а11х\ + <*12*2 +^Ь
х2 = а2{х{ + а22х2 + fy.
Из первого уравнения выразим Х\ :
*1=*п(*12*2+*0-
Подставляя это выражение во второе
уравнение, получаем
х2 = [а2{апап +а22} (а^а^Ьу + ^).
Подставляя этот результат в написанное выше
выражение для Х\ , находим окончательное
решение:
х2 = (*21*11*12 + Д22)*2+" +(*21*lVl/7 + а2п)хп + *21*lA + Ъ>
х3 = {аЪ\а\{ап + а32)х2+..л(а3[а*па1п + а3„)хп + а^а^Ь + ^,
хп = (an\a\\ai2 + an2)x2+---+(anial\aln + апп)хп + ап\а\Л + Ьп.
БУЛЕВЫ АЛГЕБРЫ
357
х{ = ап х
х\ап{а2{аиап + а22) (я21дп4[ + h) + hJ.
Особенно просто решение выглядит в
случае тривиальной итерации, т.е. тогда, когда
в полукольце итерация любого элемента
равна единице полукольца (как в полукольцах
В, 7£+, SA , S[a,b])- В этом случае для
системы из двух уравнений решение будет:
х{ ^а[2(а2[Ь{ +^ъ)+^,
Х2 = tf2l£) + h ■
9.2.4. Булевы алгебры. Теория булевых
алгебр является классическим разделом
дискретной математики, булевы алгебры
возникли в трудах английского математика Дж. Буля
в пятидесятых годах XIX века как аппарат
логики. При этом элементы булевой алгебры
трактовались как высказывания, а
операциями являлись дизъюнкция, конъюнкция и
отрицание.
Существуют различные подходы к
определению булевой алгебры. Мы определим
булеву алгебру как частный случай идемпо-
тентного полукольца.
Определение 9.2.3. Полукольцо S =
= (S,+, ,0,1) называют симметричным (или
взаимным), если оно идемпотентно и в нем
выполнены следующие тождества:
1) а ■ а = а (идемпотентность операции
умножения полукольца);
2) а - b = b - а (коммутативность
операции умножения полукольца);
3) а + (Ь • с) = (а + Ь) ■ (а + с)
(дистрибутивность операции сложения полукольца
относительно умножения);
4) 1 + а = 1 (аннулирующее свойство
единицы полукольца относительно сложения).
Можно дать определение, равносильное
определению 9.2.3. Идемпотентное
полукольцо S = (iS, +, , 0,1) называется
симметричным (или взаимным), если алгебра S =
= (а5\ •, +, 0,1) также является идемпотент-
ным полукольцом. При этом будем говорить,
что идемпотентное полукольцо S есть
полукольцо, двойственное к идемпотентному
полукольцу S .
В двойственном идемпотентном
полукольце операция сложения — это операция
умножения в исходном полукольце и
наоборот; нуль двойственного полукольца — это
единица исходного полукольца и наоборот.
Легко видеть, что полукольцо S , двойст-
венное к двойственному полукольцу S , есть
исходное полукольцо S.
Справедлив принцип двойственности для
симметричных полуколец: любое тождество в
симметричном полукольце остается верным,
если в нем операцию сложения заменить
операцией умножения и наоборот, а единицу
заменить нулем и наоборот.
Пример 9.2.6. а. Полукольцо В (см.
пример 9.2.2) симметрично.
б. Полукольцо 71+ (см. пример 9.2.1) не
является симметричным в силу
неидемпотентности умножения полукольца.
в. Полукольцо SA =(2А,и,Г\,0,А) с
носителем — множеством всех подмножеств
некоторого множества А — и операциями
объединения и пересечения, симметрично в
силу известных свойств операций пересечения
и объединения множеств.
Рассмотрим некоторые свойства
симметричного полукольца.
Свойство 9.2.1. Для любых элементов
симметричного полукольца выполняются
равенства:
х(х + у) = х , х + ху = х .
Равенства, приведенные в формулировке
свойства 9.2.1, называют тождествами
поглощения.
Свойство 9.2.2. В симметричном
полукольце неравенство х < у имеет место тогда
и только тогда, когда ху = х .
Свойство 9.2.2 выражает связь
умножения с естественным порядком идемпотентного
полукольца: меньший сомножитель поглощает
больший, т.е. порядок в двойственном полу-
кольце S является порядком, двойственным к
порядку в полукольце S . Но, как известно,
при переходе к двойственному порядку
наибольший (максимальный) элемент становится
наименьшим (минимальным) элементом, а
точная верхняя грань — точной нижней гранью.
Свойство 9.2.3. В симметричном
полукольце произведение ху есть точная нижняя
грань последовательности {.*,}>}:
xy = inf{x,y}.
358
Глава 9.2. ПОЛУКОЛЬЦА И БУЛЕВЫ АЛГЕБРЫ
Свойство 9.2.4. Для любого элемента х
симметричного полукольца имеет место
неравенство 0 < х < 1.
Таким образом, в симметричном
полукольце единица (1) является наибольшим
элементом.
Определение 9.2.4. Булева алгебра — это
симметричное полукольцо, в котором для
каждого х существует элемент х ,
называемый дополнением х , такой, что:
х + х = \, (9.2.21)
х х = 0 . (9.2.22)
Обычно сложение в булевой алгебре
называют булевым объединением и обозначают
v, а умножение — булевым пересечением и
обозначают л .
Рассмотрим некоторые важные свойства
булевых алгебр, вытекающие из определения.
Свойство 9.2.5 (единственность
дополнения). В булевой алгебре для любого х его
дополнение х единственное.
Свойство 9.2.6 («симметричность»
операции дополнения). В булевой алгебре
выполняется тождество
х = х .
Свойство 9.2.7. В булевой алгебре верны
следующие тождества:
xv у = х а у, х а у = xv у . (9.2.23)
Тождества (9.2.23) называют законами де
Моргана.
Единственность дополнения означает,
что в булевой алгебре возникает унарная
операция — переход от элемента к его
дополнению. Эту операцию можно ввести в сигнатуру
алгебры, т.е. рассматривать булеву алгебру как
алгебру вида
B = (^,v,a,-,0,1)
с двумя бинарными, одной унарной и двумя
нульарными операциями, такую, что
1) (#, v, л, 0,1) — симметричное
полукольцо;
2) a v а =1 и а а а = 0 (для любого
а).
Дополнение в булевой алгебре называют
булевым дополнением, а все операции булевой
алгебры — булевыми операциями.
Рассмотрим примеры булевых алгебр.
Пример 9.2.7. Полукольцо В (см.
пример 9.2.2) является булевой алгеброй. Эта
булева алгебра — важнейшая структура. Мы
назовем ее двухэлементной булевой алгеброй и
обозначим В. Видно, что в В 0 = 1, 1=0.
Пример 9.2.8. На множестве {0, 1}
определим структуру булевой алгебры, положив
для произвольных а = (сц,..., ап), р =
= (Р1,...,Р,7) из {0,1}", что
avp = (ai vpb...,a„ vp„),
алР = (а! лр1,...,аялр„),
а = (аь...,ая),
0 = (0,...,0),
1 = (1,..Д).
Можно показать, что все аксиомы
булевой алгебры выполняются. Носитель
определенной таким образом булевой алгебры
называют булевым кубом размерности п , а его
элементы — булевыми векторами (или
наборами) размерности п. Вектор 0 называют
при этом нулевым булевым вектором или
нулевым набором, а вектор 1 — единичным булевым
вектором или единичным набором. Заметим,
что случаи /1 = 0 и /1 = 1 включаются в эту
конструкцию. При п = 1 получаем уже
рассмотренную двухэлементную булеву алгебру
В, а при л = 0— так называемую
одноэлементную булеву алгебру, в которой 0 = 1.
Булевы операции над булевыми
векторами выполняются покомпонетно — так же,
как сложение векторов или умножение
вектора на число в линейной алгебре. Отношение
порядка здесь определено также
покомпонентно, т.е. для произвольных a =
= (a,,...,a„), р=(р,,...,ря)е{0,1}я нера-
венство a < Р означает, что ос, < р,,
/ = \,п . Так, например,
(0, 1,0, 0, 1)<(1, 1, 0, 0, 1),
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
359
а векторы (0, 1, 0, 0, 1) и (0, 1, 0, 0, 0) не
сравнимы.
Пример 9.2.9. Полукольцо SA есть
булева алгебра, в которой все булевы операции
есть не что иное, как обычные теоретико-
множественные операции, т.е. булево
объединение есть обычное объединение множеств,
булево пересечение — пересечение множеств,
булево дополнение — дополнение множества.
Теория булевых алгебр имеет
многочисленные приложения: в математической
логике, в теории вероятностей. Она позволяет, в
частности, рассматривать с единой точки
зрения операции над множествами, над
высказываниями, над случайными событиями.
Неориентированные графы
1
Неориентированный граф G задается двумя
множествами
G = {V,E),
где V — конечное множество, элементы
которого называют вершинами, или узлами, Е —
множество неупорядоченных пар на V , т.е.
подмножество множества двухэлементных!
подмножеств V , элементы которого называют
ребрами. Для каждого ребра \u,v\ е Е
считаем, что и и v — различные вершины.
Если ребро е = (u,v), то говорят, что ребро е
соединяет вершины и и v , и обозначают это
и w v ; если необходимо, указывают имя графа
G'.UHq V .
Вершины и и v , соединенные ребром
(u^v), называют смежными, а также концами\
ребра {u,v}. Если u^v, говорят, что
вершины и и v связаны отношением непосредА
ственной достижимости.
Ребро е называют инцидентным вершине v ,
если она является одним из его концов.
Глава 9.3
ТЕОРИЯ ГРАФОВ
9.3.1. Основные определения. Графы
есть способ «визуализации» связей между
определенными объектами. Связи эти могут
быть «направленными» или
«ненаправленными». В соответствии с этим в теории
графов выделяют два основных типа графов:
ориентированные (или направленные) и
неориентированные. Построение
математического определения графа осуществляется
путем формализации и «объектов», и «связей»
как элементов некоторых (как правило,
конечных) множеств (табл. 9.3.1).
Таблица 9.3.1
Ориентированные графы
| 2
^Ориентированный граф G задается двумя
множествами
G = {V,E),
-где V — конечное множество, элементы ко-
- торого называют вершинами, или узлами, Е
<• — множество упорядоченных пар на V , т.е.
х подмножество множества V xV, элементы
т которого называют дугами.
1 Если дуга е = (и, v), то говорят, что дуга е
э ведет из вершины и в вершину v , и обозна-
а чают это и -» v ; если необходимо, указывают
имя графа G.u -*G v .
а Вершины и и v , такие, что из вершины и в
и вершину v ведет дуга (u-^v), называют
.{смежными, причем и называют началом, a v
I— концом дуги {u,v). Дугу, начало и конец
которой есть одна и та же вершина, называют
петлей. Если и —> v, то говорят, что вершины
\ и и v связаны отношением непосредственной
достижимости.
'Дугу (u,v) называют заходящей в вершину v
и исходящей из вершины и. Дугу называют
инцидентной вершине v , если она или заходит
В V ИЛИ ИСХОДИТ ИЗ V .
360 Глава 9.3. ТЕОРИЯ ГРАФОВ
Продолжение табл. 9.3.1
1
Степенью вершины v называют число dga
всех инцидентных ей ребер.
Для вершины v множество
T(v) = {x:x~v}
называют множеством смежных с v вершин.
Справедливо равенство
dg(»Hr(4
Цепь в неориентированном графе G — это
последовательность вершин (конечная или
бесконечная) Vq , V\, ..., vn, ..., такая, что
vil~iVi+i лпя любого / , если а,+1
существует. (Под конечной последовательностью
понимается кортеж вершин.)
Для конечной цепи Vq , V\, ..., vn число п
(п > 0) называют длиной цепи. Таким образом,
длина цепи есть число ее ребер, т.е. всех
ребер, соединяющих вершины а, и а,+1
1 / = 0,л - 11. Цепь длины 0 — это
произвольная вершина графа.
Говорят, что вершина v неориентированного
графа G достижима из вершины и этого
графа и обозначают «N v, если существует
цепь Vq, V\, ..., vn, такая, что u = Vq,
vn = v (при этом говорят также, что данная
цепь соединяет вершины и и v, которые
называют концами цепи). Таким образом, зада- |
2
Полустепенью захода вершины v называют
число dg~(a) заходящих в нее дуг, а полусте-
\ пенью исхода вершины v — число dg+(a)
исходящих из нее дуг. Степень вершины v ,
обозначаемая dg(a) — это сумма
полустепеней захода и исхода.
Для вершины v множество
T(v) = {x:v -> jc}
называют множеством преемников вершины v ,
а множество
T-\v) = {x:x->v}-
множеством предшественников вершины v.
Справедливы равенства
<Jg»=lrH>
dg-(,) = |r-'(^.
Путь в ориентированном графе G — это
последовательность вершин (конечная или
бесконечная) v0, v{, ..., vn, ..., такая, что
vt —> vi+i для любого / , если vi+i
существует.
Для конечного пути Vq , V[, ..., vn число п
называют длиной пути (п > 0). Тем самым
длина пути есть число его дуг, т.е. всех дуг,
которые ведут из вершины v{ в вершину vi+[
1 / = 0, п - 11. Путь длины 0 — это
произвольная вершина графа.
Говорят, что вершина v ориентированного
графа G достижима из вершины и этого
графа и обозначают и => v , если существует
ПУТЬ Vq, V[, ..., Vn , ТаКОЙ, ЧТО U = Vq,
v = vn (при этом говорят, что данный путь
ведет из вершины и в вершину v , называя
первую вершину началом, а вторую — концом
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
361
Окончание табл. 9.3.1
но отношение достижимости N в неориенти
рованном графе. Оно является рефлексивно
транзитивным замыканием отношения —
непосредственной достижимости.
данного пути). Таким образом, задано
отношение достижимости => в ориентированном
графе. Оно является рефлексивно-
транзитивным замыканием отношения —>
непосредственной достижимости.
Отношение достижимости в
неориентированном графе рефлексивно, симметрично и транзи-
тивно, т.е. является отношением
эквивалентности.
Отношение достижимости в ориентированном
графе рефлексивно и транзитивно, но в общем
случае не антисимметрично, так как если две
вершины ориентированного графа достижимы
одна из другой, то из этого вовсе не следует,
что они совпадают. Таким образом, отношение
достижимости в ориентированном графе есть
отношение предпорядка.
Если существует цепь ненулевой длины,
соединяющая и и v , то пишут
Если необходимо явно указать длину цепи, то
пишут
и говорят, что существует цепь длины п ,
соединяющая и и v .
Если существует путь ненулевой длины,
ведущий из и в v , то пишут
и =>+ v .
Если необходимо явно указать длину пути, то
пишут
и говорят, что существует путь длины п ,
ведущий ИЗ U В V .
Простая цепь — это цепь, все вершины
которой, кроме, быть может, первой и последней,
попарно различны и все ребра попарно
различны.
Простой путь — это путь, все вершины
которого, кроме, быть может, первой и последней,
попарно различны.
Простую цепь ненулевой длины с
совпадающими концами называют циклом.
Простой путь ненулевой длины, начало и
конец которого совпадают, называют контуром.
Произвольную цепь ненулевой длины с
совпадающими концами, все ребра которой попарно
различны, будем называть замкнутой цепью.
Произвольный путь ненулевой длины, начало
и конец которого совпадают, будем называть
замкнутым путем.
Неориентированный граф, не содержащий
циклов, называют ациклическим графом.
Ориентированный граф, не содержащий
контуров, называют бесконтурным
ориентированным графом.
Пример 9.3.1. Рассмотрим
неориентированный граф, изображенный на рис. 9.3.1. Он
задается множеством вершин
и множеством неупорядоченных пар
В этом графе последовательность
вершин V[, ^3,^4 есть простая цепь, а
последовательность V[,z^,V2,V[,V2yV^ — цепь, не
являющаяся простой. Последовательность
У|,Уз,v2,V[ есть цикл, а последовательность
v4,z^,v[,V2,V2,v4 - цепь с совпадающими
362
Глава 9.3. ТЕОРИЯ ГРАФОВ
концами, но не цикл, поскольку эта цепь не
является простой. Эта цепь не будет и
замкнутой, так как в ней есть повторяющееся
ребро {v3,v4}.
Вершины Vi,V2,v^,V4 попарно
достижимы Ivj =* Vj,i,j е {1,2,3,4}) и образуют
класс эквивалентности по отношению
достижимости. Заметим, что вершина Vj, по
определению, образует цепь длины 0 и
эквивалентна по отношению достижимости только
самой себе.
Пример 9.3.2. Обратимся к
ориентированному графу, изображенному на рис. 9.3.2.
Он задается множеством вершин
^ = {и1 > °2»^3»Щ 9 v5 9 v6 } и множеством дуг
Е = {(Ч9Ъ)9(Щ,Щ),{*>29°1)>{°2>°3)>{°2>Щ)>
{^39V\)9(v3,v4),(v5,v6),(v6,v4)}.
В этом ориентированном графе
последовательность вершин ^1,^2,^3,^4 есть простой
путь, а последовательность вершин
^1,02,^3,^1,^3» ^4 "~ путь, не являющийся
простым, поскольку в нем, например, 2 раза
встречается вершина г>$ , не служащая
началом и концом пути.
Последовательность вершин 03,^1,02,03
есть контур, а последовательность
^3,^1,^2,^1,^3 — замкнутый путь, но не
контур, поскольку вершина г\ , не являющаяся
началом пути, встречается 2 раза.
Отношение достижимости в
неориентированных и ориентированных графах обладает
следующим важным свойством.
Теорема 9.3.1. Если две вершины
неориентированного графа соединены цепью, то
существует и простая цепь, соединяющая их.
Если вершины u,v ориентированного графа
таковы, что существует путь, ведущий из и в
v , то существует и простой путь, ведущий из
и в v .
Следствие 9.3.1. Если вершина
неориентированного графа содержится в некоторой
замкнутой цепи, то она содержится и в
некотором цикле. Если вершина
ориентированного графа содержится в некотором
замкнутом пути, то она содержится и в некотором
контуре.
Определение 9.3.1. Неориентированный
(ориентированный) граф G\ = (У\,Е[)
называют подграфом неориентированного
(ориентированного) графа G = {V, Е), если
Vx с V и Е{ с Е.
Будем использовать обозначение
G) с G, аналогичное обозначению
включения для множеств.
Если хотя бы одно из указанных двух
включений в определении 9.3.1 строгое, то
G\ называют собственным подграфом графа
G ; если V\ = V , то G\ называют остовным
подграфом графа G .
Подграф G[ неориентированного
(ориентированного) графа G называют
подграфом, порожденным множеством вершин
V\ с V, если каждое ребро (дуга) тогда и
только тогда принадлежит Е\ с Е, когда его
концы принадлежат Vy. Часто в случае, если
множество вершин V\ подразумевается,
говорят просто о порожденном подграфе.
Подграф G\ с G называют
максимальным подграфом, обладающим данным
свойством Р, если он не является собственным
подграфом никакого другого подграфа графа
G , обладающего свойством Р.
Например, на рис. 9.3.3 подграфы
Gj, £2,63 являются максимальными
ациклическими подграфами графа G . Отметим, что
они также являются собственными и остов-
ными подграфами указанного графа.
Рис. 9.3.2
G2 G3
Рис. 9.3.3
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
363
Следующее важное понятие снова
графов (табл. 9.3.2).
Неориентированные графы
Неориентированный граф называют связным,
если любые две его вершины и и v
соединены цепью ыи* v).
Компонента связности (или просто
компонента) неориентированного графа — это его мак-
симальный связный подграф.
В неориентированном графе две
вершины, соединенные цепью, связаны
отношением достижимости, которое является
эквивалентностью. Поэтому компонента такого
графа — это подграф, порожденный некоторым
классом эквивалентности вершин по
отношению достижимости. Две различные
компоненты не пересекаются, т.е. не имеют ни
общих вершин, ни общих ребер.
Так как отношение достижимости в
ориентированном графе не является
эквивалентностью, то компоненты
ориентированного графа могут пересекаться.
Пример 9.3.3. Граф, изображенный на
рис. 9.3.1, не является связным. Он состоит из
трех компонент. Эти компоненты порождены
тремя классами эквивалентности по
отношению достижимости, указанными в примере
9.3.1.
Связными являются все графы,
изображенные на рис. 9.3.3.
Рис. 9.3.4
В ориентированном графе,
изображенном на рис. 9.3.4, имеются две компоненты
связности: Q и С2, которые пересекаются.
Для ориентированного графа можно
определить также понятия сильной и слабой
связности.
Определение 9.3.2. Ориентированный
граф называют сильно связным, если для
любых двух его вершин и и v вершина v дос-
параллельно для рассматриваемых двух видов
Таблица 9.3.2
Ориентированные графы
Орграф называют связным, если для любых
двух его вершин и , v вершина v достижима
из вершины и или вершина и достижима из
вершины v lu =>* v или v =>* и).
Компонента связности (или просто
компонента) ориентированного графа — это макси-
мальный связный подграф.
тижима из вершины и и вершина и
достижима из вершины v Iи =>* v и v=**u).
Бикомпонента ориентированного графа — это
его максимальный сильно связный подграф.
Если и =>* v и v=$* и , то говорят, что
и и v связаны отношением взаимной
достижимости. Это бинарное отношение
рефлексивно, симметрично и транзитивно, т.е.
является отношением эквивалентности.
Следовательно, две различные бикомпоненты не
пересекаются.
Пример 9.3.4. В ориентированном графе,
представленном на рис. 9.3.4, имеются четыре
бикомпоненты B^Bj,B^ и 2?4 ^ТО
подграфы, порожденные соответственно
множествами вершин {^}, {^2»^3}» {^4>y5} и
Определение 9.3.3. Неориентированный
граф G\ ={V\,E\) называют ассоциированным
с ориентированным графом G = (V, Е), если
его множество вершин совпадает с
множеством вершин ориентированного графа G , а
пара {и, v} образует ребро тогда и только
тогда, /когда и & v и из и в v или из v в и
ведет дуга, т.е. V\-V и
Е) = {{и, v}: (и, v) е Е или (v, u)e E,u*v\.
Таким образом, переход от
ориентированного графа к ассоциированному с ним
неориентированному графу состоит в
"стирании" ориентации дуг ориентированного
графа с учетом того, что все петли исчезают, а
дуги (и, v) и (р, и) при и # v переходят в
одно и то же ребро [и, v].
Определение 9.3.4. Ориентированный
граф называют слабо связным, если ассоции-
364
Глава 9.3. ТЕОРИЯ ГРАФОВ
рованный с ним неориентированный граф
связный. Компонентой слабой связности
(слабой компонентой) ориентированного графа
называют его максимальный слабо связный
подграф.
9.3.2. Способы представления. Можно
задать граф как пару множеств, следуя
определению, однако этот способ является довольно
громоздким. Рассмотрим три наиболее
распространенных способа представления графов.
Матрицу (д„ V ч, определенную ука-
^ у '(пхт)
занным образом, называют матрицей инциден-
ций.
В матрице инциденций в каждом
столбце только два ненулевых элемента, что делает
этот способ представления графа
неэкономным при большом количестве вершин. Кроме
того, решение практических задач с помощью
матрицы инциденций весьма трудоемко.
Например, временные затраты на
решение с помощью матрицы инциденций задачи
анализа окружения данной вершины vk
(множества преемников и множество
предшественников вершины vk ) в ориентированном
графе составляют О (dgfy).
Поиск "окружения" всех вершин займет
время порядка произведения числа вершин
ориентированного графа на сумму степеней
всех вершин, которая пропорциональна числу
дуг ориентированного графа.
Более эффективной матричной
структурой, представляющей граф, служит матрица
смежности вершин, или булева матрица графа.
Это квадратная матрица В порядка п,
элементы которой определяют следующим образом:
для неориентированного графа
П,если /-я иу-я вершины смежные,
lJ [0, если иначе,
для ориентированного графа
Предположим, что все вершины и все
ребра неориентированного графа или все
вершины и все дуги (включая петли)
ориентированного графа пронумерованы начиная с
единицы. Граф (неориентированный или
ориентированный) может быть представлен в виде
матрицы размера пхт, где п — число
вершин, am- число ребер (или дуг). Для
неориентированного графа элементы этой
матрицы задаются следующим образом:
П,если из /-Й вершины ву'-ю ведет дуга,
[О, если иначе.
В к -строке матрицы ориентированного
графа, количество единиц равно полустепени
исхода dg+^ вершины v^ , а количество
единиц в к -м столбце — полустепени захода
6g~vk .
Для неориентированного графа матрица
смежности вершин симметрическая.
Можно показать, что с использованием
матрицы смежности вершин решение задачи
поиска окружения всех вершин
ориентированного графа будет иметь сложность порядка
2
п , что эффективнее предыдущей оценки
пт, если число дуг ориентированного графа
превышает число его вершин.
Во многих задачах граф создается
динамически, т.е. в ходе решения задачи меняется
множество вершин и множество ребер (или
дуг). В этом случае эффективным способом
машинного представления графа являются
списки смежности (или списки инцидентности).
Рассмотрим ориентированный граф. Для
задания множества вершин, непосредственно
достижимых из вершины v , используют
линейный однонаправленный список. Каждый
элемент такого списка включает данные
(например, некоторое число) и указатель на
следующий элемент списка. Список в целом
задается указателем на его первый элемент
(голову списка). Последний элемент списка
содержит "пустой" указатель.
1,если для /-й вершины у'-е ребро инцидентное,
и |0, если иначе.
Для ориентированного графа элементы матрицы задаются так:
ач =
1, если для /-й вершины у-я дуга выходящая,
-1, если для /-й вершины у-я дуга заходящая,
О, если иначе.
ДЕРЕВЬЯ
365
Задать для вершины v ее список
смежности означает в произвольном порядке
поместить в данные элементов списка номера
вершин и, для которых в ориентированном
графе есть дуга из v в и(р-^и). Список
смежности вершины, v обозначают L (а).
Список смежности вершины может при
необходимости дополняться.
Если количество вершин
ориентированного графа известно заранее, то
ориентированный граф удобно задавать в виде
структуры, называемой массивом лидеров.
Под массивом мы понимаем матрицу-
столбец, элементами которой могут быть
некоторые объекты (например, элементы списка
смежности). Их называют элементами
массива. Число элементов массива лидеров равно
числу вершин графа. Элементами массива
лидеров являются первые элементы списков
смежности вершин ориентированного графа.
Пример представления ориентированного
графа списками смежности, собранными в
массив лидеров, представлен на рис. 9.3.5.
С использованием списков смежности
задача поиска преемников вершин для всего
ориентированного графа потребует времени
порядка числа его дуг. Менее эффективно
решается задача поиска предшественников
вершины, так как в этом случае необходимо,
вообще говоря, просмотреть списки
смежности всех вершин с целью поиска в них данной
вершины.
Задача поиска "окружения" с
использованием списков смежности является более
трудоемкой, чем в случае использования
матриц. Однако удобство динамического
формирования описания ориентированного графа в
данном случае перевешивает.
Неориентированный граф задать с
помощью списков смежности можно так же, как
и ориентированный. Здесь в список
смежности вершины v войдут все вершины, смежные
с ней, а списки смежности могут быть
собраны в массив лидеров. Для
неориентированного графа на решение задачи поиска
"окружения" для всего неориентированного
графа потребуется время, пропорциональное
произведению числа вершин графа на число
его ребер.
Еще одна матрица, характеризующая
граф, - так называемая матрица
достижимости. Это матрица С типа \V\ x |К|, каждый
элемент Су которой равен 1, если j -я
вершина достижима из / -й вершины, и равен О,
если иначе. Отметим, что, согласно
определению достижимости, элементы Сц = 1 . Метод
ЯН'1
Н~-Ч"2|0+-Ч1'
Рис. 9.3.5
вычисления матрицы достижимости
ориентированного графа по его матрице смежности
будет рассмотрен в 9.3. Матрица
достижимости несет очень важную информацию об
ориентированном графе. Ее анализ позволяет,
например, найти его бикомпоненты и
компоненты.
9.3.3. Деревья. Определение 9.3.5.
Неориентированным деревом называют связный
ациклический неориентированный граф.
Определение 9.3.6. Ориентированным
деревом называют бесконтурный
ориентированный граф, у которого полустепень захода
любой вершины не больше 1 и существует ровно
одна вершина, называемая корнем
ориентированного дерева, полустепень захода которой
равна 0.
Опираясь на данное определение,
можно доказать, что в ориентированном дереве
любая вершина достижима из корня.
Отметим, что из определения 9.3.6
нельзя убрать требование бесконтурности
ориентированного графа, поскольку бесконтурность
не вытекает из других условий.
Определение 9.3.7. Вершину v
ориентированного дерева называют потомком
(подлинным потомком) вершины и, если
существует путь из и в v (путь ненулевой
длины из и в v ). В этом же случае вершину и
называют предком {подлинным предком)
вершины v , а если длина пути из и в v равна 1,
то вершину v называют сыном вершины и,
которая при этом вполне естественно
именуется отцом вершины v . Вершину, не
имеющую потомков, называют листом.
На рис. 9.3.6 вершины щ и v5 есть
сыновья вершины а2 » которая, в свою
очередь, является сыном вершины щ — корня
Збб
Глава 9.3. ТЕОРИЯ ГРАФОВ
Уровень 3
Уровень 2
Уровень 1
Уровень О
Рис. 9.3.6
дерева. Вершины v4 и v$ являются
подлинными потомками вершин щ и а2» которые
соответственно будут их подлинными
предками. Вершины Vi,V4,v5,v6,V9,v% - листья
дерева. Взаимно недостижимые вершины
ориентированного дерева (например, такие,
как V2 и v$) не являются ни предком, ни
потомком одна другой. Каждая вершина будет
сама для себя предком и потомком, но не
подлинным.
Определение 9.3.8. Произвольный
ациклический граф называют неориентированным
лесом. Ориентированный граф, каждая слабая
компонента которого является
ориентированным деревом, называют ориентированным
лесом.
Определение 9.3.9. Подграф
неориентированного (ориентированного) дерева,
являющийся неориентированным (ориентированным)
деревом, называют поддеревом исходного
дерева.
Из определения следует, что
неориентированный лес — это неориентированный
граф, каждая компонента которого является
неориентированным деревом.
Определение 9.3.10. Ориентированное
дерево, у которого каждая вершина, отличная
от корня, есть лист, называют кустом.
Определение 9.3.11. Высота
ориентированного дерева — это наибольшая длина пути
из корня в лист; глубина d(v) вершины
ориентированного дерева v — это длина пути из
корня в эту вершину; высота вершины
ориентированного дерева vh(v) — это наибольшая
длина пути из данной вершины в лист и,
наконец, уровень вершины ориентированного
дерева — это разница между высотой
ориентированного дерева и глубиной данной вершины.
Уровень корня равен высоте
ориентированного дерева, но уровни различных листьев,
так же, как и их глубины, могут быть
различными; высота любого листа равна нулю (см.
рис. 9.3.6).
Определение 9.3.12. Ориентированное
дерево называют бинарным, если полустепень
исхода любой его вершины не больше 2;
бинарное ориентированное дерево называют
полным, если из любой его вершины, не
являющейся листом, исходят ровно две дуги, а
уровни всех листьев совпадают.
Используя индукцию по высоте
ориентированного дерева, можно показать, что в
полном бинарном ориентированном дереве
высоты h ровно 2 листьев.
Теорема 9.3.2. (Теорема о высоте
бинарного ориентированного дерева с заданным
числом листьев). Бинарное ориентированное
дерево с п листьями имеет высоту, не меньшую
log2 п .
Эта теорема имеет одно весьма
интересное приложение к задаче сортировки.
Предположим, что необходимо расположить строго
по возрастанию элементы конечного линейно
упорядоченного множества {щ,..., ап }.
Можно показать, что число шагов
алгоритма сортировки будет величиной,
пропорциональной высоте дерева решений, не
меньшей, чем log2/i!, в силу теоремы 9.3.2.
Используя формулу Стирлинга для оценки
факториала при больших п получим, что
дерево решений имеет высоту порядка п log2 n .
Заметим, что в общем случае
ориентированное дерево - это не связный
ориентированный граф. Компонентами
ориентированного дерева являются его подграфы,
порожденные множеством вершин, расположенных
на некотором пути из корня в лист.
Остовным лесом (деревом)
неориентированного (ориентированного) графа называют
любой его остовный подграф, являющийся
лесом (деревом).
Теорема 9.3.3. У всякого
неориентированного графа существует максимальный
остовный лес.
Утверждение теоремы сохраняет силу и
для ориентированных графов.
Задачи нахождения множества циклов
неориентированного графа и построения
максимальных остовных лесов решаются на
основе приведенных ниже алгоритмов поиска в
глубину.
9.3.4. Остовное дерево наименьшего
веса. Неориентированный (ориентированный)
граф называют взвешенным или размеченным
графом, если каждому ребру (дуге) сопостав-
ОСТОВНОЕ ДЕРЕВО НАИМЕНЬШЕГО ВЕСА
367
лено некоторое действительное число. Это
число называют весом или меткой ребра
(дуги). Как правило, рассматривают граф с
натуральными метками ребер (дуг).
Задачу вычисления для заданного
взвешенного неориентированного графа G остов-
ного дерева с наименьшей суммой весов ребер
- остовное дерево наименьшего веса решает
алгоритм Краскала.
При описании алгоритма будем
использовать способ хранения данных, называемый
очередью. Элементы данных в очереди
упорядочиваются по времени поступления.
Элементы можно добавлять в очередь и извлекать из
очереди. В каждый момент времени доступен
только один элемент, который был помещен в
очередь раньше других - "голова" очереди.
При добавлении новый элемент помещается в
"хвост" очереди, т.е. работа ведется по
обычной для очереди дисциплине — "первым
пришел — первым вышел". Чтобы извлечь из
очереди некоторый элемент, недоступный в
текущий момент, надо извлечь все ранее
поступившие элементы, начиная "с головы"
очереди.
Алгоритм Краскала формально описывается
следующим образом.
1. Множество ребер Н искомого остов-
ного дерева полагаем пустым (// = 0).
2. Формируем множество
Ку = {{^1 }»•••> {°п }}» элементами которого
являются множества вершин,
соответствующих компонентам исходного остовного леса.
Каждая такая компонента состоит из
единственной вершины.
3. Сортируем множество ребер Е
исходного графа по возрастанию весов и
формируем очередь Q, элементами которой являются
ребра графа G.
4. Если множество Vs содержит более
одного элемента (т.е. остовный лес состоит из
нескольких компонент) и очередь Q не пуста,
переходим на шаг 5, если иначе - на шаг 7.
5. Извлекаем из очереди Q ребро е. Если
концы ребра е принадлежат различным
множествам вершин Vj и Vs из Vg , то
переходим на шаг 6, если иначе, то отбрасываем
извлеченное ребро и возвращаемся на шаг 4.
6. Объединяем множества вершин Vj и
Vj (полагая W = Vj kjVj), удаляем
множества Vj и Vj из множества Vs и добавляем в
V§ множество W. Добавляем ребро е в
множество Н. Возвращаемся на шаг 4.
7. Прекращаем работу. Множество Н
есть множество ребер полученного остовного
дерева.
На рис. 9.3.7, а-д для
неориентированного графа показана последовательность
построения остовного дерева наименьшего веса.
Заметим, что результат работы алгоритма в
общем случае зависит от порядка следования
ребер одинакового веса в очереди.
Можно доказать, что наиболее
трудоемким шагом в алгоритме Краскала является
сортировка ребер графа по возрастанию весов.
Поскольку задачу сортировки п элементов
нельзя решить быстрее, чем за время
V* VA
v* vt
'4 "3
6
368
Глава 9.3. ТЕОРИЯ ГРАФОВ
0(/ilog2/i), то сложность алгоритма Крас-
кала оценивается числом 0(|£|log2 |/?|), где
— мощность множества ребер графа.
9.3.5. Методы систематического
обхода вершин графа. Важными задачами
теории графов являются задачи глобального
анализа как неориентированных, так и
ориентированных графов. К этим задачам относятся,
например, задачи поиска циклов или
контуров, вычисление длин путей между парами
вершин, перечисление путей с теми или
иными свойствами и т.п. Базой для решения
многих задач глобального анализа являются
так называемые алгоритмы обхода или
поиска.
Необходимо уметь обходить все
вершины графа, отмечая их так, чтобы каждая
вершина была отмечена ровно 1 раз. Обычно
такое "путешествие" по графу сопровождается
нумерацией вершин графа в том порядке, в
котором они отмечаются, а также
определенной "маркировкой" ребер (или дуг) графа.
Существуют две основные стратегии
таких обходов: поиск в глубину и поиск в ширину.
Алгоритм поиска в глубину. Будем
считать, что неориентированный граф задан
списками смежности, собранными в массив
лидеров.
При поиске вершины графа нумеруются
в порядке их посещения. Номер вершины v
графа, присваиваемый ей при поиске в
глубину, обозначим D[v] и будем называть D-
номером.
В процессе обхода будем находить
фундаментальные циклы графа. Понятие
фундаментального цикла в неориентированном
графе вводится следующим образом. Пусть в
неориентированном графе G = (V,E)
произвольно фиксирован максимальный остовный
лес (см. теорему 9.3.3). Для связного графа это
будет максимальное остовное дерево.
Множество его ребер обозначим Т. Все ребра из Т
назовем древесными, а ребра исходного графа
G, не принадлежащие Г, - обратными.
Таким образом, фиксируя в графе G
максимальный остовный лес, мы тем самым
фиксируем разбиение множества его ребер на
подмножества древесных и обратных ребер. В
силу максимальности остовного леса любая
пара вершин графа G, принадлежащих одной
и той же компоненте связности, соединена
цепью, все ребра которой являются
древесными. Возьмем теперь произвольно две
вершины и и v , принадлежащие одной и той же
компоненте связности графа G. Пусть эти
вершины соединены обратным ребром.
Поскольку они также соединены цепью,
содержащей исключительно древесные ребра, то
существует цикл, содержащий эти две
вершины, в котором будет единственное обратное
ребро {н,а}. Любой цикл графа (7,
содержащий только одно обратное ребро, назовем
фундаментальным.
Можно показать, что не существует двух
различных фундаментальных циклов,
содержащих одно и то же обратное ребро.
Фиксируя в графе максимальный остовный лес, мы
тем самым фиксируем взаимно однозначное
соответствие между множеством обратных
ребер и множеством фундаментальных
циклов.
При поиске в глубину всякое ребро, по
которому из текущей вершины мы попадаем в
неотмеченную ранее вершину, будет
древесным. Каждое ребро, не являющееся
древесным, будет обратным. Максимальный
остовный лес, находимый с помощью алгоритма
поиска в глубину, называют остовным лесом
поиска в глубину или глубинным остовным
лесом.
Заметим, что классификация ребер
зависит от хода работы алгоритма, который
определяется стартовой вершиной и
расположением вершин в списках смежности.
Алгоритм поиска в глубину в
неориентированном графе может быть использован
для вычисления множества фундаментальных
циклов графа — одной из задач глобального
анализа.
Число фундаментальных циклов,
находимое алгоритмом поиска в глубину, не
зависит от выбора начальной вершины. Это число
называют циклическим рангом
неориентированного графа. Разность числа всех ребер
графа и его циклического ранга называется
коциклическим рангом неориентированного
графа.
Формула v = т - п + к связывает
циклический ранг v , число ребер /я, число
вершин п и число компонент связности к
произвольного неориентированного графа G.
Для организации работы алгоритма
поиска в глубину используется способ хранения
данных, называемый стеком. Элементы в
стеке упорядочиваются в порядке
поступления. В стек можно добавлять новые элементы
и из него можно извлекать элементы. При
этом доступен только последний добавленный
элемент — вершина стека, чем и определяется
режим работы стека — (последним пришел —
первым ушел). Образно стек можно
представить в виде стопки тарелок. Из стопки можно
МЕТОДЫ СИСТЕМАТИЧЕСКОГО ОБХОДА СИСТЕМ ГРАФА
369
взять только верхнюю тарелку и только
наверх можно добавить новую. Обычно стек
реализуется в виде списка.
В алгоритме поиска в глубину
используется стек вершин. Мы будем считать, что из
стека можно считывать информацию без
изменения его содержимого, но в том порядке,
в каком ее удаляли бы из стека. Указанная
операция считывания понадобится нам для
поиска фундаментальных циклов.
Перейдем к формальному описанию
алгоритма поиска в глубину.
Вход. Граф G = (V, Е) , заданный
списками смежности.
Выход. Множества Tree древесных
и Back обратных ребер соответственно;
множество Fc фундаментальных циклов,
массив D, содержащий /)-номера вершин.
0. Просмотреть массив лидеров и
сформировать множество Vq вершин графа. Это
множество используется для хранения новых
(необработанных алгоритмом) вершин. В ходе
работы алгоритма обработанные вершины
будут удаляться из этого множества.
В процессе работы алгоритма для
каждой вершины v необходимо знать, какие
вершины из ее списка смежности L[v]
обработаны на предыдущих шагах работы алгоритма.
Для этого формируется массив Lp размера
|Kq|, в котором хранятся номера первых еще
не обработанных алгоритмом вершин списка
смежности L [v] каждой вершины v .
Первоначально все элементы массива Lp полагают
равными 1.
Стек вершин STACK и список вершин
фундаментального цикла Cycle положить
пустыми (STACK = 0, Cycle = 0).
Множества Tree древесных ребер,
Back обратных ребер и Fc фундаментальных
циклов положить пустыми (Tree = 0,
Back = 0,FC = 0). Массив D-номеров D
обнулить.
Задать начальную вершину для поиска
(v = Vq ). (Обычно это первая вершина
массива лидеров.)
Счетчик /)-номеров вершин count
положить равным 1 (count = 1).
1. Если множество Vq не пусто
(^О * 0), перейти на шаг 2, если иначе, - на
шаг 8 (выход).
2. Если стек пуст (STACK = 0) и
алгоритм стартует из вершины щ (count = 1), то
перейти на шаг 3, если иначе, то выбрать из
множества Vq произвольную вершину, из
которой поиск в глубину будет продолжен
(v = u,ue Vq) и перейти на шаг 3.
3. Поместить текущую вершину v в
стек STACK .
Присвоить вершине v /)-номер
(D[v] = count).
Увеличить счетчик /)-номеров на 1
(count = count + 1).
Удалить вершину v из множества Vq
новых вершин.
Перейти на шаг 4.
4. Проверить по элементу Lp [v], что не
достигнут конец списка смежности L\v\
текущей вершины v . Если в списке
смежности есть еще необработанные вершины,
получить из списка смежности очередную
вершину w, увеличить Lp [v] на 1 и перейти на
шаг 6.
Если список смежности L[v] вершины
v обработан полностью, удалить вершину v
из стека STACK и перейти на шаг 5.
5. Если стек STACK пуст, вернуться на
шаг 1, если иначе, то в качестве текущей
вершины v взять вершину, находящуюся в
вершине стека, и перейти на шаг 4.
6. Если вершина w новая (we Vq) , то
добавить ребро {v, w} в множество древесных
ребер
(Tree = Tree u {{v, w}}),
сделать вершину w текущей (v = w) и
вернуться на шаг 3.
Если вершина w не новая (wg Vq) , то
перейти на шаг 7.
7. Если ребра [v, w} нет среди
древесных ({v,w}g Tree), поместить ребро в
список обратных ребер
(Back = Back v {{v,w}}).
370
Глава 93. ТЕОРИЯ ГРАФОВ
Рис. 9.3.8
Поместить вершину w в список Cycle .
Читать содержимое стека STACK , начиная с
вершины стека, до появления вершины w и
помещать в список Cycle (включая вершину
w), т.е. формировать фундаментальный цикл,
соответствующий обратному ребру [v, vv} .
Добавить список Cycle в множество
фундаментальных циклов Fc
(Fc = Fcu {Cycle}).
Список Cycle положить пустым
(Cycle = 0).
Вернуться на шаг 4.
8. Закончить работу.
Пусть для неориентированного графа,
изображенного на рис. 9.3.8, списки
смежности имеют вид
v0 -^(vhv3),v{ -+{v0iv2,v3),O2 ->(v\,v4),
v3 -+(vo,V]3V4,v5),v4 ->(a2,a3),
Здесь запись vt; —> (vk,...,vm) означает, что
кортеж (pk^--4vm) заДает список смежности
вершины Vj .
При выполнении поиска в глубину
выделенные ребра являются древесными,
остальные — обратными. Около каждой
вершины указан присвоенный ей /)-номер.
Фундаментальные циклы в порядке их нахождения
таковы: v], v2, v4, v3 ,v{ и v0, vhV2,v4,u3yv0 .
Поиск в глубину в неориентированном
графе можно использовать и для нахождения
числа его компонент. Это число равно числу
опустошений стека от начала до конца поиска
в глубину. Регистрируя удаляемые из стека
вершины, можно после очередного его
опустошения распечатать номера вершин,
принадлежащих данной компоненте.
В ориентированном графе поиск в
глубину реализуется во многом аналогично
поиску в глубину для неориентированного
графа. В этом случае возникает остовный
ориентированный лес поиска в глубину, дуги
которого — это в точности те дуги, по которым в
процессе работы алгоритма переходят от
очередной вершины к новой, еще не отмеченной
вершине. Можно показать, что это
максимальный остовный лес исходного графа.
Слабыми компонентами этого глубинного
остовного леса будут некоторые
ориентированные деревья. Поэтому используемая далее
терминология из теории деревьев относится к
той или иной слабой компоненте глубинного
остовного леса. В ориентированном графе
вершинам также присваиваются /)-номера.
Но классификация дуг при поиске в глубину
в ориентированном графе сложнее по
сравнению с аналогичной классификацией ребер
при поиске в глубину в неориентированном
графе. Различают четыре класса дуг:
1) древесные дуги — каждая такая дуга
ведет от отца к сыну в глубинном остовном
лесу;
2) прямые дуги - каждая такая дуга
ведет от подлинного предка к подлинному потомку
(но не от отца к сыну) в глубинном остовном
лесу;
3) обратные дуги — от потомков к
предкам (включая все петли);
4) поперечные дуги - все дуги, не
являющиеся ни древесными, ни прямыми, ни
обратными.
Следовательно, в результате работы
алгоритма будут получены множества Tree —
древесных дуг, Back — обратных дуг,
Forward — прямых дуг, С - поперечных дуг
и массив Д содержащий D -номера вершин.
В процессе работы алгоритма по
сравнению с алгоритмом поиска в глубину в
неориентированном графе имеется ряд
особенностей.
Так, если очередная вершина w,
извлеченная из списка смежности текущей
вершины v новая, т.е. (vv € Vq) , то дуга (v,w)
является древесной. Следует добавить дугу
(v, vv) в множество древесных дуг
(Tree = Tree u {(v, vv)}), сделать вершину vv
текущей (v = vv) и начать ее обработку.
Если вершина w не новая (wg J^), то
дуга (v, vv) будет либо прямой, либо
обратной, либо поперечной.
Если /)-номер вершины v строго
меньше /)-номера вершины w(/)[a] < /)[w]), то
МЕТОДЫ СИСТЕМАТИЧЕСКОГО ОБХОДА СИСТЕМ ГРАФА
371
дуга (0, и>) является прямой. Добавляем ее в
множество прямых дуг Forward
(Forward = Forward u (0, w>)).
Если D-номер вершины v не меньше
D-номера вершины w(Z>[t;] > Z>[w]),
необходимо проверить, есть ли в стеке STACK
вершина w. Если вершина w находится в
стеке, то дуга (v,w) является обратной и ее
следует добавить в множество обратных дуг
Back (Back = Back u {(0, н>)}). Если
вершины w в стеке нет, то дуга является
поперечной. Тогда нужно добавить ее в множество
поперечных дуг С(С = Си {(0, н>)}) . Далее
следует перейти к рассмотрению очередной
вершины из списка смежности текущей
вершины (если он не пуст).
Если стек пуст, но не все вершины
ориентированного графа обработаны, поиск
продолжают из любой необработанной вершины.
Можно показать, что алгоритм поиска в
глубину имеет сложность порядка
тах(|К|,|£|).
В случае ориентированного графа поиск
контуров на базе поиска в глубину
существенно сложнее, чем в случае
неориентированного графа, и здесь не рассматривается.
Можно показать, что ориентированный граф
является бесконтурным тогда и только тогда,
когда при поиске в глубину от некоторой
начальной вершины множество обратных дуг
оказывается пустым.
Для ориентированного графа нет такой
простой связи между числом опустошений
стека и числом компонент, как для
неориентированного графа.
На базе алгоритма поиска в глубину
может быть разработан эффективный алгоритм
поиска бикомпонент в ориентированном гра-
Рис. 9.3.9
Пример 9.3.5. Проведем поиск в глубину
на ориентированном графе, представленном
на рис. 9.3.9. Поиск начнем из вершины Vq .
Пусть списки смежности вершин имеют
следующий вид:
06 -> (03,05), 07 ->(^5^б)-
(9.3.1)
Результаты выполнения поиска в
глубину представлены на рисунке: около каждой
вершины указан ее /)-номер, все древесные
дуги выделены более жирными линиями, а
прямые, обратные и поперечные помечены
соответственно буквами F,B,C .
Первое опустошение стека происходит
после обработки первых пяти вершин (в
порядке обхода): 00,02, Щ, 03,0| •
После опустошения поиск продолжается
из вершины 07 , которой присваивается D-
номер 6. (Напомним, что в приведенном
выше алгоритме после опустошения стека для
продолжения поиска выбирается любая из
необработанных вершин.)
Алгоритм поиска в ширину в
ориентированном графе. В отличие от алгоритма поиска
в глубину, алгоритм поиска в ширину
использует не стек, а очередь вершин. Дадим вариант
поиска в ширину, когда, начиная поиск в
некоторой начальной вершине Vq , мы
останавливаемся при первом же опустошении
очереди. Это значит, что некоторые из
вершин могут остаться неотмеченными. Таким
образом может быть решена задача
распознавания достижимости от заданной вершины.
Мы совместим также поиск в ширину с
вычислением длины кратчайшего пути от 0q до
любой вершины графа. Будем предполагать,
что вершины графа пронумерованы без
пропусков числами от 0 до /V: V = щ : / = О, /V j.
Поиск в ширину рассматриваем только
для ориентированного графа.
Вход. Граф G = (V,E), заданный
списками смежности; Vq — начальная
вершина (не обязательно первый элемент
массива лидеров.)
Выход. Массив Л/ меток вершин, где
каждая метка равна длине пути от v$ до v .
0. Очередь Q положить пустой (Q = 0).
372
Глава 9.3. ТЕОРИЯ ГРАФОВ
Все вершины пометить как недостижимые
из вершины Vq , присваивая элементам массива
Мзначение +°°(М[vj] = +°V = 1, Nj.
Стартовую вершину Vq пометить меткой
О, т.е. длину пути от стартовой вершины щ
до самой себя положить равной О
(Л/[ц)] = 0). Поместить вершину Vq в
очередь Q. Перейти на шаг 1.
1. Если очередь Q не пуста (Q Ф 0), то
из головы очереди извлечь (с удалением из
очереди) вершину и и перейти на шаг 2. Если
очередь пуста, перейти на шаг 3.
2. Если список смежности L(u)
вершины и пуст, вернуться на шаг 1.
Если список смежности L(u) вершины
и не пуст, для каждой вершины w из списка
смежности, где Л/ [и>] = +<» , т.е. вершины,
которую еще не посещали, положить длину
пути из стартовой вершины Vq до вершины w
равной длине пути от vq до вершины и плюс
одна дуга (Л/ [w] = М [и] + 1), т.е. пометить
вершину w и поместить ее в очередь Q. После
просмотра всех вершин списка смежности
L(w) вернуться на шаг 1.
3. Распечатать массив Л/. Закончить
работу.
Алгоритм поиска в ширину может быть
дополнен процедурой "обратного хода",
определяющей номера вершин, лежащих на
кратчайшем пути из вершины Vq в данную
вершину и. Для этого необходимо завести массив
PR размера \V\, каждый элемент которого
fTffw] содержит номер той вершины, из
которой была помечена вершина w.
1
Рис. 9.3.10
Если вершина w находится в списке
смежности L(u) вершины н, заполнение
элемента массива /*/?[>*>] происходит при
изменении метки вершины w Л/[и>]с + оо
на единицу. При этом в элементе fTffw]
сохраняется номер вершины и (PR[w] = и").
Для начальной вершины РЯ^о] можно
положить равным 0, в предположении, что
начальная вершина Vq имеет номер 0 и
остальные вершины пронумерованы от 1 до N.
Сложность рассмотренного алгоритма
поиска в ширину, известного под названием
"алгоритм волнового фронта", составляет
0(max(||/|,|£|)).
Пример 9.3.6. На рис. 9.3.10 дан пример
работы алгоритма волнового фронта (при
поиске из вершины Vq ) для
ориентированного графа, изображенного на рис. 9.3.9.
Списки смежности ориентированного графа
имеют вид (9.3.1).
Около каждой вершины vt поставлена
метка М [vj] , которую получает вершина при
поиске в ширину. Выделены дуги,
составляющие кратчайшие пути из вершины Vq в
остальные. Отметим, что вершины v$ , v^ и
Vj не достижимы из щ и их начальные
метки -И» остались без изменения. При
рассмотренном ходе алгоритма массив PR будет
содержать следующие номера вершин:
PR[vq] = 09 PR [v] ] = 0 , PR[v2] = 0,
PR [v^] = 0 , PR [v4] = 2. Для остальных
величин соответствующие значения не
определены, поскольку они не "посещались".
Используя массив PR, восстановим
кратчайший путь из вершины щ в вершину
v4. Поскольку PR[v4] = 2, a PR[v2] = 0,
искомый путь есть Vq, Vj, v4 ■
9.3.6. Задача о путях во взвешенных
ориентированных графах. Среди задач
анализа ориентированных графов весьма важны
следующие задачи.
I. Вычисление для заданного
ориентированного графа его матрицы достижимости.
Эту задачу будем называть задачей
построения транзитивного замыкания ориентирован-
ЗАДАЧА О ПУТЯХ ВО ВЗВЕШЕННЫХ, ОРИЕНТИРОВАННЫХ ГРАФАХ
373
ного графа. Такое название связано с тем, что
матрицу достижимости можно рассматривать
как матрицу транзитивного и рефлексивного
замыкания бинарного отношения
непосредственной достижимости в ориентированном
графе.
2. Вычисление наименьших расстояний
между всеми парами вершин в
ориентированном графе. Эту задачу будем называть задачей
о кратчайших расстояниях.
Задачу о кратчайших расстояниях можно
сформулировать так. Пусть задан взвешенный
ориентированный граф и пусть из вершины v
достижима вершина w. Фиксируем какой-
либо путь S, ведущий из v в w. Расстоянием
от вершины v до вершины w no пути S
называют сумму меток дуг, входящих в этот
путь, а наименьшим — минимальное из
расстояний между вершинами v и w по всем
возможным путям.
Задача о кратчайших расстояниях не
всегда имеет решение. Например, если в
ориентированном графе есть петля, метка
которой - отрицательное число, то по этой петле
можно проходить сколько угодно раз и тем
самым уменьшать сумму меток дуг пути,
включающего эту петлю, до любого наперед
заданного значения.
Указанные задачи можно решить в
рамках единого подхода, суть которого сводится к
следующему.
Ранее мы ввели понятие взвешенного
неориентированного (ориентированного)
графа, и метки ребер (дуг) определили как числа,
поставленные в соответствие ребру (дуге).
Обобщим это понятие для ориентированного
графа.
Определение 9.3.13. Взвешенным (или
размеченным) ориентированным графом
называют пару W =(G, ф), где G = (V, Е) -
обычный ориентированный граф, а
ф: Е —> R — весовая функция (или функция
разметки) со значениями в некотором
замкнутом идемпотентном полукольце
Я = (Я,+,-,0,1), причем (We E)(tp(e)*0).
Пусть вершины ориентированного графа
каким-либо образом пронумерованы. Тогда
взвешенный ориентированный граф может
быть задан матрицей А, элемент которой dy
равен значению y((i,j)} весовой функции
на дуге (/,у), если из вершины / ведет дуга в
вершину у, или нулю полукольца в противном
случае. Эту матрицу будем называть матрицей
меток дуг.
Вычисление итерации А* матрицы А
дает решение сформулированных выше задач,
если для каждой задачи выбирать
соответствующее полукольцо. А именно, в случае
полукольца 3d (см. пример 9.2.2) получаем
решение задачи о транзитивном замыкании, в
случае полукольца 1V (см. пример 9.2.1) —
решение задачи о кратчайших расстояниях.
Будем называть задачу вычисления
матрицы А * для ориентированного графа,
размеченного над замкнутым полукольцом, общей
задачей о путях во взвешенных
ориентированного графах.
Метка пути, ведущего из вершины Vj в
вершину V;, есть произведение в полукольце Я
меток входящих в путь дуг в порядке их
следования (для пути ненулевой длины) и есть 1
{единица полукольца Я) для пути нулевой
длины.
Стоимость прохождения из вершины Vj
в вершину Vj (или между /-й и у-й
вершинами) — это сумма в полукольце 'Я меток всех
путей, ведущих из вершины ь) в вершину
Vj.
Сумма, определяющая стоимость
прохождения, вообще говоря, есть бесконечная
сумма замкнутого полукольца, т.е. точная верхняя
грань соответствующей последовательности
меток. Это связано с тем, что множество всех
путей, ведущих из одной вершины графа в
другую, в общем случае бесконечно (но, как
можно доказать, не более чем счетно).
Аналогично можно определить
стоимость прохождения между парой вершин по
какому-либо множеству путей. Если
стоимость прохождения между парой вершин по
какому-либо множеству путей равна 0, то это
означает, что не существует пути,
принадлежащего данному множеству путей, ведущего
из первой вершины рассматриваемой пары во
вторую вершину.
Матрица меток дуг является элементом
полукольца матриц над полукольцом 'R . В этом
полукольце определены операции сложения и
умножения матриц, а также возведение
матрицы в неотрицательную степень.
Лемма 9.1. Элемент ау матрицы
/1,/>0, равен стоимости прохождения из
вершины Vj в вершину Vj по всем путям
длины / .
Так как стоимость прохождения между
374
Глава 93. ТЕОРИЯ ГРАФОВ
парой вершин [v^vjj равна сумме меток
всех путей, ведущих из первой вершины во
вторую, а указанную сумму можно получить,
суммируя последовательно метки путей длины
О, длины 1, длины 2 и т.д., то матрица
стоимостей взвешенного ориентированного графа
с учетом доказанной леммы 9.1 может быть
представлена в виде
Теорема 9.3.4. Матрица стоимостей
ориентированного графа (7, размеченного над
замкнутым полукольцом Я , равна итерации
матрицы А меток дуг ориентированного графа
G.
Для вычисления С = А* достаточно
решить (т.е. найти наименьшее решение) в Я
при всех j = \,п систему уравнений
t, = At, + Zj,
где е. е Я" — у-й единичный вектор, т.е.
вектор, все элементы которого, кроме у-го,
равны 0, а у-й равен единице полукольца Я .
Наименьшее решение имеет вид ^ = A Ej
(см. 9.2). Тогда столбец £, = А*е .• есть у-й
столбец матрицы А*. Такой метод
вычисления матрицы А* аналогичен известному из
линейной алгебры методу элементарных
преобразований при вычислении обратной
матрицы.
Для полукольца 3d матрица стоимостей
совпадает с матрицей достижимости
ориентированного графа. В полукольце Я матрица
стоимостей является матрицей кратчайших
расстояний, т.е. наименьших длин путей
между всеми парами вершин ориентированного
графа.
Рис. 9.3.11
Пример 9.3.7. Рассмотрим граф,
изображенный на рис. 9.3.11, и решим для него
задачу вычисления матрицы достижимости. На
числовые метки дуг внимания пока не
обращаем, считая, что ориентированный граф
размечен над полукольцом J8 и метка каждой
дуги равна 1, т.е. ориентированный граф
задан матрицей
(О 1 1 \Л
О 110
"0 1 0 0 Г
10 10
V /
Запишем систему уравнений в
полукольце J3 для определения первого столбца
матрицы А *:
\х\ = х2 + *з + *4 + 1,
\xj = Xj + Хл + 0,
\ l l (9.3.2)
\х3 = х2 +®>
[х4 = х{ +х3 +0.
Отметим, что часто нулевые слагаемые
не записывают, как и в системах уравнений в
поле действительных чисел.
Воспользуемся методом
последовательного исключения неизвестных (см. 9.2).
Поскольку в правой части первого уравнения нет
переменной х± , можно исключить эту
переменную из системы, подставив ее в остааьные
уравнения. С учетом идемпотентности
сложения получим
\х2 ~ х2+ ХЪ + 0>
1 х3 = х2 +0,
[х4 - х2 + х3 + х4 + 1.
Из второго уравнения имеем
*2 = 1 (*з + 0) • В полукольце Ъ итерация
любого элемента равна единице полукольца.
Поэтому х2 = х3 +0 . Исключив х2 из сис"
темы, получим
\х3=х3 +0,
\х4 = х3 + х4 + 1.
Далее вычислим х3 = Г0 = 1 0 -- 0 .
Подставив х3 = 0 в последнее уравнение, найдем
х4 = 1*1 = 1.
Итак, первый столбец А * есть
ЗАДАЧА О ПУТЯХ ВО ВЗВЕШЕННЫХ, ОРИЕНТИРОВАННЫХ ГРАФАХ
375
'О
О
О
к1 j
Аналогично вычисляем второй, третий и
четвертый столбцы и в результате получаем
матрицу А *:
А*
О
О
1
1 1
1 1
1 1
1 1
о
о
1
Анализ этой матрицы показывает (см.
9.3), что данный граф связный и имеет две
бикомпоненты: {^j,^} и {г^^з}-
Заметим, что в полукольце 33 наимень-
п
шее решение уравнения xk = jT ЩХ{ + 1 есть
/=1
хк = 1 и не зависит от значений переменных
в правой части уравнения. С учетом этого
решение системы (9.3.2) упростится. Так, из
первого уравнения сразу получаем Х\ = 1.
Тогда четвертое уравнение принимает вид
х4 = Хз + 1 , откуда х4 = 1 . Поскольку Х\ и
х4 не входят в оставшиеся два уравнения, их
решение нужно искать, используя метод
исключения.
Пример 9.3.8. Для графа, изображенного
на рис. 9.3.11, вычислим матрицу кратчайших
расстояний, перейдя к полукольцу Я+. Для
упрощения записи *> здесь будем понимать
как 4оо.
Взвешенный ориентированный граф
задается теперь следующей матрицей:
10
3
1
оо оо
(9.3.3)
Система для вычисления первого
столбца матрицы А * имеет вид
х{ = 5х2 + 10*3 + 1*4 + 0,
х2 = 2х2 + 3*з + °°,
х3 = 1*2 + °°>
*4 = 3*i + 4*з + °°-
Обратим внимание, что элементы 1 и 0
не являются единицей и нулем полукольца, т.е.
х * х + 0 и х*\ • х в общем случае.
Заметим, что наличие слагаемого 0 в любой сумме
(в полукольце) означает, что вся сумма равна
0; слагаемое +©о можно не записывать (как
нуль полукольца).
Из первого уравнения системы сразу
следует, что Х\ = 0 . Поскольку итерация
любого элемента в рассматриваемом полукольце
равна единице полукольца, то из второго
уравнения получаем
х2 = 2* (Зх3 + оо) = 3х3.
Исключая х2 из остальных уравнений
системы и учитывая, что Х\ = 0 , получаем
\х2 = Зх3 + ~,
\х3 =1(Зх3) + оо,
[х4 =30 + 4х3 + °°.
Далее, из второго уравнения имеем
х3 = (1 ■ 3) *з + °° = 4*з + °°>
откуда х3 = 4* • оо = оо , и поэтому
х4 =3-0 + 4-оо + оо = 3 + 4 = 3.
Подставляя найденное значение х3 в
выражение для х2 , получаем х2 = ©о . Первый
столбец искомой матрицы вычислен:
Этот столбец содержит кратчайшие
расстояния от всех вершин графа до вершины V\ .
Наличие в нем нулей полукольца во второй и
третьей строках свидетельствует о том, что
вершина vy не достижима из вершин v2 и
v3.
Аналогично вычисляются остальные
столбцы матрицы А*. Результат будет
следующим:
0 5 5 1
оо 0 3 оо
А* =
1 О
5 4
376
Глава 9.3. ТЕОРИЯ ГРАФОВ
Помимо изложенного есть еще один
способ вычисления замыкания матрицы с
элементами в замкнутом полукольце. Он
основан на понятии пути ранга к из вершины
Vj в вершину Vj .
Пусть в ориентированном графе
выбрана и зафиксирована нумерация вершин.
Будем полагать, что все вершины
пронумерованы подряд натуральными числами, начиная с
1.
Путь VjQ —» Vj —>... —> Vj длины т
называют путем ранга к при т > 1 , если к -
наибольшее среди чисел i\,...,im_\ , и путем
ранга 0 при т - 1 . Путь нулевой длины
также считают путем ранга 0. Таким образом,
ранг пути — это максимальный номер
вершины, в которую разрешено заходить по пути из
Vj в V; (исключая вершины Vj и v.-). Путь
ранга 0 не содержит промежуточных вершин.
Максимальный ранг пути в ориентированном
графе при указанном выше способе
нумерации равен числу его вершин.
Обозначим через матрицу
стоимостей прохождения между различными парами
вершин по всем путям ранга, не
превосходящего к. Ее элемент Cj- ' содержит стоимость
прохождения из вершины у,- в вершину V;
по всем путям рангов 0,1,..., к - 1, к .
Приведем формулу для вычисления
элемента с\^ матрицы С(*) (рис. 9.3.12):
М) _ЛкА) (к^)Пк-\)\ (к-\)
Cij ~Cij +Cik \скк ) ckj '
(9.3.4)
Пусть ay — элементы матрицы меток
дуг ориентированного графа. Элементы мат-
С(0)
имеют вид
рицы
Ч са
(k-l)
,(k-l)
ДО) = К, если , * ,, (9.3.5)
у [1 +Д//, если / = j.
Тогда матрицу стоимостей С = А* можно
найти, вычисляя последовательно матрицы
при к = 0,1,..., п , по формулам (9.3.4) и
(9.3.5).
Вычисления согласно формулам 9.3.4 и
9.3.5 образуют алгоритм Флойда - Уоршелла
— Клини для вычисления стоимости
прохождения между любыми парами вершин.
Для полуколец j8 и Я+ в силу того, что
в них итерация любого элемента х равна
единице полукольца, получим упрощенный
вариант формулы (9.3.4):
{k)_Jk-\)^(k-i)(k-\)
:Cil
+ cb
Чг
(9.3.6)
Решим описанным способом задачу о
кратчайших расстояниях в графе,
изображенном на рис. 9.3.П. Для него О -А, где
матрица А имеет вид (9.3.3). Используя
формулу (9.3.6), последовательно находим
С0) =
с& =
о
5
о
I
8
5
0
I
5
10
3
о
4
8
3
о
4
1
,d2) =
о
уз
О)
,с
(4)
5
0
1
8
5
0
1
5
8
3
0
4
5
3
0
4
1
о
П
Рис. 9.3.12
9.3.7. Изоморфизм графов. Для
ориентированного графа (V, Е) множество Е дуг
можно рассматривать как график бинарного
отношения непосредственной достижимости,
заданного на множестве вершин.
В неориентированном графе (V, Е)
множество Еребер является множеством
неупорядоченных пар. Для каждой неупорядоченной
пары {и, v}e E можно считать, что вершины
и и v связаны симметричным бинарным от-
ношением р , т.е. (и, v)e p и (v, u)e p .
Таким образом, с каждым
неориентированным и ориентированным графом связано
бинарное отношение р . Это отношение
будем называть отношением смежности.
Определение 9.3.14. Отображение
ИЗОМОРФИЗМ ГРАФОВ
377
h: V\ —> Vj множества вершин графа
^l=(^l>Pl) B множество вершин графа
(/2=(^2»Р2) называют гомоморфизмом
графов (графа G[ в граф <72 ), если для любых
двух вершин, смежных в первом графе, их
образы при отображении И смежны во втором
графе, т.е. если
(Vi/, v e Vx) (и Pi v => И (и) р2 h (v)).
Биективный гомоморфизм И , такой, что
любые две вершины смежны в первом графе
тогда и только тогда, когда их образы смежны
во втором графе, т.е.
(Vi/,i;e K,)(i/p| v о А(|/)р2 h(v))9
называют изоморфизмом графов G\ и Gj
(графа (7i на граф Gj ), а графы (7j и (/2 _
изоморфными, что записывают в виде
Гомоморфизм графов, который является
эпиморфизмом, называется также
гомоморфизмом одного графа на другой.
Возвращаясь к нашему определению
графа посредством двух множеств: множества
вершин V и множества ребер (дуг) Е,
получим следующие варианты определений
гомоморфизма и изоморфизма.
Гомоморфизм неориентированного
графа G\ = (V\>E\) в неориентированный граф
Gj = (Vj, Ej) есть такое отображение
h : V\ —> Vj, что для любых двух вершин
первого графа, соединенных ребром, их образы
при отображении h также соединены ребром,
т.е.
(Vi/, о € Vx)({u,v}e E{ => {h(u),h(v)}e E2).
Гомоморфизм ориентированного графа
Gi=(V\,E[) в ориентированный граф
^2={^2^l) есть такое отображение
И : V\ -bVj, что для любых двух вершин i/, v
первого графа, таких, что есть дуга, ведущая
из и в v , из вершины h(u) тоже ведет дуга в
h(v), т.е.
(Vi/,ве Vx)((u,v)e E{ => (h(u),h(v))e E2).
Изоморфизм неориентированного графа
G{ на неориентированный граф <72 есть
такая биекция h'.V\ —» К2, при которой две
вершины и и v графа G\ соединены ребром
тогда и только тогда, когда соединены ребром
их образы h(u) и Л(t;), т.е.
(Vi/,ae V\)(u**v <^> h(u)nh(v)).
Аналогично, изоморфизм
ориентированного графа G[ на ориентированный граф
G2 есть такая биекция h : V\ —» ^2 > при
которой в ориентированном графе G\ из
вершины и ведет дуга в вершину v тогда и
только тогда, когда в ориентированном графе Gj
из образа А (и) вершины и ведет дуга в образ
h (v) вершины v , т.е.
(Vi/,ве Vx)(u ->vt=> h(u) -> h(v)).
Пример 9.3.9, а. На рис. 9.3.13
отображение И , где Л (^i) = и>1 , Л (vj) = и>2 ,
Л(г>з) = Л(г;4) = и>3 , есть гомоморфизм
ориентированного графа (7| в ориентированный
граф G\ .
Обратим внимание на петлю (и^,^):
эта петля является образом дуги (^4>^з)> так
как /i(v^) = W2 и Л(г>з) = vv3 - В
противоположность этому петля (W],u>i) не имеет
"прообраза" в G\ .
На этом же рисунке более жирными
линиями выделен подграф <72 графа Gj , поро-
жденный подмножеством вершин {и>|, и^,*^}-
Этот подграф будет гомоморфным образом
Рис. 9.3.13
378
Глава 93. ТЕОРИЯ ГРАФОВ
графа G[ . Удаляя петлю в вершине W\ ,
получим (для того же подмножества вершин)
порожденный подграф, являющийся строгим
гомоморфным образом графа G\ . Отметим, что
каждая дуга в строгом гомоморфном образе
ориентированного графа G[ имеет прообраз в
с,.
б. На рис. 9.3.14 неориентированный
граф Gi есть строгий гомоморфный образ
графа G\ (если рассматривать
неориентированные графы без петель).
h(v2)
h(v2) = h(v4)
Рис. 9.3.14
в. На рис. 9.3.15 отображение И не
является гомоморфизмом (7| на Gj , поскольку
v\ -^ v2, но h(v\) ф h(vj) (нет петли
(vv,,w,)), И(и3)фИ(и1), хотя v3-+vh и
т.д. Легко сообразить, что любой
двухвершинный гомоморфный образ графа G\ на
рис. 9.3.15 должен иметь петлю, и,
следовательно, (?2 не является гомоморфным
образом G\ ни при каком отображении.
tt>i
О
к
h(vx) = h(v2) = wx
h(v2) = w2
Рис. 9.3.15
ttfo
г. На рис. 9.3.16 изображен один граф из
множества двухвершинных гомоморфных
образов (7| .
wx = h(v{)
Рис. 9.3.16
д. Графы, изображенные на рис. 9.3.17,
изоморфны, и изоморфизмом является,
например, отображение И, такое, что
h(v4) = w5, h(v5) = w3, h(v6) = w6.
Рис. 9.3.17
Определение 9.3.15. Автоморфизм графа
(7 = (К,р) — это любая подстановка
множества его вершин, являющаяся изоморфизмом
G на себя.
Можно показать, что композиция двух
любых автоморфизмов графа снова есть
автоморфизм этого графа, а подстановка,
обратная к автоморфизму, опять-таки есть
автоморфизм. Таким образом, множество всех
автоморфизмов данного графа образует группу
по операции композиции, которая является
подгруппой симметрической группы множества
вершин графа. Ее называют группой
автоморфизмов данного графа.
Можно доказать, что автоморфизмы
неориентированного графа сохраняют степени, а
ориентированного графа - полустепени исхода
и захода всех его вершин. Это свойство
позволяет упростить описание автоморфизмов
графа.
Пример 9.3.10. Найдем нетривиальные
(т.е. отличные от тождественной подстановки)
автоморфизмы неориентированного графа,
изображенного на рис. 9.3.18. Так как среди
вершин графа лишь одна вершина v\ имеет
степень 1, и лишь одна вершина г;4 имеет
ТОПОЛОГИЧЕСКАЯ СОРТИРОВКА
379
степень 2, то при любом изоморфизме эти
вершины перейдут в себя. Значит, при
изоморфизме возможны лишь перестановки
вершин Vj,V2 и v$ .
Итак, для любого автоморфизма И этого
графа h(v\) = V[ . Поскольку V\ nvj , то
h (v\)и h (vj), и, следовательно, поскольку
Vj — единственная вершина, смежная с V\ ,
всегда Л(г^) = vj , т.е. вершина v2 переходит
в себя. Таким образом, единственным
нетривиальным автоморфизмом данного графа
будет транспозиция (3 5) - "отражение"
квадрата vjVip^ относительно диагонали ь2Щ .
Иногда группу
автоморфизмов
графа легко найти
именно из чисто
геометрических
соображений при
удачном
изображении графа.
Автоморфизм есть не что
иное, как
преобразование графа
(геометрической
фигуры), при
котором граф
совмещается с самим собой.
Поэтому группу
автоморфизмов графа можно изучать,
анализируя его как геометрическую фигуру.
В заключение сформулируем теорему,
доказанную Фрухтом в 1938 г. и характеризующую все
конечные группы в терминах групп
автоморфизмов конечных неориентированных графов.
Теорема 9.3.5 (Теорема Фрухта). Каждая
конечная группа изоморфна группе
автоморфизмов конечного неориентированного графа.
9.3.8. Топологическая сортировка.
Определение 9.3.16. Ориентированной сетью
(или просто сетью) называют бесконтурный
ориентированный граф.
Поскольку сеть является бесконтурным
графом, можно показать, что существуют
вершины (узлы) сети с нулевой полустепенью
исхода, а также вершины (узлы) с нулевой
полустепенью захода. Первые называют стоками
или выходами сети, а вторые - источниками
или входами сети.
Определение 9.3.17. Уровень вершины
сети — это натуральное число, определяемое
следующим образом:
Рис. 9.3.18
1) если полустепень захода вершины
равна 0, то ее уровень равен 0 и наоборот
(т.е. нулевой уровень Nq — это множество
всех входов);
2) если множества N{ вершин уровня /
определены для всех / < к , то уровень Л^+|
содержит те и только те вершины,
предшественники которых принадлежат любому из
уровней с номером от 0 до к , причем
существует хотя бы один предшественник уровня
к , т.е.
с Nx u... u Nk9 Г1 (v) n Nk Ф 0},
где Г~ (р) = {х : х -» v] - множество
предшественников вершины v .
Уровень вершины сети можно
интерпретировать как длину максимального пути от
входов сети до этой вершины.
Определение 9.3.18. Порядковой функцией
сети G = (V,E) называют отображение
ord : V —> N , сопоставляющее каждой
вершине сети номер ее уровня.
Рис. 9.3.19
380
Глава 9.3. ТЕОРИЯ ГРАФОВ
Проблема такого упорядочения вершин
сети, при котором вершины, принадлежащие
одному уровню, располагаются друг под
другом, а дуги ориентированного графа ведут в
его изображении на плоскости от вершин с
меньшим уровнем к вершинам с большим
уровнем слева направо, называется проблемой
топологической сортировки.
На рис. 9.3.19 показаны сеть и результат
применения топологической сортировки сети.
Алгоритм Демукрона. Формально
топологическую сортировку можно реализовать
по-разному. Один из возможных методов
состоит в вычислении порядковой функции
сети и известен как алгоритм Демукрона.
Предполагается, что вершины сети
пронумерованы от 1 до п.
Алгоритм обрабатывает матрицу В
смежности вершин графа размера пхп. В
результате работы алгоритма получаем массив
Ord длины п, /-й элемент которого равен
номеру уровня вершины v{ .
0. Сформировать множество У\ вершин
сети.
Значение счетчика уровней к положить
равным 0.
Найти суммы элементов по всем
столбцам матрицы В (полустепени захода вершин)
и заполнить ими массив Л/.
1. Если множество V\ не пусто, перейти
на шаг 2, если иначе, то перейти на шаг 3.
2. Определить множество / номеров всех
новых нулевых элементов массива Л/, т.е.
таких, что соответствующие этим номерам
вершины принадлежат множеству У\.
Присвоить элементам массива Ord с
номерами из множества / номер уровня к и
удалить вершины с этими номерами из
множества V\ ("замаскировать" вершины).
Вычесть из массива Л/ строки матрицы В,
соответствующие вершинам с номерами из
множества / (т.е. вершинам последнего
вычисленного уровня).
Увеличить счетчик уровней на 1
(А: = к + 1). Вернуться на шаг 1.
3. Закончить работу.
Пример 9.3.11. Применим алгоритм
Демукрона к сети, представленной на. рис.
9.3.19. Матрица смежности вершин сети
имеет следующий вид:
I 2 3 4 5 6 7 8 9 10 11 12 13 141
Приведем последовательность значений
массива М, соответствующую итерациям
алгоритма и множества /V, вершин /-го уровня.
Прочерки соответствуют вершинам, не
принадлежащим множеству V\ ("замаскированные"
вершины) на соответствующем этапе
алгоритма.
1
2
2
0
-
-
-
2
1
0
-
-
-
-
3
5
4
4
3
3
0
4
2
1
1
1
0
-
5
0
-
-
-
-
6
2
1
1
0
-
7
2
1
0
-
-
8
0
-
-
-
-
9
1
0
-
-
-
10
1
0
-
-
-
11
2
2
2
1
0
-
12
2
2
1
1
0
-
13
3
3
2
1
0
-
14
1
1
0
-
-
-
N0 = {5 ,8}
/V, = {2 ,9, 10}
/V2 = {1 ,7, 14}
Л^з = {6}
N4 = {4,11, 12, 13}
/v5 = {3}
Алгоритм Демукрона может быть
модифицирован так, чтобы он останавливался,
если ориентированный граф, поданный на
вход, не является сетью, и сообщал об этом.
Можно увидеть, что анализируемый граф не
будет сетью тогда и только тогда, когда при
очередном перевычислении массива М не
появятся новые нули.
В заключение рассмотрим вопрос о
связи понятий ориентированной сети и
упорядоченного множества. Так как сеть есть
бесконтурный граф, то отношение достижимости в
нем будет отношением порядка.
Обратно, пусть (А,<) — конечное
упорядоченное множество. Сопоставим ему ори-
ПОНЯТИЕ БУЛЕВОЙ ФУНКЦИИ
381
ентированный граф G = (V, E) так, что
множество вершин V находится с А во
взаимно однозначном соответствии, а множество
дуг определяется следующим образом: и —> v
тогда и только тогда, когда v доминирует над
и в смысле порядка < . Построенный таким
образом ориентированный граф G будет
сетью.
Входы сети G есть минимальные
элементы исходного упорядоченного множества, а
выходы - максимальные. Кроме того, каждый
уровень сети образует антицепь в
упорядоченном множестве (А, <).
{а) {а,Ъ}
{с} {М
Рис. 9.3.20
Построенная сеть G будет обладать еще
одним интересным свойством: для любых трех
попарно различных вершин н, v и w из того,
что и —> v и v —> w , следует и —> w . Такие
сети будем называть простыми.
Каждому упорядоченному множеству
может быть сопоставлена простая сеть
согласно описанной выше процедуре. Эта простая
сеть может рассматриваться как вариант
наглядного изображения конечного
упорядоченного множества и использоваться как
диаграмма Хассе. На рис. 9.3.20 показана сеть,
сопоставленная множеству всех подмножеств
трехэлементного множества {а,Ь,с},
упорядоченного отношением включения. Полезно
сравнить эту сеть с диаграммой Хассе,
приведенной на рис. 9.13.
Глава 9.4
БУЛЕВЫ ФУНКЦИИ
9.4.1. Понятие булевой функции.
Булева функция (от п переменных) — это
произвольное отображение вида
/: {0,1}"-* {0,1}, (9.4.1)
т.е. булева функция определена на множестве
всех л-элементных (при п > 0)
последовательностей (или л-компонентных кортежей)
нулей и единиц и принимает два возможных
значения: 0 и 1.
Булева константа — это индивидная
константа с областью значений {0,1}. Таким
образом, существуют две булевы константы: 0
и 1. По определению принимается, что
каждая булева константа есть также булева
функция от 0 переменных.
Булево переменное — это индивидное
переменное с областью значений {0,1}, т.е. это
переменное, которое может принимать только
два значения: 0 и 1. Мы можем задать булеву
функцию (9.4.1) записью у = f (х^...,хп), в
которой каждое булево переменное х{ при
/ = 1, п и функция / принимают два
возможных значения: 0 и 1. Переменные Xi,...,xn
называют при этом переменными булевой
функции f. Фиксируя значение а,- е {0,1}
каждого переменного хг получаем кортеж
a = (aj,...,aw) из множества {0,1} ,
называемый набором значений переменных
Xi,...,xn, и соответствующее ему значение
функции /(ai,...,aw), которое будет
значением переменного у, сопоставленным
заданным значениям переменных Х\,...,хп .
Подчеркнем, что, если специально не
оговорено противное, в выражении
у = / (xj,..., хп) все переменные
предполагаются попарно различными.
Будем обозначать через Р2 множество
всех булевых функций (для всех возможных
значений п числа переменных), а через Р2п —
множество всех булевых функций от п
переменных (для фиксированного п).
Из определения следует, что
Итак, областью определения любой
булевой функции от п переменных является
множество {0,1} , т.е. булев куб размерности
п. Элементы булева куба {0,1} называют п-
мерными булевыми векторами (или наборами).
382
Глава 9.4. БУЛЕВЫ ФУНКЦИИ
Число всех элементов булева куба {0,1}
составляет 2я . Элементы булева куба будем
также называть его вершинами.
Булев куб {0,1} является носителем
булевой алгебры Шп (это же обозначение часто
будем использовать и для соответствующего
булева куба). Но в любой булевой алгебре
оА = (Л, v, л, 0,1) определяется, как
известно, естественное отношение порядка так, что
для любых a, b е А а < b тогда и только
тогда, когда avb = b (или, что равносильно,
a a b = а). Булева алгебра Вя является не чем
иным, как п-й декартовой степенью
двухэлементной булевой алгебры В = ({0,1}, v, л, 0,1).
Согласно общему принципу распространения
отношения порядка на декартово произведение
множеств для произвольных двух наборов
а = (щ,...,ап) и р = (рь...,ря) из Iя
имеет место а < р тогда и только тогда, когда
а,- < р/ для каждого / = 1, п , т.е.
a, v ft = р,-.
Другими словами, а < р тогда и только
тогда, когда а, = р/ или (X/ = 0, а р, = 1 для
каждого / = 1, /!. Если существует хотя бы
одно /, для которого выполняется ос, = 0,
Р/ = 1 , то имеет место строгое неравенство
а < р . В частности, если существует ровно
одно такое /', то набор р доминирует над
набором а , так как ясно, что в этом случае
нельзя найти такой набор у , что а < у < р.
Рассмотренное отношение порядка на
В" будем называть булевым порядком.
Булев куб как упорядоченное множество,
можно изобразить в виде диаграммы Хассе. На
рис. 9.4.1 приведены диаграммы Хассе для
булевых кубов размерностей от 0 до 4.
Помимо булева порядка полезно также
ввести на булевом кубе другое отношение
порядка, которое мы будем называть
лексикографическим порядком, используя обозначение ■< .
Пусть а, р е Вя (для произвольного
фиксированного п). По определению, ссхр,
если
^а^-'^Р,^- (9.4.2)
/=1
/=1
ООП
0001
ТАБЛИЦЫ БУЛЕВЫХ ФУНКЦИЙ
383
Каждая из сумм в неравенстве (9.4.2) есть не
что иное, как представление некоторого
натурального числа (включая и нуль) в двоичной
системе счисления (при числе разрядов,
равных фиксированной размерности п). На
каждый булев вектор можно смотреть как на
такое представление (двоичный код)
натурального числа, и лексикографический порядок
на булевом кубе Шп есть не что иное, как
естественный числовой порядок на
подмножестве |0,1, ...,2Л~ > множества Nu{0} (при
условии, что числа заданы в двоичной
системе счисления).
Заметим, что отношение
лексикографического порядка является, в отличие от булева
порядка, отношением линейного порядка.
Пример 9.4.1. Набор (1,0, 1) как
двоичный код числа 5 = 1 • 2 + 0 • 21 +1-2
лексикографически больше набора (0, 1, 1),
служащего двоичным кодом числа 3, но при
этом указанные наборы несравнимы по
отношению булева порядка.
Лексикографический порядок играет,
однако, вспомогательную роль. Далее,
рассуждая о булевом кубе как об упорядоченном
множестве, мы будем иметь в виду булев
порядок. Кроме того, конкретные наборы
(элементы булева куба соответствующей
размерности) будем записывать без скобок и
запятых, т.е. вместо (0, 1,0, 1) будем писать
0101 (если, конечно, это не ведет к
недоразумениям).
Мощность множества всех булевых
функций от п переменных для фиксирован-
ного п равна 2
9.4.2. Таблицы булевых функций.
Булева функция от п переменных может быть
задана таблицей, состоящей из двух столбцов
и 2я строк. В первом столбце перечисляются
все наборы из В" в лексикографическом
порядке, а во втором — значения функции на
наборах. Форма таблицы произвольной
булевой функции приведена ниже (табл. 9.4.1).
Таблица 9.4.1
Х\...Х„
0...0
(а*,1-«м)
1...1
Л*!-
/(0,..
/(а*,ь-
/(U
-.*„)
-.0)
-.«*,«)
-1)
В [к + 1) -й строке таблицы расположен
набор
являющийся двоичным кодом числа к (при
0 < к < 2" - 1).
Рассмотрим некоторые примеры булевых
функций, которые будем задавать
посредством таблиц.
При п = 1 имеем четыре булевых
функции (табл. 9.4.2).
Таблица 9.4.2
X
0
1
/iW
0
1
fl{x)
0
0
/зМ
1
1
ЛМ
1
0
Функцию /| называют тождественной
функцией, а функцию /4 — отрицанием.
Функции /2 и /з являются функциями (от
одного переменного), принимающими
постоянное значение (0 и 1 соответственно). Их
также зачастую называют константой 0 и
константой 1. Постоянные функции, разумеется,
могут быть определены и при любом
(большем 1) числе переменных.
В табл. 9.4.3 перечислены семь (из
22
2 =16) наиболее важных для дальнейшего
изложения булевых функций двух
переменных
Таблица 9.4.3
х\
0
0
1
1
х2
0
1
0
1
Л
0
1
1
1
/2
0
0
0
1
/з
0
1
1
0
Л
1
1
0
1
h
1
0
0
1
/б
1
1
1
0
Л
1
0
0
0
Поскольку каждая булева функция от
двух переменных есть одновременно и
бинарная операция на множестве {0,1}, то
естественно для таких функций использовать
запись, принятую для бинарных операций:
xwy вместо w(x,y).
Принимаются следующие обозначения
выписанных в табл. 9.4.3 функций
/l(*b*2) = *l v*2>
/2(*1>*2) = *Г*2 (или /2(*|,Х2) = х, ЛХ2)>
h{xbxl) = xi ф*2>
h{xbxl) = x\ ~*х2>
384
Глава 94. БУЛЕВЫ ФУНКЦИИ
/5(*Ь*2) = *1 ~*2»
/6(х1,Х2) = Х1|х2,
Функцию /| называют дизъюнкцией, /2 -
конъюнкцией, f$ — сложением по модулю 2
(mod 2), /4 — импликацией, f$ —
эквивалентностью, /б — штрихом Шеффера, fj —
стрелкой Пирса.
Дизъюнкция и конъюнкция, как видно, -
это операции двухэлементной булевой алгебры —
объединение и пересечение соответственно
(тогда как функция отрицания есть не что
иное, как дополнение в этой булевой алгебре).
В то же время дизъюнкция и конъюнкция -
это не что иное, как одноименные логические
операции. Очевидным образом с логическими
связками, помимо отрицания, соотносятся
импликация и эквивалентность.
Таблица 9.4.4
0
1
2
3
4
5
6
7 1
*1
0
0
0
0
1
1
1
1
*2
0
0
1
1
0
0
1
1
*3
0
1
0 1
i
0
1 1
0
1 1
7(*1.*2.*з)
0
0
1 °
1
0
1
1
1
Кроме того, полезно иметь в виду, что,
записывая таблицу булевой функции п
переменных, нет необходимости каждый раз
перечислять все наборы длины п — достаточно
записать вектор значений булевой функции,
понимая, что /-я компонента этого вектора
есть значение функции на 7-м наборе
(двоичном коде числа /).
Тогда мажоритарная функция / может
быть задана так:
/ = (0,0,0,1,0,1,1,1).
Можно также перечислить номера тех
наборов, на которых функция принимает
значение 1:
/ = {3,5,6,7}.
Обобщением понятия булевой функции
служит понятие булева оператора. Булев
оператор — это произвольное отображение вида
f : Iя -> Bm (9.4.3)
для произвольных /I, т е N и {0}.
Булев оператор (9.4.3) может быть задан
посредством семейства булевых функций в
виде
\\ (9.4.4)
\Ут ~ Jm \x[i'--ixn)-
Функции fj в (9.4.4) будем называть
координатными функциями булева оператора (9.4.3).
Если ввести векторы переменных
У = (У\>->Ут) и х = (дсь...,дся), то булев
оператор (9.4.3), заданный семейством
координатных функций (9.4.4), можно записать в
таком виде:
'* = /(*). (9.4.5)
9.4.3. Фиктивные переменные.
Равенство булевых функций. Ключевым понятием
в теории булевых функций является понятие
равных булевых функций. Для функций от
одного и того же числа переменных п нет
необходимости рассматривать какое-то
специальное определение равенства, ибо такие
функции равны, если они совпадают как
отображения булева куба Iя в В. Проблема
состоит в том, чтобы определить равенство
булевых функций независимо от числа
переменных.
Можно заметить, что сложение по
модулю 2 совпадает с операцией сложения кольца
вычетов Z2 по модулю 2, штрих Шеффера
есть отрицание конъюнкции, а стрелка Пирса —
отрицание дизъюнкции, т.е.
х{ \х2 = х{ • х2, хх I х2 = х{ v х2.
Приведем для примера таблицу булевой
функции трех переменных (табл. 9.4.4).
Эта функция называется мажоритарной
функцией или функцией голосования.
Теоретически таблицей можно задать
любую булеву функцию, но при большом
числе переменных этот способ практически
не применим. В 9.4.3 мы рассмотрим способ
задания булевых функций в виде формул,
аналогичных аналитическому заданию
элементарных функций в анализе. С точки
зрения логической интерпретации булевой
функции ее таблица есть таблица истинности
Некоторого сложного высказывания.
Переменными функции являются входящие в сложное
высказывание простые высказывания.
ФИКТИВНЫЕ ПЕРЕМЕННЫЕ
385
Определение 9.4.1. Переменное х,
называют фиктивным переменным булевой
функции /(xj,...,x/7), если значение функции не
зависит от значения этого переменного, т.е.
если для любых значений переменных
Х\,..., Xj_ 1, Х/+|,..., Хп
/(*! ,...,*;_), О, X/+i,..., Х„ ) =
= /(*i,...,xM,l, х/+1,..., хя).
Будем называть переменное х, не
являющееся фиктивным переменным функции
/, существенным переменным данной функции
и говорить, что функция/существенно
зависит от переменного х.
Пусть дана булева функция
У = /(*!»• ~>хп) от п переменных. Пусть
существенными переменными этой функции
являются переменные дс,- ,...,*,- , где г < п и
1 < /j < ... < ir < п . Присваивая каждому
фиктивному переменному функции /
произвольное значение, получим функцию / ,
такую, что она есть функция от г
переменных, т.е. есть отображение из Вг в В , и для
любого набора а,-,..., а,- значений переменных
Xj ,..., Xj имеет место равенство
/(а/1,...,а/г) = /(дс,,...,а/|,...,а/г,...,дс|1)
независимо от значений фиктивных
переменных функции / (т.е. переменных, отличных
от xir...,xir).
Договоримся только что описанный
переход от функции / к функции / , уже не
имеющей фиктивных переменных, называть
удалением фиктивных переменных (функции
/).
Определение 9.4.2. Булевы функции /
и g называют равными, если их
существенные переменные соответственно равны и на
каждом наборе значений этих переменных
функции / и g принимают равные
значения.
Чтобы распознать по таблице булевой
функции, является ли переменное л:,
фиктивным, нужно рассмотреть все наборы с
фиксированным значением /-й компоненты
(один раз фиксировав это значение как О,
другой раз — как 1). Из определения 9.4.1
13 — 7706
ясно, что переменное х, фиктивно тогда и
только тогда, когда для любых двух наборов,
отличающихся только значением /-й
компоненты, функция принимает равные значения.
Пример 9.4.2. Из табл. 9.4.4 следует, что
мажоритарная функция не имеет фиктивных
переменных, так как, например,
/(0,0,1) = 0 , а /(1,0,1) = 1, т.е.
переменное Х| существенное. Далее, /(1,0,0) = 0,
но /(1,1,0) = 0, что означает
существенность переменного Xj ; для х% имеем
/(1,0,0) = 0, но /(1,0,1) = 1, что означает
существенность и этого переменного.
Кроме процедуры удаления фиктивных
переменных используют и процедуру
добавления к множеству переменных булевой
функции одной или нескольких фиктивных
переменных. Так, если дана функция
/(х\,...,хп)е Я2я, то можно ввести новое
фиктивное переменное у, определив новую,
равную исходной (согласно определению
9.4.2), функцию от (я+1)-го переменного
таким образом:
f(x\,...,xn9y) = f(xl9...9xn)-(yvy).
Следует заметить, что фиктивное
переменное можно (в новой функции / )
"поставить на любое место". Или, говоря
точнее, можно определить семейство функций
/l;, / = 1, п , с фиктивным переменным у так,
что
fi{xh...iy,xh...,xn) = f(x],...9xn)(yvy).
Понятие фиктивного переменного
позволяет также произвольные две булевы
функции рассматривать как функции от
одного и того же числа переменных.
Пусть функция f(x\,...,xn) есть
функция от п переменных, а функция
g{y\,--,ym) ~ функция от т переменных.
Обозначим множества переменных функции
fag через А" и Y соответственно.
Расширим множество переменных функции / до
X u Y , вводя переменные из Y \ X (если
они существуют) как фиктивные. Точно так
же поступим с функцией g, добавляя
фиктивные переменные из множества X \ Y
(если, конечно, оно не пусто). Тогда получим
386
Глава 9.4. БУЛЕВЫ ФУНКЦИИ
функции / и g, равные согласно
определению 9.4.2, функциям соответственно / и g
и определенные как функции от одного и
того же числа переменных, составляющего
|*иУ|.
Нетрудно распространить описанную
конструкцию на произвольное конечное
множество булевых функций и считать тем
самым все функции этого множества
функциями от одного и того же числа переменных.
Функцию рГ} от п переменных, такую,
что
РП (*ь—,*/, —t*/i) = xi,
называют (/-и) проектирующей функцией. В
общем случае нумерация множества
переменных может быть явно не задана, и тогда при
определении проектирующей функции
следует указывать не номер соответствующего
переменного, а само переменное. В этом случае
проектирующая функция рг£ с множеством
переменных X этой функции и выделенным
переменным х е X определяется так:
/>г/(...,*,...) = *
(за многоточиями "скрыты" переменные
проектирующей функции, отличные от
переменного х).
Из определения следует, что npOeKTH-
рующая функция рг£ имеет единственное
существенное переменное, а именно
переменное х. Все остальные переменные
проектирующей функции являются фиктивными.
Поэтому любые две проектирующие функции
X Y
рг£ и рг£ равны (согласно определению
9.4.2) при любых множествах переменных X и
У, содержащих переменное х.
Вместе с тем, для двух различных пере-
V
менных х и у проектирующие функции ргх
и ргу — разные функции. Так, pr\ (x\,X2) ~
функция, отличная от функции /Mi(*i,*2)»
поскольку, например, рг\ (1,0) = 1 ,
/>г2(1,0) = 0.
Впредь договоримся любую из
множества равных между собой проектирующих
у
функций ргх обозначать символом х ее
единственного существенного переменного.
9.4.4. Формулы и суперпозиции.
Табличный способ задания булевой функции не
является эффективным. Им практически
нельзя воспользоваться при большом числе
переменных. Помимо этого способа
существует способ представления булевых функций
в виде формул. Этот способ аналогичен
аналитическому способу задания функций
действительного переменного.
Определение формулы основано на
понятии сложной функции, или суперпозиции.
Пусть булева функция/есть функция от
п переменных, а булевы функции g|,...,g/7 —
произвольные (и не обязательно различные)
функции от одного и того же числа
переменных, которое обозначим т.
Определим функцию /(gj,...,g„),
называемую суперпозицией функций f,g\,...,gn
так, что для любого а е Мт имеет место
равенство
f(g\,->gn)(a) = f{g\{&)>->gn{a))-
Таким образом, суперпозиция
/'{g\i — >8n) есть не что иное> как
композиция булевых операторов g ° /, где булев
оператор g задается семейством координатных
функций ghi - 1, л .
Для суперпозиции f (g^,...,gn)
используется также обозначение S(f, g\,...,gn).
Предположение о том, что все функции
ghi = \,n - функции от одного и того же
числа переменных, не ограничивает
общности, поскольку любое конечное множество
булевых функций всегда можно рассматривать
как множество функций от одного и того же
числа переменных.
Пусть дано некоторое множество
булевых функций F. Тогда формулой над
множеством F мы считаем любую константу из F
(если она там есть) и любое булево
переменное. Далее, если известно, что Ф|,...,Ф„ (при
п > 1 ) — формулы над множеством F, а / -
функция из Fот п переменных, то выражение
/(Ф|,...,ФЯ) есть формула над множеством
F. Никаких других формул над множеством F,
кроме определенных выше, не существует.
Пример 9.4.3. а. Пусть /r = {v,,-}. Это
множество, состоящее из функций
ФОРМУЛЫ И СУПЕРПОЗИЦИИ
387
дизъюнкции, конъюнкции и отрицания,
называют стандартным базисом. Формулами над
стандартным базисом будет любое
переменное: х,у,...,*!,...,хя и т.д. Далее, из
переменных х,у как формул и функции v
можно построить новую формулу, например
v (х, у) или • (л:, у). Эти формулы, однако,
естественно записывать несколько иначе.
Поскольку каждая булева функция от двух
переменных (каковы, в частности,
дизъюнкция и конъюнкция) является одновременно
бинарной операцией на множестве В = {0,1},
то формулы с такими функциями обычно
записывают в "инфиксной форме", т.е. как
(х v у),(х • у) и т.п. Аналогично для
отрицания используют запись х, а не (лс).
Кроме того, в формулах над
стандартным базисом, во-первых, опускают скобки,
используя ассоциативность булевых операций
v и • , т.е. вместо ((* v y)v z) пишут
(х v у v z); во-вторых, опускают, как
правило, внешние скобки, записывая формулу,
аналогичную последней, просто как
xv у v Z', в-третьих, используют соглашение
о "старшинстве" (или о приоритете) операций,
полагая, что самый высокий приоритет имеет
операция отрицания (т.е. она всегда
выполняется перед конъюнкцией и дизъюнкцией),
затем идет конъюнкция и после нее —
дизъюнкция.
С учетом сказанного формула
\{х v У) v {{У ' z) • wm может быть
переписана так:
(xv y)v у- zu. (9.4.6)
Согласно определению формулы, можно
представить процесс построения формулы
(9.4.6) следующим образом. Из переменных х,
у и функции v строим формулу
Ф| =(xvy), затем из нее и функции
отрицания получаем формулу Ф2 = Ф| , т.е.
формулу (х v у). Далее из переменных у, z и
функции • строим формулу (у ■ z), а из нее,
переменного и и опять функции * -
формулу Ф3 = (у >z) • м), которую записываем как
У -Z и. И наконец, из формул Ф2,Фз и
функции v строим формулу Ф2 v Ф3 , т.е.
13*
формулу (9.4.6).
б. Рассмотрим множество булевых
функций {Ф, •, 1}, которое называют базисом Же-
галкина. При записи формул над базисом
Жегалкина используют те же принципы, что
и при записи формул над стандартным
базисом. Приоритет операции конъюнкции
считается выше приоритета операции сложения по
модулю 2. Так как последняя ассоциативна, то
при записи формул с этой операцией
соответствующим образом опускают скобки. Так
формулами над базисом Жегалкина будут:
ху Ф х Фу, *Ф1,
xyz ф ху е xz ф yz ф х е у е z ф 1.
Мы будем использовать запись
Ф(Х|,...,л:я), указывая тем самым, что
формула Ф содержит переменные Х\,...,хп, и
только их. Множество переменных формулы
Ф будем обозначать через Уаг(Ф).
Нам понадобится также понятие
подформулы.
Из определения и рассмотренных
примеров следует, что процесс построения
формулы есть процесс определения некоторой
сложной булевой функции, т.е. суперпозиции.
Формула "собирается" из "элементарных
формул", т.е. переменных и базисных функций,
так, что на каждом шаге из уже полученных
формул строится новая, более сложная
формула. Естественно назвать эти
"промежуточные" формулы подформулами
рассматриваемой формулы. Так, в примере
9.4.3, а формулы Ф|,Ф2,Фз (и, конечно,
переменные и базисные функции) - это
подформулы формулы (9.4.6).
Строго понятие подформулы может быть
введено следующим образом. Пусть Ч* -
формула над F. Если Ч* е F или Ч* есть
переменное, то ее единственной подформулой
является она сама. Если Ч/ имеет вид
/(Ф|,...,ФЯ), где/— функция из F от п
переменных, а Ф,- при / = 1,/1 суть формулы
над F> то подформулами формулы Ч/ будут:
1) все формулы Ф/ ; 2) для каждого / = \,п
все подформулы формулы Ф/ .
Каждому набору значений переменных,
входящих в заданную формулу, можно
определенным образом сопоставить значение этой
формулы. Вычисление этого значения в
точности соответствует процессу построения
формулы из подформул (в конечном счете из
388
Глава 9.4. БУЛЕВЫ ФУНКЦИИ
переменных и базисных функций).
Пример 9.4.4. Полагая в формуле (9.4.6)
x = \,y = Q,z = u = \, получим значение
формулы (9.4.6), равное
(lvO) v 0 • 1 • 1 = 0.
Таким образом, по каждому набору
значений переменных формулы можно по
определенному алгоритму вычислить значение
формулы. Это значит, что каждая формула
определяет (или представляет) некоторую
булеву функцию. Это понятие уточняется
через определение функции, представляемой
формулой над множеством F. Мы полагаем,
что:
1) любая константа из F представляет
саму себя;
2) любое переменное л: из ЛГ
представляет проектирующую функцию х (точнее, любую
из множества равных между собой
проектирующих функций существенного переменного
х);
3) если формулы Ф1?...,ФЛ над
множеством F представляют соответственно
функции £i,...,g„ , а/- функция из Fот п
переменных (л>1), то формула /(Ф1,...,ФЯ)
представляет суперпозицию функций
/(£1>->£л);
4) других булевых функций,
представляемых формулами над множеством F, кроме
тех, которые могут быть получены согласно
пп. 1-3 данного определения, не существует.
Функцию, представляемую некоторой
формулой над множеством F, называют
суперпозицией над множеством F. Таким образом,
суперпозиция над множеством F — это любая
суперпозиция функций вида f(gi, — ,gn),
где /ef, а каждая из функций g\,..-,gn
есть либо элемент F, либо переменное
(точнее, проектирующая функция), либо
некоторая суперпозиция над F. Множество всех
суперпозиций над F будем обозначать [F] и
называть замыканием множества F булевых
функций.
Понятия формулы и суперпозиции
взаимно предполагают друг друга. Суперпозиция
над множеством F есть некоторая сложная
функция, которая определенным образом
построена из базисных функций - функций
фиксированного множества F (и
проектирующих функций). Само "строение"
суперпозиции, т.е. то, из каких именно базисных
функций и в какой последовательности
образуется результирующая сложная функция
(суперпозиция), и есть формула.
Если булева функция /(xj,...,*,,)
представляется формулой Ф (Х[,..., хп ) , то
будем писать / (х{,..., хп) = Ф (хь..., хп),
или, короче, / = Ф(х[,...,хп).
Определение 9.4.3. Множество булевых
функций F называют:
1) замкнутым, если любая формула над
F представляет некоторую функцию из F;
2) полным, если любая булева функция
может быть представлена некоторой
формулой над F.
Определение 9.4.3 равносильно
следующему (на "языке суперпозиций"): множество
F функций замкнуто, если каждая
суперпозиция над F есть функция из F, т.е. [F] = F , и
полно, если всякая булева функция есть
некоторая суперпозиция над F, т.е. [F] = Р2 •
Пример 9.4.5. Для каждой из
определенных в 9.4 функций от двух переменных мы
можем записать следующие формулы над
стандартным базисом:
Xj 0 Х2 = Х^ • Х2 V ХуХ2,
х\ ""* х2 = х\ v x2>
х\ ~*2=(*1 vx2)-(x2 vx{),
х\ |*2 = х\ х2>
Х{ I Х2 = Х{ V Х2.
Если мы пополним стандартный базис
функцией —> (импликацией), то формула для
эквивалентности примет вид
х\ ~*2=(*1 ->*2)"(*2-»*0-
Тот факт, что одна и та же функция (в
данном случае эквивалентность) может быть
представлена по крайней мере двумя разными
формулами над одним и тем же множеством,
а именно над {v,-,-,—>}, показывает, что
соответствие между формулами над
фиксированным множеством и представляемыми ими
функциями не является взаимно
однозначным. Эта ситуация до некоторой степени
аналогична разложению по базису векторов
конечномерного линейного пространства.
Формула, представляющая некоторую булеву
функцию, выражает "разложение" этой функции по
ДИЗЪЮНКТИВНЫЕ И КОНЪЮНКТИВНЫЕ НОРМАЛЬНЫЕ ФОРМЫ
389
фиксированному "функциональному базису".
Одна и та же функция может иметь несколько
таких разложений. В отличие от линейной
алгебры в этом случае возникает ситуация,
когда возможны различные разложения
заданной функции по одному и тому же базису.
Например, формулы [х v у) и х у над
стандартным базисом представляют одну и ту
же функцию.
Назовем эквивалентными формулы,
которые представляют равные функции.
Эквивалентным (или тождественным)
преобразованием формулы Ф называют переход (по
определенным правилам) к любой формуле Ч* ,
эквивалентной формуле Ф . Необходимо
сделать несколько замечаний относительно
правил, согласно которым осуществляются
эквивалентные преобразования формул.
Введем понятие тождества. Тождеством
(над множеством Fcf^) называют
выражение
Ф(хи...,х„) = Ч'{уи...,ут), (9.4.7)
где формулы Ф и Ч1 — эквивалентные
формулы над F. Формулу Ф называют при этом
левой, а формулу Ч* - правой частью
тождества (9.4.7).
Левая и правая части тождества
представляют равные булевы функции. Поэтому
пересечение множеств переменных
Кяг(Ф) = {*,,...,*„} и Уаг(Ч>) = {у1%...,ут}
должно содержать все существенные
переменные функции f(x{,...,x„) и g(yi,.-.,y,„),
предстааняемых формулами соответственно
Ф и Ч/ . В частности, если это пересечение
пусто, то обе функции равны некоторой
константе.
Пример 9.4.6. В тождествах
xv х = у v у, xv х = \ пересечение
множеств переменных в левых и правых частях
пусто, причем во втором тождестве правая
часть вообще не содержит переменных. В
тождестве (х v у) ■ (z v z) = х v у v v • v
указанное пересечение равно {х, у} .
Все записанные в примере 9.4.5
выражения являются тождествами над множеством
{v,.,~, 0,->,~,|, I],
причем во всех этих тождествах множества
переменных в левой и правой частях
тождества совпадают. Такого же рода тождества —
аксиомы булевой алгебры* (кроме тождеств
xv х = \ и xv х = 0) и вытекающие из них
тождества (подобные, например, законам де
Моргана).
Сформулируем правила тождественных
преобразований.
Теорема 9.4.1. 1. Если в тождестве (9.4.7)
некоторые переменные заменить
произвольными формулами (над множеством F), то
тождество сохранится, т.е. полученные в
результате такой замены новые формулы
останутся эквивалентными.
2. Если в формуле Ф произвольную ее
подформулу заменить любой эквивалентной
ей, то получится формула, эквивалентная
формуле Ф .
Чтобы использовать сформулированные
в теореме 9.4.1 правила, нужно фиксировать
какую-то систему исходных тождеств. Тогда
возникает вопрос: можно ли утверждать, при
надлежащем выборе исходных тождеств, что с
помощью правил (I) и (2) утверждения 9.4.1
можно из формулы Ф получить
эквивалентную ей формулу Ч/ , каковы бы ни были эти
формулы? Говоря неформально, любые ли две
эквивалентные формулы (над заданным
множеством F) можно "трансформировать" друг в
друга, используя фиксированную систему
основных тождеств над Fu правила (I) и (2)
утверждения 9.4.1? Для стандартного базиса
ответ на вопрос положителен, причем в
качестве исходных тождеств используются
аксиомы булевой алгебры.
9.4.5. Дизъюнктивные и
конъюнктивные нормальные формы. Любая формула
вида х или х над стандартным базисом, где х —
произвольное переменное, называется
литералом. Таким образом, литерал есть
обозначение либо самого переменного х, либо его
отрицания. Часто используют такое
обозначение: для се {0,1} пишут ха , понимая под
этим само переменное х, если О = 1, и
отрицание х, если а = 0 , т.е.
Гх, а = 1;
хс =\- (9.4.8)
[х, о = 0.
Подставляя в (9.4.8) 0 и 1 вместо х,
получим
* Поскольку все переменные, фигурирующие в
этих тождествах, есть булевы переменные, то речь здесь
идет об аксиомах булевой алгебры применительно к
частному случаю - двухэлементной булевой алгебре В
390
Глава 9.4. БУЛЕВЫ ФУНКЦИИ
Оо № о = 1; 0 [1, о = 1;
jl, o = 0, JO, o = 0.
Часто используют также обозначение х,
понимая под этим любой из двух литералов —
X ИЛИ X .
Формула вида Х[,Х2...хт
(соответственно вида х\ v xi v ... v xm ), где
все фигурирующие в ней переменные
попарно различны, называется элементарной
конъюнкцией (соответственно элементарной
дизъюнкцией).
Определение 9.4.4. Дизъюнктивная
нормальная форма (ДНФ) от переменных
Х\,...,хп — это формула вида К\ v ... v Km,
где для каждого / = 1,/и А/ - элементарная
конъюнкция, содержащая некоторые из
литералов Х\,...,х„ . В том случае, когда в каждую
конъюнкцию Kj для каждого j = 1, л входит
в точности один из литералов лгу (при
I < j < п ), то ДНФ называется совершенной
дизъюнктивной нормальной формой (СДНФ).
Двойственным образом, т.е. с
использованием принципа двойственности для булевых
алгебр, определяются конъюнктивная
нормальная форма (КНФ) и совершенная
конъюнктивная нормальная форма (СКНФ).
Теорема 9.4.2. Любая булева функция,
отличная от константы 0 (соответственно от
константы 1) представима в виде СДНФ
(соответственно в виде СКНФ).
Для функции / е Р2 n , не равной
тождественно 0, рассмотрим множество
Cf = jet: /(а) = l|. Каждый набор из Cf
называют конституентой единицы функции /
Так как по условию / * 0 тождественно, то
множество Cf не пусто. Каждому набору
ае Cf поставим в соответствие
элементарную конъюнкцию К^ - Л""1 Л""2.,.Л""" ,
которую также называют конституентой единицы
функции / Поскольку А~ обращается в
единицу только на наборе а , то искомой СДНФ
для функции /будет
{xlvx2vx3)(xlvx2vx3)(x]
аеС|
Согласно принципу двойственности,
СКНФ для той же функции будет иметь вид
аеС°
где множество наборов Cf = jot: /(а) = 0>,
и каждый набор а из Cf называют
конституентой нуля функции /; при этом
элементарная дизъюнкция Ih сопоставляется кон-
ституенте нуля а по следующему правилу:
D-a=xfv...vxf»,
т.е. если в наборе /-я компонента равна 0, то
в Lh ставим само переменное Л",, если иначе —
отрицание переменного Л",- (таким образом,
дизъюнкция £h обращается в нуль только на
наборе а ).
Таким образом, любая булева функция
может быть представлена в виде формулы над
стандартным базисом (СДНФ или СКНФ) и,
следовательно, стандартный базис есть полное
множество булевых функций.
Рассмотрим в качестве примера
построение СДНФ и СКНФ для мажоритарной
функции (см. 9.4). Конституентами единицы
для нее служат наборы: ct| =(0,1,1),
сс2 = (1,0,1), а3 =(1,1,0) и а4 =(1,1,1).
Им соответствуют элементарные конъюнкции:
^а, = Х\Х2х3 , Кй2 = х{х2х3 , АГд3 = ххх2хъ ,
Ад = Х\Х2х3 . Тогда СДНФ, представляющая
мажоритарную функцию, имеет вид
Х\Х2ХЪ v Х\Х2ХЪ v Х\Х2ХЪ v Х\Х2ХЪ- (9-4.9)
Для получения СКНФ для той же функции
выпишем все конституенты нуля данной
функции: (0, 0, 0), (0, 0, 1), (0, 1, 0), (1, 0, 0).
Сопоставим им элементарные дизъюнкции
соответственно Х\ v x2 v х3 , Х\ v x2 v х3 ,
Х| V Х2 V Х3 И Х{ V Х2 V Х3 .
В результате получим СКНФ для
мажоритарной функции в виде
v x2 v x3)(x~i v x2 v х3). (9.4.10)
ПОСТРОЕНИЕ МИНИМАЛЬНЫХ ДНФ
391
Заметим, что если в формуле СКНФ (9.4.10)
мы раскроем скобки и преобразуем
полученное выражение согласно законам булевой
алгебры, проведя тем самым эквивалентные
преобразования СКНФ, то придем к формуле
СДНФ (9.4.9).
9.4.6. Построение минимальных
ДНФ. СДНФ, которая строится по таблице
булевой функции, зачастую оказывается весьма
сложной, т.е. она содержит достаточно много
элементарных конъюнкций и литералов.
Необходимо уметь находить в определенном
смысле минимальную ДНФ, представляющую
исходную функцию.
Уточним задачу.
Определение 9.4.5. Булеву функцию g
называют импликантой* булевой функции /
если для любых наборов значений переменных
из g = 1 следует / = 1 .
Если функция / представлена СДНФ, то
любая ее элементарная конъюнкция
(конституента единицы функции /) будет ее
импликантой. Заметим также, что если g\ и
g2 ~~ импликанты / то дизъюнкция g\ v g2
также является импликантой /
Из определения 9.4.5 и понятия равных
булевых функций (см. определение 9.4.2)
следует, что булевы функции fug равны, если и
только если каждая из них служит
импликантой другой: / = 1 <=> g = 1.
Определение 9.4.6. ДНФ называют
минимальной, если она содержит наименьшее
число литералов среди всех ДНФ,
эквивалентных ей.
Обратим внимание на то, что под
числом литералов в ДНФ понимают число всех
подформул этой ДНФ, которые являются
литералами. Так, СДНФ (9.4.9) содержит 12
литералов (по три литерала в каждой из
четырех элементарных конъюнкций).
Пример 9.4.7. ДНФ х{х2 v х}х2 не
является минимальной, так как ее можно
преобразовать к эквивалентной ДНФ, не
содержащей ни одного из литералов Х\ :
х{х2 v х{х2 = (х, v х{)х2 = х2.
Вместо четырех литералов в исходной ДНФ
получаем ДНФ, состоящую из одного
литерала.
Определение 9.4.7. Длиной ДНФ называ-
Иногда употребляют и термин "импликант"
(мужского рода).
ют число входящих в нее элементарных
конъюнкций.
ДНФ называют кратчайшей, если она
имеет наименьшую длину среди всех
эквивалентных ей ДНФ.
Заметим, что кратчайшая ДНФ не
обязана быть в то же время минимальной среди
всех ДНФ, эквивалентных исходной функции.
Но поиск минимальных ДНФ, как мы сейчас
увидим, проводится среди кратчайших ДНФ.
Наша задача состоит в том, чтобы
описать метод построения минимальной ДНФ,
эквивалентной заданной булевой функции.
Мы рассмотрим простейший метод такого
рода — алгоритм Квайна — Мак-Клоски. Этот
алгоритм исходит обязательно из СДНФ,
которая строится по таблице функции.
Опишем последовательно этапы,
составляющие алгоритм Квайна — Мак-Клоски.
1. Склейка. Пусть К\ и К2 - две
элементарные конъюнкции, входящие в
исходную СДНФ Ф , которая представляет
функцию / причем для некоторого переменного х
и некоторой элементарной конъюнкции К
выполняются равенства К\ = хК и
К2 = хК.
Тогда имеем (согласно тождествам
булевой алгебры):
K{v K2 = xKvxK = (xvx)K = K.
Мы получаем элементарную конъюнкцию
К , которая содержит на один литерал
меньше, чем К\ и К2, и является, как и обе
конъюнкции К\ и К2 , импликантой /
Образно говоря, мы "склеили" две импликанты в
одну, в которой число литералов будет на
единицу меньше.
Операцию получения К по К\ и К2,
описанную выше, можно провести и для
любых двух элементарных конъюнкций
подобного вида, составляющих любую ДНФ,
эквивалентную исходной функции. Такую
операцию называют простой склейкой импликант
К\ и К2 по переменной х.
С алгебраической же точки зрения мы
из двух элементарных конъюнкций /f~ и К*
получаем новую элементарную конъюнкцию
лишенную литерала xf* .
Итак, применяя простую склейку к
исходной СДНФ Ф , получаем новую ДНФ Ф| ;
392
Глава 9.4. БУЛЕВЫ ФУНКЦИИ
к ней также применяем простую склейку —
получаем ДНФ Ф2 ; продолжаем выполнять
эту операцию до тех пор, пока не окажется,
что для некоторого к в ДНФ Фк уже нельзя
склеить никакие две элементарные
конъюнкции. Такое к всегда найдется, так как СДНФ
Ф состоит из конечного числа элементарных
конъюнкций, а они, в свою очередь, состоят
из конечного числа литералов. Полученную в
результате ДНФ Фк называют сокращенной
ДНФ функции / а ее элементарные
конъюнкции — простыми импликантами булевой
функции/
Геометрия описанного выше
многократного повторения простой склейки, как можно
показать, состоит в дальнейшем "склеивании"
каждой пары соседних ребер (граней
размерности 1), на которых значение функции равно
1, в грани размерности 2, соседних граней
размерности 2 — в грани размерности 3 и т.д.
Разбираемый ниже пример поясняет эту
идею.
Пример 9.4.8. Зададим функцию / от
трех переменных следующей СДНФ:
/ = Х\Х2Х3 v *1*2*3 v *|*2*3 v *1*2*3-
(9.4.11)
Подвергнем простой склейке первую и
третью, а также вторую и четвертую
элементарные конъюнкции в (9.4.11):
/ = х2х3 vx2x3. (9.4.12)
\X2X3
х1\
0
1
00
01
11
10
Рис. 9.4.2
Х1Х2\
00
01
11
10
00
01
11
10
Рис. 9.4.3
Применяя простую склейку к (9.4.12) (по
переменному х3 ), получаем /(х{,х2,х3) = х2.
Побочным результатом склейки явилось и
удаление фиктивных переменных функции Х\
и х3.
Для булевых функций трех и четырех
переменных процедура склейки наглядно и
просто выполняется на так называемых
картах Карно. Форма карт Карно,
представляющих собой прямоугольные таблицы, для
функции трех переменных показана на рис.
9.4.2, а для функции четырех переменных —
на рис. 9.4.3. На рис. 9.4.2 строки отмечены
наборами значений переменного Х\ , а
столбцы - х2,х3 , а на рис. 9.4.3 строки -
наборами значений переменных х^х2 , а столбцы -
х3, х^ .
Карта Карно есть не что иное, как
форма таблицы для определения булевой
функции. Каждая клетка карты задается своим
набором значений переменных, причем в
клетках, соответствующих конституентам
единицы данной функции, ставится единица,
тогда как остальные клетки остаются
пустыми. Карта Карно устроена так, что наборы,
определяющие любые две соседние клетки,
различаются в точности в одной позиции (т.е.
различаются значениями ровно одной
компоненты), причем клетки (одной и той же
строки или одного и того же столбца),
примыкающие к противоположным сторонам
прямоугольника, также являются соседними в
только что определенном смысле. Это можно
представить себе так, что карта
"закручивается" в "цилиндр" по обоим направлениям,
т.е. в "тор".
Пусть булева функция/задана таблицей,
представленной в форме карты Карно.
Описанный выше итерационный процесс
склейки, в результате которого получается
сокращенная ДНФ, представляющая функцию /
проводится на карте Карно так: любые две
соседние клетки, содержащие единицы,
обводятся, и "поглотивший" их прямоугольник (он
и есть обозначение результата склейки на
карте) представляется словом, содержащим
"0", "1" и "х" ("крестик"), причем "крестик"
занимает позицию того переменного, по
которому произведена склейка (рис. 9.4.4).
По таким обозначениям легко получить
и ту импликанту, которая является
результатом простой склейки: для этого достаточно
записать литерал х,- (соответственно xj-),
если в /-и позиции стоит 1 (соответственно
ПОСТРОЕНИЕ МИНИМАЛЬНЫХ ДНФ
393
ч1п Xrt
00
01
(Т
И
10
-XII
-их
1X1
Рис. 9.4.4
0), и пропустить литерал х-,, если в /-й
позиции стоит "крестик". Так, по слову 1 х 0
получим импликанту Х\Х-$.
При наличии на карте Карно двух
прямоугольников площади 2, находящихся в
соседних столбцах или строках, их можно
объединить в один большой прямоугольник
площади 4 (рис. 9.4.5). Этот прямоугольник
можно записать в виде слова хО х .
[\*2Хз|
0
1
У
00
(FT
Wr
т<-^\
01
"Fit
-Ц
11
\
10
Х00 X0X XQ1
Рис. 9.4.5
Точно так же можно объединять в один
прямоугольник площади 8 два соседних
прямоугольника площади 4 (рис. 9.4.6).
00 Г
01
11
10 1
~v
00
~щ
1
1
/У
01
11
1
А
А
/
10
(ТТТ
1
1
у}
Ц-
\
XX00
хххо
XX10
Рис. 9.4.6
Если такие большие прямоугольники
находить сразу, то "поглощаемые" ими меньшие
прямоугольники уже не рассматриваются.
Выделяемые описанным способом
прямоугольники могут состоять только из 2
клеток (для некоторого к, не превышающего
числа переменных). Так, на карте,
приведенной на рис. 9.4.7, получим два
прямоугольника площади 4: хОхО и ОхОх.
Подчеркнем еще раз, что соседство
клеток, прямоугольников и само выделение
прямоугольников на карте Карно производится с
учетом ее "закрученности". В этой связи
интересен "прямоугольник" на карте, приведенной
на рис. 9.4.7, обозначенный х 0 х 0, Он
образован двумя парами противоположных
угловых клеток.
0X0X
00
01
11
10
00
11
10
X0X0
-01X1
Рис. 9.4.7
Таким образом, если па карте Карно
сразу выделять все максимальные (в
указанном выше смысле) прямоугольники площади
2 (для некоторого к > 0 и не
превышающего числа переменных), то таким образом
мы "геометрически" реализуем описанный
ранее алгебраический итерационный процесс
склейки и в результате получим все простые
импликанты исходной функции
(составляющие сокращенную ДНФ). Эти
импликанты восстанавливаются по записям
прямоугольников точно так же, как это
описано выше ддя простой склейки. Так, для
карты, приведенной на рис. 9.4.7, получим
сокращенную ДНФ в виде Зс23с4 v ЗС|Зс3 v
VX\X2X4 .
1. Определение ядра. Говорят, что
элементарная конъюнкция К покрывает
элементарную конъюнкцию L (и пишут К >- L),
если любой литерал, входящий в К, входит в
L. Так, Х^х2 >■ *i*2*3 > х\х3 у *1*2*3> HO
Х\Хз >h Х\Х2х^, поскольку вторая конъюнкция
содержит литерал х^, отсутствующий в
первой конъюнкции. Легко понять, что если
К >■ L , то К v L = К (согласно
тождествам поглощения).
Каждая входящая в сокращенную ДНФ
простая импликанта покрывает некоторую
элементарную конъюнкцию исходной СДНФ.
На карте Карно этому отвечает прямоугольник,
"закрывающий" соответствующую единицу.
394
Глава 94. БУЛЕВЫ ФУНКЦИИ
Простую импликанту называют ядровой,
если она покрывает некоторую элементарную
конъюнкцию исходной СДНФ, не
покрываемую никакой другой простой импликантой.
На карте Карно прямоугольник,
соответствующий ядровой им пли канте отыскивается
очень просто: это такой прямоугольник,
удалив который, получим единицу, не закрытую
никаким другим прямоугольником. Тогда ни
одна ядровая импликанта не может быть
удалена из искомой минимальной ДНФ
исходной функции, т.е. все ядровые импликанты
обязательно войдут в минимальную ДНФ.
Множество всех ядровых импликант
(склеек) сокращенной ДНФ называют ядром.
Пример 9.4.9. я. У функции,
изображенной на карте Карно на рис. 9.4.8, ядро пусто,
т.е. ядровых импликант нет вовсе.
-X1Q
*1 \
0
1
00
М
г
01
щ
8
11
Ы
\
10
щ
JTft
1QX Х01 1X0
Рис. 9.4.8
б. На карте Карно на рис. 9.4.9 в ядро
попадают склейки Oxxl , Oxlx, 1x00.
0ХХ1 ХОЮ
P44^*4
00
01
11
10 1
00
(T|
Щ
\
Ы
V
h^
{
и
n
Ы.
10
i И
Щ
jj
щ
0X1X
10X0
1X00
Рис. 9.4.9
Если все простые импликанты оказались
в ядре, то сокращенная ДНФ и есть
единственная минимальная и кратчайшая ДНФ для
данной функции. В противном случае
смотрят, не эквивалентна ли ДНФ, построенная
как дизъюнкция всех ядровых импликант,
исходной СДНФ. Это будет иметь место тогда
и только тогда, когда ядровые импликанты
покрывают в совокупности все элементарные
конъюнкции исходной СДНФ. На карте
Карно тогда каждая клетка, содержащая единицу,
должна быть закрыта прямоугольником,
отвечающим некоторой ядровой импликанте.
Если это так, то ДНФ, построенная по ядру, как
описано выше, есть минимальная и
кратчайшая (склейки ядра закрыли все единицы
карты Карно). При этом импликанты, не
попавшие в ядро, все оказываются "избыточными",
т.е. их удаление из сокращенной ДНФ не
приводит к нарушению эквивалентности этой
последней с исходной СДНФ.
В остальных случаях переходят к
отысканию так называемых тупиковых ДНФ.
3. Перечисление тупиковых ДНФ.
Простую импликанту называют избыточной
(относительно некоторой ДНФ, содержащей
только простые импликанты и эквивалентной
исходной СДНФ), если ее можно удалить из
этой ДНФ без потери эквивалентности ее с
исходной СДНФ. Так, сокращенная ДНФ (см.
рис. 9.4.9) содержит избыточные импликанты:
импликанта, соответствующая
прямоугольнику 10x0 или прямоугольнику хОЮ (но не обе
сразу!), может быть удалена. Это значит, что
каждая из этих импликант является
избыточной относительно сокращенной ДНФ, но
удаление одной из них приводит к новой
ДНФ, относительно которой вторая из
упомянутых импликант уже не будет избыточной.
В том случае, когда каждую элементарную
конъюнкцию исходной СДНФ покрывает
некоторая ядровая импликанта, импликанты,
не вошедшие в ядро, можно удалить
одновременно.
Тогда можно представить процесс
пошагового удаления избыточных импликант,
начиная с сокращенной ДНФ, в результате
которого получится некоторая ДНФ, уже не
содержащая ни одной избыточной склейки.
Любую ДНФ, эквивалентную исходной
СДНФ, содержащую все ядровые импликанты
и не содержащую ни одной избыточной
импликанты, называют тупиковой.
Заметим, что в силу конечности
множества всех импликант тупиковая ДНФ
обязательно существует, т.е. в упомянутом выше
процессе мы рано или поздно доберемся до
такого момента, когда удаление хотя бы
одной склейки приведет к тому, что "откроется"
какая-то единичная клетка на карте Карно и
тем самым будет потеряна эквивалентность
полученной таким образом ДНФ с исходной
СДНФ.
Для СДНФ, карта Карно которой
приведена на рис. 9.4.9, имеются две тупиковые
ДНФ:
х}х4 v х,х3 v Х|Х3 ■ х4 v х2х3х4,
Х|Х4 V Х\Х3 V Х\Х~2 • JC4 V JCjJC2 • JC4.
Первые три конъюнкции соответствуют ядру.
ПОСТРОЕНИЕ МИНИМАЛЬНЫХ ДНФ
395
В общем случае для перечисления всех
тупиковых ДНФ может быть использован
следующий алгоритм. Мы изложим его в
терминах карт Карно и, допуская вольность
речи, будем отождествлять максимальные
прямоугольники на карте Карно с
соответствующими простыми импликантами.
Присвоим каждой простой импликанте
сокращенной ДНФ некоторое имя: т.е.
обозначим их, например, как Ку,К2,...,Кт .
Для любой единицы карты Карно, не покры-
ваемой ядром, перечислим все простые им-
Тем самым мы образуем
вспомогательную функцию (представленную КНФ вида
(9.4.13)), называемую функцией Патрика.
Раскрывая скобки в КНФ (9.4.13) и используя
тождества булевой алгебры (в частности,
тождество поглощения), получим ДНФ, в
которой каждая элементарная конъюнкция соот-
Элементарные конъюнкции в (9.4.15)
определяют тупиковые ДНФ. Более того, так
как в данном случае отсутствуют ядровые
импликанты, найденные конъюнкции
исчерпывают тупиковые ДНФ. Первая тупиковая
ДНФ состоит из конъюнкций К[ , Кз и К $ ,
т.е. имеет вид ХуХ2 v Х\Х3 v х2х3. Точно так
же определяются остальные тупиковые ДНФ.
Перечисление тупиковых ДНФ является
самым трудоемким этапом всего алгоритма
минимизации. Если число единичных клеток
карты Карно, не покрываемых ядром,
достаточно велико, то функция Патрика будет
весьма сложной и ее упрощение сопоставимо по
трудоемкости со всем процессом минимизации.
4. Отыскание среди тупиковых ДНФ
кратчайших и минимальных. Среди найденных
тупиковых ДНФ находят кратчайшие и ми-
пликанты, которые ее покрывают, записав их
в виде элементарной дизъюнкции, в которой
переменными считаются введенные выше
имена простых импликант. Переменное,
именующее данную простую импликанту,
принимает, по определению, значение 1, если
данная простая импликанта выбирается для
покрытия рассматриваемой единицы карты
Карно.
Записав все элементарные дизъюнкции,
составим из них КНФ. Рассмотрим карту
Карно на рис. 9.4.8. Введя обозначения
ветствует некоторой тупиковой ДНФ и,
наоборот, каждой тупиковой ДНФ может быть
сопоставлена одна из этих конъюкций.
Для нашего примера поступим так:
вычислим конъюнкцию первой и второй скобки
в выражении (9.4.13), третьей и четвертой, а
также пятой и шестой, после чего получим
нимальные. Можно легко показать, что
минимальная ДНФ всегда является кратчайшей,
но обратное неверно. Так,
х^х2 v х~2 = Х[ v х2 , и первая ДНФ
кратчайшая, но не минимальная. Действительно,
легко сообразить, что вторая из записанных
ДНФ минимальна. Следовательно,
представляемую ею функцию нельзя представить
ДНФ, содержащей менее двух элементарных
конъюнкций. Но в первой ДНФ три литерала,
а во второй — два. Из пяти тупиковых ДНФ,
соответствующих функции Патрика (9.4.15),
кратчайшими являются две. Каждая из них
минимальна, так как обе они имеют
одинаковое число литералов.
Пример 9.4.10. Рассмотрим карту Карно
на рис. 9.4.10.
В результате проведения склейки
получим следующую сокращенную ДНФ:
K{=xix2{l0x), К2=х2х3(х01), АГ3 = Зс! (Ох 1),
К4=х{х2{0\х), *5=х2х3(х10), Кв=х{х3(1х0),
получим
(К{ v К6) л (AT, v К2) л (К2 v К3)л (К3 v К4) л (К4 v К5) л (К5 v K6). (9.4.13)
(К\ v KyK2 v K^K[ v К^К2) д (К2К3 v K2K$ v K3 v К3К$) л (А4Л5 v K^K^ v К$ v K^K^).
(9.4.14)
Используя тождества поглощения, в содержащие К5. Проделав это, раскрыв все
первой скобке (9.4.14) мы можем удалить все
„ три скобки и применив еще раз поглощение,
члены, содержащие AT, , во второй - все чле- окончательно получим
ны, содержащие К3 , в третьей — все члены,
К\К3К$ v К\К3КлК^ v К\К2К^К^ v K2K3K^K(, v К2КлК(.. (9.4.15)
396
Глава 9.4. БУЛЕВЫ ФУНКЦИИ
х^х3 v Х\Х2 v х2х4 v Х2ХЪ v Шесть клеток, содержащих единицу, на
ч/г-г wvvv v/vvv vywv карте КаРно остаются непокрытыми ядровы-
vx3x4 v X[x2x4 v х{х2х3 v хЛх4. ми ^ей^^ д^ Неядровых склеек
Ядро составляют склейки (простые им- (обозначенных К\,...,К^) составляем функ-
пликанты) х{х3 и х{х2 . цию Патрика в виде
(#3 v К4)(К4 v K5)(K5 v ^6)(^ v K2)(K2 v /Г3)(ЛГ, v *б).
Преобразуя ее аналогично функции (9.4.13), получаем
К{К3К5 v К2К4К6 v К2К3К5К6 v КХК2К4К5 v КХК3К4К6.
Имеем, следовательно, пять тупиковых ДНФ. Запишем их, для наглядности, так:
х2х4 v х3х4 v х^Хз,
Х2Х3 V X[A2^4 V XjXj-fyj
Х2Х3 V Х3Х4 V Х^Хз v *1*3*4'
х2х4 v х2х3 v х{х2х4 v xtx2x3,
х2х~4 v x3x4v Х[Х2х4 v X|X33c4.
XjX3 V XjX2 V
ядро
00
01
11
10
00
01
т
и
3
т
ООхх
X0X0 {К{)
X00X
П1Х(К5)
tfblxlO(K6)
алгебраический метод Елейна, состоящий в
том, что к любой ДНФ, представляющей
функцию, применяются следующие тождества:
хК{ v хК2 = хКу v xK2 v К{К2,
К\ v К\ К-) = К\.
(9.4.16)
Ч-
X00X (К2) ХХ01 (К3) 11X1 (К4)
Рис. 9.4.10
Из этих пяти тупиковых ДНФ
кратчайшими являются первая и вторая. Из них, в
свою очередь, минимальной является первая,
так как она содержит на один литерал
меньше.
В итоге получаем минимальную ДНФ в
виде
х{х3 v х{х2 v х2х4 v х3х4 v *i*2*3-
В данном случае минимальная ДНФ
оказалась единственной, хотя, как это мы видели в
ранее разобранных примерах, в общем случае
могут существовать несколько минимальных
ДНФ.
Техника карт Карно является удобным и
наглядным (при определенных ограничениях
на число переменных минимизируемой
функции) способом реализации алгоритма
Квайна—Мак-Клоски. Но существуют и
другие способы проведения склейки, т.е.
получения сокращенной ДНФ для исходной
функции. Одним из таких способов является чисто
Первое из тождеств (9.4.16) называют
тождеством (или правилом) обобщенного
склеивания, второе — тождеством (или
правилом) поглощения.
"Технология" использования метода
Блейка такова: применяют тождество
обобщенного склеивания до тех пор, пока не
перестанут появляться новые элементарные
конъюнкции (вида К{К2). После этого
применяют тождество поглощения.
Как только сокращенная ДНФ тем или
иным способом найдена, приступают к
нахождению ядра. Ядро можно определить (без
использования карты Карно) с помощью так
называемой таблицы Квайна. Столбцы этой
таблицы соответствуют элементарным
конъюнкциям исходной СДНФ, а строки -
простым импликантам сокращенной ДНФ. На
пересечении строки и столбца проставляется
знак плюс(+), если простая импликанта
данной строки покрывает элементарную
конъюнкцию данного столбца. Ядро вычисляется
так: отмечаем столбцы с единственным
знаком +, тогда простые импликанты тех и
только тех строк, в которые попал этот знак,
образуют ядро.
Для примера 9.4.9, б (см. рис. 9 4.9)
получим таблицу Квайна, изображенную на
рис. 9.4.11.
В целях экономии места элементарные
конъюнкции в ааблице заменены цифровыми
ТЕОРЕМА ПОСТА
397
oxxi
0Х1Х
loxo
хою
1X00
0001
+
*
ООП
+
+
0010
+
+
0101
+
*
0111
+
+
оно
+
*
1100
+
*
1000
+
+
1010
+
+
Рис. 9.4.11
обозначениями соответствующих вершин и
граней булева куба - точно так же как при
обозначении прямоугольников на картах
Карно. Ядровые импликанты выделены
жирным шрифтом.
По таблице Квайна можно составить и
функцию Патрика для перечисления
тупиковых ДНФ. Для этого нужно отметить все
столбцы таблицы, в которых на пересечении
со строками, соответствующими ядровым
импликантам, не стоит знак +. Для
разбираемого примера таковым является только
последний столбец. Чтобы покрыть
соответствующую элементарную конъюнкцию
(совершенной ДНФ), можно выбрать одну из
двух простых импликант: х{х2х4 или
х2х^х^.
В заключение рассмотрим применение
карт Карно к построению минимальных ДНФ
частичных булевых функций, т.е. частичных
отображений из множества {0,1} в
множество {0,1}-
Частичная булева функция может быть
задана посредством карты Карно, в которой,
кроме клеток с единицами и пустых клеток,
будут клетки, заполненные прочерками (-).
Такой прочерк означает, что на
соответствующем наборе функция не определена.
Склейка для частичной функции
(заданной картой Карно) проводится таким
образом, что выделяются прямоугольники
максимальной площади (содержащие 2к
клеток, для некоторого к), каждая клетка
которых содержит либо единицу, либо
прочерк, причем существует, по крайней мере,
одна единичная клетка.
Пример 9.4.11. Пусть частичная функция
/(*1,*2»*з) задана картой Карно,
приведенной на рис. 9.4.12.
0
j l
00
(L
-
01
-_
-4
11
Т=
10
3]
ОХХ
Рис. 9.4.12
Прямоугольник максимальной площади
(равной 4), состоящий из единиц и
прочерков, записывается как Охх. Следовательно,
минимальная ДНФ для заданной функции
будет х{ .
В рассмотренном примере не принят во
внимание другой прямоугольник (площади 2),
содержащий клетку с единицей и клетку с
прочерком: хОО, поскольку среди
прямоугольников (с прочерками), содержащих
данную единицу, выбирают для замены
прочерков единицами такой, который имеет
максимальную площадь. Прочерки же остальных
прямоугольниках заменяют нулями.
Таким образом, в отличие от
минимизации булевых функций при минимизации
частичных булевых функций следует выделять не
все максимальные прямоугольники с
прочерками, содержащие данную единичную клетку
карты Карно, а выбрать произвольно любой
из таких прямоугольников. Но, конечно, не
нужно забывать о том, что каждая единица на
карте должна быть покрыта некоторой
склейкой.
9.4.7. Теорема Поста. В силу теоремы
о представлении любой булевой функции
дизъюнктивной или конъюнктивной нормшьной
формой стандартный базис {v,-,-} является
полным множеством. Поскольку согласно
законам де Моргана можно выразить конъюнкцию
398
Глава 9.4. БУЛЕВЫ ФУНКЦИИ
через дизъюнкцию и отрицание, равно как и
дизъюнкцию можно выразить через
конъюнкцию и отрицание, то при удалении из
стандартного базиса одной функции,
дизъюнкции или конъюнкции, при сохранении
отрицания, получим снова полное множество.
Прежде чем рассматривать другие
примеры полных множеств, установим один
важный факт.
Теорема 9.4.3. Пусть F и G - некоторые
множества булевых функций, причем F —
полное множество. Тогда, если каждая
функция из F может быть представлена некоторой
формулой над множеством G, то G — полное
множество.
Пример 9.4.12. Рассмотрим базис Жегал-
кина {0,•, 1}.' Чтобы доказать полноту этого
множества, заметим, что
xvy = xy®x®y, х = х Ф 1,
т.е. каждый элемент стандартного базиса
может быть представлен формулой над базисом
Жегалкина. Отсюда и следует (ввиду полноты
стандартного базиса, и теоремы 9.4.3) полнота
базиса Жегалкина.
Любую формулу над базисом Жегалкина
называют полиномом Жегалкина. Полином
Жегалкина от п переменных может быть
записан в виде
/>(*!,-,*„) =
{'ь(2.-.1|и}с{1,2,...,л}
(mod 2)^.
•imXhXh'"Xim>
где коэффициенты полинома О// / е {0,1} (коэффициент % соответствует пустому
индексированы всеми возможными подмно- множеству). В частности, при /2 = 3 будем
{1,2,..., п] иметь:
жествами
множества
#123*1*2*3 Ф #12*1*2 ф #13*1*3 ф #23*2*3 ф #1*1 ф #2*2 ф #3*3 ф #0
(9.4.17)
(общий вид полинома Жегалкина от трех
переменных). Формулу вида
п
]Г (mod 2) щх{ 0 а0 (9.4.18)
/=1
называют полиномом Жегалкина первой
степени от п переменных. В таком полиноме
отсутствуют "нелинейные" слагаемые, т.е. все
коэффициенты, индексированные более чем
одноэлементными подмножествами, равны 0
(и вместе с ними равны 0 все слагаемые,
содержащие конъюнкции переменных).
Теорема 9.4.4. Полином Жегалкина для
любой булевой функции определен
однозначно.
Для функций от небольшого числа
переменных можно использовать метод
неопределенных коэффициентов, позволяющий
получить полином Жегалкина данной функции.
Проиллюстрируем этот метод на примере.
Пример 9.4.13. Пусть вектор значений
булевой функции / равен 11001011. Найдем
полином Жегалкина, представляющий /
Поскольку размерность вектора значений/равна
2 = 8 , то /задана как функция от трех
переменных. Тогда она представляется некото-
/ (1,1,0) = #12*1*2 ф #1*1 ф #2*2 Ф #0 = #12 ф #2 ф #0 = #12 ф 1 ф * = #12
(сумма по модулю 2 любого четного числа же время /(1,1,0) = 1, то tf|2 = 1 . Анало-
равных слагаемых равна 0). Поскольку в то гично
рым полиномом Жегалкина третьей степени,
общий вид которого дает формула (9.4.17).
Наша задача — найти такие значения
коэффициентов этого полинома, при которых он
представляет функцию / Ясно, что значение
функции/на наборе 000 равно
коэффициенту Яд в формуле (9.4.17). Но, согласно
заданному вектору значений, оно равно 1.
Следовательно, flo = 1 . Далее
/(0,0,1) = я3$#о=#3®1 = 1>
откуда, решая уравнение относительно Я3 B
поле Z2 , получим а^ = 0 ;
/(o,i,o) = fliei=o>
т.е. aj = 1 ;
/(1,0,0) = 0, 01 = 1,
и Q\ - 0. Чтобы найти коэффициенты
#12,#13 и #23 » нужно рассмотреть значения
функции соответственно на наборах 110, 101
и 011. Так, для первого набора получим
ТЕОРЕМА ПОСТА
399
/(1Д1) = *13е<%=0,
откуда Я|з = 1 ;
/(0,1,1) = я2з Ф^2 ф^0 =0
и, так как а2 = Oq =\, а2з =0 . Наконец,
/ (1,1,1) = ат Ф ли Ф «в Ф ^2 е °0 = д123 = 1-
Итак,
J — Xj Л^2^3 Ф -^1 ^2 Ф "*i ^3 ® ^2 ® 1 *
Пример 9.4.14, д. Рассмотрим множество
{ | }, состоящее из единственной функции
(штриха Шеффера). Полнота этого множества
следует из легко проверяемых тождеств
б. Полнота множества {I},
единственным элементом которого является стрелка
Пирса, проверяется аналогично.
Теперь сформулируем критерий
(необходимое и достаточное условие) полноты
для произвольного множества булевых
функций. Для этого сначала рассмотрим некоторые
специальные множества функций.
Определение 9.4.8. Функцию /называют
функцией, сохраняющей константу О
(соответственно константу 1), если /(0) = О
(соответственно: /(П= 1 ), где 0 - нулевой,
а 1 - единичный наборы значений переменных
функции f .
Например, мажоритарная функция
является функцией, сохраняющей и константу 0,
и константу 1. Отрицание не сохраняет ни 0,
ни 1, а эквивалентность сохраняет 1, но не
сохраняет 0. Множество всех функций,
сохраняющих константу 0 (сохраняющих
константу 1), обозначается Tq (соответственно
71).
Наборы а и а из булева куба
В" = {0,1} (для произвольного
фиксированного п) будем называть взаимно
противоположными, говоря при этом также, что набор
а есть инверсия (или отрицание) набора а (в
силу единственности дополнения любого
элемента булевой алгебры набор а будет,
очевидно, инверсией набора а ).
Определение 9.4.9. Функцию g е Р2 п
называют двойственной к функции f e Р2п ,
если для всякого ае{0,1} (при л>0)
имеет место
8 (&) = /{&)■
Полагаем также, что константа 0
является двойственной к константе I и наоборот.
Пример 9.4.15. Стрелка Пирса есть
функция, двойственная к штриху Шеффера,
так как
х I у = х v у = х • у = х\у.
В общем случае в силу уже упомянутого
свойства единственности дополнения в
булевой алгебре функция h, двойственная к
функции g, которая двойственна к/ равна/.
Определение 9.4.10. Функцию /е Р2п
называют самодвойственной, если она
двойственна к себе самой, т.е.
(Vu6{0,1}")(/(a) = 7(u)),
ИЛИ
(Vae{0,l}")(/(u) = /(a)).
Таким образом, функция
самодвойственна тогда и только тогда, когда на взаимно
противоположных наборах она принимает
взаимно противоположные значения.
Следовательно, для того чтобы убедиться в несамо-
двойственности заданной функции /
достаточно найти хотя бы одну пару взаимно
противоположных наборов а и a , таких, что
значения функции на них совпадают, т.е.
/(a) = /(a). Так, мажоритарная функция
является самодвойственной, а
эквивалентность - нет, поскольку при
а = (0,0) 0-0 = 1 и 1-1 = 1.
Множество всех самодвойственных
функций (при всех п>\) обозначим S.
Определение 9.4.11. Функцию /еЯ2)Я
называют монотонной, если для любых
наборов а,р е Шп , таких, что a < Р , имеет место
/(*)*/(A)-
Другими словами, функция монотонна
400
Глава 94. БУЛЕВЫ ФУНКЦИИ
тонность следует из того, что 0 < 1 и
/ (0) = 0 < / (1) = 1. Линейность очевидна.
В то же время существуют функции, не
принадлежащие ни одному из классов Поста.
Таков, например, штрих Шеффера. Все
свойства, кроме нелинейности, следуют прямо из
таблицы этой функции. Нелинейность же
доказывается выводом полинома Жегалкина
для штриха Шеффера:
х\у = х-у = х-у(В\,
что не есть полином Жегалкина первой
степени.
Фундаментальным свойством каждого
класса Поста является его замкнутость (в
смысле определения 9.4.3). Это означает, что
для любого из классов Поста С всякая
суперпозиция над С снова есть элемент С.
Теорема 9.4.5. Каждый класс Поста
замкнут.
Приведем теорему, характеризующую
одно важное свойство немонотонных
функций.
Теорема 9.4.6. Если / £ М , то найдутся
два набора а, р , что
а = (а,,...,а/_1,0,а/+,,...,ая),
и / (а) = 1 , / (р) = 0 , т.е. для любой
немонотонной функции найдутся два набора,
различающиеся значениями в точности одной
компоненты и такие, что значение функции
на большем наборе равно 0, а на меньшем —
1.
Теорема 9.4.7 (критерий Поста).
Множество F булевых функций полно тогда и только
тогда, когда оно не содержится целиком ни в
одном из классов Поста.
Чтобы исследовать полноту конкретного
множества функций F = {/j,/2,—,fn} ,
нужно построить так называемую критериальную
таблицу (табл. 9.4.5).
Таблица 9.4.5
тогда и только тогда, когда для любого набора
а имеет место следующее свойство: если
значение функции на наборе а равно 1, то
оно равно 1 и на всех наборах, строго больших
(по отношению булева порядка на Шп) набора
а . Любой минимальный (относительно того
же порядка) набор а , для которого значение
/(а) монотонной функции /равно 1,
называют нижней единицей функции / Очевидно,
что вектор значений монотонной булевой
функции полностью определяется множеством
ее нижних единиц.
Мажоритарная функция монотонна, и
множество ее нижних единиц есть
{011,101,П0}- Штрих Шеффера -
немонотонная функция, так как 00 < 11 , но
0|0 = 1 , а 1| 1 = 0. Множество всех
монотонных функций принято обозначать через М.
Определение 9.4.12. Функцию /бЯ2я
называют линейной, если она может быть
представлена полиномом Жегалкина первой
степени от п переменных, т.е. формулой вида
(9.4.18).
Множество всех линейных функций
принято обозначать через L.
Любая булева константа и любая
проектирующая функция х являются линейными
функциями. Такова, разумеется, сумма по
модулю 2. Отрицание также линейно, ибо
х = х 0 1 . Конъюнкция и дизъюнкция не
являются линейными функциями, так как не
могут быть представлены полиномом
Жегалкина первой степени (см. утверждение 9.4.4).
Определение 9.4.13. Множества
функций Tq,Tj,S,M,L называются классами
Поста.
Замечание 9.4.1. Каждый класс Поста
состоит из функций с соответствующим
свойством для любого числа переменных. Можно
доказать также, что если функция /
принадлежит какому-то классу Поста С, то и любая
функция, равная функции / принадлежит
этому же классу. Другими словами,
добавление или удаление фиктивных переменных не
выводит за пределы любого из классов Поста.
Полезно еще заметить, что любая
проектирующая функция х принадлежит
одновременно всем пяти классам Поста.
Действительно, если / (х) = х , то / (0) = 0 и
/(1) = 1, т.е. / е Г0 n 7J . Отсюда же
вытекает и самодвойственность функции х. Моно-
/.
/2
fn
То
71
S
М
L
ТЕОРЕМА ПОСТА
401
Строки таблицы соответствуют
функциям исследуемого множества, а столбцы —
классам Поста. В результате анализа функций
множества F клетки таблицы заполняются:
если функция fj принадлежит некоторому
классу Поста С, то в соответствующей клетке
критериальной таблицы ставится знак плюс
(+), а если нет, то - знак минус (—).
Множество F тогда полно, если и только если в
каждом столбце таблицы стоит хотя бы один знак
Построим формулы над F для функций
отрицания и конъюнкции.
Для немонотонной функции
/д/ е F \ М , согласно теореме 9.4.6,
найдутся два таких набора а и Р, что
а = (а,,...,а/_,,0,а/+1,...,ая),
р = (cx,,...,oc/_,,l,cx/_f.,,...,ot„),
/Л/ (й) = 1, а/л/(Р) = 0.
Тогда х=/л/(а,,...,а/_,,х,а/+,,...,ал),
т.е. отрицание может быть получено из
немонотонной функции подстановкой вместо
некоторого ее переменного х, переменного х, а
вместо остальных переменных — констант
(Xj,...,a/_j,a/+|,...,aw, определяемых
выбранными выше наборами аир. Но,
вообще говоря, система F может и не содержать
констант. Поэтому константы 0 и 1
необходимо представить некоторыми формулами над
F
Рассмотрим два случая.
Первый случай. В F существует функция
Уо, не сохраняющая константу 0, которая
сохраняет константу 1; или существует
функция /|, не сохраняющая константу 1, но
сохраняющая константу 0.
Если существует функция /q € 7q и
Уо е Т\ , то константа 1 представляется
формулой
1 =/о (*,...,*),
так как /0 (0,...,0) = 1 и /0 (!,...,!) = I .
Чтобы выразить константу 0, используем любую
функцию ge F , не сохраняющую константу
I:
Q = g(l,...,l) = g(f0(x,...,x),...,f0(x,...,x)).
Если же указанная функция /q не
существует, но найдется функция /4 е 7q \ Ту, то
константы представляем формулами над F
аналогично (двойственным образом).
Второй случай. Любая функция из F, не
сохраняющая константу 0, не сохраняет и
константу 1, и, наоборот, любая функция из
F, не сохраняющая константу 1, не сохраняет
и константу 0.
Пусть /0(0,...,0) = 1, а /0(1,...,1) = 1.
Тогда мы получаем возможность представить
отрицание следующей формулой:
х = /о (*,-..,х).
Переходим к построению формулы для
констант, так как они потребуются нам далее
при построении формулы для конъюнкции.
Чтобы представить константы формулами над
F, воспользуемся несамодвойственной
функцией /у из F- Для этои функции найдется
такой набор a , что f$ (a) = /у (a). Введем
функцию одного переменного
h{x) = fs[xai ,'•--,ха" 1 (в предположении,
что a = (<Xj,...,art)). Легко видеть, что
л(°) = Л (^) = /?(«) = МО' так как ддя
любого ае {0,1}
0сП. <т = о; ,<, М, ° = i;
[0, а = 1, [0, а = 0.
Итак, значение h(x) есть константа. Если
она равна 0, то константу 1 представляем
через функцию, не сохраняющую константу
0; если же h (х) = 1 , то константу 0
представляем через функцию, не сохраняющую
константу 1.
Опишем построение формулы для
конъюнкции. Берем нелинейную функцию
fl из F. В полиноме Жегалкина для этой
функции выберем произвольное нелинейное
слагаемое, содержащее наименьшее число
переменных; пусть это будет слагаемое
Xj ,..., х,^ при 2<к<п. Вместо каждого
переменного хт функции Д , где
402
Глава 9.4. БУЛЕВЫ ФУНКЦИИ
/и* {/Ь...,/Л, подставим константу 0, т.е. вошли в выбранную ранее конъюнкцию.
Получим "редуцированную" функцию
заменим нулем все переменные, которые не
fL=xir..xik ®ai{Xil Ф...Фл,Л e^=/L(0,...,0,x/l,0,...,0,x/jt,0,...,0).
Заметим, что поскольку мы уже представили а переменные второй части - переменным у.
константы формулами над F, то функция f[
тоже представлена формулой над F. Разобьем
теперь множество переменных {дс,-,...,*,• }
произвольно на две части: (х,- , ...,*/т} и
\хЧп+\' •"' х'к J ' где * ~ т ~ * ~ *' и заменим
все переменные первой части переменным х,
В результате получим функцию двух
переменных
X (х, у) = хуФахФЬуФ с,
где
а = аи
'/я' '/л+1 'А:'
Ясно также, что функция х может быть
представлена такой формулой над F:
(
%{x,y) = h
0,...,0, х ,0,...,0, х ,0,...,0, х ,0,...,0, х ,0,...,0
'-у-' ^-v-< *-^ '-V-1
'1 '/и '/«+1 '*
т.е. функция х получена из нелинейной
функции fi^F путем подстановки на
место ее переменных с номерами /j,...,/w
переменного х, на место переменных с номерами
/w+j,...,/£ — переменного у, а на место всех
остальных переменных — константы 0, уже
представленной формулой над F(cm. выше).
Определим функцию
\|/ (х, у) = х (* $ Ь, у Ф я) 0 ab Ф с.
Выражая эту функцию из полинома Жегалки-
на для х , получим
= ху е я* ф Ьу е я£ ф ах ф аь ф £у ф аь ф с ф я£ е с = ху,
так как сумма по модулю 2 любого четного
числа равных слагаемых равна 0. Итак,
функция \|/ и есть конъюнкция. Так как
прибавление к любой функции константы по моду-
принадлежит самому множеству F. Поскольку
х = х - 0, то ввиду полноты множества
jv, | будет полным и рассматриваемое мно-
лю 2 есть либо сама исходная функция, либо жество. Конъюнкцию можно представить
ее отрицание, а отрицание уже представлено формулой над F, следуя доказательству теоре-
формулой над базисом F, то тем самым и
конъюнкция представлена такой формулой.
Пример 9.4.16. Пусть F = {~,v,0}.
Результаты исследования элементов этого
множества на принадлежность к классам Поста
приведены ниже. Заполненная критериальная
таблица примет вид табл. 9.4.6.
Таблица 9.4.6
~
V
0
п
-
+
+
Т\
+
+
-
S
-
-
-
м
-
+
+
L
+
-
+
При этом 1 = х ~ х , так как функция
~ (эквивалентность) не сохраняет константу
0, но сохраняет константу 1. Константа 0
мы Поста. Берем единственную нелинейную
функцию данного множества, дизъюнкцию, и
записываем для нее полином Жегалкина:
•^1 V Х2 = Xj • Х2 Ф Xj Ф Х2.
Видно, что этот полином есть не что
иное, как функция х(х1»х2) ПРИ <* = Ь = \ и
с = 0 . Следовательно,
х{ ■ х2 =х(*1 Ф1,*2 Ф 1)Ф1-
Но так как х = х ~ 0, то
Х\-х2= ((х{ ~ 0) v (х2 ~ 0)) ~ 0 . Этот же
результат (в данном конкретном случае)
можно получить и гораздо проще:
х, • х2 = X! v х2 = ((х, ~ 0) v (х2 ~ 0)) ~ 0.
СХЕМЫ ИЗ ФУНКЦИОНАЛЬНЫХ ЭЛЕМЕНТОВ
403
Итак, исходное множество является
полным.
Заметим, что это полное множество
двойственно к базису Жегалкина в том
смысле, что каждая из его функций двойственна к
соответствующей функции базиса Жегалкина:
эквивалентность двойственна к сумме по
модулю 2, дизъюнкция - к конъюнкции,
константа 0 — к константе 1. Полезно заметить
также, что никакое собственное
подмножество заданного множества не будет полным.
9.4.8. Схемы из функциональных
элементов. Представлению булевых функций
формулами можно придать следующий
"инженерно-конструктивный" смысл. Будем
рассматривать формулу 0(xi,...,xw) над
каким-то произвольно фиксированным
множеством /^как "черный ящик", некое устройство, на
вход которого подаются всевозможные наборы
значений переменных, а на выходе появляются
соответствующие этим наборам значения
функции / представляемой формулой Ф .
ОС п
Переменное JCj (точнее, значение этого
переменного) подается на вход структурного
элемента, называемого инвертором (рис.
9.4.14, а) и вычисляющего отрицание.
Снимаемое с выхода инвертора отрицание х± , т.е.
функция х~[ , подается на один из входов
конъюнктора (рис. 9.4.14, б), на второй вход
которого подается переменное х2 . На выходе
конъюнктора появляется функция Х\Х2 .
Аналогично прослеживается вычисление функции
ХуХ~2 - Обе эти функции подаются на входы
дизъюнктора (рис. 9.4.14, в), с выхода
которого снимается функция Х\Х2 v x±x2 (это не
что иное, как сумма по модулю 2. Х\ Ф х2 ). И
наконец, эта функция подается на вход
инвертора, на выходе которого уже получается
функция ~ (эквивалентность).
Таким образом, мы приходим к идее
Чтобы понять, как устроен "черный
ящик", мы должны разобрать процесс
построения формулы из подформул. Добираясь
до "базисных" подформул, т.е. элементов
множества F, мы приходим к "кирпичикам",
структурным элементам, из которых собран
"черный ящик", вычисляющий функцию /
Каждая функция "базиса" F вычисляется
соответствующим "узлом", который
рассматривается как мельчайшая структурная единица
нашего "черного ящика", и его внутренняя
структура уже не анализируется.
Пример 9.4.17. Выберем в качестве
множества F стандартный базис. Тогда формула
над стандартным базисом, представляющая
функцию ~ (эквивалентность), строится
следующим образом:
Xj ~ х2 = х{х2 v х{х2. (9.4.19)
Вычисление по этой формуле (и процесс
ее построения из элементов стандартного
базиса) можно схематически изобразить так,
как показано на рис. 9.4.13.
"схемы" - математической модели
вычислителя булевой функции, представленной
некоторой формулой. Вычислитель собран из
структурных элементов, каждый из которых
вычисляет одну из базисных" булевых функций. В
общем случае "схема" вычисляет булев
оператор, причем каждая координатная функция
этого оператора снимается с одного из
выходов схемы.
Математически "схема" определяется как
ориентированный граф специального вида, в
котором и вершины, и дуги снабжены
некоторыми метками.
Введем обозначение: если F - какое-то
множество булевых функций, то через F^
-t>- rO- 3>-
о б в
Рис. 9.4.14
404
Глава 9.4. БУЛЕВЫ ФУНКЦИИ
обозначаем подмножество F, состоящее из
всех функций от п переменных (при п > 0 ).
Определение 9.4.14. Пусть фиксированы
множества: F (булевых функций) и X
(булевых переменных).
Схема из функциональных элементов
(СФЭ) над базисом F u X (или просто схема
над базисом FvX, (F,X) -схема) —это
бесконтурный орграф (т.е. сеть), каждая
вершина которого помечена одним из элементов
множества F u X так, что должны
выполняться следующие требования:
1) каждый вход сети помечен либо
некоторым переменным из X, либо некоторой
константой из F^ ';
2) если вершина v сети помечена
(п)
функцией/от п переменных (т.е. / е FK '),
то ее полустепень захода равна я, причем на
множестве дуг, заходящих в вершину v , задана
(взаимно однозначная) нумерация, при
которой каждая дуга получает номер от 1 до п.
При изображении схем входы
обозначаются кружочками, а вершины, не являющиеся
входами, - треугольниками, внутри которых
записано обозначение функции, помечающей
данную вершину. Выходы отмечаются
"выходными" стрелками.
Определим теперь по индукции понятие
булевой функции, вычисляемой вершиной СФЭ.
Определение 9.4.15. Пусть задана СФЭ
S над базисом F u X , множество вершин
которой есть V.
х х у у
Рис. 9.4.15
1. Принимается, что каждый вход СФЭ
вычисляет булеву функцию, которой он
помечен (т.е. некоторое переменное или
константу).
2. Если вершина v e V помечена
функцией / е F^ ', заходящая в нее дуга с
номером / (при 1 < / < п) исходит из вершины
щ е V, которая вычисляет функцию gt, то
вершина v вычисляет суперпозицию
f(g[>->8n)-
Таким образом, каждая вершина СФЭ
над F вычисляет некоторую функцию.
Отметим, что порядок, в котором перечисляются
функции gi,...,£„, подставляемые на места
переменных функции/ в общем случае
существен. Естественно назвать булеву функцию /
от п переменных коммутативной, если она
сохраняет значение при произвольной
перестановке ее переменных. В этом случае мы
можем не заботиться о нумерации дуг,
заходящих в вершину схемы, помеченную такой
функцией.
Пример 9.4.18. СФЭ, изображенная на рис.
9.4.15, имеет два выхода, вычисляющие функции
Wx)M>;)=x>; и w>;)|w>;)=xv>;-
Определение 9.4.16. Булева функция,
вычисляемая СФЭ над базисом F и X — это
функция, вычисляемая каким-либо из ее
выходов.
В общем случае, если {xi,...,xw} -
множество всех переменных, которые служат
метками входов схемы S над базисом
F\j X , имеющей т выходов, то СФЭ S
определяет отображение булева куба Мп в
булев куб Мт , т.е. булев оператор.
Можно доказать и обратное: по любому
булеву оператору может быть построена СФЭ
над базисом F, где F — полное множество,
вычисляющая данный оператор.
Пример 9.4.19. Зададим булев оператор,
отображающий В3 в В2 (табл. 9.4.7). Из
таблицы легко увидеть, что
У[ = х{х2 v х{х3 v х2х3,
У2 = Х[ Ф X2 $ Ху
Функция >>i есть не что иное, как
мажоритарная функция от переменных
Х[,Х2,х3, и выше написана минимальная
ДНФ для нее.
СХЕМЫ ИЗ ФУНКЦИОНАЛЬНЫХ ЭЛЕМЕНТОВ
405
Представим функцию Ух в базисе Же-
галкина. Используя законы де Моргана,
получим
Х[%2 v -^1^3 v Х2Х3 ~ Х\Х2 • Х\Х-$ • Х2Х3.
Учитывая, что х = хФ1, будем иметь
х{х2 - х{х3 • х2х$ = (х{х2 Ф 1)(*1*з ф 1)(*2X3 $ 1) $ 1 =
= Х\Х2Х3 Ф Х[Х2^з Ф Х^Х2Х^ Ф -^1^2 ® X^XjX^ Ф ^С^ЛГз Ф Х2-Х3 Ф 1 Ф 1 = Х\Х2 Ф ^1^3 ® ^С2Х3
(напомним, что сумма по модулю 2 любого СФЭ для булева оператора, заданного
четного числа равных слагаемых равна 0). табл- 9-4 7» наД базисом Жегалкина приведена
на рис. 9.4.16.
Таблица 9.4.1 при проектировании СФЭ полезно
иметь в виду числовой параметр, называемый
ее сложностью.
Сложность СФЭ — это число ее вершин,
не являющихся входами.
Приведенная на рис. 9.4.16 СФЭ над
базисом Жегалкина имеет сложность 5.
Рассмотрим теперь СФЭ для того же
оператора над стандартным базисом.
По табл. 9.4.7 строим СДНФ для
функции у2:
*1
0
0
0
0
1
1
1
1
*2
0
0
1
1
0
0
1
1
3
0
1
0
1
0
1
0
1 1
1
0
0
0
1
0
1
1
1
У2
0
1
1
0
1
0
0
1
Итак,
Ух = х\х2 Ф jqjC3 Ф jc2x3 = х{х2 Фх3 (х{ Ф х2).
(х1 ®Х2)Хз
у2 = Х,Х2Х3 v *1*2*3 v *1*2*3 v *1*2*3-
Карта Карно для этой функции,
изображенная на рис. 9.4.17, показывает, что ее нельзя
минимизировать (точнее, записанная выше
СДНФ и есть минимальная ДНФ для этой
функции).
Но можно пойти по другому пути. Мы
можем рассматривать карту Карно на рис.
9.4.17 как таблицу, определяющую частичную
булеву функцию у2 = у2 (хь х2, х3, у{).
Минимизируя ее по карте Карно, изображенной
на рис. 9.4.18, получаем
у2 = х{х2х3 v уу (х{ vx2v х3).
СФЭ над стандартным базисом для
рассматриваемого булева оператора представлена
на рис. 9.4.19. Сложность этой СФЭ
составляет 11. Заметим, что вершина, вычисляющая
функцию Ух , не является выходом.
у2 = х1®х2®х2 у1 - х,х2©(х1©х2)х3
Рис. 9.4.16
fNF2x3
x,\s^
0
1
00
1
01
1
11
1
10
1
00
01 "
11 "
10
00
0
~Tj
j
1
/
01
"
-
0
-
11
-
3
я
0
10
(71
гГТ
и
4zJ
J XX01
fjUXO
J lxxo
] llix
Рис. 9.4.17
Рис. 9.4.18
406
СПИСОК ЛИТЕРАТУРЫ
t/1(x1vx2vx3)
Рис. 9.4.19
Булев оператор, рассмотренный в этом
примере, вычисляет двухразрядную сумму (по
модулю 2) трех одноразрядных слагаемых. Его
можно считать также одноразрядным
двоичным сумматором - функциональным блоком
многоразрядного двоичного сумматора - для
двух слагаемых. Тогда функция у\
интерпретируется как "сигнал переноса" в старший
разряд.
СПИСОК ЛИТЕРАТУРЫ
1. Ахо А., Хопкрофт Дж., Ульман Дж.
Построение и анализ вычислительных
алгоритмов: Пер. с англ. М.: Мир, 1979. 536 с.
2. Барти Т., Биркгоф Г. Современная
прикладная алгебра: Пер. с англ. М.: Мир,
1976. 400 с.
3. Богомолов А.М., Салий В.Н.
Алгебраические основы теории дискретных систем.
М.: Наука, 1997. 368 с.
4. Евстигнеев В.А. Применения теории
графов в программировании. М.: Наука, 1985.
352 с.
5. Каргополов М.И., Мерзляков Ю.И.
Основы теории групп. М.: Наука, 1972. 240 с.
6. Кон П. Универсальная алгебра: Пер. с
англ. М.: Мир, 1968. 352 с.
7. Кристофидес Н. Теория графов.
Алгоритмический подход: Пер. с англ. М.: Мир,
1978.432 с.
8. Кук Д., Бейз Г. Компьютерная
математика: Пер. с англ. М.: Наука, Гл. ред. физ.-
мат. лит., 1990. 384 с.
9. Лекции по теории графов / В.А. Еме-
личев, О.И. Мельников, В.И. Сарванов,
Р.И. Тышкевич. М.: Наука, 1990. 384 с.
10. Матросов В.Л., Стеценко В.А.
Лекции по дискретной математике. М.: Изд-во
МПГУ, 1997. 220 с.
11. Нефедов В.Н., Осипова В.А. Курс
дискретной математики. М.: Изд-во МАИ,
1992. 264 с.
12. Нигматуллин Р. Сложность булевых
функций. М.: Наука, 1991. 240 с.
13. Сикорски Р. Булевы алгебры: Пер. с
англ. М.: Мир, 1969. 375 с.
14. Яблонский СВ. Введение в
дискретную математику, 3-е изд. М.: Высш. шк.,
2001. 384 с.
ЧАСТЬ III
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
Раздел 10
ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ
УРАВНЕНИЯ
Глава 10.1
ОБЩАЯ ТЕОРИЯ
10.1.1. Основные определения.
Обыкновенным дифференциальным уравнением
называют соотношение вида
F(x,yJ9y",...9y№yo, (10.1.1)
связывающее независимую переменную х, ее
функцию у и производные у'9у"9...9у^п'.
Порядком дифференциального уравнения
называют наивысший порядок входящей в него
производной. Решением дифференциального
уравнения (10.1.1) называют такую п раз
дифференцируемую функцию у = у(х), которая
при подстановке в уравнение обращает его в
тождество по х. Процесс отыскания решения
дифференциального уравнения называют его
интегрированием. График решения
дифференциального уравнения называют интегральной
кривой. Решение дифференциального
уравнения, заданное в неявной форме ф(х,^) = 0,
называют интегралом дифференциального
уравнения. Решение дифференциального
уравнения может быть определено также и в
параметрической форме, а именно: у = (p(f),
х = \\f(t} для некоторого интервала
изменения параметра t . Общим решением
дифференциального уравнения в некоторой области
переменных х, у называют функцию
У = у(х9 С\, С2,..., Сп), такую, что при
соответствующем выборе значений постоянных
Q, С*2, ..., Сп функция у обращается в
любое решение этого уравнения, график
которого лежит в данной области. Любое решение
дифференциального уравнения, полученное
из общего при конкретных значениях
произвольных постоянных С[, С-1 , ... , Сп ,
называют частным решением этого уравнения.
Общее решение дифференциального уравнения,
заданное в неявной форме
ф(х, у, Су, С*2,..., Сп) = 0 , называют общим
интегралом. Решение, полученное из общего
интеграла при конкретных значениях
постоянных С\, С*2 , ... , Сп , называют частным
интегралом данного уравнения. Общее
решение может определяться также и в
параметрической форме, например, у - y(t9C\9C29-.-,
Сп), х = дс(/,С|,С2,...,Ся).
В совокупность решений данного
уравнения могут входить решения, не
содержащиеся в семействе решений этого уравнения,
зависящем от произвольных постоянных.
Такие решения также называют частными
решениями, если они записываются в явной
аналитической форме, или частным
интегралом — в случае неявной формы решения.
Системой обыкновенных
дифференциальных уравнений называют совокупность
т(т > 1) соотношений вида
fi[x,y\,y\,yi,...,y\ \УъУъУъ-^У\ >•••>
УтУтУт^'-*У^У^ / = 1,2 /И,
(10.1.2)
связывающих независимое переменное х,
функции УхьУъ-'-чУт и их производные до
порядка соответственно к9 /,...,г. Число
п- к + 1+.. .+г называют порядком системы,
408
Глава 10.1. ОБЩАЯ ТЕОРИЯ
а каждое из чисел к, /,...,/* называют
порядком этой системы относительно
соответствующей функции.
Примечание 10.1.1. Если к = /=.,.= г,
то система (10.1.2) может быть записана в
векторной форме:
ЛХ,уУУ'9...9у(к> | =
0, (10.1.3)
где / = {/J ,/2 ,...,/да}; У = {Л ,J>2 >-Л} J
,(*>
i-
Следовательно, (10.1.1) является скалярным
случаем системы (10.1.3), поэтому
определения решения, частного у = у(х} или общего
у = у(х,С), где С = {С1,С2,...,СЯ}, и
определения интеграла, частного ф(.х,д>) = 0 или
(к) г ( , ,, (к-[) , „
У\ ~ /l х,у{, Л ,у{ ,...9у\ ,у2 ,У2 ,У2 >
^2 = /2 *> Л »Jl »Jl >•",Д7! »J2 »J2 »J2 >
общего (p(.x,j>,C) = 0, повторяют ранее
данные определения, если их рассматривать
применительно к векторным формам решения и
интеграла. При т = 1 эти определения
совпадают.
Примечание 10.1.2. Так как (10.1.1)
является частным случаем (10.1.3), то всюду в
дальнейшем, проводя исследование системы
дифференциальных уравнений, одновременно
проводим его фактически и для уравнений
высшего порядка, и, следовательно, результат
этого исследования в скалярном случае может
быть применим к этим уравнениям без
какого-либо дополнительного обоснования, за
исключением некоторых специальных
случаев, когда для уравнений высшего порядка
некоторые рассуждения могут быть
упрощены.
Если система (10.1.2) может быть
записана в виде, разрешенном относительно
старших производных всех входящих в нее
функций:
(/-1) , „ (г-.
>^2 ч'-чУт^УтчУтт-чУт
(/-1) / „ (г-\
•">У2 ^••'•>УтчУт,>Ут'>"">У\
(10.1.4)
(г) f ( / „ (к-\) , ,, (/-1) , „ (г-\)\
Ут ~fm \х,У\,У1,У\,.~Ух \У2>У2>У2>-У2 >->Уж>Ут>Ут>~Ут >
то такой вид системы (10.1.4) называют кано- высшего порядка является скалярный случай
ническим. Очевидно, при & = /=...= г ее системы (10.1.5).
можно записать в векторной форме: Каноническую систему (10.1.4) из т
уравнений можно заменить эквивалентной ей
у\Ч _ Л Ху у у ,...,дД*-1' 1. (10.1.5) системой п = к + /+...+Г дифференциальных
V / уравнений первого порядка, разрешенных
л , ,х относительно производных уже п искомых
Отсюда следует (при т = 1), что канони- функций> КОТорыми являются
ческим видом дифференциального уравнения
\Z\ =У\> Z2 =У\, Z3 = У[,
(к-\)
Zk =У\ ', Zk+\ =У2, Zk+2 =У2>
[Zk+l = У2 ^ Zk+1+l = Уъ> •••> Zn = У% [).
Эта система, в силу (10.1.6) и (10.1.4), имеет вид
Z\ =Z2,Z2 =*3 »•»»**-! =*к>
\z'k =fl{x9Zi,Z2>->Zn)>
\Zk+\ =Zk+2>Zk+2 =Zk+3 9—>Zk+l-{ =Zic+l,
\z'k+i = f2{x*Z{,Z2>—9Zn)9
(10.1.6)
(10.1.7)
Zn-\ ~ Zn >
Zn = fm(x>Z\ ,Z2>~->Zn)-
ТЕОРЕМА КОШИ О СУЩЕСТВОВАНИИ И ЕДИНСТВЕННОСТИ РЕШЕНИЙ УРАВНЕНИЙ 409
Аналогично для дифференциального
уравнения л-го порядка
y{n) = f{x,y,y\y",..Jn-l))
строится эквивалентная система п
дифференциальных уравнений первого порядка:
К1 =*2>
[Zn ~ f\x>Z\,Z2>-">Zn)'
Каждая из систем (10.1.7) и (10.1.8)
является частным случаем следующей системы
дифференциальных уравнений первого
порядка (в которой неизвестные функции снова
обозначим через у):
\У2=/2(х,У\,Уъ->УпЪ (1019)
[Уп=/п(х>У\*У2>—>Уп)
или, в векторной форме, если
У = {У\,У2>->Уп}> / = {/|.Л Л}:
£ = /(^,j). (Ю.1.10)
Системы дифференциальных уравнений
(10.1.10) называют нормальными системами
обыкновенных дифференциальных уравнений,
или системами, имеющими нормальную форму
Коши. Таким образом, например, для системы
(10.1.4) эквивалентная ей система (10.1.7)
имеет нормальную форму.
10.1.2. Задача Коши (начальная
задача). Если математическая модель
теоретической или прикладной задачи описывается
дифференциальным уравнением или системой
дифференциальных уравнений, то для
определения конкретного частного решения
требуется задание дополнительных условий. При
задании таких дополнительных условий при
одном и том же значении независимого
переменного эти условия называют начальными
условиями, или условиями Коши, а задачу
решения уравнения или системы уравнений,
удовлетворяющего начальным условиям,
называют начальной задачей, или задачей Коши.
Если же дополнительные условия задаются
для двух или более значений независимого
переменного, то эти условия называют
краевыми условиями, а задачу решения уравнения
или системы уравнений, удовлетворяющего
краевым условиям, называют краевой задачей.
Так как общее решение уравнения или
системы содержит п произвольных
постоянных, то в задаче Коши и в краевой задаче
задается п дополнительных условий.
Задача Коши для системы (10.1.9) —
(10.1.10) ставится так: найти решение (10.1.9) -
(10.1.10), удовлетворяющее условиям
ЛЫ = Л0. У2Ы = У20, •••> УпЫ = Уп0>
для заданных чисел х0 , у[0 , у2о, ..., У „о
или в векторной форме у(хц) = Уо, где
Уо = {У\о>У20>—>Упо}> причем точка (х0,у0)
является точкой, принадлежащей области
определения системы (10.1.9) - (10.1.10).
Для дифференциального уравнения
высшего порядка
задача Коши состоит в нахождении его
решения, удовлетворяющего условиям: у(хо) = У\о,
/Ы = Л<Ь-. У{П~[)Ы = Уп0-
10.1.3. Теорема Коши о
существовании и единственности решений уравнений и
систем дифференциальных уравнений. Для
корректности постановки начальной и
краевой задач требуется доказательство
существования решения, указывающее иногда и путь
его построения. Существование физического
явления, описываемого данным
дифференциальным уравнением, может лишь подсказать
существование решения: доказательство
существования проверяет состоятельность
математической модели.
Рассмотрим условия существования и
единственности решения задачи Коши, или
начальной задачи.
Теорема Коши 10.1.1. Пусть функции f[,
/2* -• > fn правой части системы (10.1.9)
однозначны, непрерывны в некоторой области
изменения переменных х, у\ , у2 , ••• , Уп и
каждая функция удовлетворяет условию
Липшица по У = {у\*У2*-~<»Уп}'-
\г(х,М\...,Щ-
-Г(х,У?\у*\...Щ±К^-уЪ\ +
410
Глава 10.1. ОБЩАЯ ТЕОРИЯ
41,м2)Ь4?,-'!2,|}
/ = 1,2,..., я, где К — константа Липшица
для любых }Г ' и )г , принадлежащих
рассматриваемой области. (Очевидно, условия
Липшица выполняются, если функции /4 ,
fl > —» fn имеют ограниченные частные
производные по переменным у у , у 2 , ..., >>„
в данной области). Гягдя начальная задача для
системы уравнений (10.1.9) - (10.1.10) имеет
единственное решение, определенное на
некотором интервале (xq - И,х$ + ti), h > 0 .
Справедлива также следующая теорема.
Теорема 10.1.2. Если функции
Мх>У1>У2>--->Уп)> / = 1, 2,...,я,
непрерывны в области D(n + 1) -мерного пространства
переменных х9 у у, у^, ..., Уп , то через
каждую внутреннюю точку х0 9у{0 9y2Q » •••> Ло
э/wow области проходит, по крайней мере, одна
интегральная кривая, и каждая из этих кривых
может быть продолжена в обе стороны,
вплоть до границы любой замкнутой области,
целиком содержащейся в D .
Так как задача Коши для
дифференциального уравнения высшего порядка (10.1.5)
при к = п сводится к соответствующей
задаче Коши для системы дифференциальных
уравнений (10.1.8), то обратный переход к
переменным уравнения позволяет аналогично
формулировать условия существования и
единственности решения задачи Коши для этого
уравнения. А именно, если в области D изме-
нения переменных х9 у, у , у ,...,JV '
функция f\x,y,y',y"9...9y\n~')
определена и непрерывна, то через каждую
внутреннюю точку {х0,У\0,у2о,:.,Упо) области D
проходит, по крайней мере, одна
интегральная кривая, продолжаемая в обе стороны,
вплоть до границы любой замкнутой области,
целиком содержащейся в D {теорема Пеано).
Если функция f[x9y9y'9y",...,ykn~'\
удовлетворяет условию Липшица по переменным
' " (//-1) „ -
У9 У » У >••• >У в этои области, то на
некотором интервале (х0 - h9 Xq + h), h > 0 ,
существует и единственно решение задачи
Коши для уравнений (10.1.5) при к = п .
10.1.4. Непрерывная зависимость
решений от начальных данных и от
параметров. Справедливы следующие утверждения:
Теорема 10.1.3. Если вектор-функция
f(x9 у), определенная в области D ,
непрерывна, ограничена и если через каждую
внутреннюю точку (х$9уц) этой области проходит
только одно решение системы
дифференциальных уравнений у =f(x9y), то это решение
непрерывно зависит от правой части f(x9y) и
от точки (х$9Уо).
Теорема 10.1.4. Если вектор-функция
f(x9y) имеет по х и по у непрерывные
производные до т-го порядка, то решение
у = у(х9Хо9уо), которое удовлетворяет
системе дифференциальных уравнений у = f(x9y)
и при х = Xq обращается в у$ , имеет
непрерывные производные по Xq и у$ также до
т-го порядка (т>\).
Примечание 10.1.3. Утверждение
относительно производной вектор-функции по
векторному аргументу эквивалентно
утверждению относительно совокупности производных
координат вектор-функции по каждой из
координат векторного аргумента и т.п.
Теорема 10.1.5. Если вектор-функция
f(x9y9\i), где \i = {\i{,\i2,-~,\Lk}> k^{ ~
вектор-параметр конечной размерности,
непрерывна в области совокупности всех своих
аргументов, ограничена и удовлетворяет условию
Липшица по у с константой Липшица К, не
зависящей от х, у и (I, то для каждой
внутренней точки (х$9уо) соответствующей
области можно указать решение
дифференциального уравнения у = y(x9XQ9yQ9[i),
проходящее через эту точку и непрерывное по
совокупности переменных х и (I.
Теорема 10.1.6. Если вектор-функция
f(x9y9\i) удовлетворяет условиям теоремы
(10.1.5) и, кроме того, имеет ограниченные
производные до т-го (т>\) порядка по у и
(I в данной области, непрерывные по
совокупности переменных х, у и (I, то решение
у = у(х9 х^, Jo > ц) системы дифференциальных
уравнений у =f(x9y}, проходящее через
заданную внутреннюю точку (х^,Уо) соответ-
АНАЛИТИЧЕСКИЕ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
411
ствующей области, имеет непрерывные по со-
вокупности переменных х, jlx производные по
JLI, до т-го порядка включительно.
10.1.5. Аналитические решения
дифференциальных уравнений. Интегрируемые
виды обыкновенных дифференциальных
уравнений первого порядка. Сначала
рассмотрим дифференциальное уравнение
первого порядка, разрешенное относительно
производной
dy
dx
= А*,У)
(10.1.11)
в области, где выполнены условия
существования и единственности решения.
С геометрической точки зрения
уравнение (10.1.11) представляет соотношение,
связывающее координаты х, у точек
интегральной кривой и у — тангенс угла,
образуемого касательной к кривой с осью ОХ.
Таким образом, дифференциальное уравнение
определяет поле касательных или поле
направлений, т.е. ставит в соответствие каждой точке
некоторой области плоскости ХОУ
направление касательной к искомой интегральной
кривой, проходящей через эту точку. Для
уравнения (10.1.11) можно нанести на
плоскость ХОУ изоклины /(х, у) = С , т.е. кривые,
в точках которых направления касательных к
интегральным кривым сохраняют постоянные
значения. Интегральные кривые уравнения
(10.1.11) с помощью поля направлений и
изоклин могут быть приближенно графически
построены как кривые, касающиеся в каждой
своей точке поля направлений.
Итак, рассмотрим последовательно
интегрируемые случаи уравнения (10.1.11).
■• I-™-
(10.1.12)
Решение этого уравнения имеет вид
y = jf(x)dx + C.
2. Уравнение с разделяющимися перемен-
dy_
dx
А*)Ф)-
(10.1.13)
Общий интеграл при g(y) Ф 0 имеет
вид J*-yV = jf(x)dx + C. Если g(r\)=0,
то у = г\ является решением данного
уравнения.
3. -?- = f(ax + by + c), (10.1.14)
dx '
где а Ф 0, Ь Ф 0 .
Заменой функции и = ах + by + с
данное уравнение сводится к уравнению типа
(10.1.13).
4. Однородное уравнение
£=#
(10.1.15)
Заменой функции и = — данное урав-
х
нение сводится к уравнению типа (10.1.13).
5. £-/[ аХ + *У + С 1. (Ю.1.16)
ах I я 1 х + Ь[ у + С\ I
где — * — , cz + cf * 0 .
а{ by l
Заменой переменных х = и + а ,
у = v + Р, где постоянные а , Р являются
решением системы уравнений:
{аа + 6р + с = 0,
tfja + ^p + q =0
данное уравнение приводится к уравнению
типа (10.1.15).
6. Линейное уравнение первого порядка
dy_
dx
+ p(x)y = q(x). (10.1.17)
Данное уравнение интегрируется
методом вариации произвольной постоянной
(Лагранжа), состоящим в следующем. Сначала
интегрируем соответствующее однородное
уравнение — + р(х)у = 0 , как уравнение
dx '
типа (10.1.13), и находим его общее решение
-\p(x)dx
у -Се , где С — произвольная
постоянная. Затем ищем решение данного неодно-
родного уравнения в виде у = uyxje
причем в результате подстановки этого вида
решения в уравнение (10.1.17) получаем
относительно неизвестной функции и(х) снова
уравнение типа (10.1.13). В итоге общее
решение данного уравнения имеет вид
-jp(x)dx -\p(x)dx \p(x)dx
у = Се +е J q(x)e dx.
Структура решения показывает, что общее
решение линейного неоднородного уравнения
412
Глава 10.1. ОБЩАЯ ТЕОРИЯ
(10.1.17) представляет собой сумму общего
решения соответствующего однородного
уравнения и частного решения данного неоднородного
уравнения.
7. Уравнение Бернулли
dy_
dx
+ p(x)y + q(x)yn=0, (10.1.18)
п Ф 0 , п ф 1, р(х) Ф 0 , q(x) Ф 0.
Это уравнение сводится к уравнению
(10.1.17) с помощью подстановки и = у ~п .
Примечание 10.1.4. Как уравнение
(10.1.17), так и уравнение (10.1.18) могут быть
проинтегрированы с помощью метода введения
двух функций (метод Бернулли) у = u(x)v(x),
из которых одна определяется как частное
ненулевое решение некоторого уравнения
типа (10.1.13), и затем общее решение
получается подстановкой данного вида решения в
уравнение. Например, для уравнения
Бернулли имеем
— v + и — + p(x)uv + q(x)unvn = 0.
dx dx v ' v
Решая уравнение —v + p(x) uv = 0
dx v
или — + p(x) и = 0 , находим решение
dx v '
u(x) = <p(x) Ф 0 и затем, подставляя у =
= <§(x)v(x) в данное уравнение, находим его
общее решение, как уравнения типа (10.1.13).
8. Уравнение Риккати
О- = р(х) + q(x)y + r(x)y2 , (10.1.19)
где р(х) Ф 0 , г(х) Ф 0.
В общем виде данное уравнение не
интегрируется в квадратурах, однако, если
известно или каким-либо образом найдено
частное решение этого уравнения у = ф(х), то
определение общего решения получается
использованием подстановки у = и(х) + ф(х), в
результате которой уравнение (10.1.19)
сводится к уравнению (10.1.18).
9. Дифференциальное уравнение
(10.1.11), записанное в виде
Af(x,y)dx + N(x,y)dy = 0, (10.1.20)
называют уравнением в полных дифференциалах,
если функции М(х,у) и N(x,y) непрерыв-
но дифференцируемы и = . Общий
ду дх
интеграл такого уравнения представляется в
виде
х у
ф,у)= JM(x,y0)dx+ JN(x,y)dy = C
*0
У0
или
ф,у)= $M(x,y)dx + JN(x0,y)dy = С :
*о
уо
где (x0,.Vo) — внутренняя точка области
непрерывной дифференцируемости функций
М(х,у) и N(x,y).
Если левая часть дифференциального
уравнения (10.1.20) M(x,y)dx + N(x,y)dy = 0
не является полным дифференциалом
некоторой функции, а функции М(х,у) и N(x,y) -
непрерывно дифференцируемы, то существует
бесконечное множество так называемых
интегрирующих множителей, т.е. функций
\i(x,y), таких, что в результате умножения
на эту функцию обеих частей данного
уравнения выражение
\i(x,y)M(x,y)dx + \i(x,y)N(x,y)dy = 0
становится уравнением в полных
дифференциалах.
Условие интегрируемости полного
дифференциала
д[ф,у)М(х,у)] d[\L(x,y)N(x,y)]
ду
дх
представляет собой уравнение в частных
производных относительно неизвестной функции
№>(х,у) • Достаточно найти частное решение
этого уравнения, чтобы, согласно алгоритму
решения (10.1.20), найти решение
рассматриваемого уравнения.
Примечание 10.1.5. Если известен общий
интеграл у(х,у) = С уравнения (10.1.20), то
интегрирующим множителем является
[i(x,y) = -^- = —— . Так как общим интегра-
4 7 М N
лом (что легко проверить непосредственно)
АНАЛИТИЧЕСКИЕ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
413
является также (р^х,у) = фШх,у)) = С,
причем Ф(г) - произвольная
дифференцируемая функция, то два интегрирующих
множителя \ь(х,у) и щ(х,}>) связаны
зависимостью Щ = Цу(ф(х,}>)), где \|/(г) -
произвольная дифференцируемая функция. Таким
образом, если известны два интегрирующих
множителя, отношение которых не равно
тождественно постоянной, то общий интеграл
уравнения получается путем приравнивания
произвольной постоянной отношения этих
множителей — ^ = С .
Р\(х,у)
Примечание 10.1.6. Из рассмотренных
выше уравнений однородное уравнение
(10.1.15), записанное в форме M(x,y)dx +
+ N(x,y)dy = 0, имеет при хМ(х,у) +
+ yN(x,y"j * 0 интегрирующий множитель в
виде —-—. — . Интегрирующим
xM(x,y) + yN(x,y)
множителем линейного уравнения (10.1.17)
jp(x)dx
является \1(х,у) = е
Рассмотрим теперь методы
интегрирования дифференциальных уравнений первого
порядка, заданных в форме
f(x,y,y')=0, (10.1.21)
т.е. не разрешенных относительно производной.
1. Если
f(x,y,y) = (у -А(х,у))(у - f2(x,y))..x
x(y'-fn{x,y)) = 0,
(10.1.22)
то данное уравнение эквивалентно п (п > 2)
дифференциальным уравнениям первого
порядка, разрешенным относительно
производной. Результат перемножения общих
интегралов ф/-(дс,1у,С) = 0 уравнений-множителей у =
= fi{x,y), / = 1, 2,...,/i, в виде произведения
Я>1 (х,У,С) ф2 (х,у,С)... ф„ (х,у,С) = 0 дает
общий интеграл данного уравнения.
2. * = /(/)- (10.1.23)
Данное уравнение и последующие
уравнения (10.1.24) - (10.1.28) интегрируются с
помощью метода введения параметра у = р .
В результате подстановки в уравнение
(10.1.23) имеем х = /(/?), и переменная х
через параметр р выражена. Из равенства
dy = pdx имеем dy = pf\p)dp , отсюда
У - I Pf (p)df + С . Совместно с х = /(/?)
получаем искомое решение в
параметрической форме.
Примечание 10.1.7. Если параметр р
может быть исключен из полученных
равенств х = /(/?), у = \ pf\p)dp + С , то
решение находится в обычной форме. Этот
факт следует иметь в виду и при решении
уравнений (10.1.24) - (10.1.28).
3.
y = f(y).
(10.1.24)
Полагая у = р , имеем у = f(p) , далее
из dx--^--—^-^-dp находим
P P
f'( \
x-\ —— dp + C , и совместно с у = f(p)
J P
находим искомое решение.
4. y = f(x,y). (10.1.25).
Полагая у = р , имеем у = f(x, p) .
Далее применяем так называемый метод
интегрирования с помощью дифференцирования.
Дифференцируя обе части у = f(x, р) по х
Э/
и заменяя слева у = р , получаем р = — +
дх
Э/ dp '
+ ——— - уравнение первого порядка от-
др dx
носительно переменных х и р , разрешенное
относительно производной. Если может быть
найдено общее решение этого уравнения
х = ф(р, С), то подставляя в у - f(x, p) это
значение, имеем у = /(ф(/>, С), р), и тем
ше уравн*
но.
5. x = f(y,y).
самым решение уравнения в параметрической
форме найдено.
(10.1.26)
414
Глава 10.1. ОБЩАЯ ТЕОРИЯ
Полагая у = р и дифференцируя обе
части х = f(y,p) по у, заменяя слева
dx 1
— = —, получаем уравнение первого поряд-
dy P
ка с разделяющимися переменными относи-
1 Э/ df dp „
тельно у и р : — = -=— + ———. Подставляя
р ду dp dy
решение этого уравнения у = <р(/?, С) в
х = /(У>Р) > те- х = /(ф(Р>С)>/>) з находим
искомое решение данного уравнения.
6. Уравнение Лагранжа
У = м?(у') + У(у')- (Ю.1.27)
Это уравнение является частным
случаем уравнения (10.1.25) и решается
соответствующим методом.
7. Уравнение Каеро
10.1.6. Методы интегрирования
дифференциальных уравнений порядка выше
первого.
Рассматриваются следующие уравнения.
■• ^
(10.1.29)
ху + <р(/) .
(10.1.28)
Данное уравнение является частным
случаем уравнения Лагранжа (10.1.27). Решая
это уравнение Клеро, по аналогии с (10.1.25)
получим
У=р, У = хр + у(р),
Ф
>&
ар ', v ар
Р = P + x-f- + <p(p)-j-,
dx dx
dp
откуда — x + ф'(р) = 0 . Приравнивая нулю
dp
первый множитель — = 0, получим инте-
dx
грал р = С и, исключая параметр р из этого
соотношения и исходного
дифференциального уравнения в виде у = хр + ф(/?),
находим общий интеграл уравнения Клеро
у = Сх + ф(С), который представляет собой
аналитическое выражение семейства прямых
линий на плоскости. Приравнивая нулю
второй множитель ф (/?) + х = 0 , получаем
решение уравнения Клеро в параметрической
форме х = -ф'(/>), у = -ру'(р) + ф(/>),
представляющее собой так называемое особое
решение, являющееся с геометрической точки
зрения огибающей семейства прямых,
записанных аналитически общим интегралом
у = Сх + <р(С).
Последовательным интегрированием
находят общее решение
у = f... \f(x)dxn +Cxx"-{ +С2х"-2+...+Сп .
2- /(x,/),/+1),...,^)j=0. (10.1.30)
Данное уравнение заменой z(x) = у^ '
приводится к уравнению порядка п- к :
/I x,z,Z ,...,V~ '1 = 0. Если общее
решение этого уравнения найдено:
Z = ф(х, С[, С2,..., С/7_£ ) , то, полагая
(к)
Z = у , получаем дифференциальное
уравнение jA ' = ф(х, Cj, С2,..., Сп_к) типа
(10.1.29).
3. /{у,У,у",...,У{п)>) = 0. (Ю.1.31)
С помощью введения функции
/ \ dz
Z\y) = У находим у = Z—,
dy
d ( dz\
у = Z—r\ Z— и т.д., и в результате под-
dyy dy)
становки в данное уравнение понижаем его
порядок на единицу. Далее полученное
уравнение интегрируют, находят решение
z(y) = <?(у, С\, С2 ,..., С„_,) и обратной
подстановкой получают уравнение первого
порядка у' = q>(y, Ci,C2,...,C„_,) типа
(10.1.13), решаемое аналогично (10.1.13).
4- f[x,y,y\y",...,y{n^ = 0. (10.1.32)
Если для любого / и некоторого к
выполнено условие однородности функции f
относительно
У,У,у", ...,у\ т.е. flx,ty,
СПИСОК ЛИТЕРАТУРЫ
415
= 0, то порядок данного уравнения
понижается подстановкой у = yz , где z(x) — новая
неизвестная функция (к - степень
однородности).
Если для (10.1.32) выполнено условие
обобщенной однородности функции f
относительно х и у, т. е. уравнение не меняется в
результате замены х на tx, у на tmу ,
соответственно у на t у , у на tm~ у
и аналогично последующие производные для
любого / и некоторого значения т,
вычисляемого из равенства f\tx,tmy,tmу ,...,
t"-"yWytkfUy,y',...J")yO, то по-
рядок данного уравнения понижается одним
из ранее рассмотренных способов после
подстановки х = е*, у = z(t)emt, где z(/) -
новая неизвестная функция; / — новая
неизвестная переменная (к - степень
однородности).
Если же левая часть (10.1.32)
представляет собой полную производную по х
некоторой функции, т.е.
то, восстанавливая первообразную, получают
<dx,y,y\y",...,y^) = Ci , т.е. порядок
уравнения понижается на единицу.
10.1.7. Метод интегрируемых
комбинаций решения системы уравнений.
Система дифференциальных уравнений (10.1.9)
может быть записана в симметричной форме,
т.е. в виде
dx = *! = *> =
/\(х,У\,У2,-,У„) /2{х,У\,У2>->Уп)
= ... dyn
fn{x,yUy2,...,yny
или в виде равенства функциональных
пропорций. Если удается составить такую
производную пропорцию, называемую в этом
случае интегрируемой комбинацией, которая
может быть проинтегрирована, то в результате
получим щ(х,у\,У2,.'.,У„) = С] . Такое
соотношение, в котором левая часть
представляет собой нетождественно равную
постоянной функцию, принимающую данное
постоянное значение С\ на решениях данной
системы (10.1.9), называют первым интегралом
данной системы. Если удается составить п
таких интегрируемых комбинаций и
соответственно п первых интегралов, таких, что они
независимы между собой, то в результате
получаем в координатной форме общий
интеграл данной системы (10.1.9)
Ъ(х>У\>У2>~->Уп) = С{> ' = !> 2> ■••> "' или
в векторной форме у(х,у) = С.
Если п независимых первых интегралов
найти не удается, а только к < п, то из
полученных к первых интегралов к переменных
выражают через остальные и подставляют в
данную систему. Ее порядок тем самым
понижают на к единиц.
СПИСОК ЛИТЕРАТУРЫ
1. Агафонов С.А., Герман А.Д., Муратова
T.B. Дифференциальные уравнения. М.: Изд-
во МВТУ, 1999. 348 с.
2. Арнольд В.И. Обыкновенные
дифференциальные уравнения. М.: Наука, 1984.
272 с.
3. Камке Э. Справочник по
обыкновенным дифференциальным уравнениям. М.:
Наука, 1971.
4. Корн Г., Корн Т. Справочник по
математике для научных работников и
инженеров. М.: Наука, 1968.
5. Матвеев Н.М. Методы
интегрирования обыкновенных дифференциальных
уравнений. М.: Высшая школа, 1963. 546 с.
6. Петровский И.Г. Лекции по теории
обыкновенных дифференциальных
уравнений. М.: Наука, 1970. 280 с.
7. Понтрягин Л.С. Обыкновенные
дифференциальные уравнения. М.: Наука, 1970.
332 с.
8. Степанов В.В. Курс
дифференциальных уравнений. М.: ГИФМЛ, 1958. 468 с.
9. Федорюк М.В. Обыкновенные
дифференциальные уравнения. М.: Наука, 1985.
448 с.
10. Хартман Ф. Обыкновенные
дифференциальные уравнения: Пер. с англ. М.:
Мир, 1970. 720 с.
И. Эльсгольц Л.Э. Дифференциальные
уравнения и вариационное исчисление. М.:
Наука, 1969. 424 с.
416 Глава 10.2. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ И ЛИНЕЙНЫЕ СИСТЕМЫ
Глава 10.2
ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ
УРАВНЕНИЯ И ЛИНЕЙНЫЕ СИСТЕМЫ
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
10.2.1. Основные определения.
Линейное дифференциальное уравнение п-го
порядка имеет вид
/пКщ(х)у("-1Ка2(х)у(п-2и...+
+ <>п(*)У =/(*)>
(10.2.1)
непрерывны, а следовательно, условия
теоремы Кош и существования и единственности
решения данного уравнения выполнены.
При f(x) = 0 уравнение называют
линейным однородным, в противном случае —
линейным неоднородным. Однородное
уравнение называют соответствующим данному
неоднородному, если оно получается путем
замены нулем свободного члена f(x) в
неоднородном уравнении.
Система линейных дифференциальных
уравнений в нормальной форме имеет вид
У\ = а\\(х)У\ + ^2{х)у2+...+щп{х)уп +/,(х),
Уг=аг\{х)У\ + *22(*)V2+- • •+а2п{х)Уп +/2(4
Уп =*1||(*)У| +ап2(х)У2+'--+апп{х)Уп +fn(x),
(10.2.2)
где функции ау(х), /{(х), /, j = 1, 2,..., л , -
непрерывны, т.е. условия теоремы Коши
выполнены.
В векторно-матричной форме линейная
система имеет вид:
^=A(x)y + f(x), (10.2.3)
где У = {у\,Уг,...,У„}\ f(x) = {f\{x),f2{x),...,
(вц(*) а\г{х) ••• °i»(*)l
\аг\{х) агг{х) - агп{х)
*{*)-
При /(*) = 0 систему называют линейной
однородной, в противном случае — линейной
неоднородной. Заменой вектор-функции /(*)
на нулевую получаем однородную систему,
соответствующую данной неоднородной.
Теорема 10.2.1 (принцип наложения). Как
для уравнения (10.2.1), так и для системы
(10.2.2) — (10.2.3) справедлив так называемый
принцип наложения, применительно к (10.2.3) он
формулируется так: если у\ (х) является
решением -j- = А(х)у + f\(x), a у2(х) ~ решением
где функции ах(х), а2(х), ..., ап[х), f(x) - dy_
dx
А(Х)У + fl{x)» то У(х) = У\(х)+ У2(х)
является решением — = А(х)у + f\ (x) + f2(x) •
10.2.2. Представление решений
линейных систем через фундаментальную
систему решений и с помощью
фундаментальной матрицы. Интегральное
представление решения неоднородной системы
уравнений. Общее решение линейной
однородной системы дифференциальных уравнений
dy_
dx
А(х)у
(10.2.4)
представляет собой линейную комбинацию п
линейно независимых ее решений у\ , у2 , ••-,
уп с произвольными постоянными С\,
С2 , ..., Сп , а именно
п
у = С]У{ +С2у2+... + Спу„ =^Ckyk .
к=\
(10.2.5)
Представление решения в виде (10.2.5)
справедливо на интервале (а,Ь), на котором
непрерывны А(х) (возможны случаи а = -оо и
Ь - +оо). Такая линейно независимая система
решений называется фундаментальной
системой решений.
На вектор-функциях, составляющих
фундаментальную систему решений в
координатной форме как на столбцах построим
матрицу G(x)
, (10.2.6)
<*п\{х) ап2(х) ... апп(х)
<?(*)=
'.vii(*) Уп(х)
Уи(х) У2г(х)
Уп\(х) УИг{х)
- У\„(х)Л
- У2п{х)
- Ут(х)\
ПРЕДСТАВЛЕНИЕ РЕШЕНИЙ ЛИНЕЙНЫХ СИСТЕМ
417
где уц — элементы матрицы, /-е координаты
у-го решения фундаментальной системы
решений. Матрица G(x) называется
фундаментальной матрицей. Фундаментальная матрица
удовлетворяет матричному
дифференциальному уравнению
dG(x)
dx
= A(x)G(x),
(10.2.7)
так как равенства столбцов левой и правой
частей уравнения (10.2.7) являются п раз
написанные уравнения (10.2.4) с
подставленными в них последовательно вектор-функциями,
составляющими фундаментальную систему
решений. Определитель фундаментальной
матрицы называется определителем Вронского
и имеет вид
Щх) = \0(х1
\Уп Уп
\У21 УП
У\п
У2п
Уп\ Уп2 .- Упп
Неравенство определителя Вронского нулю
ни в одной точке рассматриваемого интервала
изменения независимой переменной является
необходимым и достаточным условием
линейной независимости решений У[ , у2 , ••-,
уп системы (10.2.4). В этом случае
фундаментальная матрица является невырожденной,
имеет, следовательно, обратную матрицу
G (х), которая является решением, так на-
ря:
а
dG~\x)
зываемои, сопряженной системы по
отношению к (10.2.7), а именно
dx
-G-\x)A(x).
При х = Xq e (a,b) фундаментальная
матрица (7(x0) становится матрицей
начальных значений для фундаментальной системы
решении
G(x0) =
(у\\{хо) Уп{хо) ». У\п(*о))
У2\(хо) У22(хо) »• У2п{хо)
Уп\(ч) У,а{ч) ». УппМ
В частном случае, когда G(xq) - Е (Е —
единичная матрица), то соответствующие систему
решений и матрицу G(jc) называют
нормальной фундаментальной системой решений и
нормальной фундаментальной матрицей. С
помощью фундаментальной матрицы согласно
(10.2.5) общее решение линейной однородной
системы (10.2.4) записывается в виде
y = G(x)C.
(10.2.8)
Для определителя Вронского справедлива
формула Остроградского-Лиувилля-Якоби
X
J (a\ 1 (*Н22 (*)+~+«/m M) <**
W(x) = W(xoyX°
из которой следует, что W(x) либо
тождественно равен нулю, либо не обращается в нуль
ни в одной точке рассматриваемого интервала
(а,Ь) изменения переменной х.
Общее решение линейного однородного
дифференциального уравнения п-го порядка
/") + а{(х)у^ + а2(х)/"-2К. лап(х)у = 0
(10.2.9)
представляет собой линейную комбинацию п
независимых между собой ее решений у± ,
У2 у •••■> Уп с произвольными постоянными
С[, С2 , ..., Сп , а именно
п
у = С[У[ + С2у2+...+С„у„ = ^Ckyk .
k=\
(10.2.10)
Данная независимая система решений
называется фундаментальной системой решений.
Если от уравнения (10.2.9) перейти к
соответствующей нормальной системе (по типу
(10.1.8)), для нее записать фундаментальную
матрицу G(x) и затем вернуться к
переменным уравнения (10.2.9), то получим матрицу
G(X):
у[
У\
У2
У2
Уг
\у\ у\
Уп
Уп
г/
Уп
(/1-1)
Уп
которая является невырожденной
фундаментальной матрицей для уравнения (10.2.9). Ее
определитель
Н - 7706
418 Глава 10.2. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ И ЛИНЕЙНЫЕ СИСТЕМЫ
п*)=Ш=
м
л
/
У\
//
л
1
Уг
г
Уг
//
Уг
(/1-0
Уп
Уп
(п-1
Уп '
(10.2.11)
является определителем Вронского для
решений уравнения (10.2.9). Из формулы Остро-
градского-Лиувилля-Якоби, имеющей для
уравнения (10.2.9) вид
]ax(x)dx
W(x) = W{x0)e
*Q
следует, что W(x) либо тождественно равен
нулю, либо не равен нулю ни в одной точке
рассматриваемого интервала изменения х.
Последнее является необходимым и
достаточным условием линейной независимости
решений ух , у2 , ..., уп .
При х = Xq имеем
С(х0) =
у'\{ч)
у\{ч)
Уг{ч)
j4(*o)
Уг{ч)
,["-%) ,И)Ы
УпЫ )
Уп{хо)
У"п(х0)
у(Г1)Ы
то есть невырожденную матрицу начальных
значений для фундаментальной системы
решений. Если (7(*о) = Е » то соответствующая
матрица C(x) и система решений
называются нормальной фундаментальной матрицей и
нормальной фундаментальной системой
решений. В случае линейного однородного
дифференциального уравнения второго порядка
у" + я 1 (х)у' + а2 (х)у = 0 i если известно
какое-нибудь его частное решение У\(х), то
ниже указанная известная формула Лиувил-
ля—Остроградского
У\
/
h
Уг\
/
Уг\
= Се
(10.2.12)
дает возможность определить с помощью
квадратур второе частное решение У2(х)»
образующее с первым фундаментальную
систему решений, и, следовательно, найти общее
решение данного уравнения:
у = С}у{ + С2у2 •
Линейная неоднородная система
дифференциальных уравнений (10.2.2) —(10.2.3) может
быть проинтегрирована по методу вариации
произвольных постоянных (Лагранжа),
состоящему в следующем: сначала определяется
фундаментальная система решений у\ ,
У2 > •••> Уп соответствующей однородной
системы уравнений, а с ней общее решение у00
этой системы уравнений
Уоо=С\У\+С2У2+--+СпУп>
где С[, С2 , ..., Сп - произвольные
постоянные.
Искомое решение у = уон , то есть
общее решение линейной неоднородной
системы (10.2.2) — (10.2.3) находим в виде
У = Q(*)Vl +C2(x)y2+...+CfJ(x)yn ,
где С|(х), С2(х), ..., С„(х) - неизвестные
функции. Подставляя этот вид решения в
(10.2.2), в результате получаем (см.
обозначения (10.2.6)):
С\У\\ +С2Уп +~ + С'пУ\п = /l(*)>
C[y2l+C2y22+... + Cny2n =f2{x), (102П)
С'хУт + с2^2 + ». + С'пУпп = Л (*) •
Так как матрицей системы (10.2.13) является
невырожденная фундаментальная матрица, то
система (10.2.13) относительно неизвестных
С[(х), / = 1, 2, ...,/! является совместной и
определенной системой. Решая ее, находим
C,(x) = j \|//(х)Лс + С, = ф/(х) + С, ,
/ = 1, 2 #i,
где С/ - новые произвольные постоянные.
ПРЕДСТАВЛЕНИЕ РЕШЕНИЙ ЛИНЕЙНЫХ СИСТЕМ
419
Подставляя найденные значения функций
Ci(x) в искомый вид решения, получим
~ ~ ~ п
У = С]У{ + С2у2+.лСпуп + У£щ{х)ук ,
к=\
п
где ф(х) = V <рк (х)ук - вектор-функция
к=\
частного решения данной системы
(получается при С\ = С2 = ... = Сп = 0).
В векторно-матричной форме, используя
(10.2.8), окончательно имеем
y = G(x)C + ф(х). (10.2.14)
Итак, общее решение системы линейных
неоднородных дифференциальных уравнений
представляет собой сумму общего решения
соответствующей линейной однородной системы и
частного решения данной неоднородной.
Линейное неоднородное дифференциальное
уравнение (10.2.1) может быть
проинтегрировано по методу вариации произвольных
постоянных (Лагранжа) следующим образом:
сначала определяем фундаментальную систему
решений у\ , у2 , ... , уп соответствующего
однородного уравнения, а, следовательно, и
общее решение у00 этого уравнения в виде
Уоо=С\У\+С2У2 + -+СпУп>
где С\, С2 , ..., Сп — произвольные
постоянные.
Искомое решение у = уон, то есть
общее решение линейного неоднородного
уравнения (10.2.1) определяем в виде
■Voh = Ci(*)Vi + С2(Х)У2 + ••• + Сп(х)Уп •
(10.2.15)
Если теперь перейти от уравнения (10.2.1) к
соответствующей нормальной системе (по
типу (10.1.8)), записать для нее решения на
основе данных решений для уравнения у00 и
Уон и подставить последнее в полученную
систему, то в результате этого строим (10.2.13)
и, возвращаясь в этой системе обратно к
переменным уравнения (10.2.1), имеем
c[yx+c2y2 +... +с>„ = о,
С[у[+С2у'2 + ... +C>^=0,
(10.2.16)
Решая данную совместную определенную
систему относительно С/(х), / = 1, 2, ...,/!,
находи м С\(х) = \|// (х) , С{(х)= \ \|/, (х) dx +
+ С/, Cj(x) = ф,(х) + Q , / = 1, 2, ...,л , где
С/ - новые произвольные постоянные.
Подставляя полученные значения в искомый вид
решения (10.2.15), окончательно имеем
~ ~ ~ л
у = С]У{ + С2у2 + ... + Спуп + £ф* (х)ук
к=\
или y = Qyi + С2у2+.. . + Спуп+у(х), где
п
ф(лс) = ^Г Ф*(*).У£ ~ частное решение урав-
к=\
нения (10.2.1).
Итак, общее решение линейного
неоднородного дифференциального уравнения
представляет собой сумму общего решения
соответствующего однородного уравнения и частного
решения данного неоднородного.
Система линейных неоднородных
дифференциальных уравнений в
векторно-матричной форме имеет вид (10.2.3), а общее
решение соответствующей ей однородной
системы с помощью фундаментальной
матрицы записывается в виде (10.2.8). Решение
данной неоднородной системы (10.2.3)
определяем в виде
y = G(x)C(x), (10.2.17)
где С(х) - неизвестная вектор-функция.
Подставляя (10.2.17) в (10.2.3) и учитывая
(10.2.7), имеем
G(jc)^1 = f(x). (10.2.18)
dx
Записывая эту систему (10.2.18) в скалярной
форме, получаем уравнения (10.2.13) для оп-
14*
420 Глава 10.2. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ И ЛИНЕЙНЫЕ СИСТЕМЫ
ределения Cj(x) по методу вариации
постоянных (Лагранжа). Уравнение (10.2.18) можно
также решить, умножая обе его части на
G~ (x). Решив уравнение (10.2.18) и
подставив его решение в (10.2.17), находим общее и
вместе с ним частное решение данной
неоднородной системы. Общее решение
неоднородной системы записывается в виде
х
y = G(x)C+JG(x)G-\Z,)m<K,.
Эту формулу называют формулой Коиш, а
матрицу G[xyj~ (£) = К(х, £) называют ядром
или матрицей Коиш. Этот метод получения
решения системы (10.2.3) в виде формулы
Коши называют методом Коиш.
10.2.3. Линейные дифференциальные
уравнения с постоянными
коэффициентами. Метод Эйлера решения линейных
систем с постоянными коэффициентами.
Линейное однородное дифференциальное уравнение
с постоянными коэффициентами
y(") + aiy("-lKa2y(n-2K... + any = 0,
(10.2.19)
где я, = const, / = 1,2,... ,я , имеет
фундаментальную систему п решений, которая
записывается на основании значений X -
корней характеристического уравнения:
X" + a{k"-x + a2Xn~z +... + я„ = 0,
полученного в результате подстановки
у = е в (10.2.19) и последующего
сокращения обеих частей полученного выражения на
е Ф 0. В общем случае корнями этих
уравнений могут быть действительные и
комплексные, простые и кратные корни. Если
корни Х\ , Х2»■■•» ^п ~~ действительные и
различные, то им соответствуют решения
фундаментальной системы решений е ,х ,
е 2* ,..., е пХ . Если среди корней имеется
пара комплексно-сопряженных корней
А,| 2 = ot ± /р , то такой паре соответствуют
следующие два действительных решения
фундаментальной системы решений: еа
еах sin P* . Для кратного действительного
корня кратности т Х\ = Х2 =- • •= ^т
соответствующими независимыми решениями
фундаментальной системы решений будут:
ех*х , хех*х , jcV,jc, ..., хтАе^х. При
наличии кратных комплексных корней
кратности т Xj 2 2/и-1 2т = а - Ф (всего 2т
корней) соответствующими действительными
решениями фундаментальной системы
решений уравнений (10.2.19) будут eflXcospx,
еах sin рх , хеах cos рх , хеах sin рх , х2еах х
xcospx, xV^sinpje, ..., хт~]еах cospx,
xm-leax sinfix.
После определения всех решений
фундаментальной системы решений уравнения
(10.2.19) его общее решение записывается в
виде (10.2.10).
Линейная однородная система
дифференциальных уравнений с постоянными
коэффициентами
dy_
dx
где А
ап ап
а2\ а22
-Ау9
а2п
(10.2.20)
- const,
\ап\ ап2 •• annj
имеет фундаментальную систему п решений,
которая вычисляется на основе значений X —
корней характеристического уравнения
\А - ХЕ\ =
(ап-Х
а2\
*п\
а\2
а22 -X
аП2
а2п
апп - X
(10.2.21)
"flxcospx3
которые могут оказаться простыми или
кратными, действительными или комплексными.
Если корни Х\ , Х2, ..., Хп —
действительные и различные, то составляющие
решения фундаментальной системы решений будут
Я,е^х, Н2еХ2Х , ..., Нпех"х, где Я, (/= 1,
2, ..., п) — ненулевые вектор-столбцы с
постоянными коэффициентами, значения
координат которых (с точностью до произвольной
постоянной) определяются как решения
систем линейных уравнений
ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ С ПОСТОЯННЫМИ КОЭФФИЦИЕНТАМИ 421
(A-XiE)Hi=0, / = l,2,...,/i, (10.2.22)
ранг матрицы которых равен п - 1.
Соответствующее общее решение
данного уравнения будет
у = С[Н1е^х +С2Н2еХ2Х+...+СпНпех»х .
Если среди корней имеются
комплексно-сопряженные корни A,j 2 = ol ± Ф , то
сначала находим для одного из этих значений,
например ос + /р, по аналогии с предыдущим
комплексный ненулевой вектор Я, решая
систему (10.2.22) при X - а + /р .
Составляющая часть общего решения данного
уравнения, содержащая два независимых
действительных решения фундаментальной системы
решений, соответствующих данной паре
комплексно-сопряженных корней, будет
C.Retfe^'^+QImtfe^K
Для кратного корня Х\ = Х2 -■•• = ^т
кратности т составляющая часть общего
решения данной системы с т независимыми
действительными решениями
фундаментальной системы решений определяется с
помощью выражения
У = [Н0 + Нхх + Н2х2 + ... + Нкхк]е^х ,
(10.2.23)
где к = Rang(y4 -Х{Е)-(п - т); Я7 , / = 1,
2, ..., к — векторы с постоянными
независимыми коэффициентами. Далее выражение
(10.2.23) подставляют в систему (10.2.20) и по
методу неопределенных коэффициентов
определяют в общем виде значения
коэффициентов Я, , /== 1, 2, ..., к. Затем после
подстановки найденных значений в (10.2.23) и
разрешения полученного результата
относительно произвольных постоянных С\, С2 , ...,
Ст получаем искомую часть общего решения
системы (10.2.20). В случае кратных
комплексных корней Л,| 2 3 2///-I 2/и = И±/р
сначала, выбрав один из этих корней,
например а + /р, проводим все вычисления по
аналогии с кратным действительным корнем
кратности т согласно предыдущему случаю. В
итоге получим сумму произведений т
произвольных постоянных на т независимых
комплексных решений вида С|ф| (л:) -f-
+С2ф2(л;) + ... + С/иф/и(х), где ф,(х), / = 1,
2, ..., т — комплексные функции
действительного переменного х.
Теперь часть общего решения системы
(10.2.20), соответствующая рассматриваемым
кратным комплексным корням, содержащая
2т действительных решений
фундаментальной системы решений , записывается
окончательно в виде
Q Rtq>i(x) + C2 1тф1(х) + C3Re92(*) +
+ С4 Im Ф2(х) + С5 Яефз(х) + С6 Im Фз(х) +
+ • • • + с2т-\ Re ф„7(х) + С2т Im ф/и(х)
Линейные неоднородные дифференциальные
уравнения с постоянными коэффициентами
+ апу = /(*),
где f(x) ~ непрерывная функция, могут
интегрироваться методом вариации
произвольных постоянных (см. (10.2.15) с
предварительным решением соответствующего
однородного уравнения (10.2.19)). Если правая
часть данного неоднородного уравнения
имеет так называемый специальный вид
N
/(*) = Х[Л {x)cos$kx+qk (jc)sinp*jr}?a*\
к=\
(10.2.24)
где СС£, р£ - действительные числа; рк(х),
Як{х) ~ многочлены по х конечной степени
с действительными коэффициентами, то в
этом случае частное решение данного
уравнения (после определения общего решения
соответствующего однородного уравнения
(10.2.19)) может быть найдено с
использованием метода наложения по так называемому
методу подбора частного решения в случае
специальной правой части вида (10.2.24). А
именно это решение определяется в виде
•Участи =
N
= ^[rk{x)cos$kx + sk(x)smVkx]ea><xxf"L ,
к=\
(10.2.25)
где гк(х), sk[x) - многочлены по х
одинаковой степени с неизвестными
коэффициентами, при этом данная степень будет
422 Глава 10.2. ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ И ЛИНЕЙНЫЕ СИСТЕМЫ
deg rk(x) = deg sk (x) = max(deg рк (х), deg qk (*)),
тк — число, равное кратности корня
X = ак ± фк среди корней
характеристического уравнения соответствующего линейного
однородного дифференциального уравнения.
Коэффициенты многочленов гк(х) и
sk(x) вычисляют по методу неопределенных
коэффициентов.
Примечание 10.2.1. Если в (10.2.24) для
некоторого k-го слагаемого р^ = 0 и,
следовательно, это слагаемое имеет вид
/ \ OL.X
рк [х)е К , то соответствующее частное
решение подбирается в виде rk (х)е k xmk ,
т.е. в виде (10.2.25) при $к = 0.
Линейная неоднородная система
дифференциальных уравнений с постоянными
коэффициентами
4jL = Ay + f(x), (10.2.26)
где f(x) ~~ непрерывная вектор-функция,
может быть проинтегрирована методом
вариации произвольных постоянных (Лагранжа) (см.
(10.2.3) при А - const с предварительным
решением соответствующей однородной
системы (10.2.20)).
Если f(x) имеет так называемый
специальный вид
N
А*) = Х[^(*)«*Р*дс + Qk{x)sin Vkx]ea*x ,
k=\
(10.2.27)
где ak , р£ — действительные числа; Рк(х),
Qk{x) — вектор-многочлены по х конечной
степени с действительными коэффициентами,
то частное решение данной системы может
быть найдено (после определения общего
решения соответствующей однородной
системы 10.2.20)) по так называемому методу
подбора частного решения в случае специальной
правой части вида (10.2.27). А именно это
решение определяется в виде
•Участи =
N
= X [ъ (*)cos р*х+5* (*)sin М е"кХ'
к=\
(10.2.28)
в котором R/c(x), <S/c{x) ~~
вектор-многочлены по х одинаковой степени с
неизвестными коэффициентами, которая равна
dtgRk(x) = 6tgSk(x)= msix{dtgPk(x),
deg Qk (x)) + mk, где тк — число, равное
кратности корня X = ак ± фк среди корней
характеристического уравнения
соответствующей линейной однородной системы
дифференциальных уравнений. Коэффициенты
многочленов Як(х) и Sk (x) вычисляют по
методу неопределенных коэффициентов.
Примечание 10.2.2. Если для некоторого
k-vo слагаемого (10.2.25) (3^ = 0, т.е. это сла-
ах
гаемое имеет вид Рк (х)е к , то
соответствующее частное решение подбирается в виде
Rk (х)еа,с , т.е. в виде (10.2.28) при р* = 0.
Линейные дифференциальные уравнения
Эйлера
{ах + Ь)"/пК(ах + Ь)п-1а[У(п-[К...+
+ (ax + b)a„_{y' + any = f(x),
(10.2.29)
где а , b , Я] , я2 > —» ап ~~ действительные
числа, при помощи подстановки (ах + Ь) = е*
приводятся к линейным уравнениям с
постоянными коэффициентами.
СПИСОК ЛИТЕРАТУРЫ
1. Агафонов С.А., Герман А.Д., Муратова
Т.В. Дифференциальные уравнения. М.: Изд-
во МВТУ, 1999. 348 с.
2. Арнольд В.И. Обыкновенные
дифференциальные уравнения. М.: Наука, 1984. 272 с.
3. Корн Г., Корн Т. Справочник по
математике для научных работников и
инженеров. М.: Наука, 1968.
4. Матвеев Н.М. Методы
интегрирования обыкновенных дифференциальных
уравнений. М.: Высшая школа, 1963. 546 с.
5. Петровский И.Г. Лекции по теории
обыкновенных дифференциальных
уравнений. М.: Наука, 1970. 280 с.
6. Понтрягин Л.С. Обыкновенные
дифференциальные уравнения. М.: Наука, 1970.
332 с.
7. Степанов В.В. Курс
дифференциальных уравнений. М.: ГИФМЛ, 1958. 468 с.
8. Федорюк М.В. Обыкновенные
дифференциальные уравнения. М.: Наука, 1985.
448 с.
ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ С ПОМОЩЬЮ СТЕПЕННЫХ РЯДОВ 423
9. Хартман Ф. Обыкновенные
дифференциальные уравнения: Пер. с англ. М.:
Мир, 1970. 720 с.
10. Эльсголыд Л.Э. Дифференциальные
уравнения и вариационное исчисление. М.:
Наука, 1969. 424 с.
Глава 10.3
ПРИБЛИЖЕННО-АНАЛИТИЧЕСКИЕ
МЕТОДЫ РЕШЕНИЯ
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ И
СИСТЕМ ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЙ
10.3.1. Метод последовательных
приближений. Метод последовательных
приближении состоит в следующем. Рассмотрим
решение задачи Коши (начальной задачи):
% = f(x>y)> уЫ = Уо> (ю.3.1)
где у = {У\,У2,Уз,~-,Уп} ; У0 = {УЮ>У20>
Узо>--->Упо}>
7i(*,j01
А*,У) =
h{*,y)
/з(х.У)
Шх>у))
Условия теоремы Коши существования и
единственности решения предполагаются
выполненными. Интегрируя обе части
дифференциального уравнения (10.3.1) в пределах
от Xq до х, получим
У{х) = У{*о)+ jf{x,y)dx,
хо
(10.3.2)
где
]f{x,y)dx-
*0
jf\ix>y)dx
х
\h{x,y)dx
х
\h(x,y)dx
х
\fn(x,y)dx
ч
Последовательные приближения Ут(х),
т = 1, 2, 3, ..., к решения у(х) (10.3.2)
задачи (10.3.1) определяются по формуле
х
Ут{х) = Уо+ \f{x,ym-\)dx,
*о
при этом принимается при т— 1 Ут-\{х) =
= Уо{х) = Уо •
Данный метод применим и к решению
дифференциального уравнения л-ro порядка,
если его записать в виде эквивалентной
системы. Оценка погрешности метода имеет вид
*т{х) = \ут(х)-у{х)\*
<4п(пК)т М
|*-*о|
т+\
Р/и = 1,2, 3,...,
(/72 + 1)!
где \х - Xq\ — величина рассматриваемого
интервала области определения решения; п —
порядок системы (10.3.1); М>0 —
постоянная, такая, что в рассматриваемой области
\fi(x9y^uM, / = l,2,...,/i; K>0
-постоянная, такая, что в данной области
\fi{x,yx)-fi{x^<KY\yh -yh\9 i= 1,
7=1
2, 3, ..., л, для любых у\ и У2 , т.е. функции
fi{x,y) удовлетворяют по У условию
Липшица с постоянной К > 0 .
10.3.2. Интегрирование
дифференциальных уравнений с помощью степенных
рядов. Метод последовательного
дифференцирования. Задача Коши для
дифференциального уравнения л-го порядка
у{я) = /(х,у,у,у",...,у{я-1)) (ю.3.3)
состоит в определении его решения,
удовлетворяющего заданным начальным условиям
•К*о) = У\0 > у\хо) = У20> у"{хо) = У30 > •••>
У{"~{)Ы = Уп0- (10-3-4)
Правая часть уравнения (10.3.3) является
аналитической функцией в рассматриваемой
424 Глава 10.3. ПРИБЛИЖЕННО-АНАЛИТИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ И СИСТЕМ
окрестности точки (х0 , j>i 0 ,3^20 > У30 >• • • >
Упо)е Я и, следовательно, в этой
окрестности представляется сходящимся степенным
рядом.
Решение задачи (10.3.3) - (10.3.4) в
данной области определяется в виде ряда Тейлора
Д*)=х4т^-*<>)*• (1015)
к=0 Кя
Первые п +1 коэффициентов ряда (10.3.5)
определяют непосредственно из начальных
условий (10.3.4) и уравнения (10.3.3) путем
подстановки в него х - Xq и (10.3.4).
Для определения следующего (п + 2) -го
у{"Лч)
коэффициента —; \-*- дифференцируют
(и + 1)!
уравнение (10.3.3) по правилу дифференциро-
вания сложной функции: ук ' = — +
Эх
v э/ dy{k)
+ у —— —, где для удобства принято
ЫЪду
{k) dx
/) = у. Отсюда У{П+[)Ы = [А{
. nL У Jo
«о» означа-
к=0и
ет, что значения соответствующих
производных берутся в точке (*о>Л(Ь.У2(Ь---..Уяо)-
Повторяя этот прием шаг за шагом, находим
значения и дальнейших производных
У (хо)> У (хо)> ••• в результате
приближенное решение данной задачи (10.3.3) —
(10.3.4) можно записать в виде у(х) =
к^у(к)Ы,
«1^*-^
, т.е. в виде отрезка
к=0
получаемого ряда Тейлора. Оценка
погрешности такого приближения определяется
величиной остатка этого ряда.
Если рассматривается задача Коши для
системы дифференциальных уравнений
(10.3.1), то при условии, что f,(x,y), /' = l,
2, ..., п — координаты вектор-функции f(x,y)
правой части системы (10.3.1) являются
аналитическими функциями, решение задачи
(10.3.1) может быть представлено в виде ряда
Тейлора
*=0
у\к)Ы
ЪЧ^^тЪЧг1^)' -
у?Ы<
\к=0
к=0
к\
А:=0
„1Ш{Х.ЩА
(10.3.6)
Первые коэффициенты этого ряда
У{хо) = Уо= У(0) и у'(х0) = f(x0,y0) =
- /I Х0>У ) определяются непосредственно
из (10.3.1) по начальным условиям. Для
определения последующих коэффициентов
проводим последовательно дифференцирование и
подстановку начальных условий и найденных
значений производных:
^L = M + M.dL = M + Mfixy)
dx2 дх ду dx дх дуП'У)'
э/
где — =
ду
Следовате
(Ml
ду{
д/2
дух
дУ„
Ум
льно,
dfx
ду2
Э/2
ду2
¥п
ду2
Vl)
ду„
Э/2
ду„
э/й
дУп)
у{2)Ы
= К(*о,Уо) +
+ /у{хо,Уо)/{хо,Уо) и т.д.
Приближенно-аналитическое решение
(10.3.1) записывается в виде отрезка ряда
Тейлора (10.3.6)
%"у{к)Ы, +
= \ к\ '{х-х0)
к=0
с оценкой погрешности по остатку этого ряда.
Метод неопределенных коэффициентов.
Для применения метода неопределенных
коэффициентов в задачах (10.3.1) или (10.3.3) —
(10.3.4) в обоих случаях сначала, как и в
методе последовательного дифференцирования,
определяются первые п коэффициентов ряда
для решения (10.3.5) или (10.3.6) по
начальным условиям. Последующие же коэффици-
МЕТОД МАЛОГО ПАРАМЕТРА
425
енты записываются как неопределенные а^ ,
fl2, Я3» ••• Таким образом, решение (10.3.5)
или (10.3.6) имеет вид
+ ^-(х-х0)п+а1(х-х0)"+1 +
4/7+2
w+3
/ чЛ+Z / \rt+J
+ а2(х-х0) +а3(х-х0) + ...+
\W+A:
+ АЛ(ДС-ДС0) +-.., (Ю.3.7)
в котором коэффициенты flj , а2» fl3> —
подлежат определению. Для этого разлагаем
сначала правую часть уравнения (10.3.3) или
системы уравнений (10.3.1) в ряд Тейлора в
окрестности начальной точки (*о>.У10».У20>
Узо>--->Упо)- В результате для (10.3.3)
получим (в операторной форме):
/(х,уУУ\..,у{"-1)У
=/(^0^10^20^30»-.,^яо)+ У—7 х
/(*,у,ц),
(10.3.10)
w=l
/я!
^(х-х0)+|-(у-Уо)+А(/->,20)+
+ ... +-
ду
(/i-l)! ' ^
л0 I
</[х,У,/,...,/^]|
(10.3.8)
Для (10.3.1) в векторной форме аналогично
имеем:
°° 1
/(*,у) = /(*о,Уо)+£—Гх
'*—*, /Я!
[-) л и"»
^(^-^о) + ^(у-Уо)] Л^)|0.
(10.3.9)
Подставляя теперь в обе части
уравнения (10.3.3), в котором правая часть записана
в виде (10.3.8), выражение для искомого
решения (10.3.7) и приравнивая в итоге
коэффициенты при одинаковых функциях от х
(ограничиваясь для приближенного
решения какой-либо степенью n + N , т.е.
(х-х0) ), получим систему
алгебраических уравнений относительно
неопределенных коэффициентов ау , а2 , Яз» —» flyv » из
которой эти коэффициенты последовательно
и определяют.
Аналогично находят коэффициенты а\ ,
а2, ^з' •••' Ядг приближенного решения
системы уравнений (10.3.1) в виде ряда
(10.3.7) до степени (x-Xq) b результате
подстановки в обе части системы уравнений
(10.3.1) искомого ряда для решения при
замене правой части системы (10.3.1) на ряд
(10.3.9).
Оценку погрешности приближенно-
аналитического решения проводят через
оценку остатка ряда для решения.
10.3.3. Метод малого параметра.
Методом малого параметра решают задачи Коши
для систем дифференциальных уравнений
вида
dx
у(х0,11) = ф) (10.3.11)
в области аналитичности функций f(x,y,\i)
по у, fi и (р(ц) по [1 и непрерывности
функции /(x,y,|i) по х. При этом fi —
малый параметр (вблизи нулевого значения).
Решение системы (10.3.10) при условии
(10.3.11) находят по методу малого параметра
в виде ряда по степеням этого параметра
y{x,\L) = Уо{х) + т{х) + \?У2 (*) + - +
+ »тут(х)+...= ^тут(х), (10.3.12)
т.е. в виде сходящегося степенного ряда по
степеням малого параметра |i, являющегося
асимптотическим разложением этого
решения. Коэффициентами этого ряда в данном
случае являются неизвестные функции }>о (х),
У\{х)> У2{х)> •••» подлежащие определению.
При н = 0 данная задача (10.3.10) - (10.3.11)
принимает вид
^ - f(x,y,0), у{х0,0) = Ф(0), (10.3.13)
426 Глава 10.3. ПРИБЛИЖЕННО-АНАЛИТИЧЕСКИЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ И СИСТЕМ
который называют порождающей задачей, а ее
решение — порождающим решением. Это
решение и есть Д>о(х) в (Ю.3.12), так как при
ц = 0 y(x,ii^0=y0(x).
Для определения последующих
коэффициентов ряда для решения (10.3.12), т.е.
функций У\(х), У2{х)> —» разлагаем
функцию /(x,j>,|i) правой части системы (10.3.10)
в ряд Тейлора в окрестности (х,Уо,0), т.е. по
степеням (у - у$) и fi, а функцию (p(|i)
правой части (10.3.11) в ряд по степеням \1. В
результате получим в векторной и
операторной форме для системы (10.3.10):
/(*,У,ц) = /(х,Уо,0)+£— х
т=\
т\
[Э Э V
a^-*>) + ^J Л*.зм1)1о
(10.3.14)
(«о») показывает, что значения производных
функции f(x,y,\i) берутся в точке {x.y^fi).
Для (10.3.11)в векторной форме имеем
ею \т)((\\
ф)=Ф(0)^^. (10.3.15)
Ю=1
Подставим теперь в обе части системы
(10.3.10) с записью ее правой части в виде
(10.3.14) выражение для искомого решения
(10.3.12) и в результате получим:
т=\
/и=0
m=i
, Э
f{x,y,v)\0-
(10.3.16)
Подставляя в (10.3.11) разложение
(10.3.15) и выражение для решения (10.3.12),
получаем:
f>">m(*o) = <p(0)+X-
И(о)
т=0
т=1
т\
(10.3.17)
Приравнивая теперь в обеих частях
(10.3.16) и (10.3.17) коэффициенты при
одинаковых степенях Ц, получаем
последовательность задач Коши для определения искомых
неизвестных функций Уъ(х),у\{х), Уг{х)> •■•
^■ = /(*,Л.О),л(*о) = ф(0),
dyi df(x,y0,0) У(х,у0,0)
Л"" Э^,+ Эц ' WbW
dx
Э/(х,^о,0) 1Э2/(х,^о,0) 2 Э2/(х,уь,0) 1 d2f(x,y0,0)
*У
■Уг +у
ЭУ2
-У\
ЭуЭц
Vi +—•
7i 2
Эц2
-.^2(^0) =
(10.3.18)
Ф"(0)
Заметим, что первая из задач (10.3.18) —
порождающая задача. Прежде чем решать
каждую из последующих задач этой их
последовательности, необходимо найденные
решения предыдущих подставить в правую часть
этой задачи на место соответствующих
неизвестных функций.
Таким образом определяются
последовательно искомые функции }>о (х), у у (*) >
у2(х),...
Для получения
приближенно-аналитического решения задачи (10.3.10) — (10.3.11)
ограничиваются некоторым значением
т = N , т.е.
N
y(x9\i) = yN (X,\l) = ]Г \Lmym (x) .
т=0
Оценка точности такого приближения
определяется либо по оценке остатка ряда,
либо с помощью оценки [f(x,|i) - }>#(*, fij <
ibe^-^+^e^-^-lj, где К -
постоянная Липшица (\f(x,yi,\i)- f(x,y2,\ij[u
КРАЕВЫЕ ЗАДАЧИ ДЛЯ ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 427
< К\у[ -yi\ B рассматриваемой области); 6
и Г] - постоянные, такие, что в этой области
удовлетворяются неравенства:
^М-/(,,Ы,,Ц>Ц]|<Л;
dx
\y{x0,\i)-yN(x0,^<b.
Данный метод применим и к решению
задачи Коши для дифференциального
уравнения я-го порядка с малым параметром |i,
если его записать в виде эквивалентной
системы, и при условии выполнения для этой
системы тех же условий, что и для задачи
(10.3.10)-(10.3.11).
СПИСОК ЛИТЕРАТУРЫ
1. Березин И.А., Жидков Н.П. Методы
вычислений. Т. 1-2. Физматгиз, 1959.
2. Корн Г., Корн Т. Справочник по
математике для научных работников и
инженеров. М.: Наука, 1968.
3. Матвеев Н.М. Методы
интегрирования обыкновенных дифференциальных
уравнений. М.: Высшая школа, 1963.
4. Мищенко Е.Ф., Розов Н.Х.
Дифференциальные уравнения с малым параметром
и релаксационные колебания. М.: Наука,
1975.
5. Понтрягин Л.С. Обыкновенные
дифференциальные уравнения. М.: Наука, 1970.
6. Степанов В.В. Курс
дифференциальных уравнений. М.: ГИФМЛ, 1958.
7. Эльсголыд Л.Э. Дифференциальные
уравнения и вариационное исчисление. М.:
Наука, 1969.
Глава 10.4
КРАЕВЫЕ ЗАДАЧИ
ДЛЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
10.4.1. Краевые задачи для линейных
дифференциальных уравнений. Для
линейного дифференциального уравнения второго
порядка
(10.4.1)
L(y) = a2(x)y"(x)+a{ (*)/(*)+
+a0(x)y(x) = f(x)
ставятся краевые условия
U2 (у) = «2^(*) + Р2/(*) = Y2 > (Ю.4.2)
а? + р? * 0, / = 1, 2.
Предполагается, что /, tf/€C[tf,£],
аг(х)*0' a/»P/»Y/ ~ вещественные числа.
Решение у ищется в пространстве С2[я,£].
Дифференциальное уравнение (10.4.1)
вместе с краевыми условиями (10.4.2)
составляет краевую задачу (КЗ) [1, 2].
Замечание 10.4.1. Для
дифференциального уравнения порядка п, вообще говоря,
должно быть задано п краевых условий. Если
краевые условия задаются только на концах
интервала [я, b], то задача называется
двухточечной КЗ. В случае задания условий в п
точках задача будет w-точечной. Возможны
промежуточные варианты.
Если f(x) = 0, то из уравнения (10.4.1)
получается однородное уравнение
L(y) = 0.
(10.4.3)
В случае yj = у 2 =0 краевые условия
называют однородными
Ui(y)=0, / = 1,2. (10.4.4)
Задачу (10.4.3), (10.4.4) называют однородной
КЗ.
Если в (10.4.2) Р] = Р2 = 0 , то получаем
краевые условия первого рода
УИ = Уь У(Ь) = Ч2, (10.4.5)
если aj = a 2 = 0 - краевые условия
второго рода
у (a) = Yi, У{Ь) = у2, (Ю.4.6)
Если У] = у2 = 0, то краевые условия
однородные
'ед=0, / = 1,2, (Ю.4.7)
У\{у) = *\У{а) + *2У'{а)>
8/ = 0 ИЛИ 1, Еу +82 = 1 •
Неоднородные краевые условия заменой
неизвестной функции могут быть сведены к
однородным. Так для (10.4.6) замена
Z(x) = у(х) - у, - (у2 - у, )(х - а)1(Ь - а).
Разрешимость краевой задачи. Общее
решение уравнения (10.4.1) имеет вид
428 Глава 10.4. КРАЕВЫЕ ЗАДАЧИ ДЛЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
у = у + С\У\ + С2У2 > гДе У ~~ частное
решение уравнения (10.4.1); У\,У2 ~~
фундаментальная система решений однородного
уравнения (10.4.3); С\,С2 — произвольные
постоянные, которые выбираются так, чтобы у
удовлетворяло краевым условиям (10.4.2):
C\V\ (У\) + с2^\ {У 2) = -U\ (у) ~ 71 >
C{U2 {У{) + C2U2 {у2 ) = -U2 (у) - 72 -
(10.4.8)
Для разрешимости КЗ (10.4.1), (10.4.2)
необходимо и достаточно, чтобы система
линейных уравнений (10.4.8) относительно
неизвестных С],С2 была разрешима. Для
однородной КЗ (10.4.3), (10.4.4) система (10.4.8)
также является однородной и всегда имеет
тривиальное решение q = С2 = 0, но может
иметь и нетривиальные решения.
КЗ (10.4.1), (10.4.2) может иметь
единственное решение, вообще не иметь решений
или иметь бесконечное множество решений.
Пример 10.4.1. Для уравнения у (х) +
+у(х) - f(x) зададим различные краевые
условия и f(x):
а) у(0) = у(тс/2) = 0, Ддс) = 1, б) у(0) =
= у(л) = 0, /(*)=!; в) у(0) = у(к) = 0,
/(x) = cos(x). Общее решение уравнения при
/(дс)=1: у(х) = с{ sinx+C2 cosx + 1, где
Cj,C2 ~ произвольные постоянные. В случае
а) решение КЗ единственно y(x) = -sinx-
-cosx + 1 . Для б) система (10.4.8)
несовместна и КЗ не имеет решений. В случае в)
имеется однопараметрическое семейство решений
у(х) = С\ sinx+—xsinx .
Теория Фредголыма. Пусть в (10.4.1)
ai(x), i - 1,2 имеют непрерывные
производные до порядка / включительно.
Краевая задача
L*(v) = 0,
(10.4.9)
U*(v) = 09 / = 1,2 (10.4.10)
называется КЗ, сопряженной с (10.4.3),
(10.4.4), если для любых у , удовлетворяющих
(10.4.4), и для любых v , удовлетворяющих
(10.4.10), выполнено тождество
Ь b
\ L(y)vdx = [yL*(v)dx . (10.4.11)
а а
Здесь L (v) — дифференциальный оператор,
сопряженный с L(v):
£ м=хн* к (*м*)Р = К (*м*))" -
*=0
-{щ (x)v(x)) +a0 {x)v(xy
(10.4.10) — краевые условия, сопряженные с
(10.4.4) (для Цу)), строятся таким образом,
чтобы было выполнено (10.4.11).
Замечание 10.4.2. Краевые условия первого
рода и второго рода для (10.4Л) являются
самосопряженными: V (у) = У (у) •
Теорема 10.4.1 (Альтернатива Фредголь-
ма). /. Если однородная КЗ (10.43), (ЮЛА)
имеет только тривиальное решение (у == 0),
то КЗ (10.4.1), (10.4.4) имеет единственное
решение для любой непрерывной правой части
/.
2. Если однородная КЗ (10.43), (10.4.4)
имеет нетривиальные решения, то КЗ (10.4.1),
(10.4.4) разрешима для тех и только тех f,
для которых
b
\ f(x)v(x)dx = 0 (10.4.12)
а
для всех решений v сопряженной КЗ (10.4.9),
(10.4.10). В этом случае КЗ (10.4.1), (10.4.4)
имеет бесконечное множество решений. Задачи
(10.43), (10.4.4) и (10.4.9), (10.4.10) имеют
одинаковое число линейно независимых решений.
Пример 10.4.2. Для КЗ
L(y) = y" + 2y' + 2y = f(x),
У{0) = У{к) = 0
(10.4.13)
соответствующая однородная КЗ имеет
нетривиальное решение уд = £~xsin.x . По теореме
(10.4.1) задача (10.4.13) разрешима для тех и
только тех f, для которых
к
| f(x)v^(x)dx = 0, где vq =ex smx ~~ реше-
КРАЕВЫЕ ЗАДАЧИ ДЛЯ ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 429
ние сопряженной задачи L (v) = v - 2v +
+2и = О, v(0) = v(k) = О . Если f(x) = е~х х
к
xsin(2x), то | f(x)v0(x)dx = О и КЗ
о
(10.4.13) имеет множество решений
у(х) = се~х s'mx--e~x sin(2x), где с
-произвольная постоянная. Для f{x) ~ 1
тс
J \v{x)dx *Ои КЗ (10.4.13) не имеет решений.
О
Самосопряженная краевая задача.
Однородная КЗ (10.4.3), (10.4.4) называется
самосопряженной, если она совпадает с
сопряженной КЗ (10.4.9), (10.4.10). В этом случае
L{y)=C{y), Ui(y) = U*(y), / = 1,2, и
для любых у, v, удовлетворяющих краевым
условиям (10.4.4),
Ь Ь
J L(y)vdx = \yL(v)dx.
а а
Для уравнения второго порядка
самосопряженный оператор имеет вид
L(y) = -(p(x)y'(x)) +q(x)y(x). (10.4.14)
Замечание 10.4.3. Для самосопряженного
оператора (10.4.14) все краевые условия вида
(10.4.4) являются самосопряженными.
Теорема 10.4.2. Самосопряженная КЗ
разрешима для тех и только тех /, которые
ортогональны всем решениям однородной КЗ. В
частности, если однородная КЗ имеет только
тривиальное решение, то КЗ разрешима при
любой f.
Функция Грина. Функцией Грина или
функцией влияния КЗ (10.4.1), (10.4.4)
называют функцию G(x,s), определенную при
а < х < b , а < s < b и обладающую
свойствами:
1. При фиксированном s G(x,s)
непрерывна по х;
2. При х •* s, G(x,s) удовлетворяет
уравнению (10.4.3) по х;
3. При х- а и х = b G[x,s)
удовлетворяет краевым условиям (10.4.4) для
а < s < b ;
4. G (x,s) непрерывна по х всюду,
кроме прямой х - s, где имеет разрыв
первого рода со скачком
G'\x=s+0 ~G'\x=s-0
a2(s)
Если КЗ (10.4.1), (10.4.4) имеет
единственное решение для любой непрерывной
функции /, то функция Грина существует и
решение у КЗ (10.4.1), (10.4.4) можно
представить в виде
Ь
y(x)=JG(x,s)f(s)ds. (10.4.15)
а
Функцию Грина можно определить как
решение уравнения
L((7(x,5)) = 5(x-5),
где 5(х) - дельта-функция Дирака.
Если известна фундаментальная система
решений уравнения (10.4.3) У\(х), У2{х)>
удовлетворяющих краевым условиям U\(y\) =
= 0, Ul{y2)^0, U2(y2) = 0, U2(yt)*0,
то функция Грина задается формулой
G(x,s)--
a2(s)lV(sy
У\. {х)Уг (*)
a2{s)W{s)
a<x<s<b
a<s<x<b,
(10.4.16)
где W{s) = y{ {s)y'2{s)-y']{s)y2{s)*0 -
определитель Вронского.
Пример 10.4.3. Построить функцию
Грина задачи у" + у = f(x), .у(0) = 0,
у{к/2)=0.
Общее решение однородного уравнения
Уо =С\ COSX + C2 sin* , находим из него
решения у\ , у^ , удовлетворяющие условиям
у,(0) = 0, л (я/2)* 0, у2(к/2) = 0, Ы0)*
*0. Получим j>|=sinx, y2=cosx.
Поскольку а2 = 1, W(s) = -sins sins-
-COS5 COS5 = -l , TO
430 Глава 10.4. КРАЕВЫЕ ЗАДАЧИ ДЛЯ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
G{X,S).
- sin x • cos s, 0 < x < s < к/2
- sin s • cos x, 0 < s < x < я/2,
и решение КЗ у
к/2
(*) = -} si
sin s • cos x x
x/ (s) ds - Г sin x • cos s • / (s) ds .
10.4.2. Краевая задача для системы
дифференциальных уравнений. Рассмотрим
краевую задачу
y" = A(x)y'+B(x)y + f(x), (10.4.17)
y(a) = y(b) = 0. (10.4.18)
Здесь у(х),/(х)— «-мерные вектор-
функции; В(х),А(х) — (пхп) матрицы,
B(x),f(x)— непрерывны, Л{х)-
непрерывно-дифференцируема на [а, Ь].
Соответствующее однородное уравнение имеет вид
/ = А (х)/ + В(х)у. (10.4.19)
Для КЗ (10.4.19), (10.4.18) сопряженной
называется КЗ
z' = [b*{x)-(a*){x)\z-A*{x)z',
z(e) = z(ft) = o,
где В*,А*— транспонированные матрицы В,
А. КЗ (10.4.19), (10.4.18) будет
самосопряженной, если В*(х)-(А*) (х) = В(х)\
-А*(х) = А(х).
Для КЗ (10.4.17),(10.4.18) справедливы
теоремы (10.4.1), (10.4.2), см. [1-3].
Замечание 10.4.4. Теоремы (10.4.1),
(10.4.2) справедливы и для краевой задачи для
уравнения порядка я, см. [1].
Замечание 10.4.5. Для краевой задачи
для системы уравнений строится матрица
Грина, см. [1, 3].
10.4.3. Задача Штурма-Лиувилля.
Рассмотрим самосопряженную КЗ:
L(y) = -{p(x)y'(x)j +q{x)y(x) = Xy(x);
а,?+Р,?*0, / = 1,2.
(10.4.20)
Здесь /?(*)> 0, q(x)— вещественные
непрерывные функции для а < х < Ь ; X —
комплексный параметр. Значение X, при
котором КЗ (10.4.20) имеет решение ур 0,
называется собственным значением этой задачи, а
решение у/еО называется собственной
функцией, соответствующей данному собственному
значению X.
Задача отыскания собственных значений
и собственных функций называется задачей
Штурма-Лиувилля.
Теорема 10.4.3. Все собственные значения
задачи (10.4.20) вещественны и образуют
неограниченную последовательность Xq <
< Х{ < ^2 < ••• < 'Хп < •••
Соответствующая каждому Хп
собственная функция уп единственна с точностью
до постоянного множителя и имеет ровно п
нулей на интервале [а, Ь), при этом
Ъ
\УпУт<*х = Ь п^т.
а
Теорема 10.4.4 (Стеклова).
Последовательность ортонормированных собственных
функций задачи (10.4.20) УЬ,У\,У2,-,Уп,-
образует полную ортонормированную систему
(Ь Ъ \
\УпУт<Ьс = ^ П*т, jyfa = l
а а
Lq [я, Ь], т.е. если f e L± [a, b], то /
представляется в виде обобщенного ряда Фурье
Ь
/W = SC^W'где cn = jf(x)y(x)dx>
п=0
т2
dx -> 0 при к -> ©о .
L «=о J
Замечание 10.4.6. Система собственных
функций тем более полна в С/с[а,Ь],к>0 в
смысле среднеквадратичной сходимости.
Пример 10.4.4. Для задачи
-у" - Ху, у (0) = у (я) = 0 , собственные зна-
чения Хп =(п + \) , п = 0,1,2,.... Собствен-
СПИСОК ЛИТЕРАТУРЫ
431
ные функции уп = yfl/n • sin (n +1) х,
я = 0,1,... образуют полную ортонормиро-
ванную систему в Lq [a, b] и уп имеет п
нулей на (0, я).
Пример 10.4.5. Для задачи -у* = Ху,
У (0) = /(к) = 0 , получим: Хп = п2,
л = 0,1,2,..., Уо=-г, yn=y/2/ncos(nx),
« = 1,2,....
10.4.4. Краевые задачи для
нелинейных дифференциальных уравнений.
Рассмотрим краевую задачу
У" = /{х,У,у'), (10.4.21)
у{а) = А, у{Ь) = В, (10.4.22)
где f(x) непрерывна при xg [fl,/>]j,
y'eR.
Пример 10.4.6. Рассмотрим КЗ:
/ = У\ У(0) = 0, у(х{) = у{, (х{>0).
Общее решение дифференциального
уравнения: у(х) = -ф{ - 2х + с2 . Используя
первое краевое условие, получим семейство
решений у(х) = --у/С|^2х + >/q", которые
существуют, если х < С\ /2 . При х = q /2
у(с\/2) = yjC[ , и КЗ имеет единственное
решение, если у\ < 2Х[ , и не имеет
решений, если у\ > 2ху .
КЗ (10.4.21), (10.4.22) имеет, по крайней
мере, одно решение, если выполнено одно из
условий [1]:
1- / (х> Уj У) ~ ограничена;
2. |/|<с|.у| для достаточно больших
(4-fl)
3- ftny\K->° при М+И->~
(М+М)
равномерно на хе [а,Ь] и / удовлетворяет
условию Липшица на любом конечном интер-
4. / монотонно возрастает по у,
удовлетворяет (10.4.23) и |/(х,УьУ[)-Г(х,УъУ2)|
ограничена;
5. / удовлетворяет (10.4.23) и
/ = ф (х, у) + у (х, у, /), где ф непрерывна и
Ч(х,У,/)
монотонно возрастает по у и
->0
вале
\/{х,уьу[)-/{хУ},у'г\<
при |у| + |у'| —> ©о равномерно на Х€ [а,Ь].
КЗ (10.4.21), (10.4.22) может иметь
множество решений. Она имеет не более одного
решения, если выполнено, например, одно из
условий [1]:
1./имеет непрерывные частные
производные по у, у' и \f'y\ < а, |/у| < Р,
а + р < 1 или f'y > 0;
2./строго возрастает по у при
фиксированных (х, У).
Если в уравнении (10.4.21) у,
/ - п -мерные векторы, то получим КЗ для
системы п нелинейных уравнений [3].
Рассмотрим случай, когда краевые условия
однородные
у(а) = 0, у(Ь) = 0. (10.4.24)
Теорема 10.4.5. Пусть / непрерывна и
удовлетворяет условию Липшица по у,у':
\\f{x,yi,yi)-f(x,y2,y'2)\\<a{\\y{-y2\\ +
-ЮгЦ-ЙИ, где У - норма в Я",
а1(Ь-а)2/& + а2(Ь-а)/2<1.
Тогда КЗ (10.4.21), (10.4.24) имеет
единственное решение.
Теорема 10.4.6. Пусть / непрерывна и
|/ {х, У, /)|| ^ т для х е [д, Ь] и любых
у,/. Тогда КЗ (10.4.21), (10.4.24) имеет, по
крайней мере, одно решение и
\\y\\<m(b-a)2/s, ||/||<m(*-*)/2.
СПИСОК ЛИТЕРАТУРЫ
1. Камке Э. Справочник по
обыкновенным дифференциальным уравнениям. М.:
Наука, 1966.
2. Сансоне Дж. Обыкновенные
дифференциальные уравнения. Т. 1,2. М.: Изд.
иностр. лит., 1953.
3. Хартман Ф. Обыкновенные
дифференциальные уравнения. М.: Мир, 1970.
432
Глава 10.5. ДИНАМИЧЕСКИЕ СИСТЕМЫ
Глава 10.5
ДИНАМИЧЕСКИЕ СИСТЕМЫ
Основоположником качественной
теории дифференциальных уравнений и теории
динамических систем, в частности, является
А. Пуанкаре. Значительное развитие эта
теория получила в трудах Г. Биркгофа,
А.Н. Колмогорова, И.Г. Петровского,
В.В. Степанова, В.В. Немыцкого, А.Я. Хин-
чина, А.А. Андронова и многих других
выдающихся математиков. Современное
состояние теории динамических систем см. в [4].
10.5.1. Основные определения. Пусть
задана автономная система обыкновенных
дифференциальных уравнений, записанная в
векторном виде
fk = /(*), хеШ\ /el". (10.5.1)
Начальное условие для этой системы задается
в виде
x(t0) = x°, х°еШ". (10.5.2)
Предполагается, что решение системы
(10.5.1), определяемое условием (10.5.2),
существует и единственно на (-°°, °°) (иногда
только на (/о,00))- Пространство R" для
данной системы называют фазовым
пространством, а решение x(t) системы (10.5.1),
рассматриваемое в фазовом пространстве,
называют фазовой траекторией. Координату /
обычно называют временем, a x{t) —
движением.
В силу автономности системы (10.5.1)
решение x(t) инвариантно по отношению к
сдвигу вдоль оси / и определяется
единственным образом значением х . Таким
образом, в силу наших предположений, через
каждую точку фазового пространства проходит
единственная фазовая траектория,
определенная для всех / . Фазовое пространство и
совокупность фазовых траекторий определяют
динамическую систему.
Динамическая система может быть
задана, как это сделано выше, с помощью
системы дифференциальных уравнений, но она
может быть задана и аксиоматически. Пусть
задано метрическое пространство: множество
М с метрикой р . Напомним аксиомы
метрического пространства. Для каждой пары
х,ye M определена действительная
функция р (*,}>), такая, что: 1. р(х,>>)>0 и
р(х,у) = 0<^х = у; 2. р(х,у) = р(у,х);
3. p(x,z)< p(x,y) + p(y,z)- Можно было
бы ограничиться аксиоматикой в Шп , однако
введение метрического пространства
позволяет рассматривать динамические системы более
общие, чем задаваемые системами вида
(10.5.1). Пусть теперь задано однопара-
метрическое отображение метрического
пространства М в себя F(x,t),
удовлетворяющее следующим аксиомам: 1) /г(х,0) = х;
2) отображение F(x,t) непрерывно по х и
по f ;3) F(F{x1t])1t2) = F(xJ{+t2).
Для динамической системы, задаваемой
системой (10.5.1), F(x,t) означает сдвиг по
фазовой траектории от точки х на время / .
Из первой аксиомы следует, что, сдвигаясь от
точки х на нулевое время, останетесь в этой
же точке. Выполнение второй аксиомы
обеспечивается непрерывной зависимостью
решений системы (10.5.1) от начальных данных.
По третьей аксиоме, если начать движение по
фазовой траектории из точки х на время /j к
точке F(xJi), а затем из этой точки
двигаться на время t2 , то попадаем в ту же
точку, в которую можно попасть, сдвигаясь по
фазовой траектории из точки х сразу на время
h+h-
Аксиоматическое задание динамической
системы позволяет изучать свойства решений
систем дифференциальных уравнений, не
находя аналитически эти решения, а
используя топологический метод исследования.
Особенно полезна теория динамических систем
для изучения периодических и близких к ним
решений и исследования асимптотического
поведения решений.
Если динамическая система такова, что
движение по фазовым траекториям возможно
как в сторону возрастания, так и в сторону
убывания времени, то ее называют
обратимой. Если же движение возможно только при
возрастании времени, то такая динамическая
система необратима. Третья аксиома говорит
о том, что динамическая система задает
группу преобразований М в себя в случае
обратимой системы и полугруппу — в случае
необратимой системы.
Примером обратимой системы может
служить динамическая система, задаваемая с
помощью системы (10.5.1). Примером необ-
СВОЙСТВА ФАЗОВЫХ ТРАЕКТОРИЙ ДИНАМИЧЕСКИХ СИСТЕМ
433
ратимой системы будет система, задаваемая
дифференциальным уравнением с
запаздыванием
^ = f{x(t),x(t-h))(h = const>0)
(10.5.3)
и начальным условиям
*(0 = Ф('). (>еК°]), (Ю.5.4)
где ф - заданная начальная функция,
принадлежащая пространству С [-Л,0]
функций, непрерывных на [-А,0]. В гл. 10.7
приведены теоремы существования и
единственности решений и непрерывной зависимости
решений от начальных функций для этой
задачи. Здесь в качестве М следует взять
пространство С [-А,0] с соответствующей
нормой в качестве метрики, а отображение F —
перенесение отрезка траектории решения с
отрезка [t - Л, /] на начальный отрезок
[-А, 0]. Эта динамическая система необратима,
так как для обращения ее пришлось бы решать
уравнение (10.5.3) назад по времени. Это
невозможно, так как пришлось бы решать
уравнение опережающего типа (см. гл. 10.7).
10.5.2. Свойства фазовых траекторий
динамических систем. Множество
Ix = \F (х, t)\te [О, ©ои называют
положительной полутраекторией, проходящей через
точку х. Аналогично определяются
отрицательная полутраектория /~ и полная
траектория /х , проходящие через точку х.
Одной из задач теории динамических
систем является изучение асимптотических
свойств решений дифференциальных
уравнений. Для этой цели вводятся следующие
определения. (О -предельной точкой для
траектории 1Х называют точку х , для которой
существует последовательность /^ —> «>,
такая, что lim^ _>« F (jc, tk) = х . Множество
всех со -предельных точек для 1Х называют
со -предельным множеством для этой
траектории и обозначают Qx. Аналогично при
*к ~* ~°° определяют а -предельные точки и
а -предельные множества, обозначаемые Ах .
Пусть А е М и F(Aj) — сдвиг
множества А на время t по траекториям
динамической системы. Множество А называют
инвариантным, если F (A,t) = А .
Инвариантное множество состоит из целых траекторий.
Если Qx не пусто, то оно инвариантно. Если
замыкание полутраектории 1 х компактно, то
Qx не пусто.
Периодическим движением периода
Т > 0 называют такое движение, что
F(x,t + T) = F(x,t),(Vt). Очевидно, что
для периодического движения 1Х = Qx = Ах .
Точку х называют точкой покоя, если
F(x,t) = x (V/). Если х - точка покоя, то
Лс = Ах = Qx = х . Теория динамических
систем изучает структуру предельных
множеств, критерии существования точек покоя и
периодических движений. Кроме того,
исследуются движения, по свойствам близкие к
периодическим, например, рекуррентные и
почти периодические движения. Движение
F (x,t) называют рекуррентным, если для
любого е > 0 найдется Т (е), такое, что
любая дуга траектории этого движения
временной длины Т аппроксимирует всю
траекторию 1Х с точностью до е . Движение
F(x,t) называют почти периодическим, если
для любого е > 0 существует число L (е),
определяющее относительно плотное
множество чисел {хЛ}, которые обладают
следующим свойством:
p(F(x9t),F(x,t+ *„))<* (V/).
Множество чисел называют относительно
плотным, если существует такое L, что
любой интервал (a, ct + L) содержит хотя бы
один элемент этого множества. Очевидно, что
если движение является периодическим, то
оно и почти периодическое, а почти
периодическое движение является рекуррентным.
Доказывается, что если М есть полное
пространство, а замыкание 1Х компактно, то
Qx не пусто и содержит рекуррентные
траектории, а если движение рекуррентно и
устойчиво по Ляпунову, то оно почти периодично.
434
Глава 10.5. ДИНАМИЧЕСКИЕ СИСТЕМЫ
Движение F(x,t) устойчиво по Ляпунову,
если для всякого е и х существует такое
5(х,е)>0, что из неравенства р(*,}>)< 5
следует p(F(x,t),F(y,t)) < г для всех
/ е (—°°, °°).
Важным понятием теории динамических
систем является понятие возвращаемости
областей. Динамическая система F(x,t),
определенная в метрическом пространстве М,
обладает свойством возвращаемости областей,
если для любой области G с М и любого Т
найдется значение t >T, такое, что
G n F (G, t)* 0. Пусть в М задана мера \1.
Эту меру называют инвариантной
относительно системы F (x,t), если для любого
|Х -измеримого множества А имеет место
равенство \iF (A, t) = jll4, (Vr g (-«>, oo)). в
теории вероятностей рассматриваются
пространства с ограниченной мерой. Пусть
\lM = 1. Тогда если А с М и \iA = /я > 0 ,
то найдутся такие значения t , что
\i[AnF(A,t)]>0.
Приведем также следующую теорему
Биркгофа-Хинчина. Пусть \iM = 1 и |Х —
инвариантная мера. Тогда для любой абсолютно
суммируемой функции ф(х) существует
предел
1 СТ
всюду, за исключением, быть может,
множества меры нуль.
10.5.3. Динамические системы на
плоскости. Динамическая система на
плоскости задается системой двух автономных
дифференциальных уравнений
^ = Р{х,у), ± = Q{x,y). (10.5.5)
Предполагается, что начальными условиями
*('о) = *<Ъ УМ = Уо (Ю.5.6)
определяется единственное решение системы
(10.5.5), и оно существует на (-00,00).
Относительно функций Р и Q предполагается, что
они непрерывны вместе со своими частными
производными и что они могут быть
представлены по формуле Тейлора в окрестности
lhnIjo%(F(x,/))*
произвольной точки (xo>.Vo) с остаточным
членом не ниже второго порядка малости.
Плоскость (х,у) называют фазовой, а
интегральные кривые системы (10.5.5),
спроектированные на фазовую плоскость, называют
фазовыми траекториями. Решение системы
(10.5.5), удовлетворяющее условиям (10.5.6),
задает на фазовой плоскости единственную
фазовую траекторию, проходящую через точку
{хО'Уо)- Совокупность фазовых траекторий
образует на фазовой плоскости фазовый
портрет системы. Точку (xj), такую, что
Р(5с,у) = 0, Q(5с,у) = 0, называют точкой
покоя системы (10.5.5). Очевидно, что если
*('о) = *> У(*о) = У, то x(t) = x, y(t) = y
будет решением системы (10.5.5), а на
фазовой плоскости вся фазовая траектория
совпадает с точкой (5с,у). Исключая t из
системы (10.5.5), получаем дифференциальное
уравнение фазовых траекторий
dx _ dy
Р(х,у) Q(x,y)'
(10.5.7)
Это уравнение первого порядка имеет
единственное решение, удовлетворяющее
начальному условию у (xq ) = Уо для всех точек
фазовой плоскости, за исключением точек покоя,
которые для уравнения (10.5.7) называют
особыми точками.
Построение фазового портрета системы
начинается с определения поведения фазовых
траекторий в окрестностях точек покоя системы. Всюду
далее предполагается, что точки покоя
изолированы, т.е. в некоторой окрестности каждой точки
покоя нет других точек покоя системы. Если
перенести точку покоя в начало координат и
представить Р и Q в окрестности начала координат по
формуле Тейлора, то можно записать
Р (х„у) = ах + by + eh
Q (х, y) = cx + dy + e2,'
где 6j и 62 - бесконечно малые не ниже
второго порядка, и рассмотреть линейную
систему первого приближения
cx + dy (10.5.8)
dx , dy
— = ах + by, —
dt '' dt
и соответствующее уравнение фазовых
траекторий
dx _ dy
ах + by cx + dy
(10.5.9)
ДИНАМИЧЕСКИЕ СИСИТЕМЫ НА ПЛОСКОСТИ
435
Анализируя поведение фазовых
траекторий вблизи точек покоя системы (10.5.8),
можно всегда, за исключением одного случая,
описанного ниже, сделать заключение о
поведении фазовых траекторий системы (10.5.5).
Характер точки покоя для системы
(10.5.9) определяется корнями
характеристического уравнения
а-Х b
с d-X\
(10.5.10)
= Х2 -(a + d)\ + ad-bc = 0.
Существуют точки покоя следующих
видов.
1. Узел (рис. 10.5.1). Корни
характеристического уравнения действительные, одного
знака (^i^2 > 0). Существуют две прямые,
проходящие через начало координат,
являющиеся фазовыми траекториями. Остальные
фазовые траектории касаются одной из этих
прямых в начале координат.
Рис. 10.5.1. Особая точка «узел»
2. Седло (рис. 10.5.2). Корни
характеристического уравнения действительные, разных
знаков (Х]Х2<0). Существуют две прямые,
проходящие через начало координат,
являющиеся фазовыми траекториями. Эти прямые
разделяют плоскость на 4 угла, каждая из
остальных фазовых траекторий находится
внутри одного из углов и асимптотически
приближается к сторонам этого угла при
/ —> -оо и / —> ©о .
Рис. 10.5.2. Особая точка «седло»
3. Центр (рис. 10.5.3). Чисто мнимые
корни характеристического уравнения
(Ху2 = iP/) • Фазовые траектории образуют
семейство замкнутых кривых, окружающих
начало координат.
Рис. 10.5.3. Особая точка «центр»
4. Фокус (рис. 10.5.4). Комплексные
корни характеристического уравнения
(A.J2 = ос±Р;). Фазовые траектории
представляют собой спирали, совершающие
бесконечное число оборотов вокруг начала
координат.
Рис. 10.5.4. Особая точка «фокус»
5. Кратный узел (рис. 10.5.5). Кратный
корень Х\ 2 = ^ • Семейство фазовых
траекторий содержит одну прямую, и все остальные
фазовые траектории касаются этой прямой в
начале координат.
Рис. 10.5.5. Особая точка «кратный узел»
6. Дикритический узел (10.5.6). Также
кратный корень характеристического
уравнения. Фазовые траектории образуют семейство
всех прямых, проходящих через начало
координат.
436
Глава 10.5. ДИНАМИЧЕСКИЕ СИСТЕМЫ
Рис. 10.5.6. Особая точка «дикритический узел»
Если фазовые траектории,
начинающиеся в достаточно малой окрестности точки
покоя системы (10.5.5), остаются вблизи
точки покоя, то точку покоя называют
устойчивой (по Ляпунову). Если, кроме того, все эти
фазовые траектории стремятся к точке покоя
при /->», то точку покоя называют
асимптотически устойчивой. Если траектории,
начинающиеся в сколь угодно малой
окрестности точки покоя, покидают некоторую
фиксированную окрестность этой точки, то
эта точка будет неустойчивой.
Теорема 10.5.1. Если все корни
характеристического уравнения (10.5.10) имеют
отрицательные действительные части, то точка
покоя системы (10.5.5) асимптотически
устойчива. Если хотя бы один из корней уравнения
(10.5.10) имеет положительную
действительную часть, то точка покоя системы (10.5.5)
неустойчива.
Замечание 10.5.1. Если корни уравнения
(10.5.10) чисто мнимые, то точка покоя
системы (10.5.5) может быть как устойчивой, так
и неустойчивой, что определяется свойствами
высших членов разложения функций Р и Q
по формуле Тейлора.
Теорема 10.5.2. Для того чтобы решение
системы (10.5.5) было периодическим,
необходимо и достаточно, чтобы соответствующая
фазовая траектория была замкнутой кривой.
Для системы (10.5.9) замкнутые фазовые
траектории бывают только при чисто мнимых
корнях характеристического уравнения (10.5.10).
Однако при переходе к системе (10.5.5)
они обычно превращаются в спирали.
Реально существующие периодические движения
моделируются предельными циклами (рис.
10.5.7). Предельным циклом называют
замкнутую фазовую траекторию, на которую
наматываются, совершая бесконечное число
оборотов, другие фазовые траектории при
/ —» +оо или при f —» -оо . Если все фазовые
траектории наматываются на предельный
цикл при / —> +оо , то предельный цикл
называют устойчивым; если при / —> -°° , — то
неустойчивым, а если часть траекторий при
г —> +оо , а часть — при / —> -°° , то
полуустойчивым.
Рис. 10.5.7. Предельный цикл
Задача о нахождении предельных циклов
является важной и непростой задачей. Здесь
сформулированы некоторые теоремы,
полезные при доказательстве существования или
отсутствия предельных циклов.
Теорема 10.5.3. Внутри предельного цикла
существуют точки покоя динамической
системы, причем число седел на единицу меньше числа
других особых точек.
Теорема 10.5.4. Если две замкнутые
кривые Т\ и \?2 ограничивают кольцеобразную
область G и все фазовые траектории входят в G
при пересечении Г\ и Г2, а внутри G нет точек
покоя системы (10.5.5), то в G существует
предельный цикл.
Теорема 10.5.5. Если в области D
выполняется неравенство — + >0 или (^0),
Эх Эу
и эта сумма не равна тождественно нулю, то в
области D нет предельных циклов.
Пример 10.5.1. Свободные колебания
математического маятника без трения описыва-
^2Ф 2 • л
ются уравнением —£■ + со sin ф = 0 , где ф —
dr
угловое отклонение оси маятника от
вертикали, со = Jy, / - длина маятника, g -
ускорение свободного падения. Полагая
d® dx
х = Ф > У = j ' приходим к системе — = у ,
dt dt
dy 7 •
-7- = -со sin x . Точками покоя этой системы
dt
являются точки (л£,0), к = 0,±1,±2,...,
причем точки (2л£,0) - это центры, а
((2£ + 1)л,0) - седла. Фазовые траектории,
соединяющие соседние седла, называют
сепаратрисами. Замкнутые траектории,
окружающие центры, — это качания маятника
относительно нижнего положения равновесия, а
фазовые траектории, расположенные над и
под сепаратрисами, соответствуют полным
оборотам маятника вокруг точки подвеса.
АБСТРАКТНЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ
437
10.5.4. Абстрактные динамические
системы. Однопараметрической группой
преобразований множества М называют набор <g*>
взаимнооднозначных отображений gt: М->М,
запараметризованный действительным t e R
или целым t e Z параметром так, что для
любых Ц, /2 выполняется
£"+'2=#"(г/2) = £'2(£"), причем g° ос-
тавляет множество М на месте. В случае если
t e R+ или t б Z+, набор <g*\ называют
однопараметрической полугруппой. Под
динамической системой понимают однопараметриче-
скую группу или полугруппу <g*>
преобразований метрического пространства М,
называемого фазовым пространством, с
параметром / , называемым временем. Динамическую
систему с непрерывным временем
t e R или t e R+ 1 называют фазовым
потоком, а с дискретным временем
t e Z или t e Z+) — каскадом.
Пример 10.5.2. Множество решений
дифференциального уравнения х = v(x),
х е М , t e R - фазовый поток.
Пример 10.5.3. Степени отображения
/:Л/->Л/, /|,=/(/,,",)> neZ+ -
каскад.
Динамическую систему \gl\,
зависящую от параметров е = (е|,е2,...,е^) с ^ ,
называют к -параметрическим семейством
систем с базой В. Под бифуркацией
динамической системы понимают скачкообразное
качественное изменение поведения фазовых
траекторий системы glx при переходе
параметра е через критическое значение £q ,
называемое бифуркационным значением
параметра. Аттрактором динамической системы
называют предельное множество
А = lim g'K = П g'K , где К с М -
Г-Н-оо Г>()
поглощающий компакт [g1 К с К при
t > 0). Аттрактор не пуст А * 0 ,
инвариантен gtA = А и обладает асимптотическим
свойством: для любой окрестности U z> A
существует Т > 0 такое, что g К aU.
Пример 10.5.4. Аттракторами фазового
потока дифференциального уравнения
являются асимптотически устойчивые особые
точки и орбитально устойчивые предельные
циклы.
Пример 10.5.5. Аттракторами
одномерного каскада /", пе Z+ , / : [0,1] -> [0,1]
являются устойчивые неподвижные точки
(/(х$) = Хо) и устойчивые /я-циклы
{xo,X[,...,xAW_|}, состоящие из /и-периоди-
ческих точек: fm (jc,-) = x; , причем
fn (xi) * Xj при п< m , и Xj = fm (xq ),
/ = 0,/я-1.
d-мерным объемом конечного покрытия
компакта А открытыми шарами назовем
сумму d-x степеней радиусов этих шаров. Хаус-
дорфова (фрактальная) размерность компакта
dim// A - это нижняя грань тех d, для
которых А допускает конечное покрытие сколь
угодно малого ^/-мерного объема. Для
аттракторов, являющихся подмногообразиями
фазового пространства, dim// А совпадает с
обычной целой размерностью. Существуют
так называемые странные аттракторы,
отличные от конечного объединения
подмногообразий фазового пространства, они имеют
дробную размерность dim// A .
Рассмотрим однопараметрическое
семейство итераций логистического отображения
/е(х) = ех(1-х), М = [0,1], Я = [0,4].
При непрерывном возрастании е проходит
через бифуркационные значения параметра
1 = г0 < /] < ... < гт < ... < /^ < 4 , наносимые
на бифуркационную диаграмму (рис. 10.5.8).
При ее (/",„,f/W+i) система имеет устойчивый
2т -цикл, который при е = гт+[ теряет
устойчивость и порождает новый устойчивый
2т+[ -цикл - происходит бифуркация
удвоения цикла (см. рис. 10.5.8). При
е = /^ ~ 3,5699 цикл приобретает
самоподобную (инвариантную относительно
масштаба) структуру фрактального множества
размерности dim// A « 0,543 , и поведение
детерминированной системы |/ел,е > гЛ становится
438
Глава 10.5. ДИНАМИЧЕСКИЕ СИСТЕМЫ
Рис. 10.5.8. Бифуркационная диаграмма
логистической системы
непрогнозируемым - происходит переход к
детерминированному хаосу. При этом точки
почти всех фазовых траекторий логистической
системы f" (x) всюду плотно покрывают
М = [0,1]. Их инвариантная мера равна мере
Лебега отрезка mesM = 1. Траектории с
близкими начальными условиями расходятся
по экспоненте с положительным показателем
Ляпунова.
Замечание 10.5.2. Такой сценарий
перехода к хаосу универсален для целого класса
гладких отображений / : [0,1] -> [0,1] с
единственным максимумом при х = 1/2 и
отрицательной производной Шварца:
s/-/7/'-з/2 (/7/')2< о на [01] Рас.
стояния от х = 1/2 до ближайшей точки
2т -цикла (см. рис. 10.5.8) и бифуркационные
значения параметра связаны универсальными
константами Фейгенбаума: dm/dm+\ -» -а ~
= -2,503 и (rw-rw_0/(rw+1-rw)-+5«4,669
при т -> ©о [6].
Теперь рассмотрим бифуркации в
системах дифференциальных уравнений
х = \)(х,е), М с Rn , В с R с семейством
векторных полей г)(х,е). Два векторных поля
топологически эквивалентны в окрестности их
особых точек, если существует локальный
гомеоморфизм h , переводящий фазовые
траектории одного поля в траектории другого
h(g{J = gi(h)\. Векторное поле типично,
если оно принадлежит открытому всюду
плотному множеству векторных полей в
Сг -топологии. Фазовое пространство
линеаризованной системы х = Ах, А = дх> (xq )/дх
в окрестности особой точки Xq = 0
распадается в прямую сумму инвариантных
относительно А подпространств: М = Ts Ф Т" Ф
®ТС, где Ts,Tli,Tc —устойчивое,
неустойчивое и центральное инвариантные
подпространства, ограничения оператора А на которые
имеют собственные значения соответственно с
отрицательными, положительными и нулевыми
действительными частями.
Теорема 10.5.6. (О центральном
многообразии [3]. Сг — гладкое (г < <») векторное
поле с особой точкой Xq = 0 имеет устойчивое
и неустойчивое инвариантные многообразия
WS,WU гладкости Сг и центральное
многообразие Wc гладкости Сг~ , касающиеся в
Xq плоскостей соответственно TS,TU и Тс.
Полутраектории на Ws \WU\ экспоненциально
стремятся к Xq при t —> -Н»(/ —> -©о).
Поведение фазовых кривых на Wc определяется
нелинейными членами.
Замечание 10.5.3. Центральным
многообразием семейства х = г)(х,е) является Wc
системы х = Х)(х1е), ё = 0 в точке
(*о,ео) = (0,0).
Теорема 10.5.7. (Теорема сведения [2]).
Семейство векторных полей х = v (jc, e)
топологически эквивалентно в окрестности особой
точки Xq = 0 надстройке стандартного седла
над ограничением г)(х,е) на центральное
многообразие Wc: 4 = и> (£, е), У = -у , Z = Z,
%еГ, ye Г, zeT".
Замечание 10.5.4. Эти две теоремы в
значительной мере определяют топологию
бифуркаций многомерных систем.
Теорема 10.5.8 [2].Бифуркации положения
равновесия в типичном однопараметрическом
семействе на прямой исчерпываются случаями
рождения или уничтожения двух особых точек
(устойчивой и неустойчивой) в системах
х = х ±г при переходе е = 0 .
Теорема 10.5.9 [2]. Бифуркации
положения равновесия в типичном
однопараметрическом семействе на плоскости исчерпываются
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
439
случаями мягкой и жесткой потери
устойчивости особой точкой Zq = (0,0) в системе
Z = z (/ + е + czz), ze С = R2 , с = ±\ при
переходе г = О (бифуркация Андронова-Хопфа).
При мягкой потере устойчивости (с = -1) из
особой точки рождается устойчивый
предельный цикл, при жесткой (с = +1) неустойчивый
предельный цикл сжимается в особую точку.
В зависимости от постановки задачи
различают бифуркации локальные,
происходящие в малой окрестности особой точки
(или предельного цикла), и нелокальные,
происходящие, например, в фиксированной
окрестности гомоклинических траекторий
(траекторий, входящих в особую точку
при f -»-и» и f -» -оо ).
Теорема 10.5.10 [2]. В типичном однопа-
раметрическом семействе на плоскости из
петли-сепаратрисы седла рождается один
предельный цикл.
Теорема 10.5.11 [2]. В типичном однопа-
раметрическом семействе в R из гомоклини-
ческой траектории седловой особой точки,
имеющей два комплексно сопряженных
собственных значения с отрицательной
действительной частью и одно положительное
действительное значение, рождается счетное число
предельных циклов.
Пример 10.5.6. Система Лоренца,
моделирующая турбулентность: х = -ох + оу ,
y = rx-y + xz, Z = xy-bz, о = 10,
b = 8/3 , г g [1,28], имеет три особые точки
0(0,0,0), 0±(±Jb(r-\), ±Jb(r-l),
г-1) и три бифуркационных значения
параметра г: г{ < г2 < г$ . При г <г\ точки 0±
устойчивы и почти все траектории
наматываются на них, точка О - седловая.
Бифуркация при г = Гу ~ 13,92 приводит к
образованию двух гомоклинических траекторий седла
О и рождению из них предельных циклов,
точки 0+ остаются устойчивыми. Вторая
бифуркация при г = r2 ~ 24,06 приводит к
возникновению странного аттрактора
(траектории начинают наматываться на
предельные циклы), но часть траекторий идет к
0+ . При третьей бифуркации (г = r$ ~ 24,74)
циклы стягиваются и происходит жесткая
потеря устойчивости точками 0+ , поведение
Рис. 10.5.9. Хаотическая траектория на аттракторе
Лоренца при г = 28 (плоскость (дг, у)
соответствует г = 27)
фазовых траекторий становится хаотическим
(рис. 10.5.9). Размерность странного
аттрактора Лоренца dim// A ~ 2,06 .
СПИСОК ЛИТЕРАТУРЫ
1. Андронов А.А., Леонтович Е.А., Гордон
И.И., Майер А.Г. Качественная теория
динамических систем. М.: Наука, 1966.
2. Арнольд В.И., Афраймовнч B.C., Иль-
яшенко Ю.С., Шильников Л.П. Теория
бифуркаций. Современные проблемы
математики. Фундаментальные направления. Т. 5,
ВИНИТИ, 1986, с. 5-128.
3. Арнольд В.И., Ильяшенко Ю.С.
Обыкновенные дифференциальные уравнения.
Современные проблемы математики.
Фундаментальные направления. Т. 1, ВИНИТИ,
1985, с. 7-149.
4. Каток А.Б., Хасселблат Б. Введение в
современную теорию динамических систем.
М.: Факториал, 1999.
5. Немыцкий В.В., Степанов В.В.
Качественная теория дифференциальных уравнений.
М.: Гостехиздат, 1949.
6. Шарковский А.Н., Коляда С.Ф., Сивак
А.Г., Федоренко В.В. Динамика одномерных
отображений. Киев: Наукова Думка, 1989, 216 с.
Глава 10.6
ЭЛЕМЕНТЫ ТЕОРИИ УСТОЙЧИВОСТИ
РЕШЕНИЙ ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЙ И СИСТЕМ
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
10.6.1. Основные определения. Для
нормальной системы дифференциальных
уравнений
? =/Су). <10-61>
440
Глава 10.6. ЭЛЕМЕНТЫ ТЕОРИИ УСТОЙЧИВОСТИ РЕШЕНИЙ
где вектор-функция f(t,y) = \2^1 '
\fn{u'y))
ределена и непрерывна при t e R,
у = {>>|, у^, • • •, уп } е R" . Условия теоремы
Коши существования и единственности
решения в данной главе для (10.6.1), если особо не
оговорено, предполагаются выполненными.
Так как решение дифференциального
уравнения высшего порядка
dny
dt"
(
= f
t,y,
dy_ dly
dt'dt2'
y("-V
dt
77-1
(10.6.2)
может быть сведено к решению системы
(10.6.1), то все определения и утверждения,
рассматриваемые в данной главе,
сформулированные для (10.6.1), могут быть аналогично
сформулированы и для (10.6.2).
Рассмотрим некоторое решение y(t)
системы (10.6.1) или уравнения (10.6.2). Все
остальные решения этой системы или этого
уравнения обозначим как y(t).
Определение 10.6.1. Решение y(t),
определенное при / > to , называют устойчивым
по Ляпунову при / —> оо 9 если для любых
е > 0 и /о существует такое 8 = 8 (е, fy) > 0 ,
что:
1. Все решения y = y(t) (включая
решение у = y(t)), удовлетворяющие условию
И'о)->Ч>о)|<6' (10-63)
определены в промежутке t$ <t < +°°;
2. Для этих решений справедливо
неравенство
\y(t) - y(t)\ < е при t0<t <+оо. (Ю.6.4)
Таким образом, решение y(t)
устойчиво, если достаточно близкие к нему в любой
начальный момент /q решения y(t)
целиком погружаются в сколь угодно узкую
е-трубку, построенную вокруг решения y(t).
В частности, при /(/,0) = 0
тривиальное решение (положение равновесия)
y(t) - 0 (/о < t < -и») устойчиво, если для
любых е > 0 и /о существует
8 = 8 (е, /о) > 0 , такое, что из неравенства
lv(/o) <8 следует неравенство \y(t) <e при
/0 < t < +оо.
Заметим, что из устойчивости
нетривиального решения y(t) не вытекает его
ограниченность. Обратно, из ограниченности
решения, вообще говоря, не следует его
устойчивость.
Определение 10.6.2. Решение y(t)
называют равномерно устойчивым при
/ е [/о , -Н»), если число 8 > 0 можно
выбрать не зависящим от начального момента
*Ь,т.е. 8 = 8(е)>0.
Определение 10.6.3. Решение y(t),
t$ < t < -И», называют асимптотически
устойчивым при t —> -И» , если:
1. Это решение устойчиво по Ляпунову;
2. Для любого to существует
Д = Д(/|о)>0, такое, что все решения
У = y(t), to < t < +оо, удовлетворяющие
условию \у (to)- У (to) < Д , обладают
свойством
lim \y(t)-y(t)\ = 0. (10.6.5)
Таким образом, асимптотическая
устойчивость есть "устойчивость с нагрузкой", т.е.
устойчивость при наличии дополнительных
условий. В частности, тривиальное решение
y(t) = Q асимптотически устойчиво, если
оно устойчиво и lim y(t) = Q при
|у(/о)|<Д- ШаР |>^| < А(/о) ПРИ
фиксированном to является областью притяжения
положения равновесия 0.
Определение 10.6.4. Решение y(t),
to <t < -И» , называют асимптотически
устойчивым в целом, если это решение
асимптотически устойчиво при f —» -и» и все
решения у = y(t), /о-'<+0°» удовлетворяют
свойству (10.6.5), т.е. Д = °° .
УСТОЙЧИВОСТЬ РЕШЕНИЙ ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 441
Таким образом, в случае
асимптотической устойчивости в целом решения y(t) его
областью притяжения в любой начальный
момент / = /о является все пространство
Определение 10.6.5. Решение y = y(t),
t$ < t < -И» f называют неустойчивым по
Ляпунову, если существует такое е > 0, что для
любого 5 > 0 найдутся такие решения у\ (/)
и момент времени t\ (5) > /q > что
Ы>о)->К>о)|<Зи |yi(/i)-^(/i)|>e.
Из определения неустойчивости
решения следует, что тривиальное решение
(положение равновесия) y(t) = 0
неустойчиво, если для некоторых е > 0 , /q и любого
5 > 0 существуют решение y\(t) и момент
tx > t0 такие, что |^ (/0 )| < 5 и \у{ (/, )| > е .
10.6.2. Устойчивость решений
линейных дифференциальных уравнений и
систем дифференциальных уравнений.
Рассматривается неоднородная система линейных
дифференциальных уравнений
4jL = A(t)y + f(t), (10.6.6)
где А (/) - матрица п х п , / (/) -
«-мерный вектор, непрерывные по / , и линейное
неоднородное дифференциальное уравнение
я-го порядка
K)dtn W dtnA V ; dtn~2
(10.6.7)
коэффициенты которого ак (/),
к = 0,1,2,...,n , и функция /(/)
непрерывны по / .
Соответствующая однородная линейная
система дифференциальных уравнений для
(10.6.6) при /(/) = 0 имеет вид
& = A(t)y. (10.6.8)
Соответствующее для (10.6.7)
однородное линейное дифференциальное уравнение
при / (/) з 0 имеет вид
dtn dt dt
... + a[{t)^ + a0{t)y = 0.
(10.6.9)
Решения системы (10.6.8) и уравнения
(10.6.9) исследуются на устойчивость и
самостоятельно.
Исследуемое на устойчивость решение
системы (10.6.6), системы (10.6.8), уравнения
(10.6.7) или уравнения (10.6.9), как и ранее,
обозначим у (/), а все остальные решения
через y(t).
Теорема 10.6.1. Для того чтобы решение
y(t), t0<t <+oo, (10.6.6), (10.6.7), (10.6.8)
или (10.6.9) было устойчивым, равномерно
устойчивым, асимптотически устойчивым,
асимптотически устойчивым в целом или
неустойчивым, необходимо и достаточно, чтобы было
соответственно устойчивым, равномерно
устойчивым, асимптотически устойчивым,
асимптотически устойчивым в целом или
неустойчивым тривиальное решение у (/) = 0,
tQ<t<+°o, системы (10.6.8) или уравнения
(10.6.9).
Таким образом, если хотя бы одно
какое-либо решение линейной системы или
уравнения (10.6.6)—(10.6.9) обладает каким-
либо из свойств устойчивости или
неустойчиво, то и все решения соответствующих систем
или уравнений (10.6.6)—(10.6.9) одновременно
удовлетворяют этому свойству.
Теорема 10.6.2. Для того чтобы решения
линейных однородных систем (10.6.8) или
уравнений (10.6.9) были устойчивы, необходимо и
достаточно, чтобы каждое их решение y(t),
/q < / < -И» f было ограничено.
Следствие 10.6.1. Если все решения
линейных неоднородных систем (10.6.6) или
уравнений (10.6.7) устойчивы, то все эти
решения одновременно или ограничены, или
неограничены при / е [tQ , -Н»).
Для нелинейных систем
дифференциальных уравнений и дифференциальных
уравнений п-го порядка из ограниченности
решений, вообще говоря, не следует их
устойчивость.
Теорема 10.6.3. Для того чтобы решения
линейных однородных системы (10.6.8) и уровне-
442
Глава 10.6. ЭЛЕМЕНТЫ ТЕОРИИ УСТОЙЧИВОСТИ РЕШЕНИЙ
ния (10.6.9) были асимптотически устойчивы,
необходимо и достаточно, чтобы все их
решения у = y(t) стремились к нулю при t -> -foo 5
т.е. lim y(t) = 0 .
/-»+оо
Следствие 10.6.2. Если решения системы
(10.6.8) или уравнения (10.6.9)
асимптотически устойчивы, то они асимптотически
устойчивы в целом.
Для нелинейных систем
дифференциальных уравнений и уравнений п-го порядка
стремление к нулю всех решений, вообще
говоря, не является достаточным условием
для асимптотической устойчивости их
тривиального решения.
10.6.3. Устойчивость решений
линейных дифференциальных уравнений и
систем дифференциальных уравнений с
постоянными коэффициентами. Рассматривается
система линейных дифференциальных
уравнений
^ = Ду+ /(/), (10.6.10)
где А-(пхп) — постоянная матрица, f (t) -
непрерывная вектор-функция, и линейное
дифференциальное уравнение п-то порядка
dny d"~]y d"~2y
ап —- + a„_t f + ап_2 f +...
п dtn dt"~] df-1
(10.6.11)
где Qfc , k = 0,1,2,...,/2 , — постоянные числа,
/(/) - непрерывная функция.
Характеристическое уравнение матрицы
А, определяющее решения системы (10.6.10),
имеет вид det [А - ХЕ) = 0 или
|яц-А, Я|2 ^13 ••• а\п I
а2] а22-Х а1Ъ ... а2п | Q
I ап\ ап2 апЪ ••■ апп~Ц
(10.6.12)
Для уравнения (10.6.11)
характеристическое уравнение имеет вид
апХп + ап_{Кп~х + ап_2Хп~2 +... + а{К + а0 = 0.
(10.6.13)
Теорема 10.6.4. Все решения (10.6.10) или
(10.6.11) устойчивы и, более того, равномерно
устойчивы, если все корни А,,-, / = 1,2, ...,п ,
соответствующего характеристического
уравнения имеют неположительные вещественные
части, т.е. Re А,,- < 0, при этом корни,
имеющие нулевые вещественные части, только
простые.
Теорема 10.6.5. Все решения (10.6.10) или
(10.6.11) асимптотически устойчивы и, более
того, асимптотически устойчивы в целом, если
все корни \j, / = 1,2,..., п , соответствующего
характеристического уравнения имеют
отрицательные вещественные части, т.е.
Re \j < 0 .
Теорема 10.6.6. Все решения (10.6.10) или
(10.6.11) неустойчивы, если среди корней
характеристического уравнения имеется хотя бы
один корень с положительной вещественной
частью.
Таким образом, чтобы доказать
устойчивость или асимптотическую устойчивость
решений (10.6.10) или (10.6.11), достаточно
убедиться, что вещественные части корней
характеристического уравнения,
представляющего собой алгебраический полином п-м
степени, были либо неположительны, либо
отрицательны.
Критерий Гурвица. Условия Рауса-Гурви-
ца. Рассмотрим полином п-н степени
/ (z) = Яо + a\Z + a2z2 +... + anz",
(10.6.14)
где ац,а\,...,ап — действительные
коэффициенты.
Определение 10.6.6. Полином f (z)
называют полиномом Гурвица, если все его корни
Z/c, k = 1,2, ...,п , имеют отрицательные
вещественные части. Полагаем для дальнейшего
без ограничения общности, что а$ > 0,
ап Ф 0 , т.е. полином (10.6.14) не имеет
нулевых корней.
Определение 10.6.7. Полином (10.6.14)
при я0 > 0 , ап Ф 0 , называют стандартным
полиномом.
Определение 10.6.8. Матрицей Гурвица
порядка п х п называют следующую матрицу
(ах л0 0 0 ... 0 Л
Ь °} °! °? "° (Ю.6.15)
0 0 0 0 ...а„
ТЕОРЕМЫ ЛЯПУНОВА ОБ УСТОЙЧИВОСТИ ПО ПЕРВОМУ ПРИБЛИЖЕНИЮ 443
элементы которой а$,щ,...,ап являются
коэффициентами стандартного полинома
(10.6.14)
Теорема 10.6.7. (Теорема Рауса—Гурвица).
Для того чтобы стандартный полином (10.6.14)
являлся полиномом Гурвица, необходимо и
достаточно, чтобы были положительны все
главные диагональные миноры:
В результате получаем
А3 =
Aj = щ > 0, Д2 =
а{ % 0
\а3 а2 а{
\а5 а4 аъ
аъ а2
>0,..., А,
>0,
апАп_{ > 0
(10.6.16)
его матрицы Гурвица.
Заметим, что так как Ап_[ > 0, то
последнее из условий Гурвица может быть
заменено требованием ап > 0. Условие (10.6.16)
носит название условия Рауса-Гурвица. Итак,
если для коэффициентов характеристического
уравнения (10.6.13) или (10.6.12),
приведенного к виду равенства нулю полинома,
выполнены условия Рауса-Гурвица и а$ > 0 , то
все решения (10.6.10) или (10.6.11)
асимптотически устойчивы в целом.
Заметим, что если стандартный полином
является полиномом Гурвица, то все его
коэффициенты положительны.
10.6.4. Теоремы Ляпунова об
устойчивости по первому приближению.
Рассматривается нелинейная система
дифференциальных уравнений (10.6.1) или
дифференциальное уравнение (10.6.2). Пусть известно
решение у = j> (/), определенное при
/ б [/q , +°°), которое необходимо исследовать
на устойчивость. Это исследование может
быть реализовано на основании
нижеследующих теорем Ляпунова об устойчивости по
первому приближению.
Рассмотрим исследование на
устойчивость решения y = y(t} системы (10.6.1).
Исследование такого решения для (10.6.2)
проводится сведением уравнения (10.6.2) к
соответствующей нормальной системе вида
(10.6.1). В системе (10.6.1) проводим замену
неизвестной вектор-функции y(t) на новую
неизвестную функцию u(t):
у(0 = "(') +Я').™- u(t) = y(t)-y(t),
где y(t} — исследуемое на устойчивость
решение (10.6.1).
dy du dy(t)
Но так как
dt
■■ f (t, у), то отсюда следу-
f = f(t,u + y)-f(t,y).
Обозначая функцию
f(t,u + p)-f(t, y) = y(t,u), приходим к
системе
du
dt
= ф(>,и),
(10.6.17)
у которой исследуемым на устойчивость
оказалось решение
s(t) = y(t)-y(t).o.
Таким образом, исследование на
устойчивость решения y(t) системы (10.6.1)
сводится к исследованию тривиального решения
системы (10.6.17). Если вектор-функция
<p(f,w) имеет непрерывные производные
первого порядка по и, являющиеся
постоянными вдоль тривиального решения (10.6.17),
то система (10.6.17) может быть записана в
виде
$ = Ли + л (>,"), (10.6.18)
at
где А - (п х п) — постоянная матрица;
T\(t,u) — функция, бесконечно малая
порядка выше первого в окрестности решения
м(г) = 0. Если в системе (10.6.18) отбросить
члены порядка выше первого, то полученную
систему линейных дифференциальных
уравнений с постоянными коэффициентами
du
dt
= Аи
(10.6.19)
называют системой первого приближения для
нелинейной системы (10.6.18), а
следовательно, и для исходной рассматриваемой системы
(10.6.1).
Теорема 10.6.8. Если все корни
характеристического уравнения системы первого
приближения (10.6.19) имеют отрицательные
вещественные части, а вектор-функция r\(t,u)
удовлетворяет условию
444
Глава 10.6. ЭЛЕМЕНТЫ ТЕОРИИ УСТОЙЧИВОСТИ РЕШЕНИЙ
|л(/,ы)|<Л/|н|а, Л/>0, а>0 (10.6.20)
(М и а — некоторые постоянные), то
тривиальное решение системы (10.6.17), а
следовательно, и исследуемое решение }>(/) системы
(10.6.1) являются устойчивыми.
Теорема 10.6.9. Если хотя бы один из
корней характеристического уравнения системы
первого приближения (10.6.19) имеет
положительную вещественную часть, а вектор-
функция r\(t,u) удовлетворяет условию
(10.6.20), то тривиальное решение системы
(10.6.17), а следовательно, и исследуемое
решение y(t) системы (10.6.1) являются
неустойчивыми.
10.6.5. Функции Ляпунова. Теоремы
Ляпунова об устойчивости и
асимптотической устойчивости. Рассматривается система
дифференциальных уравнений (10.6.1), для
которой исследуется устойчивость
тривиального решения у (t) = 0 .
Заметим, что, как показано в п. 10.6.4,
исследование на устойчивость любого
решения y = y(t) системы (10.6.1) в общем
случае сводится к исследованию устойчивости
тривиального решения системы (10.6.17).
Можем полагать, что такое сведение, в случае
необходимости, уже произведено.
Наряду с тривиальным решением
}>(/) = 0 системы (10.6.1) рассмотрим
некоторую функцию v(t,y), teR[, ysRn.
Определение 10.6.9. Действительную
непрерывную скалярную функцию v(t,y)
называют знакопостоянной (знакоположительной
или знакоотрицательной), если v(t,y)>0
или v(t,y)<0.
Определение 10.6.10. Функцию v(t,y)
называют положительно определенной
(определенно положительной), если существует
непрерывная скалярная функция w [у),
такая, что
v(t,u)>w(y)>0 при \у\*0,
и o(/,0) = w(0) = 0. { U
Определение 10.6.11. Функцию v(t,y)
называют отрицательно определенной
(определенно отрицательной), если существует
непрерывная скалярная функция w(y), такая,
v(t,u)< -w(y)<0 при \у\ф 0,
и v(t,0) = w(0) = 0.
Положительно или отрицательно
определенную функцию называют знакоопределен-
ной.
В качестве w(_y) иногда можно брать
w (у) = inf v (/, у) или supv(t, у).
Определение 10.6.12. Функция v(t,у)
имеет бесконечно малый высший предел при
у -> 0 , если для любого е > 0 существует
5 = 5(e) > 0 , такое, что \v(t,у)\ < г при
\у\<Ь и te [f0,+~).
Заметим, что если v(t,y) = v(y) —
непрерывная функция, не зависящая от
времени / и такая, что а(0) = 0, то, очевидно,
v(y) допускает бесконечно малый высший
предел при х -> 0 .
Определение 10.6.13. Функцию
Ми у)
dt
dv
равную
dv(t,y) = dv t у dv dyt
dt ~ Э/ + *i dyf dt
dv
/=l
dv
(10.6.22)
где —L = fj (/, y), / = 1,2,..., n , в
соответствии с (10.6.1), называют (полной) производной
повремени t функции v(t,y) в силу системы
(10.6.1).
Теорема 10.6.10. (Первая теорема
Ляпунова об устойчивости). Если для системы
(10.6.1), имеющей тривиальное решение
y(t) = 0, существует положительно
определенная скалярная функция v(t,y),
допускающая знакоотрицательную производную по вре-
dv(t,y)
мени в силу системы (10.6.1), то
dt
тривиальное решение y(t) = 0 данной системы
устойчиво по Ляпунову при t —> +<» .
Следствие 10.6.3. Если для линейной
однородной системы
СПИСОК ЛИТЕРАТУРЫ
445
dy_
dt
= A(t)y
(10.6.23)
существует положительно определенная
функция v(t,y), для которой производная в
силу системы (10.6.23) —^_iZ2 < о , то все
dt
решения y = y(t) данной системы (10.6.23)
определены и ограничены на полуоси
te[t0,+оо).
Теорема 10.6.11. (Вторая теорема
Ляпунова об асимптотической устойчивости). Если
для системы (10.6.1), имеющей тривиальное
решение y(t) = 0, существует положительно
определенная скалярная функция v(t,y),
допускающая бесконечно малый высший предел при
у —> 0 и имеющая отрицательно определенную
производную по времени в силу этой
dt
системы, то тривиальное решение у (/) = 0
данной системы асимптотически устойчиво
при t —> -и» .
Следствие 10.6.4. Если для однородной
системы (10.6.23) существует положительно
определенная функция v(t,y),
удовлетворяющая условиям второй теоремы Ляпунова,
то каждое решение y = y(t) этой системы
(10.6.23) асимптотически устойчиво в целом.
10.6.6. Теоремы Четаева и Ляпунова
о неустойчивости.
Теорема 10.6.12. (Третья теорема
Ляпунова о неустойчивости). Если для системы
(10.6.1), имеющей тривиальное решение
>>(/) = 0, существует функция v(t,y),
допускающая бесконечно малый высший предел при
у-)0 и обладающая знакоопределенной произ-
dv(t,y)
водной в силу системы (10.6.1) и если
dt
в окрестности у = 0 найдется точка (/0,Уо),
для которой знак функции v(t,y) совпадает со
* « dv(*>y)
знаком производной * , т.е. такая, что
dt
то тривиальное решение _р(/) = 0 системы
(10.6.1) неустойчиво.
Заметим, что функция v (t, у) в теореме
10.6.12 (третьей теореме Ляпунова) не
обязательно является знакоопределенной.
В третьей теореме Ляпунова о
неустойчивости полагается, что производная
dv(t,y)
—^—- в силу системы (10.6.1) знакоопре-
делена в некоторой полной окрестности
у.0.
Однако для доказательства
неустойчивости тривиального решения системы (10.6.1)
достаточно обнаружить существование хотя
бы одной траектории, исходящей из каждой,
сколь угодно малой, окрестности у = 0 при
г = /q и выходящей за пределы
фиксированной окрестности.
В этом случае нет необходимости
рассматривать полную окрестность у = 0 . Такое
ослабление условий теоремы Ляпунова о
неустойчивости и утверждает следующая
теорема.
Теорема 10.6.13. (Теорема Четаева о
неустойчивости). Если для системы (10.6.1),
имеющей тривиальное решение y(t) = 0,
существует непрерывно дифференцируемая функция
v(t,y), область положительности и
ограниченности которой является открытой
областью, примыкающей к у = 0, причем
v (j9 у) = 0 на части границы этой области, и
если эта функция в этой области имеет опре-
dv(t,y)
деленно положительную производную
dt
в силу системы (10.6.1), то тривиальное
решение >>(?) = 0 системы (10.6.1) неустойчиво.
СПИСОК ЛИТЕРАТУРЫ
1. Агафонов С.А., Герман А.Д.,
Муратова Т.В. Дифференциальные уравнения. М.:
Изд. МВТУ, 1999. 348 с.
2. Арнольд В.И. Обыкновенные
дифференциальные уравнения. М.: Наука, 1984.
272 с.
3. Барбашин Е.А. Функции Ляпунова.
М.: Наука, 1970. 240 с.
4. Демидовым Б.П. Лекции по
математической теории устойчивости. М.: Наука, 1967.
472 с.
446
Глава 10.7. ФУНКЦИОНАЛЬНО-ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
5. Матвеев Н.М. Методы
интегрирования обыкновенных дифференциальных
уравнений. М.: Высшая школа, 1963. 546 с.
6. Петровский И.Г. Лекции по теории
обыкновенных дифференциальных
уравнений. М.: Наука, 1970. 280 с.
7. Понтрягин Л.С. Обыкновенные
дифференциальные уравнения. М.: Наука, 1970.
332 с.
8. Степанов В.В. Курс
дифференциальных уравнений. М.: ГИФМЛ, 1958. 468 с.
9. Федорюк М.В. Обыкновенные
дифференциальные уравнения. М.: Наука, 1985. 448 с.
10. Хартман Ф. Обыкновенные
дифференциальные уравнения: Пер. с англ. М.:
Мир, 1970. 720 с.
11. Четаев Н.Г. Устойчивость движения.
М.: Наука, 1987. 204 с.
12. Эльсголыд Л.Э. Дифференциальные
уравнения и вариационное исчисление. М.:
Наука, 1969. 424 с.
Глава 10.7
ФУНКЦИОНАЛЬНО-
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
10.7.1. Начальные задачи для
функционально-дифференциальных уравнений.
Функционально-дифференциальное уравнение
(ФДУ) — это уравнение, связывающее
аргумент, искомую функцию и её производные,
взятые, вообще говоря, при различных
значениях аргументов. Примеры:
x(t) = ax(t-h), (10.7.1)
x(t) = ax(kt) (10.7.2)
и т.д. В уравнении (10.7.1) число / называют
основным (ведущим) значением аргумента, а
t - И — отклоняющимся значением, при этом
величину -И называют отклонением. Поэтому
ФДУ называют также дифференциальными
уравнениями с отклоняющимся аргументом.
ФДУ может включать и более одного
отклонения аргумента. Если все эти отклонения
постоянны, ФДУ называют разностно-
дифференциальным уравнением (РДУ); в
частности, таким является уравнение (10.7.1) (но
не (10.7.2)). Может также оказаться, что
отклонение зависит от неизвестной функции
(авторегулируемое отклонение).
Порядком ФДУ называют наибольший из
порядков производных от искомой функции,
входящих в данное уравнение. Если
рассматривается система ФДУ, то обычно число
уравнений совпадает с числом неизвестных
функций; последнее называют размерностью
системы. Такую систему можно записать в
векторном виде.
Обычно аргумент в ФДУ трактуется как
время, а само ФДУ - как дифференциальный
закон эволюции некоторого процесса. В этом
случае ФДУ естественно записывать в виде
*И(>) =
= f(t1x^(t-h]),...J"^(t-hk),...),
(10.7.3)
где все /ц > 0 , а значения 1ц называть
отклонениями аргумента.
Обозначим п = max{щ,...,пк} . Тогда,
если п > п (соответственно п -Л, п <п),
то ФДУ (10.7.3) называют уравнением
запаздывающего (соответственно нейтрального,
опережающего) типа.
Наиболее подробно разработана теория
ФДУ запаздывающего типа (ЗДУ); они и
наиболее часто встречаются в приложениях —
например, при описании работы системы
автоматического управления с учетом
запаздывания в органе регулирования. Один из
простейших классов ЗДУ имеет вид
x(t) = f{t,x(t),x{t-h)), (1074)
h = const > 0.
К такому виду с векторной функцией X легко
сводится любое ЗДУ с единственным
постоянным запаздыванием аргумента.
Начальное условие для уравнения
(10.7.4) имеет вид
х(/) = ф(/), t0-h<t<t0, (10.7.5)
где fg — начальное значение аргумента, а <р —
начальная функция, описывающая
предысторию процесса до момента /q . Решением
задачи (10.7.4), (10.7.5) называют функцию x(t),
определенную при / > /q и удовлетворяющую
уравнению (10.7.4), в котором, когда
/ - И < /q , надо в силу (10.7.5) подставлять
ф(/ - И) вместо x(t - И); кроме того, опять-
таки в силу (10.7.5) должно быть выполнено
равенство х (/д ) = <р (/д ).
Решение задачи (10.7.4),(10.7.5) на
любом конечном интервале изменения t
сводится к решению последовательности
обыкновенных дифференциальных уравнений
(ОДУ) на основе следующего метода шагов.
НАЧАЛЬНЫЕ ЗАДАЧИ ДЛЯ УРАВНЕНИЙ
447
Когда t меняется от /0 Д° А) + ^ » значение
/ - /* меняется от /0 ~ ^ Д° А)> и поэтому
уравнение (10.7.4) приобретает вид ОДУ
*(0 = /М0.ф('-а))-
Решая его при начальном значении
х (''о ) = Ф (А))' мы получаем значения
решения x(t) при t$ < t < t$ + И . Далее, когда /
меняется от to + h до t$ + 2h , значение
t - h меняется от tQ до tQ + h , т.е. значения
x(t-k) уже известны, и поэтому (10.7.4)
представляет собой ОДУ; решая его при уже
известном начальном условии x(/q+^), мы
получаем значения x(t) при
А) + h < t < /0 + 2h и т.д. Это.дает, в
частности, возможность не только распространить
теоремы о разрешимости задачи Коши для
ОДУ на задачу (10.7.4), (10.7.5), но и
перенести с ОДУ на ЗДУ численные методы
решения начальной задачи.
Если интересующее нас число шагов
невелико, то удобно ввести функции
yk(t) = x(t0+{k-l)h + t),
k = l,2„...,N; 0<t<h.
Задача (10.7.4),(10.7.5) равносильна тогда
задаче для системы ОДУ:
y2(t) = f(t0+h + t,y1(t)J(t));
yN(t)=f(t0+(N-\)h + ty(t),yN-l(t)),
Q<t<h,
У(0) = Ф(/Ь),У2(0) = У(А),...,/Г(0) = /г-1(А).
Её можно решить с помощью итераций по
схеме у1 -> (У,у2) ->... -> (yl,y2,...,yN),
фиксируя до последнего перехода только
значения yt(h),...,yN-l(h).
Решение задачи (10.7.4),(10.7.5) обладает
следующим свойством сглаживания. Пусть
функция / обладает непрерывными
производными всех порядков, а функция ф
непрерывна. Тогда решение х принадлежит классу
С (т.е. имеет непрерывную производную
первого порядка) при / > А) , классу С при
/ > А) + h и т.д. на всем интервале
существования решения.
Важнейшей особенностью задачи
(10.7.4), (10.7.5), отличающей её от задачи
Коши для ОДУ, является то, что решение её
строится только в направлении возрастания
t . Другая важная особенность состоит в том,
что начальное условие задается с помощью
функции, а не числа, как для ОДУ, и потому
множество всех решений ЗДУ
бесконечномерно.
Если ЗДУ содержит несколько
постоянных запаздываний, то начальное условие
задается на интервале, длина которого равна
наибольшему среди них, а в качестве длины
шага берется наименьшее из них. Метод
шагов распространяется и на ЗДУ с
переменными запаздываниями, но не обращающимися в
нуль. Для переменного запаздывания
начальная функция задается на интервале значений
/ , необходимых для осмысленности
уравнения. Так, например, для уравнения (10.7.2)
при ?о > 0 , 0 < к < 1 начальное условие
надо задавать при kt$ <t < A) •
Уравнения (10.7.1), (10.7.4) (а также
(10.7.2) при t > 0 , 0 < к < 1 ) являются
примерами ЗДУ с дискретным запаздыванием. К
ним, естественно, примыкают ЗДУ с
непрерывно распределенным запаздыванием,
которые обычно имеют вид интегродифференци-
альных уравнений типа Вольтерра, например,
x(t) = fU^_hK{t,x)x{x)dx\ (10.7.6)
Иногда под термином процессы с
запаздыванием понимают только процессы, описываемые
ЗДУ с дискретными запаздываниями, тогда
как в случае распределенного запаздывания
говорят о процессах с последействием. И те и
другие уравнения являются ЗДУ, и их
свойства аналогичны.
Все эти типы объединяет следующий
общий вид ЗДУ первого порядка:
x(t) = F(t,xt), (10.7.7)
где х, (9) = x(t + 9), -И < 9 < 0 . Таким
образом, xt представляет собой функцию-
"отрезок" решения от t - h до / , сдвинутый
на стандартный интервал [0, h], a F является
функцией относительно / и функционалом
относительно xt. Так, чтобы из (10.7.7) полу-
448 Глава 10.7. ФУНКЦИОНАЛЬНО-ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
чить (10.7.4), надо положить
/,(f,\|f) = /(/,\|f(0),\|f(-A)), а чтобы
получить (10.7.6), - принять
*■('.¥) =
-'('•!>
(/,/ + e)\|f (e)rfe
Начальное условие для уравнения (10.7.7)
имеет вид (10.7.5), а свойства решений задачи
(10.7.7), (10.7.5) в целом такие же, какие были
указаны для задачи (10.7.4), (10.7.5).
Простой класс ФДУ нейтрального типа
имеет вид
x(t) = f(t,x(t),x(t-h),x'(t-h)), (10.7.8)
а начальное условие для него имеет тот же
вид (10.7.5); однако теперь от ф надо
требовать не только непрерывности, но и (хотя бы
кусочно) непрерывной дифференцируемости.
Метод шагов здесь также применим, и общие
свойства решений задачи (10.7.8), (10.7.5)
сходны с описанными для задачи (10.7.4),
(10.7.5), за исключением свойства
сглаживания, которое теперь не имеет места. Так, при
любой гладкости <р, если условие согласования
Ф) = /(^.ф('о)>ф('о--Л),ф(гь-А)+)
не выполнено, то решение задачи (10.7.8),
(10.7.5), вообще говоря, имеет разрывы
первого рода у производной при
/ = /0>>0+Мо+2/*,...
Решение ФДУ опережающего типа,
например, вида
*(0 = /(',*(/-А),*(Г-А)), (Ю.7.9)
при начальном условии (10.7.5) сводится с
помощью метода шагов к последовательному
дифференцированию функции <р. В
результате малые изменения ф могут привести к
существенному изменению решения. Кроме
того, у решения, вообще говоря, появляются
слагаемые типа 5 -функции и ее производных
с особенностями в точках /q + A,/q + 2А < ...
все более высокого порядка по мере удаления
от /q • Эт° вносит затруднения в исследование
и приложения задач этого типа. Аналогичная
ситуация возникает при продолжении
решений ЗДУ назад во времени.
Наиболее изучен класс линейных
автономных (т.е. с постоянными коэффициентами)
РДУ, так как к таким уравнениям применим
метод отыскания решений в виде х = ept .
Для скалярного уравнения
сИ(0-_^.>)Му), (ш7
(10.7.10)
aj*0J = \,...,N,hje
Это приводит к характеристическому
уравнению
p"=f,ajp"Je-hjP; (10.7.11)
при этом г -кратному корню р уравнения
(10.7.11) отвечают решения
ept,tept,...Jr~]ept уравнения (10.7.10). Если
(10.7.10) не является ОДУ, то уравнение
(10.7.11) имеет бесконечную
последовательность корней Р\,Р2->'~1 причем |/^|—>°°
при к —> оо. Если (10.7.10) имеет
запаздывающий (нейтральный или опережающий)
тип, то
limsup$Re/?£ = -оо,(е (-оо?оо), или °о).
Если sup* 9te Pk < 0 (> 0), то уравнение
(10.7.10) асимптотически устойчиво
(соответственно неустойчиво) по Ляпунову.
(Определения этих понятий, как и понятия
устойчивости по Ляпунову, совершенно
аналогичны соответствующим определениям для
ОДУ). Если supfc 9te pk = 0, причем
3ie р{ = ... = Же pi = 0, тогда как
suP)b/ 4Re Pk <® (в частности, это верно для
ЗДУ вида (10.7.10), если max* Sie pk = 0), то
для устойчивости уравнения (10.7.10)
необходимо и достаточно, чтобы все корни P[,...,Pi
уравнения (10.7.11) были простыми.
Таким образом, вопрос об устойчивости
линейного автономного РДУ сводится к
исследованию корней соответствующего
характеристического уравнения, которое можно
проводить аналогично тому, как это делается
для ОДУ.
Если уравнение (10.7.10) векторное, т.е.
хеМ", а коэффициенты представляют
собой квадратные матрицы порядка п , то
характеристическое уравнение имеет вид
det
N
\
0 (10.7.12)
(Е" — единичная матрица). Свойства его
НАЧАЛЬНЫЕ ЗАДАЧИ ДЛЯ УРАВНЕНИЙ
449
решений для систем РДУ различного типа
такие же, как были указаны выше для
уравнения (10.7.11), однако возможен случай
вырождения (10.7.12) в алгебраическое
уравнение.
К решению начальной задачи для
скалярного или векторного уравнения (10.7.10)
можно привлечь операционное исчисление. В
качестве примера рассмотрим уравнение
(10.7.1) при аеШ, h>0, t0=0,
ф s const. Применение к нему
преобразования Лапласа приводит с учетом начального
условия к изображению решения
Х{р) = ур
1 +
а(р-ае-»у1].
Характеристическое уравнение имеет вид
р = ае~Ир. (10.7.13)
Пусть а > 0 . Тогда можно проверить,
что уравнение (10.7.13) имеет единственный
вещественный корень р\ > 0 , тогда как для
остальных корней Же Рь< Р\. Применяя
формулу обращения преобразования Лапласа,
получаем асимптотическое представление
решения
x(/)~a<p[/>,(l+ */>,)]">', *->...
При а < 0 эта формула сохраняет силу,
если Щ И < е~ ; здесь р\ < 0 — больший из
двух вещественных корней уравнения
(10.7.13). Если аЩ , возрастая, переходит
через значение е~ , то эти корни
превращаются в пару комплексно сопряженных корней
А,2 = г\ - 's\ cr\ < 0 • Применение формулы
обращения дает асимптотическое
представление решения при / -> «>:
х(/)=2аФ|/)|Г2(1 + 2А/-|+Л2|Л|2)"1х
х 1г| + h\p\\ )cos5|/ + i| (l + 2ar1)sin5)nx
хе* [1+0(1)],
т.е. оно остается затухающим, но становится
осциллирующим, что принципиально
отличает ЗДУ (10.7.1) от соответствующего ОДУ с
h = 0 . При дальнейшем возрастании \а\ h ,
когда это произведение переходит через
значение тс/2, значение /j становится
положительным, т.е. уравнение (10.7.1) при
ah < - я/2 оказывается неустойчивым.
Операционный метод можно применять
и при исследовании влияния заданного
внешнего воздействия на линейную
автономную систему с запаздыванием,
математической моделью чего является уравнение
x{n4t) = t°Jx("j)(<-h;hf(<)'
7=1
В частности, таким методом можно
построить периодическое решение в случае,
когда функция / периодична и отсутствует
резонанс.
Энергетический ("второй ") метод
Ляпунова исследования устойчивости равновесия
распространяется на системы с
запаздыванием. Приведем пример теоремы об
устойчивости автономной системы ЗДУ 1-го порядка в
векторной форме
*(0 = /(*)•*/(*) = *(' + *)■ (Ю.7.14)
-h < 0 < 0.
Пусть функционал / : С [-/*, 0] -> Шп
непрерывен, причем /(0) = 0, т.е. х(г) = 0
удовлетворяет уравнению (10.7.14). Обозначим
K:C[-A,0]->R, <peC[-A,0],
KW = lh._sup±[K((^)J-K(<p)],
где хф представляет собой решение
уравнения (10.7.14) при начальном условии (10.7.5).
Тогда, если V (ф) —»0 при
||ф|| (= max |<р|) -* 0, inf№6 V (<р) > 0 для
любого 5 > 0 и V (ф) < 0 для всех ф, то
решение x(t) = 0 уравнения (10.7.14)
устойчиво по Ляпунову. Если, кроме того,
supy^g V (ф) < 0 для любого 5 > 0 , то эта
устойчивость асимптотическая. Имеет место
также теорема о неустойчивости, аналогичная
соответствующей теореме Ляпунова.
Из этих общих теорем вытекает, в
частности, следующая теорема об устойчивости по
первому приближению. Пусть уравнение
(10.7.14) можно представить в виде
x(t)=L(xt) + a(xt), (10.7.15)
где L — линейный функционал, а
а (ф) = о (||ф||) при |ф||->0. Тогда, если
характеристическое уравнение для линеаризо-
15 — 7706
450
Глава 10.7. ФУНКЦИОНАЛЬНО-ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
ванного ("укороченного") уравнения (10.7.15)
имеет все корни с отрицательной вещественной
частью, то нулевое решение уравнения (10.7.15)
асимптотически устойчиво, а если хотя бы один
из этих корней имеет положительную
вещественную часть, то оно неустойчиво.
Имеются также теоремы об
устойчивости, в которых V представляет собой не
функционал, а функцию от векторного или
даже скалярного аргумента. Приведем пример
такой теоремы для уравнения
*(') = /(*(').*('-*))• (10.7.16)
h = const > 0
с непрерывной функцией / : С [-И, 0] -> Rn
и / (0,0) = 0 . Пусть в окрестности G точки
0 6 Жп существует скалярная непрерывно
дифференцируемая функция V, для которой
К(0) = 0, V(x)>0(x*0), и из x,yeG ,
V (х) < V (у) следует, что
(grad V (х), / (х, >>)) < 0 . Тогда решение
х(/) = 0 уравнения (10.7.16) устойчиво по
Ляпунову.
10.7.2 Краевые задачи для разностно-
дифференциальных уравнений. Известны
различные постановки краевых задач для
ФДУ, причем классификация уравнений по
отношению к таким задачам может
отличаться от приведенной выше. Рассмотрим,
например, краевую задачу для скалярного РДУ:
j-t[p(t)x(t-h) + q(t)x(t) + r(t)x(t + h)]= (10717)
= f(t,x(t-h),x(t),x(t + h),x(t-h),x(t),x(t + h)), a<t<b,
x(t) = x~(t)(a-h<t<a), x(t) = x+(t), b<t<b+h (10.7.18)
(функции х и х+ заданы), причем для
простоты будем считать, что функции p,q,r
принадлежат С , х~ и А'+ принадлежат С , а
b - а кратно h , т.е. b - а = mh , где т>\ -
целое. Решением задачи (10.7.17), (10.7.18)
естественно считать непрерывную функцию
х : [а, Ь] -> Е , сужение которой на каждый
интервал [а, а + Л], [а + А,а + 2А],..., [Ь-h,Ь] поРядка Размерности т. Для этого надо обо
принадлежит С и удовлетворяет уравнению
(10.7.17) во всех внутренних точках, причем
на первом интервале вместо x(t-h) и
x(t-h) надо подставлять соответственно
пользовать х+. Кроме того, должно быть
х{а) = х~ (а), х(Ь) = х+ (Ь), а при переходе
через точки а + h , а + 2И ,..., b - И сумма,
стоящая в (10.7.17) внутри квадратных скобок,
должна быть непрерывной.
Краевая задача (10.7.17), (10.7.18)
сводится к краевой задаче для системы ОДУ 2
значить
/(/) = *(а + (*-1)А + /),
£ = !,...,/я; 0 </</*.
х (t - И) и х (/-Л), а на последнем ис-
d\
Тогда уравнение (10.7.17) преобразуется в
систему
= f(a + (* - \)h + t,yk~] (t),yk (/),/+l (О,/"1 (/),/ (/),/+I (/)), (10.7.19)
к = 1,...,m\ 0<t<h,
причем при к = 1 надо полагать
у0 (/) = х~ (а - И + /), а при к = т -
полагать ут+ (t) = x+ (b + t). Решение системы
(10.7.19) ищется в классе С [0,А], причем
должны удовлетворяться краевые условия
p(a + kh)[yk(0)-yk-*(h)]
+q (a + kh)[yk+] (0)
yk(h)
+r{a + kh)[yk+2(0)-yk+{(hj
A: = 1 — 1
+
+
= 0
(10.7.20)
с прежней оговоркой относительно у и ут
ЛИНЕЙНОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ
451
Если уравнение (10.7.17) линейное, то и
система ОДУ (10.7.19) линейна. Если ее
можно разрешить относительно у (/),...,ут (/),
то после подстановки ее общего решения в
краевые условия (10.7.20) задача сводится к
решению системы 2т линейных
алгебраических уравнений с 2т неизвестными.
Если b - а не кратно р, так что
a + mh<b<a + (m + \)h (m - целое), то
аналогичным образом получается краевая
задача для системы ОДУ размерности 2т + 1.
Пример. Для РДУ
—Гх(Г-1)+2jc(/) + x(/ + 1)] = 1 ставятся
dtL J
краевые условия х(/) = 0(-1</<0),
х (/) = 0 (3 < / < 4). Применяя изложенный
метод, находим у (t) = -—+ C\t + С2 ,
^(/) = С3(г + 1) + С4, у3(/) =
С + 2)2
+С5 (/ + 2) + Q . Из краевых условий получа-
3 1
ем, что С] = С$ = — ; Q = — ;
с2 = с3=с6 = о.
Изучались также стохастические ФДУ;
ФДУ с частными производными; задачи
оптимального управления с запаздыванием;
асимптотическое представление решений
ФДУ с малыми отклонениями аргумента или
со слабой нелинейностью; возникновение
периодических режимов для систем с
запаздыванием при изменении параметра и т.д.
СПИСОК ЛИТЕРАТУРЫ
1. Беллман Р., Кук К.Л.
Дифференциально-разностные уравнения. М.: Мир, 1967.
2. Каменский Г.А., Скубачевский А.Л.
Линейные краевые задачи для
дифференциально-разностных уравнений. М.: Изд-во
МАИ, 1992.
3. Колмановский В.Б., Носов В.Р.
Устойчивость и периодические режимы
регулируемых систем с последействием. М.: Наука,
1981.
4. Красовский Н.Н. Некоторые задачи
теории устойчивости движения. М.: Физ-
матгиз, 1959.
5. Лекус В.Д., Ровинский В.Э. Оценка
устойчивости систем с запаздыванием. Л.:
Энергоатомиздат, 1982.
6. Митропольский Ю.А., Мартынюк Д.И.
Периодические и квазипериодические
колебания систем с запаздыванием. Киев: Вища
школа, 1979.
7. Мышкис А.Д. Линейные
дифференциальные уравнения с запаздыванием. М.:
Наука, 1972.
8. Разван В. Абсолютная устойчивость
автоматических систем с запаздыванием. М.:
Наука, 1983.
9. Разумихин Б.С. Устойчивость эреди-
тарных систем. М.: Наука, 1988.
10. Эльсголыд Л.Э., Норкин СБ.
Введение в теорию дифференциальных уравнений с
отклоняющимся аргументом. М.: Наука, 1971.
Глава 10.8
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
С ЧАСТНЫМИ ПРОИЗВОДНЫМИ
ПЕРВОГО ПОРЯДКА
10.8.1. Линейное дифференциальное
уравнение. Уравнения характеристик.
Определение 10.8.1. Линейным
неоднородным дифференциальным уравнением с частными
производными первого порядка называют
уравнение вида
Х\ {х\,х2,...,хп)— + Х2(хьх2,...,хп)-— + ...
Эх,
Эх-)
Эй
... + Хп(хьХ2,...,Хп)-— = Z(X],X2,...,Xn),
дХп
(10.8.1)
где Xi(x],x2,...,xn), / = 1,2,..., я,
Z (Х],х2,...,хп) - заданные функции п
независимых переменных Х\,х2,...,хп,
непрерывно дифференцируемые в некоторой
области QeR"; и(х\,х2,...,хп) - искомая
функция.
Определение 10.8.2. Если в (10.8.1)
Z (х\,х2,...,хп) = 0 , то такое уравнение
называют линейным однородным
дифференциальным уравнением с частными производными
первого порядка.
Рассмотрим сначала линейное
однородное уравнение
Х\{хьхъ...,хп)— + Х2{хьх2,...,хп)— +...
... + Хп{хьхъ...,хп)-^- = 0,
дхп
(10.8.2)
15*
452 Глава 10.8. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ
Данному уравнению поставим в
соответствие нормальную систему обыкновенных
дифференциальных уравнений в
симметрической форме записи:
дХ\
dxj
Х\ (*ь*2>—>*л) Х2(хьх2,...,хп)
Ъх„
Лп [X\fX2,...,Xn)
(10.8.3)
Условия теоремы Коши существования
и единственности решения для (10.8.3)
полагаются выполненными.
Определение 10.8.3. Систему (10.8.3)
называют системой уравнений характеристик для
однородного уравнения (10.8.2).
Решение системы (10.8.3) (см. также
п. 10.1.7) может быть определено в виде
системы п-\ независимых первых интегралов:
V,(JC,,JC2,...,JCW) = C,
\|/2(х,,х2,...,хя) = с2
Уп-\(х\,хЪ-,хп) = СП-\-
(10.8.4)
Условие независимости эквивалентно
неравенству нулю соответствующего Якобиана
системы функций (10.8.4) по каким-либо п-\
переменным из (х\,х2,...9хп).
Определение 10.8.4. Интегральные
кривые семейства линий от (п-\) параметра,
определяемого системой (10.8.4) в я-мерном
пространстве Х\, х2,..., хп , называют
характеристиками уравнений (10.8.2).
Аналогично определяются далее
характеристики уравнений (10.8.1) и (10.8.16).
Теорема 10.8.1. к = ф(\|/,,\|/2,...,\|/„_,),
где ф — произвольная непрерывно
дифференцируемая функция, является общим решением
уравнения (10.8.2), а \|/; = q , i = 1,2,...,я - 1 , -
совокупность п-1 независимых первых
интегралов (10.8.4) системы (10.8.3).
Рассмотрим теперь линейное
неоднородное уравнение (10.8.1). Решение этого
уравнения определяется в неявном виде:
V(xhx2,...,x„,u) = 0, где^*0. (10.8.5)
ди
Выражая частные производные в
(10.8.1), , / = 1,2,...,п, через
ьные функции (10.8.5), получим
дУ_
|р-||' / = ,-2 я. (10.8.6)
ди
В результате замены (10.8.6) уравнение
(10.8.1) принимает вид
Мчл-л^Ыч* *>%+-
... + Xn(xbx2l...,xn)— + Z{xbx2,...1xn)— = 0.
(10.8.7)
Уравнение (10.8.7) является линейным
однородным относительно неизвестной
функции V (х\,х2,...,хп,и). Данному уравнению
соответствует система уравнений
характеристик:
dx\
dx*>
Х\ (*ь*2>—>*л) Х2{хьхъ...,хп)
dx„
du
%п (х\,Х2>—>хп) Z(xhx2,...,x„)
(10.8.8)
Определение 10.8.5. Систему (10.8.8)
называют системой уравнений характеристик для
неоднородного линейного уравнения (10.8.1).
В соответствии с теоремой 10.8.1 решением
уравнения (10.8.7) является
^ = ф(У1>¥2> —>V/i)- Вследствие (10.8.5)
отсюда следует:
Теорема 10.8.2 ф(\|/|,\|/2,...,У„) = 0, где
ф — произвольная непрерывно
дифференцируемая функция, а \|/;- (Х\, х2,..., хп, и) = с,-,
/ = 1,2,...,/!, — совокупность п независимых
первых интегралов системы (10.8.8), является
общим решением уравнения (10.8.1).
10.8.2. Решение задачи Коши для
линейного уравнения.
Определение 10.8.6 Задача Коши для
линейного однородного уравнения (10.8.2)
формулируется так: найти решение и(х\,х2,...,хп)
уравнения (10.8.2), такое, чтобы
w(x|,x2,...,xrt_|,xwj = a(x,,x2,...,xw_,),
(10.8.9)
где хп - заданное число; a(X|,x2,...,xw_|) -
заданная (дифференцируемая) функция.
Для решения задачи Коши в систему
первых интегралов (10.8.4) системы уравне-
КВАЗИЛИНЕЙНОЕ ДИФФЕРЕНЦИАЛЬНОЕ УРАВНЕНИЕ
453
ний характеристик (10.8.3) уравнения (10.8.2)
подставим хп = хп ,
щ(х{,хъ...,хп_ьх°п) = щ
^2\хЬх2^->хп-Ьхп) = ^2 (Ю.8.10)
V/f-1 \ХЬ ХЪ • ■•»*л-1»хп ) = Vai-1 •
Разрешив данную систему относительно
Х\,Х2,...,хп_1, получим:
х{ =со1(\|/,,\|/2,...,\|/я_1)
х2=со2(\|/1,^7,...,^") (ю.8.11)
хп_{ =(0„_i(\|/,,\|/2,...,\|/AI_i)-
Теорема 10.8.3. Решением задачи Коши
(10.8.2), (10.8.9) является функция:
w(x,,x2,...,x/;) = a[co,(\|/l,\|/2,...,\|/w_1),
С02(У1,У2»-^а,-1)»-^а,-1(У1^2»-^а,-1)]»
(10.8.12)
где \|/,(х,,х2,...,х„), / = 1,2,..., л - 1, -
функции левой части совокупности п-1
независимых первых интегралов системы (10.8.4).
Определение 10.8.7. Задача Коши для
линейного неоднородного уравнения (10.8.1)
формулируется так: найти решение
и(хьх2,...,хп) уравнения (10.8.1), такое,
чтобы выполнялось условие (10.8.9).
Для решения задачи Коши в систему
первых интегралов у,- (х\,х2,...,хп,и) = q,
/ = 1,2,...,/!, системы уравнений
характеристик (10.8.8) уравнения (10.8.1) подставим
х =х° '
\|//(x,,x2,...,x/l_,,^,w) = \|//, / = 1,2,...,«.
(10.8.13)
Разрешив эту систему относительно
X|,x2,...,xn_\,u , получим:
х{ =со1(\|/1,\|/2,...,\|/л)
*2=Ю2(УЬУ2>-">Ч'Л)
_._ _ (10.8.14)
хп_{ =соя_,(\|/1,\|/2,...,\|/л)
« = ®ii(vi.V2.-.V/f).
Теорема 10.8.4. Решением задачи Коши
(10.8.1), (10.8.9) является функция
«[^(у,,^,...,^), сог^, \|/2,...,\|/„),...
(10.8.15)
где У,-(дсьдс2,...,дся,,1/), / = 1,2,...,/!,
функции левой части совокупности п
независимых первых интегралов системы (10.8.8).
10.8.3. Квазилинейное
дифференциальное уравнение.
Определение 10.8.8. Квазилинейным
дифференциальным уравнением с частными
производными первого порядка называют уравнение
вида
X{(xbx2i...,xn,u)-^-+X2(xbxb...,xn,u)^-+...
... + Xn(xbx2,...,xn,u)-^- = Z(xbx2,...1xniu),
dx„
(10.8.16)
где Xi(xl9x2,...9xn,u), / = 1,2,...,/2, и
Z (xbx2i...,xn,u) - заданные функции я+1
переменных xbx2,...,xn,u, непрерывно
дифференцируемые в некоторой области
Qe Rn+l\ u(xbx2,...,xn) - искомая
функция.
Как и в случае неоднородного
линейного дифференциального уравнения с
частными производными первого порядка,
решение уравнения (10.8.16) определяем в неявном
виде (10.8.5). С учетом (10.8.6) уравнение
(10.8.16) приводится к виду, аналогичному
(10.8.7):
дУ
.ЭК
Хх (хьх2,...,хп,и)— + Х2 (х,,х2,...9хП9")— + ... + ДГЯ (х,,х2,...,*„,//)— +
'Эх, ^ " ^ ' "' 'Эх2
+Z(xbx2,...,*„,к) —- = 0.
о//
Система уравнений характеристик для (10.8.17) имеет вид
Эх
•п (10.8.17)
dx\
dx7
dxn
du
Х](хьхъ...1хп,и) X2(xbx2,...,xn,u)
Хп(х{,хъ...,хп,и) Z(x{ix2,...,xn,u)
(10.8.18)
454
Глава 10.9. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
Определение 10.8.9. Систему (10.8.18)
называют системой уравнений характеристик для
квазилинейного уравнения (10.8.16).
В соответствии с теоремой 10.8.1
решением однородного уравнения (10.8.17)
является
Р = фОКь¥2»-.¥#|)-
Теорема 10.8.5. ф(уьУ2> —>Ул) = ° > где
ф - произвольная непрерывно
дифференцируемая функция, а \|// (xj, ^2,..., хп,и) = с,- ,
/ = 1,2,...,я, - совокупность п независимых
первых интегралов системы (10.8.18), является
общим решением уравнения (10.8.16).
10.8.4. Решение задачи Коши для
квазилинейного уравнения.
Определение 10.8.10. Задача Коши для
квазилинейного уравнения (10.8.16)
формулируется так: найти решение и(Х[,Х2,...,хп)
уравнения (10.8.16), такое, чтобы
выполнялось условие (10.8.9).
Задача Коши для квазилинейного
уравнения (10.8.16) решается по тому же
алгоритму (10.8.13)-( 10.8.14), как и решение задачи
Коши для линейного неоднородного
уравнения (10.8.1).
Теорема 10.8.6. Решением задачи Коши
(10.8.16), (10.8.9) является функция (10.8.15),
где \\fi(xbx2i...ixn,u), / = 1,2,...,л,
-функции левой части совокупности п независимых
первых интегралов \|/;-= с,, / = l,2,...,/i,
системы (10.8.18).
СПИСОК ЛИТЕРАТУРЫ
1. Агафонов С.А., Герман А.Д.,
Муратова Т.В. Дифференциальные уравнения. М.:
Изд. МВТУ, 1999.
2. Арнольд В.И. Обыкновенные
дифференциальные уравнения. М.: Наука, 1984.
3. Матвеев Н.М. Методы
интегрирования обыкновенных дифференциальных
уравнений. М.: Высшая школа, 1963.
4. Понтрягин Л.С. Обыкновенные
дифференциальные уравнения. М.: Наука, 1970.
5. Степанов В.В. Курс
дифференциальных уравнений. М.: ГИФМЛ, 1958.
6. Эльсгольц Л.Э. Дифференциальные
уравнения и вариационное исчисление. М.:
Наука, 1969.
Глава 10.9
АСИМПТОТИЧЕСКИЕ МЕТОДЫ
В ТЕОРИИ ОБЫКНОВЕННЫХ
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
10.9.1. Понятие асимптотического
ряда. Асимптотическим в окрестности точки
х = Xq называют по Пуанкаре ряд V ип (х),
члены которого ип (х), п = 0,1,2,...,
составляют асимптотическую последовательность,
ип+\ (х) л
т.е. при всех п lim / / = 0 (или
un+i (x) = °{ип (*)))• Любой степенной ряд
апх" с постоянными коэффициентами
0
ап является асимптотическим в окрестности
х = 0 . Асимптотические ряды могут быть
сходящимися по Коши в некотором
интервале |х| < р и расходящимися при любом
х*0.
Пусть некоторая функция /(/,е)
независимой переменной / и параметра е
представлена частичной суммой асимптотического
ряда с номером N , т.е.
/7=0
причем ||Л (/, е)| = о (г") для всех / е [0, Т].
Если этот ряд расходится по Коши при всех
е * 0, то точность аппроксимации функции
/(/,е) частичной суммой с заданным
номером N тем выше, чем меньше е . Вместе с
тем если значение е фиксировано и даже
достаточно мало, то с увеличением номера
N точность аппроксимации функции
/(/,е) не обязательно повышается; во
всяком случае, /?дг(/,е)^0 при N—> °°, и
разность между /(/,е) и N-vi частичной
суммой или неограниченно увеличивается,
или превышает некоторое число. Если же этот
ряд сходится по Коши при / е [0, Т], |е| < р,
то можно достигнуть при таких значениях /
и е сколь угодно точной аппроксимации
РЯДЫ ПУАНКАРЕ-ЛЯПУНОВА ПО СТЕПЕНЯМ МАЛОГО ПАРАМЕТРА
455
функции /(/,е) за счет увеличения номера
N частичной суммы.
10.9.2. Ряды по степеням независимой
переменной. Пусть задано уравнение
(скалярное)
/ = /(*, У) (Ю.9.1)
и пусть задано начальное условие
У (*0) = Уо • Пусть функция / (х, у)
обладает в окрестности точки х - Хц производными
любого порядка. Тогда решение у(х) пред-
ставимо рядом Тейлора по степеням х - Xq в
некотором интервале \х - х$\ < А :
Уо+^ап(х-хо)п,
п=[
(10.9.2)
<>п=У{")(хо)-
Достаточно длинная частичная сумма этого
ряда аппроксимирует достаточно точно
решение у(х) в интервале |х-Ло|<у4.
Практическая сторона проблемы заключается в
непосредственном нахождении коэффициентов
ап. Для этой цели разработаны
соответствующие методы.
1. Наиболее прямой путь — вычисление
производной у'(хо), равной /(*о».Уо)> и
остальных производных у (хц),
я = 2,3,..., после последовательного
дифференцирования правой части f(x,y)
исходного уравнения. Этот путь вполне реализуем в
случае простых уравнений, но в общем случае
приводит к весьма громоздким формулам.
2. Если функция f(x,y) разлагается в
ряд или полином по степеням х, у, то
применим метод неопределенных коэффициентов.
При подстановке ряда (10.9.2) в исходное
уравнение удается часто составить
рекуррентные формулы для вычисления любых
коэффициентов ап. Последовательные
вычисления этих коэффициентов (можно составить
программу вычисления на компьютере)
позволяют оценить радиус сходимости этих
рядов, равный пределу отношения f—4 .
Ь+1|
3. Стефенсоном, Бруком и другими
авторами [8] разработана методика построения
степенных рядов в задачах небесной
механики, опирающаяся на применение рядов и
операций Ли.
В случае линейных уравнений с
особыми точками применяется метод, известный
как метод Фробениуса [15]. Общий вид
уравнения я-го порядка с особой точкой х = 0
следующий:
+х"-2р2(х)у{"-2)+...
~ + xPn-\(x)y' + Pli{x)y>
где ру (*),...,/?„ (х) - степенные ряды или
полиномы по х. К этому типу принадлежит, в
частности, уравнение Бесселя порядка v :
У +-У +
х
2 ^
у = 0.
Ряд, представляющий решение этого
уравнения, имеет вид
у(х) = xw х
1-
2(2v + 2) 2-4(2v + 2)(2v + 4)
и он сходится при всех х > 0 , если v > 0 .
Имеются вместе с тем случаи, когда
такие ряды расходятся при всех х^О и
являются лишь асимптотическими. Например, для
решения уравнения х у" + (Зх - \)у' + у = 0
при начальных условиях у(0) = д/(0) = 1
получим ряд
расходящийся при всех х Ф 0 .
10.9.3. Ряды Пуанкаре-Ляпунова по
степеням малого параметра для решений
при заданных начальных условиях. Общий
метод построения может быть
проиллюстрирован на примере вещественного уравнения
1-го порядка:
§ = /(*.'.*).
(10.9.3)
где функция /(z,/,e) непрерывна по / и
разлагается в ряд по степеням Z и малого
параметра £ в некоторой области изменения
/,£,£.
456
Глава 10.9. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
Пусть известно решение этого
уравнения Zq (/) при е = 0 ; его называют
невозмущенным (в небесной механике) или
порождающим (по Пуанкаре). Составляют
уравнение для отклонения (возмущения) х = z - Zq :
^ = f(Zo(t) + xit,e)-f{zo(t)J,0)
(10.9.4)
или
dt
/7(/)х + (р(Г,е) + ЛГ(х,/,е),
(10.9.5)
где />(/) = /;(*о(/),/,0), ф(/,е)=/(^)(/),/,е)-
-/(^о(0»/»0) = £Ф1(0 + е2ф2(0— и Ф^-
ция X (х, /, е) представима в некоторой
области \х\ < /ft, |е| < £о , рядом по степеням х и
е , начинающимся с членов не ниже 2-го
порядка относительно х. Решение этого
уравнения ищется в виде ряда
х(/,е) = щ (/) + £2х2 (0 + ..., (Ю.9.6)
где все Xj (/) удовлетворяют нулевому
начальному условию Xj (0) = 0 . Подстановка
этого ряда в уравнение (10.9.5) приводит к
уравнениям:
dx\
1L-
dx
dt
= />(')*!+<Pl(')>
-J- = p(t)Xj+<Vj(t) + Xj, (10.9.7)
7 = 2,3,...
где Xj зависит в общем случае от
X|,x2,...,Xy_i . Из этих уравнений получим
формулу для последовательных вычислений:
t
xl{t) = JK{t1s)^(s)ds1
о
t
Xj(t) = JK(t,s)[4>j(s) + Xj]ds,
о
7 = 2,3,...,
где К(/,5) -функция Коши (см. п. 10.4.1).
Пуанкаре и Ляпунов доказали
сходимость в смысле Коши этого ряда к точному
решению исходного уравнения в некотором
интервале [О, Г] и при е , не превышающем по
абсолютной величине некоторой границы £* .
10.9.4. Ряды Пуанкаре-Ляпунова по
степеням малого параметра для
периодических решений. Изложим общий подход
Пуанкаре в применении к часто встречающимся
в прикладных задачах квазилинейным
уравнениям
^ = Az + (p(t) + eF(Zit)i (10.9.8.)
где А — постоянная матрица размера пхп ,
функция ф(/) кусочно-непрерывная и 2л -
периодическая по / , функция F(z,t) имеет
тот же характер по / и разлагается в ряд по
степеням компонент вектора z в некоторой
области.
В методе Пуанкаре выделены:
нерезонансный (некритический) случай и
резонансные (критические) случаи.
Некритический случай. В этом случае
матрица А не имеет нулевых и мнимых
собственных значений, равных ±ki, к — целое
число; следовательно, уравнение (10.9.8) при
е = 0 , т.е. уравнение
f = ^ + <р(0
(10.9.9)
имеет единственное 2л -периодическое
(порождающее) решение Zq (/) при
произвольный кусочно-непрерывной функции
ф(/). Для отклонения (возмущения)
X = z - Zq имеем
— = Ax + £F(zo+x,t). (10.9.I0)
dt
Предполагается, что функцию
F (Zq + xj) можно разложить в ряд по
степеням компонент вектора х в некоторой
области |х| < М . Положив
x = x{t,t) = ^E"x„(t), (10.9.11)
1
получим для членов этого ряда уравнения:
dX:
^ = Axt+F(zo,t),
-jj- = Axj + Xjfa.^xj -\,t),
7 = 2,3,...
(10.9.12)
РЯДЫ ПУАНКАРЕ-ЛЯПУНОВА ДЛЯ ПЕРИОДИЧЕСКИХ РЕШЕНИЙ
457
Из этих уравнений находят последовательно
единственные 2л -периодические решения
2л
xt(t)= fnG(t,s)F(zo(s),s)ds,
о
2л
Xj(t)= fnG(t,s)XJ(xl(s),...,s)ds,
о
(10.9.13)
где G(t,s) - функция Грина (см. п. 10.4.1).
Если все собственные значения матрицы А
имеют только положительные или только
отрицательные вещественные части, то вместо
(10.9.13) применяют более простые формулы
t
*.(')= \ eA('-s)F{zo(s),s), ...(10.9.14)
±оо
Критические (резонансные) случаи.
В этих случаях среди собственных
значений матрицы А имеются критические, т.е.
равные нулю или ±ki, к — целое число.
Тогда система (10.9.9) для порождающих
решений обладает семейством 2л -
периодических решений Zq {UC), зависящим
от произвольного постоянного вектора С,
если функция <р(/) удовлетворяет
соответствующему условию; от этого вектора зависит
также правая часть системы (10.9.10). Как
правило, эта система не обладает 2л -
периодическим решением при любом векторе
С. Вместе с 2л -периодическим решением
х(/,е) в виде ряда (10.9.11) по степеням е
ищется также соответствующий вектор
С = С(г) в виде аналогичного ряда. При
этом возможны различные ситуации, для
которых составлена определенная
классификация.
Критический случай 1-го порядка
является основным. В этом случае уже при
анализе уравнения для первого элемента Х| (/)
ряда (10.9.11) устанавливается, что или а)
существует вектор С(е), которому
соответствует 2л-периодическое решение х(/,е) в
виде ряда (10.9.11), или б) таких векторов нет,
т.е. система (10.9.10) не обладает искомым
решением х(/,е).
Чтобы избежать сложных формул,
рассмотрим вместо (10.9.8) скалярное уравнение
* = ф(/)+ е/(*,/) (10.9.15)
с функциями ф (/),/(£,/) того же характера,
что и в уравнении (10.9.8). Используем в
дальнейшем обозначение [ф(0]п ДЛЯ
постоянной части и (У(0]*> [^(0]jfc ДЛЯ ко~
эффициентов при cos kt, sin kt в полиноме
Фурье для любой функции у (/).
При е = 0 получим 2л -периодическое
решение, если [^(Olo^' B виде
Zq (/, С) = С + z (/), где С - произвольная
постоянная, играющая роль периодического
решения однородного уравнения z = 0, а
z(t) определяется после двукратного
интегрирования функции ф(/).
Уравнения для возмущения
х = z- Zo(t,C) и для JC| (/) имеют вид:
* = «/(«,(/,C) + x,/) = ex
xf/^c))*/^^))**...],
5с, =/(*Ь(/,С),/). (Ю.9.17)
Условие существования периодического
решения Х\ (/) представляет собой
алгебраическое уравнение относительно С:
Фо(С)»[/Ы'>с).')]о=0- (10-918)
Справедлив следующий результат [7, 11J:
а) если уравнение (10.9.18) имеет так
называемый "простой" корень, т.е. такой, что
Ф'(С0)*0, (10.9.19)
то при значениях |е|, не превышающих
некоторой границы £*, этому вектору С$
соответствует единственное 2л -периодическое
решение уравнения (10.9.16) в виде ряда
(10.9.11);
б) если уравнение (10.9.18) не имеет
вещественных корней, то уравнение (10.9.16) не
имеет таких 2л -периодических решений.
Доказано, что в случае а) можно найти
последовательно члены ряда С(е) = С() +
+С|£ + С2е + ... и члены ряда для x(t,e).
Критические случаи высших порядков
имеют место тогда, когда условие (10.9.19) не
458
Глава 10.9. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
выполняется, т.е. когда Ф'(Со) = 0 или когда
уравнение (10.9.18) удовлетворяется при
произвольной постоянной С. Уравнения и
формулы для построения периодических решений
рассмотрены в [4, 7, 10].
10.9.5. Итерационный вариант метода
малого параметра Пуанкаре-Ляпунова.
Метод последовательных приближений при
построении периодических решений был
применен впервые Лихтенштейном [7]. Этот
метод представляет собой итерационный
вариант метода рядов Пуанкаре-Ляпунова.
Более систематически он изложен в [11], а его
развитию на основе методов Ляпунова
посвящена работа [7].
Сравнивая метод рядов и метод
итераций, заметим, что ряды предназначены
прежде всего для построения приближенных
периодических решений с помощью
вычисления нескольких первых членов рядов. Эти
решения не претендуют на высокую точность,
но они строятся, как правило, в буквенном
виде, что существенно для качественного
анализа исследуемой задачи. Вместе с тем
достижение высокой точности решения связано
обычно с вычислением большого количества
членов рядов и, естественно, с большими
техническими трудностями. В рамках
итерационного варианта алгоритмы более
компактны и ориентированы на вычисление сколь
угодно далеких приближений по
рекуррентной процедуре. Это позволяет получить при
условии сходимости процесса приближенное
решение, сколь угодно близкое к точному
решению, а также оценить область значений
е , при которых данный процесс практически
сходится.
Некритический случай. В качестве
исходной рассмотрим систему (10.9.8), а для
решения Zq (t) и для возмущения *(/, е)
рассмотрим уравнения (10.9.9) и (10.9.10).
Периодическое решение периода 2л ищется с
помощью последовательных приближений
х,(/,е), у = 1,2,..., в которые входит явно
е. Для 1-го приближения Xj(/,e) имеем
уравнение
и формулу, аналогичную первой из (10.9.13).
Уравнения для последующих приближений
Xj (/, е), у > 2 , следующие:
dt
-~jj- = Axj+ eF(zo {t) + Xj_{ (/,e),f),
(10.9.21)
из которых последовательно находят
Xj (/,£) =
= zJG(t,s)F(zo(s) + xJ_l(s,e),s)ds,
о
у = 2,3,...
(10.9.22)
Критический случай 1-го порядка.
Рассмотрим уравнение (10.9.15). Для семейства
порождающих решений имеем формулу
Zq (t,C) = C + z (/)• Для возмущения х(/,е)
имеем уравнение (10.9.16). Пусть найден
"простой корень" Q уравнения (10.9.18) и
определено порождающее решение
Zo(t) = Zq (/,Q). Положим в исходном
уравнении z = Zo(t) + q + x, где q = q(z) —
искомая постоянная и х = х(/,е) - искомая
периодическая функция, не содержащая в
своем разложении Фурье постоянной части,
т.е. периодического решения однородного
уравнения х = 0 . Для Зс(/,е) получим
уравнение
x=e[\|/(/) + /?(/)(^ + 3c) + 9t(^ + 3c,/)],
(10.9.23)
где функции \|/(/) = /(^о (/),/), p(t) = f^x
xf^o(/),/J целиком определены, а
разложение функции R(q + Jc,/) не содержит членов
ниже 2-го порядка относительно q и х .
Данное уравнение эквивалентно на множестве
2л -периодических решений интегральному
уравнению
^L = Ax^eF(zo (0>0 (10-9-2°)
2л
х(t,e) = е j g(t,s)[y(s) + p(s)(q + x(s,e)) + R(q + x,sj]ds,
(10.9.24)
где g(t,s) — обобщенная функция Грина, равная в данном случае
ЧИСЛЕННО-АНАЛИТИЧЕСКИЕ ИТЕРАЦИИ
459
g(t,s)-
('~S)2? °-5<''
«->(£-}
/ < s < 2л
(10.9.25)
и реализующая двукратное интегрирование
полинома Фурье без постоянной части. Так
[Ф(0]о=[/(^(').')]0=0>
И')]о=[л'(М')>')]0*0' то условие
периодичности х(/,е) имеет вид
фЫ = [р(0]0«+[*(« + г,/)]0 = о
(10.9.26)
и представляет собой при заданной функции
х(/,е) уравнение для постоянной q = q(e).
Из этого уравнения и интегрального
уравнения (10.9.24) можно найти 2л -
периодическую функцию Зс(/, е) и
постоянную q = q{t) с помощью последовательных
приближений <7у (с), */ (/, е), у = 1,2,...
В тех или иных случаях могут быть
использованы варианты приведенного алгоритма.
Автономные системы. Анализ таких
систем с точки зрения построения
периодических решений близок к анализу
неавтономных систем в критических случаях. Но он
отличается прежде всего тем, что приходится
дополнительно определять период искомого
решения, зависящего от параметра е .
Рассмотрим, например, уравнение Ван-дер Поля
Z + Z = t(\-Z2)t \ =^\ ("0.9.27)
Период искомого решения неизвестен;
поэтому вводится новая независимая переменная
0 по формуле / - (1 + /*)0 , где h = h(e) -
неизвестная постоянная, зависящая от е и
равная нулю при £ = 0 . Приходим к
уравнению
z' + (l+b?z = e(\ + h)(\-z2)z; (' = ^j
(10.9.28)
Порождающее периодическое решение равно
2о =<7COS0, где q — произвольная
постоянная. Для возмущения х = z - Zq получим
уравнение
х" +* = /(*, х'Л?,0), (10.9.29)
где правая часть представлена полиномом по
х,х\ h,q, 0 с коэффициентами периода 2л
по 0. По существу, так же, как в
предыдущем случае, ищем 2л -периодическую
функцию х(/,е), не содержащую в своем
разложении Фурье первую гармонику, и
постоянные И (е), q (e), при которых такая функция
существует, с помощью последовательных
приближений Xj (/,е), hj (е), qj (е). Для
них составляется рекуррентная процедура.
Единственной относительно громоздкой
операцией на каждом шаге является разложение в
полином Фурье функции / (х, х', Л, q, 0) при
подстановке вместо х соответствующего
приближения х,(/,е), являющегося в свою
очередь полиномом Фурье. Эту операцию можно
реализовать с помощью ЭВМ (см. ниже).
10.9.6. Численно-аналитические
итерации. Построение решений с помощью
асимптотических методов ориентировалось до
сравнительно недавнего времени прежде всего
на алгебраические выкладки вручную и лишь
на некоторые вспомогательные вычисления
на малых компьютерах. Это значительно
сужало роль асимптотических методов, так как
часто объем выкладок слишком велик. Первая
работа [9] по применению больших
компьютеров для построения приближенных
аналитических решений в виде рядов опубликована в
1959 г. французским астрономом Ж. Ковалевски.
В дальнейшем это направление интенсивно
развивалось [7, 10, 14]. Мы опишем здесь
один из самых простых вариантов этих
методов в применении к построению
периодических решений.
Некритический случай. Пусть дана
система уравнений вида
^Ц Л*+ <p(/) + eF(*,/), (10.9.29)
где постоянная матрица А не имеет
критических собственных значений, ф(/) - полином
Фурье по cos/:/, sin/:/, функция F(zj) ~
такой же полином по / и алгебраический
полином по z , так что
N
F(z,t) = £ В% (z)cos*/ + Cl (z)sinkt,
(10.9.30)
460
Глава 10.9. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
где B%(z),Ck(z) - полиномы некоторых
степеней относительно компонент вектора z .
Порождающее решение Zq (t) и
приближения Zj (t, e) определяются уравнениями
компьютерные программы. После определе-
*
^ = *ь + ф(0.
-jj- = AZj+y(t) + £F(zj-bt), (10.9.31)
у = 1,2,3,...,
и все эти приближения представимы
полиномами Фурье различных порядков. Пусть
фиксировано некоторое значение е . Тогда в
пределе (при j —> ©о ) получим теоретически
(при условии, что при данном е процесс
сходится) бесконечный ряд Фурье. С
некоторой точностью z(t) выразится полиномом
Фурье соответствующего порядка. Поэтому
можно все приближения определять как
полиномы Фурье одного и того же достаточно
большого порядка N (точнее, порядка не
выше N). Пусть получено некоторое
(у - 1) -е приближение
JV
Z/_i (0=2 Мк COS Ш + Е1
U-l)n™irtM f(j-{) sinkt.
k=0
(10.9.32)
Подстановка этого полинома в полином
(10.9.30) приводит после выполнения
соответствующих операций к полиному
JV
F(zj-\ (0,0 = X Bk coskt + HJhmkt.
к=0
Для этих операций имеются стандартные
коэффициентов В\ , Q '
можем вы-
НИЯ кизффицисши» и и , v^^.
числить коэффициенты Фурье для
следующего приближения Zj (0 по достаточно
простым формулам. Таким образом, если заданы
коэффициенты Фурье 2?# , Ск для функции
F (zj), то последовательно вычисляются по
рекуррентной процедуре последующие
коэффициенты:
Счет прекращается, если разности между
всеми соответствующими коэффициентами двух
соседних приближений по абсолютной
величине или сумма модулей этих разностей меньше
некоторой заданной погрешности А . Процесс
вычисления может не сходиться, если
выбранное значение е превышает границу области
сходимости или если заданный порядок N
полиномов Фурье для всех приближений
слишком мал. Тогда следует повторить
вычисления с новыми значениями N и е .
Пример. Рассмотрим уравнение типа
Дюффинга
Z + Z = -£Z3 + A, sin со/, X = 0,2,
(10.9.33)
при различных е и со. Ищем решение в
виде
7
*(0 = £^2*-1 sin (2*-l)/,
1
ограничиваясь гармониками не выше 13-го
порядка и принимая допустимую
погрешность коэффициентов А = 10~ . Результаты
при е = 3,75 следующие:
со
п
Л/,
Л/3
М5
М7
м9
Ми
Л/,з
0,60
37
0,245449
-7310
167
-4
0
0
0
0,50
15
0,222917
-10756
317
-11
0
0
0
0,40
11
0,202563
-39649
1952
-184
15
-1
0
0,38
24
0,186473
-102966
6754
-1204
195
-25
4
0,37
Расходимость
ЧИСЛЕННО-АНАЛИТИЧЕСКИЕ ИТЕРАЦИИ
461
В таблице п — число итераций, после
которых достигнута заданная точность
коэффициентов. Расходимость процесса при
со = 0,37 , а также большое число итераций
при со = 0,60 обусловлено близостью со к
резонансным значениям со = 1/3 и (О = 2/3 .
При таких значениях со и близких к ним
следует проводить вычисления по формулам
для критических случаев.
Вполне возможно усложнить структуру
искомого решения, сохранив е как
буквенный параметр. В настоящее время
разработаны специальные программы для операций не
только с обычными рядами (полиномами)
Фурье, но и с так называемыми полиномами
Пуассона [22]:
14!::;*:^-^Г(*1ф.+-^лфл),
причем предусматривается т $ 10, п < 6 .
Критические случаи. Алгоритм для
построения периодических решений
составляется аналогичным образом, но он усложняется
вследствие необходимости дополнительно
учитывать соотношения вида (10.9.26).
Пример. Ищется функция Матье
CeQ (t) , представляющая периодическое
решение z (t, e) уравнения
Z: + (а + е cos 2t) z = 0 ; одновременно ищется
постоянная а = а(г), такая, что я(0) = 0 , и
называемая собственным значением этой
функции. Для коэффициентов полинома
Фурье
z(t,e) = 1 + М{ cos2/ + M2cos4t + ...
(10.9.34)
и для постоянной а = а (е) имеют место
соотношения
a = \+h, h = --Mb М,=!(2 + 2Ш,+Л/2)
2 8
о
Мк =T72(Mk-\+2hMk + Mk+[), fc = 2,3,...,
ok
(10.9.35)
на основании которых можно составить
алгоритм для вычисления итераций hj, M^J',
У = 1,2,3,...
В работе [7] приведен ряд более
сложных примеров, включая автономные
уравнения.
Итерации с ускоренной сходимостью.
Приведенный выше метод называют методом
простых итераций, и он обладает
сходимостью, типичной для рядов по степеням е .
Однако можно применить итерации с
квадратичной сходимостью, характерной для
известных итераций Ньютона.
Запишем уравнения (10.9.10) в виде
dx
— = Ax + eX(x,t). (10.9.36)
dt
Пусть имеет место некритический случай, а
функция X (х, t) представима алгебраически -
тригонометрическим полиномом по х, t вида
(10.9.30). Определим приближение Xj(t,e)y
j = 1,2,... (jc0 = 0) как периодические
решения уравнений
dx
-J- = [A + eX'x{xj_ht)]xj +
+е[Х (xj_ut)- X'x(xj_bt)xj_{].
(10.9.37)
На каждом шаге имеем при фиксированном
е систему вида
dx
-jL = (A + p(t))y + q>(t), (10.9.38)
где p(t),(p(t) - полиномы Фурье. Ищем
периодическое решение y(t) в виде
полинома Фурье, ограничиваясь некоторым
порядком N . Коэффициенты этого полинома
ищутся из соответствующей системы
линейных алгебраических уравнений. Для
процедуры составления матрицы этих уравнений
составляется компьютерная программа.
Доказано, что ||xi || ~ е, |дс2 — JC||| ~ e ,
||х3-х2|~е7...
В критических случаях и в случаях
автономных уравнений к неизвестным
коэффициентам Фурье добавляются неизвестные
постоянные, входящие в порождающее решение и
в формулу для периода искомого решения. На
каждом шаге опять получим систему
линейных алгебраических уравнений относительно
коэффициентов Фурье и этих постоянных.
Ряд примеров приведен в [7].
Изложенный численно-аналитический
метод заключается в использовании
компьютеров при реализации итерационных
процессов, для которых составлены аналитические
алгоритмы и которые сходятся по Коши к
462
Глава 10.9. АСИМПТОТИЧЕСКИЕ МЕТОДЫ
точным решениям, если выполняются
определенные условия. В настоящее время
имеется также другое направление (вполне
эффективное) численно-аналитических методов,
которое сочетает аналитические алгоритмы и
чисто численные процедуры, применяемые в
вычислительной математике [14].
10.9.7. Асимптотические методы,
основанные на усреднении. Подробное
изложение этих методов имеется в [2, 3, 5-7, 9].
Основные типы уравнений, к которым эти
методы применяются, следующие:
1. Системы в так называемой
стандартной форме
dx
— = eX(x,t), (10.9.39)
где х — вектор, X (х, t) — векторная
функция, периодическая или условно-
периодическая по / , дифференцируемая по
х; параметр е принимается
неотрицательным. Во многих задачах X (х, /) —
алгебраически-тригонометрический полином
(однократный или многократный) по х, t :
N
X(x,t) =^Bk (jc)cos kt + Ск (x)sin kt,
(10.9.40)
или
X(xj) = ^Bk(x)ca>(k,(u)j + Ck(x)sin(k,(u),t,
(10.9.41)
где Вк(х),Ск(х) — алгебраические
полиномы относительно компонент вектора дс, во
второй формуле к = (к\,...,km) -
целочисленный вектор, ю = ((0i,...,(0w) -
постоянный вектор с вещественными компонентами,
(к,(й) = к{щ +... + кта>т.
2. Многочастотные системы с быстро
вращающимися фазами
-^ = е* (*,>>), -^ = ^ + еУ (*,>>),
(10.9.42)
где х = (Х[,...,хп) — вектор медленных
позиционных переменных, у - быстрая угловая
переменная, в общем случае векторная,
У = (У\>->Ут)> вектор Х = (Х{,...,Хт) или
постоянный, или зависящий от дс, функции
X, Y представлены кратными полиномами
Фурье вида (10.9.41) по у. В частном случае
у — скалярная угловая переменная, X —
скаляр; тогда имеем систему с одной
вращающейся фазой.
Среди многочастотных систем вида
(10.9.42) выделяют: а) нерезонансные
системы, когда компоненты постоянного вектора
X далеки от соизмеримости; б) резонансные
системы, когда компоненты (А,],...Дт)
вектора X рационально соизмеримы или близко
соизмеримы, т.е. когда существуют
целочисленные векторы A:j\...,А:^ , такие, что
величина к[Х + + ... + кщХт равна нулю или
близка к нулю; в) системы, проходящие через
резонанс; для таких систем компоненты
переменного вектора Х[х) становятся
соизмеримыми или близко соизмеримыми в
процессе изменения х.
Мы остановимся ниже на анализе
системы (10.9.39) с правой частью (10.9.40).
В качестве исходного приближения к
решению системы (10.9.39) выбирают
решение £ = £0(/,е) усредненного по /
уравнения
(10.9.43)
Решение £0 (/, е) играет важную роль и
позволяет аппроксимировать решение x(t,e)
исходной системы с достаточной точностью,
по крайней мере, при достаточно малых е и
на некотором интервале 0 < / < Т , причем
т~уе.
В случае когда решение £о (/, е)
равномерно асимптотически устойчиво, близость
решений дс(/,е) и J^o(f,e) гарантируется на
бесконечном интервале времени.
Дальнейшие приближения находят
путем построения последовательности
$о(/,е) + е11,($о,*),
^1 (Ле) + eii! (^i,0 + e "2 (^1.0
(10.9.44)
члены которой принимают за
последовательные после £о (/, е) приближения
Xj (t,z), j' > 1, к искомому решению. Функ-
СПИСОК ЛИТЕРАТУРЫ
463
ции щ fat),и2 fa0»— аргументов £, t во
всех этих приближениях одни и те же, а
функции £y(f,e), у > 1 удовлетворяют
каждая своему дифференциальному уравнению. А
именно, функции j/j (£,г),м2 (£,г),... в
каждом приближении дСу(/,£) подбираются так,
что функция £,(/,е) удовлетворяет системе
уравнений вида
^ = tX0^) + ^X{fa) + ... + ^Xj_xfa),
(10.9.45)
и вместе с тем X; (г, е) удовлетворяет
исходному уравнению (10.9.39) с точностью до
членов порядка еJ .
Обычно рассматривают выражение для
Xj (г,е), записанное без индекса j ,
х = £ + eu{fat) + ... + ejUj fat)
(10.9.46)
как формулу для замены переменной х —> £
и именно такой замены, что при
соответствующем выборе функций W| fat),и2 fat),...
система уравнений для новой переменной £
имеет вид (10.9.45). Выбор функций и{,и2,...
при этом неоднозначен. Один из способов
такого выбора следующий: подставляем
(10.9.46) в исходное уравнение (10.9.39),
разлагаем правую часть X (х, t) по степеням е
и приравниваем справа и слева члены при
одинаковых степенях е . Получаем
соотношения, откуда:
X0(^)=jXfat)dt,
о
t
И|&') = Я*(Ь')-*о($)]*,
о
u2fat) = \^fat)-^X0^)-X^^t
(10.9.47)
и т.д.
Многочисленные примеры см. в [3, 5, 6].
СПИСОК ЛИТЕРАТУРЫ
1. Андронов А.А. Собрание трудов. М.:
Изд. АН СССР, 1956.
2. Боголюбов Н.Н. О некоторых
статистических методах в математической физике.
Изд. АН УССР, 1945.
3. Боголюбов Н.Н., Митропольский Ю.А.
Асимптотические методы в теории
нелинейных колебаний. М.: Физматгиз, 1963.
4. Вайнберг М.М., Треногий В.А. Теория
ветвления нелинейных уравнений. М.: Наука,
1969.
5. Волосов В.М., Моргунов Б.И. Метод
осреднения в теории нелинейно-
колебательных систем. М.: Наука, 1979.
6. Гребеников Е.А. Методы усреднения в
прикладных задачах. М.: Наука, 1986.
7. Гребеников Е.А., Рябов Ю.А.
Конструктивные методы анализа нелинейных
систем. М.: Наука, 1979.
8. Джакалья Г.Е.О. Методы теории
возмущений для нелинейных систем: Пер. с
англ. М.: Наука, 1979.
9. Крылов Н.М., Боголюбов Н.Н.
Введение в нелинейную механику. М.: Изд. АН
СССР, 1937.
10. Лика Д.К., Рябов Ю.А. Методы
итераций и мажорирующие уравнения Ляпунова
в теории нелинейных колебаний. Кишинев:
Штиинца, 1974.
11. Малкин И.Г. Некоторые задачи
теории нелинейных колебаний. М.: Гостехиздат,
1956.
12. Мандельштам Л.И., Папалекси Н.Д.
Новые исследования нелинейных колебаний.
М.: Гостехиздат, 1936.
13. Папалекси Н.Д. Собрание трудов. М.:
Изд. АН СССР, 1948.
14. Самойленко A.M., Ронто Н.И.
Численно-аналитические методы исследования
решения краевых задач. Киев: Наукова
Думка, 1986.
15. Хартман Ф. Обыкновенные
дифференциальные уравнения: Пер. с англ. М.:
Мир, 1970. 720 с.
Раздел 11
ИНТЕГРАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ
И ОПЕРАЦИОННОЕ ИСЧИСЛЕНИЕ
Глава 11.1
ОБЩИЕ ПОЛОЖЕНИЯ
Пусть функция К(х,р) определена на
множестве (а,Ь)хР, где (а,Ь)
—ограниченный или неограниченный интервал
действительной оси, а Р — некоторое множество
изменения параметра, в общем случае
являющееся множеством комплексных чисел,
т.е. Р е С . Интеграл
b
B[u](p) = JK(x,p)u(x)dx (ll.l.l)
о
определяет линейное преобразование, которое
отображает функцию и(х) , определенную на
интервале (а,Ь), в некоторую функцию
U(p) - В[и](р), определенную на множестве
Р. Такое преобразование называют
интегральным. Функцию К{х,р) называют ядром
интегрального преобразования. Множество
функций и(х), для которых интеграл (11.1.1)
определен для каждого ре Р , образует
линейное пространство, называемое
пространством оригиналов, а соответствующее ему
линейное пространство образов В[и]
называют пространством изображений.
Понятие интегрального преобразования
без труда переносится на случай многих
переменных. Функции многих переменных
могут быть объектом одномерного интегрального
преобразования. Пусть функция и(х\,...,хп)
определена в области я-мерного пространства,
причем пределы изменения переменной хк
не зависят от остальных переменных и
представляют собой интервал (а,Ь). Тогда все
переменные, кроме хк , можно рассматривать
как параметры, и мы, применив формулу
(11.1.1), получим в качестве изображения
функцию U(xi,...,xk_i9p9xk+{,...9x„), у
которой переменная хк заменена на новую
переменную р . В данном случае говорят об
интегральном преобразовании функции
многих переменных пох^ . Еще раз повторим,
что необходимым условием применения
интегрального преобразования по одной
переменной к функции многих переменных
является независимость области изменения
указанной переменной от остальных.
Главная идея метода интегральных
преобразований состоит в следующем. При
помощи интегрального преобразования
дифференциальный или интегральный оператор
преобразуется в оператор в пространстве
изображений. Поставленная задача решается в
пространстве изображений, и тем самым
находится изображение искомого решения.
Решение восстанавливается по найденному
изображению.
Реализация изложенной идеи требует,
во-первых, чтобы оператор в пространстве
изображений имел простой вид,
позволяющий решить задачу в изображениях. Во-
вторых, интегральное преобразование на
пространстве оригиналов должно быть
обратимым, т.е. разным оригиналам должны
соответствовать и разные изображения. При этом
для практических целей необходимо также,
чтобы обратное преобразование, по
изображению восстанавливающее оригинал, было в
каком-то смысле непрерывным, т.е.
незначительное изменение изображения не должно
приводить к радикальному изменению оригинала.
ИНТЕГРАЛЬНОЕ ПРЕОБРАЗОВАНИЕ ДЛЯ ОПЕРАТОРА 2-ГО ПОРЯДКА
465
Пример 11.1.1. Рассмотрим пространство
L [а,Ь] и полную ортонормированную
систему функций Кп(х) в нем. Эта система
может трактоваться как функция двух
переменных, Кп(х) = К(х,п), определенная на
[fl,£]xN . Преобразование
b
U(h) = \K(x,n)u(x)dx (11.1.2)
а
приводит к функции U(ri) натурального
аргумента, представляющей собой
последовательность коэффициентов Фурье для
разложения и(х) по системе функций {Кп(х)].
Если [Кп(х)} — ортонормированная система
собственных функций оператора Штурма —
Лиувилля L с собственными значениями Хп,
то преобразование (11.1.2) переводит оператор
L, действующий в пространстве оригиналов,
в оператор L в пространстве изображений.
Оператор L имеет простой вид: L[U(n)] =
= \nU(ri) . Таким образом, действие
оператора L состоит в умножении изображения на
известную функцию.
Рассмотренный пример показывает, что
разложение функций по собственным
функциям в задаче Штурма — Лиувилля можно
интерпретировать как специальный вид
интегрального преобразования.
Для каждого линейного оператора,
действующего на функциональном пространстве,
необходимо свое упрощающее интегральное
преобразование. Поиск такого интегрального
преобразования может быть задачей не менее
сложной, чем исходная. Однако в некоторых
случаях метод интегрального преобразования
оказывается весьма эффективным.
11.1.1. Интегральное преобразование
для линейного дифференциального
оператора 2-го порядка. Чтобы проиллюстрировать,
как для заданного линейного оператора можно
построить упрощающее интегральное
преобразование, рассмотрим случай линейного
дифференциального оператора 2-го порядка. Пусть
задано линейное дифференциальное уравнение
в частных производных 2-го порядка
У У а-Ах) + У ЬАх)— +
j=\ i=\ i j i=\ i
+c(x)u(x) = /(x), (11.1.3)
где x = (xj... xn) e G cR" . Предположим,
что выполнены следующие условия:
1) для некоторого фиксированного
индекса к переменная хк может меняться в
интервале (а,Ь) независимо от значений
других переменных, т.е. область G имеет вид
C = (fl,A)xCb;
2) akj(x) = ajk{x) = О при j]Ф к всюду
в G;
3) коэффициенты ау(х) при ij*k и
коэффициенты £,(х) при / Ф к не зависят от
хк'>
4) акк(х) и Ьк{х) зависят только от
переменной хк ;
5) функция с(х) представима в виде
с(х) = Cq(x) + ск(хк), причем с0(х) не
зависит от хк .
Если выполнены все эти условия, мы
будем говорить, что переменные
у = (х{,...,хк_ьхк+ь...,хп) и хк
разделились. Обозначив оператор в левой части
(11.1.3) через Ци], получим
Дк] = А)М + 4М> (Н.1.4)
где
кМ = <>кк К)т4 + h (xk)-^- 4- ск (хк)и,
дХк °хк
j*ki*k aXl° J
Г-* ЭХ;
i*k l
Оператор Lq действует в области
Gq с R"-1, причем хк выступает как
параметр, от которого не зависят ни
коэффициенты оператора Lq , ни область определения
функций, к которым применяется этот
оператор. Аналогично оператор Lk действует на
интервале (а,Ь), его коэффициенты не
зависят от блока переменных у, которые можно
рассматривать как параметры.
В дальнейшем для упрощения выкладок
мы будем считать, что к = 1 и соответственно
466
Глава 11.1. ОБЩИЕ ПОЛОЖЕНИЯ
у = (*2, ...,xn), что, впрочем, не
ограничивает общности рассуждений. Интегральное
преобразование, упрощающее оператор L , будем
искать в виде
b
U(p,y) = В[и](р, у) = j и(хх, у)К{хх ,р)р(хх )dxx,
(11.1.5)
где К{х\,р) и p(*i) — неизвестные пока
функции, для которых интегралы
\
dxfiXj
(xx,y)K(xx,p)p{xx)dxx , i,j = \,n\
(11.1.6)
|^(*ь.и)*(*ь/0р(*1)л1> / = 1,л;
Эх,-
J^l,jO*(*b/>)p(*l)rf*l (И.1.8)
сходятся равномерно, а их подынтегральные
выражения являются непрерывными
функциями. Уравнение (11.1.3) может быть
записано в виде
Lo[u](x) + Lk[u](x) = f(x), xeG.
(11.1.9)
Применим к уравнению (11.1.9)
оператор В, определяемый равенством (11.1.5). В
силу линейности В получаем
В1<\иХ +ВЦ[и\ = B[f].
Введем обозначения В[и] = U, B[f] = F
для изображений функций и(хх,у) и
/(Х\>У) ' определенных в G czRn . Исходя из
ВЦ[и] =
(11.1.7) определения операторов Lq и L\ , получаем
ди
д2и
\j-2i=2 ' J i-2 ' J
+ с0(у)В[и].
j=2i=2
d2U
oXjOX;
J /=2
Эдс,-
Так как применение оператора В свя- оператор интегрального преобразования В
зано с интегрированием по переменной хх , в можно определить при помощи скалярного
произведения с весом р :
то время как частные производные берутся по
другим переменным, заключаем согласно
предположению о равномерной сходимости
интегралов (11.1.6) - (11.1.8), что
ди
дХ;
(p,y)=Y-ju(x\>y)K(xi>P)p(x\)dxi=
OX; dXj
в
Поэтому
дги
dxfiXj
-В[и
д2и
dXjXj dXjdXj
B[U) = (U,K(;P))
(в данном случае р рассматривается как
параметр). Если вес р удовлетворяет
дифференциальному уравнению
(яиР)'-% = 0
и, следовательно, имеет вид
p^expH^'^'W
,( -ffliifL
(*i)
ВЦ[и)=ЦВ\и] = Lo[U].
то оператор Lx относительно указанного
скалярного произведения будет самосопря-
Оператор Lx (11.1.4) представляет собой женным в линейном пространстве Q всех
линейный дифференциальный оператор 2-го функций у(х)е С^\а,Ь\, удовлетворяющих
порядка по переменной хх , в то же время однородным граничным условиям
ИНТЕГРАЛЬНОЕ ПРЕОБРАЗОВАНИЕ НА ОТРЕЗКЕ
467
ai/(a)-p|y(a) = 0,
а2у'(Ь) + $2у(Ь) = 0.
В этом случае
BL1[U] = (L1[U],K(;P)) =
= («,11^(-,р))-/,(х1)И/[М;^(,р)]|*)
где p{xi) = au(xl)p(xl), a W[yx;y2] -
определитель Вронского двух функций У\(х)
и У2(х) • Дополнительное слагаемое
N(b) - N(a) = p(bW[u(;y);K(;p)](b) -
-р(а)Щи(;у);К(,р)](а)
в полученной формуле появилось потому, что
функции и(-,у) и К(,р) могут не попадать в
пространство Q , т.е. удовлетворять
однородным граничным условиям по переменной Ху.
Потребуем, чтобы ядро К(ху,р)
интегрального преобразования В удовлетворяло
уравнению L\ [К(•,/?)] = -р К(,р) или
Ху коэффициентов, а вторая не содержит
производных по переменным дс,, j > 2 , и
представляет собой условия на концах интервала
(а,Ь);
2) если граничные условия первой
группы содержат операторы дифференцирования
по переменным Xj , j> 2 , то порядок
применения этих операторов и оператора
интегрирования по Ху может быть изменен.
Если выполнены сформулированные
условия, то граничные условия первой группы
могут быть перенесены на изображение
неизвестной функции и , а условия второй
группы учитываются в преобразованном
уравнении (11.1.11). Например, если граничное
условие имеет вид
«00^7+ РО0"
= <p(Xi,...,Xj_i9Xj+i,...,Xn),
то его можно преобразовать в граничное
условие для изображения U:
дхх
Р{х\)
ЪК{хьр)
дХ\
+ q(x{)K(xbp)-.
«wfl+poo^
4-uj
= р2р(х{)К(хир), (11.1.10) =^[ф(х1,...,дсу_1,дсу+1,...,дсл)].
где q (дС|) = -Су (ху) р (ху). Тогда исходное
уравнение сведется к следующему:
Io[U(p,y)]-p2U(p,y)= (и111)
= F(p,y) + {N(b)-N(a)).
Если теперь мы сумеем определить
каким-либо образом последнее слагаемое в
правой части (11.1.11), то получим уравнение
относительно U(p,y) по переменной р
алгебраическое, а не дифференциальное.
Таким образом, размерность исходного
уравнения оказалась пониженной на единицу.
Указанное слагаемое можно определить, исходя
из граничных условий, которыми должно
быть дополнено уравнение (11.1.3) для
корректной постановки математической задачи.
Но чтобы это стало возможным, требуется
выполнение двух условий:
1) граничные (начальные) условия
распадаются на две группы, первая из которых не
содержит производных по Х\ и зависящих от
11.1.2. Интегральное преобразование
на отрезке. Если оператор Ly является
регулярным, т.е. его коэффициенты Щ[(ху),
by (xy), Су (ху) не имеют особенностей в
концах отрезка [а, Ь], то граничные условия
по переменной Ху могут быть поставлены так
же, как и в регулярной задаче Штурма — Лиу-
вилля, например так:
Эй Q
дХу
">£;-*"
= фЛ^),
ху=а
(11.1.12)
= ФбОО-
Ху=Ь
Поставим задачу Штурма — Лиувилля,
дополнив уравнение (11.1.10) однородными
граничными условиями:
468
Глава II.I. ОБЩИЕ ПОЛОЖЕНИЯ
_Э_
P(xl)
Ж(хиР)]
дХ\
+ q(x{)K(xbp) =
= р2р(х[)К(х[,р),
<*ь
дхх
*К{хир)
Эх,
- Ра*(*,,/>)
= 0,
дс,=л
= 0.
х^Ь
(11.1.13)
Тогда:
1) задача (11.1.13) имеет нетривиальное
решение лишь при определенных
действительных значениях параметра р, квадраты
которых образуют бесконечную
возрастающую последовательность \Рп\ ~~ спектр
собственных значений задачи;
2) каждому собственному значению
соответствует единственная, с точностью до
числового множителя, собственная функция;
через К(х\,рп) обозначим ту собственную
функцию, отвечающую собственному значе-
2
нию рп , которая имеет единичную норму
относительно скалярного произведения с
весом р (xj);
3) последовательность {К(ху,рп)^
является полной ортонормированной системой
функций в пространстве L^[a,b\ функций / ,
для которых
b
ll/|p = J[/w]2pw^<+o°'
а
4) если функция и(х) = и (х{, у) ,
определенная в G , принадлежит пространству
Lz[a,b], то она может быть представлена в
виде
u(xuy) = y£U(y,pn)K(xbPn), (11.1.14)
любого у е Gq . В то же время U[у,рп)~ это
коэффициенты Фурье функции и(-, у), и
этими коэффициентами функция определяется
однозначно. Равенство (11.1.14), которое
понимается в рамках пространства Lp[a,b],
позволяет восстановить функцию и(-,у) по ее
коэффициентам Фурье или, другими словами,
восстановить функцию-оригинал по ее
изображению. Таким образом, формула (11.1.15)
задает интегральное преобразование функций
из Lp[a,b] в пространство изображений,
определенных на множестве Р = [рп], причем это
преобразование взаимно однозначно.
Из граничного условия, поставленного в
задаче (11.1.13) в точке а , следует, что
столбцы (К(а,р) K'X[(a,pj) и (аа$а)
пропорциональны. Поэтому
N(a) = p(a)
ди
К(а,р)
-, (<>, У) т—(<*,Р)\
дХ{ дХ{
Хар(а)
"(а, У)
Э*!
(а, У) рл
= -КР(а)<Ра(У)>
где Ха может быть определено по одной из
формул:
к =
Ча,р)
<xfl*0;
(а,р)
; Р„ * 0.
Р„
Аналогично N(b) = -кьР(Ь)<Рь(У) > гДе
\К(Ь,Р)
Ьь =
где
Ь
дК
аь * 0;
Эх,
(Ь,р)
Р*
-, Р**о.
U(yipn) = ju(x[,y)K(x[lpn)Q(x[)dx{.
(11.1.15)
Выражение (11.1.15) определяет
интегральное преобразование для всякой функции
и(х{,у), для которой и(-,у)е L2[a,b] для
Таким образом, выражение N(b) - N(a),
входящее в правую часть уравнения (11.1.11),
выражается через правые части граничных
условий, а само уравнение содержит лишь
одну неизвестную функцию U(y, p),
определенную на множестве GqX P .
ИНТЕГРАЛЬНОЕ ПРЕОБРАЗОВАНИЕ НА ПОУОГРАНИЧЕННОМ ИНТЕРВАЛЕ 469
11.1.3. Интегральное преобразование
на полуограниченном или неограниченном
интервале. Если интервал (а,Ь) изменения
переменной х^ является неограниченным
либо слева (а - -оо) , либо справа (Ь = +«») ,
либо с обеих сторон, то стандартные
граничные условия III рода на обоих концах
интервала поставить уже нельзя. Та же ситуация
наблюдается, если интервал (а,Ь) ограничен, но
на одном или обоих концах коэффициенты
а\ 1 » Ь\. > с\ оператора Ц имеют особенности.
В описанной ситуации поставленная
нами задача Штурма — Лиувилля для ядра
К(х\,р) интегрального преобразования
трансформируется в свой сингулярный вариант.
Сначала рассмотрим случай
полубесконечного интервала [я,+°°). Предположим, что
по переменной JCj в точке а поставлено
условие III рода (11.1.12). Тогда, предполагая,
что ядро интегрального преобразования
К{хьР) удовлетворяет в точке а
соответствующему однородному условию, мы можем,
как и в регулярном случае, определить N(a).
Поэтому, чтобы уравнение (11.1.11) не
зависело напрямую от функции и , достаточно
выполнения условия
Щ+оо)= lim N(x{) =
Jtj-И-оо
= lim p(xi)W[u(;y);K(;p)]{xi) = 0.
(11.1.16)
Это требование необременительно, так
как оно выполняется, например, если
и(Х[,у) -> 0 при Х[ -> +оо , а ядро К^х^р)
ограничено. Мы будем рассматривать
решения и(ху,у), для которых и(,у)е L [я,+°°),
но тогда функция и(х^у), как правило,
является бесконечно малой в +<*>.
Поставим задачу Штурма — Лиувилля для
ядра К (jC|, p) интегрального преобразования
дх{
[p{Xl)**№yq{Xl)K{Xl,p).
= Хр(х1)К(хьр),
Ж(хьр)
дх.
-ра* (*,,/>)
= 0,
xt=a
где X - р (в дальнейшем для удобства мы
будем использовать вместо р параметр X и
писать К(ху,Х)). Модифицируем задачу
(11.1.17) при помощи замены
v(xbX) = K(xhX)Jp(x{).
Тогда поставленная задача преобразуется к
виду
дх{ i
Р— \+qv = Xv, (11.1.18)
9xj '
~ dv a
= 0, (11.1.19)
X(=fl
где
Р(*|) =
Р(.х\)
p(*l)'
?(*l) =
g(*l) 1
P(*i) Vp(xi)
хЛ
/>ы;
U/рЫ
OLa = ая>/Р(а).
W).
Таким образом, мы получили задачу на
собственные значения (11.1.18), (11.1.19). Ее
решение определяется с точностью до
функции, зависящей от X. В качестве решения
можно взять функцию \|/(лГ|,Л.), которая
однозначно определяется условиями
у(а,Х) = аа,
дх\
-(*Л) = Р<г
(11.1.20)
Если f(x)ell[a,+oo),To f(x)y[p(x)e
е 1?[а,+оо\, и последняя функция может
быть представлена в виде
f(x)4p(xj = J F(\Mx,\)do(X),
(11.1.17) где
470
Глава 11.1. ОСНОВНЫЕ ИНТЕГРАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ
F(X) = jf(x)fi(x)yHx,\)dx =
а
-и»
= | /(х)*бО)р<х)&
есть интегральное преобразование функции
f(x) с ядром К(х,Х) и весом р(дс), а а(Х) —
это спектральная функция задачи (11.1.18),
(11.1.19).
Условия (11.1.20) равносильны условиям
К(а,Х) = аа,
дХу
(11.1.21)
и мы приходим к следующему утверждению.
Теорема 11.1.1. Пусть Дц, by, q e
и Дл(дс)>0 при дсе[д,-н*>).
Если А'(дсД) — решение задачи (11.1.18),
(11.1.21), то для любой функции f(x)e
е Z,p[fl,+oo) определено изображение
-и»
F(X) = J Я*)Х0О)р(*)Лс
интегрального преобразования с ядром К и
весом р . При этом имеет место формула
обращения
/(*)= J F(\)K(x,X)do(\),
где а(А.) — спектральная функция задачи
(11.1.17).
Отметим, что спектральная функция
определяется однозначно, только если
дифференциальное уравнение в задаче (11.1.17)
имеет решения, не принадлежащие /,р[я,+°°). В
противном случае определено однопараметри-
ческое семейство спектральных функций.
Для построения интегрального
преобразования на бесконечном интервале (-°°,+о°),
как и на полубесконечном (я,+°о) с особой
точкой а или на конечном (а,Ь) с двумя
особыми точками а и b оператора Ly , нужно
использовать двустороннюю задачу Штурма—
Лиувилля. Интегральное преобразование
приводит к двум изображениям, определенным в
верхней полуплоскости С, которые можно
рассматривать как единое изображение,
заданное и в верхней полуплоскости, и в
нижней. Эти два изображения определяются
двумя ядрами Ку(х,Х) и А^хД). Обратное
преобразование задается матрицей из четырех
спектральных функций двусторонней задачи
Штурма — Лиувилля.
Теорема 11.1.2. Пусть Qyy, by, Су е
€С(1)(-оо,+оо), причем ауу(х) > 0 при
хе (-оо,+оо). Если Ку(х,Х) и К2(х,Х) -
решения дифференциального уравнения
~{рЩ-\+яК = ^К, (11.1.22)
дх у дх J
удовлетворяющие граничным условиям
tfj(<iA) = l,
L(<a)=o
Ml,
дх
(11.1.23)
K2(a,\) = 0,
дК>>
Эх
Ча,Х) = \,
(11.1.24)
то для любой функции /(дс)е Lp(-«>,+oo)
определены изображения
F,(X) = j f(x)K^X)p(x)dx
интегральных преобразований с ядрами К у ,
К2 и весом р . При этом имеет место
формула обращения
2 2 +~
Л*) = ZX f FiWKj(x,Woy(\),
1 = 1 j=\ -со
где (Оу(\)) — это матрица спектральных
функций соответствующей задачи Штурма —
Лиувилля.
Матрица спектральных функций
определена однозначно, если дифференциальное
уравнение (11.1.22) имеет на интервалах
(-о°,д] и [а,+°°) решения, не
принадлежащие соответственно Lp(-°°,a] и /,р[я,+°о). В
противном случае образуется одно- или двух-
параметрическое семейство таких матриц.
ИНТЕГРАЛЬНОЕ КОСИНУС-ПРЕОБРАЗОВАНИЕ ФУРЬЕ
471
Глава 11.2
ОСНОВНЫЕ ИНТЕГРАЛЬНЫЕ
ПРЕОБРАЗОВАНИЯ
НА НЕОГРАНИЧЕННЫХ ИНТЕРВАЛАХ
Все построения теории интегральных
преобразований основаны на рассмотрении
пространства L функций, суммируемых с
квадратом. В этом пространстве считаются
равными функции, различающиеся лишь на
множестве меры нуль. Если такие функции
используются в подынтегральных
выражениях, то результат будет один и тот же. Однако
если с чисто теоретической точки зрения
результаты с "точностью до множества меры О"
вполне приемлемы, на практике это не всегда
удобно. Для обеспечения равенств в каждой
точке на функции-оригиналы накладывают
дополнительные ограничения. Это приводит к
более сильным утверждениям типа теоремы
Дирихле для рядов Фурье.
11.2.1. Экспоненциальное
преобразование Фурье. Прямое преобразование Фурье
задается формулой
Нр)= jf(y)e-ipydy, (11.2.1)
а обратное - формулой
fM = j^JF(p)e^xdp. (11.2.2)
Эти два интегральных преобразования схожи,
и их можно поменять местами. И то и другое
являются упрощающими для
дифференциального оператора
действующего на всей числовой оси. Обычно
под оригиналом преобразования Фурье
понимают любую функцию, определенную и
абсолютно интегрируемую на (-оо^+оо),
удовлетворяющую условиям Дирихле:
а) она кусочно непрерывна, т.е. на
каждом конечном интервале она имеет лишь
конечное число точек разрыва, причем все
точки разрыва ] рода;
б) она кусочно монотонна, т.е. любой
конечный интервал содержит лишь конечное
число точек локального экстремума и потому
разделяется на конечное число подынтервалов,
на каждом из которых функция монотонна.
При этих дополнительных условиях
представления (11.2.1) и (11.2.2) верны в
каждой точке числовой оси.
11.2.2. Смешанное интегральное
преобразование Фурье. Оригиналом
смешанного интегрального преобразования Фурье
называют функцию, определенную и
абсолютно интегрируемую на полубесконечном
интервале [0,-h»), удовлетворяющую
условиям Дирихле. Для функции-оригинала f(x)
изображением Фсм [/(*)] является
+оо
cos(px) + —sm(px) \dx.
Р )
Обратное преобразование имеет вид
№ = Ф-с1[Р(Р)](х) =
= - \ F(P)\ cos(px) + — sin(px) —£—Tdp,
ni { p )н2+р2
если H > 0 , и
Дх) = Ф-с1[Г(р)]М =
=- f F(p)\cos(px) + —sm(px) p dp-
-2HF{>TiH)eHx,
если Н < 0 .
Смешанное интегральное
преобразование Фурье является упрощающим для
дифференциального оператора —j.
дх
11.2.3. Интегральное
косинус-преобразование Фурье. Пространства оригиналов
косинус-преобразования и смешанного
преобразования совпадают. Оператор интегрального
косинус-преобразования Фурье имеет вид
F(P) = Ф* [/«](/>) = J f(x)cos(px)dx,
и его формула обращения
f(x) = Фк' [F(p)](x) = - f f(x)cos(px)dx.
к J
Интегральное косинус-преобразование
Фурье может быть получено либо из
экспоненциального преобразования Фурье, если
предполагать, что оригинал - четная
функция, либо как частный случай смешанного
интегрального преобразования Фурье, когда
472
Глава 11.2. ОСНОВНЫЕ ИНТЕГРАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ
поставлены граничные условия II рода (т.е.
Н = О). Действие этого варианта
преобразования Фурье на оператор двукратного
дифференцирования следующее:
11.2.4. Интегральное
синус-преобразование Фурье. Это преобразование по сути
близко к интегральному
косинус-преобразованию Фурье. Его пространство оригиналов
совпадает с пространством оригиналов
смешанного преобразования. Оператор
интегрального синус-преобразования Фурье имеет вид
F{p) = Фс[/(*)](/>) = J f(x)sin(px)dx ,
о
и его формула обращения
f{x) = Фс[ [F(p)](x) = - f f(x)sm(px)dx .
о
Интегральное синус-преобразование Фурье
может быть получено либо из
экспоненциального преобразования Фурье, если
предполагать, что оригинал - нечетная функция,
либо как частный случай смешанного
интегрального преобразования Фурье, когда
поставлены граничные условия I рода (т.е. в
пределе при Н -» оо ). Действие этого
варианта преобразования Фурье на оператор
двукратного дифференцирования следующее:
*c[f"(x)](p) = -p2F(p) + Pf(0).
11.2.5. Интегральное преобразование
Ганкеля. Это преобразование полезно при
рассмотрении плоских задач в полярной
системе координат. Если функция /(г)
определена на [0,+оо), абсолютно интегрируема с
весовой функцией р(г) = -Jr и удовлетворяет
условиям Дирихле, то ее называют
оригиналом преобразования Ганкеля. Само
преобразование задается формулой
F(p) = Н [Дг)](р) = j f(r)Jv(pr)rdr,
о
где Jv (t) - функция Бесселя индекса
v > -1/2. Формула обращения для этого
преобразования имеет вид
+оо
/(г) = Я"1 [F(p)](r) = J F(p)Jv(pr)pdp .
Преобразование Ганкеля можно
использовать для упрощения оператора
г г , I Э ( ди\ v2 „, „ „ч
согласно формуле
H[Ll[u]] = -p2H[u].
11.2.6. Интегральное преобразование
Вебера. Если функция /(г) определена на
[/Ь>+°°)» абсолютно интегрируема с весовой
функцией р(г) = V/" и удовлетворяет
условиям Дирихле, то ее называют оригиналом
преобразования Вебера. Это преобразование
задается формулой
F{p) = V[f{r)](p) =
= j (А(/"Ь) П (pr)-Jv (pr)Yv (pr0))f(r)rdr,
где /v(f) и Yv(t) — функции Бесселя и
Вебера индекса v > -1/2. Обратное
преобразование имеет вид
m = v-l[F(p)](r) =
-j
Jv {pro)Yv {pr)-Jy {pr)Yy [pr0)
Jl(pr0)+Yi(pr0)
F(p)pdp.
Преобразование Вебера, как и
преобразование Ганкеля, может быть использовано для
упрощения оператора (11.2.3), но при
дополнительном условии, что соответствующая
задача имеет граничное условие I рода в точке
Го . В этом случае можно воспользоваться
формулой
У[1лП(Р) = -»{*)-P2UM.
п
11.2.7. Интегральное преобразование
Меллина. Оригиналом интегрального
преобразования Меллина называется функция
/(г) , определенная на (0,-h»),
удовлетворяющая условиям Дирихле и следующему
условию: существуют такие положительные
С\ и &2 , 0\ < &2 > что сходятся интегралы
1 -н~
p'-'l/^K' jr°2-l\f(rpr.
О 1
(11.2.4)
ОПРЕДЕЛЕНИЕ И УСЛОВИЯ СУЩЕСТВОВАНИЯ
473
Это — еще одно интегральное преобразование
для полярных координат. Преобразование
Меллина задается формулой
F(p) = M[f(r)](p) = j f(r)r<>-[dr ,
о
интеграл в которой сходится при
Re/?G (а|,а2). Обратное преобразование
Меллина имеет вид
0+/00
f(r) = M-l[F(p)](r) = ±: f F(p)r»dp,
О-/00
где комплексный интеграл берется вдоль
вертикальной прямой Re/? = a, ae((j],a2).
Эти формулы могут быть получены при
помощи экспоненциального преобразования
Фурье.
Интегральное преобразование Меллина
можно использовать для упрощения
дифференциального оператора
согласно формуле
М[Ц[и]] = р2М[и].
Глава 11.3
ПРЕОБРАЗОВАНИЕ ФУРЬЕ
11.3.1. Определение и условия
существования. Прямое (экспоненциальное)
преобразование Фурье задается формулой
F(p) = j f(x)e~ipxdx . (11.3.1)
Функциями-оригиналами преобразования Фурье
являются абсолютно интегрируемые на
числовой оси функции, удовлетворяющие
условиям Дирихле (т.е. кусочно непрерывные и
кусочно монотонные). Из теории интеграла
Фурье вытекает, что обратное преобразование
Фурье определяется формулой
1 "^
f(x) = j-j Fipy^dp, (11.3.2)
причем несобственный интеграл в правой
части равенства следует понимать в смысле
главного значения.
В действительности преобразование
Фурье определено для любой абсолютно
интегрируемой функции f(x), причем функция-
изображение F(p) = Фе [/(*)] является ком-
плекснозначной функцией, непрерывной и
ограниченной на числовой оси. Кроме того,
функция-изображение является бесконечно
малой при р -» сю э т.е. lim F(p) = О . До-
полнительные условия Дирихле, налагаемые
на функцию-оригинал, позволяют
восстановить оригинал по изображению с помощью
формулы обращения (11.3.2). При этом
равенство (11.3.2) имеет место только в тех
точках, в которых функция f(x) непрерывна, а
в точках разрыва функции f(x) (в силу
условий Дирихле все они первого рода)
интеграл в правой части равен
/(х + 0) + /(*-0)
2
т.е. полусумме двух односторонних пределов.
Пусть функция f(x) является
оригиналом преобразования Фурье. Функцию
S(p) = j-jf(t)e-i»'dt
называют спектральной функцией исходной
функции f(x) . С точки зрения механики
функция е,рх есть аналитическое
представление гармонического колебания. Поэтому
формулу обращения (11.3.2) можно понимать
как разложение механического движения,
описываемого функцией f(x) , в
суперпозицию бесконечного числа независимых
колебаний с различными частотами, а
спектральную функцию S(p) - как амплитуду
отдельных колебаний, соответствующих различным
значениям частот р .
Преобразование Фурье можно ввести
для функций /е L2(-°°,+o°), если интеграл
в (11.3.1) понимать в смысле главного
значения. Тогда функция-изображение F также
будет принадлежать Z^-00,00) и
j\F(pfdp = 2nj\f(xfdx.
(Это утверждение известно как теорема
Планшереля). Если в преобразование Фурье
ввести поправочный коэффициент ^— , т.е.
474
Глава 11.3. ПРЕОБРАЗОВАНИЕ ФУРЬЕ
вместо изображения F(p), полученного в
соответствии с (11.3.1), рассматривать функ-
1
цию -j=F(p),
то, согласно теореме План-
шереля, преобразование Фурье будет изомет-
рией гильбертова пространства Z^""00»00)»
поскольку в этом случае оно сохраняет
расстояние между элементами гильбертова
пространства.
11.3.2. Свойства преобразования
Фурье. Преобразование Фурье является
упрощающим для дифференциального
оператора —, а значит, и для дифференциального
dx
d2 Q
оператора —j. Это вытекает из следующего
dx
утверждения. Если комплекснозначная
функция / имеет все производные до п -го
порядка включительно, непрерывные и
абсолютно интегрируемые на числовой прямой
R , то справедливы следующие равенства:
*>e[fik)] = Wk*,[f]' к=^"- <"-3-3>
Гладкость функции-оригинала
преобразования Фурье связана со скоростью
убывания на бесконечности функции-изображения,
а именно: если функция-оригинал f(x)
имеет все производные до п -го порядка
включительно, непрерывные и абсолютно
интегрируемые на числовой прямой R , то функция-
изображение F(p) удовлетворяет условию
F(p) = o
1
И"
при р
Наоборот, если функция-оригинал
f(x) непрерывна на R , а функции f(x) ,
xf(x) , ..., x"f(x) абсолютно интегрируемы
на R , то функция-изображение F(p) имеет
на R производные до п -го порядка
включительно, причем функция (ri)kF(k\p),
к = \,п, является изображением функции-
оригинала х f(x).
Сверткой функций fug, заданных на
R , называют функцию
/**(*) = jf(t)g(x-t)dt9 xgR,
при условии, что интеграл справа сходится
при всех х е R. Если функции / и g
кусочно непрерывны и абсолютно
интегрируемы на всей прямой R, то свертка fog
функций / и g также кусочно непрерывна
и абсолютно интегрируема на всей прямой
R, причем ФЛ/*£] = фЛ/]фЛ#Ь те-
преобразование Фурье переводит свертку
оригиналов в произведение изображений.
11.3.3. Косинус- и
синус-преобразования Фурье. Если функция-оригинал
экспоненциального преобразования Фурье
является четной, то ее изображение можно
выразить формулой
+оо
F(P) = Фе [/(*)](/>) = J fixye-^dx =
+оо
= f f(x)cos(px)dx, (11.3.4)
а формула обращения принимает вид
1 +~
fix) = — j F(p)cos(px)dp . (11.3.5)
Любую функцию, определенную на
[О, +©о) t абсолютно интегрируемую и
удовлетворяющую условиям Дирихле, можно
продолжить на всю числовую ось как четную
функцию (как говорят, четным образом). Такое
продолжение позволяет определить на
множестве указанных функций с помощью формулы
(11.3.4) интегральное косинус-преобразование
Фурье, обратное к которому определяется
формулой (11.3.5). Для нечетных функций-
оригиналов преобразование Фурье принимает
вид
+оо
ПР) = Фе [/(*)](/>) = J f(x)3in(px)dx ,
(11.3.6)
а формула обращения преобразуется к виду
1 +~
fix) = — \ F(p)sin(px)dp. (11.3.7)
—оо
Используя нечетное продолжение, на
множестве функций, абсолютно
интегрируемых на [0,-h>o) и удовлетворяющих условиям
Дирихле, с помощью формулы (11.3.6) можно
ввести интегральное синус-преобразование
Фурье. При этом равенство (11.3.7) будет
определять формулу обращения
синус-преобразования Фурье.
ПРЕОБРАЗОВАНИЕ ЛАПЛАСА
475
Глава 11.4
ОПЕРАЦИОННОЕ ИСЧИСЛЕНИЕ
Операционное исчисление появилось в
начале века как некоторый формальный
метод интегрирования обыкновенных линейных
дифференциальных уравнений с
постоянными коэффициентами и их систем. К таким
уравнениям сводятся многие практические
задачи электротехники, радиотехники, теории
автоматического регулирования.
В соответствии с современными
представлениями этот метод по существу сводится
к преобразованию линейных
дифференциальных выражений. Линейный
дифференциальный оператор разлагается в произведение
более простых, для которых известен
обратный оператор.
Строгое математическое обоснование
операционное исчисление получило в рамках
теории интегральных преобразований.
Интегральное преобразование Лапласа позволило
интерпретировать формальные правила
преобразования операторных выражений как
преобразование выражений алгебраических,
связывающих изображения функций.
Современное операционное исчисление
строится по схеме, типичной для теории
интегральных преобразований. По функциям-
оригиналам, входящим в дифференциальные
уравнения, строятся их изображения, при
этом дифференциальные уравнения
превращаются в алгебраические. Система
алгебраических уравнений решается, и тем самым
находятся изображения неизвестных функций.
Неизвестные функции восстанавливаются по
найденным изображениям. Техника
операционного исчисления базируется на таблице
стандартных оригиналов и изображений, а
также на ряде правил преобразования
выражений при переходе от оригиналов к
изображениям и обратно.
Линейные дифференциальные
уравнения с постоянными коэффициентами и их
системы хорошо изучены. Решение задач,
приводящих к таким уравнениям, не связано
с какими-либо теоретическими трудностями и
может быть осуществлено различными
методами. Ни один метод не имеет преимуществ
перед другими, и выбирать тот или иной
метод следует с учетом особенности конкретной
задачи. Операционное исчисление наиболее
эффективно, когда решаемая задача является
задачей Коши; при этом правые части
дифференциальных уравнений и начальных
условий содержат составные функции, которые,
возможно, являются гладкими, но
описываются в разных частях области определения
разными формулами. Например, функция
\х2 +х + cosx, х < 0;
[ ех, х>0,
дважды дифференцируема, но на интервалах
(-оо,0) и (0,+оо) имеет совершенно разное
поведение.
11.4.1. Преобразование Лапласа.
Преобразование Лапласа — это интегральное
преобразование, которое определяется
соотношением
F(p) = j^f(t)e-P'dt. (11.4.1)
Интеграл в правой части этого соотношения
называют интегралом Лапласа. Изображение
интегрального преобразования Лапласа
называют также изображением по Лапласу.
Взаимосвязь оригинала f(t) и его изображения
F(p) записывают следующим образом:
F(p) = L[f(t)](p) или f(t) = F(p).
Функцией-оригиналом интегрального
преобразования Лапласа назовем любую, в общем
случае комплексно-значную функцию,
удовлетворяющую условиям:
1) /(0 = 0 при /<0;
2) /(0 кусочно непрерывна на
действительной оси, т.е. она может иметь разрывы
только I рода, причем каждый конечный
интервал содержит лишь конечное число точек
разрыва;
3) f{t) при / -»-и» имеет
ограниченный показательный рост, т.е. существуют такие
постоянные М > О и а, что |/(0| - Meot
при t > О.
Прокомментируем условия 1) - 3),
налагаемые на функцию-оригинал
преобразования Лапласа. Поскольку основная цель
операционного исчисления - решение
обыкновенных линейных дифференциальных
уравнений и систем при заданных начальных
условиях (задача Коши), а также смешанных
задач математической физики, то поведение
функций до начального момента (т.е. при
t < О) не является существенным, и самое
простое — полагать, что до начального
момента функция тождественно равна 0 . Это
аналогично началу работы радиотехнического
устройства, когда в некоторый момент
времени на его вход подается сигнал, а до этого
момента сигнал отсутствует, т.е. равен 0 . Эти
соображения мотивируют введение условия 1).
476
Глава 11.4. ОПЕРАЦИОННОЕ ИСЧИСЛЕНИЕ
Условие 2) достаточно естественно.
Отметим, что в литературе оно может
заменяться более легким (минимальное требование —
интегрируемость на любом конечном
интервале) либо более жестким, например
условиями Дирихле (т.е. дополнительно функция
должна быть кусочно монотонной).
Конкретный выбор одного из таких условий не
является существенным с практической точки
зрения и связан прежде всего с нюансами
построения математической теории.
Условие 3) также важно для
математического обоснования исчисления, но не
является обременительным практически, так как
большинство функций, описывающих
физические процессы, подчиняются ему. Более
того, из теории линейных дифференциальных
уравнений известно, что если правые части
системы линейных дифференциальных
уравнений с постоянными коэффициентами
имеют экспоненциальный рост, то и решения
системы имеют такой же рост.
Примером оригинала преобразования
Лапласа является функция
,2
Функция /(f) = e не является оригиналом
преобразования Лапласа, так как нарушается
условие ограниченного показательного роста.
Функция /(f) = tg/также не является
оригиналом преобразования Лапласа, поскольку
имеет разрывы II рода.
Функция rj(f) играет особую роль в
пространстве оригиналов преобразования
Лапласа, являясь в нем единичной функцией:
если /(f) - функция-оригинал, то /(0л(0 =
= fit). Иногда ее обозначают символом "1"
и вместо rj(f) пишут 1(f). Функцию rj(f)
называют функцией Хевисайда.
Работая с оригиналами, считают, что
условие 1) выполняется автоматически,
специально это не оговаривая. Например,
записывая /(f) = sin f, на самом деле имеют в виду
функцию
Для любой функции-оригинала /(f)
параметр G в условии 3) определяется
неоднозначно. Число Oq , являющееся точной
нижней гранью всех таких G, называют
порядком роста функции /(f). Число Gq
можно вычислить по формуле
/-»+<» f
Если /(f) - оригинал и имеет
показатель роста Gq , то интеграл Лапласа (11.4.1) от
этой функции сходится абсолютно всюду в
полуплоскости Re/?>GQ. При этом
сходимость равномерная в любой области
Re/? > g , где с > о0 . Функция Fip),
являющаяся изображением /(f), аналитична в
полуплоскости Re/? > Gq . Кроме того,
существует предел
Jim Fip) = О .
Rep-»+°o
Аналитичность функции Fip)
комплексного переменного в правой полуплоскости
Re p > Gq и существование нулевого предела
функции при Re/?-»+«o являются
необходимыми условиями для того, чтобы эта
функция была изображением по Лапласу. Однако
эти условия не являются достаточными.
Следующее утверждение дает
достаточные условия для изображения по Лапласу.
Теорема 11.4.1. * Пусть функция
комплексного переменного Fip) удовлетворяет
условиям:
1) Fip) определена и аналитична в
полуплоскости Re /? > Gq ;
2) в любой полуплоскости Re /? > G ,
G > Gq , существует предел
lim Fip) = О ;
3) функция Fip) абсолютно
интегрируема вдоль всякой прямой Re/? = G,
G > Gq , т.е. функция Fit, + /т|) абсолютно
интегрируема по переменной Т|.
Тогда Fip) является изображением
некоторой функции-оригинала /(f), имеющей
показатель роста не более Gq , причем
ЯО = -^ Г+'~ F(p)el"dp, (11.4.2)
где по определению
Г F(p)ep'dp= lim [ F(p)ep'dp,
ОСНОВНЫЕ ТЕОРЕМЫ ОПЕРАЦИОННОГО ИСЧИСЛЕНИЯ
477
а а > Cq может быть выбрана произвольно.
Равенство (11.4.2) выполняется в каждой
точке /, в которой функция /(/) непрерывна.
Интеграл в правой части формулы
(11.4.2) называют интегралом Меллина, а саму
формулу - формулой Римана—Меллина или
формулой обращения преобразования Лапласа.
Формула (11.4.2) в случае, когда
функция-оригинал удовлетворяет условием Дирихле,
может быть получена при помощи интеграла
Фурье. Из теории преобразования Фурье
вытекает, что формула обращения верна в общем
случае, если функции рассматривать как
элементы пространства L \-°°, +°°), т.е. если
считать идентичными функции,
различающиеся лишь на множестве меры нуль. Отсюда,
в частности, заключаем, что каждая функция-
оригинал однозначно восстанавливается по
своему изображению с точностью до значений
в точках разрыва, поскольку любые функции,
различающиеся на множестве меры нуль,
совпадают во всех точках непрерывности.
11.4.2. Основные теоремы
операционного исчисления. Линейность. Если /[(/), ...,
/к(0 -функции-оригиналы, /}(/) =/}(/>) .
/ = 1,... Д , то для любых (Х|,...,а£€С
функция cti/|(/) + ... + аkfk(t) есть
функция-оригинал и
к к
/=1 1=1
Теорема подобия. Если /(/) - функция-
оригинал, то для любого положительного
числа а функция /(а/) - тоже оригинал, и
если f(t) = F(p), то
а уо. J
Теорема смещения. Если /(/) -
функция-оригинал, f(t) = F(p), то для любого
комплексного числа X функция е f(t) —
тоже оригинал и
ex,f(t) = F(p-X).
Теорема запаздывания. Если f(t) —
функция-оригинал, /(/) = F(p), то для
любого положительного числа а функция
f(t - а) — тоже оригинал и
f(t-a) = e-'F{p).
Теоремы смещения и запаздывания
являются двойственными. Однако если в теореме
смещения параметр X - любое комплексное
число, то в теореме запаздывания параметр а
должен быть действительным
положительным.
Интегрирование оригинала. Если /(/) -
функция-оригинал, f(t) = F(p), то функция
g(t)=\'f(i)dz
Jo
является оригиналом и
g(t) = ±-F(p).
Р
Дифференцирование оригинала. Пусть
функция f(t) непрерывна при t > О, имеет
производную всюду, кроме некоторого
дискретного множества точек (т.е. множества,
имеющего конечное число точек на любом
конечном интервале). Если f(t) и f\t) —
функции-оригиналы, f(t) = F(p), то
f(t) = pF<j>)-f№),
где /(+0) = lim /(/).
Отметим, что при дифференцировании
оригинала главное, чтобы производная /'(/)
была оригиналом и чтобы для нее была верна
формула Ньютона - Лейбница.
Дифференцирование оригинала может
применяться многократно. Если функция
/(/) имеет (к-\)-ю производную,
непрерывную при t > О , существует к -я
производная всюду, кроме, быть может, некоторого
дискретного множества, и если все эти
производные являются оригиналами, то
f«)(t) = pkF(p)-pk-]f(+Q)-...-f(k-l\+0),
где f(t) = F(p).
Интегрирование изображения. Если
функция f(t) — оригинал, f(t) = F{p),
функция f(t)/t ограничена в окрестности 0 ,
то она является оригиналом и
t Jp
Дифференцирование изображения. Если
функция /(/) - оригинал, f(t) = F(p), то
функция -tf(t) - тоже оригинал, причем
-tf(t) = F\p).
478
Глава 11.4. ОПЕРАЦИОННОЕ ИСЧИСЛЕНИЕ
Свертка оригиналов. Сверткой двух
функций-оригиналов /(/) и g(t) называют
функцию
(f*g)(t) = j'of(T)g(t-x)dx.
Каждую из этих формул называют интегралом
Дюамеля.
Теоремы о предельных значениях. Для
любой функции-оригинала /(/) с
изображением F(p) выполняется равенство
Свертка оригиналов / и g является
оригиналом, причем показатель роста свертки не
превосходит максимального из показателей для
/ и g . Если ДО = F(p), g(t) = G(p), то
{f*g)«) = F(p)G(p). (ПАЗ)
Из теоремы о свертке можно сделать
несколько заключений. Из равенства (11.4.3)
следует, что свертка коммутативна,
/ * g = g * / , поскольку и та и другая
функция имеют одно и то же изображение, равное
произведению изображений / и g.
Теорема о свертке показывает, что
произведение изображений снова является
изображением. Пусть f(t) = F(p), g(t) = G(p)
и функция f\t) — оригинал. Тогда
PF(p)G(p) = {pF(p) - ДЩС(р) +
+f(+0)G(p) = (f * g)(t) + /(+0)g(0-
С учетом симметрии получаем две близкие
формулы:
pF(p)G(p) = f(*0)g{t) + j'ofb)g(t - x)dx,
pF(p)G(p) = £(+0)/(0 + j'of(x)g\t - x)dx.
lim pF(p) = /(+0), (11.4.4)
/7->oo
где предельный переход р -» °o
осуществляется внутри угловой области |arg р\ < а < тс/2 .
Если функция-оригинал f(t) с
изображением F(p) имеет предел
Д+~) = lim f(t),
f-H-°o
то существует также
ит/>Д/>) = /(+оо),
/7->0
где предельный переход р -» °°
осуществляется внутри угловой области |arg р\ < а < л/2 .
11.4.3. Изображения элементарных
функций-оригиналов. Непосредственным
вычислением интеграла Лапласа легко найти
изображение функции Хевисайда: Т|(/) =' р~ .
При помощи свойств преобразования Лапласа
можно найти изображения для ряда
элементарных функций-оригиналов. Приведем
"таблицу" наиболее употребительных
оригиналов и изображений.
п\
t"=^-r(neN);
Г =
г(у-и)
„V + I
(v e R);
S111 (О/ =
(О
2 2 '
/Г +(0
COS (Of .
2 2
/Г + GT
sh со/ =
со
2 2
/Г -GT
Р
en Ш = —г-^—j;
р -со
е»= '
ех' sin oof =
р-Х'
(0
(/? - А,)2 + со2 '
я!1тГ(/? + (о/)л+,1
tn sin cof = *= ;-^ (я
(/>2+со2)'
(леМ);
tnex, ^ «!
(/>-Х)
л+1
ex'cos(o/ = '"^
(/>-Х)2 + со2
л!11еГ(/> + (о/)"+|]
f"cos(0/ = *= ^ (леМ);
/ 2 2\"+|
ИЗОБРАЖЕНИЯ ЭЛЕМЕНТАРНЫХ ФУНКЦИЙ-ОРИГИНАЛОВ
479
smW7 = -^~4'
Г ^
2р4р
COSdhft _. IK_ 4/7
4t ' ip
chohfi
V7
2Vitf
e 4/ = e-Up (A. > 0);
■Jnt Jp
MO ='
^
/>2+l
С помощью теоремы запаздывания и
функции Хэвисайда можно находить
изображения составных оригиналов, часто
встречающихся в задачах электротехники и
радиотехники. Отметим, что функция т|(/ - а) - x\(t - b),
а < b , имеет ступенчатый вид (рис. 11.4.1)
J0(2jki) = -e p.
v ' Р
Пример 11.4.1. Рассмотрим функцию
(рис. 11.4.2)
л(г-д)-л(>-*) =
0, / < а;
l,a<t<b;
0,t>b.
Если функция /(/) задана как
составная в виде
/,(0, Щ <t<a2\
flit), a2<t< аъ\
/« =
fk-\(t), <>k-\ <t<ak\
/*('), *>ак,
то при помощи запаздывающих функций Хе-
висайда ее можно представить как сумму
к-\
(=1
до = X л w h с -«/) - л с - в,-+1)]+
+fk(t)4{t-ak).
При таком представлении переход к
изображениям делается легче. Рассмотрим несколько
примеров.
а Ь
Рис. 11.4.1
/(0 =
t, 0<f<l;
2-/, \<t<2\
0, t > 2.
Эту функцию можно представить в виде
ЛО = '(л(0-л('-1)) +
+ (2-/)(л(/-1)-л('-2)) =
= Гп(0 - (2/ - 2)л(/ - 1) + (^ - 2)л(/ - 2).
По таблице оригиналов и изображений нахо-
дим t =p , а по теореме запаздывания
(t - a)r\(t - а) =е~арр~2 . Поэтому
1-2е-"+е-2'_(1-е~Р)
АО:
Р" Р"
Пусть f(t) — периодическая при / > 0
функция-оригинал, т.е. для некоторого Т > 0
выполняется равенство /(/ + Т) = /(/),
/ > 0. Обозначим через /о(/) функцию
/о(0 =
/(/), 0 < Г < Т;
0, ? > Т.
Глава 11.4. ОПЕРАЦИОННОЕ ИСЧИСЛЕНИЕ
Тогда ную часть: /(/) = t -к, если к < t <к + 1 ,
f(t) = f0(t) + f(t-T). (11.4.5) ^ - Целое. Эта функция периодическая с
В равенстве (11.4.5) перейдем к
изображениям, полагая, что /(/) = F(p), a
F(p) = F0(p) + F(p)e-PT.
В результате получаем
Пример 11.4.2. Рассмотрим функцию
f(t) = {/}, которая ставит в соответствие
каждому действительному числу t > О его дроб-
периодом Т = 1 , причем
m-\o,t>\.
Согласно сказанному выше находим
/о(') = '(л(0-л('-1)).=
1 1
Р2 Р
е-" = F0(p),
откуда
1 е~р
f(t) = F(p) = ±--f -г.
Р2 p(l-e-P)
Раздел 12
СПЕЦИАЛЬНЫЕ ФУНКЦИИ
Под специальными функциями
подразумевают обычно некоторые классы функций,
встречающиеся при построении решений ряда
задач математической физики: сферические,
цилиндрические, эллиптические функции и
др. Вместе с тем к специальным функциям
относят также функции, не выражаемые в
конечном виде через элементарные:
интегральные синус и косинус, интегральный
логарифм, гамма-функцию Эйлера и др.
Достаточно полная информация о специальных
функциях имеется в [1-13].
Глава 12.1
СФЕРИЧЕСКИЕ ФУНКЦИИ
12.1.1 Определение. Однородный
полином <t>n(x,y,z) степени п относительно
х, у, z, являющийся решением уравнения
Лапласа в прямоугольных координатах
АФ = Ф«+Ф^+Ф«=0, (12.1.1)
называют объемной сферической или шаровой
функцией порядка п. После перехода к
сферическим координатам
x = rcos(psin0,
.у = rsinq>sin6, (12.1.2)
Z =COS0.
полином Фп(х,у,£) представим в виде
<t>n(x,y,z) = r"Yn(e,<f>), (I2.1.3)
и функцию Кл(0,ф) называют поверхностной
сферической функцией или сферической
гармоникой порядка (или степени) п . Эта функция
задана на поверхности сферы (0 < 0 < л,
О < ф < 2л) единичного радиуса и является
2л -периодической по ф.
Существует 2п + I линейно
независимых сферических функций порядка п
следующего вида:
Рп (cos 0), PJim) (cos 0) cos /яф,
P,<w)(cos0)sin/mp, (12.1.4)
где /^(cos©) — полиномы Лежандра с
аргументом COS0, а Т^"1* (cos 0) -
присоединенные функции Лежандра (см. п. 12.5.3).
Каждая из функций (12.1.4), умноженная на
гп , является частным решением уравнения
Лапласа. Общий вид сферической функции
порядка п следующий:
У„ (0,ф) = А0Рп (cos 0) +
п
+V (Ат cos/иф + Вт sin imp) P^ (cos0),
/w=l
(12.1.5)
где Aq , Ат , Вт - произвольные
постоянные. К сферическим функциям приходим
также при построении решения уравнения
Лапласа в сферических координатах. Если
искать это решение в виде
Ф(г,Ф,0) = *(г)Г(0,ф), (12.1.6)
то при условии ограниченности Х(0,ф) на
поверхности сферы получим для w(r),
У(в>ф) уравнения:
r2w" + 2rw'-n(n + \)w = 0, (12.1.7)
16 — 7706
482
Глава 12.2. ФУНКЦИИ БЕССЕЛЯ
1 Э
К)
+ \ Э Y)+n(n+l)Y=09
shre Эф2
sineaev
(12.1.8)
где п может принимать значения 0, 1, 2, ...
Уравнению (12.1.8) при фиксированном п
удовлетворяет именно сферическая функция
Yn(Q,<p) » а Уравнение (12.1.7) имеет
следующее общее решение:
иг(г,С1,С2) = С1гя+-^г
(12.1.9)
где Су, С2 — произвольные постоянные.
Следовательно, частными решениями
уравнения Лапласа являются произведения функций
(12.1.4) не только на гп , но и на г.
12.1.2. Ортогональность сферических
функций. Бесконечная последовательность
сферических функций Yn (Э,ф), п = О,1, 2,...
образует на поверхности сферы (0 < 0 < л,
О < ф < 2л) ортогональную систему функций,
так как
ЛМе,ф)У„2(е,Ф)л =
(S)
2л к
О О
: J dq>JYm (е,ф)У„2 (e,<p)sin&/e = О, п{ * пъ
(12.1.10)
//С«(е,Ф)С2(^ф)^ =
(S)
0, п\\ ф т2,
2к(п + т)
(2п - 1)(я - т)
4л
, т{ = /и2 = /и ф 0,
(12.1.11)
-, т{=т2= 0.
2л +1
Глава 12.2
ФУНКЦИИ БЕССЕЛЯ
12.2.1. Определение. Обыкновенное
дифференциальное уравнение 2-го порядка
„ I ,
У +-У +
х
1--
\ J
|у = 0, (12.2.1)
где v - любое вещественное или
комплексное число, называют уравнением Бесселя. Его
решения, удовлетворяющие определенным
условиям, называют функциями Бесселя, или
цилиндрическими функциями порядка (или с
индексом) V .
Уравнение (12.2.1) и приводимые к нему
встречаются во многих задачах физики,
механики, астрономии. В 1738 г. Даниил Бернулли,
рассматривая задачу о колебаниях тяжелой
гибкой нити, пришел к уравнению
1 ?
и'\х) + —и'(х) + orw(x) = 0 (со = const),
х
которое приводится после замены
переменной к уравнению (12.2.1) с v=0. В 1764 г.
Эйлер встретился с уравнением вида (12.2.1) в
задаче о колебании круглой мембраны. В
1822 г. Шарль Фурье, применив в задаче о
распределении температуры в охлаждающемся
цилиндре метод разделения переменных,
получил именно уравнение (12.2.1). Свое
название это уравнение и соответствующие ему
решения получили после того, как математик
и астроном Фридрих Бессель опубликовал в
1824 г. работу, в которой эти функции были
подробно рассмотрены и выделены в
отдельный класс. Наиболее полная информация о
функциях Бесселя содержится в [4]. См.
также [3, 5, 9, 10, 13].
Строгое математическое определение
функций Бесселя предполагает, что
независимая переменная х, а также постоянная v
комплексные. В частности, при замене х на
be (/ = v-l) уравнение (12.2.1) принимает
вид
У +-У -
X
( у2Л
1+ —
X*
J
\У = 0. (12.2.2)
Это уравнение называют модифицированным
уравнением Бесселя, а его соответствующие
решения — модифицированными функциями
Бесселя.
В инженерных задачах уравнения
(12.2.1), (12.2.2) и соответствующие функции
Бесселя рассматривают обычно при
вещественных х > 0 и вещественных v . Мы
ограничимся ниже, за некоторым исключением,
именно такими х и v .
Выделяют следующие семейства
функций Бесселя:
1) функции Бесселя 1-го рода,
обозначаемые Jv (х);
ФУНКЦИИ БЕССЕЛЯ 1-ГО РОДА
483
2) функции Бесселя 2-го рода,
называемые функциями Неймана или функциями Вебе-
ра и обозначаемые Nv(x) или Уу,(х) ;
3) функции Бесселя 3-го рода,
называемые функциями Ханкеля 1-го и 2-го рода и
обозначаемые соответственно
4) сферические функции Бесселя;
5) модифицированные функции Бесселя
1-го рода, обозначаемые /v(x) ;
6) модифицированные функции Бесселя
2-го рода, называемые функциями Макдо-
нальда и обозначаемые Ку,(х') ;
7) функции Кельвина, обозначаемые
ber(x), bei(x), и обобщения этих функций
berv(x), beiy,(x), kerv(x), keiv(x).
12.2.2. Уравнения, приводящиеся к
уравнению Бесселя.
.2 Л
/у<*) =
2vr(v + l)
1--
2-4(2v + 2)(2v + 4)
2(2v + 2)
, (12.2.7)
злД/+*2-4
\у = 0. (12.2.3)
Замена t = kx приводит к уравнению (12.2.1)
относительно y(t).
х
(12.2.4)
1-я
Замена у = xwz , t = Jbx , где v =
приводит к уравнению (12.2.1) относительно
функции z(t) •
(хту^ +схпу = 0, (с>0). (12.2.5)
1 I
Замена y = xaz, t = \a\y[cxa, где
2 а(/и-1)
а = , v = -, приводит к
п-т + 2 2
уравнению (12.2.1) относительно функции
НО.
у" + схпу = 0, (с>0). (12.2.6)
Частный случай уравнения (12.2.5) с т = 0,
2 а
а = , v = —.
п + 2 2
12.2.3 Функции Бесселя 1-го рода
J\(x). При произвольном v > 0 эти
функции представлены рядом
где T(v + 1) - гамма-функция Эйлера (см.
ниже п. 12.4.3). Этот ряд строится при
нахождении решения уравнения (12.2.1) в виде
степенного ряда, и он сходится к точному
решению при всех х > 0 . В частности, при v = О
и при целом положительном v = п
^■^ШШ1
(12.2.8)
. • чЛ+4
Функции Jn(x), n = 0,1,... могут быть
выражены также интегралом
1 к
Jn(x) = - [cos(я/ - xsint)dt (12.2.10)
*0
или получены как коэффициенты разложений:
cos (x sin/) = Jo(x) + 2^J2k(x)cos2kt,
(12.2.11)
sin (xsin r) = Jo(x) + 2^V2*(*)Snl(2£ -1)/.
(12.2.12)
Функции Бесселя 1-го рода отрицательного
не целого порядка v обозначают /_у(х), где
V > 0 , и записывают в виде ряда
(_п* fjcYv+2*
(12.2.13)
сходящегося при всех х * 0 . Если v = п > О
(целое число), то
•/-„(*) = <-1)Ч,(х).
16»
484
Глава 12.2. ФУНКЦИИ БЕССЕЛЯ
12.2.4. Функции Бесселя 2-го рода.
При не целом порядке v формулы (12.2.7) и
(12.2.13) определяют два линейно независимых
решения уравнения (12.2.1). Если же v = aj,
п = 0,1, 2,..., то в качестве второго решения
этого уравнения, линейно независимого по
отношению к Jn(x), выбирают функцию, обо-
где С = 0,57721566 - так называемая
постоянная Эйлера.
При отрицательном целом порядке -п,
п = 1, 2,..., имеем N_n(x) = (-\)nNn(x).
Если же v не равно нулю или целому
числу, то полагают
NJx) = [/v(x)cos vk - /_v(x)l.
sin vk
(12.2.17)
Функции Nv(x) при любых v
называют функциями Бесселя 2-го рода или функциями
Неймана. Называют их также функциями Вебе-
ра и обозначают Yv(x) .
12.2.5. Общее решение уравнения
Бесселя. Общее решение уравнения Бесселя
(12.2.1) выражается при всех v формулой
у(х,СиС2) = C{Jv(x) + C2Nv(x), (12.2.18)
где С\ , С2 — произвольные постоянные. Если
же v не равно нулю или целому числу, то
у{х,СьС2) = C,/V(x) + C2Jv(x). (12.2.19)
12.2.6. Функции Бесселя 3-го рода.
Функции, выражаемые при всех v формулами
#<■><*) = /v(jc) + iWv(x), ()2220)
Hi2\x) = Jv(x)-iNv(x),
называют функциями Бесселя 3-го рода или
функциями Ханкеля соответственно 1-го и 2-го
рода.
значаемую Nn(x) и выражаемую формулой
Nn = lim [/v(x)cosvk-/_v(x)1,
v->wS111VK
/1 = 0,1,2,-.., (12.2.14)
откуда
(12.2.15)
(12.2.16)
12.2.7. Рекуррентные,
дифференциальные и интегральные формулы. Для
любых Zv(x) решений уравнения Бесселя, т.е.
для всех функций /v(x), Nv(x), Н$\х),
Ну '(х) и их линейных комбинаций
справедлива следующая рекуррентная формула:
Zv_,(x) + Zv+,(x) = yZv(x). (12.2.21)
По этой формуле можно определить
функцию Zv_j(x), если известны Zv(x),
Zv+j(x), или определить Zv+|(x), если
известны Zv_j(x), Zv(x) . Справедливы также
следующие дифференциальные и
интегральные формулы:
Z'w(x) = -[Zv_,(x) - Zv+,(jc)] ,
-(^-')*
i
(12.2.22)
Ц(Х) = | ^у^ - l lZi<*) + 7*v+l<*) >
(12.2.23)
xvZv_\(x)dx = xvZv(x) + const,
(12.2.24)
[ xZv (hc)Zv {\xx)dx = —z =■ x
J X -\i
x[\iZv(Xx)Z'v(\dc) - XZv(Ajc)Zv(ujc)], X * ц,
^(^)-2(1п| + с]/.(,)-Х[|] *4г^-
ФУНКЦИИ БЕССЕЛЯ ПОЛУЦЕЛОГО ПОРЯДКА. СФЕРИЧЕСКИЕ ФУНКЦИИ 485
[xZ2 (Xx)dx =
= -±j\(x2x2 - v2)Zv2 (Xx) + X2x2 (Z; (Xx)f\
(12.2.26)
В последних двух формулах (') означает
дифференцирование по всему аргументу, а в
предпоследней формуле Zv(x) и Zv(x) -
любые функции, удовлетворяющие
уравнению Бесселя с фиксированным v .
12.2.8. Поведение функций Бесселя
1-го и 2-го рода вблизи начала координат
X == 0 . В малой правой окрестности х = О
справедливы следующие приближенные
выражения:
/0W-i~,/v(x)-nv
—И
, v>0,
(12.2.27)
^-VW •
1
r(-v + l)l x
2Y
— (при не целых v>0 ),
(12.2.28)
Nq(x)
.lta|fE|
я |2|
Mx),
л
J„(x)
/7 = 1,2,...,
>-"(U
(12.2.29)
Nn(X)
COSVK
Sill VK
r(
V + OUJ
Sill VJt
^J r(-v + l)
В последней формуле v Ф 0,± 1,± 2,... Все
функции Бесселя 2-го и 3-го рода терпят в
точке х = 0 бесконечный разрыв.
12.2.9. Поведение функций Бесселя
1-го и 2-го рода вдали от начала координат.
Асимптотические формулы. Замена
неизвестной функции у = -j=r в уравнении Бесселя
(12.2.1) приводит это уравнение к виду
:0, (12.2.30)
l-4v2
где X = . Поэтому при х » 1 спра-
4
ведлива для всех решений у(х) уравнения
Бесселя асимптотическая формула
1
\( т ( \ Л
COS X +
2>х-
/^ 1 Л
+ 0
*=0
sin х
(12.2.31)
где Aq, ..., Вт - некоторые постоянные.
Если не требуется большая точность, то при
всех v » 0 применяют следующие формулы
(полученные после вычисления первых
коэффициентов Aq, A[, Bq, By):
/»(*)
cos<p--
4v^-l
8х
sincp , (12.2.32)
4v2-l
6x
-COS(p
, (12.2.33)
/
где ф = x . Погрешность этих
формул имеет порядок
1
V*"
Более точные
формулы имеются в [5, 13].
12.2.10. Функции Бесселя полуцелого
порядка. Сферические функции. Из
уравнения (12.2.30) следует, что любое у(х)
решение уравнения Бесселя при v = ±~
выражается конечной формулой
у(х) = -j=(A0 cos x + Bq sin x), (12.2.34)
yjx
где Aq, Bq — некоторые постоянные.
Сопоставление этого выражения с рядами для
Jl(x), J_i(x), N±(x), N_i(x) приводит к
2 2 2 2
формулам:
J\W = J—sinx, J i(x) = J—
I Vrac "I ynx
„•+(uAj„
cosx,
NL(x) = -J L(x), N_L(x) = JL(x).
2 2 2 2
(12.2.35)
486
Глава 12.2. ФУНКЦИИ БЕССЕЛЯ
С помощью рекуррентной формулы
(12.2.21) можно построить выражение для всех
функций /v(x), Nv(x), если w=^±k и
к — целое положительное число. В частности,
/3W = J——sinx-cosx ,
2 ЧКХ{Х )
J з(*) = а/— —cosx-sinх ,
"2 \TVC\ X )
N!(x) = J з(х), N 1(x) = -J1(x).
2 2 2 2
С функциями Бесселя связаны так
называемые сферические функции Бесселя 1-го, 2-го,
3-го и 4-го рода, обозначаемые (см.,
например, [5]) соответственно jj(x), Яу(х),
Лу}(х), hf\x) и равные
(12.2.36)
Эти функции являются решениями
дифференциального уравнения
„ 2 ,
У +-У +
х
х2
■у = 0 (12.2.37)
и удовлетворяют рекуррентной формуле
2у + 1
JV+1 СФ
-^yW->;y-lW =
12.2.11. Нули функций Бесселя. Из
(12.2.33) следует, что, по крайней мере,
начиная с некоторого х > 0 , графики функций
Бесселя 1-го и 2-го рода соответствуют
затухающим колебаниям. Эти графики
пересекают правую полуось последовательно в
бесчисленном количестве точек Х|, Xj> x3,...,
называемых нулями функций Бесселя. В [3-5, 13]
имеется подробная качественная и
количественная информация о характере
расположения вещественных и комплексных нулей
различных функций Бесселя. Мы ограничимся
основными фактами, относящимися к
положительным нулям функций Бесселя 1-го и 2-го
рода вещественного аргумента и
неотрицательного порядка v .
1. Расстояние между двумя соседними
нулями хп, xn+i тем ближе к к , чем больше п.
2. Между каждой парой соседних нулей
функции /v(x) (и Nv(x)) имеется один нуль
функции /v+l(x) (uNv+i(x)).
3. Для приближенного вычисления нулей
хл, /1 = 1,2,... функции /v(x) и Nv(x)
имеется следующая формула:
8р [ 64р2
+ 2& + ft +
15 44р4 Ю5(4р)6
(12.2.40)
где
Ci=7tf-31, G2=83?2-982? + 3779,
к л 2
Q3=6949q3-\53S55g2 +1585743?-6277237,
=-xj—(x~jу (х)\ (12.2.38) а = 0 " Для нулей функции /v(x) и <х=-
dx
При целых j эти функции выражаются в
конечном виде. В частности,
Mx) = ^,hV=-ie-,^=i
X
х
cos* Л(1)=£_ >Л(2)=£_.
X
(12.2.39)
для нулей функции Nv(x).
4. Бесконечной последовательностью
нулей Х|, Х2 ... обладают также функции
Jv(ax)Nv(bx)-Jv(bx)Nv(ax), (12.2.41)
где а,Ь — постоянные, причем а > О , Ь > О .
Приведем таблицу первых шести нулей
функции /v(x), Л\,(х), v = 0,1:
МОДИФИЦИРОВАННЫЕ ФУНКЦИИ БЕССЕЛЯ
487
п
1
2
3
4
5
6
ш
Хп
2,405
5,520
8,654
11,792
14,931
18,071
(А)
Хп
3,832
7,016
10,174
13,324
16,471
19,616
(N0)
Хп
0,894
3,958
7,086
10,222
13,361
16,500
М)
Хп
2,195
5,428
8,596
1,749
14,897
18,043
12.2.12. Ортогональность бесселевых
систем функций. С помощью функций
Бесселя можно построить системы
ортогональных функций. Пусть
ик(х) = Vx/V(Y**), * = 1, 2Д ..., (12.2.42)
где /v(x) - функции Бесселя 1-го рода
порядка v>0 и Yj, у2, Уз» ••• ~ бесконечная
последовательность положительных нулей
этой функции. Построенная система функций
является ортогональной на отрезке [0,1], так
jum(x)u„(x)dx =
0, тФп,
(12.2.43)
t|/v+1 (Ут)]2 = т|/С (Ут)]2 , т = П.
Условие ортогональности выполняется
также для системы функций (12.2.42), если
Yi, Y2» Уз» ••• ~ положительные нули функций
(12.2.41).
Тогда
JM2(x№ = -L{Y?„[y;(Y;„)]2 +
0 1Чт
+(Y?n-v2)[/v(Y„,)]2}- (12-2.44)
Ортогональную последовательность на
отрезке [а, Ь] образуют также функции
ик(х) = V* [/у (Ук*)Яу (УкЬ) ~
-Wv(y*x)/v(y**)], (12.2.45)
где Yi»Y2»Y3»-- "" положительные нули
функции (12.2.41). При этом
Г 2/ w 2№(УпА)-'НУтЬ)]
I uzm(x)dx = -J- ТТ7Г ±.
(12.2.46)
Благодаря ортогональности этих систем
функций возможны разложения функций
f(x) достаточно широкого класса в ряды
где Ui(x), w2W»-- "" системы (12.2.42) или
(12.2.45) и ат - соответствующие
коэффициенты.
12.2.13 Модифицированные функции
Бесселя. Модифицированные функции
Бесселя 1-го рода порядка v (обозначаемые
/v(x) и 2-го рода (обозначаемые Kw(x) и
называемые часто функциями Макдональда)
удовлетворяют модифицированному
уравнению Бесселя (12.2.2) и выражаются
следующими формулами:
(v — любое вещественное число),
(12.2.48)
Kv(x) = —?—[I_v(x)-Iv(x)]
2 sin v л
(v - не целое число), (12.2.49)
K„(x)=]imK,(x), /,,(*) =/_„(*)
(п - целое число). (12.2.50)
Функции 1п(х), п = 0,1,... являются также
коэффициентами следующих разложений:
ch(xsin/) = /o(jc) + 2^(-l)kI2k(x)cos2kt,
(12.2.51)
Аг=1
sh(xsin/) = 2^(~l)k+l I2k-i(x)sin(2k - 1)Л
Аг=1
(12.2.52)
Общее решение уравнения (12. 2.2) при
не целых v имеет вид
у(х,СьС2) = C,/V(x) + C2/_v(x), (12.2.53)
488
Глава 12.2. ФУНКЦИИ БЕССЕЛЯ
а при любых v может быть записано в виде
y(x,Cl9C2) = q/v(x) + C2Kv(x), (12.2.54)
где С\, С2 — произвольные постоянные.
При х > О, v > 0 функции 1у,(х)
монотонно возрастают, при этом /о(0) = 1 и
/v(0) = 0 (v > 0 ). При v < 0 функции
/v(x) терпят в начале координат
бесконечный разрыв.
Графики для функций Kv(x)
напоминают при v > 0 гиперболу ху = const,
причем Kv(x)-^0 при х-»оо и Kv(x)->oo
при х -» 0 .
12.2.14. Функции Кельвина и их
обобщения. Функции Кельвина Ьег(х),
bei (x) определяются формулой
Jq (x/V7) = I0 (W7) = ber(x)+/ bei(x).
(12.2.55)
Ьег(х) = 1-^^Т+-Ц_^Т-...,
(2!)42J (4!)42J
[2) (3!)42J (5!)42J
£ ±(*f L(£?_L(*Y + 1
2 + 2!(2j * 2!3!^2J 3!4!^2j +"j
2 + 2!^2j + 2!3!^2 J 3!4!^2 J '
beri(x) = 72
bei,(x) = -^
12.2.15. Функции Бесселя и частные
решения некоторых уравнений
математической физики.
1.Пусть дано трехмерное уравнение
Лапласа в цилиндрических координатах
ф^+1ф;+±ф^ + Ф^=0. (12.2.62)
Частные решения ищутся по методу
разделения переменных в виде
Ф(г,ф,г) = w(r)v{q>)u{z), (12.2.63)
что приводит к следующим
дифференциальным уравнениям относительно функций
w(r), в(ф), u(z):
Обобщением этих функций являются
функции
ker(x), kei(x), berv(x),
bei(x), kerv(x), keiv(x),
определяемые формулами
K0 (хЛ) = кег (х) + / kei (x),
/v (W7) = berv(x) + /bei v(x), (12.2.56)
Kv (W7) = kerv(x) +1 kei v(x).
Все эти функции вещественные при х > 0 .
Функции ber(x), bei(x) удовлетворяют
дифференциальному уравнению
/' + -/-/>> = 0. (12.2.57)
х
Приведем разложения функций Ьег(х),
bei (х), ber {(x), bei i(x) в степенные ряды
(12.2.58)
(12.2.59)
(12.2.60)
(12.2.61)
1 ( Х\
W + - W+ и - Аг \w = 0 , (12.2.64)
г { г2)
v" + Xv = 0, (12.2.65)
и"-ци = 0, (12.2.66)
где ц, X - произвольные вещественные
постоянные. Функцию а(ф) полагают обычно
2л -периодической, так что X = п ,
п = 0,1,2,.... Постоянная Ц может быть > 0
и < 0 (в зависимости от краевых условий).
Если JJ, > 0, то частные решения
(12.2.63) запишутся в виде
ФУНКЦИИ БЕССЕЛЯ И ЧАСТНЫЕ РЕШЕНИЯ УРАВНЕНИЙ МАТЕМАТИЧЕСКОЙ ФИЗИКИ 489
Ф = Ц/„ Шг) + A2Nn (yfcr)] х где ФУНКЦИЯ ^ ~ Зл-периодическая; w(r) -
L ' v 'J конечная при /чОи ДО -> 0 при / -» °°.
x[fi,cosw(p+52sinn9][c,e^+C2e"^l, Для w, и, Г получим уравнения:
(12.2.67) „ 1 ,
w +-w +
82-Дг|и- = 0, (12.2.75)
г2
^тп ~ J n
где у4|,...,С2 - произвольные постоянные, г
определяемые, как и постоянная ц, в зави- „ 2 л П7 7 76Ъ
с и мости от краевых условий.
Если ц = -q2 < О, то Г + а2Ъ2Т = 0, (12.2.77)
Ф = U l„(qr) + A2Kn(qr)] х где л = 0,1, 2,... и 8 - произвольная вещест-
венная постоянная. Если эти решения ищутся
х[В{ cosЯф + В2 sin яф][С, cos^г + С2 sintfz]• внутри кольца (a<r<b) при краевых условиях
(.2.2.68) ф| ( ф| /(Г)ф)((12.2.78)
Например, пусть ищется решение уравнения
(12.2.62) внутри цилиндра, конечное при где /(г,ф) - заданная функция, то получим
г —> 0 , при краевых условиях следующее семейство частных решений:
4=„=4=/=°> Ч=о=/С-.Ф)' <>«•»> фтя = .тп(г)№ясо8Иф + Д2п81ппф]е-8-«2',
где /(г,ф) - заданная функция. Тогда, исхо- (12.2.79)
дя из (12.2.67), получим следующее семейство где
частных решений: , ч АТ /с \ 7 /с \
И wmi,(/-) = tf„ {bmna)Jn (bmnr) -
Уя-r\вХпcosmp + ~Jn(bmn<*)Hn(8milr), bmn = ytf/b
in) (12-2-7°) и ytf -нули функции wmil(r).
+^2/iSin^]sh^-(/-z), 3. Пусть дано двумерное волновое урав-
о нение
где я = 0,1, 2,..., пг = 1,2,3,..., Я1л, Я2„ - ф;; Д ф; + *ф" * ф;; , (12.2.80)
(я) Г Г2 С2
произвольные постоянные и У/я ~ НУЛИ
описывающее колебания закрепленной по
функции Бесселя J„(х). с л /ifl4| Пч
^J wV 7 краям мембраны радиуса о (^)|=/1=^) с
Аналогичное семейство частных реше- г
ний уравнения (12.2.62) внутри данного ци- заданным начальным состоянием
линдра и при краевых условиях Ф|/=0 = /i(f,<p) , ф/|/=0 = /2(г>ф) • Частные
ф| = ф| = 0 Ф| = Лф) (12 2 71) Решения ищутся в виде (12.2.74), причем оп-
\z=0 |г=/ » \r=a J VY/ ' ределяются теми же уравнениями, что и в
определяется формулой предыдущем пункте, а функция T(t) удовле-
творяет уравнению
Ф mn = I„i^}[B[n cos п(р+В2п sin пф'т^1. Г' + с282Г = 0. (12.2.81)
(т = 1 2 3 • п = 0 1 2 ) (12.2.72) Семейство частных решений запишется в виде:
2. Пусть дано двумерное уравнение теп- ®тп = •'л(8/ялг)1#1лcosmP +
лопроводности в полярных координатах . 1 / ч ...^
+ /?2л sin пщ cos (5wwc/), (12.2.82)
ф^ + 1ф;+^-ф^ = -^ф;. (12.2.73) („ = o,i,2,...; /я = 1,2,3,...),
Частные решения ищутся в виде где Ътп = у™/а и yff - нули функции
Ф(г,ф,/) = w(r)v((p)T(t) , (12.2.74) Бесселя Jn(x).
490
Глава 12.3. ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ И ФУНКЦИИ
Глава 12.3
ЭЛЛИПТИЧЕСКИЕ
ИНТЕГРАЛЫ И ФУНКЦИИ
12.3.1. Эллиптические интегралы.
Эллиптическим интегралом называют функцию
х
F(x) = J f(x)dx , (12.3.1)
а
где f(x) — рациональная функция х и
квадратного корня yJG(x), причем G(x) —
полином третьей или четвертой степени без
кратных корней. Полная теория
эллиптических интегралов предусматривает, что х —
комплексная переменная. Мы ограничимся,
как правило, случаем вещественных х и
fix).
С помощью преобразований и замен
переменных интеграл (12.3.1) может быть
приведен к сумме элементарных функций и
линейной комбинации интегралов [2, 5]:
t f t
Г dt Г tdt с dt
\Щ9 \Щ' {(t-c)y[6
G(t)
(12.3.2)
которые называют нормальными
эллиптическими интегралами соответственно 1-го, 2-го и
3-го рода. (Здесь с не является корнем
полинома (/(/))• В свою очередь эти интегралы
могут быть приведены заменой переменных к
нормальной форме Вейерштрасса, Римана или
Лежандра. В приложениях используют
наиболее часто нормальную форму Лежандра. В
этом случае осуществляется замена х = х(ф) ,
такая, что
dtp
•*2sin2q>
, (12.3.3)
где q — некоторая постоянная. В [5]
приведена таблица таких преобразований и
соответствующих выражений для k, q в
зависимости от характера корней полинома G(x).
Например, если G(x) - полином третьей
степени с коэффициентом 1 при х ,
имеющий три вещественных корня аз < «2 < otj и
аз < х < <Х2 , то
х = а3 + (а2 -a3)sin2<p,
/с2 = «2-а3
я = -
«1 " «3 ' Va2 - «3
-. (12.3.4)
Нормальными эллиптическими
интегралами Лежандра (неполными) 1-го, 2-го и 3-го
рода называют интегралы соответственно
J, ^ 2 , JVl-*2SinV<p,
J0>/1-A:2sm2(p J0
f <*<P
o(l+csin2(pWl-
A:2sin29
. (12.3.5)
Первые два интеграла представляют собой
функции двух переменных ф, к, их
обозначают соответственно F(<p,k) и Е(у,к);
величину к называют модулем эллиптического
интеграла. Постоянную с в третьем
интеграле называют параметром этого интеграла.
После замены х = sin <p эти интегралы
принимают вид
dx
■■It
л.
lj(i-J)(i-kV)' {IT
V
dx
\-klx
iji
-dx,
|(l + cVy(l-x2)(l-ikV)
(12.3.6)
Полные нормальные эллиптические
интегралы 1-го и 2-го рода обозначают
соответственно через К(к), Е(к), и они равны
я/2
о yi — Л: sin ф
л/2
(12.3.7)
Е(А:) = J ^1-*2 sin2 q>rfq>.
В таблицах этих интегралов обычно
используют в качестве аргумента так называемый
модулярный угол a = arcsin к .
Вместе с интегралами К(к) и Е(к)
рассматривают интегралы
я/2
I yjl - к'1 sin2 ф
= К(*') = К',
ЭЛЛИПТИЧЕСКИЕ ФУНКЦИИ ЯКОБИ
491
Ф
J V1 — к'2 sin2 Ф <*Р = ЩкГ) = Е', (12.3.8)
где к' = VI - к . Модули А; и &' называют
дополнительными по отношению друг к
другу, а интегралы К и К', а также Е и Е'
называют связанными полными
эллиптическими интегралами. Имеет место следующее
соотношение:
ЕК' + ЕГК-КК' = ^. (12.3.9)
Интегралы К(к), Е(к) как функции модуля
к удовлетворяют дифференциальным
уравнениям:
*(l-*2)K" + (l-3*2)K'-*K = 0,(12.3.10)
*(l - £2)Е" + (l - £2)E' + kE = 0. (12.3.11)
Разложения этих интегралов в ряды по
степеням А; имеют вид:
и эти ряды удобны для вычислений при
малых к. Если же модуль к близок к I, то
целесообразно применить (однократно или
последовательно несколько раз) формулу
К(к):
2 irfl-П
l + jfc' [l + k')'
(12.3.14)
поскольку (1 -к')Ц\ + к')<к . Например,
если к =0,99, то
К(0,99) = 1,752К (0,752) =
= 1,752-1,206К (0,206) = ...
Если построить последовательность
2#£Т
ко — к , кп
\ + к'
-, /2 = 1,2,3,...,
п-\
то из (12.3.14) вытекает формула
2
1 л=0 1 + К»
(12.3.15)
(12.3.16)
Ж(*)-§
**)«§
(12.3.12)
к4-...
(12.3.13)
удобная для вычислений. Интеграл
К(к') = К' вычисляется при модулях к',
близких к 1 , по этим же формулам после
замены к§ , к'п соответственно на к§ , кп.
Приведем краткую таблицу значений
К(к), К'(к) как функций модулярного угла
а = arcsin к :
а°
К
Е
0
1,571
1,571
10
1,583
1,559
20
1,620
1,524
30
1,686
1,468
40
1,787
1,393
50
1,936
1,306
60
2,156
1,211
70
2,505
1,118
80
3,153
1,040
85
3,832
1,013
Более подробные таблицы см в [13].
12.3.2. Эллиптические функции Якоби.
Согласно общему определению,
эллиптическими функциями называют мероморфные
двоя ко-периодические функции
комплексного аргумента. Достаточно полная теория
таких функций изложена в работе [4], см.
также [2, 5, 13]. Наиболее подробно
разработана теория двух конкретных классов
эллиптических функций: функций Якоби и Вейер-
штрасса. Мы ограничимся информацией об
эллиптических функциях Якоби; эти функции
часто встречаются в приложениях.
Определение эллиптических функций
Якоби связано с обращением эллиптического
интеграла 1-го рода. А именно, если и(ф) -
функция аргумента ф, выражаемая интегралом
н(ф) = |
*/ф
у]\ - к2 sin2 ф
(12.3.17)
то величину sin ф, рассматриваемую как
функцию и , называют эллиптическим синусом
Якоби и обозначают sn и, а величину
cosy(u) - эллиптическим косинусом Якоби и
обозначают спи. Функцию ф(н), обратную
по отношению к и(ф) , называют амплитудой
и и обозначают am и. Кроме того, вводится
492
Глава 12.3. ЭЛЛИПТИЧЕСКИЕ ИНТЕГРАЛЫ И ФУНКЦИИ
также третья эллиптическая функция Якоби
дельта амплитуды, равная ^1 - к sin ф , и
обозначаемая dn и . Таким образом,
sn и = sin ф = sin(am и),
сп и = cos ф = cos(am и),
dn = yjl - к2 sin2 ф = Jl - к2 (sin(am и) .
(12.3.18)
Очевидны следующие соотношения:
sn2 и + сп2 и = 1, dn2 и + &2sn2 и = 1.
(12.3.19)
Фактически эти функции являются функциями
двух аргументов и, к, так что правильнее
обозначать sn(u,k)9 сп(и,к), dn(w,&),
но обычно второй аргумент опускают.
12.3.3. Периодичность и другие
свойства эллиптических функций Якоби.
Функции Якоби вещественных аргумента и и
модуля к являются, как и обычные
тригонометрические функции, периодическими по
и , но с периодом, зависящим от модуля к ; а
именно, sn и и сп и имеют период, равный
4К(к), a dn и имеет период 2К(к), причем
snu — нечетная функция, а спи и йпи -
четные функции аргумента и , так что
sn(u ± 4К) = sn и, сп(и ± 4К) = сп и,
dn(w±2K) = dnw,
sn (-и) = -sn и , сп (-и) = сп и ,
dn(-i/) = dna. (12.3.20)
Справедливы формулы приведения,
аналогичные таким формулам для
тригонометрических функций:
. ~4 спи , „ч fc'snw
sii(h + K) = -—, сп(н + К) = — ,
dnw dnw
dn(w + K) = —,
dnw
sn(w + 2K) = -snu, cn(w + 2K) = -enw ,
dn(H + 2K) = dnH,
, ожгч en i/ / ожгч к'snu
snu/ + 3K) = , en(u + 3K) = ,
v dni/ dni/
(12.3.21)
dn(i/ + 3K) =
dni/
Таблица "опорных" значений
эллиптических функций следующая:
U
sn и
СП И
dn u
0
0
1
1
iK
(l + /fc')~2
V/P(l+it')"2
VF
к
l
к'
iK
(l + /t')"2
-VF(i + /t'p
VF
2K
0
1
fK
-(l + /t')"2
-VF(i + /fc')"2
VF
3K
-1
*'
f*
-0 + *T*
VF(i + /t')"2
VF
Справедливы также следующие формулы
для функций Якоби от суммы аргументов и от
половинного аргумента, аналогичные
формулам для тригонометрических функций:
sn (а + Р) = (sn а сп р dn р + sn р сп а dn a)/Q,
сп (а + Р) = (сп а сп р - sn а dn а sn p dn P)/G,
dn (а + Р) = (dn а dn р - к 2 sn а sn р сп а сп р) /Q,
(12.3.22)
? а 1 - dn а ? а сп а + dn а
2 (1 + спа)*:2' 2 1+dna
где
. 2 ос сп а + dn a
dn т = —; »
2 1 + сп а
Q = l-Jfc2sn2asn2p.
(12.3.23)
12.3.4. Поведение функций Якоби при
различных модулях. При к = 0 функции
snu и спи вырождаются в
тригонометрические соответственно sin w, cos и. При малых
к отличие графиков snu, спи от графиков
sin w, cos и небольшое, но с ростом к это
отличие увеличивается. При к —» 1 период
4К стремится к «> 9 а sn и и сп и стремятся
РАЗЛОЖЕНИЯ ЭЛЛИПТИЧЕСКИХ ФУНКЦИЙ В РЯДЫ ФУРЬЕ
493
соответственно к гиперболическим th// и к
1/ch//.
12.3.5 Функции Якоби мнимого и
комплексного аргументов. Полная теория
эллиптических функций Якоби
предусматривает, что аргумент этих функций
комплексный, т.е. рассматриваются функции sn w,
en w , dn w , где w = и + iv и и , v -
вещественные переменные. При этом имеют место
формулы:
sn (w, к) = — sn (f, к') en (v, к') х
Л,
хсп(и,к)д\л(и,к) + —sn(uyk)6n{v,k'),
(12.3.24)
cn(w,k) = — en (//,&') en (t>,£')-
-—sn(^&')dn(t>,A;')sn(//,A:)dn (//,&),
(12.3.25)
dn(w,A:) = — dn(//,&)cn(t>,/:')dn(a,&')-
где /я , л — любые целые числа, так что
эллиптические функции являются в
комплексной области так называемыми двояко-
периодическими с двумя основными (или
примитивными) периодами:
©!=«, со2=2/К',
со^К, со2=2(К + /К'),
щ = 2К , со2 = 4/К' •
(12.3.30)
Из этих формул также следует, что
эллиптические функции обладают в
комплексной области полюсами (в которых модули
функций обращаются в«>):
wmn = 2/яК + (2л + 1)/К', /я, п = 0,1, 2,...
(12.3.31)
12.3.6. Производные и интегралы.
Справедливы следующие формулы:
(sn//) = cn//dn//, (en//) =-sii!/-dnz/,
(dn//)' = -khnu спи , (12.3.32)
/*2
sn (v, k') sn (//,&) сп (и, к),
с , l . йпи-i
\snuau = — In
i * 1-
1 f dn// - A: en и
1 '
(12.3.33)
(12.3.26)
где
i
\cv\udu = — arcsin(&snz/),
\ = cnz(v,k') + kIsnI(u,k)sn2(v,k')
(12.3.27)
и А:' - дополнительный модуль. Эти
формулы выражают функции Якоби комплексного
аргумента через эти же функции
вещественных аргументов. В частности, если и = 0 , то
.sn(v,k') 1
„„(/0,*)»*1М1 (.2.3.38)
en (и,/:)
Из этих формул следует, что эллиптические
функции обладают не только вещественным
периодом, но также мнимым или
комплексным. А именно:
sn (w + 4/яК + 2/azK') = sn w,
en [w + 4/яК + 2л (К + /К')] = en w , (12.3.29)
dn (w + 2/wK + 4я/К') = dn w,
f , , r dn// , sn//
\ anudu = amz/, —=—//// = ,
i icn2// en//
о о
f dn// , en//
—r—dn//= . (12.3
isiri/ sn//
.34)
12.3.7. Разложения эллиптических
функций в ряды Фурье. Функции sn//,
спи периода 4К и функции dn//, am//
периода 2К в вещественной области могут
быть разложены в ряды Фурье по косинусам
и синусам аргументов, кратных соответственно
7Ш/2К и пи/К :
sn
// = г=> —^Ц—j-sin (2//-1)—г ,
(12.3.35)
dn/
■ X * г»г\с
2К к4?1+<72" к
.3.36)
~1+?
494
Глава 12.4. НЕКОТОРЫЕ ИНТЕГРАЛЬНЫЕ ФУНКЦИИ
Интегральный логарифм li(x) опреде-
сш
2к ^ д" (п ики\ интегральный
Ш ~ kKJa^l+ 2"+lCOS|( ~ ' 2К Г ляется Формулами :
(12.3.37) * л
И^=1Г7' 0<х<1> (12.4.6)
7Ш ~^-« Я . /1711/ J- Ш'
"■5к + 2§^=)5шТГ-
я// ~^ q" . /пси n
am//= —г + 2> —-^—r-rSin °
1-е . х
[ — [ —
J ln/+ J In/
О 1+е
, х>1. (12.4.7)
(12.3.38) Ц(х) = Нт
е—»0
где q = ехр(-лК'/К). Они удобны для
вычисления эллиптических функций Якоби при Интегральная показательная функция
малых q. Более точные формулы, удобные Щх) определяется интегралом
для вычисления этих функций при любых q
см. в [1]. Таблицы эллиптических функций х t
см. в [12]. Ei(x) = J —A, x<0. (12.4.8)
Глава 12.4
НЕКОТОРЫЕ ИНТЕГРАЛЬНЫЕ
ФУНКЦИИ бой Формулами
Функции Ei(x) и Ц(дс) связаны между со-
12.4.1. Интегральные синус, косинус, Ei(x)-li^e j, дс<0,
(12.4.9)
логарифм, показательная функция. Инте- Ei(Injc) = li(x) x>0.
гральный синус Si(x) определяется
интегралом Функции Si (x), Ci (x), Ei (дс) выражаются
Si
х также следующими рядами:
Г sin/
.5
(x)-JSH£*. (12.4.1) з lx,
о ' SiW = x"IiT + ?!T"-; (12A10)
Вместо Si(x) рассматривают также
интегральную функцию _, 1 дс2 1 х4
CiW = C + lnx-^ + ^-..., х>0;
si(jc) = Si(jc)-| = J^prf/. (12.4.2) (12.4.11)
х и2 1х3
Интегральный косинус Ci(дс) определя- Ei(Х) = С + hi(-x) + х + ^"J" + зТ~ + ""'
ется интегралом
•cos/
х<0. (12.4.12)
С'\(х) = -\^-А, х > О , (12.4.3) 12.4.2. Интегралы Френеля. Интегралы
х ' Френеля, обозначаемые С (дс) и S (дс), опре-
или формулой деляются формулами:
Ci(*) = C + In*-jI^*, (12.4.4) C(oc) = Jcos^/2j*
где С — постоянная Эйлера, равная
С = lim
О ° ' (12.4.13)
х
S(x)
( п , Л
Х1-.„я
-!*{РУ
и следующими рядами:
= -/е-Мп/Л = 0,5772157. (12.4.5) С<*> = /i(§^)+/f(f^)+/|(f**)
+ ...,
(12.4.14)
ГАММА- И БЕТА-ФУНКЦИИ ЭЙЛЕРА
495
(12.4.15)
^7^2 , п = 1, 3,5,..., - функции
где
Бесселя аргумента — х .
При этом
Г(х) = ft^e-'dt, х>0, (12.4.19)
О
называемым также интегралом Эйлера 2-го
рода. Из этой формулы непосредственно
следует, что Г(1) = 1 и Г(х) -» оо при х -» 0.
Эта функция определяется также
следующими формулами:
1
С(оо) = S(oo) = --. Имеют место следующие
асимптотические формулы:
Г(х) = lim
С(х) = - +—sin
2 юс
(12.4.46)
Эти формулы отражают достаточно точно
характер поведения данных функций.
12.4.3. Функция ошибок и интеграл
вероятности. Функция оишбок, обозначаемая
erf (x), определяется интегралом
л->- х(х + 1)(х + 2)...(х + п)
(12.4.20)
(С—постоянная Эйлера), (12.4.21)
справедливыми при всех х > 0 , х < 0 ,
кроме точек х = 0, - 1, - 2,..., где Г(х) терпит
бесконечный разрыв.
Одним из важных соотношений для
гамма-функции является следующее рекуррентное:
хГ(х) = Г(х + 1), (12.4.22)
erf(x
dt. (12.4.17)
откуда, в частности,
Г(л + 1) = л!, /1 = 0,1,2,
(12.4.23)
При х —> ©о имеем erf (оо) = 1. Интеграл
вероятностей, обозначаемый Ф(х) и часто
называемый в теории вероятностей функцией
Лапласа, определяется интегралом
«к*)
связан
•W-i«f(£).
V2^o
erf(jc)
При
2
2*
(12.4.18)
Поэтому гамма-функцию называют иногда
факториальной функцией.
По этой формуле можно вычислять
Г(х) при отрицательных х. Например,
Г(-0,3) = -^Г(0,7);
Г(-2,5) = --
1
соотношением
х —> оо имеем
Эти функции широко используются в
теории вероятностей и в задачах
математической физики, связанных с решением
уравнения теплопроводности.
12.4.4. Гамма- и бета-функции Эйлера.
Для строгого определения и анализа свойств
этих функций требуется их рассмотрение как
функций комплексной переменной. Мы
ограничимся краткой информацией, считая, что
их аргумент х вещественный.
Гамма-функция Эйлера, обозначаемая
Г(дс), определяется при вещественных х > 0
интегралом
2,51,5 0,5
Из нее также вытекает, что
Г(х) ->-оо, Г(х)
х-»-1+0 *-»-1-0
ПО, 5).
Цх)
х->-2+0
Г(х)
*-*-2-0
Справедлива при больших х > 0
следующая асимптотическая формула
Г(х) = е-*4=Л^
Я
L 12jc 288jc2 v ;J
(12.4.24)
откуда
Г(я + 1) = я! = я"е-ял/2^. (12.4.25)
Вместе с гамма-функцией, определяемой
согласно (12.4.19) и называемой иногда полной
496 Глава 12.5. ГИПЕРГЕОМЕТРИЧЕСКАЯ ФУНКЦИЯ. ОРТОГОНАЛЬНЫЕ ПОЛИНОМЫ
гамма-функцией, применяют также так
называемые неполные гамма-функции. Они
обозначаются у(х,у), Г(х,у) и определяются
интегралами [3]
у(х,у) = je'ftx-[dt, Г(х,у) = je-ftx-[dt.
(12.4.26)
Используются и другие обозначения.
Например, первая из этих функций
обозначается [5] через Гу(х).
Бета-функция (полная), обозначаемая
обычно B(p,q) определяется интегралом
I
B(p,q) = jtP-l(l-t)l-ldt, p>0, q>0,
О
(12.4.27)
называемым интегралом Эйлера 1-го рода. Эта
функция зависит от двух аргументов /?, q и
выражается через гамма-функции формулой
B(p,q)=*Wl. (12.4.28)
П/> + q)
Применяют также неполную бета-
функцию, обозначаемую в [4] через By(p,q)
и выражаемую интегралом
У
By(p,q) = \tP-\\-t)q-{dt. (12.4.29)
О
Подробную информацию о гамма- и бета-
функциях см. в [3, И], таблицы значений - в
[5-7, 13].
Глава 12.5
ГИПЕРГЕОМЕТРИЧЕСКАЯ ФУНКЦИЯ.
ОРТОГОНАЛЬНЫЕ ПОЛИНОМЫ
При решении многих задач
математической физики, при разложении различных
функций в обобщенные ряды Фурье, при
аппроксимации функций широко
используются ортогональные системы полиномов;
наиболее часто — полиномы Лежандра, Че-
бышева, Эрмита, Лагерра. Все они являются
решениями некоторых линейных
дифференциальных уравнений 2-го порядка и могут
быть выражены через гипергеометрические
функции, а также с помощью
дифференцирования соответствующих так называемых
производящих функций; они удовлетворяют
однотипным рекуррентным формулам. Их
подробный анализ как функций комплексной
переменной см. [3, 11]. В инженерных задачах
их рассматривают обычно при вещественных
значениях аргумента х, которыми мы здесь и
ограничиваемся.
12.5.1. Гипергеометрическая функция.
Обыкновенное дифференциальное уравнение
х(х - \)у" + [(а + Ь + 1)х - с\У + aby = 0,
(12.5.1)
где а, Ь, с — постоянные, называется
гипергеометрическим уравнением Гаусса. Его
частное решение, выражаемое рядом
, ч f ah а(а + \)Ь{Ь + \) 2
у(х) = 1 + х + — — '-х1 +
УУ } 1-е 2!с(с + 1)
уа(а + \)(а + 2Ж6 + 1) 0 + 2)^ ,
3!с(с + 1)(с + 2)
(12.5.2)
называют гипергеометрическим рядом или
гипергеометрической функцией Гаусса и
обозначают F(a,b,c,x). Этот ряд сходится
абсолютно и равномерно при \х\ < 1.
Обыкновенное дифференциальное
уравнение
ху" + (с - х)у' -ay = Q, a,c = const,
(12.5.3)
называют вырожденным гипергеометрическим
уравнением и его частное решение,
выраженное рядом
/41 я д(д + 1) 2
у(х) = \+—x+-f- '-х1 +
1-е 2!с(с + 1)
д(д + 1)(д + 2) з /1*чг „ч
+—± >1 i_xJ +. (12.5.4)
3!с(с + 1)(с + 2)
называют вырожденным гипергеометрическим
рядом или вырожденной (или конфлюэнтной)
гипергеометрической функцией, обозначаемой
F(a,c,x). Многие элементарные функции и
также рассматриваемые ниже ортогональные
полиномы могут быть представлены как
частные случаи гипергеометрических функций.
12.5.2. Полиномы Лежандра Рп(х).
Полином Рп(х) при фиксированном п
(п = 0,1, 2,...) является решением
дифференциального уравнения
(1 - х2)у" - 2х/ + п(п + \)у = 0 . (12.5.5)
ПРИСОЕДИНЕННЫЕ ФУНКЦИИ ЛЕЖАНДРА
497
Полиномы Рп(х), п = О,1,... являются также 12.5.3. Присоединенные функции
коэффициентами разложения функции Лежандра Р^т\х). Функции Р^т\х) при
(1-2яс + 52р (называемой производящей Фиксированных п, т (п = 0,1, 2,..., т = 1,
' 2,..., п) удовлетворяют дифференциальному
для полиномов Лежандра) в ряд по степеням s : „^я„„в„„.л
уравнению
(1-2ях + 52р = 5>л(*У, (12.5.6) (i_xV-2x)/- ~2
/1=0 ' '
/ 1\ т
1-х2
>> = 0
сходящийся при |s| < 1 . Дифференцирование (12.5.13)
этой функции по s позволяет вывести еле- и выражаются при |х| < 1 обобщенной фор-
дующую дифференциальную формулу мулой родрига
(называемую формулой Родрига):
Справедливы следующие рекуррентные соот- (12.5.14)
ношения:
При /я = 0 Р„(х) = Р„(х) и при т>п
Рп+\ (х) = п + 1 хРп(х) ~ ^|ГТ^я-1^ ' Р$т)=0. Справедливы рекуррентные соот-
(12.5.8) ношения:
Pn+i(x) = хрп(х) + 2^±Г.{х). V" + »хР»т) W " С " " + ^ <*> -
П + Х (12.5.9) Чя + «)/>,Й)(*) = 0, (12.5.15)
Выражение Р„(х) через гипергеометриче- ^(т+г)/^ 2(ят i 1) * Plm+l){r) i
скую функцию следующее: " М _ ^ "
2
Рп(х) = р(-п,п + 1,1,1-^-\ (12.5.10) Чп-т)(п + т + 1)РЦ"\х) = 0. (12.5.15)
^ ' Выражения нескольких первых таких функ-
Первые шесть полиномов Рп(х), п = 0,1, ...,5, ций следующие:
Р0 = 1, Л(дс) = х, i>2(*) = 1(3дс2 -1), р(2)(х) = з(1 - х2),
Р3(х) = i(5x3 - Зх), /,0)(JC) = Ц5х2 _ 1)VTT?,
(12.5.11) 2
/>,(*) = !(35*4-З0х2 + 3), ' /»3(2)(*) = 15*(l-*2),
, />з(3)(х) = 15(1-л:2)^1-:с2-
P5(x) = ±(63x5-7Qx3 + l5x). (12517)
Бесконечная система полиномов Р„(х), При я =/и имеет место следующая формула:
я = 0,1, 2,... образует ортогональную систему Р^т\х) = 1-3-5 (2п - \)(\ - х2)2
на отрезке [-1,1], так как ^ '
/2 = 0,1,2,.... (12.5.18)
0, т * л,
2 (12.5.12) Бесконечная система функций
J P„(x)Pm(x)dx =
т = п.
2и +1 л = 0,1, 2,..., при любом фиксированном
498 Глава 12.5. ГИПЕРГЕОМЕТРИЧЕСКАЯ ФУНКЦИЯ. ОРТОГОНАЛЬНЫЕ ПОЛИНОМЫ
т = О,1, 2,..., образует ортогональную
систему на отрезке [-1,1], причем
1
jP<;m)(x)p(m)(x)dx =
-1
О, п*к,
2 (п + т)\
п = к.
[2п+1(п-т)\
(12.5.19)
12.5.4. Полиномы Чебышева.
Полиномы Чебышева 1-го рода, обозначаемые
Тп{х), удовлетворяют дифференциальному
уравнению
(l - х2 )/' - х/ + п2у = 0. (12.5.20)
Производящая функция, равная
1 -sx
Un(x) = тТп+1(х) (12.5.28)
/2-1-1
и удовлетворяют дифференциальному
уравнению
(l - х2)у - Ъху' + п(п + 2)у = 0 . (12.5.29)
Они образуют аналогичную ортогональную
систему, но с весом у(х) = V1 - х :
1 I
j([-x2)2Un(x)U,„(x)dx =
-1 (12.5.30)
0, я*/и, п = т = 0,
[я/2, п = т *0.
-С
1 - 5ДС + S
2 '
разлагается в ряд
У£Тп(х)зп
л=0
(12.5.21)
(12.5.22)
Явные выражения:
TH(x) = F\n9-n,±,l^-
), (12.5.23)
Тп (х) = cos(/z arccosx). (12.5.24)
Дифференциальная формула (обобщенная
формула Родрига):
'■«-Шг^
О-2)"
(12.5.25)
Свойство ортогональности с весом
у(х) = (1 - х J 2 на отрезке [-1,1]
выражается интегралом
[0, m * п,
)T»{pl^X)dxAnl2, m = n*0,
0 J1-** [*, « = n»0.
(12.5.26)
Справедливо рекуррентное соотношение
Т„+1 (х) = 2хТ„ (х) - Т„.{ (х). (12.5.27)
Полиномы Чебышева 2-го рода Un(x)
определяются формулой
Кроме полиномов Тп{х) используют
также так называемые смещенные полиномы
Чебышева Т^(х) , определяемые на отрезке
[0,1] формулой
Т*(х) = Тп(2х -1) = cos(azG) , (12.5.31)
где cos0 = 2x-l, /1 = 0,1,2,... Первые
четыре полинома Тп(х), Т^(х) следующие:
7о = 1. 7о=1,
r,(x) = x, Г,*(*) = 2х -1,
Т2(х) = 2х2-\, Т{ = Sx2 - Sx + 1 ,
7,з(д:) = 4х3-3д:,
7?(х) = 32х3-48л:2 + 18х-1.
(12.5.32)
12.5.5. Полиномы Эрмита Н/7(дс).
Дифференциальное уравнение для полиномов
Эрмита:
ху"-2ху' + пу = 0, /2 = 0,1,2,... (12.5.33)
Разложение производящей функции:
-s2+2sx
e-s+2sx = ^Hn(x)^. (12.5.34)
л=0
Обобщенная формула Родрига:
Н„(х) = (-\)"ех2-^(е-х2\ (12.5.35)
ПОЛИНОМЫ ЛАГЕРРА
499
Рекуррентные формулы: Обобщенная формула Родрига:
Hn+{(x) = 2xHJx)-2nHn_{(x), (12.5.36) 1 v dn i „ r\
n+l /,v ' wlw Ln(x) = —ex-^(x"e-x). (12.5.46)
Н'п{х) = 2пНя_х(х). (12.5.37) "! <*"
n Разложение производящей функции :
Явные выражения через вырожденную
гипергеометрическую функцию: __?L_ «>
, п„ / , ч пе(И=1^". (12.5.47)
Н2л(х) = ^-(2я)!^ -я, i,x2 , (12.5.38) «=0
^ ' Явные выражения:
L„(x) = F(-n,l,x), (12.5.48)
Н2л+1 (*) = ^Г(2я + l)!2xf f-я, |, х21.
1„(х) = я! У (-l)m f • (125.49)
Система полиномов Эрмита ортогональна на •". (/я!) (я-/и)!
(12.5.39)
альна на
2
интервале (-~.ee) с весом у(х) = е и при Рекуррентные формулы:
этом
L„+] (х) = (2я +1 - x)L„{x) - n2L„_i(x),
Ге-дс2[Ня(х)]2^ = 2пя!^. (12.5.40) (|15-50)
L„+l(x) = (n + l)[L'n{x)-L„(x)]. (12.5.51)
Первые шесть полиномов Н„(х), я=0,1,...,5, Система функций L„(x) ортогональна на
следующие:
Н0 =1, Нх(х) = 2х, Н2(х) = 4х2-2,
.3
интервале (0,оо) с весом у(х) = е х и при
этом
Н3(х) = 8х -12х, fe-*[Ln(xj\2dx = l. (12.5.52)
Н4(х) = 16х4-48х2 + 12, °
Первые пять полиномов Лагерра Ln(x),
Н5(х) = 32х5 - 160*3 +120*. л = 0,1,..., 4 , следующие:
(12.5.41)
Кроме полиномов Эрмита применяют
также функции Эрмита
1о=1, Ц(х) = -х + 1,
, L2(x) = i(x2-4x + 2),
х|/л(х) = е-х/2Н/|(х), л = 0,1,2,...,(12.5.42) ^ '
удовлетворяющие дифференциальному урав- Шх) = -Н-х3 + 9х2 - 18х + б)
нению 3 3^ ''
у" + (2я + 1 - *2)>> = 0 . (12.5.43) Ц{х) = ^4 _ [6х3 + ?2х2 _ %х + 24)
Система этих функций ортогональна на ин- (12.5.53)
тервале (-00,00) и при этом „ - - ...,л.,,.
к v » / f Применяют также обобщенные полиномы
°} 2 Лагерра L^\x), удовлетворяющие диффе-
J [уя(дс)] dx = 2"n\j2n . (12.5.44) ренциальному уравнению
~~ ху" + (а + \-х)у' + пу = 0. (12.5.54)
12.5.6. Полиномы Лагерра.
Дифференциальное уравнение для полиномов Ла- Обобщенная формула Родрига:
герра, обозначаемых через LJx), следующее: t ,n t
#>(*) = -е^'а — e-xx"+a . (12.5.55)
*/' + (!-х)/ + я.у = 0. (12.5.45) "л! dfx" v '
500 Глава 12.5. ГИПЕРГЕОМЕТРИЧЕСКАЯ ФУНКЦИЯ. ОРТОГОНАЛЬНЫЕ ПОЛИНОМЫ
При а >-1 система полиномов L„'(x),
п = 0,1, 2,..., ортогональна на интервале
(0,оо) с весом у(х) ■■
е хха и при этом
Je-*jca[4a>(x)]2dbc =
Г(л + а + 1)
п\
(12.5.56)
Применяют также так называемые при-
соединенные функции Лагерра
упа(х) = ха'2е-х'ЧЫ(х), (12.5.57)
удовлетворяющие дифференциальному
уравнению
«.2^
ху + у + \п +
5 + 1
2 4 Axj
(12.5.58)
Система этих функций ортогональна на
интервале (0, ©о) с весом у = 1, и интеграл от
квадрата таких функций совпадает с
интегралом (12.5.52).
В заключение укажем, что все полиномы
Р„(х), Тп(х), L„(x), 4a)(*), H,,(x) сте-
пени п обладают на отрезке [-1,1] или на
интервалах (-оо)0о) , (0,оо) п простыми
корнями, и что полиномы Рп(х), Тп(х)
ограничены на отрезке [-1,1] неравенствами
\Р„(хЦ(й1, |ВД|<1.
Более подробная информация об
ортогональных полиномах имеется в [1, 3, 5, 10].
СПИСОК ЛИТЕРАТУРЫ
1. Аксенов Е.П. Специальные функции
в небесной механике. М.: Наука, 1986.
2. Ахиезер Н.И. Элементы теории
эллиптических функций. 2-е изд. М.: Наука,
1970.
3. Бейтмен Г., Эрдейи А. Высшие
трансцендентные функции. Т.2. М.: Наука, 1974.
4. Ватсон Г.Н. Теория бесселевых
функций. М: Изд. иностр. лит., 1949.
5. Корн Г.К., Корн Т.К. Справочник по
математике. М.: Наука, 1973.
6. Пагурова В.И. Таблицы неполной
гамма-функции. М: Наука, 1963.
7. Пирсон К. Таблицы неполной бета-
функции: Пер. с англ. М.: 1974.
8. Попов Б.А., Теслер Г.С. Вычисление
функций на ЭВМ. Киев: Наукова Думка,
1984.
9. Справочник по специальным
функциям с формулами, графиками и
математическими таблицами / Под ред. М. Абрамовица и
И.Стиган. М.: Наука, 1979.
Ю.Тихонов А.Н., Самарский А.А.
Уравнения математической физики. 5-е изд. М.:
Наука, 1977.
П.Уиттекер Э.Т., Ватсон Д.Н. Курс
современного анализа. Т.2. М.: Физматгиз, 1963.
12. Шулер М., Гебелейн X. Таблицы
эллиптических функций. М.: ВЦ АН СССР,
1961.
13.Янке Е., Эмде Ф., Леш Ф.
Специальные функции (формулы, графики, таблицы).
М.: Наука, 1968.
Раздел 13
УРАВНЕНИЯ МАТЕМАТИЧЕСКОЙ ФИЗИКИ
(УМФ)
Глава 13.1
ОБЩИЕ СВЕДЕНИЯ ОБ УМФ
Многие процессы в различных областях
естествознания (электростатике,
электродинамике, гидродинамике, теории упругости,
статистической физике, химии, биологии и
др.) описываются уравнениями и системами
уравнений с частными производными (ч.п.).
13.1.1. Основные определения. Система
уравнений с ч.п. относительно неизвестной
вектор-функции и(х) = {w| (x),...,um(x)} в
области Qcl" = |х = (Х|, ...,хп )} в общем
случае имеет вид
^v(x,tt|,...,i/llf,...,Oai//,...) = 0, i = l,...,/и,
где a = (СХ| ,...,aw ) - мультииндекс; ay —
целые неотрицательные числа; |а| = (Х|+...
эи
+а„, Da = . В этом разделе
Э*,"1 ...Эх"»
будет рассматриваться одно уравнение
относительно неизвестной скалярной функции
f(x,u,...,Dau) = 0. (13.1.1)
Наивысший порядок входящей в
уравнение ч.п. называют порядком уравнения.
Решением уравнения' (13.1.1) k-го порядка
называют к раз дифференцируемую функцию
и(х), обращающую его в области Q в
тождество. Уравнение (13.1.1) называют линейным,
если оно линейно относительно неизвестной
функции и ее ч.п. Общий вид линейного
уравнения к-то порядка
£fla (x)Dau = /(*).
Если в этом уравнении коэффициенты
аа зависят еще и от неизвестной функции и
и ее ч.п. порядка меньшего, чем к, то
уравнение называют квазилинейным.
В гл. 13.1 - 13.3 будут рассмотрены
линейные уравнения 2-го порядка. Их общий
вид
п
Lu= S aij(X>>UXiXj +
'■">=| (13.1.2)
+]£ ft/(*)"*, +c(x)u = f(x),
/=l
/i
где \bj(x)uXj +c(x)u - младшие члены
/=l
(мл. чл.).
Сумму всех членов с ч.п. 2-го порядка
называют главной частью уравнения (13.1.2).
Пусть ы(£)= \u(x)e~i{x^)dx - пре-
Q
образование Фурье функции и(х). Тогда
преобразованием Фурье главной части уравнения
(13.1.2) с коэффициентами в фиксированной
502
Глава 13.1. ОБЩИЕ СВЕДЕНИЯ ОБ УМФ
точке х будет (после деления на / =-1)
квадратичная форма
]|>//(*)Ыу. (13.1.3)
Ее называют главным символом (или
просто символом) уравнения (13.1.2). Уравнение
ХМ*)Ыу =0 (13.1.4)
относительно переменных £,-(/ = 1,...,л)
называют характеристическим уравнением
уравнения (13.1.2) в точке xgQ; вектор
% - (£| j — j^n ) » удовлетворяющий уравнению
(13.1.4) - характеристическим направлением
уравнения (13.1.2) в точке х. Гладкую
поверхность S, в каждой точке которой нормальный
вектор является характеристическим
направлением, называют характеристикой.
13.1.2. Классификация линейных
уравнений с ч.п. 2-го порядка. При
и(х) е С2 (П) матрицу А(х) = fa (дс)|
можно считать симметричной (ибо при
Qy Ф djj в силу того, что их.х. = их.х ,
каждый из коэффициентов ау и ayt можно
заменить их полусуммой). Уравнение (13.1.2)
классифицируют в зависимости от корней
уравнения
det||/f(x)-A£j = 0 (13.I.5)
(здесь Е — единичная матрица) относительно
X при фиксированном х. Так как матрица
А(х) вещественная симметричная, то все
корни А.|,...ДЛ уравнения (13.1.5) вещественны.
Возможны случаи:
1) А,- фО (V/ = 1,...,h) и все А,-
одного знака;
2) Х{ Ф О (V/ = 1,...,л) и один корень
противоположного знака с остальными;
3) А,,- ФО (V/ = l,...,w) и более чем
один корень одного знака и более чем один
корень другого знака (это возможно при
я>4),
4) среди А,|,...ДЛ имеются равные
нулю.
Уравнение (13.1.2) в случае 1) называют
эллиптическим в точке х, в случае 2) —
гиперболическим, в случае 3) —
ультрагиперболическим, в случае 4) — параболическим в широком
смысле.
Квадратичную форму (13.1.3)
невырожденным линейным преобразованием Т] = С£
можно привести к каноническому виду. В
эллиптическом случае (умножая, может быть,
матрицу шЛ на -1) получим V тгг , в ги-
Ы
перболическом (изменив, может быть,
нумерацию переменных и знак матрицы) —
л-1
Т^Л/ ~Лл > в ультрагиперболическом —
/=1
Р п
V ту? -Vt|?,2<p<w-2,B параболи-
/=| i=p+\
к
ческом в широком смысле — у (±\)r\j,
к < п.
Если теперь в уравнении (13.1.2) сделать
замену переменных у = С~ А(х)С~ (х-
-л), где С — вышеуказанная матрица и С —
ей транспонированная, то получим в случае
эллиптического уравнения в точке х
уравнение
/I
5jMJW + млчл- = /» (13.1.6)
где мл. чл. — младшие члены; в случае
гиперболического —
л-1
XS* -цУпУп + мл- чл- = ^' (Ш7)
/=1
в случае параболического в широком смысле —
к
У^(±1)иЛя + мл. чл. =/, к<п.
/=|
Среди последних наиболее важным
является уравнение
л-1
^Luyiyi ~иУп + ДРУгие мл-чл- =/• (13.1.8)
/=1
Уравнение (13.1.8) называют просто
параболическим. Вид уравнений (13.1.6),
(13.1.7), (13.1.8) называют каноническим.
ПОСТАНОВКА ЗАДАЧ МАТЕМАТИЧЕСКОЙ ФИЗИКИ (МФ). КОРРЕКТНОСТЬ 503
Если уравнение (13.1.2) во всех точках
области Q является эллиптическим
(гиперболическим или параболическим), то его
называют эллиптическим (соответственно
гиперболическим или параболическим) в области Q .
Для уравнения относительно функции
и(х, у) двух переменных
а(х, У)Нхх + 2Ь(х,у)иху +
+с(х,у)иуу + мл. чл. = /
критерии эллиптичности, гиперболичности и
параболичности имеют простой вид:
Ь - ас < 0 - эллиптическое уравнение,
Ь - ас> 0 — гиперболическое
уравнение,
b -ас = 0 — параболическое уравнение.
В каждом из этих случаев может быть
выбрана, вообще говоря, нелинейная замена
переменных, которая приведет уравнение к
каноническому виду сразу во всей области.
Примером гиперболического уравнения
является уравнение малых колебаний
р(х)и„ = divx (p(x)gradxi/) - q(x)u + f.
(13.1.9)
Здесь u(x, t) — отклонение точки xg CI czR"
от положения равновесия в момент времени t,
р>0, р > 0, q>0. Среди уравнений (13.1.9)
наиболее простой вид (при р = 1, р =
= а = const, q = 0) имеет волновое уровне-
ние
п
u„=a2Au + f, Au = Y,uxiXr (13.1.10)
/=l
Примером параболического уравнения
является уравнение диффузии (или
распространения тепла)
р(х)и, = divx (p(x)gr2idxu) - q(x)u + /.
(13.1.11)
Здесь и(х, t) — концентрация вещества
(соответственно температура) в точке xgQcR"
в момент времени /. При р = 1,
р-сг = const, q = 0 получим уравнение
теплопроводности
щ =a2Au + f. (13.1.12)
Уравнения (13.1.9) - (13.1.12) называют
эволюционными. Примером эллиптического
уравнения является уравнение, описывающее
стационарный процесс. Так, если в
уравнениях (13.1.9) - (13.1.12) функция и не зависит
от времени /, то из (13.1.9), (13.1.11) получим
div(/K*)grad u)-q(x)u + f = 0, (13.1.13)
из (13.1.10), (13.1.12) при я = 1
-Дм = / (уравнение Пуассона), (13.1.14)
а в случае / = 0
Ли = 0 (уравнение Лапласа).
Некоторые задачи теории дифракции
приводят к эллиптическому уравнению
Дм + k и = 0 (уравнение Гельмгольца). (13.1.15)
13.1.3. Постановка задач
математической физики (МФ). Корректность.
Поставить задачу МФ для данного уравнения
значит сформулировать условия, позволяющие
выделить из множества всех решений
уравнения единственное конкретное. Для
эволюционных уравнений задают начальные условия,
характеризующие состояние исследуемой
величины во всех точках области в начальный
момент времени, и в случае ограниченной
области задают граничные условия,
описывающие протекающий на границе области с
течением времени процесс. Например, для
уравнений (13.1.9), (13.1.10) в начальный
момент времени t = /q задают начальное
возмущение и начальную скорость в каждой
точке области
(или х е R" ),
а для уравнений (13.1.11), (13.1.12) -
начальное распределение концентрации (или
температуры) в области
ill , =ф(х), хеП (или xeR"). (13.1.17)
i/=/(0
Граничные условия для широкого круга
задач линейны относительно исходной
функции и ее производных. Так, в задаче о
распространении тепла в случае когда на границе
области в любой момент времени известна
температура, имеем
н = ц V(x,t)eS = {xzdCl, /^/0}, (13.1.18)
в случае когда известен тепловой поток, —
^ = (lV(*,/)e5f (13.1.19)
где п - нормаль к S, а в случае когда на
границе области происходит по линейному
504
Глава 13.2. ЭВОЛЮЦИОННЫЕ УРАВНЕНИЯ
закону теплообмен с внешней средой
известной температуры, —
— + Ом = ц, о>0, V(jc,/)g5. (13.1.20)
дп
Граничные условия (13.1.18), (13.1.19),
(13.1.20) называют соответственно граничными
условиями 1-го, 2-го и 3-го рода. При Ц = 0 их
называют однородными. В задаче о колебании
мембраны к однородным граничным
условиям (13.1.18), (13.1.19), (13.1.20) приходят в
случаях соответственно жестко закрепленного
края, свободного края, упруго закрепленного
края.
Начальные и граничные условия
называют краевыми. Краевые задачи для
эволюционных уравнений с граничными условиями
1-го, 2-го или 3-го рода называют
соответственно 1-й, 2-й или 3-й краевой задачей. Их
также называют начально-краевыми или
смешанными задачами.
В случае когда Q = Rn и граничные
условия отсутствуют, задачи (13.1.10), (13.1.16) и
(13.1.12), (13.1.17) называют задачами Коиш
(или начальными задачами) соответственно для
волнового уравнения и уравнения
теплопроводности.
Краевые задачи для стационарных
уравнений не содержат начальных условий. В
случае ограниченной области Qcl"
краевую задачу (13.1.14), (13.1.18) называют
внутренней задачей Дирихле, краевую задачу
(13.1.14), (13.1.19) — внутренней задачей
Неймана, краевую задачу (13.1.14), (13.1.20) -
внутренней 3-ей краевой задачей. В случае,
когда QcR" — неограниченная область,
содержащая внешность шара достаточно
большого радиуса, т.е. когда
Зр > 0 : |jc| > р => хе Q, задачи (13.1.14),
(13.1.18), (13.1.14), (13.1.19), и (13.1.14),
(13.1.20) называют соответственно внешними
задачами Дирихле, Неймана и 3-ей краевой
задачей. При постановке внешних краевых
задач накладывают дополнительные условия
на поведение решения на бесконечности —
условие регулярности (см. гл. 13.3, п. 13.3.3).
Задача МФ для данного уравнения
поставлена корректно, если краевые условия, а в
случае необходимости другие дополнительные
условия, гарантируют: 1) существование, 2)
единственность и 3) устойчивость (или
непрерывную зависимость от данных в краевых
условиях) решения. Задачу, не
удовлетворяющую хотя бы одному из трех указанных выше
требований, называют некорректной.
Пример Адамара. Задача Коши для
уравнения Лапласа некорректна.
Действительно, задача
Uxx+Uy = 0 Щх,у)е R2, у>0,
i=o=*^fi
= V(x), x'eR,
\y=0
имеет решение щ = —r- е у cos Ajc при
К
ф(дс) = —-cosXjc и у(х) = — cosAjc и ре-
X2 *
шение и2 = О при ф(х) = у(х) s 0 . Для
начальных данных имеем
h-"2)U|c.(R)=max
при X -> °о,
а для решений при у = 5 > О
N-
1С'(К)
= max
при
Следовательно, задача не удовлетворяет
требованию устойчивости решения.
СПИСОК ЛИТЕРАТУРЫ
1. Владимиров B.C. Уравнения
математической физики, 4-е изд. М.: Наука, 1981. 512 с.
2. Петровский И.Г. Лекции об
уравнениях с частными производными, 3-е изд. М.:
Физматгиз, 1961. 400 с.
3. Тихонов А.Н., Самарский А.А.
Уравнения математической физики. М.: Наука, 1977.
735 с.
Глава 13.2
ЭВОЛЮЦИОННЫЕ УРАВНЕНИЯ
В этой главе рассматриваются задачи
МФ для уравнений (13.1.10) и (13.1.12).
13.2.1. Задача Коши для волнового
уравнения. Обозначим П = {(*, t)\ x e
eRV>0}, n = {(x,t)\xeRn,t>0}.
ЗАДАЧА КОШИ ДЛЯ ВОЛНОВОГО УРАВНЕНИЯ
505
"•3 /тал >
Пусть /еС2(П), феС^К"), уе
^2ftn>n\ „ м _ i 1 .. /-.-/^l/rn
Классическим решением задачи Коши
(13.1.10), (13.1.16) называют функцию
u(x,t)e С2 (П)п С1 (П), удовлетворяющую eC^R") в случае л = 2,3 и /еС'(П),
в полупространстве П уравнению (13.1.10) и фе С (R), уе С1 (R) в случае п- 1 . То-
при / = /0 = 0 начальным условиям (13.1.16) гда классическое решение задачи Коши
существует, единственно и представимо в случае
cQsR. я = 3 в виде
u(x,t) = —
fc-x\=at
%-x\=at
._L_ f _!_
/
{ fe-*H
(13.2.1)
*/£ (формула Кирхгорфа),
в случае п = 2 в виде
«(х.О^
♦<$)<*$
¥tt)^
/($.t)d;
f dx r
о 2nflMi('-x) ja\t-x?-\%-x\
(формула Пуассона),
(13.2.2)
в случае п = 1 в виде
"(*,') =
ф(х + я/) + ф(х-яО 1
x+at
t x+a(t-x)
+ — J v(£)</£+[— J /(£,т)*/£ (формула Даламбера).
(13.2.3)
х-д(/-х)
При тех же предположениях относи- уравнения корректна. Отметим характер рас-
тельно /, ф, w имеет место непрерывная пространения возмущения от
сосредоточенного источника,
зависимость решения от правой части урав- fi e свободных КОЛебаний беско-
нения и от начальных данных. Пусть 7 > 0 и нечной струны согласно (13.2.3) имеем
Пт =1хе Кл,0</<Г|, л = 1,2,3. Пусть u(x,t) = щ (х -at) + и2 (дс + at), где щ (х-
и, и - решения задачи Коши соответ- i I f ич
ственно с /,ф,У и /»Ф»У- Тогда 2 x-at
для Ve>035(e, Г)>0:||/-1/||С(Пт) <е дг+л/
н -н * н. ill T я +*') = тФ(* + *0 + т- J vU)^- А это
пР"1/-/1с(Пт)<в'1*"»1с-(.")<в и 2 2 *о
|| у - у || „ < 8 . В случае п = 1 достаточ- означает, что возмущение щ (jcq ) от возбуди-
Н ~ц теля в точке Xq в момент / = 0 через время
но для ф и ф неравенства |ф -фЦ^ < 5. f ^^ точно такое же возмуще„Ие
Таким образом, задача Коши для волнового щ (х - at) = щ (xq ) в точке х = х$ +at.
506
Глава 13.2. ЭВОЛЮЦИОННЫЕ УРАВНЕНИЯ
Скорость распространения этого возмущения
dx _ d(xQ + at)
равна — =
dt
dt
= a . Аналогично
возмущение и2 (xq ) в точке Xq в начальный
момент времени / = 0 через время / вызовет
такое же возмущение и2 (х + at) = и2 (xq )
в точке х = Xq -at. Скорость распростра-
dx
нения этого возмущения равна — =
d(x0 -at)
dt
= -а . Таким образом,
описываемые функцией u(x,t) свободные
колебания бесконечной струны есть суперпозиция
двух бегущих волн — «прямой» Uy(x-at) и
«обратной» и2 (х + at).
Рассмотрим случай п = 3. Пусть
мгновенные источники в момент времени t = 0
сосредоточены в окрестности Qt : \х\ < е так,
что ф(х) = \\f(x) = 0 при |х| > е. Тогда
согласно формуле (13.2.1) при / = 0 в момент
2е
времени t>— u(x,t)*Q во всех точках
а
х, для которых сфера |£ - х| = at с центром
в точке х радиуса at пересекает Qz , т.е. при
at - е < Ы < at + е . Это означает, что
возмущение распространяется в виде сферической
волны с передним фронтом |дс| = at + e и
задним фронтом \х\ = at - е, движущейся со
скоростью а.
В случае п = 2 согласно формуле
(13.2.2) u(x,t)*0 тогда, когда круг
|£ - х\ < at пересекает Qt и, следовательно,
если в точке х в момент времени t\
w(x,/, )*0, то и для W>f, и(х,0*0.
Таким образом, в плоском случае возмущение
распространяется в виде круговой волны со
скоростью а. Это волна имеет передний
фронт и не имеет заднего фронта.
Плоскими волнами называют волны,
фронт которых в R есть плоскость
п : Х[ cos oi| + х2 cos а2 + х3 cos a3 =c (в Иг -
прямая). Вводя переменную I; = *i cos (Х| +
+х2 COS0C2 + *з cos аз в направлении
нормали к плоскости п, преобразуем уравнение
2 1
utt -а Дм в уравнение utt = а Щ& , откуда
получаем u(x,t) = /(£-at) + g(£, + at), где
/,geC2(R) и £(х) указана выше. К
вопросу о распространении плоских волн
приводят задачи сейсмологии, теории дифракции
и другие.
13.2.2. Задача Коши для уравнения
теплопроводности. Классическим решением
задачи Коши (13.1.12), (13.1.17) называют
функцию u(x,t)e С2 (П)пС(П),
удовлетворяющую в полупространстве П уравнению
(13.1.12) и при t = fg =0 начальному
условию (13.1.17), где а = Кл.
Задача Коши (13.1.12), (13.1.17)
корректна в классе медленно растущих при
|х| —» ©о функций, а именно
удовлетворяющих условию: ЗС|, с2 > 0 такие, что
VjcgR" и V/e[0, Т], Т < ~,
\и(х, 0|<q«?C2'*' (I3.2.4)
Пусть / = 0 ив начальный момент в
точке £ находится мгновенный единичный
источник тепла. Тогда для V/ > 0 в каждой
точке х е R" температура определяется
функцией Грина (или функцией источника)
1
-ехр
l*-tf
4a2t
,/>о,
<?<*-*,') = \(2аЩП
[о, /<0, (дс,0)*($,0),
(13.2.5)
что свидетельствует о мгновенном
распространении тепла от мгновенного источника на
все пространство.
Решением задачи Коши (13.1.12),
(13.1.17) в классе медленно растущих
функций при / = 0, фе С(ШП) и ф
удовлетворяет условию (13.2.4) является свертка
||(дс, /) = ф*<7= J Ф«)<?(*-$,')<*$, (13.2.6)
СМЕШАННАЯ ЗАДАЧА ДЛЯ ЭВОЛЮЦИОННЫХ УРАВНЕНИЙ. МЕТОД ФУРЬЕ 507
В случае /^0, /еС(П) и удовлетворяет
условию (13.2.4) решение есть сумма
интеграла в (13.2.6) и интеграла
/
\di\f(%,i)G(x-%,t-i)d%. (13.2.7)
0 Rn
Условие (13.2.4) существенно для обеспечения
единственности решения. В классе функций,
| .2+8
растущих при \х\ -> ©о со скоростью ес" ,
8 > 0 , единственности, вообще говоря, нет.
Соответствующий пример был впервые
построен А.Н. Тихоновым.
13.2.3. Смешанная задача для
эволюционных уравнений. Метод Фурье. Пусть
ОсМ" - ограниченная область с гладкой
границей dQ,
Q = {(x,t)\xeQ,,t>0},
S = {(xJ)\xedQJ>0},
О0 ={хеП, > = 0}, Q = <2uSuQo-
Классическим решением 1-й (2-й или 3-й)
краевой задачи для волнового уравнения
(13.1.10) (или уравнения (13.1.9)) называют
функцию u(x,t)e С (Q)nC* (Q),
удовлетворяющую в области Q уравнению (13.1.10)
(или уравнению (13.1.9)), на S граничному
условию соответственно (13.1.18), (13.1.19)
или (13.1.20) и на Q0 начальному условию
(13.1.16).
Аналогично определяется классическое
решение смешанной задачи для уравнения
теплопроводности (13.1.12) (или уравнения
(13.1.11)).
Ниже изложен метод Фурье решения
смешанных задач для этих уравнений.
Рассмотрим сначала задачи с
однородными уравнениями:
м„ = а2Аи, (xj)e Q, (13.2.8)
щ =а2Аи, (x,t)eQ (13.2.9)
с однородными краевыми условиями:
а) и = 0, б) |^ = 0,
дп (13.2.10)
в) -^ + он = 0, о>0, (х, t)eS
дп
и начальными условиями (13.1.16) в случае
задачи с уравнением (13.2.8) и начальным
условием (13.1.17) в случае задачи с
уравнением (13.2.9).
Будем искать решения и(х, t) задач
(13.2.8), (13.2.10) и (13.2.9), (13.2.10) (пока без
учета начальных условий (13.1.16) и (13.1.17))
в виде е±,ау' v(x) и соответственно в виде
е~а v(x). Подставляя эти выражения в
уравнения (13.2.8) (или (13.2.9)) и в краевые
условия (13.2.10), сокращая на экспоненты, а
2
уравнения еще и на а , получим:
Av + \v = 0, xeQ, (13.2.11)
a) v = 0, б) ^ = 0,
дп (13.2.12)
в) — + ov = 0, о > 0, х g 3Q.
дп
Отыскание ненулевых решений
уравнения (13.2.11), удовлетворяющих одному из
трех граничных условий (13.2.12), называют
задачей Штурма-Лиувилля (зад. Ш.-Л.) для
оператора Лапласа в области Q,. Ее также
называют задачей на собственные значения
оператора Лапласа при однородном краевом
условии 1-го, 2-го или 3-го рода. Значения
параметра X, при которых существует решение
зад. Ш.-Л., называют собственными
значениями, а сами решения — собственными
функциями зад. Ш.-Л.
Отметим те свойства собственных
функций и собственных значений зад. Ш.-Л.,
которые используются в методе Фурье. 1).
Собственные значения образуют
неубывающую последовательность неотрицательных
чисел: 0 < Х\ < Х2 ^ ••- ^т - ••• При этом
lim Xm = ©о. 2). Собственные функции,
соответствующие различным собственным
значениям, ортогональны в /^(U):
(vi'vj)L2(n) =0 при \Ф }. Линейно
независимых собственных функций,
соответствующих одному и тому же собственному
значению, лишь конечное число, их можно ор-
тогонализовать. Таким образом, существует
ОС собственных функций и притом полная.
3). В области Q с достаточно гладкой
границей всякая достаточно гладкая функция
/(х)|/еС*(0), *>КЧ + 3 I,
удовлетворяющая однородным краевым условиям зад.
Ш.-Л., разлагается в ряд Фурье по ОС
508
Глава 13.2. ЭВОЛЮЦИОННЫЕ УРАВНЕНИЯ
f(x) = ^amvm(x),
/и=1
(13.2.13)
который к ней сходится абсолютно и
равномерно, и при этом ряд можно дважды
почленно дифференцировать.
Итак, пусть {vmY^=\ - полная ОС
собственных функций зад. Ш.-Л. и {A.m}^=j -
последовательность соответствующих
собственных значений. Тогда для задачи (13.2.9),
(13.2.10) получим систему линейно независи-
2
мых решений um(x,t) = e~a mtvm(x),
т = 1,2,..., а для задачи (13.2.8), (13.2.10) с
1 ( iaJkZt , -iaJxZt |
учетом того, что — \ е у т +е у т | =
= cos a yjXmt
'•)■
= s'mayJXm /, систему ит (х, t) -
[Ат cosafk^t + Вт smajx^t) vm(x),
/я = 1,2,...
Будем теперь искать решение исходной
смешанной задачи для волнового уравнения,
удовлетворяющее начальным условиям
(13.1.16), в виде ряда
u(x,t)= ]Г wm(x,0 =
= X (А* cos*>/^> + Вт sinafi^t)vm(x).
/и=1
Подставляя его в начальное условие (13.1.16),
получим
т=\
Am —
вт =
(Ф> vm)b2(Q)
1 (¥, Pmhg(Q)
|2
Аналогично решение смешанной задачи для
уравнения теплопроводности представляем в
виде ряда u(x,t) = ^Г Сте~а X,n,vm(x),
т=\
коэффициенты которого находим из
начального условия (13.1.17). Имеем
^Cmvm(x) = ty(x), откуда
т=\
С =
(4>>P|n)Zg(Q)
В случае смешанных задач с
неоднородным уравнением (/*0) решение ищем
в виде ряда по собственным функция зад.
Ш.-Л. (13.2.11), (13.2.12) с
коэффициентами, зависящими от времени: u(x,t) =
= 2^Tm(t)vm(x). Подставляя этот ряд в
т=\
уравнение и начальные условия, в случае
смешанной задачи для волнового уравнения
приходим к системе задач Коши относительно
Тт(0:
T^t) + a2XmTm(t) = Fm(t), Tm(0) =
= <L. 7,m(0) = Vm. m = \,2,...,
где
Ъ(') =
(■/>щ)/з(Р) _(<Mm)fg(Q)
(¥,«m)t2(Q)
V,
К
(«)
w=l
и в случае смешанной задачи для уравнения
теплопроводности — к системе
T^(t) + a2\mTm(t) = Fm(t),
7'т(0) = фт,д| = 1>2,...,
откуда
где Fm(t), фт те же, что и выше.
ТЕПЛОВЫЕ ПОТЕНЦИАЛЫ И ИХ ПРИМЕНЕНИЕ К РЕШЕНИЮ СМЕШАННЫХ ЗАДАЧ 509
Изложенный выше метод Фурье остается
в силе при решении смешанных задач с
уравнениями (13.1.9), (13.1.11) вместо (13.1.10),
(13.1.12). В этом случае следует решать зад.
Ш.-Л. (13.2.11), (13.2.12) не для оператора
Лапласа, а для эллиптического оператора
L = div(/?(x)grad)-#, q>0.
Собственные функции зад. Ш.-Л.
(13.2.11), (13.2.12) для оператора Лапласа в
таких областях, как прямоугольник,
параллелепипед, круг, сектор, цилиндр, шар, могут
быть найдены методом разделения переменных.
Так, в случае Q = {(*, у): 0 < х < /,
0<y<h} в задаче (13.2.11), (13.2.12а), беря
решение v(x,y) в виде произведения
Х(х)У(у) и подставляя его в уравнение
(13.2.11) и краевое условие (13.2.12а),
получим:
X'Y + XY" + \XY = 0,
X(0)Y(y) = 0, X(l)Y(y) = 0 Vy e [0,А],
X(x)Y(0) = 0, X(x)Y(h) = 0 Vx e [0,/].
(13.2.14)
Деля уравнение на XY , получим
v//7 = — , я,/и = 1,2,..., а функции
х0
(13.2.15)
Замечая, что отношение зависит только
Л
от х, а отношение — — только от у, делаем
вывод, что равенство (13.2.15) возможно
только тогда, когда каждое отношение есть кон-
у" уг*
станта. Полагая = -|1, — = -V и учиты-
Л У
вая равенства (13.2.14), получим зад. Ш.-Л.
относительно Х(х) и Y(y):
Х"(х) + [iX(x) = 0, Х(0) = Х(1) = 0,
Y"(y) + vY(y) = 0, Y(0) = Y(h) = 0
и из (13.2.15)- A, = |i + v.
Решениями этих задач являются функ-
ции Xn(x) = sm —, Ym(y) = sm——
являются
с собственными значениям
(ппЛ
, ч . кпх . кту
vmn (х, у) = sin sin являются
собственными функциями оператора Лапласа
в прямоугольнике Q с собственными значе-
Г 2 2
ниями Хпт = 7tz — + —
[г /г
Собственными функциями и
собственными значениями оператора Лапласа в круге
а = {(г,ф):г<р0,0<ф<2я}
функции:
/1 = 0,1,2,..., Л = 1,2,...,
y/i2i =ЛЛ—г ртлф,
IPO )
/1 = 1,2,...,* = 1,2,...,^ =рМ ,
где Jn(x) - функции Бесселя (см. разд. 12),
a \ik в соответствии с краевым условием
1-го, 2-го или 3-го рода есть нуль Jn(x),
нуль J'n (x) или корень уравнения Дини
Мл (И* ) + #/„ (цЛ ) = О, Я = аро .
Собственными функциями оператора
Лапласа на сфере являются сферические
функции (см. разд. 12), в шаре — шаровые
функции (см. там же).
13.2.4. Тепловые потенциалы и их
применение к решению смешанных задач
для уравнения теплопроводности.
Температуру u(x,t) можно рассматривать как
потенциал векторного поля grad^w. Тогда
потенциал поля, создаваемого расположенным в
точке (£,т) мгновенным точечным
единичным источником тепла, есть определяемая
равенством (13.2.5) функция источника
G(x-%, t-x), а в соответствии с
принципом суперпозиции (grad^. щ +
+gradJcw2 -&^х(и\ +u2)) потенциал
поля, создаваемого мгновенными источниками,
510
Глава 13.2. ЭВОЛЮЦИОННЫЕ УРАВНЕНИЯ
распределенными на поверхности S с
поверхностной плотностью их интенсивности
р($, т), есть
u(x,t) = jp(^x)G(x-^t-x)ds-
S
(13.2.16)
тепловой потенциал простого слоя.
Под единичным тепловым диполем
в точке Р(£, х) понимают предельное
положение системы двух разноименных источни-
1 1
ков тепла интенсивности и + —, распо-
h h
ложе иных на прямой PN в точках Ру (£j, Tj)
и Pi (£2 , Т2 ) на расстоянии h друг от друга
симметрично относительно точки Р(£, х)
(см. рис. 13.2.1) при А-»0. Вектор
- ЖЕ
п = -. г называют осью диполя. Тогда по-
\щ
тенциал поля, создаваемого этим диполем,
будет
Теорема о скачке потенциала двойного
слоя: Пусть QcR" — ограниченная область
с гладкой границей dQ, Q = {(х, t) :
xeQ, />0}, £ = {(*, t):xed&, />0},
р(£, т) е C(S) и ограничена на S.
Тогда потенциал двойного слоя непрерывен
вне 5, а при переходе через S терпит разрыв
1-го рода. При этом V(jc , t ) справедливы
равенства:
ui(x°,t0) = u(x\t»)-i<>(x0,t{>),
mA'0) = "(*V0)4p(A'°>.
и(х, /)=lim\-G{x-%2,t-x2)-
Л-»0 П
где
||,(дс°,/°)= lim и(х, О,
(*,/)->( х°,/°)
(х,/)е<2
ц,(дс°,/°)= lim и(х, О,
(х,/)->(х0,/ )
(*,/)*(?
-i(7(x-^,/-t,)j =
a<?(x-j/-T)
= jdxjp(%,x)
а потенциал поля, создаваемого
распределенными на поверхности S с поверхностной
плотностью р(£, т) диполями, оси которых
направлены по нормали п^х к поверхности
S , будет
"(*, t) = jp(£, т)—х—^ '-ds -
о эп
Эл4х
Э(7(;с0-1;,/0-т)
dl^
Чх
(13.2.17)
тепловой потенциал двойного слоя.
dk — элемент площади (длины) дС1. Заметим,
что и(лг°,0) = 0, х° еП.
Теорема о скачке нормальной производной
потенциала простого слоя:
Пусть Q , Q , 5, р(£, т) те алее, что л
выше.
Потенциал простого слоя непрерывен в
R n {t > 0} , 0 его нормальная производная
при переходе через S терпит разрыв 1-го рода.
При этом V(jc , t ) e S справедливы
неравенства:
ди
дп+
ди
drf
1(Л/°) 2
|(Л/°) 2
Рис. 13.2.1
где
МЕТОД ХАРАКТЕРИСТИК РЕШЕНИЯ ГИПЕРБОЛИЧЕСКИХ ЗАДАЧ НА ПЛОСКОСТИ 511
ди
ди
дп~
PM2Wnp 2h о эп
,m ,А,\ ЭС(ДС° -^, /° -X) ,,
.. и(Р)-и(М\) х —2 dh, откуда с учетом
= Jim - ; дпрх ъ
\(хо ,<к h^O 1 . s
A/jPTT/7 9^ того, что для классического решения
Vj (х°, /° ) = Д(х°, /° ), получим для плотно-
•^(х0 f°)= fp(£ х) — -ds сти р(х°,/°) интегральное уравнение
S ' дПР о
Фредгольма 2-го рода по х и Вольтерра 2-го
Потенциалы (13.2.16), (13.2.17) используют рода по /° •
при решении смешанных задач для уравнения 0
теплопроводности. 0 '-
Рассмотрим 1-ю краевую задачу р(х ,/ ) = 2\dxx
щ =a'Au + f, (x,t)eQ, dG(o t p _x)
Положим w = у + w , где и> - решение Решение 2-й краевой задачи с краевым
задачи Кош и ^ц
1 условием — = \i(x,t) e S проводится по той
wt = а*Аи + F, дп
же схеме. Следует лишь решение задачи для v
(x,t)e Rw+1 n{/ > 0}, w\ = Ф, xe R", искать в виде потенциала простого слоя и
воспользоваться теоремой о скачке его нор-
г- . лИ+| fj ftl мальной производной,
где г - продолжение / на R п {/ > Oj ,
13.2.5. Метод характеристик реше-
Ф - продолжение ф на R", a v - решение Ния гиперболических задач на плоскости.
краевой задачи В п. 13.1.1. было дано понятие
характеристики линейного уравнения 2-го порядка (13.1.2)
vt =a Av, (x,t)eQ, в области Q с R" . Это гладкая поверхность
v = n-w = ii,(x,t)eS,v = 0,xea,t = 0. (линия) S:«x) = const, в каждой точке
которой нормальный к ней вектор grad<|>
Решение w задачи Кош и имеет вид удовлетворяет характеристическому уравне-
w(x,t)= J Ф(£)(7(л:-£, t)dZ,+ нию (13.1.4): £"у *#(*)♦*/♦*; =0. В слу-
/ чае плоской области Q с R = {(х,у)\ ха-
+ \dx \ F(Z„ x)G(x - £, f - x)d%. рактеристикой уравнения относительно и(х, у)
0 R" a{x,y)uxx+2b(x,y)uxy +
(13.2. lo)
Решение v краевой задачи ищут в виде с(х, у)иуу + F(x, у, их, иу) = О
потенциала двойного слоя Jp(§, t)x является линия ф(х,д,) = 0 , в каждой точке
S которой выполняется равенство
х ~ ~Х ds' плотность Р(^» т) в яФх +2btyxtyy +cty2y =0. (13.2.19)
котором следует выбрать так, чтобы v удов- Семейство кривых ф(дс,д>) = С является се-
летворяло граничному условию v = р, мейством характеристик тогда и только тогда,
(х, /) б S . Согласно теореме о скачке потен- КОГда УРавнение ♦<*.*> = С определяет об-
щий интеграл обыкновенного дифференци-
циала двойного слоя и,- (х° , t° ) = v(x , Г ) - ального уравнения (ДУ)
512
Глава 13.2. ЭВОЛЮЦИОННЫЕ УРАВНЕНИЯ
ady2 -2bdxdy + cdy2 = 0, (13.2.20)
также называемого характеристическим
уравнением. Уравнение (13.2.20) эквивалентно
системе ДУ 1-го порядка
ady ~{b + 4b2 -ac)dx = 0,
ady - (b - 4b2 -ac)dx = 0.
(13.2.21)
В случае уравнения (13.2.18)
гиперболического типа (b -flc>0) общие интегралы
ф(х, у) = С|, ф(х, у) = Сг будут
вещественными и независимыми, и определяемые ими
два семейства вещественных характеристик
могут быть взяты в качестве координатных
линий новой криволинейной системы
координат £,т|, где
\ = ф(х,у), ц = у(х, у), %№1 * 0, (13.2.22)
Э(х,д0
в области Q .
Рассмотрим для уравнения (13.2.18)
гиперболического типа задачу Коши с
начальными данными на гладкой дуге Г: найти в
окрестности Г решение уравнения (13.2.18) по
известным значениям на дуге Г самого решения и его
производной по некасательному к Г (или
«выводящему») направлению /
и|г =а(х,у), -~|
= Р(х,>>). (13.2.23)
Функции а(х,у) и $(х,у) в (13.2.22)
называют начальными данными Коши.
Задача Коши с данными на
характеристике некорректна.
Действительно, пусть дуга Г задана
уравнением /(х, у) = 0 , где / е С2 (Q). Пусть
(х0,у0)еГ, (х,у) = (хо + Ах,у0 + Ау)еГ.
Пусть и(х, у) е С2 (Q). Тогда
и(х,у) = u(xq ,y0) + du{xQ,y0) +
1 9 9 (13.2.24)
—dzu(xo,y0) + o(F),
где р = Ах + Ау . Покажем, что если Г не
является характеристикой уравнения (13.2.18),
то решение и(х,у) в окрестности Г
(с точностью до бесконечно малых порядка
выше 2-го относительно р) однозначно
определяется начальными данными Коши, а
в случае, когда Г - дуга характеристики,
единственность решения нарушается.
Осуществляя в уравнении (13.2.18) замену
переменных (13.2.22), где ф, \|/еС , при которой
дуга Г станет координатной линией £ = 0 , и,
полагая и(х,у) = а(£»Л)» полУчим
+с(§, J])vm + F(£, Л, v9v^9vn) = 0,
(13.2.25)
где
а = а$ + 2£фхф>, + сф2 . (13.2.26)
Начальные условия (13.2.23) примут вид
= Р(Л). (13.2.27)
H^-^fjl
5=0
Так как угол 0 между VI; и направле-
2 и э7 =
нием / отличен от — и —\
\dv _ dv . Jl
= —cose+—sine
то ^,^л,улл
при £ = 0 однозначно определятся
начальными данными из (13.2.27), а тогда из
(13.2.25) в случае, когда Г не является
характеристикой и согласно (13.2.19) и (13.2.26)
а * 0 , однозначно найдется v^ . Если же Г -
дуга характеристики, то а = 0 и наряду с
решением Vq , если оно существует, будут
также решениями v = щ + Л% , где Л —
произвольная константа. Таким образом, при
задании начальных данных на характеристике
нарушается единственность решения задачи
Коши, а при переходе через характеристику
решение, оставаясь непрерывным, может
иметь разрывные производные второго
порядка. В этом случае говорят, что решение
имеет на характеристиках слабые разрывы.
Важным для приложений свойством
характеристик является выполнение на них
дифференциальных соотношений,
содержащих лишь внутренние производные вдоль
характеристики. В плоском случае для
гиперболического уравнения относительно
и(х,у) , когда характеристика задана
параметрическими уравнениями х = x(s),
у = y(s), эти соотношения представляют
собой обыкновенные дифференциальные
МЕТОД ХАРАКТЕРИСТИК РЕШЕНИЯ ГИПЕРБОЛИЧЕСКИХ ЗАДАЧ НА ПЛОСКОСТИ 513
уравнения относительно u[x(s), y(s)].
Например, характеристиками волнового
уравнения
ип =а2ихх + /(*,/)
являются два семейства прямых х - at = C\ и
х + at = C2 , где С\,С2 — произвольные
постоянные. Полагая £ = х- at, г) = х +
+ at, u(x,t) = v(S,i\), f(x,t) = F($,r\),
согласно (13.2.22), (13.2.26) и (13.2.25) получим
уравнение
Тогда на характеристике Г j : £ = С\ оно
является обыкновенным дифференциальным
уравнением — = F(C\ ,т|) относительно
w(r|) = v^ (Cj ,t|) , а на характеристике
Г 2 ' Л = Со — уравнением — = /^(J^C? )
относительно z{%) = t^ (£, С2 ) •
Рассмотренные свойства характеристик
лежат в основе одного из методов численного
интегрирования гиперболических уравнений,
называемого методом характеристик.
Сущность построения численных схем сеточно-
характеристического метода решения задачи
Коши (13.2.18), (13.2.23) состоит в следующем.
Пусть Г не является характеристикой и
— АВ с Г . Разобьем - АВ на п мелких
частей точками Л/,-,/= 1,2,...,/! - 1. Для
каждой пары точек Л/,-_| и Mi ,i = l,...,/i,
найдем точку /* пересечения характеристик,
проходящих через точки Л//_| и М\ , (рис.
13.2.2). Интегрируя вдоль ^ Mj_]Pj
характеристики выполняющееся на ней
дифференциальное соотношение с учетом значений
начальных данных а(х,у) и $(х,у) в точке
Л//_1 и, аналогично, интегрируя вдоль
— MjPj выполняющееся на ней другое
дифференциальное соотношение с учетом
значений начальных данных в точке Л/,- , получим
систему, из которой находим значения и и
Э" п ,
— в точке Ц. Затем ведется счет по
о/
«слоям». Таким образом выстраивается
область (на рис. 13.2.2 криволинейный
треугольник ABC) такая, что во всех
расположенных в ней узлах сетки решение
однозначно определяется значениями начальных
функций а(х,у) и $(х,у) на ~АВ.
Максимальную область, в которой задача Коши
(13.2.18), (13.2.23) имеет единственное
решение, называют областью зависимости решения
от начальных данных.
Изложенный сеточно-характеристиче-
ский метод используют также при решении
задачи Гурса, заключающейся в нахождении
решения гиперболического уравнения по его
значениям на двух пересекающихся
характеристиках (рис. 13.2.3). Разбивая ^АВ на
мелкие части точками М\,...,М„ и ^АС
точками К\ ,...,ATW, проводим через точки
деления характеристики и по значениям решения
в точках Л/j, К\ находим значение решения
в точке Р\ и т.д.
Рис. 13.2.2
Mi Мг М3
Рис. 13.2.3
17 — 7706
514
Глава 13.3. КРАЕВЫЕ ЗАДАЧИ ДЛЯ ЭЛЛИПТИЧЕСКИХ УРАВНЕНИЙ
Глава 13.3
КРАЕВЫЕ ЗАДАЧИ
ДЛЯ ЭЛЛИПТИЧЕСКИХ УРАВНЕНИЙ
13.3.1. Фундаментальное решение
уравнения Лапласа. Функция Грина. Инте-
где (Оп - площадь единичной сферы в Ш" и
v(x) — гармоническая в R" функция. При
v(x) = О функцию Е(х,х ) называют
главным фундаментальным решением.
Фундаментальное решение описывает
стационарное температурное поле,
создаваемое единичным точечным источником тепла,
или потенциал электростатического поля,
создаваемого единичным точечным зарядом.
Пусть Qcl" - ограниченная область
с гладкой границей ЭО. и х е О,. Функцией
Грина 1-го рода для оператора Лапласа в
области Q с особенностью в точке х
называют фундаментальное решение, обращающееся
в нуль на границе дО,:
<7(jc,jc°)| =0. (13.3.2)
Оно имеет вид G(x,x° ) = £(х,х° ) +
+н>(х,х°), хе Q, х° е Q, где £(х,х°) -
главное фундаментальное решение,
a w(x,x ) - решение задачи Дирихле
Axw(x1x°) = 0, xeQ,
х v ' ; ' (13.3.3)
w(x, х° ) = -£(х, х° ), х е дП.
Рассмотрим внутреннюю задачу Дирихле
для уравнения Пуассона
-Аи = /, xgQ,
J' . (13.3.4)
и = д, хе д£1.
Пусть х е Q и е > 0 таково, что шар
Qz : \х - х < е принадлежит области Q . По
гральное представление решения
внутренней задачи Дирихле для уравнения
Пуассона.
Фундаментальным решением уравнения
Лапласа называют функцию
формуле Грина для решения и(х) задачи
(13.3.4) и функции Грина G(x,x ) в области
Q \ QE получим
J (uAxG-GAu)dx =
J дпх дпх I
ЭОиЭ(?с Vх х )
где пх — внешняя нормаль к Э (Q \ Qz).
Перейдем в этом равенстве к пределу при
е —> 0 . Нетрудно установить, что
lim | и ds = и(х° ),
е->0 J dnY
dQ€ x
lim f (7—^ = 0.
e->0 J dnY
Щ x
Учитывая, что G\ ^ = 0, AYG = 0
при xgQ\Qe, -Au = f при xeQ и
и = \i при x g dQ., получим
u(xv) = - \i(x)———-ds +
J dnx
9" (13.3.5)
+jf(x)G(Xlx°)dx.
a
Для использования формулы (13.3.5)
необходимо построить функцию Грина и,
следовательно, решить задачу (13.3.3). Однако в
ряде случаев можно избежать решения задачи
(13.3.3), используя другие методы: метод
отражений, метод конформных отображений.
£(Х,Х°):
1 1 J
— 1пт
2к \х_хо
(оп(п-2)\х-х°
+ v(x)
в случае п = 2,
1Л-2
+ v(x) в случае п > 3,
(13.3.1)
ФУНКЦИЯ ГРИНА ДЛЯ ШАРА (КРУГА)
515
13.3 2. Функция Грина для шара начала координат, и Loll о| = ^2 н
(круга). Решение задачи Дирихле для урав- I II I
нения Лапласа в шаре (круге). Интеграл w i с
„ ^ „ ш«р^ \ivFji^/ у проверить, что Vx e о имеет место равенст-
Пуассона. Свойства гармонических функций . .
Р I ol
= ~, где р = x . Поэтому
A I '
в ограниченных областях. Пусть х?
инверсна х относительно сферы S : |х| = R , т.е.
х и х* лежат на одном луче, выходящем из функция
*'-*?
<7(х,х0) =
1
1
и>„(л-2) дс-дс1
о Г-2 w„ (« - 2)1 р
-Lm,
1
-Lin-
R
х- х \ *'* р|х-х*
является функцией Грина в шаре (круге) Q : |х| < R .
1/1-2
х - х;
при п > 2,
при я = 2
(13.3.6)
Функция Грина для односвязной
плоской области может быть построена методом
конформных отображений, в основе которого
лежит следующее утверждение.
Теорема. Если аналитическая в
односвязной области Q с С = {z = Х| + /x2 } функция
w = f(z) отображает конформно область Q
на область Q', Z° e Q, w°=f(z°)
и G(ZiZ ) — функция Грина для оператора
Лапласа в области Q, то функция
G(w, w° ) = G\ z(w), Z(w° ) является
функцией Грина для оператора Лапласа в области Q .
Пусть аналитическая функция w = f(z)
конформно отображает область Q на
единичный круг Q': |w| < 1 . Функция Грина для
оператора Лапласа в круге имеет вид
G(w,w°) = ^\n
2л
р и>- и>? 1 р ww° - II
I I L i« J [
\w- w
— In-
2я
\w-w
(ибо и>? =—- и р = \w ). Тогда функция
Грина для оператора Лапласа в области £1
будет
G(z,Z°)^\n
2л
|/U)/U°)-1
/U)-/U°)
Для решения задачи Дирихле Aw = О
в шаре (круге) QR : |х - х| < R, и = \i при
хе dQ :|x- x| = R , согласно равенствам
(13.1.5), (13.1.6) Vx° e QR, получаем
ы(х°) = \ [i(x)V(xyx°)ds (интеграл Пуассона), (13.3.7)
\x-x\=R
где
7>(х,хи) = -
Я2-р2
nR\R2 + р2 -2/?pcos0]
|"/2
(ядро Пуассона), (13.3.8)
р = \х° -х , 0 = (х° -х, х -х).
17*
516
Глава 13.3. КРАЕВЫЕ ЗАДАЧИ ДЛЯ ЭЛЛИПТИЧЕСКИХ УРАВНЕНИЙ
Свойства гармонических функций: 13.3.3. Внешние задачи. Условия
1. и(х) е С°° (Q). регулярности решения на бесконечности.
о Сведение внешних краевых задач к внут-
Действительно, всякая точка х при- ренним При постановке внешних краевых
надлежит^ области Q вместе с некоторым Задач, как следует из приведенных ниже при-
шаром QR : \х - х\ < R , а потому справедли- меров, для корректности ее недостаточно
задавать только краевые условия. Необходимо
вы равенства (13.3.7) с \i(x) = и(х) и накладывать дополнительные условия на по-
(13.3.8), из которых следует существо- ведение решения на бесконечности.
д^и(х° ) Пример 13.3.1. Aw = О при |х| > 1, х =
вание EPuix") = — —^— при Vex =
Эх,1 ...дх„п =x(x{ix2);u(x) = \ при |дс| = 1. Решения-
= (cxi ... а ) ми этои задачи являются щ = 1 и
2. Теорема о среднем. . е л
п с л. Wo = In 1—г» те- нет единственности. Однако
Пусть о — площадь поверхности сферы L \х\
дОр : \х - х\ = R, V — объем шара _ _ , ч ^/|ч
^л I • если потребовать, чтобы и(х) = и(\) при
QR :\x-x\<R, u{x) - гармоническая |*|->оо, то этому условию удовлетворяет
функция в Qr . Тогда решение щ и не удовлетворяет и2 .
f u(x)ds, Пример 13.3.2. Aw = 0 при |.
|x-Jc|=/? = (*i ,*2 »*3 )i и = I ПРИ \х\ = 1 • Решениями
> j •
\x-x\<R
Оценка npoi
I э^ I
w(Jc) = J- f u(x)ds, Пример 13.3.2. Aw = 0 при |х|>1, х =
\x-x\=R
If - 1
u(x) = — u(x)dx. этои задачи являются w, = 1 и w2=1-r.
V J \x\
Эх,-
<4" max |w(x)|, / = !,...,/i.
R \x-x\=R ' '
Снова нет единственности решения. Однако
3. Оценка производных. условию w(jc) = o(1) при |х|-> ~
удовлетворяет лишь одно из двух — 1*2 и не
удовлетворяет Wj .
4. Принцип максимума. Оказывается, что так называемое условие
Пусть и(х) - гармоническая функция в регулярности решения на бесконечности:
ограниченной области Q . Тогда Vx e Q u(x) = 0(|) при |х| -> <*> в случае п > 3 , (13.3.9)
mixw(x) < и(х) < maxw(jc). _ ,. , ч
9Q 9Q 3 hm w(jt) = /l*oo вслучае л = 2 (13.3.10)
|*|->оо
5. Пусть w(jc) - гармоническая в об- _
обеспечивает единственность решения внеш-
ласти Q функция, и ограниченная область них краевых задач.
Q вместе с гладкой границей S принадле- При выполнении условий регулярности
жит области Q . Тогда на бесконечности внешние краевые задачи
-ч могут быть сведены к внутренним.
J— ds = 0. Пусть область Q содержит внешность
S шара достаточно большого радиуса и не со-
6. Теорема об устранимой особенности. Держит начала координат вместе с его окрест-
Пусть функция и(х) гармоническая в ностью, так что Зр > 0 : |х| > р => х е Q и
области а\{х0} и w(x) = o(£(x,x0)) при Зр' > 0 : |х| < р' => хе Q. Пусть (г, 0,,...,
Ijc - х°| -> 0. Тогда и(х) можно доопределить Vl ) > гДе r = \x\ ~ сферические координаты
0 точки х. Поставим в соответствие каждой
в точке х так, что она станет гармонической + +
во всей области П . точке хеП точкУ х = (' , в, ,...,вп-1).
ПОТЕНЦИАЛЫ, ИХ СВОЙСТВА И ПРИМЕНЕНИЕ К РЕШЕНИЮ КРАЕВЫХ ЗАДАЧ 517
такую, что /г* = р , и положим и (х*) =
= |х| и(х) . Это преобразование называют
преобразованием Кельвина. Область О, при
этом преобразовании перейдет в
ограниченную область Q*, содержащую проколотую
окрестность точки х* = О. Можно показать,
что гармоническая функция и(х)
преобразуется при этом в гармоническую функцию
и*(х*) и при выполнении условий
регулярности (13.3.9) и (13.3.10) будет
и*(х*) = о(£(**,0)1 при \х* —>0, а
потому точка х* = 0 будет устранимой особой
точкой. Таким образом, внешняя краевая
задача относительно и(х) в области Q
свелась к внутренней относительно и* (х*)
в области О* и {х* = 0}.
13.3.4. Потенциалы, их свойства
и применение к решению краевых задач.
Потенциалы и потенциальных векторных
полей (а = -gradw ) без стоков и источников
(divtf=0) являются решениями уравнения
Лапласа и, следовательно, их можно
использовать при решении краевых задач.
и(х)=\\т\уи(х2)-уи(х1)] =
3. Ньютонов потенциал — это потенциал
поля w(x), создаваемого распределенными в
области QcR" с плотностью р(£)
зарядами. В каждой точке хё Q он равен
и(х)= fp(£)—2- при /7 = 3 и
"(*)= fp(£)l"i -xd% при /i = 2.
4. Потенциал простого слоя — это
потенциал и(х) поля, создаваемого
распределенными на поверхности S сШ" с поверхностной
Виды потенциалов
1. Потенциал точечного заряда — это
потенциал электростатического поля,
создаваемого в R" расположенным в точке £
единичным зарядом. В каждой точке х * £ он
равен
«(*) =
1
■*1
Ini
при /1 = 3,
при /1 = 2.
2. Потенциал диполя. Под диполем в
точке £ понимают предельное при h —»0
положение системы двух разноименных заря-
1 1
дов величины и —, расположенных в
h h
точках х{ и х1 на оси, проходящей через
точку £ в направлении вектора п ,
симметрично относительно точки £ на расстоянии
h друг от друга. В соответствии с принципом
суперпозиции потенциал электростатического
поля, создаваемого расположенным в точке
£ диполем, в каждой точке х * % будет
равен
, я = 3,
U--4J
In-
■4J
cos(jc
1-
cosl
-%,
1
й)
>
Тй)
|*-«|
, /1 = 2.
плотностью р(£) зарядами. В каждой точке
х£ S он равен
«(*) = [
P(S)
к-51
Л при п = 3 и
2.
5. Потенциал двойного слоя — это
потенциал м(х) поля, создаваемого
распределенными на поверхности 5сК" с поверхностной
плотностью р(£) диполями. В каждой точке
хе S он равен
518
Глава 13.3. КРАЕВЫЕ ЗАДАЧИ ДЛЯ ЭЛЛИПТИЧЕСКИХ УРАВНЕНИЙ
"(*) = Jp(S)
COS(jC-^,AI^)
Ml2
э«
ds при п - 3 и
дп"
= У(х°)-27ф(х0),
COS(x - £,, П^)
u(x)= p(£) : -г2-^ ПРИ n
= 2.
(соответственно
ди
дп
:J(x°) + np(x°),
ди
Все указанные потенциалы, кроме по- ^aj+
= /(х°)-7ф(х0)), где л
тенциалов на плоскости R точечного
заряда, Ньютонова потенциала и потенциала
простого слоя, стремятся к нулю при |х| —> °°.
Рассмотрим важные свойства
потенциалов простого и двойного слоя.
Пусть Qcl" — односвязная
ограниченная область с дважды гладкой границей дО. и
p(£)e С(Э£2). Тогда потенциал простого слоя
непрерывен в R", а потенциал двойного слоя и
нормальная производная потенциала простого слоя
при переходе через dQ терпит разрыв 1-го рода.
При этом имеют место следующие теоремы.
Теорема о скачке потенциала двойного
слоя: Vjc° е ЭО в R3 (в R2 )
и^х°) = и(х0)-2пр(х°)9
ие(х°) = и(х°) + 2кр(х0),
(соответственно щ (дс° ) = и(х° ) - кр(х ),
ие(х°) = и(х°) + кр(х0)), где
W/(jc°)= lirn u(x), ие(х°) = lim u(x),
внешняя нормаль к дО, в точке х ,
ди
дп~
ди
»{х°-и(х))
lim —- г—-,
с0 s->x°,xeQ |jc° — JC|
jfl-xttnj)
Эл+
lim
и(х° -и(х))
с0 х-*х0,хд:П \Х° - х\
х°-хПп0
f COS(£-X°,AI о)
J(x°) = |р«) -Z—dS
J I о Л
(соответственно
J(x°)= jp(V
эо
COS(£-Х°,Л о)
i rJE— *)•
х->л:
X€Q
x-»x
x*Q
w(x )= p(q) T^"s при л = ^ и
l*°-51'
n f COS(X° -t,nt)
«(s°)=fp(S) , o , ^'ds
s К -У
ПРИ Я :
Теорема о скачке нормальной производной
потенциала простого слоя: Для Ух е 3Q в
R3 (в R2 )
Рассмотрим применение потенциалов к
решению краевых задач на примере
внутренней задачи Дирихле на плоскости:
Дм = О, х e Q с R2 , и = д, xedQ.
(13.3.11)
Будем искать решение в виде
потенциала двойного слоя, плотность распределения
диполей в котором следует определить так,
чтобы выполнялось краевое условие и = |Х,
х е dQ. Используя теорему о скачке
потенциала двойного слоя и учитывая, что для
классического решения задачи щ (х ) =
= \у(х ), получим интегральное уравнение
Фредгольма 2-го рода относительно плотности
cos(x°4,^) 1 0
k ^ds—Ц(хи).
\х - Ц
р<*°) = — fp($)
п J
да
ди
дп~
= J(x°) + 2np(x°)i
В случае задачи Дирихле для уравнения
Пуассона -Дм = /, xe Q, вычитая из
решения и частное решение уравнения
Пуассона в виде Ньютонова потенциала w =
МЕТОД ФУРЬЕ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ
519
= Г/(£)1п: rdt, для разности v = u-w,
получим рассмотренную выше задачу с
Д = д - и>, х е dQ . Для внешней задачи
(13.3.11), используя равенство
ие(х°) = и(х°) + пр(х°) и условие
ие (х° ) = \i(x°), получим
р(хи) = — р(£) Г"5"*—**(*)•
В случае внутренней (внешней) задачи
Неймана для уравнения Лапласа ищем
решение в виде потенциала простого слоя, для
плотности распределения зарядов в котором
согласно теореме о скачке нормальной произ-
ди
водной с учетом краевого условия
■ ц(х ) (соответственно
Эй
дп+
= ц(*и))
получим
. 1 , cos(x° -%,п о) 1 „
P(x°) = --fp(^) \x-Lds-±ii{x°)
*L |x°-4|
(соответственно
Р<*°)=-[р№)
к J
да
I f ycos(x°-^nxo)
-4"
ds + ±ii(x0)).
к
13.3.5. Метод Фурье решения
краевых задач. Метод Фурье применим к
решению краевых задач для уравнения Пуассона в
простейших областях, ограниченных
координатными поверхностями. На плоскости — это
прямоугольник со сторонами, параллельными
осям координат, круг, кольцо, внешность
круга. В пространстве - это параллелепипед,
грани которого параллельны координатным
плоскостям, цилиндр, шар и др. Краевую
задачу в круге решают в полярных
координатах, в цилиндре - в цилиндрических
координатах, в шаре — в сферических координатах.
Рассмотрим решение задачи Дирихле
в круге.
(Aw = 0) в круге Q = {(г, ф)| г < р0, 0 < ф < 2л}
(13.3.12)
WLP0 = й(Ф), Ф«М0, 2я]. (13.3.13)
Кроме того, решение должно удовлетворять
дополнительным условиям:
условию периодичности по ф: Уфе
е[0,271]ы(г,ф + 271) = ы(г,ф);
и условию ограниченности в нуле:
НЦ<ов-
Представляя решение м(/*,ф) в виде
произведения /?(г)Ф(ф), подставляя в урав-
нение Аи = и,,.+ — иг+ — Ыц =1) и деля
г г2
r2R" + rR' Ф" л
переменные, получим + — = U ,
г Ф
что возможно лишь тогда, когда каждое из
отношений есть константа. С учетом
дополнительных условий имеем:
Ф' + а* = о,* = соп*, 3
Ф(ф + 2л) = Ф(ф)Уф€[0,2л;],
r2R" + rR'- AJ? = О, \R(0)\ < ос. (13.3.15)
Задача (13.3.15) имеет лишь при X = п
систему решений:
Ф„,1(Ф) = со8/|ф, « = 0,1,2,...,
фл,2(Ф) = зтлф, л = 1,2,...
(13.3.16)
Уравнение (13.3.15) при X = п *0 имеет
фундаментальную систему решений Rn \(г) =
= r" » Rn,2(r) = Г~П и при Х = 0 -систему
RQ](r) = \, Rot2(r) = lnr. Из них г~" и
In г не удовлетворяют условию |/?(0)| < ©о .
Решение исходной задачи (13.3.12), (13.3.13)
представим в виде ряда
оо
ы(г,ф) = — + \anrn cosnty + bnr" sinw|>,
/i=i
(13.3.17)
коэффициенты которого найдем из краевого
условия
Ц(Ф) = "f + X Р0 (°п COS Я* + Ъп Sil1 Я*)'
л=1
откуда
.2л . 2л
% = - f Д(ФМ>, ап = - f Д(ф)С08/|ф</ф,
к J n J
о
12п
b„ =- f ц(ф)8тжИф.
ТС J
520 Глава 13.4. ОБОБЩЕННЫЕ РЕШЕНИЯ ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
Решение задачи Дирихле для уравнения
Пуассона
-Дм = /, хе£2 = {г<р0,0<ф< 2л},
(13.3.18)
ищем в виде ряда по ОС (13.3.16) с
коэффициентами a0(r), a„(r), bn{r), зависящими
от г . Подставляя его в уравнение и краевое
условие задачи (13.3.18) и учитывая условие
ограниченности решения в нуле |и| _ < °°,
получим для коэффициентов систему краевых
задач:
1 п2
ап (г) + -ап (г) --т-ап (г) = сп (г),
Г г2
an(Po) = gn> K(0)|<oo> л = 0,1,2,...
Г г1
МРо) = ММО)|<~, л = 0,1,2,...,
где cn(r),dn(r) и gn, hn - коэффициенты
Фурье по ОС (13.3.16) функций /(г, ф)
и д(ф).
В случае внешней краевой задачи вместо
условия ограниченности решения в нуле
имеем условие регулярности решения на
бесконечности. Для задачи в кольце имеем два
краевых условия. Аналогично решаются
краевые задачи для уравнения Пуассона в круге с
краевыми условиями 2-го и 3-го рода.
Краевую задачу в секторе или части
кольца, ограниченного радиусами ф = 0 и
ф = а , редуцируют к задаче с однородными
краевыми условиями при ф = 0 и ф = а ,
вместо задачи (13.3.14) получают задачу Ш.-Л.
Ф' + ХФ = О Ще [0, а], Ф(0) = Ф(а) = 0.
(13.3.19)
В случае однородных условий Дирихле
на границе Q при ф = 0 , ф = а решение
м(/*,ф) представляют в виде ряда по ОС
собственных функций задачи (13.3.19) с
коэффициентами, зависящими от г . Дальнейшее
решение проводится по той же схеме, что и
выше.
Глава 13.4
ОБОБЩЕННЫЕ РЕШЕНИЯ ЛИНЕЙНЫХ
ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
13.4.1. Определение обобщенного
решения. Пусть
L(x9D)u(x)= ^aa(x)Dau(x) = f(x),
H<m (13.4.1)
/еЯ'(Я),
— линейное дифференциальное уравнение порядка
т с коэффициентами аа е С°° (Q), Q —
область в Ш" .
Здесь Da =Z)1ai ...D%", a = (a,,...,
ч л * Э • 1
ап ) — мультииндекс, и, = , j =1,...,я,
J i dxj
/ = V=T, Z)(Q) = C0~(Q), Д'(Я) -
пространство обобщенных функций.
Обобщенным решением уравнения (13.4.1)
в области Q называют любую обобщенную
функцию ие D(Q) , удовлетворяющую
этому уравнению в обобщенном смысле, т.е. для
любой (ре Z)(Q)
(Z,(x,Z))w,(p) = (/,(p). (13.4.2)
Равенство (13.4.2) равносильно равенству
(и,Г(дс>Д)ф) = (/>Ф)>ФбД(П)>
где Г(х, Д)ф= ]Г (-!)!«! /)а(яаФ).
|а|<т
Очевидно, что любое классическое
решение является и обобщенным решением.
При дополнительных условиях верно
следующее обратное утверждение.
Теорема 13.4.1. Если feC(Q) и
обобщенное решение и(х) уравнения (13.4.1) в
области О, принадлежит классу Ст {£!), то
оно является и классическим решением этого
уравнения в области Q .
13.4.2. Фундаментальные решения.
Фундаментальные решения играют важную
роль при исследовании вопроса
существования и регулярности решений линейных
дифференциальных уравнений с постоянными
коэффициентами.
Пусть L — дифференциальный
оператор с постоянными коэффициентами, т.е.
ФУНДАМЕНТАЛЬНЫЕ РЕШЕНИЯ
521
L = L(D) = ^ aaDa, aa = const e С.
|ос|<я;
Фундаментальным решением (функцией
влияния) дифференциального оператора
L(D) называют любую обобщенную
функцию £eD'(Rn), удовлетворяющую в R"
уравнению
ЦП)£(х) = Цх).
Фундаментальное решение оператора,
вообще говоря, не единственное, оно
определяется с точностью до слагаемого
£q e D'(Rn), являющегося
произвольным решением однородного уравнения
L(D)£o=0.
Теорема 13.4.2. Для того чтобы
обобщенная функция £е S'(Rn) была
фундаментальным решением оператора L(D), необходимо и
достаточно, чтобы ее преобразование Фурье
£(%) удовлетворяло алгебраическому уравнению
L(\)S(\) - 1, где Щ) ш £ aj?.
\а\<т
Теорема 13.4.3. Любой линейный
дифференциальный оператор L(D) с постоянными
коэффициентами имеет фундаментальное
решение £ e S , определяемое по формуле
£(x) = (2k)-"j£x [£($)], где £{\) -
какое-либо решение из S'(Rn) уравнения
Z,(£)£(£) = l, Fi\x ~ обратное
преобразование Фурье.
Из принципа суперпозиции легко
получается следующая теорема.
Теорема 13.4.4. Пусть £ -
фундаментальное решение оператора L(D) и пусть
f E D'(Rn ) такова, что свертка £ * f
существует в D'(Rn ). Тогда решение уравнения
L(D)u = f существует в D'(Rn ) и
задается формулой и = £ * f .
Физический смысл этой теоремы
состоит в следующем. Источник /(*)
представляется в виде «суммы» точечных источи и-
ков /($)8(х-$), т.е. /(д) = 8*/ =
= I/(£)8(х-£)*/£ . Каждый точечный
источник /(£)8(x-£) определяет влияние
f(£)£(x-Q. Наложение (суперпозиция)
этих влияний дает решение
Примеры.
13.4.1. Фундаментальное решение
линейного дифференциального оператора с
обыкновенными производными L —
dn
+ а{
,//i-i
~х-\
dx
■ + ... + ап определяется фор-
dx" ' dxx
мулой £(х) = Q(x)Z(x), где О(х) -
функция Хевисайда, a Z(x) — решение
задачи Коши LZ = 0, Z(0) = ... = Z("-2)(0) =
= 0, Z("-|)(0) = 1.
13.4.2. Фундаментальное решение
оператора Лапласа в R" (Д£„ (х) = Ь(х))
определяется формулами:
Ь(х) = -\п\х\,
Sn{x) = -
1
\хГ+\п>3,
(я-2)ол
где о„ — площадь поверхности единичной
сферы в R" .
13.4.3. Фундаментальное решение
оператора теплопроводности
l-£-a2A£„=b(x9t),
хе Rn, t e R \ определяется формулой
,. JL
£„(x,t) = Q{t)ne^2> (e>0).
(2а7л7)"
13.4.4. Фундаментальное решение волно-
2L - а2А£„ = 8(х, t),
(ЪЧ„
вого оператора
ы1
хе R", teR\ определяется формулами:
522 Глава 13.4. ОБОБЩЕННЫЕ РЕШЕНИЯ ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
£l(x,t) = —Q(at-\x\),
2а
£2(х,/) = -
&{at-\x\)
2па
0(0,
^2'2-Н2'
S3(x,t) = ^b(a2t2-\x\2),
что dave Lp(Q) для любого мультииндекса
а с |а| < /с (здесь производные dav
понимаются в смысле обобщенных функций,
dav = d^v/dx^ ...Эх"» ). Норму в W*(Q)
определяют по формуле
( \]/Р
Sn(x,t) = Q(t)F(\:
sin
*W
«HI
Н
(в>0)
р,к 1М1^*(П)
\а\<к р
(Я)
при любом п.
Теорема 13.4.5. Пусть S(x,t) —
фундаментальное решение оператора L
вида
рЛ+1
(13.4.3)
Теорема 13.4.6. Пространства Wk (Ф)
сепарабельны.
В случае пространства W2 (Q) можно
определить скалярное произведение
L = L(DtiDx) = d? +%Lj(Dx)d?-J.
У=|
Пусть, кроме того, £(x,t) равно О при
/ < О, £(x,t) является гладкой функцией от
te [О, + ©о) со значениями в D'(R"). Тогда
для любой функции <р(х) е Cq° (Rn ) свертка
u(x,t) = l^n£(x-y,t)4>(y)dyi t>0,
является решением задачи Коши
Примером такого фундаментального
решения является фундаментальное решение
оператора теплопроводности.
13.4.3. Пространства Соболева.
Пространства Соболева являются
математическими моделями множеств возможных состояний
многих физических явлений. Эти множества
обладают естественной структурой
гильбертова или банахова пространства, что отражает
геометрическую сторону соответствующих
задач математической физики (линейных и
нелинейных).
Пусть р>\,к — натуральное число,
Q — область в Шп. Тогда пространством
Соболева W'* (Q) называют банахово про-
(Я)'
(^)r(^W(Q,BI(W^
(13.4.3')
согласованное с нормой (13.4.3). Гильбертово
пространство W* (Q) обозначается также
Я* (О).
В теории краевых задач для
дифференциальных уравнений важную роль играют
замкнутые подпространства пространств
Соболева. Наиболее простое из них
пространство W кр (О) | Н к (О) = W \ (О) |, которое
можно определить как замыкание множества
Cq°(Q) в пространстве Wp (Q) по норме
(13.4.3).
Примеры.
13.4.5. Пространство Wk (Q), где
Q = (а,Ь) ее R , совпадает с множеством
всех функций v на [я,£], имеющих
классическую (А:-1)-ю производную на (а,Ь),
которая является абсолютно непрерывной на
[а,Ь] функцией, а производная к-ro порядка
г/ ' существует почти всюду на (а,Ь) и
принадлежит Lp(a,b).
13.4.6. Пространство W p(Q) , где
странство всех таких функций ve Lp (Q), Q = (fl,/i)ccR, совпадает с подмножеством
ПРОСТРАНСТВА СОБОЛЕВА
523
всех функций v из Wk (Q),
удовлетворяющих условиям:
V(a) = ... = v{k-X)(a) =
= v(b) = ... = v(k-{)(b) = 0.
13.4.7. Пространство Н (Rn) состоит
из таких обобщенных функций ve S'(Rn ) ,
что (l+ft ) v^)eL2(R"), где и -
преобразование Фурье функции v .
13.4.8. Пусть Q = {xe R" :\х\<\] -
единичный шар в Rn , v(x) = \х\У, где
уеК. Если у "" четное и неотрицательное,
то veC°°(Q) и, значит, velVk(Q) при
любых к, р . Если же у не является четным
и неотрицательным, то условие v e W~ (Q),
как нетрудно проверить, равносильно
неравенству у > к - п/р .
При исследовании эволюционных задач
математической физики используются
анизотропные пространства Соболева. К ним
относятся, в частности, гильбертовы
пространства Hk0(Q), где keN, Q = {(x,t):
:xeQ,0</<71}. Множество Нк'° (Q)
состоит из всех функций v(x,t)e /^(Q),
обобщенные производные которых (в смысле
D\Q)) d?^ принадлежат Z^(Q) при всех
|а| = ot| +... + ая < к . Скалярное
произведение в//' (Q) определяется по формуле
(v,w)Hkt0(Q)^j^d^vd^wdxdt.
Q\a\<k
Свойства пространств Н ' (Q)
аналогичны, с учетом естественных
модификаций, свойствам пространств Н (Q),
приведенным ниже.
Теорема об эквивалентности норм в
W p(Q) утверждает, что функционал
м.,„ = 1Нмш
\а\=к р
определяет в пространстве IV p(Q) норму,
эквивалентную норме (13.4.3).
В частности, для любых vg H (Q)
выполняется неравенство Стеклова—Пуанкаре
j\v\2dx <CQj \gradv\2dx
Q Q
с некоторой постоянной CQ, зависящей
лишь от области Q .
Теоремы вложения описывают вложения
пространств Соболева в другие пространства.
К ним относят следующие основные
утверждения:
1) если Q — ограниченная область, то
Wk (Я) dWk', {Q.) при р>р, k>k'\
2) если Q — ограниченная область с
регулярной границей, то
Wk(Q)^Cm(h) при к>- + т,
Р
И'* (О) с И? (О)
при к -г >0, к -г > п\ ,
[р я)
W$ (П) cc (Vqr (Q) при рк<п,к-г> О,
к -г > п\ ,
[р я)
где q = р/(р - 1), р>\, с; и ее;
-соответственно непрерывное и компактное
вложения одного пространства в другое.
Приведенные теоремы вложения
являются точными в том смысле, что если числовые
показатели не удовлетворяют указанным
неравенствам, то соответствующее вложение
отсутствует. Например, функция v(x) = 1п|л:|е
еН1(П), но v(x)eC(h), где П = {хе
е R3 :|jc|<1}.
Теорема о плотности утверждает, что
множество C°°(Q) всюду плотно в Wp (Q),
если Q - ограниченная область с регулярной
границей.
Теоремы о следах описывают сужения
(ограничения) функций из пространств
Соболева на подмногообразия области Q . Одной
524 Глава 13.4. ОБОБЩЕННЫЕ РЕШЕНИЯ ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
из простейших таких теорем является
следующая.
Теорема 13.4.7. Пусть Г - достаточно
гладкая поверхность, лежащая в ограниченной
замкнутой области QcR", a y:C°°(Q) —»
С°° (Г), y(v) = v\ - оператор сужения.
Тогда оператор у однозначно продолжается до
линейного непрерывного оператора
y:fV*(Q)^>Lp(r) при к>\,р>\.
Функцию y(v) называют при этом следом
функции Wp(Q.).
В общем случае след y(v) функции
vslVp(Q) определяется как предел в
МО
где Q — ограниченная область в R" ,
коэффициенты я,у, bj, с,-,(/, j = 1,...,п), d —
вещественнозначные измеримые и
ограниченные функции на Q , точнее существуют такие
положительные постоянные Ли V, что
ХЫФл2'
последовательности
где
vmeC°°(Q), vm -> v в Wp (Q) (см.
теорему о плотности), vm\ — обычное сужение
(ограничение) функции vm e C°° (Q) на
поверхность Г. При этом lim vm\r в Lp(T)
существует и не зависит от выбора
аппроксимирующей функцию v в Wp (Q)
последовательности vm е С°° (Q).
С помощью следов пространство
Wp (Q) описывается в случае достаточно
гладкой границы dQ как подмножество всех
функций veWp(Q), для которых
y(dav) = О при всех |<х| < к - 1.
13.4.4. Понятия обобщенных решений
эллиптических краевых задач и задач на
собственные значения. Рассмотрим
формальное дифференциальное уравнение
второго порядка
/=1
ди(х)
dXj
au(x)-^p- + bi(x)u(x) +
+ d(x)u(x) = f(x), xeQ,
I(|^(x)|2+KW|2) + l^)Hv2
/=I
при почти всех x e Q .
Будем предполагать также, что д,у (дс) =
= ajj(x) при почти всех xeQ и всех
i,j = \,...,n, а уравнение (13.4.4) - строго
эллиптическое, т.е. выполняется неравенство
при почти всех х е Q и всех ^gE".
Примером строго эллиптического
уравнения вида (13.4.4) является уравнение
div (k(x)gradu(x)) + а(х)и(х) = f(x),
где k,a <zC(Q), k(x) > k$ = const > 0 при
всех x e Q .
Вместе с уравнением (13.4.4) рассмотрим
три краевых условия на д£1:
(13.4.4 а) u\dQ = <р; (13.4.4 6)
= ф;
да
(13.4.4в) I— + ои
3Q
(13.4.4)
где (р и о - заданные на д£1 функции.
Уравнение (13.4.4) вместе с одним из
условий (13.4.4 а), (13.4.4 б) или (13.4.4 в)
определяет соответственно задачу Дирихле (первую
краевую задачу), задачу Неймана (вторую
краевую задачу) или третью краевую задачу.
Эти три задачи при некоторых
дополнительных условиях могут быть сведены к
задачам с однородными краевыми условиями, т.е.
к таким, в которых ф^О. Для этого нужно
сделать замену искомой функции на новую
неизвестную функцию v = и - Ф , где Ф —
ПОНЯТИЯ ОБОБЩЕННЫХ РЕШЕНИЙ ЭЛЛИПТИЧЕСКИХ КРАЕВЫХ ЗАДАЧ 525
произвольная функция, удовлетворяющая
лишь выбранному краевому условию
(13.4.4 а), (13.4.4 6) или (13.4.4 в). Поэтому в
дальнейшем будем считать, что ф = О.
Уравнение с комплексным параметром X
Lu = Хи
(13.4.5)
вместе с одним из однородных условий
(13.4.4 а), (13.4.4 6) или (13.4.4 в) определяет
соответствующую задачу на собственные
значения (и собственные функции).
Аналогично указанным краевым задачам
и задачам на собственные значения
рассматриваются общие эллиптические краевые задачи
(для эллиптических уравнений высших
порядков и систем) и соответствующие задачи
на собственные значения.
Обобщенным (слабым) решением задачи
(13.4.4), (13.4.4 а) (при ф = 0) называют
любую функцию u e H '(Q), удовлетворяющую
при всех ve H (Q) тождеству
L(u,v).j
i=\
Q
dll
du dv
OX: oXj
tyu- q -^-v |- duv
dXj dxj
\dx = - \ fvdx.
Q
(13.4.6)
Обобщенным (слабым) решением задачи
(13.4.4), (13.4.4 b) при b{ =0 и ф = 0
называют любую функцию и е Н (Q),
удовлетворяющую при всех ve Я (Q) тождеству
_ Л
/,у=1 J ' /=1
дХ:
\dx +
+ i guv dS = - Г fv dx.
3Q
Здесь v, vx.
(13.4.7)
комплексно-сопряженные функции к функциям
соответственно v, vx. .
Обобщенное (слабое) решение задачи
(13.4.4), (13.4.4 б) является и обобщенным
(слабым) решением задачи (13.4.4), (13.4.4 в)
при G = 0, Ьх; = О и ф = 0 .
Обобщенной собственной функцией задачи
(13.4.5), (13.4.4 а) при ф = 0 называют любую
функцию ие Н (Q), и * 0 , для которой
существует такое число X е С
(соответствующее функции и собственное значение
задачи (13.4.5), (13.4.4 а)), что при всех
ие Н (Q) выполняется тождество
L(u, v) = -X(u, v)Ll{Q).
Аналогично определяют обобщенные
собственные функции ие Н (Q) и
соответствующие им собственные значения X задачи
(13.4.5), (13.4.4 в) или (13.4.5), (13.4.4 6). Для
этого используют тождество (при ty = О )
L(w, v) + J GuvdS = -X(u, v)L2 (Q),
которое должно выполняться при всех
v = Hl(Q).
При bj =0 и q = 0 обобщенные
решения задачи (13.4.4), (13.4.4 а) совпадают
со стационарными точками функционала
«потенциальной энергии»
F: Я'(а)->С, D(F) = Hl(Q),
fll',7=l ' J
\dx +
vdx.
Таким образом, в этом случае
обобщенные решения и являются «истинными
состояниями» данной системы в соответствии с
принципом наименьшего действия. Аналогичное
утверждение имеется и для задач (13.4.4),
(13.4.4 6) или (13.4.4), (13.4.4в).
Например, функционал
F(v) = jj\Vvfdx + jfvdx,
D(F) = H\Q),
имеет физический смысл потенциальной
энергии в возможном состоянии ve D(F)
однородной упругой среды (мембраны при
п = 2 или упругого тела при п = 3 ), на
которую действует внешняя сила с плотностью
526 Глава 13.4. ОБОБЩЕННЫЕ РЕШЕНИЯ ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
f(x). В соответствии с принципом
наименьшего действия истинное состояние и(х)
рассматриваемой упругой среды совпадает со
стационарной точкой функционала F (для
данного функционала такая точка
единственна). Таким образом, функция ие D(F)
является решением уравнения F\u) = 0, где
F (и) — производная Гато функционала F
в точке и. Производная F\u) легко
вычисляется, и уравнение F\u) = О принимает вид
f VuVvdx = -[ fvdx, v = Hl(Q).
Это уравнение является частным
случаем уравнения (13.4.6) и определяет
обобщенное решение краевой задачи
Д|/= /(*), xeQ,u\dQ = 0.
Кроме того, в случае ^ s0 и с, = 0 в
соответствии с вариационным принципом Рэлея
обобщенные собственные функции задачи
(13.4.5), (13.4.4 а) являются стационарными
точками функционала «потенциальной энер-
0 •
гии» F на множестве функций ve H (Q),
определяющих заданную «кинетическую
энергию». Аналогичные утверждения имеются
и для задач (13.4.5), (13.4.4 6) или (13.4.5),
(13.4.4 в).
Нетрудно также проверить, что всякое
классическое решение иеС (Q) краевой
задачи (13.4.4), (13.4.4 а); (13.4.4), (13.4.4 6) или
(13.4.4), (13.4.4 в) является ее обобщенным
решением. Аналогично всякая классическая
собственная функция иеС (Q) является
обобщенной собственной функцией
соответствующей задачи (13.4.5), (13.4.4 а); (13.4.5),
(13.4.4 б) или (13.4.5), (13.4.4 в).
13.4.5. Функциональные методы
решения линейных эллиптических краевых
задач и задач на собственные значения.
Структура гильбертова пространства в
функциональных пространствах, в которых ищутся
обобщенные решения линейных
эллиптических краевых задач, и линейность этих задач
позволяют использовать соответствующие
методы функционального анализа.
Формулируемые ниже результаты
основаны на теореме Рисса о представлении
линейного непрерывного функционала,
заданного на гильбертовом пространстве, и
теоремах Фредгольма.
Теорема 13.4.8. Если
( п \
Г Idv-fbi^ldx^O
JQ ^ ' дХ;
для любой неотрицательной функции v из
Ci(Q), то обобщенное решение задачи
(13.4.4), (13.4.4 а) при любой f e Lq (Q)
существует и единственно.
Множество {Хт} собственных значений
задачи (13.4.5), (13.4.4 а) не более чем счетное,
каждое {Хт} имеет конечную кратность, и
единственной предельной точкой может быть
только ©о . Вместе с {Хт} в указанное
множество входит и {Хт}, при этом кратности
{Хт} и {Хт} совпадают.
Если дополнительно ty = 0 и q = 0 , т.е.
L — симметрический дифференциальный
оператор, то задача (13.4.5), (13.4.4 а) имеет
счетное множество собственных значений (с
учетом кратностеи) {Хт} cR,w = 1,2,...
При этом все собственные значения {Хт}, за
исключением, может быть, нескольких первых,
отрицательны и Хт —> -<» при т -* °° . Из
обобщенных собственных функций,
соответствующих {Хт}, можно выбрать базис {ит},
ортонормированный в LqiQ) и ортогональный
в смысле скалярного произведения (при некото-
о
ром достаточно большом Xq ) в Н (Q)
[v, w] = L(v,w) + XQ (v,w)L2(Q),
эквивалентного скалярному произведению
(13.4.3').
Минимаксный принцип определения
собственных значений и собственных векторов
самосопряженных операторов позволяет
находить {Хт} и {ит} для симметрической
задачи (13.4.5), (13.4.4 а) как решения
следующих вариационных задач:
-Хт = sup inf L(v,v) =
Мт_х \\v\\=\,(v,w)=0,w<=Mm_\
= L(um,um), /я = 1,2,...
РЕГУЛЯРНОСТЬ РЕШЕНИЙ ЭЛЛИПТИЧЕСКИХ КРАЕВЫХ ЗАДАЧ
527
Здесь Мт_\ -произвольное (т-\) -мерное
подпространство пространства Ь± (Q),
/и = 1,2,...
Заметим, что точное вычисление
собственных значений и собственных функций
возможно лишь для простейших
обыкновенных дифференциальных уравнений или для
многомерных краевых задач, которые можно
решать методом разделения переменных. Тем
не менее в общем случае можно получить
оценки собственных значений (например, с
помощью минимаксного принципа), а в ряде
случаев - и оценки собственных функций.
Теорема о базисности собственных функций
является основой метода Фурье решения
краевых задач для параболических и
гиперболических уравнений (см. пп. 13.4.7, 13.4.8).
Утверждения, аналогичные
приведенным выше утверждениям для задач (13.4.4),
(13.4.4 а) и (13.4.5), (13.4.4 а) имеют место для
задач (13.4.4), (13.4.4 б) или (13.4.4), (13.4.4 в)
и (13.4.5), (13.4.4 б) или (13.4.5), (13.4.4 в).
Метод Тшхеркина (в симметрическом
случае совпадающий с методом Ритца)
позволяет доказывать существование
обобщенных решений и находить их как пределы
строящихся в методе приближенных решений.
Этот функциональный метод является
основным примером проекционных (соответственно
вариационных) методов приближенного
решения линейных и нелинейных задач
математической физики. Подробнее он обсуждается в
главе 13.5 (см. п. 13.5.8) для решения более
общих, чем в данной главе задач.
13.4.6. Регулярность решений
эллиптических краевых задач.
Теорема 13.4.9. Пусть и е И1 (Q) -
обобщенное решение уравнения (13.4.4), т.е.
Ци, v) = -(/, v)L2 для всех v e Cq (О),
ay,bi cC*+l(Q),c^cC*(Q),
/,у = !,...,#!, fe Hk(Q),keN.
Тогда для любой подобласти Q с с Q
и g H + (Q') и выполняется оценка
1Н1я^,п^с(1ИяЧп)+1Ии(п))
с некоторой постоянной С.
Из этой теоремы и теоремы вложения из
п. 13.4.3 непосредственно вытекает следующее
утверждение.
Теорема 13.4.10. Пусть usHl(Q) -
обобщенное решение уравнения (13.4.4) и пусть
<*ij> bi9 q, d, f <=С~(П), (/, j = l,...,w).
Тогда ие C~(Q).
Приведенные два утверждения о
внутренней регулярности обобщенных решений при
дополнительном предположении
определенной гладкости границы 3Q распространяются
на всю область Q .
Теорема 13.4.11. Пусть иеН{(П) -
обобщенное решение уравнения (13.4.4), Оу9Ь( с
сСый, с,, </сС*(Я), (/, y = U.,/i),
/ с Hk (Q), дО. е Ск , где к е N, и пусть
существует такая функция фе Н + (Q),
о
что и-уе Н1(П). Тогда ueHk+2(Q) и
выполняется оценка
* С (И* (Q,+И** (Q)+№,*♦'(«,))
с некоторой постоянной С, не зависящей от
и, f и (р. Если функции ay, bj, q, (i,j =
= 1,...,л), d, f и ф принадлежат C°°(Q)
и dQe C°°, то ие С°° (Q).
Из теоремы о существовании и
единственности обобщенного решения в п. 13.4.5 и
последнего утверждения вытекает следующая
теорема о существовании и единственности
классического решения задачи Дирихле для
уравнения (13.4.4).
Теорема 13.4.12. Пусть а^ , q , d с
<zC~(Q), bs=0(i,j = l,...9n), d(x)<0
при всех х е Q и dQ е С°°. Тогда для любых
/, феС°°(£2) существует и единственно
решение иеС°°(£1) уравнения (13.4.4),
удовлетворяющее условию и = ф на dQ .
Поскольку уравнение (13.4.5) при
фиксированном X является частным случаем
уравнения (13.4.4), то приведенные выше
теоремы о регулярности переносятся, с
соответствующими модификациями, на
обобщенные собственные функции задачи (13.4.5),
(13.4.4 а).
528 Глава 13.4. ОБОБЩЕННЫЕ РЕШЕНИЯ ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ
Аналогичные теоремы о регулярности
имеют место для обобщенных собственных
функций задач (13.4.5), (13.4.4 6) и (13.4.5),
(13.4.4 в), а также для решений общих
эллиптических краевых задач.
13.4.7. Обобщенные решения
параболических краевых задач. Рассмотрим
краевые задачи для параболических уравнений вида
+a(x)u = f(x,t), (x,t)eQTi
(13.4.8)
^ S?\\
где keC(Q), аеС(П), k(x)>k$ =
= const > 0 и а(х) > О при всех xeQ,
Qf = {(х, /):xeQ, 0<t<T}, Q -
ограниченная область в Rn .
Кроме уравнения (13.4.8) рассмотрим
начальное условие
4=0 =(Р<*)> xeQ> (13А9>
и одно из граничных условий:
(13.4.9 а) и\Гт =Х; (13.4.9 6) |^|
1Г>
(13.4.9в)
= х;
(!го(Н
X.
где Гг ={(x,t):xedtl, 0</<71}, о и х -
заданные на Г^ функции, v - единичная
внешняя нормаль к гиперповерхности Г^ .
Тогда обобщенным решением первой смешанной
задачи (13.4.8), (13.4.9), (13.4.9а) (при % = ^)
называют любую функцию ие Н ' (Qj),
удовлетворяющую граничному условию
н| = 0 (в смысле следов) и тождеству
1г>
Г (-uvt + kV xu Vxv + auv)dxdt =
г>
= J Н
"о
Щ
dx +
j fvdx
dt
для всех v e H (Г^), таких, что v\_ = 0,
iry
v\ = 0 (в смысле следов), где Llx =
= {(xJ):xeQJ = x}, 0 < т < 7\
При х * 0 понятие обобщенного
решения задачи (13.4.8), (13.4.9 а) сводится
заменой и = и - X , где Х\ = х > к
приведенному выше понятию обобщенного решения
при х - 0 • Аналогично определяются
обобщенные решения второй или третьей
смешанной задачи (13.4.8), (13.4.9), (13.4.9 6) или
(13.4.8), (13.4.9), (13.4.9в).
Теорема 13.4.13. Пусть fel^iQr),
фе Lq(Q). Тогда каждая из смешанных задач
(13.4.8), (13.4.9), (13.4.9 а) или (13.4.8),
(13.4.9), (13.4.9 в) (в частности, задача
(13.4.8), (13.4.9), (13.4.9 6)) при х = ^ чмеет
единственное обобщенное решение и . Это
решение находится методом Фурье (методом
разделения переменных) и представляется
сходящимся в Н ' (Qj ) рядом
u(xit)=y£Um(t)Xm(x),
т=\
где {Хт} — ортонормированный в /^(Q)
базис из обобщенных собственных функций задачи
6\v(k(x)gra6(X))-a(x)X = \X, хеО
(13.4.10)
4о=°'"«(|£ + °<*>*
= 0,
№
«/«(0 = Ф^Х"/+/0//Я|(х)^(/-х)Л,
(13.4.11)
\т — собственные значения,
соответствующие Хт, ф,„ = (<р, Xm)Ij2(n), f„,(t) =
= ff(x,t)Xm(x)dx,m = l,2,...
При этом имеет место оценка
с некоторой постоянной С, не зависящей от f
и ф.
Из этой теоремы сразу следует
корректность обобщенных постановок смешанных
задач для уравнения (13.4.8), т.е.
существование, единственность и непрерывная
зависимость от данных задачи / // ф.
ОБОБЩЕННЫЕ РЕШЕНИЯ ГИПЕРБОЛИЧЕСКИХ КРАЕВЫХ ЗАДАЧ
529
При дополнительных условиях на глад- Пример 13.4.9. Первая смешанная задача
кость коэффициентов, данных смешанной 2
задачи (т.е. на к, я,/,ф) и гиперповерхность Щ - а и^ (О < х < /, 0 < /),
3Q обобщенное решение и принадлежит и\ _ и\ _ о
анизотропному пространству Соболева типа х=
H2s>s(QT) или ueC2](QT) и является в и\ ^cx(l-x)
последнем случае классическим решением /
смешанной задачи. имеет единственное обобщенное решение
(2я+1)2яУ
/ .ч 8с^ 1 л ' . (2л + 1)юс
7Г3 ^Оя + П3 /
tij^5(2a7 + 1)
Можно доказать, что это решение будет Г //Г7 ^ w~^*
F J (kvYu VYv + auv- UfUfjaxat =
и классическим для данной задачи. J
В случае зависимости коэффициентов А: ^
и а от х ч t существование обобщенного = ГшУ| dx + [ fvdxdt
решения доказывается методом Галеркина. J lflo J
Аналогичные результаты верны и для более ^Т
общих параболических уравнений. и\ <r\ \
v JF при всех veH (Qj), для которых
13.4.8. Обобщенные решения гипер- ^ = о, v\ = 0 (в смысле следов)
болических краевых задач. Рассмотрим т т
краевые задачи для гиперболических уравнений Теорема ^ 4 ы д^ /е^^),
вида
I/
"// -divJC(A:(x)grad:ct/) + fl(x)t/= Ф^ # (Q), уд ^(£2) в случае первой сме-
(13.4.12) , ч
= f(x t) (x t)eQr шанной задачи и фе Я (£2) в случае второй
или третьей смешанной задачи для уравнения
где k, a, Qj — такие же, как и в п. 13.4.7. (13.4.12). Тогда обобщенное решение каждой из
Кроме уравнения (13.4.12) рассмотрим У^занных задач существует, единственно и
начальные условия представляется сходящимся в Н (Qj) рядом
I /ч | /ч ^/.^x.^v (определяемым по методу Фурье)
и одно из граничных условий (13.4.9 а), t/(x,Q= } Um(t)Xm(x),
(13.4.9 6) или (13.4.9 b) при % = ^ (без <>гРа- w=l
ничения общности по тем же соображениям, где {Хт) _ ортонормированный в ^(П)
что и в п. 13.4.7.). ^ ^^ „ ,
0 оязмс из обобщенных собственных функции со-
Пусть /е LqiQj), (ре Я '(£2), ответствующей задачи (13.4.10), (13.4.11),
yeZ^CQ). Тогда обобщенным решением пер- г m г -
вой смешанной задачи (13.4.12), (13.4.13), ит(0 = <Рт cos J\Xm | / + -=^= sin J\\m \ t +
(13.4.9 а) (при х - 0 ) называют любую
функцию ueH](QT), удовлетворяющую на- + _1 Г'^ (,)sjn Jp^(/ - x)dx
чальному условию н| = (р, граничному VI т\
условию и\Г = 0 (в смысле следов) и тожде- (« случае, когда А,, = 0, Ux (t) = (р, + у,/1 +
СТВУ +j'/i(0('-t)</T),
530
Глава 13.5. НЕЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
%i = (ф. %т )b2 (Q) > Vw = (Vi Хт )b2 (Q)»
A,w — собственные значения,
соответствующие Хт, т = 1,2,...
Я/?м этол! имеет место оценка
IHIw-(0r)^c(lHlw-(n)+MU(n)+»/fli2(n))
с некоторой постоянной С, «в зависящей от
ф, \|/ w / .
Из этой теоремы сразу следует
корректность обобщенных постановок смешанных
задач для уравнения (13.4.12).
При дополнительных условиях на
гладкость коэффициентов, данных задачи (т.е. на
Можно доказать, что это решение будет
и классическим для данной задачи.
В случае зависимости коэффициентов к
и а от х и / существование обобщенного
решения доказывается, как и в
параболическом случае, методом Галерки на.
Аналогичные результаты имеют место
и для более общих гиперболических
уравнений.
СПИСОК ЛИТЕРАТУРЫ
1. Владимиров B.C. Уравнения
математической физики, 4-е изд. М.: Наука, 1981,
512с.
2. Гилбарг Д., Трудингер Н.
Эллиптические дифференциальные уравнения с
частными производными второго порядка. М.:
Наука, 1989, 464 с.
3. Егоров Ю.В., Шубин М.А. Линейные
дифференциальные уравнения с частными
производными. Основы классической теории.
Итоги науки и техники ВИНИТИ. Совр.
пробл. матем. Фунд. направления. Т. 30, М.:
ВИНИТИ, 1988, 264 с.
4. Ладыженская О.А. Краевые задачи
математической физики. М.: Наука, 1973, 408 с.
5. Соболев С.Л. Уравнения
математической физики. М.: Наука, 1966, 444 с.
к, я, ф, \|/, / ) и гиперповерхности д£1
обобщенное решение и принадлежит
пространству Hs (Qt) или С (Qj) и является
в последнем случае классическим решением
смешанной задачи.
Пример 13.4.10. Первая смешанная задача
utt = а2ихх (0 < х < /, 0 < /),
и\ =и\ . = 0,
\х=0 Ijc=/ '
имеет единственное обобщенное решение
Глава 13.5
НЕЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ
УРАВНЕНИЯ
13.5.1. Нелинейные
дифференциальные операторы. Рассмотрим подробно
нелинейные дифференциальные операторы в
дивергентной форме. Случаи более общих
операторов, а также систем, более трудны и
громоздки. Пусть
A(v)(x) = X Н )Н Э<4 (*, h v(x)), х е П,
\а\<к
(13.5.1)
— формальный нелинейный
дифференциальный оператор, определенный в ограниченной
области flcR". Здесь
I ^ dv_ dv_ cfv_ dkv\
~Р Эх, """Эх/ Эх,2'""дх*\
— вектор-функция, компонентами которой
являются функция и и все ее производные
порядка к включительно (при этом порядок
дифференцирования смешанных производных
безразличен и они учитываются только 1 раз).
Эти компоненты упорядочены
лексикографически с помощью мультииндексов а , т.е.
«(*>') = —г-2,
5тс5 ;S(2a* + 1)5
(2п + \)nat . (2п + \)пх
cos si п - —.
НЕЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ОПЕРАТОРЫ
531
а -< р <=>
И<|Р|,
\а\ = Щ,Щ>Ь,
М = |Р|>а/ = Р/ при ' ^ ™ " 1, «w > pw
для некоторого /ие {2,...,я}.
Пусть, далее, функции яа (*,£),
|а| < А; («коэффициенты» оператора Л ), где
£ = (£а )|<х|<Аг (с лексикографической
упорядоченностью компонент £а), £g R , /Г = С^ ,
удовлетворяют следующим условиям.
Условие 13.5.1. Условие Каратеодори:
аа(х, ^)(\а\<к) измеримы (по Лебегу) по
xeQ при всех £g R , непрерывны по
£е R при почти всех jcg Q .
Условия 13.5.2. Для почти всех х е Q и
для всех ^eR функции яа(*,£)(|а| ^ А)
удовлетворяют условиям
\аа(х,Ц<с{
I Ь
1 ' Р
£«(*)+ X Ы
г(а,Р)
где р > 1 и
a) q =С|(/) - неотрицательная
непрерывная функция переменной / Е [0, «>) t
С\ = const при к < 0 ;
Р
б) &х е 4(a) (Q)> ™e
*(<х):
сс>* ,
<7(а)-1 ' ' Р
1, |а| <*-■£;
в)
г(а,Р) =
tf(a) ' ' Р
г)
<7(Р),
пр
|а|<*--;
/ , ■ при |у|>£--,
*-(*-М)/> '
<?(у)>1 при Ы = к--.
1 ' />
Примеры.
13.5.1. Обыкновенный
дифференциальный оператор 2-го порядка
A(v)(x) = - — a{(x,v(x),v'(x)) +
+aQ (x9v(x),v'(x))9 xe Q = (a,b)ac: R[,
удовлетворяет условию роста А2), если при
Р>\
h(*.5o,§l)|sq,(|4o|)[«.(*) + |^r],
где Cq , q — неотрицательные
непрерывные функции на [0, ©о], g{ e Lg(a,b), q =
= /V(P ~ 1)» £o G 4 (я» ^) • в частности,
•A(D)«-V + e".
13.5.2. Оператор 4-го порядка,
At ч/ ч dl d
A(v)(x) = —-a2 -—^i +0o>
где я, =Я/(х, a(x), u'(x), u"(*)), xeQ =
= (a, b) <=c R1, / = 0,1,2, удовлетворяет
условиям роста А2), если при р > 1
<с2(|$оН^.|)[ы*)фГ],
532
Глава 13.5. НЕЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
<с{
\ai(x^0^{^2)\<
■/(|5о| + |§1|)[л(') + |§2Г], ' = 0,1,
где с0, С\, с2 - неотрицательные
непрерывные функции на [0, +°°], g2 e Lg(a,b),
Я=Р/(р-1), So , g\ ci| (я, A). В частности,
Л(у) = у(4) + g(u,|i/|), где g = g(s,/) -
произвольная непрерывная на R функция.
13.5.3. Оператор .4(a) = -Да + |а| v, где
5>0 при л = 2, 0<s<4/(n-2) при л>2,
удовлетворяет условиям 13.5.1, 13.5.2. Здесь
М*> £о,£ь •••,£/! )^ЫЧ(Ь /> = 2, q(/) = l,
&(х)з0, / = 0,1,.»,я.
13.5.3. Рассмотрим оператор
IP-2
/=1"*»
Эо
Эх,-
dv_
Эх,
+ *<»),
где р > 1, Л = h(t) — непрерывная на R
функция (при р = 2 и Л(/) = |/| t
получается пример 13.5.3). При р > п оператор Л
удовлетворяет условиям роста 13.5.2 для
любой функции h(t) (при этом достаточно
взять Ч,(И)-|*(0| + |*И)|,а)(*)"1). При
р < п условия роста 13.5.2 выполняются,
если |Л(/)|<с|/| + d, где с и d —
положительные постоянные,
_ Unp - п + р)/(п - р) при р<п9
[s - 1 при р = п,
a s > 1 - произвольное.
Теорема 13.5.1. Пусть Л — формальный
дифференциальный оператор, заданный
формулой (13.5.1), а функции аа, |сс| < к ,
удовлетворяют условиям 13.5.1, 13.5.2. Тогда формальный
оператор Л задает непрерывный оператор
А : W* (П) -> (\Vkp (П))*, Я(Л) = ^ (Q),
<А(и), w> = £ J^a(x,5^y(x))aaw(x)^c,
|a|<*Q
(13.5.2)
13.5.2. Краевые задачи для
нелинейных стационарных уравнений. Рассмотрим
формальное нелинейное дифференциальное
уравнение
A(u)(x)=^dafa(x), хеП, (13.5.3)
где Л — формальный дифференциальный
оператор порядка 2Л вида (13.5.1),
коэффициенты которого удовлетворяют условиям
13.5.1,13.5.2, faeLs{a)(il), \a\<k.
Пусть V — произвольное замкнутое
подпространство пространства Wp (Q), такое,
что ^*(Q)cKc W*(Q.) (здесь р > 1
определено в условии 13.5.2).
Обобщенным решением уравнения (13.5.3)
называют любую функцию и G Wp (ft), для
которой при всех vsCq(Q) выполнено
интегральное тождество
J £ аа (х, bku(x))dav(x)dx =
n|a|<*
= JX/a(*)da0(*)dr.
n|a|<*
(13.5.4)
Обобщенным решением уравнения (13.5.3)
относительно пространства V называют
любую функцию и е V , для которой при всех
vsV выполнено интегральное тождество
(13.5.4).
Примеры.
13.5.5. При V - W n(Q) в случае
достаточной гладкости границы области Q ,
функций аа и обобщенного решения и(х)
получается, что и(х) — решение уравнения
(13.5.3) в классическом смысле,
удовлетворяющее краевым условиям
даи(х) = 0, |сс|<А;-1, хеЭП,
т.е. и(х) является классическим решением
задачи Дирихле для уравнения (13.5.3).
ВАРИАЦИОННЫЙ МЕТОД РЕШЕНИЯ КОЭРЦИТИВНЫХ ЗАДАЧ
533
13.5.6. При V = W$ (Q) и при
выполнении некоторых условий гладкости
обобщенное решение и(х) будет классическим
решением краевой задачи для уравнения
(13.5.3) с краевыми условиями Неймана вида
Nj(x> &2*-1"(*)) = °>
J = 0,1,...Д-1, хе 3Q,
где N; — известные функции, определяемые
через aa>fa. Это аналог классической задачи
Неймана для уравнений второго порядка.
13.5.3. Вариационный метод решения
коэрцитивных задач. Из определения
обобщенного решения краевой задачи сразу
следует, что разрешимость этой задачи
эквивалентна разрешимости операторного уравнения
7Чн) = 0,где T.V ->K\ D(T) = V ,
<T(v), w> =
= X J[M*' &kv(x))-fa(xj\daw(x)dx.
\o\<k Q
(13.5.5)
Это приводит к нескольким методам решения
(при дополнительных условиях к условиям
13.5.1, 13.5.2) — вариационному, методу теории
монотонных операторов и топологическому.
Наиболее разработанный из этих
методов — вариационный. Сформулируем
основной результат, основанный на этом методе.
Пусть при хейДеК определена
измеримая функция /(*,£), непрерывно
дифференцируемая по £g R при почти
каждом xeQ. Пусть функции fa(x,^,) =
= Э/(дг,!;)/Э£а , |а| < к удовлетворяют
условиям 13.5.1, 13.5.2 и /(х,0)€ Ц(П). Тогда
формула
F(v) = \f(x,bkv(x))dx (13.5.6)
определяет функционал F: V—>R, V сW» (Q),
имеющий в каждой точке v G V
производную Гато, где при всех v, w czV
<F\v\ w>= £ jf0L(x9bkv(x))daw(x)dx.
\a\<k q
Стационарные точки и функционала F
являются обобщенными решениями
относительно V уравнения
£(-1)Иэа/а(хАи(х)) = 0. (13.5.7)
|а|<*
Определим еще три условия для
функций вида аа(х, £), удовлетворяющих
условиям 13.5.1, 13.5.2.
Условие 13.5.3. При почти всех хе £2
и всех 5 = {$« }|„|=jt б R*° , С = {С }щ=к e
eR*», Л = {Ла>|о|<*екГ
ХК<-Х'11'С)-Оа(^Л,С')](Са-Са)>0.
при С ^ С
Условие 13.5.4. При почти всех хе £2 и
всех це RK', £,е RK°
f \
1«И
SK
X М
к--<а<к-\
\а\=к
Ла)
где Л(а) < ^(а)(см. условие 13.5.2), c2(t) и
Сз (/) — непрерывные положительные
соответственно невозрастающая и неубывающая
функции на [0, + °°).
Условие 13.5.5. При t\gRK,C), т,
При |^| —> °°
равномерно относительно хе ft, Т|€ Ч*, где
Ч* — произвольное ограниченное
подмножество в RK .
Примерами функций, удовлетворяющих
условиям 13.5.3, 13.5.4, являются
дифференцируемые по £ функции вида яа (*,£),
удовлетворяющие при xeQ^eK ,
неравенству
534
Глава 13.5. НЕЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
ЖРИ
I Ы
чР-2
1+1Ь
1й
с ^ap(x»^) = <Цх (*,£)/<% и непрерывной
положительной невозрастающей функцией
c(t) на [0, +оо). Это неравенство
обеспечивает эллиптичность уравнения (13.5.3),
являясь усиленным вариантом условия
эллиптичности.
Теорема 13.5.2. Пусть функционал
F : V —> Ш определен формулой (13.5.6) и
удовлетворяет условию коэрцитивности
lim F(v) =+oo.
\\v\\v ->~
Пусть, кроме того, /(х,0)еЦ(С1) и
функции /а(х,£) удовлетворяют условиям
13.5.1 — 13.5.3, 13.5.5. Тогда соответствующая
подпространству V краевая задача для
уравнения (13.5.7) имеет обобщенное решение. Если,
дополнительно, функции /а(х,£)
удовлетворяют и условию 13.5.4, то это обобщенное
решение может быть получено как сильный
предел минимизирующей последовательности для
функционала F.
Заметим при этом, что в условиях
теоремы 13.5.2 функционал F имеет точку
глобального минимума.
13.5.4. Примеры нелинейных задач
механики. Одним из примеров задач
механики, моделируемых коэрцитивными краевыми
задачами и решаемыми вариационным
методом, является задача об упруго-пластическом
изгибе жестко закрепленной по краю
пластинки. Прогиб пластинки удовлетворяет
формальному уравнению
и краевым условиям
дх1
g(H2(u))
(д2и
V
iaV
дхду
дх
g(H2(u))
дуг
д2и
дхду
(13.5.8)
д/
8{Н2(и))
д2и 1^и)
ду2 + 2 дх2
f{x,у), (х^)бЙсГ
I - —
(13.5.9)
эп
Здесь
Н2(и) =
(-а Л
' д и •
дхг
2 .Л
ды
ду2
(д2и^
ЪхЪу
д2и д2и
дх2 ду
2 '
v - единичная внешняя нормаль к 3Q;
g(t) — функция, характерная для данного
материала пластины, причем: 1) g(t )t —
возрастающая функция при / € [0, «>); 2)
g(t) — непрерывная функция на [0, оо) ; 3)
при всех t > О
аъ+а^2А ^(О^+Л,^2-1,
где р>\, (Jq > О, Я|>0, а при р < 2
4)=0.
Задача (13.5.8), (13.5.9) решается
вариационным методом, точнее удовлетворяет
теореме 13.5.2, где
F:fV2p(a)^R, D{F) = W2p{a),
F{v) = \a\o S(t)dtdxdy-
-<f,v>, fs\iv2p(a)\.
Другим примером является система
сильного изгиба тонких пластин. Заметим при
этом, что построения пп. 13.5.1, 13.5.2 легко
переносятся на случай систем
дифференциальных уравнений. В частности, это верно для
рассматриваемого примера системы,
описывающей задачу нелинейной механики. Эта
задача сводится к нахождению решения
краевой задачи для прогиба w и функции
напряжений Ф :
МЕТОД ТЕОРИИ МОНОТОННЫХ ОПЕРАТОРОВ И ТОПОЛОГИЧЕСКИЙ МЕТОД 535
--Д2и>-£(и>,Ф) = т<7(х,>>),
h h
— А2Ф + Ди>,и>) = 0, (х,у)е QcK2,
Е
ш
dw\
э7
1эп
. ЭФ,
= 0,
1эп
где А — оператор Лапласа,
г/ ^ч Э2н>Э2Ф Э2и>Э2Ф ~ Э2и> Э2Ф
Ци>,Ф) =—- — +—- — -2-
дх1 ду1 ду1 Ъх1
дхду дхду '
Q — ограниченная область на плоскости с
границей 3Q, h, E, D — положительные
постоянные.
Рассмотрим гильбертово пространство
Н =L = (w, Ф):и>, OcW22(Q)l
со скалярным произведением
(и, и)= £ JJ {эан>Эах + ЭаФЭ>}</х</у,
|а|=2
где у = (х,ф)еЯ. Обобщенным решением
рассматриваемой краевой задачи назовем
вектор-функцию и g H , удовлетворяющую при
всех У€ Я равенству
и < — AwAx- Ци>, Ф)х + — АФА(р+£(и>, м>)ф [*/**/>> =
= ^JJQ?(*,>0x(*,>0rf*4v;
Определим оператор А : Н —> Я и элемент Qs H так, чтобы
(Л(и), и) = JJ | — AwA%-L(w, Ф)х + —АФАф+Ци>, и>)ф1</х</>>,
здесь предполагается, что q G L| (Q).
Можно доказать, что оператор А будет
ограниченным непрерывным коэрцитивным
(см. п. 13.5.5) оператором, удовлетворяющим
некоторому условию монотонности.
13.5.5. Метод теории монотонных
операторов и топологический метод.
Теорема 13.5.3. Пусть функции аа (х, £)
удовлетворяют условиям 13.5.1-13.5.3, 13.5.5, а
оператор Г, определенный по формуле (13.5.5),
удовлетворяет условию коэрцитивности
Mm
<T(v), v>
• Ну
= +оо. (13.5.10)
Тогда для произвольных fa(x)e
€ ^у(а) (Ф) соответствующая
подпространству У краевая задача для уравнения (13.5.3)
имеет, по крайней мере, одно обобщенное решение.
Замечания.
13.5.1. Для выполнения условия
коэрцитивности (13.5.10) достаточно, например, при
V = W р(£1) выполнения неравенства
|сс|<* |сс|=*
|сс|<*-1
где Cj, С2 - положительные постоянные,
г < р . Имеются другие примеры
алгебраических условий, гарантирующих выполнение
(13.5.10).
13.5.2. Искомое обобщенное решение в
приведенной теореме является слабым
пределом галеркинских приближений (см. п. 13.5.6).
При дополнительных условиях эти
приближения сильно сходятся в WD (Q).
536
Глава 13.5. НЕЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
13.5.3. Указанное в теореме 13.5.3
обобщенное решение будет единственным в случае
строгой монотонности оператора Т.
Примеры.
13.5.7. Линейные дифференциальные
уравнения вида (13.5.3) определяются
функциями вида аа(хЛ) = ^ы<каа$(х)Ц > где
аар(х) s Яра(х) - измеримые
ограниченные на О. функции. В данном случае р = 2
и все условия последней теоремы
выполняются, если оператор Л строго эллиптический,
т.е. если при почти всех jcgQ и всех
^eR с некоторой положительной
постоянной с выполняется неравенство
М<*,|Р|<* |а|=*
13.5.10. Примером применения
приведенной в этом параграфе теоремы
существования является задача об упруго-пластическом
изгибе жестко закрепленной по краю
пластинки из п. 13.5.4. В соответствии с этой
теоремой данная задача имеет обобщенное
решение и(х, у)е W\ (Q) при любой
13.5.8. Задача Дирихле (V = WKp(Q))
для уравнения
-У —
ди
Эх,
р-1 . ^
ди
Эх,-
Лх),хеП,
имеет по указанной теореме обобщенное
решение при произвольных feLg(Q),
13.5.9. Пусть h(t) — непрерывная
неубывающая на R функция, /g Z^(Q), Q -
кусочно-гладкая ограниченная область в Rn
и существует с = const > 0 , такое, что
неравенство |/г(/)| < с(1+ Ы ) выполняется при
всех /eR, где х > 0 при п = 2 или
т = (я + 2)/(л-2) при л>2. Тогда: 1)
задача Дирихле для формального
дифференциального уравнения
-Ди(х) + А(и(дг)) = /(*), xgQ
имеет обобщенное решение, которое
единственно, если h(t) — возрастающая на R
функция; 2) краевая задача относительно V
для дифференциального уравнения -Аи(х) +
+u(x) + h(u(x)) = f(x), xeft, имеет
обобщенное решение при любых допустимых V
и / . Утверждения этого примера также
вытекают из последней теоремы.
MWUQ)
Это решение может быть
получено как предел сильно сходящихся в
Wp(Q) галеркинских приближений.
13.5.11. Примером применения теоремы
существования для систем дифференциальных
уравнений является задача о сильном изгибе
тонких пластин из п. 13.5.4. Эта
теорема обеспечивает существование обобщенного
решения (и>, Ф)е[^2 (Ф)] при
произвольной функции q^[W2(Ф)Г • Это решение
может быть получено как предел сильно схо-
° 9 9
дящихся в |Ж2(^)1 галеркинских
приближений.
13.5.12. Топологический метод позволяет
доказать существование обобщенных решений
краевых задач для широкого класса
уравнений, включающего как уравнения в
дивергентной форме, так и общего вида.
Простейшая краевая задача для уравнения не
дивергентного вида
„И)
1
иу ■' + — arctg«' = / в Q = (a,b) cc JR,
к
и(а) = и'(а) = и(Ь) = и'(Ь) = 0
дает пример применимости топологического
метода в том случае, когда вариационный
метод и метод теории монотонных операторов
неприменимы.
Недостатком топологического метода
является отсутствие алгоритмов, позволяющих
находить на основе этого метода
приближенные решения.
Еще одно интересное направление,
основанное на использовании топологического
метода, дают примеры нелинейных задач,
имеющих кратные решения. В частности,
можно доказать, что задача
Ди + Xku + — = g(x) в ft, и = 0 на dQ
1 +и2
РЕГУЛЯРНОСТЬ РЕШЕНИЙ НЕЛИНЕЙНЫХ ЭЛЛИПТИЧЕСКИХ УРАВНЕНИЙ 537
имеет не меньше двух решений при
достаточно малой Li -норме функции g(x), если
(vk >£)l2(Q) * ®' Здесь ^к ~~ простое
собственное значение задачи Дирихле для
оператора Лапласа, vk — соответствующая ему
собственная функция (см. п. 13.4.4).
13.5.6. Методы приближенного
решения Ритца и Галеркина. Метод Галеркина
(и, по существу, его частный случай - метод
Ритца) основан на теореме 13.5.3
(соответственно на теореме 13.5.2).
Пусть U|,02,... - полная счетная
система линейно независимых функций в
пространстве К из п. 13.5.2, Т— оператор (13.5.5).
Тогда m-ным галеркинским приближением
решения уравнения Т\и) = О называют функцию
Um = 2*1 /-IC/U/' где С/ = const' '= '",Пу
удовлетворяющую системе нелинейных
алгебраических уравнений относительно С\ ,...,£,„
<Т(и), v{ >=0, / = 1,...,/л. (13.5.11)
Условия теоремы 13.5.3 гарантируют при
каждом m существование решения системы
(13.5.11), т.е. /w-ное галеркинского
приближения обобщенного решения соответствующей
краевой задачи. Сходимость этих
приближений к точному обобщенному решению
отмечена в замечании 13.5.2.
Метод Галеркина для потенциальных
операторов Т : V —> V* (операторов,
определяемых левой частью уравнения (13.5.7))
совпадает с методом Ритца. При той же системе
V\,V2,..., что и выше, m-ное приближение
Ритца ит для уравнения Т\и) = О
определяется из условия
F(um)= inf F(v),
veV,„
где F : V —> R - потенциал оператора Г, т.е.
F'(v) = T(v) при всех veV, Vm
-линейная оболочка векторов v\,...,vm, F (v) —
производная по Гато.
Теорема 13.5.2 обеспечивает
существование при каждом m приближений Ритца для
уравнения (13.5.7) и их сильную сходимость к
точному обобщенному решению этого
уравнения.
Замечание 13.5.4. Модификации методов
Ритца и Галеркина, использующие
специальные финитные базисные функции (сплайн-
функции), дает метод конечных элементов.
Этот метод в последние десятилетия получил
широкое развитие и применение в
вычислительной математике.
13.5.7. Регулярность решений
нелинейных эллиптических уравнений. Даже
весьма простые обыкновенные нелинейные
дифференцильные уравнения могут иметь
обобщенные решения, не являющиеся
классическими. Например, уравнение
— — = А = const ф О, х е (я, Ь),
ахуах J
имеет общее обобщенное решение
ii(jc) = 4z(Ax + С, )4/3 + С2 с С2 (а,Ь)
4 А
при -С\/Ае (а,Ь). Соответствующая, в
частности, этому уравнению краевая задача с
условиями (а,Ь) = (0,1), и(0) = и(1) = 0
имеет единственное обобщенное решение
и(х) = |(2х-1)4/3-|«С2(0,1).
Теорема 13.5.4. Пусть:
1) ue\Vp(a,b) — обобщенное решение
уравнения
- — а{ (х,и(х)9и'(х)) +
+aQ(x,u(x),u'(x)) = /(*), xe(a,b),
(13.5.12)
относительно пространства Wp(a,b), где
р > 1 , -°о<д<£<+оо, /е C([a,b\)\
2) М*,^,$|)еС([М]хД2), *,(*,
§0 , ^1 ) € С1 ([М]ХД2) И flb(JC, §о,^|),
а\ (*> £о»£|) удовлетворяют условиям 13.5.1,
13.5.2 при к = я = 1 ;
3) существует такая постоянная с > 0 ,
что при всех лсе[0, 1] // при всех £0»
£l, Г|| е R выполняется неравенство
[(1\(хЛоЛ\)-<>\(х>*>оЛ\)]х
х(£| -Л| )><■(£, -^i)2-
538
Глава 13.5. НЕЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
Тогда иеС ([#,£]), и является
классическим решением уравнения (13.5.12) и
и(а) = и(Ь) = 0.
Пример 13.5.13. Уравнение
d_
dx
(Й-
/(*), xe(a,b),
где /g C([a,b]), не удовлетворяет условиям
теоремы 13.5.4, так как Q\ (х,£о ,£i) s £i ,
а0 (*>£о >£l ) = 0 и функция ^j не
удовлетворяет условию 3) этой теоремы.
Пример 13.5.14. Уравнение
-u'(x) + g(u(x)) = f(x), xe(a,b),
где /бС([я,£]), g(t) — непрерывная и
возрастающая на R функция, удовлетворяет
условиям теоремы 13.5.4, а также условиям
теоремы 13.5.3 при V-WAa^b). Отсюда
следует, что обобщенное решение и
этого уравнения относительно простран-
ства W р(а,Ь) существует, единственно и
ug С ([а,Ь]). При этом и — классическое
решение данного уравнения и и(а) =
= и(Ь) = 0.
Замечание 13.5.5. Для обобщенных
решений и уравнения (13.5.3) известны
теоремы о внутренней регулярности, т.е. о
принадлежности функции и пространству Cs (Q ),
где Q' — произвольная подобласть области
Q , для которой Q'ccfl. В случае
достаточной гладкости границы дО. при
определенных условиях имеет место глобальная
регулярность обобщенного решения и краевой
задачи для уравнения (13.5.3), т.е. включение
wgC5(Q).
Полное решение вопроса регулярности
имеется в двумерном случае. В частности,
имеется следующая теорема о существовании
обобщенного решения задачи Дирихле из
класса Cs (Q).
Теорема 13.5.5. Пусть О. —
ограниченная область в R с границей 3Q € С + ,
и е W р (£2) (р > 2) - обобщенное решение
уравнения (13.5.3). Пусть, далее, fa e С (Q),
функции аа(х,£,) дважды непрерывно
дифференцируемы по всем аргументам при (х,^)е
g Q х R и удовлетворяют условиям:
1)
2)
Яар(*>£) = Яра(*>£)> еса« |aHN = *' (*,£) g 3Qx R* ;
1Р-2
MH0M
I Ы
Цск-±
1 ■ р
ч- I М
А:-—<|сх|<Аг
Р ' '
при всех (х,£) eQxRA;
3)
I
|а|,|р|<*
Цхр(*>£)|
' + I Ы
А:-—<|«|<Аг
Р ' '
2
I
;=1
+ХК,(*.$)|
I Ы
|а|<*-1
Р
при всех (х,^)е QxR* .
*--<|а|<*
Р ' '
р-\
СПИСОК ЛИТЕРАТУРЫ
539
Здесь л = (Л<х )|а|=* ,Яар (ХЛ) = ^ (*,£)/д£р ,
Я<х/(*>£) = Эаа(х,^)/Эх/, с, (О м С2(0 -
положительные непрерывные соответственно
невозрастающая и неубывающая функции на
[0, + оо). Тогда ueCk (О).
Замечание 13.5.6. В условиях теоремы
13.5.5 решение mgCw(Q), где т > к, в
случае большей, чем в условиях этой
теоремы, гладкости функций аа и /а. В
частности, при достаточной гладкости функций аа
и fa функция и будет классическим
решением задачи Дирихле для уравнения (13.5.3).
Пример 13.5.15. Уравнение
Д2и + g(u) = /(*), xeQcR2,
где g(/) — непрерывная возрастающая
функция на R , / е L2 (ft), имеет единственное
обобщенное решение uelV^ (Q) • Это
следует из теоремы 13.5.3 и замечания 13.5.3. Если
при этом /eCw(Q), geCm(R) и
граница д£2 класса Ст при достаточно большом
т, то us С (П) и является классическим
решением задачи Дирихле для данного
уравнения. Последнее утверждение следует из
теоремы 13.5.5 и замечания 13.5.6.
СПИСОК ЛИТЕРАТУРЫ
1. Агмон С, Дуглис А., Ниренберг Л.
Оценки вблизи границы решений
эллиптических уравнений в частных производных при
общих граничных условиях. М.: Изд. иностр.
лит., 1962. 205 с.
2. Гаевский X., Грёгер К., Захариас К.
Нелинейные операторные уравнения и
операторные дифференциальные уравнения. М.:
Мир, 1978. 336 с.
3. Гилбарг Д., Трудингер Н.
Эллиптические дифференциальные уравнения с
частными производными второго порядка. М.:
Наука, 1989. 464 с.
4. Куфнер А., Фучик С. Нелинейные
дифференциальные уравнения. М.: Наука,
1988. 304 с.
5. Марчук Г.И., Агошков В.И. Введение
в проекционно-сеточные методы. М.: Наука,
1981.416 с.
6. Скрыпиик И.В. Методы исследования
нелинейных эллиптических граничных задач.
М.: Наука, 1990. 448 с.
ЧАСТЬ IV
ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
Раздел 14
ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
Глава 14.1
МНОЖЕСТВА, ПРОСТРАНСТВА,
ФУНКЦИИ
14.1.1. Функции и отображения.
Рассматривая множество всех элементов,
обладающих каким-либо общим свойством, его
часто называют пространством. Например,
множество всех действительных чисел
(числовую прямую R ) обычно называют
одномерным пространством, множество всех
точек плоскости R — двумерным
пространством, множество всех точек обычного
пространства R , изучаемого в геометрии,
называют трехмерным пространством. Обобщая
эти понятия, в линейной алгебре называют
п -мерным пространством R" множество всех
упорядоченных наборов п действительных
чисел. В функциональном анализе множество
всех скалярных непрерывных функций,
определенных на интервале [я,£], называют
пространством непрерывных функций.
Общее определение функции. Если
некоторым точкам х пространства X поставлены
в соответствие точки другого пространства
Y , так что каждой точке х некоторого
множества пространства X соответствует одна и
только одна точка )>gY* , то это соответст-
В функциональном анализе рассматриваются
только однозначные функции. Если некоторым
точкам х е X соответствует конечное или счетное
множество точек у е Y , то это соответствие будет
многозначной функцией. Каждая "ветвь" этой
многозначной функции рассматривается в
функциональном анализе как отдельная функция. Например,
у - 4х и у - -4х рассматриваются как две
различные функции.
вие называют функцией и обозначают, как и в
элементарном анализе, у - f(x). При этом
говорят, что функция у = f(x) действует из
X в Y .
Множество точек пространства X , на
котором определена функция / , называют
областью определения этой функции и
обозначают Df . Множество точек пространства Y ,
которые поставлены в соответствие точкам
х е Dr , называеют областью значений
функции у(х) и обозначают Rf .
Каждая функция у = f(x)
осуществляет отображение Df на Rf. Если Df = X ,
Rf - Y , то говорят, что функция у = f(x)
отображает X на Y . Если же Df = X ,
Rf *Y , Rf с Y , то говорят, что функция
у = f(x) отображает X в Y. Мы будем
говорить, что функция у = f(x) отображает
X в Y и в том случае, когда Df Ф X ,
DfCzX, Rf с Y . В соответствии с этим
функцию называют также отображением и
пишут f : X ->Y вместо у = f(x).
Если функция у = f(x) устанавливает
взаимно однозначное отображение Df на
Rf, то существует обратная функция
х = f (у) с областью определения Rf и
областью значений Df.
Функцию, отображающую все
пространство X на все пространство Y , называют
сюръективным отображением или сюръекцией.
ФУНКЦИИ И ОТОБРАЖЕНИЯ
541
Функцию, определяющую взаимно
однозначное отображение всего пространства
X в пространство Y , называют инъективным
отображением или инъекцией. Таким образом,
инъекция представляет собой функцию,
отображающую все пространство X в Y и
имеющую обратную функцию.
Функцию, осуществляющую взаимно
однозначное отображение всего пространства
X на Y , называют биективным
отображением или биекцией.
Функцию со значениями на числовой
прямой или на комплексной плоскости (в
поле скаляров) называют функционалом.
Функционалы переменной х мы часто будем
коротко обозначать малыми буквами, не
заключая х в скобки, например, fie, gx и т.д.
Если пространство Y не является
числовой прямой или комплексной плоскостью,
то функцию f(x) называют оператором.
Операторы переменной х мы будем часто
обозначать большими буквами, также не
заключая х в скобки, например, Ах, Тх и т.д.
Образы и прообразы множеств. Обратные
отображения. Значение ye Y функции
f(x) , соответствующее точке х е X ,
называют образом точки х.
Совокупность всех точек х е Df ,
которым соответствует одно и то же значение у
функции f(x), называют прообразом точки
у и обозначают f~*(y), f (у) =
= [х : f(x) = у} *. Например, если
существуют три точки, для которых У = /(Х[) =
=/(^2) =/(^з), то множество точек
{*1,я:2,я:з} представляет собой прообраз
точки у, а у является образом каждой из трех
точек Х[,Х2, *з-
Если функция у = f(x) отображает
множество А на множество В , то
множество В называют образом множества А , и это
записывают виде В = f(A). Очевидно, что
f(A) = {y.y = f(x), xeA].
Не путать с обратной функцией. Функция,
обратная по отношению к у = f(x) , может и не
существовать, а прообраз точки у , определяемый
функцией у = f(x) , всегда существует и
обозначается f~\y).
Множество А прообразов всех множеств
класса В называют прообразом класса множеств
В , что записывается в виде А- /~ (В).
Очевидно, что f~{(B) = {х : f(x) e В}.
Функцию /~ (В), с помощью которой для
каждого множества В с Y определяется его
прообраз, называют обратным отображением.
Совершенно так же определяются и
прообразы классов множеств.
Теорема. Все соотношения между
множествами при обратном отображении остаются
неизменными.
Отношение порядка. Любое множество
пар {а, Ь), где а — элемент некоторого
множества А , a b — элемент некоторого
множества В , называют отношением, точнее,
бинарным отношением. Отношение обычно
записывают в виде aRb, что означает, что пара
{а,Ь} принадлежит отношению R . В
частности, множество В может совпадать с А . В
этом случае R представляет собой
отношение на множестве А .
Если для некоторых пар элементов
некоторого множества А установлено, какой из
них предшествует другому, то говорят, что на
А определено отношение порядка (множество
пар элементов, первый из которых
предшествует второму). Если элемент а предшествует
элементу b (b следует за а ), то это
записывается в виде неравенства а < b , так же, как
для действительных чисел, или в виде а < b.
Эти записи означают, что а предшествует b
или совпадает с b . Если а предшествует b ,
но не совпадает с b, то говорят, что а
строго предшествует b , и пишут а < b .
Множество называют частично
упорядоченным, если на нем установлено отношение
порядка, обладающее свойствами:
1) если а<Ь и £<с,то а<с;
2) а < а для любого элемента а ;
3) если а< b и Ь<а ,юа = Ь;
Элементы a, b частично
упорядоченного множества называют несравнимыми, если
для них несправедливо ни д<£,ни b< a , и
сравнимыми — в противном случае.
Частично упорядоченное множество
называют упорядоченным, или линейно
упорядоченным, или совершенно упорядоченным, если
любые два его элемента сравнимы.
Элемент s частично упорядоченного
множества S называют мажорантой под-
542 Глава 14.1. МНОЖЕСТВА, ПРОСТРАНСТВА, ФУНКЦИИ
множества А с S , если х < s для любого
хе А. Элемент а частично упорядоченного
множества называют верхней гранью
подмножества А с S , если х < а , Vx g Л и а < s
для любой мажоранты s подмножества А .
Элемент а множества А называют
максимальным элементом А , если в А нет
элементов, следующих за а . Аналогично
определяются миноранта и нижняя грань подмножества
частично упорядоченного множества и
минимальный элемент множества.
Любое упорядоченное подмножество
частично упорядоченного множества
называют цепью.
Упорядоченное множество называют
вполне упорядоченным, если каждое его
подмножество имеет минимальный элемент.
Аксиома выбора. В основе многих
построений современной математики лежит
аксиома выбора: для произвольного семейства
множеств {Xt}, / g T , можно определить
функцию x(t), / g T , выбрав из каждого
множества Xt произвольно один элемент xt
и приняв при каждом / x(t) = xt.
Теорема Цермело. Каждое множество
может быть вполне упорядочено.
Лемма Цорна. Если каждая цепь частично
упорядоченного множества S имеет
мажоранту, то в S существует максимальный элемент.
Теорема Хаусдорфа. Каждая цепь
частично упорядоченного множества содержится в
некоторой максимальной цепи.
Оказывается, что каждая из теорем
Цермело и Хаусдорфа и лемма Цорна
эквивалентны аксиоме выбора, вследствие чего
каждая из них может быть принята за аксиому
вместо аксиомы выбора.
14.1.2. Метрические пространства.
Метрическим пространством называют
пространство X , в котором определено
расстояние d(x,y) между любыми двумя точками
х, у, обладающее свойствами:
1) d(x,y) >0, причем d(x,y) = Q тогда
и только тогда, когда х = у
(неотрицательность);
2) d(x,y) = d(y9x) (симметрия);
3) d(x, z) ^ d(x, у) + d(y, z) (неравенство
треугольника).
Функцию, обладающую этими
свойствами, называют метрикой в пространстве X .
Открытые и замкнутые множества.
Окрестности точек. Открытым шаром Sr(x)
радиуса г с центром в точке х в метрическом
пространстве (X,d) называют множество
точек у g X , расстояния которых от точки
х меньше г : Sr(x) = {у : d(x,y) < г}.
Замкнутым шаром радиуса г с центром
в точке хе X называют множество точек
уЕ X , расстояния которых от точки х не
больше г : [у : d(x,y) < г}.
Сферой радиуса г с центром в точке
хе X называют множество точек уе X ,
расстояние которых от точки х равны
г: {y:d(x,y) = r}.
Открытое множество в метрическом
пространстве — это такое множество, которое
вместе с любой своей точкой содержит и
некоторую ее шаровую окрестность.
Теорема 14.1.1. Любое объединение
открытых множеств есть открытое множество.
Теорема 14.1.2. Любое непустое
пересечение конечного числа открытых множеств есть
открытое множество.
Точку х называют граничной точкой
множества А метрического пространства,
если любая шаровая окрестность этой точки
содержит как точки множества А , так и
точки его дополнения А . Множество всех
граничных точек множества А называют
границей множества А .
Множество метрического пространства
X называют замкнутым, если оно содержит
свою границу (т.е. все свои граничные точки).
Дополнение любого открытого множества
является замкнутым множеством, а
дополнение любого замкнутого множества —
открытым множеством.
Все метрическое пространство и пустое
множество являются одновременно
открытыми и замкнутыми множествами.
Сходимость в метрическом пространстве.
Последовательность точек метрического
пространства {*„} называют сходящейся к точке
х, если при любом е > 0 окрестность SE(x)
точки х содержит все точки хп, начиная с
некоторого номера N(e). Иными словами,
последовательность точек [хп] сходится к
точке х, если для любого е > 0 существует
такое натуральное число N = N(e), что
d(xn,x) < е для всех п> N . Если
последовательность [х„] сходится к х, то пишут
хп -> х. При этом х называют пределом
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
543
последовательности [хп] и пишут
х = lim хп или короче, х = lim xn.
Л->оо
Последовательность {*„} называют
фундаментальной, если для нее выполнено
условие Коши, d(xn,xm) -> 0 при п, т -> оо
Теорема 14.1.3. Всякая сходящаяся
последовательность фундаментальна.
Полные метрические пространства.
Метрическое пространство называют полным, если
любая фундаментальная последовательность в
нем сходится к некоторой точке этого
пространства.
В полном метрическом пространстве для
сходимости последовательности необходима и
достаточна ее фундаментальность.
Теорема 14.1.4. Всякое метрическое
пространство допускает пополнение.
Сепарабельные метрические пространства.
Множество Л точек метрического
пространства X называют плотным в X , если любая
е-окрестность любой точки пространства X
содержит точки множества Л , т.е. если при
любыхе > 0, хе X найдутся такие точки а
множества А , что d(x,a) < е .
Метрическое пространство называют се-
парабельным, если в нем существует счетное
плотное множество.
Непрерывные функции в метрических
пространствах. Функцию у = f(x),
отображающую метрическое пространство (X,d) в
другое метрическое пространство (У,г),
называют непрерывной в точке х, если для
любого е > 0 существует такое 8 = 8(e) > 0 , что
r(f(x),f(x'))< e при всех х\ d(x,x')<b.
Таким образом, в метрическом пространстве
функция у = f(x) непрерывна в точке х,
если г (/(*), /00) -> 0 при d(x,х) -> 0 .
Функцию у = f(x) называют непрерывной на
некотором множестве, если она непрерывна в
каждой точке этого множества. Если функция
у = f(x) непрерывна во всей области ее
определения Df, то ее называют просто
непрерывной.
14.1.3. Линейные пространства.
Пространство X называют линейным или
векторным, если:
1) для любых двух элементов х, уе X
однозначно определена их сумма х + у е X ;
2) для любого элемента х е X и любого
числа а однозначно определено
произведение ах е X , причем 1 х = х;
3) существует единственный нулевой
элемент 0 е X , такой, что 0 • х = 0 * для
любого хе X (существование нуля);
4) операции сложения векторов и
умножения вектора на число обладают обычными
свойствами:
х + У = У + х (коммутативность),
(х + у) + z = х + (у + z), а(рх) = (ар)х
(ассоциативность),
(а + р)х = out + рх, а(х + у) = ах + ау
(дистрибутивность).
Элементы (точки) линейного
пространства называют векторами.
В зависимости от того, определена
операция умножения вектора на число только
для действительных чисел или и для
комплексных чисел, приходится различать
действительные линейные пространства (линейные
пространства над полем действительных чисел
R) и комплексные линейные пространства
(линейные пространства над полем комплексных
чисел С ).
Для любого х существует единственный
противоположный элемент -х , такой, что
х + (-*) = 0 .
Вектор z = х + (-у) называют
разностью векторов х и у и обозначают х - у .
Понятие разности двух векторов дает
возможность переносить слагаемые из одной
части равенства в другую с изменением знака
так же, как и в обычных алгебраических
равенствах.
Векторы Х\,...., хп называют линейно
независимыми, если равенство
а{Х\ +... + anxn = 0
справедливо только при а\ = ... = ап = 0 .
Если же это равенство справедливо при
каких-нибудь не равных одновременно нулю
числах а[у...,ап, то векторы Х\,...,хп
называют линейно зависимыми.
Если в линейном пространстве X
существует не больше конечного числа п линейно
* Здесь 0 • JC - произведение числа 0 на
элемент X пространства X , а в правой части 0 -
нулевой элемент пространства X.
544
Глава 14.1. МНОЖЕСТВА, ПРОСТРАНСТВА, ФУНКЦИИ
независимых векторов, то пространство X
называют конечномерным, конкретно п-мерным,
а число п — размерностью пространства X. В
этом случае любой вектор х е X выражается
через линейно независимые векторы
Xj,..., хп формулой
х = Ci*i +... + спхп.
Если при любом натуральном п
существует п линейно независимых векторов, то
пространство называют бесконечномерным.
Бесконечное множество векторов {ха}
(в бесконечномерном пространстве) называют
линейно независимым, если при любых
п, щ,..., ап векторы ха ,..., ха линейно
независимы.
Подпространства. Линейные оболочки.
Подмножество Y линейного пространства
X называется подпространством
пространства X , если оно представляет собой линейное
пространство с теми же операциями сложения
и умножения на число. Если при этом
Y Ф X , то Y называют собственным
подпространством пространства X .
Пересечение любого множества
подпространств тоже является подпространством.
Наименьшее подпространство
пространства X , содержащее данное множество
векторов А с X , называют линейной оболочкой
множества векторов А или
подпространством, образованным множеством векторов А , и
обозначают L(A).
Если линейная оболочка линейно
независимого множества векторов [ха] совпадает
со всем пространством X, L({x(X}) = Ar, то
множество векторов {ха} называют базисом
Хамеля пространства X . В этом случае любой
вектор пространства X представляет собой
конечную линейную комбинацию векторов
множества {ха}.
Фактор-пространства. Пусть L -
подпространство линейного пространства X.
Векторы Х\,Х2^Х считаются
эквивалентными, если их разность Х[ - *2 принадлежит
подпространству L. В частном случае вектор
х всегда эквивалентен сам себе, поскольку
нулевой элемент принадлежит любому
подпространству. В результате пространство X
будет представлять собой объединение
различных классов эквивалентных элементов
(классов смежности). Если рассматривать
классы эквивалентных векторов пространства
X как элементы некоторого пространства Y,
то пространство Убудет линейным
пространством, нулевым элементом которого будет
подпространство L всех векторов х е X ,
эквивалентных нулю.
Пространство Y классов эквивалентных
элементов пространства X называют фактор-
пространством пространства X по
подпространству L и обозначают X/L .
Норма вектора. Распространяя понятие
модуля вектора в конечномерном
пространстве, в произвольном линейном пространстве
можно ввести понятие нормы вектора.
Нормой вектора х называют функцию
|| л: || (иногда обозначаемая так же, как и
модуль конечномерного вектора \х\) вектора х,
обладающую свойствами:
1) ||x|| >0, причем ||х|| = 0 только для
х = 0,
2) || осх || = \а\ || х || для любого числа а ,
3) || х + у || < || х || + | у || (неравенство
треугольника).
Нормированные линейные пространства.
Линейное пространство X с определенной в
нем нормой вектора называют нормированным
линейным пространством.
Нормированное линейное пространство
будет метрическим пространством, если
определить в нем метрику с помощью нормы:
d(x,y) = \x-y\.
Банаховы пространства. Нормированное
линейное пространство, полное относительно
метрики, порожденной нормой, называют
банаховым пространством или, коротко,
В-пространством.
Скалярное произведение. По аналогии с
конечномерными пространствами можно
ввести в линейном пространстве скалярное
произведение векторов.
Скалярным произведением векторов х и у
в линейном пространстве X называют
числовую функцию этих двух векторов (х,у) ,
обладающую свойствами:
О (х,у) = ЦУ),
2) (ах,у) = а(х,у),
3) (*i +*2>У) = (х\ > У) + (*2> У) >
4) (*,*)> 0, причем (х,х) = 0 только
при* = 0 .
ЛИНЕЙНЫЕ ФУНКЦИИ
545
Вводя скалярное произведение в
действительном линейном пространстве,
естественно потребовать, чтобы оно было
действительным числом для любых векторов. Тогда
аксиома скалярного произведения 1
заменится аксиомой
П (х,у) = (у,х).
Пусть Х[,...,хп — любые п векторов
пространства X, в котором определено
скалярное произведение. Матрицу
Г =
(*,,*,) (х{,х2)
(*2>*|) (*2.*2)
(х\,х„)
(*„,*,) (хп,х2) ... (хп,хп)
называют матрицей Грома векторов Xj,..., хп .
Теорема 14.1.5. Матрица Грома —
эрмитова неотрицательно определенная матрица.
Теорема 14.1.6. Определитель матрицы
Грома неотрицателен и равен нулю тогда и
только тогда, когда векторы Xj,..., хп линейно
зависимы.
Из неотрицательности определителя
Грама следует, в частности, что для любых
х,уе X
\(х,у)\2<(х,х)(у,у),
причем знак равенства имеет место тогда и
только тогда, когда у = ах . Это неравенство
называют неравенством Коиш-Буняковского.
Евклидовы и гильбертовы пространства.
Если в линейном пространстве X определено
скалярное произведение, то это пространство
можно нормировать, положив || х || = у](х,х) .
Нормированное линейное пространство
с нормой, порожденной скалярным
произведением, называют евклидовым пространством.
Полное (относительно метрики,
порожденной нормой) евклидово пространство
называют гильбертовым пространством, или,
коротко, Н-пространством.
Векторы х и у евклидова, в частности,
гильбертова, пространства называют
ортогональными, если их скалярное произведение
равно нулю, (х,у) = О .
Из аксиом скалярного произведения
непосредственно следует, что в евклидовом и в
гильбертовом пространствах норма
удовлетворяет известному из элементарной геометрии
тождеству параллелограмма
11*-Ч|2ф--Я|2=2|И2 + 2|И2.
Пространства непрерывных функций и
пространства ограниченных функций.
Пространство С (Г) представляет собой
пространство ограниченных непрерывных
числовых функций с областью определения
Т с R", в котором норма определяется
формулой
|x| = sup|x(0|.
teT
(14.1.1)
Пространство В (Г) представляет собой
пространство ограниченных числовых
функций с областью определения Т с Яп , р
котором норма определяется той же формулой
(14.1.1). Ясно, что пространство С (Г)
является подпространством пространства В (Г).
Сходимость в С (Г) и В(Т) представляет
собой равномерную сходимость
последовательности функций {xn(t)} из С(Т) или
В(Т).
Пространства дифференцируемых функций.
Рассмотрим теперь пространство С" (Т)
непрерывных функций на замкнутом конечном
интервале Т = [а,Ь], имеющих непрерывные
производные до порядка п включительно.
Норма элемента x(t) пространства С'\Т)
определяется формулой
|x|=ysup|x<'>(/)|. (14.1.2)
/7=0
teT
Из этой формулы следует, что
сходимость последовательности функций в
пространстве С" (Г) представляет собой
равномерную сходимость последовательности
функций и последовательностей всех их
производных до порядка п включительно.
14.1.4. Линейные функции. Функцию
У - f(x), отображающую линейное
пространство X в линейное пространство Y,
называют линейной, если при любых п,
*{,..., хп е Df и любых числах оц,..., <хп
/
2>Л =Х«а/Ы- 04.1.3)
Областью определения Df линейной
функции / естественно считать подпространство
18 - 7706
546
Глава 14.2. ТЕОРИЯ МЕРЫ
пространства X, так как, если она определена
при х = Х|,..., хп , то формула (14.1.3)
определяет ее и для всех линейных комбинаций
векторов Х\,..., хп .
Если линейная функция у = f(x)
отображает X в числовую прямую или в
комплексную плоскость, то у = f(x)
представляет собой линейный функционал, f(x) = fie .
Линейная функция f(x) ,
отображающая линейное пространство X в другое
линейное пространство Y, отличное от
множества чисел, представляет собой линейный
оператор, f(x) = Ах .
Кроме линейных функций, в
комплексном линейном пространстве можно
определить аналогичные функции, обладающие
симметричными свойствами.
Функцию у = f(x), отображающую
линейное пространство X в линейное
пространство Y, называют сопряженно линейной
или антилинейной, если для любых п,
Х\,..., хп е Df и любых чисел о^,..., ап
(
f
k=\ J *=1
Теорема 14.1.7. В любом линейном
пространстве существует линейный функционал,
принимающий заданные значения на любом
конечном множестве линейно независимых
векторов.
Теорема 14.1.8. Любой линейный
функционал, определенный на подпространстве
линейного пространства, можно продолжить на
более широкое подпространство.
Неотрицательный функционал р(х),
определенный на всем линейном
пространстве X, называют выпуклым, если он
удовлетворяет условиям:
1) р(х + у)< р(х) + р(у) Vx, у ;
2) р(ах) = |а\р(х) Vx, aе К .
Теорема 14.1.9. Любой линейный
функционал /q(x) , определенный на подпространстве
Lq линейного пространства X и
удовлетворяющий условию
\f0(x)\ < р(х) УхеЦ). (14.1.4)
где р(х) — некоторый выпуклый функционал,
может быть продолжен на все
пространство X с сохранением этого условия (теорема
Хана - Банаха).
Глава 14.2
ТЕОРИЯ МЕРЫ
14.2.1. Классы множеств. Полуалгебры
множеств. Класс множеств С называют
полуалгеброй, если он содержит пустое множество
0, все пространство X, конечные
пересечения входящих в него множеств и дополнение
любого входящего в него множества
представляет собой конечное объединение попарно
непересекающихся входящих в него множеств.
Иными словами, С есть полуалгебра, если
0,Х <zC, А,ВеС=* АВеС и АеС=*
А = (J"4*' 4» •••> Ап G С , AkAh = 0
при
к=\
НФк.
Примерами полуалгебры могут служить
множество всех интервалов числовой прямой
R , прямоугольников (параллелепипедов) со
сторонами, параллельными осям координат
на плоскости Г ив трехмерном
пространстве R3 .
Алгебры множеств. Алгеброй множеств
(некоторого пространства X ) называют такой
класс множеств, который наряду с любым
входящим в него множеством А содержит и
его дополнение А и наряду с любыми двумя
входящими в него множествами А и В
содержит их объединение A U В .
Примерами алгебры могут служить
конечное объединение интервалов на R
(прямоугольников в R , параллелепипедов в
Таким образом, алгебра множеств
замкнута относительно операций дополнения,
разности и конечных объединений и пересечений.
Алгебру множеств А называют
о-алгеброй множеств, если она содержит все счетные
объединения входящих в нее множеств, т.е.
если из Ak e А (к = 1, 2,...) вытекает
\jAkeA.
а-алгебра замкнута относительно
операций дополнения и счетных объединений и
пересечений.
Минимальную алгебру, содержащую
данный класс множеств С , называют О-алгеб-
рой, порожденной классом множеств С , и
часто обозначают о(С).
ФУНКЦИИ МНОЖЕСТВА И МЕРЫ
547
Теорема 14.2.1. Для любого класса
множеств С существует порожденная им о-алгебра
о(С).
Полные 0-алгебры. Пусть (X,A,[i) -
пространство с неотрицательной мерой.
О-алгебра А называется полной относительно
меры [i , если она содержит все подмножества
всех входящих в нее множеств нулевой меры
ц , т.е. если из N е A, \i(N) = О, N[ с N
вытекает N[E А (и, конечно, \i(N[) = 0 ).
Меру ц , определенную на полной
относительно нее а-алгебре, также называют
полной мерой, и соответствующее пространство с
мерой (Х,А,[1) называют полным.
Пределом возрастающей
последовательности множеств [Ап] называют объединение
всех этих множеств:
ПтАп = [\Ап.
В частном случае lim An может совпадать со
Л-»°о
всем пространством X.
Пределом убывающей последовательности
множеств [Ап] называют пересечение всех
этих множеств:
МтАп = Г\Ап.
В частном случае lim An может быть пустым
Л_>оо
множеством 0.
Монотонным классом множеств называют
такой класс множеств, который содержит
пределы всех монотонных
последовательностей входящих в него множеств.
Для любого класса множеств С
существует минимальный монотонный класс,
содержащий С. Этот минимальный класс
называют монотонным классом, порожденным классом
множеств С , и обозначают М(С).
Теорема 14.2.2. Всякая о-алгебра
представляет собой монотонный класс множеств.
Теорема 14.2.3. Если монотонный класс
М является алгеброй, то он представляет
собой о-алгебру.
Теорема 14.2.4. Монотонный класс М,
порожденный алгеброй множеств С , совпадает с
О-алгеброй А, порожденной той же алгеброй С.
Произведение двух пространств.
Рассмотрим два пространства X н Y. Множество Z
всех упорядоченных пар z = {х, у},
хе X, yeY называют прямым или
декартовым произведением пространств Хи У и
обозначают Z = Xх Y . При этом точку хе X
называют проекцией точки z = {х, у] е Z на
пространство X, а точку ye Y — проекцией
точки z = {х, у} е Z на пространство Y
Пусть Ad X и В <zY - произвольные
множества. Совокупность всех пар z = {х,у} ,
хе А, у е В называют прямоугольником со
сторонами А и В в пространстве Z = X х Y
и обозначают Ах В .
Пусть (Х,А) и (Y,B) - два
измеримых пространства. Совокупность всех
прямоугольников Ах В , Ае А, В е В -
измеримых прямоугольников — представляет
собой полуалгебру.
Минимальную а-алгебру С,
содержащую все измеримые прямоугольники (а-
алгебра, порожденная полуалгеброй измеримых
прямоугольников Ах В , Ае А, В е В),
называют произведением о-алгебр А и В и
обозначают С-АхВ.
Произведением двух измеримых
пространств (Х,А) и (Y,B) называют
произведение XxY с а-алгеброй в нем С-АхВ,
(Z,C) = (XxY,AxB).
Возьмем произвольное множество
С с Z и выберем из него точки z = {х, у},
соответствующие некоторому
фиксированному х. Получим сечение Сх множества С в
точке х.
Теорема 14.2.5. Сечения измеримых
множеств в произведении измеримых пространств
измеримы.
14.2.2. Функции множества и меры.
Функцию множества <р(Л), определенную на
некотором классе множеств С и
принимающую значения из некоторого линейного
пространства, называют аддитивной функцией,
если для любых попарно непересекающихся
18*
548
Глава 14.2. ТЕОРИЯ МЕРЫ
множеств А[,...,АпеС, AkAh ~ ® ПРИ
ИФк, [JAkeC,
( п \ п
^=1 ) к=\
Теорема 14.2.6. Аддитивная функция
<р(А) равна нулю на пустом множестве:
(р(0) = О (конечно, если ее область
определения С содержит 0).
Аддитивные и а-аддитивные функции
называют мерами. В дальнейшем, говоря о
мерах, мы всегда будем иметь в виду
а-аддитивные меры, если не сказано, что речь идет
об аддитивной мере.
Особенно важную роль играют числовые
меры, т.е. меры со значениями на числовой
прямой или на комплексной плоскости.
Числовую аддитивную функцию
называют конечной, если она не принимает
бесконечных значений ни на каком множестве из
области ее определения.
Числовую аддитивную функцию Ц>(А)
называют о-конечной, если существует такое
разбиение пространства X на попарно
непересекающиеся множества X = IIХк , XkXj - 0
к=\
при к Ф I, что <р(А) конечна на всех
множествах Хк (к = 1, 2,...).
Непрерывные функции множества.
Функцию множества Ц>(А) называют непрерывной
сверху, если для любой монотонно
убывающей последовательности множеств {Ап},
Ап+{ с Ап (п = 1, 2,...),
ф(1™ Ап) = ф(ГИ") = Пт ф(Л")
(в случае числовой функции ф должно быть
ф(ЛЛ)<оо V«). Функцию множества ф(^4)
называют непрерывной снизу, если для любой
возрастающей последовательности множеств
{Л}> Л+1 =э А> (я = 1,2,...),
<p(lim Ап) = ф(и^) = 11тф(Л„).
Функцию множества, непрерывную сверху и
снизу, называют непрерывной.
Теорема 14.2.7. Мера ц (^4), определенная
на о-алгебре множеств Л , непрерывна.
Теорема 14.2.8. Если аддитивная функция
ф, определенная на некотором классе
множеств С, содержащем пустое множество,
непрерывна в нуле, т.е. если \\т(р(Сп) = 0 для
любой монотонно убывающей
последовательности множеств [Сп] с С с пустым
пересечением, \\Сп = 0 , то она о-аддитивна на С .
Теорема 14.2.9. Если неотрицательная
аддитивная функция [i определена на
полуалгебре множеств С , то для любых множеств А,
ВеС, AczB
»(А) <»(В).
Теорема 14.2.10. Если неотрицательная
аддитивная функция ц определена на
полуалгебре множеств С, то для любого множества
Ае С и любых попарно непересекающихся его
подмножеств А\,..., Ап е С , AkAh = 0 при
к Ф И , справедливо неравенство
^(Ак)<ц(А).
к=\
Теорема 14.2.11. Если ц —
неотрицательная мера, определенная на полуалгебре
множеств С, то для любой
последовательности множеств [Ап] с С , для которой
A = \jAkeC,
k=i
справедливо неравенство
ц(Л)<£ц(Д0-
к=\
Это свойство неотрицательной меры
называют полуаддитивностью меры.
Теорема 14.2.12. Если неотрицательная
аддитивная функция JJ., определенная на
полуалгебре множеств С, полуаддитивна, то она
О-аддитивна.
Особо важное значение имеют мера
Лебега, определяемая на полуалгебре интервалов
числовой прямой R и на полуалгебре
прямоугольных множеств пространства Я"
формулами
ПРОДОЛЖЕНИЕ МЕРЫ
549
l((a,b)) = l([a,b)) = l{(a,b\) = l([a,b]) = b-a,
l(A) = (bl-ai)...(b„-an),
где A = {x : xk e (ukibk),k = 1> —» л} или
любое другое прямоугольное множество,
полученное из А заменой совокупности
открытых интервалов (йк,Ьк) любой комбинацией
открытых, замкнутых и полузамкнутых
интервалов с теми же концами, и мера Лебега —
Стилтьеса, определяемая на числовой
прямой формулами:
s([a,b)) = F(b)-F(a),
s([a,b]) = F(b + 0)-F(a),
s((a,b)) = F(b)-F{a + Q),
s((a,b]) = F{b + 0)-F(a + 0),
где F(x) — непрерывная слева функция.
Полная вариация меры. Пусть [i(A) -
мера (или аддитивная мера) со значениями в
нормированном линейном пространстве Y ,
определенная на классе множеств А.
Действительную неотрицательную функцию множества
|nH = supXlk(4fc)|. (14.2.1)
где верхняя грань берется по всем конечным
совокупностям попарно непересекающихся
подмножеств Ак е А множества А ,
Ак с А , называют полной вариацией меры
(аддитивной меры) р.
Теорема 14.2.13. Если мера или
аддитивная мера \х определена на алгебре или о-алгебре
множеств А, то ее полная вариация аддитивна.
Следствие. Полная вариация
действительной меры, определенной на о-алгебре множеств,
О-аддитивна.
Полная вариация меры Лебега —
Стилтьеса на числовой прямой R
s([a,b))=F(b)-F(a)
определяется формулой
\s\{[a,b)) = sup"£\F(xk)-F(xk_{)\,
к=\
(14.2.2)
где верхняя грань берется по всем конечным
разбиениям интервала \а,Ь) на попарно
непересекающиеся части
п
к=\
Если | s | (R) = | s | ((-°°, °°)) < °° , то функцию
F(x) = s ((-°°, *)) называют функцией
ограниченной вариации.
14.2.3. Продолжение меры.
Предположим, что неотрицательная а-аддитивная
а-конечная мера р. задана на некоторой
полуалгебре множеств С, и требуется
продолжить ее на более широкий класс множеств
(конечно, содержащий полуалгебру С).
Определим для любого множества
А с X функцию множества
p*(^) = inf]Tp(Q), (14.2.3)
к
где нижняя грань берется по всем возможным
счетным покрытиям множества А
множествами класса С : A <z\\Ck,Ck e С . Без потери
к
общности можно считать множества Ск в
(14.2.3) попарно непересекающимися,
СкС\ = 0 при I Ф к . Эту функцию
множества называют внешней мерой.
Оказывается, что внешняя р.*
представляет собой единственное а-аддитивное
продолжение меры р , определенной на
полуалгебре множеств С, на класс множеств С,
измеримых по Лебегу
С = {А : р* (AD) + р* (Щ = р* (/)), VDcz х),
представляющий собой минимальную полную
относительно р* а-алгебру, содержащую
полуалгебру С. Таким образом, любую
неотрицательную о-конечную о-аддитивную меру,
заданную на полуалгебре множеств С (или
алгебре множеств В), можно однозначно
продолжить на минимальную полную о-алгебру
А*, содержащую полуалгебру С (алгебру В).
550
Глава 14.3. ИНТЕГРАЛЫ
Глава 14.3
ИНТЕГРАЛЫ
14.3.1. Измеримые функции. Пусть
(Х,А) и (Y,B) — два измеримых
пространства. Функцию у = f(x), отображающую
пространство X в пространство Y,
называют измеримой относительно о-алгебр Л и В
или (А, В)-измеримой, если из В е В следует
f (В)е А. В тех случаях, когда речь идет
об известных а-алгебрах А и В и путаницы
быть не может, (А, #)-измеримую функцию
коротко называют измеримой без указания
а-алгебр в пространствах X и Y , по
отношению к которым она измерима.
По свойствам обратных отображений
класс множеств f (В) представляет собой
О-алгебру. Эту а-алгебру называют О-алгеброй,
индуцированной в пространстве X функцией
/, и обозначают Af , Af = f~ (В).
Если функция / не измерима, то
индуцированная ею а-алгебра Af не входит в
а-алгебру А .
Теорема 14.3.1. Пусть (Х,А), {Y,B) и
(Z,C) ~ измеримые пространства. Если
функция у = f(x), / : X -> Y , (А, В)-измерима,
а функция z = g(y), g '• Y -> Z, (В,
(^-измерима, то сложная функция (композиция
отображений) gf(x) = g(f(x)) (А, С)-измерима.
Для теории интеграла особенно важны
измеримые функции со значениями в сепара-
бельном i?-пространстве Y . В этом случае в
качестве а-алгебры В в Y обычно берут
а-алгебру, порожденную классом всех
открытых шаров.
Если область значений Rf функции
f(x) состоит из конечного числа точек, то
функцию f(x) называют конечнозначной.
Если Яг — счетное множество точек, то
функцию f(x) называют счетнозначной.
Измеримую конечнозначную функцию
называют простой. Измеримую счетно-
значную функция называют элементарной.
Основные свойства измеримых функций
со значениями в сепарабельном ^-пространстве.
Теорема 14.3.2. Предел
последовательности измеримых функций представляет собой
измеримую функцию.
Теорема 14.3.3. Функция f(x) измерима
тогда и только тогда, когда она представляет
собой предел равномерно сходящейся
последовательности элементарных функций.
Как следствие этой теоремы из
измеримости конечного или счетного множества функций
{fn(x)} вытекает измеримость функций
Х/л(*)> fMg(x), \/g(x) (g(x) -число-
п
вая функция, нигде не обращающаяся в нуль),
Х/«(*)Ч (*), Е„(х) е А , ^/„(х),
п п
inf fn(x), supfn(x).
» п
14.3.2. Сходимость почти всюду и по
мере. Пусть (X,A,[i) — пространство с
неотрицательной мерой [i. Без потери
общности можно считать а-алгебру А полной
относительно меры Ц.
Последовательность функций {//,(*)},
отображающих пространство X в
if-пространство Y , называют сходящейся почти всюду
(или почти всюду на множестве А ) к
функции f(x) , если она сходится при всех х
(соответственно при всех х е А), кроме,
может быть, точек множества Е е А нулевой
меры, [i(E) = 0. Записывается это в виде
Последовательность функций {fn(x)}
называют фундаментальной почти всюду (или
почти всюду на множестве А ), если
fn(x)-fm(x) "'"• >° ПРИ п>т ->°°-
Последовательность функций {/„(*)} со
значениями в ^-пространстве сходится почти
всюду тогда и только тогда, когда она
фундаментальна почти всюду.
Если последовательность измеримых
функций {/„(*)} сходится к функции f(x)
почти всюду относительно меры |i и а-алгебра
А полна относительно меры [i, то
предельная функция f(x) измерима.
ИНТЕГРАЛЫ ЛЕБЕГА, ЛЕБЕГА - СТИЛТЬЕСА
551
Всякая сходящаяся по мере |1
последовательность фундаментальна по мере |1 и
наоборот.
Всякая последовательность измеримых
функций {//;(*)}, сходящаяся почти всюду к
функции f(x) на множестве А конечной
меры, сходится к f(x) и по мере. Всякая
последовательность измеримых функций
{/„(*)}, фундаментальная по мере |1,
содержит подпоследовательность {/„(*)},
сходящуюся почти всюду и по мере. Отсюда
следует, что всякая сходящаяся по мере
последовательность содержит подпоследовательность,
сходящуюся почти всюду.
14.3.3. Интеграл Бохлера.
Интегрирование простых функций. Пусть X —
измеримое пространство с а-алгеброй множеств Л
и заданной на Л неотрицательной мерой |1.
Интеграл от простой функции
f(x) = j^yklEk(x)
по множеству А е Л определяется формулой
N
jf(xMdx) = jfd\L = ^yk[i(EkA).
А А к=\
(14.3.1)
Интегралы без указания области
интегрирования всегда понимаются как интегралы
по всему пространству X .
Интегрирование функций со значениями в
банаховом пространстве. Измеримая функция
f(x) со значениями в сепарабельном
^-пространстве Y называется
^-интегрируемой, если существует последовательность
ц-интегрируемых простых функций |/л(*)[,
сходящаяся почти всюду к f(x) , такая, что
J|/"-/W||^->0 при л,/и->оо.
Такую последовательность называют
определяющей функцию f(x) .
Интеграл от функции f(x) по
множеству A е Л определяется формулой
\f{x)\i(dx) = f/rf|i= lim \fnd\i. (14.3.2)
AAA
Этот интеграл называют интегралом Бохнера.
Интеграл представляет собой линейный
оператор, отображающий пространство
ц-интегрируемых функций в пространство их
значений.
Из других свойств интеграла важно
отметить неравенство
J/4lU/|/|4i (14.3.3)
и неравенство Чебышева
H({*:|/(jc)|ae})s!j|/|rf|i. (14.3.4)
Теорема 14.3.4. Если функция f(x) со
значениями в сепарабельном В-пространстве
измерима и | f(x) | < g(x), где g(x) -
|i-интегрируемая функция, то функция f(x) —
|i-интегрируема.
Пусть (X,A,[l) — пространство с
неотрицательной мерой, {U^V) — измеримое
пространство, и - ф(х) - (Л, V) - измеримая
функция, отображающая X в U ,
у(/>) = ц(ф"1 (/))), DeV, (14.3.5)
- мера, индуцированная в пространстве if
функцией и = (p(x). Рассмотрим v-интегри-
руемую функцию у - g(u), отображающую
U в сепарабельное ^-пространство У .
Теорема 14.3.5. Справедлива следующая
формула замены переменных в интеграле:
jg(uMdu)= J g{q(x))\L(dx). (14.3.6)
D ф-1(/>)
При g(u) = u , D = U , /)ф = X формула
(14.3.5) принимает вид
juv(du) = J4>(x)\i(dx). (14.3.7)
Эта формула применяется в теории
вероятностей.
14.3.4. Интегралы Лебега, Лебега -
Стилтьеса. Интеграл Лебега. В частном
случае действительной числовой функции f(x),
/ : X -> R интеграл Бохнера (14.3.2)
называют интегралом Лебега.
В частности, интеграл Лебега по
лебеговой мере определяется формулой
552
Глава 14.3. ИНТЕГРАЛЫ
\f{x)dx.
(14.3.8)
При этом в случае я-мерного векторного
аргумента х интеграл понимается как кратный
интеграл
j f(x)dx = j...j f (xb...,xn)dx{...dxn .
Теорема 14.3.6. Если существует
интеграл Римана от функции f(x) no ограниченной
области А , то существует и интеграл Лебега
от этой функции, равный интегралу Римана.
Теорема 14.3.7. Если существует
абсолютно сходящийся несобственный интеграл
Римана от f(x) , то существует и интеграл
Лебега от функции f(x) no области А ,
совпадающий с интегралом Римана.
Интегралы Лебега — Стилтьеса и Римана —
Стилтьеса. В случае конечномерного
пространства X = Rn общий интеграл Лебега
называют интегралом Лебега — Стилтьеса. В
частности, при X = R любой конечной
неотрицательной мере |1 можно поставить в
соответствие ограниченную неубывающую
функцию F(x) = |х((-оо,х)). Эта функция
определяет меру Лебега — Стилтьеса на R , и для
любого интервала вида [ос, Р)
u([a,P))=F(p)-F(cc). (14.3.9)
На основании теоремы 14.2.7 о
непрерывности меры, заданной на a-алгебре, функция
F(x) непрерывна слева.
Если мера |i a-конечна, то, определив
функцию F(x) формулой
F(x) =
снова получим формулу 14.3.9 для (i([a,p)),
и F(x) будет непрерывной слева
неубывающей функцией.
Интеграл Римана — Стилтьеса от
функции / по функции F определяется
формулой
Ъ Np
\f(x)dF(x)=\\mTf(^)x
и([о,*))
0
-ц([х,0))
при х > 0,
при х = 0,
при х < 0,
xJV^)-/^)} (14-3.10)
где {Ар} : а = 4Р)<4Р)< " < x<n\-x <
< x)F' -b (p = 1, 2,...) - такая последова-
тельность разбиений интегравала [а, Ь), что
lim Д - = lim maxfxH - х[р\) -> 0.
Теорема 14.3.8. Если существует
интеграл Римана — Стилтьеса
b
j\f(x)\dF(x),
а
то существует интеграл Лебега — Стилтьеса
от функции f{x) no F(x) no интервалу
[а, Ь) (а значит, и по интервалам [а, Ь],
(a,b] , (а,Ь)), совпадающий с интегралом
Римана — Стилтьеса (может быть а = -оо ,
Ь=оо).
14.3.5. Предельные переходы под
знаком интегралов. Теорема 14.3.9. Если
{fn(x)} ~ неубывающая последовательность
неотрицательных измеримых функций,
сходящаяся почти всюду к функции f(x) , то
lim \f„d\i = \fd\L.
А А
Это предложение известно как теорема
о монотонной сходимости.
Из теоремы о монотонной сходимости
следует теорема о возможности почленного
интегрирования почти всюду абсолютно
сходящихся рядов измеримых действительных
функций.
Рассмотрим теперь произвольную
последовательность неотрицательных измеримых
функций {///(*)}, ограниченную снизу ц-
интегрируемой функцией. Для нее
справедливо неравенство
fMfnd\L*Mffn<l\L- (14.3.11)
А А
Это неравенство составляет содержание леммы
Фату.
Если последовательность {/„(х)}
ограничена сверху (i-интегрируемой функцией
v(x), то из (14.3.11) следует
АБСОЛЮТНАЯ НЕПРЕРЫВНОСТЬ И СИНГУЛЯРНОСТЬ МЕР
553
limj7„ d\i < J lim/я d\i. (14.3.12)
A A
Теорема 14.3.10. Если последовательность
действительных измеримых функций {/„(*)}
сходится почти всюду к функции f(x) и
ограничена снизу и сверху ц-интегрируемыми
функциями соответственно v(x) и w(x)
v(x)<fn(x)<w(x),
то все функции fn(x) и f(x) |i-интегрируемы
и справедливо равенство
lim \fnd\i= \fd\L.
А А
Доказанное предложение обычно
называют теоремой о мажорируемой
последовательности.
Теорема 14.3.11. Если последовательность
измеримых функций {/„(*)} со значениями в
сепарабельном В-пространстве сходится почти
всюду или по мере к функции f(x) и все
функции f„(x) ограничены по норме
\1-интегрируемой функцией g(x) , | /„(*) || < g(x), то
функция f(x) \i-интегрируема и
[fd[i= lim \fnd\i (14.3.13)
A A
(теорема Лебега).
Теорема 14.3.12. Если ряд
£м*>
сходится почти всюду или по мере к некоторой
функции f(x) и все его конечные отрезки
/,,(*) = 5>,(*) (л = 1,2,...)
ограничены по норме ц-интегрируемой функцией
g(x) , то функция f(x) ц-интегрируема и
оо оо
\fd^ = \JuSpd\i = ^\gpd\i. (14.3.14)
А А />=1 P=l A
14.3.6. Абсолютная непрерывность и
сингулярность мер. Определения. Пусть
(Х,А) — произвольное измеримое
пространство, \i(A) - неотрицательная мера,
определенная на а-алгебре А , ф(Л) - мера со
значениями в сепарабельном В-пространстве,
определенная на а-алгебре А .
Меру (р(Л) называют абсолютно
непрерывной по отношению к мере |i , или, короче,
ji-непрерывной, если ф(>4) = 0 на любом
множестве Ае А нулевой меры |1,
\i(A) = 0 . Иными словами, мера ф(Л)
ц-непрерывна, если из [i(A) = 0 следует
<р(Л) = 0.
Меру ф(Л) называют сингулярной по
отношению к мере [i, или, короче,
ц-сингулярной, если она равна нулю всюду вне
некоторого множества А е А нулевой меры, т.е,
если ф(2?) = 0 при любом В е А , В с А,
Две неотрицательные меры ц(>4) и
v(v4), определенные на одной и той же
а-алгебре А , называют эквивалентными, если
мера \ь(А) v-непрерывна и мера v (A)
ц-непрерывна.
Две неотрицательные меры У-(А) и
v(>4) называют ортогональными, если [i(A)
v-сингулярна и v(y4) ц-сингулярна.
Разложение меры на абсолютно
непрерывную и сингулярную части. Пусть ф(^4) -
произвольная числовая мера, определенная на
той же а-алгебре А , что и неотрицательная
мера [i(A).
Теорема 14.3.13. Мерау{А) представима
формулой
<р(Л) = сс(Л) + р(Л), АеА,
где ос(;4) - ^-непрерывная мера, а $(А) — |i-
сингулярная мера.
Отсюда следует теорема Радона — Нико-
дима.
Теорема 14.3.14. Всякая действительная
или комплексная \i-непрерывная мера ф(Л)
представляет собой интеграл от некоторой
{^-интегрируемой) функции z(x) :
554
Глава 14.3. ИНТЕГРАЛЫ
(p(A)=jzd[i (14.3.15)
А
(теорема Радона - Никодима).
Функцию z(x) в (14.3.15) называют
производной Радона — Никодима меры ф(Л)
по мере |i (А) и обозначают
Z(x) = ^(x) = ^ = ^(x). (14.3.16)
Так как интеграл по мере ц не изменяется
при любом изменении подынтегральной
функции на любом множестве нулевой меры
|1, то производная Радона - Никодима
представляет собой класс эквивалентных функций,
отличающихся одна от другой на множестве
нулевой меры |i.
Теорема 14.3.15. Если действительная
мера X, определенная на той же с-алгебре
множеств А , что и мера ц, \1-непрерывна, а
действительная функция f(x) Х-интегрируема,
то
ip{A)=jfdX = jfXfVLd[i. (14.3.17)
А А
14.3.7. Лебеговы пространства.
Пространства Соболева. Определение лебегова
пространства. Лебеговым пространством Lp,
1 < р < ©о , называют множество всех
измеримых функций, отображающих пространство
X с неотрицательной мерой |1 в сепара-
бельное /^пространство Y и
удовлетворяющих условию
Jt/|'4t = J|/W||V№)<~.
В случае необходимости это пространство
обозначают Lp(X,A,\i) или Lp(X,A,[i,Y),
указывая пространство X , на котором
определены функции, а-алгебру А в X и
определенную на ней меру |i и, может быть,
пространство значений функций Y .
Любое пространство Г представляет
собой /^пространство с нормой
И,-{(И'*Г- (14318)
Элементами пространства Lp служат не
отдельные функции, а классы эквивалентных
функций, отличающиеся одна от другой
только на множестве нулевой меры |i .
В частном случае пространство
Is2(X,A,li) числовых функций представляет
собой //-пространство со скалярным
произведением
(/ь/2) = jfifid\i = \h{x)JJx)\i{dx).
(14.3.19)
Пространства Соболева. Естественным
обобщением лебеговых пространств Lp(X)
являются пространства Соболева, имеющие
большое значение в приложениях
функционального анализа. Рассмотрим линейное
пространство скалярных функций, непрерывных
вместе со своими производными до порядка
N включительно, на ограниченном
замкнутом интервале [я, Ь]. Вводя в этом
пространстве норму
\Ъ N Vlp
(14.3.20)
где интеграл естественно понимается как
интеграл Римана, получим нормированное
линейное пространство, которое мы обозначим
Ср ([д, b]j. Это пространство не полно.
Для того чтобы пополнить Ср ([д,£]),
необходимо обобщить понятие производной.
Рассмотрим фундаментальную
последовательность функций {fn (х)} с С^ ([д, Ь]). Для
этой последовательности
I/„(*)-/■„(*) Г =
-jtl^W-^Wl'ifc^O
ak=0
при п,т -» 0.
Отсюда следует, что каждая из
последовательностей {/„*** (*)} (к = 0,1,..., N)
фундаментальна в Lp ([д, b]j и в силу полноты Lp
имеет предел /<*>(*) (А; = 0,1, ...,#).
Предельные функции f'(x),...,flN)(x)eLp([a,b])
называют обобщенными производными предельной
функции f(x) е Lp (la, b]\ в смысле Соболева.
МЕРА ВИНЕРА
555
Множество всех функций из Lp ([д, £]),
имеющих обобщенные производные в смысле
Соболева до TV-го порядка включительно, с
нормой, определяемой формулой (14.3.20), в
которой интеграл понимается как интеграл
Лебега, называют пространством Соболева
<(М).
Совершенно так же определяется
пространство Соболева Wp (X) для любой
замкнутой ограниченной области X
пространства Rn с достаточно гладкой границей.
В частном случае при р = 2
пространство Wp [X) представляет собой
//-пространство со скалярным произведением
(/.*) =
= г Д Э*'+"+*"/(х) дк>+'+к»Жх)dx
lkb.in=o Ъх£.М* Эх** ..Ас*"
(14.3.21)
Это пространство Соболева обозначают
HN(X), W2N(X) = HN(X).
14.3.8. Меры в произведении двух
пространств. Пусть (Х,Л) и (Y,B) - два
измеримых пространства, |1 -
неотрицательная мера, определенная на а-алгебре А в
X , Хх — семейство неотрицателльных мер,
определенных на а-алгебре В в Y ,
зависящее от параметра х е X , и такое, что при
любом множестве В е В функция Хх (В)
переменной х измерима и ц-интегрируема.
Теорема 14.3.16. Формула
v (А х В) = JXX (B)ii(dx) (14.3.22)
А
определяет неотрицательную меру v на всех
измеримых прямоугольниках Ах В , А е А ,
В е В произведения измеримых пространств
(XxY,AxB).
Теорема 14.3.17. Продолжение меры v на
о-алгебру С- Ах В определяется формулой
v(C) = j\x(Cx)\L(dx) =
= j\>{dx)flc(x9y)\xVy), CgC.
(14.3.23)
Теорема 14.3.18. Пусть/(х, у)
-V-интегрируемая функция в произведении пространств
Z = X xY со значениями в некотором В-про-
странстве U . Тогда сечение fx(y) = f(x,y)
функции f Хх-интегрируемо почти при всех х
(относительно меры \i ), функция
w(x) = jf(x,y)Xx(dy)
|i- интегрируема и
J/rfv = jwd\i = j\i(dx)jf(x9y)Xx(dy)
(14.3.24)
(теорема Фубини).
В частном случае, когда мера Хх не
зависит от х, Хх (В) = X (В) при всех В е В и
при всех х, меры |i и А, в (14.3.24) можно
поменять местами, и формула (14.3.24)
принимает симметричный вид. Вследствие этого
и теорема Фубини симметрична относительно
мер X и |1, и формула (14.3.24) принимает
вид
jfdv=j[i(dx)jf(x,y)X(dy) =
= J4dy)jf(x,yMdx). (14.3.25)
По индукции определяются меры и
кратные интегралы в любом конечном
произведении пространств (см. п. 14.2.1).
14.3.9. Мера Винера. Классическая
мера Винера (распределение винеровского
процесса) определяется на полуалгебре
измеримых прямоугольников бесконечного
произведения пространств X = Г~Г Xt ,
АТ = ]jAt , Xt = R(te [О,-)), At - боре-
левская а-алгебра на R , формулой
\iW({*(/): x(t{)e Ai9..., x(tn)e An}) =
1 x
J(27l)4(>2 -hYA'n -'n-l)
(14.3.26)
Наряду с мерой Винера |1^ часто
применяется мера ц'и/ , определяемая на прямо-
556
Глава 14.4. ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
угольных множествах пространства IX ,А )
формулой
\L'tV(Alx...xAn) =
1
^2n)n-\t2-tv)..\tn-tn_{)
х [ ... [ ехр{4У^^^Ц-.-^-
{ I 12h ь-h J
(14.3.27)
Мы будем называть эту меру
модифицированной мерой Винера, чтобы избежать путаницы,
которая может возникнуть из-за того, что мера
ц'и/ часто тоже называется мерой Винера.
Как и введенная выше общая мера на
бесконечном произведении пространств, меры
\i'\y а-аддитивны на полуалгебре измеримых
прямоугольников бесконечного произведения
пространства (X ,А ) и вследствие этого
имеют однозначное продолжение на а-алгебру
Ат.
Меры Винера \i\y и MV можно считать
сосредоточенными на подпространстве
непрерывных функций С([0,°°)) пространства
X всех действительных функций.
Глава 14.4
ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
14.4.1. Основные понятия топологии.
Для определения сходимости
последовательностей и непрерывности функций основным
является понятие открытого множества. За
класс открытых множеств в пространстве X
можно принять произвольно выбранный
класс множеств т , обладающий следующими
свойствами:
1) пустое множество 0 и все
пространство А"являются открытыми множествами;
2) любое объединение открытых
множеств представляет собой открытое множество;
3) пересечение конечного числа
открытых множеств представляет собой открытое
множество.
Класс х открытых множеств
пространства X называют топологией этого
пространства. Пространство X с заданной в нем
топологией называют топологическим
пространством и обозначают (X, х).
Множество всех возможных топологий в
данном пространстве X, как и множество
любых классов множеств, частично упорядочено
знаком включения. Если в пространстве X
заданы две топологии Xj и х2, причем ij
полностью содержится в х2 (т.е любое
открытое множество в Xj является открытым
множеством в х2), Xj с: х2 , то говорят, что
топология Xj слабее топологии х2 , а
топология х2 сильнее топологии Х\.
Дополнение любого открытого
множества называют замкнутым множеством. На
основании принципа двойственности класс
замкнутых множеств содержит все
пространство X и пустое множество 0, все конечные
объединения и любые пресечения входящих в
него множеств. Таким образом, пустое
множество и все пространство являются
одновременно открытыми и замкнутыми множествами.
Всякое открытое множество, содержащее
точку jc, называют окрестностью точки х.
Всякое открытое множество, содержащее
данное множество А, называют окрестностью
множества А.
Точку х называют внутренней точкой
множества А, если существует некоторая
окрестность Vx точки х, целиком содержащаяся
в A, Vx с А .
Точку х называют точкой прикосновения
множества А, если в любой окрестности точки
х содержится хотя бы одна точка множества А.
Точка прикосновения множества А может
принадлежать, а может и не принадлежать
множеству А.
Точку х называют предельной точкой
множества А, если в любой окрестности точки
х содержится хотя бы одна точка множества А,
отличная от х. Предельная точка множества А
может принадлежать, а может и не
принадлежать множеству А.
Теорема 14.4.1. Множество А открыто
тогда и только тогда, когда каждая его точка
является внутренней точкой.
Теорема 14.4.2. Множество А замкнуто
тогда и только тогда, когда оно содержит все
свои точки прикосновения.
Рассмотрим произвольное множество А.
Наибольшее открытое множество,
содержащееся в А, называют открытым ядром множе-
АКСИОМЫ ОТДЕЛИМОСТИ. АКСИОМЫ СЧЕТНОСТИ
557
ства А и обозначается А . Наименьшее
замкнутое множество, содержащее А, называют
замыканием множества А и обозначают [А].
Разность [А] \ А называют границей
множества А.
Легко видеть, что А представляет
собой объединение всех открытых множеств,
содержащихся в А, а [А] представляет собой
пересечение всех замкнутых множеств,
содержащих А.
Базой топологического пространства или
базой топологии этого пространства называют
совокупность открытых множеств,
объединением множеств которой можно получить
любое открытое множество.
Теорема 14.4.3. Для того чтобы подкласс
В открытых множеств был базой
топологического пространства, необходимо и достаточно,
чтобы для любого открытого множества G и
любой его точки х е G существовало такое
множество Вхе В , что хе Вх с G .
Множество С открытых множеств, все
конечные пересечения которых образуют базу
топологического пространства, называют
предбазой топологии этого пространства.
Теорема 14.4.4. Любой класс множеств С
пространства X, объединение всех множеств
которого совпадает с X, может служить пред-
базой некоторой топологии в этом
пространстве.
14.4.2. Аксиомы отделимости.
Аксиомы счетности. Аксиомы отделимости. Хотя
топологию в любом пространстве можно
задать в принципе совершенно произвольно
(лишь бы удовлетворялись аксиомы
топологии), для построения содержательной теории
имеет смысл выбирать топологию так, чтобы
в известной мере сохранить то свойство
естественной топологии метрического
пространства, что любая точка имеет стягивающееся к
ней множество окрестностей. В связи с этих
принимается одна из четырех аксиом
отделимости.
Первая аксиома отделимости 7j . Каждая
из двух различных точек х, у топологического
пространства X имеет окрестность, не
содержащую другую точку. Иными словами, если
х ■* у , то точка х имеет окрестность Vx, не
содержащую у, а точка у имеет окрестность
V», не содержащую х. Топологическое
пространство с первой аксиомой отделимости 7[
называют Т{ -пространством.
Теорема 14.4.5. Пересечение всех
окрестностей любой точки х Т^пространства
представляет собой множество {*}, состоящее из
одной точки х (одноточечное множество).
На основании этой теоремы любая точка
7i-пространства имеет стягивающееся к этой
точке множество окрестностей.
Теорема 14.4.6. Любое конечное
множество точек Т{ -пространства замкнуто.
Теорема 14.4.7. В любой окрестности
предельной точки множества в Т\-пространстве
содержится бесконечное множество точек
этого множества.
Вторая аксиома отделимости Т2 . Любые
две различные точки х, у топологического
пространства имеют непересекающиеся
окрестности. Иными словами, если х * у , то
существуют такие окрестности Vx, Vy точек
х, у, что VxVy = 0 . Топологическое
пространство со второй аксиомой отделимости
Т2 называют Т2-пространством или хаусдор-
фовым пространством.
Третья аксиома отделимости Т3. Каждая
точка х топологического пространства и не
содержащее ее замкнутое множество F
имеют непересекающиеся окрестности. Иными
словами, если х ё F, где F - замкнутое
множество, то существуют такие окрестности
Vx и Vp точки х и множества F, что
VxVp=0. ^-пространство,
удовлетворяющее также третьей аксиоме отделимости 7з,
называют Т^-пространством или регулярным
пространством.
Четвертая аксиома отделимости 7^.
Любые два непересекающихся замкнутых
множества топологического пространства
имеют непересекающиеся окрестности.
Иными словами, если F\, F2 — два замкнутых
множества и F\ F2 = 0, то существуют такие
окрестности V\ , V2 множеств F\, F2, что
V\ V2 - 0 • ^-пространство,
удовлетворяющее также четвертой аксиоме отделимости
Г4 , называют Т^-пространством или
нормальным пространством.
558
Глава 14.4. ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
База окрестностей точки. Множество Вх
окрестностей точки х называют базой окрест-
ностей точки х, если любая окрестность Vx
точки х содержит некоторую окрестность
ВхеВх, BxaVx.
Теорема 14.4.8. Объединение баз
окрестностей всех точек топологического пространства
представляет собой базу этого пространства.
Аксиомы счетности. Первая аксиома
счетности. Каждая точка топологического
пространства имеет счетную базу
окрестностей.
Вторая аксиома счетности.
Топологическое пространство имеет счетную базу.
Множество А называют плотным в
множестве В (в пространстве X), если в любой
окрестности любой точки множества В
(пространства X) содержатся точки множества А.
Иными словами, множество А плотно в В,
если любая точка множества В представляет
собой точку прикосновения множества А.
Топологическое пространство называют
сепарабельным, если оно содержит счетное
плотное множество.
Теорема 14.4.9. Топологическое
пространство со счетной базой сепарабельно.
Обратное утверждение в общем случае
не справедливо. Сепарабельное
топологическое пространство может не иметь счетной
базы. Однако серапабельное метрическое
пространство имеет счетную базу.
14.4.3. Сходимость. Непрерывность
функции. Сходимость последовательности.
Последовательность точек [хп]
топологического пространства называют сходящейся в
точке х,
хп -> х или х = lim xn,
если любая окрестность точки х содержит все
точки хп , начиная с некоторой.
Теорема 14.4.10. В Т2-пространстве
последовательность может сходиться не более,
чем к одной точке.
Теорема 14.4.11. В Т\-пространстве с
первой аксиомой счетности точка х может
быть предельной точкой множества А тогда и
только тогда, когда в множестве А
существует последовательность, сходящаяся к х.
Непрерывность функции. Функцию
у = f{x) , отображающую топологическое
пространство X в топологическое
пространство У , называют непрерывной в точке Xq ,
если прообраз любой окрестности W точки
Уо - f (x0) содержит некоторую окрестность
V точки х0 , V cz f~{ (W). Очевидно, что
это определение эквивалентно следующему:
функцию у = f(x) называют непрерывной в
точке Xq , если любая окрестность W точки
Уо - f (x0) содержит образ некоторой
окрестности V точки Xq , f(V) <= W .
Эквивалентность этих двух определений вытекает
непосредственно из свойств обратных
отображений.
Функцию у - f(x) называют
непрерывной, если она непрерывна во всех точках
своей области определения Df.
Теорема 14.4.12. Если функция у = f(x),
отображающая топологическое пространство
X в топологическое пространство У ,
непрерывна в точке Xq и функция z = g(y),
отображающая Ув топологическое пространство Z,
непрерывна в точке yQ = / (xq ), то сложная
функция g f(x) = g(f(x)) непрерывна в точке
х0.
Теорема 14.4.13. Функция у = f(x) ,
отображающая топологическое пространство
X в топологическое пространство У и
определенная на всем пространстве X, непрерывна
тогда и только тогда, когда определяемый
этой функцией прообраз любого открытого
множества представляет собой открытое
множество.
Теорема 14.4.14. Если функция f(x)
непрерывна, то для любой последовательности
{хп} с Df , сходящейся к хе Df ,
последовательность [уп], yn-f{xn)i сходится к
У-fix).
Теорема 14.4.15. Если X — пространство
с первой аксиомой счетности, то из
сходимости последовательности [уп] , уп = f(xn), к
у = f(x) для любой последовательности
[хп] с: Df, сходящейся к xeDf, следует
непрерывность функции f{x) .
Пусть X — пространство, в котором
нужно задать топологию, (У,о) —
топологическое пространство с известной топологией
а, у = f(x) — отображение X —> У . Про-
КОМПАКТНОСТЬ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ
559
образ т = / (а) топологии а можно
принять за топологию в пространстве X, так как в
силу свойств обратных отображений
множества из т обладают всеми свойствами открытых
множеств, поскольку ими обладают
множества из а.
Однако топология в сложном
пространстве X, перенесенная с помощью обратного
отображения из достаточно простого
пространства У (а только в простых
пространствах существуют естественные топологии),
часто оказывается слишком бедной. Поэтому
часто не довольствуются одним
пространством с известной топологией и одним
отображением. Взяв достаточное множество
пространств с известными топологиями и
достаточное множество отображений, можно
определить достаточно сильную топологию в
любом пространстве.
Измеримые топологические пространства.
В топологическом пространстве обычно
задают или а-алгебру, порожденную топологией,
или а-алгебру, порожденную базой топологии.
Топологическое пространство с о-алгеброй,
порожденной топологией, называют
измеримым топологическим пространством.
Теорема 14.4.16. Все непрерывные
функции, отображающие измеримое топологическое
пространство в другое измеримое
топологическое пространство, измеримы (теорема об
измеримости непрерывных функций).
14.4.4. Компактность множеств и
пространств. Объединение множеств \jGa
называют покрытием множества А
(пространства X), если А с \)Ga
(соответственно X = \\Ga). Если все
множества Ga открыты, то I \Ga называется
открытым покрытием множества А
(пространства X).
Множество топологического
пространства (в частности, само пространство) называют
компактным, если любое его открытое
покрытие содержит конечное покрытие
(подпокрытие). Компактное множество ^-пространства
называют компактом.
Множество топологического
пространства (в частности, само пространство) называют
счетно компактным, если любое его счетное
открытое покрытие содержит конечное
покрытие.
Теорема 14.4.17. Замкнутое
подмножество компактного множества компактно.
Теорема 14.4.18. Компакт замкнут в
любом содержащем его Т2-пространстве.
Теорема 14.4.19. Для того чтобы
множество было счетно компактным, необходимо и
достаточно, чтобы любое его бесконечное
подмножество имело предельные точки.
Множество топологического
пространства называют' предкомпактным (счетно пред-
компактным) или относительно компактным
(относительно счетно компактным), если его
замыкание компактно (счетно компактно).
Теорема 14.4.20. Образ компактного
множества при непрерывном отображении
компактен.
14.4.5. Компактность в метрических
пространствах. Множество S называют
е-сетью для множества А, если для любой
точки х е А найдется точка s e S,
удаленная от х меньше, чем на е, d(x,e) < г . При
этом некоторые (или все) точки множества S
могут и не принадлежать множеству А.
Множество А метрического пространства
X называют ограниченным, если существует
такое число о 0, что d(xi,x2)<c для
любых точек Xi,x2e A .
Множество А метрического пространства
X называют вполне ограниченным, если для
каждого е > 0 существует конечная е-сеть
для А.
Теорема 14.4.21. Всякое вполне
ограниченное множество в метрическом пространстве
ограничено.
Теорема 14.4.22. В конечномерном
метрическом пространстве всякое ограниченное
множество вполне ограничено.
Таким образом, понятия ограниченности
и полной ограниченности множеств
совпадают для конечномерных метрических
пространств и различны для бесконечномерных
пространств.
Теорема 14.4.23. Всякое счетно
компактное метрическое пространство вполне
ограничено.
Теорема 14.4.24. Всякое счетно
компактное метрическое пространство компактно.
Таким образом, для метрических
пространств понятия компактности, счетной
компактности и секвенциальной
компактности совпадают.
Теорема 14.4.25. Метрическое
пространство компактно тогда и только тогда, когда
оно полно и вполне ограничено.
Следствие 1. Множество в полном
метрическом пространстве предкомпактно тогда и
только тогда, когда оно вполне ограничено.
Следствие 2. Всякое предкомпактное
(компактное) множество в полном
метрическом пространстве ограничено.
560
Глава 14.4. ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
Следствие 3. В конечномерном
пространстве Rn любое ограниченное множество пред-
компактно.
Следствие 4. Объединение конечного
множества компактов в полном метрическом
пространстве есть компакт.
Теорема 14.4.26. Множество А = {ха(0}
функций пространства С\Т,Кп\ непрерывных
функций, отображающих компакт Т в
пространство Кп , предкомпактно тогда и
только тогда, когда все функции множества А
равномерно ограничены (т.е. ограничены по модулю
одним и тем же числом М) и равностепенно
непрерывны (число 5 = 5(e) в определении
непрерывности функции в 14.1.2 при любом
е > 0 одно и то же для всех функций xa(t)).
14.4.6. Топологические линейные
пространства. Операции над множествами в
линейном пространстве. Кроме обычных
операций над множествами, в линейном
пространстве целесообразно ввести операции сложения
множеств и умножения множества на число.
Суммой вектора х и множества В в
линейном пространстве называют множество
всех векторов вида х + у , где у — любой
вектор, принадлежащий множеству В,
x + B = {z:z = x + y,ye В}.
Суммой множеств А и В в линейном
пространстве называют множество всех
векторов вида х + у, где х - любой вектор из
множества А, а у — любой вектор из
множества В, А + В = [z : z = х + у, х е А, у е В}.
Произведением множества А на число с в
линейном пространстве называют множество
всех векторов вида сх, где х — любой вектор
множества А, сА = [z : Z = сх, х е А] .
Множество А линейного пространства
называют выпуклым, если оно содержит
наряду с любыми двумя векторами х, у их
линейную комбинацию сис + (\-а)у при любом
осе (0,1).
Линейное пространство с топологией, в
которой операции сложения векторов и
умножения вектора на число непрерывны,
называют топологическим линейным
пространством.
Если топологическое линейное
пространство есть ^-пространство, то его
называют отделимым.
Теорема 14.4.27. Если А — открытое
множество топологического линейного
пространства X, то для любого вектора у, любого
множества В пространства X и любого числа
X * 0 множества А + у, А + В и ХА
открыты.
Следствие. В топологическом линейном
пространстве X любая окрестность Vx любой
точки х получается сдвигом некоторой
окрестности нуля Vq на вектор х.
Способы задания топологии в линейном
пространстве. На основании следствия
теоремы 14.4.27 для определения топологии в
линейном пространстве достаточно задать базу
окрестностей нуля. Тогда база окрестностей
любой точки х получится сдвигом базы
окрестностей нуля на вектор х.
Фундаментальность последовательности.
В отличие от общего топологического
пространства в топологическом линейном
пространстве можно ввести понятие
фундаментальности последовательности.
Последовательность точек {хп}
топологического линейного пространства X
называют фундаментальной, если любая
окрестность нуля содержит все точки хп - хт при
п,т> N , где N — некоторое натуральное
число, зависящее от выбранной окрестности
нуля.
Теорема 14.4.28. Всякая сходящаяся
последовательность в топологическом линейном
пространстве фундаментальна.
Топологическое линейное пространство
называют локально выпуклым, если любая
окрестность нуля содержит выпуклую
окрестность нуля.
В нормированном линейном
пространстве X база окрестностей нуля представляет
собой множество всех открытых шаров с
центром в нуле:
^(0) = {л:: ||лг|| < е} Ve > 0 (14.4.1)
Нормированное линейное пространство с
такой топологией, как и всякое метрическое
пространство, является пространством с
первой аксиомой счетности.
В произвольном линейном пространстве
базу окрестностей нуля можно определить с
помощью множества линейных функционалов
путем переноса базы окрестностей нуля поля
скаляров | z | < е в пространство X обратными
отображениями (см. 14.4.3). Пусть F — любое
множество линейных функционалов на X.
СЛАБЫЕ ТОПОЛОГИИ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ
561
Тогда база окрестностей нуля в X может быть
определена как совокупность окрестностей
нуля
{x:|/ix|<e,...,|/,,х|<е}, (14.4.2)
соответствующих всем п,г > О , /j,..., fn e F .
Каждая такая окрестность нуля представляет
собой пересечение прообразов окрестностей
нуля | z | < е при отображениях z = fkx
(к = \,...,п) ХвК.
На основании теоремы 14.4.13 все
функционалы / е F непрерывны в
топологии Т/г, порожденной базой окрестностей
нуля (14.4.2).
Теорема 14.4.29. Для того чтобы
топологическое линейное пространство X с
топологией Xf было Т2-пространством, необходимо и
достаточно, чтобы для любых двух различных
точек х, у , х Ф у , в F нашелся такой
функционал f, что fa Ф fy .
На основании этой теоремы множество
линейных функционалов F, удовлетворяющее
условию теоремы, называют разделяющим
точки пространства X.
Теорема 14.4.30. Топологическое линейное
пространство X с топологией if локально
выпукло.
Теорема 14.4.31. Линейная функция
у = f(x) , отображающая топологическое
линейное пространство X в другое
топологическое линейное пространство Y, непрерывна
всюду, если она непрерывна хотя бы в одной точке.
Ограниченные линейные функции.
Линейную функцию у = f{x) , отображающую
топологическое линейное пространство X в
нормированное линейное пространство Y,
называют ограниченной, если она ограничена в
некоторой окрестности нуля Vq :
\\f(x)\\<c VxeV0. (14.4.3)
Теорема 14.4.32. Для того чтобы линейная
функция у = f(x) , отображающая
топологическое линейное пространство X в
нормированное линейное пространство Y, была
непрерывной, необходимо и достаточно, чтобы она была
ограниченной.
Пусть у = f{x) — линейная функция,
отображающая нормированное линейное
пространство X в нормированное линейное
пространство Y . Величину
Ия8ир Ы1 =„T»/W» (14A4)
называют нормой непрерывной функции.
В частности, если функция f(x)
представляет собой непрерывный линейный
функционал f(x) = fa , формула (14.4.4)
определяет норму непрерывного линейного
функционала:
ll/i = supiM=»sl!plAl- (14A5)
Если функция f(x) представляет собой
непрерывный линейный оператор,
f(x) = Ах , формула (14.4.4) определяет
норму непрерывного линейного оператора:
|^|| = supif^=sup||^||. (14.4.6)
Из общей теоремы Хана - Банаха о
продолжении линейного функционала
вытекает следующая теорема.
Теорема 14.4.33. Любой непрерывный
линейный функционал, заданный на
подпространстве нормированного линейного пространства,
может быть продолжен на все пространство с
сохранением нормы.
14.4.7. Слабые топологии в линейных
пространствах. Пусть (Х,т) —
топологическое линейное пространство, F — множество
всех непрерывных линейных функционалов
на нем. Топология Т/г, определяемая
множеством линейных функционалов F, является
слабейшей топологией, в которой все
функционалы из F непрерывны. Следовательно,
if с т. Это дает основание ввести понятие
слабой топологии в топологическом
линейном пространстве.
Слабой топологией в топологическом
линейном пространстве (Х,т) называют
топологию Хр , определяемую множеством F всех
непрерывных (в топологии т) линейных
функционалов этого пространства с помощью
окрестностей нуля (14.4.2). В противовес
этому, если в X не определена никакая третья
топология, топологию т называют сильной
топологией пространства X.
В частности, в нормированном
линейном пространстве X с топологией т ,
порожденной нормой, топология if , определяемая
562
Глава 14.5. ПРОСТРАНСТВО ОПЕРАТОРОВ И ФУНКЦИОНАЛОВ
множеством F всех непрерывных линейных
функционалов пространства X, будет слабой
топологией.
В отличие от топологических понятий,
связанных с топологией т , все
топологические понятия, связанные со слабой
топологией Т/г, вводятся с добавлением слова "слабо"
или "слабый", или "слабая".
Так, последовательность точек {хп}
линейного пространства X, сходящаяся к х
(фундаментальная) в слабой топологии Туг,
называют слабо сходящейся к х (слабо
фундаментальной). В соответствии с этим точку х
называют слабым пределом слабо сходящейся к
х последовательности {*„} , х = w - lim xn ,
Теорема 14.4.34. Всякая сходящаяся
последовательность в топологическом линейном
пространстве слабо сходится к тому же
пределу.
Теорема 14.4.35. Для слабой сходимости
последовательности {хп} к х в топологическом
линейном пространстве X необходима и
достаточна сходимость числовой последовательности
{fon} к & дм любого функционала f e F .
Глава 14.5
ПРОСТРАНСТВО ОПЕРАТОРОВ
И ФУНКЦИОНАЛОВ
14.5.1. Общая теория. Сопряженные
пространства. Топологии в пространстве
ограниченных линейных операторов. Пусть
А — оператор, отображающий некоторое
пространство X в линейное пространство Y
Равенство у = а(Ах), где а - комплексное
число, определяет некоторый оператор С,
также отображающий X в У, у = Сх. Этот
оператор называют произведением оператора А
на число а: С = оА .
Если А и В — два оператора,
отображающие пространство X в линейное
пространство Y, то равенство у = Ах + Вх
определяет некоторый оператор С, также
отображающий Хв Y, у = Сх. Этот оператор
называют суммой операторов Aw В: С = А + В .
Из этих двух определений вытекает
определение линейной комбинации операторов:
п
k=\
если
п
к=\
В частном случае, когда Y — поле
скаляров (числовая прямая или комплексная
плоскость), предыдущие определения дают
произведение функционала на число, сумму и
линейную комбинацию функционалов.
Если оператор А отображает
пространство А" в У, а оператор В отображает
пространство Y в Z и область определения DB
оператора В пересекается с областью значений ЯА
оператора А, то равенство z = В (Ах)
определяет оператор С, отображающий X в Z :
Z = Сх . Этот оператор называют
произведением оператора А на оператор В: С = ВА .
Областью определения оператора С - ВА
служит множество Dq ={х : хе DA, Axe DB) ,
а его областью значений — множество
Rc = {z : Z = By, у 6 DBRA]. Из этого
определения вытекает определение произведения
любого числа операторов.
Если Z — поле скаляров, то из этого
определения вытекает определение произведения
оператора А на функционал f , которое,
очевидно, представляет собой функционал
В частном случае, когда Y = Z = X ,
кроме произведения ВА оператора А на Д
можно определить произведение АВ
оператора В на А. Очевидно, что в общем случае
АВ Ф ВА . Областью определения оператора
АВ служит DBC\{x : Вх е DA}, а областью
определения оператора ВА служит
DAf]{x:AxeDB}.
Если Y = Z=X , DBf]{x:Bxe DA}=
= Д4р|{х : Ах е DB) и АВх = ВАх при
любом х в области определения операторов
АВ и ВА, то операторы А и В называют
коммутативными или перестановочными.
Из приведенных определений вытекает
определение любой целой положительной
степени оператора А, отображающего X в X, а
ОБЩАЯ ТЕОРИЯ. СОПРЯЖЕННЫЕ ПРОСТРАНСТВА
563
также определение полинома от оператора А,
отображающего линейное пространство Хв X.
Если оператор А устанавливает взаимно
однозначное соответствие между точками
области определения DA cl и области
значений КА с Y , то существует обратный
оператор А~ , отображающий ЯА на DA,
хе А~ у , ye RA. Областью определения
обратного оператора А служит область
значений ЯА оператора А, а областью
значений А~ — область определения DA опера-
тора 4^.,=/^, RA-\ =DA.
Очевидно, что оператор А является
обратным для А~ , у4 = Ы~М , и что
произведение оператора на обратный оператор
представляет собой единичный оператор I,
оставляющий неизменными элементы
пространства. Действительно, А А = I
представляет собой единичный оператор в
пространстве X, а АА = I — единичный
оператор в пространстве Y
Пусть А - оператор, взаимно
однозначно отображающий пространство X в Y, а В —
оператор, взаимно однозначно отображающий
пространство Y в Z, причем RADg * ® » и
С = ВА . Тогда существует обратный оператор
С-1=А-1В-1.
Пространства линейных операторов и
функционалов. Из предыдущих определений
следует, что операции сложения операторов и
умножения оператора на число обладают
всеми свойствами операций сложения векторов и
умножения вектора на число. Поэтому
множество всех операторов, отображающих
пространство X в линейное пространство Y, как
линейных, так и нелинейных, можно
рассматривать как линейное пространство.
Особенно важны для функционального анализа
пространства линейных операторов и
функционалов.
Будем обозначать пространство всех
линейных операторов, отображающих линейное
пространство X в линейное пространство У,
через £(Х, К). В частности, пространство
всех линейных операторов, отображающих
пространство X в X, будем обозначать С [X) ,
£(Х) = С{Х,Х). Пространство всех
непрерывных линейных операторов, отображающих
топологическое линейное пространство X в
топологическое линейное пространство Y,
будем обозначать В (X, Y). В частности,
пространство всех непрерывных линейных
операторов, отображающих X в X, будем обозначать
В{Х), В(Х) = В{Х,Х).
В частном случае, когда X и Y -
нормированные линейные пространства,
пространство непрерывных линейных операторов
B(X,Y) само является нормированным
линейным пространством, в котором норма
определена как норма линейного оператора.
Теорема 14.5.1. Пространство
непрерывных (ограниченных) линейных операторов
B(X,Y), отображающих нормированное
линейное пространство X в В-пространство Y,
полно (т.е. является В-пространством).
Сопряженные пространства.
Пространство всех непрерывных линейных
функционалов на топологическом линейном
пространстве X называют пространством, сопряженным с
X, и обозначают X*.
Если задать в сопряженном
пространстве А"* топологию, то можно определить
второе сопряженное с X пространство X как
сопряженное с X* пространство
непрерывных линейных функционалов на X .
Если X - нормированное линейное
пространство, то сопряженное пространство X
также будет нормированным линейным
пространством.
Заметим теперь, что равенство Z = fe
при любом фиксированном х определяет
отображение пространства X* в поле скаляров
К, т.е.' функционал на X*. Таким образом,
при фиксированном х fie представляет собой
линейный функционал на X . Этот
функционал непрерывен, так как при всех /
IAM/IM.
и, следовательно, определяет некоторый
элемент <рх второго сопряженного пространства
<pxf = fa, (14.5.1)
564
Глава 14.5. ПРОСТРАНСТВО ОПЕРАТОРОВ И ФУНКЦИОНАЛОВ
причем || фд. | = | х |. Таким образом,
равенство (14.5.1) устанавливает взаимно
однозначное отображение всего пространства X во
V**
второе сопряженное пространство л с
сохранением нормы.
В частном случае, когда не только
каждому хе X соответствует функционал
фд. 6 X**, но и наоборот, каждому фе X**
соответствует некоторый элемент хе X (т.е.
когда (14.5.1) определяет взаимно
однозначное отображение X на все X**), можно
отождествлять второе сопряженное пространство
1/-** лг V"** V П
Л с л, л = л . В этом случае
пространство X называют рефлексивным.
Теорема 14.5.2. Пространство X*,
сопряженное с нормированным линейным
пространством X, полно, т.е. является В-прост-
ранством (независимо от того, полно или не
полно X).
Топологии в пространстве ограниченных
линейных операторов. В пространстве
В(Х, У) ограниченных линейных
операторов, отображающих нормированное линейное
пространство X в нормированное линейное
пространство У, естественная топология
определяется нормой. Однако эта топология
иногда оказывается чересчур сильной. Поэтому в
пространстве &(Х, У) обычно определяют
еще две топологии. Одна топология
определяется окрестностями нуля
{Г:|7х1|<е>...,||73с„|<е}> (14.5.2)
соответствующими всем е > 0, п и
Х\,..., хп е X . Вторая топология определяется
множеством линейных функционалов вида
/Г = gTx , где g — непрерывный линейный
функционал на пространстве У
Вторая топология в &(Х, У)
определяется окрестностями нуля
{У : | ft7Sc, | <е,...,|fe7Jc„|<e}, (14.5.3)
соответствующими всем е > 0, п ,
х{9...,хпеХ , g,,..., g„e У*.
Топология, определяемая нормой,
сильнее топологии, определяемой окрестностями
нуля (14.5.2), которая, в свою очередь,
сильнее топологии, определяемой окрестностями
нуля (14.5.3).
В соответствии с установленными
соотношениями между тремя топологиями в
пространстве операторов В(Х,У) топологию,
определяемую нормой, называют равномерной,
топологию, определяемую окрестностями
нуля (14.5.2), - сильной, а топологию,
определяемую окрестностями нуля (14.5.3), - слабой.
14.5.2. Сопряженные пространства
некоторых функциональных пространств.
Пусть В (Г), Т с Rn - пространство
ограниченных скалярных функций (см. п. 14.1.3)
Теорема 14.5.3. Любой непрерывный
линейный функционал на пространстве
ограниченных функций В (Г) определяется формулой
fie = \x(t)y(dt) = \xdq>, (14.5.4)
где Ц>(А) = f\A представляет собой
конечную аддитивную меру.
Теорема 14.5.4. Норма функционала,
определяемого формулой (14.5.4), равна значению
полной вариации аддитивной меры ф на всем
пространстве Т
Это соответствие между функционалами
/ и мерами ф взаимно однозначно. Это дает
основание отождествить пространство В* (Г)
непрерывных линейных функционалов,
сопряженное с В(Т), с пространством Ьа{Т)
конечных аддитивных мер, определенных на
а-алгебре всех множеств пространства Т.
Если сузить функционал / ,
определяемый формулой (14.5.4), на пространство
ограниченных непрерывных функций С (Г), то
взаимная однозначность соответствия между
функционалами / и мерами ф нарушается.
Поэтому для определения пространства
С (71), сопряженного с С(Т), необходимы
дополнительные исследования и определения.
Меру или аддитивную меру,
определенную на некотором классе множеств А
топологического пространства, содержащем
топологию, называют регулярной, если для любого
е > 0 и любого множества Ае А
существуют такие открытое множество G и замкнутое
множество F, что F с А с G и
И<7)-иИ|<е, |ц(Л)-ц(/=')|<е.
ОСНОВНЫЕ ПОНЯТИЯ И ТЕОРЕМЫ. СОПРЯЖЕННЫЕ ОПЕРАТОРЫ
565
Теорема 14.5.5. Каждому непрерывному
линейному функционалу f на пространстве
ограниченных непрерывных функций С (Г),
определенных на метрическом пространстве Т,
соответствует единственная регулярная
конечная аддитивная мера jLly на о-алгебре
множеств А, порожденной топологией компакта Т,
через которую f выражается формулой (14.5.4),
при ф(Л) = (Ну (А) и наоборот: каждой
регулярной конечной аддитивной мере \if на
О-алгебре Л соответствует единственный
непрерывный линейный функционал /,
определяемый формулой (14.5.4) при ф(Л) = \if (A) ,
причем норма функционала f равна значению
полной вариации аддитивной меры \if на Т
(теорема Рисса).
Пространства, сопряженные с
лебеговыми пространствами Lp, определяются
следующей теоремой.
Теорема 14.5.6. Любой непрерывный
линейный функционал на пространстве Lp (Т, Bf \i) ,
1 < р < ©о 9 выражается формулой
fic = jf(t)x(tMdt) = jficdn,
где f{t) - некоторая функция из
пространства Lq(T,B,\\), р~ + q~ =1, причем норма
этого функционала равна норме || /1| функции
f{t) в пространстве Lq (Т,В,\\).
Таким образом, между непрерывными
линейными функционалами на Lp и
элементами пространства Lq , p~ + q~ = 1 , 1 < р ,
q < ©о t существует взаимно однозначное
соответствие, сохраняющее норму. Это дает
основание отождествлять пространство L*p,
сопряженное с Lp, 1 < р < °« , с
пространством Lq .
Следствие. Пространство Lp, 1 < р < °°,
рефлексивно, поскольку второе сопряженное про-
г** Г* Г
странство Lp как сопряженное с Lp = Lq ,
р" +q~ - 1 , совпадает с Lp, L*p = Lp .
Глава 14.6
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
14.6.1. Основные понятия и теоремы.
Сопряженные операторы. Пусть Т -
оператор, отображающий топологическое линейное
пространство X в топологическое линейное
пространство Y, Z ~ X xY — прямое
произведение пространств X и Y. Множество пар
{{х, у} : у = 7х} называют графиком
оператора Т и обозначают Gr(T). Предположим,
что в произведении пространств Z = X х Y
обычным образом определена топология, в
которой каждая окрестность нуля W
представляет собой произведение некоторой
окрестности нуля U пространства X и некоторой
окрестности нуля V пространства Y.
W = U х V = {{х,у} :хеО,уеУ}.
График линейного оператора Т содержится в
некотором подпространстве пространства
Z = XxY, так как из [xk,yk}e Gr(T)
(k = 1,..., п) следует {с,х, 4-... 4- спхп ,
С\У\ +.-. + cnyn}eGr(T).
Оператор Т называют замкнутым, если
его график Gr(T) представляет собой
замкнутое множество в произведении пространств
Z = XxY .
Теорема 14.6.1. Если пространства X и Y
представляют собой Т\-пространства с первой
аксиомой счетности, то оператор Т замкнут
тогда и только тогда, когда из сходимости
последовательностей [хп] а X и {Тхп} с Y
следует, что х = lim хп е Dj и
у = lim Txn = 73с.
Если оператор Т замкнут и имеет
обратный оператор Т , то он также замкнут, так
как его график совпадает с графиком Т.
Теорема 14.6.2. Непрерывный оператор
замкнут тогда и только тогда, когда его
область определения замкнута.
Следствие. Непрерывный оператор,
определенный на всем пространстве, замкнут.
Если X и Y - ^-пространства, то
справедливо и обратное утверждение: замкнутый
оператор, определенный на всем пространстве,
непрерывен.
566
Глава 14.6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ
Если оператор Т не замкнут, но каждая
точка замыкания его графика [Gr(71)J
однозначно определяется первым элементом пары
{х,у}, т.е. когда из {хьу{}, {х2,Уг}^
6 [Gr(71)] , Х\ = *2 следует у\ = у2 , то
оператор Т может быть продолжен до замкнутого
оператора Т путем добавления к его графику
всех не принадлежащих ему его предельных
точек. Замкнутый оператор Т , полученный
таким путем, называют замыканием оператора Т.
Теорема 14.6.3. Если Т - непрерывный
линейный оператор, определенный на всем
пространстве Y, и функция f(x) ^-интегрируема,
то функция ф(х) = Tf{x) ц,-интегрируема и
А А А
Теорема 14.6.4. Если Т — замкнутый
линейный оператор с областью определения Dj,
отображающий сепарабельное В-пространство
Y в сепарабельное В-пространство Z , функция
f(x) имеет значения в Dj и функции f(x) и
(p(x) = T f(x) ^-интегрируемы, то
\fd\ie Dj и
А
jipd[i = JTfd[i = TJfdii.
А А А
Сопряженные операторы. Пусть Т —
линейный оператор, отображающий
топологическое линейное пространство X в
топологическое линейное пространство Y, X и Y —
пространства, сопряженные соответственно с
X и Y. Произведение оператора Т на
функционал g e Y* представляет собой
функционал / = gT в пространстве X.
Область определения этого функционала
совпадает с областью определения Dj
оператора Т. Если для каждого функционала g из
некоторого множества G с Y* в X*
существует единственный функционал / ,
совпадающий с gT на Dj , то наряду с
соответствием у = Тх линейный оператор Т ставит в
соответствие каждому линейному
функционалу geG определенный непрерывный
линейный функционал / б X . Линейный
оператор Т, отображающий X в Y, индуцирует в
этом случае некоторый оператор Т*,
отображающий сопряженное с Y пространство Y* в
сопряженное с ^пространство X*,
у = Тх, f = T*g.
Этот оператор Т* называют
сопряженным с оператором Т. Областью определения
D * сопряженного оператора Т* служит
множество G тех непрерывных линейных
функционалов g, для каждого из которых
функционал gT непрерывен, т.е.
принадлежит пространству X*, и в X* существует
единственный функционал / , совпадающий
с gT на Dj. Оператор Т имеет
сопряженный оператор тогда и только тогда, когда в
Y существуют функционалы g, каждому из
которых соответствует единственный
функционал / 6 X*, совпадающий с gT на Dj .
Таким образом, если существует
оператор Т*, сопряженный с данным линейным
оператором Т, то он определяется
соотношением
[T*g)x = g(Tx) при всех хе DT и ge D^ .
(14.6.1)
или символическим равенством T*g = gT .
Теорема 14.6.5 Если линейный оператор Т
отображает топологическое линейное
пространство X в топологическое линейное
пространство Y, а линейный оператор S
отображает Y в топологическое линейное
пространство Z и существуют сопряженные операторы
Т и S* и при этом Rj с D$,
D *R * ?t0, то и оператор ST,
отображающий X в Z, имеет сопряженный оператор,
который определяется соотношением
(ST)* = T*S*.
Теорема 14.6.6. Для того чтобы
непрерывный линейный оператор Т имел
сопряженный оператор Т*, необходимо и достаточно,
чтобы он был определен на всем пространстве
СПЕКТР ЛИНЕЙНОГО ОПЕРАТОРА
567
X, Dj = X . В этом случае сопряженный
оператор Т определен на всем пространстве Y .
Теорема 14.6.7. Если оператор Т не
непрерывен, то для существования сопряженного
оператора Т необходимо и достаточно,
чтобы область определения Dj оператора Т была
плотна в X, т.е. чтобы замыкание [Df]
области определения оператора Т совпадало с X,
[DT] = X.
Теорема 14.6.8. Сопряженный оператор
всегда замкнут.
Теорема 14.6.9. Если оператор Т
допускает замыкание и [Df] = X , то его замыкание
Т имеет сопряженный оператор Т*,
совпадающий с Т*.
Положительные операторы. Пусть X -
топологическое линейное пространство, X* -
соответствующее сопряженное пространство.
Линейный оператор Т, отображающий
пространство Хв сопряженное пространство X*,
называют положительным, если для любого
хеХ
(Тх)х > О.
Точно так же линейный оператор Т,
отображающий сопряженное пространство X* в X,
называют положительным, если для любого
функционала /е X*
fTf = f(Tf)>0.
Линейный оператор Т, отображающий
нормированное линейное пространство X в
сопряженное пространство X*, называют
положительно определенным, если
(73фс>ф|.
Изометрические операторы. Линейный
оператор V, определенный на всем
^-пространстве X и отображающий его на все
^-пространство Yc сохранением нормы,
|fr| = |jt|, хеХ, Ry=Y,
называют изометрическим.
Теорема 14.6.10. Изометрический
оператор У всегда имеет обратный оператор V~ ,
который также изометричен.
Теорема 14.6.11. Изометрический
оператор V имеет сопряженный оператор V*,
определенный на всем сопряженном с Y
пространстве Y*. Этот оператор также изометричен и
п'-п'-
Унитарные операторы. Линейный
оператор U , отображающий ^-пространство X на
то же пространство X с сохранением нормы,
Dv = Rv = X , I Ux I = I х I \fx , называют
унитарным. Иными словами, унитарным
называют изометрический оператор,
отображающий ^-пространство X на то же
пространство X.
Из общих свойств изометрических
операторов следует, что унитарный оператор U
ограничен, его норма равна единице,
| U | = 1 , и что существуют обратный
оператор U~ и сопряженный оператор U* ,
которые также унитарны, причем
Теорема Банаха — Штейнгауза.
Рассмотрим множество непрерывных (а
следовательно, и ограниченных по теореме 14.4.32)
операторов [Та}, отображающих iJ-пространство
X в Б-пространстро Y и определенных на
всем пространстве X.
Теорема 14.6.12. Если множество {Тах}
ограничено при каждом хе X , то множество
норм Ц| Та ||} операторов Та ограничено
(теорема Банаха - Штейнгауза).
Следствие 1. Если последовательность
{Тпх} сходится при каждом хе X,
Тпх —> Тх , то предельный оператор Т
является ограниченным линейным оператором.
Следствие 2. Любая слабо сходящаяся
последовательность в нормированном линейном
пространстве ограничена.
Следствие 3. Сопряженное с
рефлексивным В-пространством X пространство
непрерывных линейных функционалов X слабо полно.
14.6.2. Спектр линейного оператора.
Собственные значения. В теории линейных
операторов большую роль играет уравнение
Тх - Хх = у , (14.6.2)
где Т - линейный оператор, отображающий
топологическое линейное пространство X в
568
Глава 14.6. ЛИНЕЙНЫЕ ОПЕРАТОРЫ
себя, X - комплексный параметр, у -
данный элемент пространства X, х —
неизвестный элемент того же пространства, и
соответствующее однородное уравнение,
получающееся из (14.6.2) при у = О :
Тх = Хх. (14.6.3)
Значения параметра X, при которых
уравнение (14.6.3) имеет отличное от нуля
решение х Ф О , называют собственными
значениями оператора Т. Соответствующие
собственному значению решения уравнения
(14.6.3) называют собственными векторами
оператора Т.
Если одному собственному значению X
соответствует множество линейно
независимых собственных векторов [ха] , то линейная
оболочка этих векторов, т.е. множество всех
их конечных линейных комбинаций, называют
собственным подпространством оператора Т,
соответствующим собственному значению X .
Очевидно, что любой элемент
собственного подпространства является собственным
вектором, соответствующим данному
собственному значению X.
Теорема 14.6.13. Если X — собственное
значение оператора Т, то уравнение (14.6.2) не
имеет однозначного решения.
Резольвента и спектр оператора. Если
при данном значении X существует обратный
оператор
RX = (T-Xiyl,
то его называют резольвентой оператора Т.
Областью определения резольвенты R^
служит область значений оператора Т -XI,
которую обычно обозначают R^(X) , чтобы в
явной форме указать ее зависимость от X .
Значения параметра X, при которых
существует определенная на всем
пространстве X непрерывная резольвента R^, называют
регулярными точками оператора Т. Множество
регулярных точек оператора Т называют
резольвентным множеством и обозначают р (Т).
Множество значений X, при которых
резольвента не существует или существует, но
не является непрерывной или определена не
на всем пространстве X, называют спектром
оператора Г и обозначают о (Г), а все
значения X, принадлежащие спектру, называют
точками спектра.
Множество собственных значений
оператора Т называют точечным спектром Т и
обозначают ор(Т). Для точек Хеор(Т)
резольвента не существует.
Множество точек спектра оператора Т,
для которых резольвента существует и
определена на плотном в X множестве, т.е.
Rt(X) * X , [ЛуМ] = X , называют
непрерывным спектром Т и обозначают ос (Г) .
Множество точек спектра оператора Т,
для которых резольвента существует, но ее
область определения не плотна в X, т.е.
[/fyW] * X , называют остаточным
спектром Т и обозначают аг (71).
Резольвенты оператора Т,
соответствующие двум различным регулярным точкам
X и ц,, связаны соотношением Гильберта
Rx-R^ = (X-ii)R^Rx.
Теорема 14.6.14. Любой оператор
коммутативен со своей резольвентой в каждой
регулярной точке.
Теорема 14.6.15. Оператор S
коммутативен с оператором Т тогда и только тогда,
когда он коммутативен с его резольвентой в
каждой регулярной точке.
Свойства спектра.
Теорема 14.6.16. Спектр ограниченного
линейного оператора Т, определенного на всем
В-пространстве X, целиком расположен в
замкнутом круге радиуса \Т\ с центром в
нуле.
Теорема 14.6.17. Спектр линейного
оператора Т представляет собой замкнутое
множество.
Теорема 14.6.18. Если X и х —
собственное значение и соответствующий собственный
вектор унитарного оператора Uf то Х = Х~ и
х — собственное значение и соответствующий
собственный вектор обратного оператора U~ .
Теорема 14.6.19. Спектр унитарного
оператора расположен целиком на окружности
ЛИНЕЙНЫЕ ОПЕРАТОРЫ В ГИЛЬБЕРТОВЫХ ПРОСТРАНСТВАХ
569
Глава 14.7
ГИЛЬБЕРТОВЫ ПРОСТРАНСТВА
14.7.1. Ортогональные
подпространства. Ортогональные дополнения. Теорема
Рисса. В теории //-пространств
рассматриваются только замкнутые подпространства.
Таким образом, все подпространства
//-пространства являются Я-пространствам и.
Подпространства G\ и G2
//-пространства X называют ортогональными, если любой
вектор Х| 6 G[ ортогонален любому вектору
x2eG2, {xhx2) = 0.
Ортогональной суммой ортогональных
подпространств G\ , G2 называют множество
векторов хе X , представимых в виде
х = Xj + х2 , Xj e <7i , x2e G2.
Ортогональную сумму подпространств G[ и G2
обозначают G\®G2. Ортогональная сумма
подпространств, очевидно, тоже представляет собой
подпространство. Каждое из подпространств
G\ и G2 называют ортогональной разностью
подпространства G = G\ Ф G2 и G2 или <7j
соответственно, <7j = G © G2 , G2 = G © (7j .
Ортогональным дополнением
подпространства G в //-пространстве X называют
множество всех векторов х е X ,
ортогональных G, (х, у) = О для всех ye G .
Ортогональное дополнение G в X обозначают G1
или X © (7 . Очевидно, что ортогональное
дополнение подпространства тоже является
подпространством.
Теорема 14.7.1. Для любой тонки х, не
принадлежащей подпространству G Н-про-
странства X, в G существует точка у$ ,
расстояние которой от х равно расстоянию х от
(7, причем уо является проекцией х на (7, а
вектор z = х - у$ ортогонален
подпространству G:
(х ~ Уо>У) = О для всех yeG.
Следствие 1. Любой вектор Н-простран-
ства X может быть однозначно представлен в
виде суммы х = у + z , где у — проекция
вектора х на любое подпространство G
пространства X, yeG, a zeG1.
Следствие 2. Любое Н-пространство X
есть ортогональная сумма любого своего
подпространства G с X и ортогонального
дополнения этого подпространства X = G Ф G■ .
Общий вид непрерывного линейного
функционала в //-пространстве устанавливает
следующая теорема.
Теорема 14.7.2. Любому непрерывному
линейному функционалу f е X в
Н-пространстве X соответствует единственный вектор
Хг б Df , такой, что fx = \х,хА при всех
х и II Xf II = | /1 (теорема Рисса).
Установленное взаимно однозначное
соответствие между элементами //-пространства
X и его сопряженного пространства X* с
сохранением нормы дает основание
отождествлять пространства, сопряженные с
//-пространствами, с соответствующими
//-пространствами. Поэтому везде в дальнейшем мы
будем считать X* = X и писать / вместо Xj-.
Это соглашение вполне соответствует общему
определению сопряженного пространства,
данному в п. 14.5.1, в случае действительного
//-пространства, так как в этом случае
скалярное произведение линейно как по первому
множителю, так и по второму. Однако в
случае комплексного //-пространства скалярное
произведение сопряженно линейно по
второму множителю, и это соглашение представляет
собой отход от общей теории, который ведет
к другому, отличному от общего, определению
сопряженного оператора в теории
//-пространств. Чтобы остаться в рамках общей
теории, надо принять fx = (х, Vf), где V -
сопряженно линейный изометрический
оператор, устанавливающий взаимно однозначное
соответствие между пространствами X и X.
Формула Рисса /х = (*,*/) дает
единственное продолжение непрерывного
линейного функционала, заданного на некотором
подпространстве, на все //-пространство с
сохранением нормы.
14.7.2. Линейные операторы в
гильбертовых пространствах. Гильбертовы
сопряженные операторы. В силу теоремы
Рисса в //-пространстве оператор Т ,
сопряженный с оператором Г, определяется
формулой
(x,T*g) = (Tx,g). (14.7.1)
570
Глава 14.7. ГИЛЬБЕРТОВЫ ПРОСТРАНСТВА
В случае ограниченного Г оператор Т*
определен на всем пространстве Y В случае
неограниченного Т с плотной в X областью
определения область определения оператора
Т* в пространстве Y служит множество G
векторов g 6 Y, для каждого из которых
существует такой вектор / е X , что ядро
линейного функционала h = {/,#} на
произведении пространств Z = X х Y содержит
график Gr (Т) оператора Т, преобразованный
оператором U , U{x,y\ = {х, -у], и при этом
T*g = f.
В случае комплексного //-пространства
X определение сопряженного оператора
(14.7.1) отличается от общего определения
(14.6.1). Формула (14.6.1) определяет Т* как
линейную функцию оператора Т, а формула
(14.7.1) — как сопряженно линейную
функцию Т. Оператор 7]*, сопряженный с
оператором Тв смысле определения (15.6.1),
следует определить формулой
(х,1Т1*я) = (Яс,И£,).
где V — сопряженно линейный изометрический
оператор, отображающий X* на X, a W —
сопряженно линейный изометрический
оператор, отображающий Y* на Y Чтобы
подчеркнуть отличие оператора Т* = VT\W~ ,
определяемого формулой (14.7.1), от
сопряженного оператора Т\ , даваемого общей
теорией, оператор Т* называют гильбертовым
сопряженным с оператором Т. Имея в виду,что
в теории //-пространств рассматриваются
только гильбертовы сопряженные операторы,
их называют для краткости просто
сопряженными.
Теорема 14.7.3. Если Т - замкнутый
оператор, то второй сопряженный оператор Т
существует и совпадает с Т, Т = Т. Из
тождества
(*.y)=j{\*+yf-\*-yf +
+i\x + iyf-i\x-iyf],
справедливого для любых векторов х, у
Я-пространства, непосредственно следует, что
линейный оператор, отображающий
//-пространство Хв //-пространство Yc сохранением
нормы, сохраняет и скалярное произведение
(Vx, Vy) = (х, у) для всех х, у е X .
Следовательно, изометрические и унитарные
операторы в //-пространствах сохраняют
скалярные произведения.
Оператор V*, сопряженный с
изометрическим оператором V, в //-пространствах
совпадает с обратным оператором V* = V~ .
14.7.3. Самосопряженные и
симметричные операторы. Линейный оператор А,
отображающий //-пространство X в X,
называют самосопряженным, если он совпадает со
своим сопряженным, А = А*. Из этого
определения следует, что оператор А является
самосопряженным тогда и только тогда, когда:
1) существует сопряженный оператор А* ;
2) область определения сопряженного
оператора А* совпадает с областью
определения оператора A, D * = DA ;
3) А*х = Ах при всех х е DA .
Если выполнены только первое и третье из
этих условий, то оператор А называют
симметричным.
Так как по теореме 14.6.8 сопряженный
оператор любого линейного оператора
замкнут, то самосопряженный оператор всегда
замкнут.
Если самосопряженный оператор А
ограничен, то он определен на всем
пространстве, DA = X (теорема 14.6.6). Наоборот,
если самосопряженный оператор А определен
на всем пространстве, DA = X , то он
ограничен.
Область определения неограниченного
самосопряженного оператора на основании
теоремы 14.6.7 плотна в X.
Теорема 14.7.4. Если самосопряженный
оператор А ограничен, то его норма
определяется формулой
и .. |(Ак,х)|
Hl=supnri^-
1*1
Теорема 14.7.5. Все собственные значения
самосопряженного оператора действительны.
Теорема 14.7.6. Собственные векторы
самосопряженного оператора,
соответствующие различным собственным значениям,
ортогональны.
ПОСЛЕДОВАТЕЛЬНОСТИ ВЕКТОРОВ И БАЗИСЫ. РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 571
Следствие. Спектр самосопряженного
оператора расположен целиком на
действительной оси.
14.7.4. Операторы ортогонального
проектирования. Общее определение
проектора. Оператор Р, сопоставляющий
каждому вектору хе X его проекцию и на G,
и = Рх, называют оператором проектирования
на G или, коротко, проектором на G Если
хотят подчеркнуть, что речь идет об
ортогональном проектировании, т.е. о нахождении
такого вектора и е G , что (и, х - и) = О, то
оператор Р называют ортопроектором на G В
дальнейшем мы будем рассматривать
преимущественно ортопроекторы, и поэтому, не
опасаясь неточностей, можем называть их
просто проекторами.
Очевидно, что проектор Р представляет
собой ограниченный линейный оператор, и
его норма равна единице.
Из того, что Рх е G для любого х е X
и Ру - у для любого yeG, следует, что
Р х = Рх для любого х е X . Это значит,
что Р - Р и вообще Рп = Р при любом
натуральном п. Операторы, обладающие
таким свойством, называют идемпотентными.
Таким образом, любой проектор представляет
собой идемпотентный оператор.
Кроме того, любой проектор является
положительным самосопряженным
оператором.
Теорема 14.7.7. Любой идемпотентный
самосопряженный линейный оператор Р
является проектором.
Теорема 14.7.8. Если Р\ и Р2 —
проекторы на подпространства G\ и (72
соответственно, то произведение Р\Р2 представляет
собой проектор тогда и только тогда, когда
Р\ и Р2 перестановочны, P\Pj = PjP\ • В этом
случае P\Pi есть проектор на подпространство
<7 = С,Р|<72.
Теорема 14.7.9. Если Р\ и Р^ —
проекторы на подпространства G\ и С?2
соответственно, то сумма Р\ + /^ является
проектором тогда и только тогда, когда
подпространства G\ и С?2 ортогональны. В этом случае
Р = Р\ + /*2 есть проектор на ортогональную
сумму G = G\ Ф С?2 подпространств G\ и Gi •
Следствие. Если Р[,...,Рп - проекторы
на подпространства Gi,...,Gn соответственно,
п
то Р = 2_j^k ~ проектор тогда и только
тогда, когда G\,...,Gn попарно ортогональны.
В этом случае Р — проектор на ортогональную
п
сумму G = ©С/£ подпространств G\,...,Gn.
*=1
Теорема 14.7.10. Если Pj и /^ -
проекторы на подпространства G\ и (72
соответственно, то разность Р = Р\ - /^ является
проектором тогда и только тогда, когда
С?2 с С7| . В этом случае Р — проектор на
ортогональное дополнение G = С7| © С?2
подпространства (72 в С7|.
Теорема 14.7.11. Если последовательность
{Рп} слабо сходится к проектору Р, то она
сходится к Р.
Теорема 14.7.12. Всякая монотонная
последовательность проекторов [Рп] сходится к
проектору Р на подпространство G = \\mGn
(\jGfj в случае возрастающей {(/„} и \\Gn
в случае убывающей [Gn] ).
В общем случае, когда в пространстве
понятия ортогональности нет, как, например,
при проектировании точки произведений
пространств на одно из этих пространств,
возникает необходимость дать общее
определение проектора, свободное от требования
ортогональности.
Оператором проектирования или, коротко,
проектором в любом линейном пространстве
X называют любой не нулевой
идемпотентный линейный оператор.
14.7.5. Последовательности векторов
и базисы. Разложение функций в ряды.
Пусть [хк] - любая последовательность
векторов в Я-пространстве X. Без потери
общности можно считать эти векторы линейно
независимыми.
Обозначим через Gn подпространство,
образованное первыми п векторами нашей
последовательности Х\,..., хп . По следствию
1 теоремы 14.7.1 любой вектор хе X может
быть однозначно представлен в виде суммы
572
Глава 14.7. ГИЛЬБЕРТОВЫ ПРОСТРАНСТВА
п
x = y£a(k")xk+zn, (14.7.2)
к=\
где zneG£.
В приложениях удобно пользоваться
ортогональными последовательностями
векторов.
Последовательность векторов {хк}
называют ортогональной, если все векторы этой
последовательности попарно ортогональны,
(хр,хЛ = 0 при р Ф q . Последовательность
векторов [хк] называют ортонормальной,
если она ортогональна и нормы всех ее
векторов равны единице (хр,хд) = 6^ .
Теорема 14.7.13. Любую
последовательность линейно независимых векторов [ик]
можно ортонормировать, а именно заменить
такой ортонормальной последовательностью
{xjt), что каждый вектор ип будет линейной
комбинацией векторов Х\,..., хп .
В случае ортонормальной
последовательности векторов формула (14.7.2)
принимает вид
п
k=\
и при этом справедливо неравенство Бесселя
\*f-i\(*.**)\2+\ь( ■
k=l
Полные последовательности векторов и
базисы. Последовательность векторов {хк}
называют полной, если в А" не существует
вектора, ортогонального ко всем векторам этой
последовательности.
В этом случае любой вектор х
//-пространства X выражается разложением
x = ^(x,xk)xk (14.7.3)
k=\
и
М2 = Х1(*.**)|2- <14-7-4)
к=\
Это равенство обычно называют
равенством Парсеваля.
Теорема 14.7.14. Если [хк] — полная
ортонормальная последовательность векторов в
Н-пространстве X, то любой вектор х е X
представим разложением (14.7.3) и при этом
справедливо равенство Парсеваля (14.7.4).
Пусть х, у — два вектора Н-пространства
Х> {хп} ~~ полная ортонормальная
последовательность векторов. Представив х, у
разложениями (14.7.3), получаем следующую формулу
для скалярного произведения векторов х, у:
(х>У) = У£(х>хк)(*к>У)-
k=\
В связи с разложениями (14.7.3)
возникает понятие базиса пространства.
Последовательность векторов {хк}
топологического линейного пространства X
называют базисом, если любой вектор х е X
однозначно выражается разложением
х = Zjakxk >
к=\
сходящимся в топологии этого пространства.
Таким образом, любая полная
ортогональная последовательность векторов в
//-пространстве А" представляет собой базис.
Теорема 14.7.15. Базис в Н-пространстве
существует тогда и только тогда, когда оно
сепарабельно.
Разложение функций в ряды. Из этой
общей теории вытекают разложения
различных функций по ортогональным или орто-
нормальным системам функций.
Рассмотрим Я-пространство /^ (Т)
функций с интегрируемым квадратом модуля
по мере Лебега по области Т. Пусть {х„(0} -
полная ортонормальная последовательность
функций в Li (T),
jTxn(0xm(t)dt = bnm.
Из общей теории следует, что любая
функция x(t) е Lq (T) может быть
представлена рядом (14.7.3):
к=\
где
<** ={х,хк) = jx(t)xk(t)dt (A: = 1,2,...).
т
ПОСЛЕДОВАТЕЛЬНОСТИ ВЕКТОРОВ И БАЗИСЫ. РАЗЛОЖЕНИЕ ФУНКЦИЙ В РЯДЫ 573
Ряд (14.7.5) сходится к x(t) по норме
пространства Lq (Т) (т.е. в среднем квадрати-
ческом):
*(0-£<**** (О
к=\
dt^O
при п —> оо . Норма остаточного члена ряда
(14.7.5) может быть оценена по формуле
ы2=|
т
*(0-£а*х*(0
к=\
dt =
-jl^)l2*-xi^r-
Т к=\
Теорема 14.7.16. Если не равная почти
всюду нулю функция ф(/) убывает при
| /1 —> ©о быстрее, чем показательная функция
е ' ', а > 0 , то последовательность функций
tky(t) (к = 0,1, 2,...) полна в L2 (R).
Биортогональные и биортонормальные
последовательности. Последовательность пар
векторов {*£,>>£} называют биортогоиальной,
если (xkiyj) = 0 при всех к,1,к ф\.
Последовательность пар векторов {я^,.^}
называют биортонормальной, если (Х/С,У/) = Ъ/С/ при
всех к, I.
Теорема 14.7.17. Для любой
последовательности линейно независимых векторов [хк]
существует такая последовательность линейно
независимых векторов [ук], что
последовательность пар {xkiyk} биортоиормальна.
Если последовательность [хк] полна, то
последовательность [ук] единственна.
Теорема 14.7.18. Если А —
положительный самосопряженный оператор,
отображающий взаимно однозначно все Н-пространство X
на все X, и (Ахк, хк) —> 0 только при
хк —> 0, то из любой последовательности
векторов можно получить такую
последовательность {хк}, что последовательность пар
{х/с,У/с} у Уk = А*к » будет биортонормальной.
Пусть {х^,}^} — биортонормальная
последовательность пар векторов.
Теорема 14.7.19. Если существует
оператор А, удовлетворяющий условиям теоремы
14.7.18, и ук = Ахк (к = 1, 2,...), то
последовательность [хк] полна в пространстве X со
скалярным произведением {х,у)А тогда и
только тогда, когда она полна в X со
скалярным произведением (х,у). При этом
последовательность векторов (ук), ук = Ахк , также
полна.
Теорема 14.7.20. Если существует такой
оператор А, удовлетворяющий условиям
теоремы 14.7.18, что yk-Axk (k = 1, 2,...) и
последовательность векторов {хк} полна, то
любой вектор х Н-пространства X может
быть представлен разложением
* = Х(*.Л)**
к=\
и при этом
Ах = У£,(х>Ук)Ук> А1у = У£(у,хк)хк
к=[
к=[
Компактные операторы. Оператор Т,
отображающий топологическое пространство X в
топологическое пространство У, называют
компактным, если определяемый им образ
ТМ любого ограниченного множества М
п редком пактен.
Непрерывный компактный оператор
называют вполне непрерывным.
В частном случае, когда Y —
/^-пространство с первой аксиомой счетности,
оператор Т компактен тогда и только тогда, когда
определяемый им образ {Тхп} любой
ограниченной последовательности [хп] содержит
сходящуюся подпоследовательность (теоремы
14.4.11 и 14.4.19)*.
Теорема 14.7.21. Компактный линейный
оператор, отображающий В-пространство X в
В-пространство У, ограничен, а следовательно,
и непрерывен.
* Если множество предкомпактно, то предел
содержащейся в нем сходящейся последовательности
может не принадлежать этому множеству.
574
Глава 14.7. ГИЛЬБЕРТОВЫ ПРОСТРАНСТВА
Таким образом, для линейных
операторов в ^-пространствах понятия компактности
и полной непрерывности совпадают.
Компактный линейный оператор Т,
отображающий рефлексивное ^-пространство У,
определен на всем пространстве X, имеет
ограниченный сопряженный оператор Т*,
определенный на всем пространстве X*, и
|Г|«|Г|.
Компактный линейный оператор
замкнут как ограниченный линейный оператор,
определенный на всем пространстве.
Теорема 14.7.22. Если S — непрерывный
оператор, отображающий В-пространство X в
В-пространство У, а Т — компактный
оператор, отображающий У в В-пространство Z,
то оператор TS, отображающий X в Z,
компактен.
Теорема 14.7.23. Если Т — компактный
оператор, отображающий В-пространство X в
В-пространство У, a S — непрерывный
оператор, отображающий У в В-пространство Z,
то оператор ST, отображающий X в Z,
компактен.
Теорема 14.7.24. Если линейный оператор
Т, отображающий Н-пространство в другое
Н-пространство, ограничен, а оператор Т*Т
компактен, то оператор Т компактен.
Следствие. Компактный линейный
оператор, отображающий одно Н-пространство в
другое, имеет компактный сопряженный
оператор.
Спектр компактного оператора Т
представляет собой конечное или счетное
множество собственных значений, и единственной
точкой спектра, не являющейся собственным
значением, может быть только 0.
Собственное значение называют
простым, если ему соответствует одномерное
собственное подпространство, и т-кратным,
если ему соответствует /я-мерное собственное
под п ространство.
Собственные значения компактного
оператора нумеруются в порядке
невозрастания их модулей, причем /я-кратное
собственное значение принимается за т совпадающих
значений.
Нормальные операторы. Линейный
оператор Т, действующий в //"-пространстве,
называют нормальным, если он
перестановочен со своим сопряженным оператором,
ТТ* = Т*Т. Самосопряженные и унитарные
операторы представляют собой частные виды
нормальных операторов.
Теорема 14.7.25. Нормальный оператор Т
в сепарабельном Н-пространстве и его
сопряженный оператор Т* имеют одну и ту же
ортонормальную систему собственных векторов.
Операторы Гильберта - Шмидта. Пусть
X = L2(A,A,\i), Y = Li{S,B,\) - два
пространства числовых функций, заданных на
пространствах с неотрицательной мерой
(A,w4,|i) и (S,#,|i) соответственно.
Рассмотрим интегральный оператор
K = JK(s,t)x(tMdt),
отображающий X в Y, с ядром K(s, t),
удовлетворяющим условию
\\\K(s,t\2\i(dt)v(ds) <оо
(K(s,t)s £2(Дх5,.Ах#,цху)).
Если меры \i и v таковы, что
пространства X и Y сепарабельны, то оператор Т
называют оператором Гильберта — Шмидта.
Оператор Гильберта — Шмидта
компактен.
В частном случае совпадающих
пространств X и У оператор Гильберта - Шмидта,
как и всякий компактный оператор, имеет
спектр, состоящий не более чем из счетного
множества собственных значений и точки 0.
Мы будем рассматривать случай нормального
оператора Гильберта — Шмидта, имеющего
счетное множество собственных значений
{Хп} и соответствующее множество
собственных векторов {xn(t)}, представляющее
собой ортонормальный базис.
Характерной особенностью операторов
Гильберта — Шмидта, действующих в
пространствах Li, является сходимость ряда,
членами которого служат квадраты модулей
собственных значений.
Эта особенность операторов Гильберта —
Шмидта дает основание для обобщения
понятия оператора Гильберта — Шмидта.
Компактный оператор, действующий в
сепарабельном //-пространстве, называют
оператором Гильберта — Шмидта, если ряд, членами
которого служат квадраты модулей его
собственных значений, сходится.
Ядерные операторы. Компактный
оператор Г, действующий в сепарабельном
//-пространстве, называют ядерным или оператором
со следом, если ряд, членами которого служат
его собственные значения, абсолютно сходит-
ОПЕРАТОРНАЯ МЕРА. ИНТЕГРАЛЫ ПО ОПЕРАТОРНОЙ МЕРЕ
575
ся. Сумму этого ряда называют следом
оператора Г и обозначают
л=1
Теорема 14.7.26. След нормального
ядерного оператора Т определяется формулой
оо
tiT = y£(Tun,un), (14.7.6)
л=1
где [ип] — произвольный ортонормальный базис
вХ.
Формула (14.7.6) дает возможность легко
вывести следующие свойства ядерных
операторов и их следов:
1) след является линейной функцией
оператора:
к=\ k=i
для любых ядерных операторов 7\,..., Тп и
любых чисел q,..., сп ;
2) tr Т* = trT ;
3) Если Т — ядерный оператор, а А —
ограниченный оператор, действующий в X, то
AT и ТА — ядерные операторы, и
trAT = trTA, причем | trAT\ = \ trTA\ <
<IMI|trr|.
Интересно заметить, что операторы AT
и ТА могут быть ядерными и в случае
неограниченного оператора А. Все зависит от
быстроты убывания модулей собственных
значений оператора Т
Глава 14.8
СПЕКТРАЛЬНАЯ ТЕОРИЯ
ЛИНЕЙНЫХ ОПЕРАТОРОВ
14.8.1. Спектральные разложения
компактных самосопряженных и
нормальных операторов.
Теорема 14.8.1. Любой компактный
самосопряженный оператор имеет по меньшей мере
одно собственное значение.
Следствие 1. Наибольший из модулей
собственных значений компактного
самосопряженного оператора А равен его норме
1Ч„ах = 1И|.
Следствие 2. Наибольший из модулей
собственных значений компактного
самосопряженного оператора А равен максимуму функционала
\(Ax,x)\/lxf:
I Uax |х|2
а вектор х, для которого этот максимум
достигается, является соответствующим
собственным вектором.
Суживая оператор А после нахождения
каждого последующего собственного значения
на ортогональное дополнение
подпространства, образованного уже найденными
собственными векторами, построим процесс
последовательного нахождения собственных значений
оператора А в порядке невозрастания их
модулей и соответствующих ортонормальных
собственных векторов. Если X — сепарабельное
пространство и система собственных векторов
[хп] , то справедлива следующая теорема.
Теорема 14.8.2. Любой компактный
самосопряженный оператор имеет непустое
конечное или счетное множество действительных
собственных значений, и при этом для любого
х е X справедливы разложения
А* = ^хк{х>хк)хк > *0G #~,
оо
Ах = ^^к(х>хк)хк' (14.8.1)
k=i
Формула (14.8.1) дает спектральное
разложение компактного самосопряженного
оператора. Она показывает, что такой оператор
полностью определяется своим спектром и
соответствующим множеством собственных
подпространств.
Аналогичная теорема справедлива для
компактных нормальных операторов.
Теорема 14.8.3. Любой компактный
нормальный оператор Т имеет конечное или счетное
множество собственных значений {Хп} и [хп] ,
и для него справедливо разложение (14.8.1).
14.8.2. Операторная мера. Интегралы
по операторной мере и определяемые ими
операторы. Общая спектральная теория
линейных операторов основана на понятии
интеграла по операторной мере.
Пусть (А,А) — произвольное
измеримое пространство Определим на а-алгебре
576
Глава 14.8. СПЕКТРАЛЬНАЯ ТЕОРИЯ ЛИНЕЙНЫХ ОПЕРАТОРОВ
Л операторную функцию множества Е(А),
обладающую свойствами:
1) значение Е(А) на любом множестве
А е Л представляет собой проектор на
некоторое подпространство Gд //-пространства Х\
2) £(0) = О, Е(А) = 1;
3)если АаВ, А,ВеА,то Е(А)<
<Е(В) (т.е. (Е(А)х,х)<(Е(В)х,х) при
всех х);
4) для любых попарно
непересекающихся множеств А±,..., Ап е Л
( п
k=i
\jAk\=^E(Ak),
к=\
т.е. функция Е[А) аддитивна;
5) Е(А)Е(В) = Е(В)Е(А) = Е(АВ)
для любых А, В е Л .
Операторную функцию множества
Е(А), обладающую этими свойствами,
называют разложением единицы.
На основании общих теорем 14.7.8—
14.7.10 о проекторах второе свойство
разложения единицы означает, что Е(0)
представляет собой проектор в точку 0, G& = 0 , а
Е[А) — проектор на все пространство X,
<7д = X. Третье свойство означает, что
GAczGfi для любых множеств А,ВеА,
А с В. Четвертое свойство означает, что
подпространства GA ,..., GA ,
соответствующие попарно непересекающимся множествам
А[,...,Апе Л , ортогональны, и подпростран-
п
ство GA , А = М Ак представляет собой ор-
к=[
тогональную сумму подпространств
Gav...,Ga . В частности, отсюда следует
gA®ga=X и Е(А) + Е(А) = 1 для
любого А е Л. Пятое свойство означает, что
GAB = Ga(\Gb -аля любых множеств
А,ВеА.
Из теоремы 14.7.12 о монотонных
последовательностях проекторов вытекает
непрерывность функции Е(А) — для любой
монотонной последовательности множеств
{А„} с Л , А = lim An .
МтЕ(Ап)х = E(\im An)x = Е(А)х
для всех х.
Из аддитивности и непрерывности
разложения единицы вытекает его о-аддитивность.
Таким образом, разложение единицы
Е(А) представляет собой операторную меру,
т.е. меру со значениями в пространстве
ограниченных линейных операторов В(Х).
В соответствии с общим определением
(14.3.3) интеграл от простой функции
п
ф(') = Х**14ь(0,
к=[
где а[,...,ап —любые комплексные числа, а
Ai,...,An — любые попарно
непересекающиеся измеримые множества, по операторной
мере Е по множеству As Л определяется
формулой
j ф)Е(Л) = \ydE = ^akE{AAk).
А А к=[
В частности, интеграл по всему пространству
А получается при А = А и пишется без
указания области интегрирования
\W)E{dt) = UdE = ^акЕ(Ак). (14.8.2)
k=l
Очевидно, что интеграл (14.8.2)
представляет собой ограниченный линейный
оператор
к=\
причем
lix(A) = (E(A)x,x) = lE(A)xf.
Сопряженный оператор Т*
определяется формулой
Г = ^акЕ(Ак)=Ы<1Е.
к=1
ФУНКЦИИ ОТ ОПЕРАТОРОВ
577
Интеграл по операторной мере Е от
измеримой числовой функции ф(/) определяют
обычным путем. Строят последовательность
простых функций, сходящуюся почти всюду
(относительно Е) к ф(/) и интеграл
T = j(p(t)E(dt)=tq>dE
определяют как предел в Z,2 (Д> А М-л:)
последовательности интегралов от простых функций.
Областью определения оператора Т
служит множество векторов
Дг={*:||ф|2Ф,<~}-
Теорема 14.8.4. Оператор Т,
определяемый разложением единицы Е, ограничен тогда и
только тогда, когда функция ф(/) ограничена
почти всюду относительно меры Е, т.е. когда
существует такое число с > О,
4moE({t:\(p(t)\>c}) = 0.
Теорема 14.8.5. Оператор, сопряженный с
оператором Т. определяемым разложением
единицы, существует тогда и только тогда, когда
функция ф(/) почти всюду конечна
относительно меры Е,
Нт£({/:|ф(0|>я}) = 0,
и при этом он определяется формулой
Т* =j^t)E(dt) = j^dE.
Теорема 14.8.6. Для того чтобы оператор
Т, определяемый разложением единицы, имел
обратный, необходимо и достаточно, чтобы
функции ф(/) и 1/ф(0 были почти всюду
конечны относительно операторной меры Е. В
этом случае
т-1 = [ШИ=[?1
J Ф(о J ф '
Резольвента R^ оператора Т с плотной
областью определения, определяемого
разложением единицы, выражается формулой
dE с E(dt)
*=<r-">~W^-J
ф(0-ь
14.8.3. Функции от операторов. Для
любого оператора Т естественно
определяются степени и полиномы от Т, а для
ограниченного Т — и функции, определяемые
сходящимися степенными рядами. Для
спектральной теории особое значение имеют функции
от унитарных и самосопряженных операторов.
При этом обнаруживаются
определенные соответствия между
тригонометрическими полиномами р{еь), 5€[0,2л] и
полиномами от унитарного оператора p(U):
p(eb)~p(U), p(eis)~p{U)\
Pl(eis) + p2(eis)~pl(U) + P2(U),
Pl(eis)P2(eis)~Pi(U)p2(U),
Pl(eis)<p2(eis)~Pl(U)<p2(U),
p(eb)<c-\p(U)[<c, (14.8.3)
где знак соответствия.
Пользуясь теоремой Вейерштрасса о
приближении непрерывной функции
полиномами, можно определить функции от
унитарного оператора U для функций класса Cq
действительных ограниченных функций
переменной els , каждая из которых или
непрерывна, или представляет собой предел невоз-
растающей последовательности непрерывных
функций (любую функцию этого класса
можно представить как предел невозрастающей
последовательности тригонометрических
полиномов), а затем и для линейных
комбинаций функций класса Cq и С сохраняются те
же соответствия (14.8.3), что и для полиномов.
Перейдем к функциям от
самосопряженного оператора А. Это можно сделать с
помощью преобразования Кэли, которое
ставит в соответствие любому самосопряженному
оператору А унитарный оператор
U = (A-iI)(A + iI)~{. (14.8.4)
Обращение этой формулы дает
A = i(I + U)(I-U)
-I
(14.8.5)
Формулы (14.8.4) и (14.8.5)
устанавливают взаимно однозначное соответствие между
оператором А и его преобразованием Кэли -
унитарным оператором U. Каждому
самосопряженному оператору А соответствует
унитарный оператор U, определяемый формулой
(14.8.4).
19 — 7706
578
Глава 14.8. СПЕКТРАЛЬНАЯ ТЕОРИЯ ЛИНЕЙНЫХ ОПЕРАТОРОВ
Наоборот, каждому унитарному
оператору U, для которого 1 не является
собственным значением, соответствует
самосопряженный оператор А, определяемый формулой
(14.8.5).
Соответствующая обратимая замена
переменных
**=(/-!■)/(' + /), /б Л,
t = i(\ + eis)/{l-eis), se [0,2л],
устанавливает взаимно однозначное
соответствие между функциями класса С
переменной / и функциями того же класса
переменной e,s .
Все эти соответствия определяют
функции класса С от самосопряженного
оператора А с сохранением соотношений (14.8.3). В
частности, определяется индикатор борелев-
ского множества числовой прямой от
самосопряженного оператора А.
Теорема 14.8.7. Для любого
самосопряженного оператора А, отображающего Н-про-
странство X в X, и любого борелевского
множества В оператор 1#(Л) представляет собой
проектор на некоторое подпространство
пространства X.
Теорема 14.8.8. Для любого
самосопряженного оператора А операторная функция
множества \В(А) представляет собой
разложение единицы.
Таким образом, любой
самосопряженный оператор А определяет на а-алгебре В
борелевских множеств числовой прямой Я
разложение единицы
ЕА(В) = 1В(А), Веб. (14.8.6)
Это разложение единицы называют
спектральной мерой оператора А. Функцию
Ра(0 = Еа((--,*)) (|48-7)
называют спектральной функцией оператора А.
Определив спектральную меру
самосопряженного оператора, можно представить
любую функцию этого оператора,
принадлежащую рассмотренному классу С, в виде
интеграла по спектральной мере.
Теорема 14.8.9. Пусть А -
самосопряженный оператор в Н-пространстве X, f(t) —
функция класса С . Тогда операторная функция
f(A) выражается формулой
f(A)= \f(t)E{A){dt), (14.8.8)
где Е(А)(В), В е В — спектральная мера
оператора А, определяемая формулой (14.8.6).
14.8.4. Спектральное разложение
самосопряженного оператора. Пользуясь
преобразованием Кэли, формулой (14.8.4) и
соотношениями между операторами,
определяемыми разложением единицы, получаем
следующее представление.
Теорема 14.8.10. Любой самосопряженный
оператор А допускает интегральное
представление
А= jtE(A)(dt). (14.8.9)
14.8.5. Спектральное разложение
унитарного оператора. Теорема 14.8.11. Любой
унитарный оператор U в Н-пространстве X
определяет ограниченный самосопряженный
оператор А = -ih\U , через который он
выражается формулой
U=eiA. (14.8.10)
Эта формула определяет унитарный
оператор и при произвольном самосопряженном
операторе А. При этом формула (14.8.8) дает
следующее следствие.
Следствие. Любой унитарный оператор U
допускает интегральное представление
U = \еиЕ{А)((Н), (14.8.11)
где Е(А)(В) — спектральная мера
самосопряженного оператора А = -/' In U .
Ввиду периодичности подынтегральной
функции эту формулу можно привести к виду
2л
I/= J *%(*),
0
где
Еи(В)= ]Г Е(А)(В + 2кк).
*=-оо
Разложение единицы Ец (В) называют
спектральной мерой унитарного оператора U.
Операторную функцию
ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИОНАЛОВ И ОПЕРАТОРОВ
579
Fu(t) = Eu([0,t))
называют спектральной функцией унитарного
оператора if.
14.8.6. Спектральное разложение
группы унитарных операторов. Рассмотрим
множество унитарных операторов {^т}>
т е R , обладающее следующими свойствами:
О U0 = I;
2)UJJ0=U^;
3) числовая функция {Uxx,y)
переменной т непрерывна при любых х,уе X .
Это множество операторов представляет
собой однопараметрическую непрерывную
коммутативную (абелеву) группу.
Теорема 14.8.12. Все операторы группы
{Ux} представляют собой степени оператора
UX = U\
Любая непрерывная однопараметрическая
коммутативная группа унитарных операторов
допускает интегральное представление
Ux = \eixtE{A){dt), (14.8.12)
где Е(А)(В) — спектральная мера оператора
А в представлении (14.8.10) оператора U =U\
(теорема Стоуна).
14.8.7. Спектральное разложение
нормального оператора. Пусть Т -
нормальный оператор. Представив его в виде
T = A{+iA2, где Л,=(ТЧГ)/2, А1=(т -
-T*)/2i — самосопряженные операторы, и
выразив А\ и А2 спектральными
разложениями, получим спектральное разложение
нормального оператора
Т = J J (/ + is)ET(dtds) = jzET(dz),
(14.8.13)
где спектральная мера Ej (С) нормального
оператора представляет собой произведение
спектральных мер самосопряженных
операторов А\ и А2 (14.3.8).
Глава 14.9
НЕЛИНЕЙНЫЙ ФУНКЦИОНАЛЬНЫЙ
АНАЛИЗ
14.9.1. Дифференцирование
функционалов и операторов. Производные и
дифференциалы Фреше и Гато. Формула и ряд
Тейлора. Пусть f(x) - функция (оператор),
отображающая нормированное линейное
пространство X в нормированное линейное
пространство У. Если разность / (х + Ьх) - f(x)
допускает в некоторой окрестности точки х
представление
f{x + bx)-f{x) = Tbx + o{\bx\),
где Т — ограниченный линейный оператор,
Т 6 в(Х,У), то величину df(x) = ТЪх
называют сильным дифференциалом или
дифференциалом Фреше функции / , а оператор Т —
сильной производной или производной Фреше
функции / в точке х и обозначают f'(x) .
При этом функцию / называют сильно
дифференцируемой или дифференцируемой по
Фреше в точке х. Функцию / называют сильно
дифференцируемой на множестве А, если она
сильно дифференцируема в каждой точке
множества А.
В частном случае, когда функция f(x)
представляет собой ограниченный линейный
оператор, f(x) = Тх , ее сильная производная
совпадает с оператором Т, f\x) = Т .
Теорема 14.9.1. Если функция у = f(x) ,
отображающая нормированное линейное
пространство X в нормированное линейное
пространство У, дифференцируема в точке Xq , a
функция z = g(y), отображающая У в
нормированное линейное пространство Z,
дифференцируема в точке Уо = f (xq ), то функция
gf(x) = g(f(x)) (композиция отображений f
и g) дифференцируема в точке Xq и
(£/")'Ы = £'(/Ы)/'Ы- (14-9.1)
Теорема 14.9.2 Если функция f(x)
имеет непрерывную производную f\x) во всех
точках некоторого выпуклого множества S, то
для любых Xq , X 6 S справедлива формула
19*
580
Глава 14.9. НЕЛИНЕЙНЫЙ ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
1 Теорема 14.9.3. Всякая сильно дифферен-
/(х)-/(х0) = \f'(xQ+t(x-x0))(x-x0)dt. цируемая функция слабо дифференцируем, и ее
(14.9.2)
(формула конечных приращений).
В частном случае, когда /(х)
представляет собой функционал, /'(х0 + f(x - х0))х
х(х-х0) есть числовая функция. Поэтому к
интегралу в (14.9.2) можно применить теорему
о среднем. В результате формула (14.9.2)
примет вид
f{x)-f{x0) = f'(x0+Q(x-x0))(x-x0),
(14.9.3)
где 0 — некоторое число из интервала (0,1).
Таким образом, для функционалов на
нормированных линейных пространствах
справедлива обычная формула конечных приращений
Лагранжа.
Пусть X и У— топологические линейные
пространства, у = /(х) - функция,
отображающая Хв У. Если существует предел
dt
f{x + tbx)
м=о
= lim
/(х + /5х)-/(х)
в топологии пространства Y, то его называют
слабым дифференциалом или дифференциалом
Гато функции /(х) в точке х по
направлению fix и обозначают §/(х,5х):
5Дх,5х) = [<//(*+ /5х)/Л]/=0.
В частном случае, когда при всех fix
существует такой непрерывный линейный оператор
Tf что §/(х, 5jc) = Г5х , этот оператор Т
называют слабой производной или производной
Гато функции f(x) в точке х и обозначают
f\x) . Функцию /(jc) в таком случае
называют слабо дифференцируемой или
дифференцируемой по Гато. В общем случае слабый
дифференциал §/(х,5х) может не быть
линейной функцией Ьх. Таким образом, из
существования слабого дифференциала функции
не следует ее слабая дифференцируемость.
1
сильная и слабая производные совпадают.
Теорема 14.9.4. Если функция /(х) слабо
дифференцируема в некоторой выпуклой
окрестности S точки х и се слабая производная
непрерывна в точке X, то существует сильная
производная функции /(х) в точке х,
совпадающая с ее слабой производной.
Дифференциалы и производные высших
порядков определяются обычным путем.
Теорема 14.9.5. Если функция у = /(х),
отображающая нормированное линейное
пространство X в нормированное линейное
пространство Y, имеет во всех точках некоторого
выпуклого множества S непрерывные
производные до порядка п +1 включительно, то при
всех х, X + Ьх е S справедлива формула Тейлора
/(x + 5x) = /(x) + /'(x)Sx + ...
... + -
п\
/(,7)(x)fix" + Rn , (14.9.4)
где остаточный член Rn определяется формулой
Rn = Rn(x,bx) =
= -±J(1 - /)" /(,7+,) (х + /8х)8х,,+|А.
'о
(14.9.5)
В частном случае, когда /(х)
представляет собой функционал, формула (14.9.5) для
остаточного члена может быть переписана в
виде
Rn=Rn(x,dx) =
1
-/(/7+1)(x + esx)Sx
//+i
(/1 + 1)Г
(14.9.6)
где 9е (0,1).
В случае функционала /(х) на
пространстве С (Г) непрерывных на компакте Т
скалярных функций формула (14.9.6)
принимает вид
/(jc + 8x) = /(*) +J Л^.*)8х(0* + .-- + ^ J..J/(,t) ('I.--.'»;*)&c('i)-"8jc('ii)*i-"*».+
т т
(я + 1)!
J...J/("+,)('i,-,'n+i;* + e&c)8x(/,)...8x(/e+1)rff,...*e+,.
т т
ОПЕРАТОРНЫЕ УРАВНЕНИЯ. МЕТОД СЖИМАЮЩИХ ОТОБРАЖЕНИЙ 581
Это обобщение формулы Тейлора и
соответствующее обобщение ряда Тейлора на
функционалы на С(Т) в случае, когда Т = [а,Ь],
было впервые дано Вольтеррой.
Производные здесь f^n' (/j,..., tn, х)
при фиксированных t[,...,tn играют роль
соответствующих частных производных
функционала / по значениям функции x(t) при
всех значениях аргумента / (по несчетному
множеству аргументов x(t)). Вольтерра
назвал эти производные функциональными
производными функционала f(x) .
Степенные ряды в пространстве С(Т)
вида
*b r\k{(t)x(t)dt + ...
т
... + \..]kn{tb..., tn)x{t{)...x(tn)dt{...dtn +...
т т
обычно называют рядами Волыперры. Эти
ряды и их конечные отрезки часто применяют в
теории управления для описания нелинейных
систем.
14.9.2. Экстремумы функционалов.
Пусть f(x) - действительный функционал
на нормированном линейном пространстве X.
Точку х называют точкой максимума
{минимума) функционала f(x) , если
существует такая окрестность V точки х, что
f(x + &х) - f(x) < О (> 0) при всех
х + бх е V (т.е. при всех достаточно малых
по норме сое). Точки максимума и точки
минимума функционала образуют множество
точек экстремума функционала f(x) .
Первое необходимое условие экстремума.
Теорема 14.9.6. Если функционал f(x)
достигает экстремума в точке х и имеет в
этой точке непрерывную слабую производную
f'(x) , то в этой точке
Второе необходимое условие экстремума.
Теорема 14.9.7. Если функционал f(x)
имеет минимум (максимум) в точке х и имеет
в некоторой выпуклой окрестности этой точки
непрерывную отличную от нуля вторую
производную, то f"(x)bx2 > 0 (f"(x)bx2 < О) при
всех достаточно малых по норме 6х .
Достаточное условие экстремума.
Теорема 14.9.8. Если в точке х
f'(x)bx = 0 и f"(x)bx2>c\\bxf пРи мех
сое при некотором с > 0, то функционал
f(x) имеет в точке х минимум.
Условные экстремумы.
Точку х называют точкой условного
максимума (минимума) функционала f(x) при
условиях
/*(*) = 0 (* = 1,...,т), (14.9.7)
если f(x + сое) - f(x) < 0 (> 0) при х,
удовлетворяющем условиям (14.9.7), и при всех
сое, удовлетворяющих условиям
dfk(x) = n(x)bx = 0 (* = l,...,m).
Теорема 14.9.9. Если функционал (р(хД)
достигает минимума (максимума) в точке х^
при некоторых значениях X и X можно выбрать
так, чтобы точка х^ принадлежала
множеству S значений х, удовлетворяющих условиям
(14.9.7), то в этой точке х^ функционал
f(x) достигает условного экстремума при
условиях (14.9.7).
Теорема 14.9.9 обобщает на
функционалы известный метод неопределенных
множителей Лагранжа для нахождения условного
экстремума.
14.9.3. Операторные уравнения. Метод
сжимающих отображений. Многие
уравнения, встречающиеся в различных областях
математики, можно записать в общей форме
Ах = у (14.9.8)
или
АХ = х , (14.9.9)
где А - некоторый оператор, в общем случае
нелинейный, отображающий некоторое
пространство X в другое пространство Y в случае
уравния (14.9.8) и в то же самое пространство
Хъ случае уравнения (14.9.9). Однако в случае
линейного пространства X уравнение (14.9.8)
всегда можно привести к (14.9.9). Для этого
достаточно взять любой оператор В,
отображающий взаимно однозначно все
пространство Y на все пространство X (т.е.
определяющий изоморфизм пространств Ху У), и
записать уравнение (14.9.8) в виде
BACz + z-By = z.
582
Глава 14.9. НЕЛИНЕЙНЫЙ ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ
Это уравнение вида (14.9.9) с оператором
Dz = BACz + Z- By (зависящим от у).
Пусть X - полное метрическое
пространство (в частности, /?-пространство), А —
оператор, отображающий пространство X
само в себя, А : X —> X . Оператор А
называют сжимающим оператором (сжимающим
отображением), если для любых элементов х, у
пространства X
d(Ax,Ay)< ad(x,y),
где а - некоторое положительное число,
меньшее 1, ае (0, 1). Ясно, что сжимающий
оператор всегда непрерывен.
Точку х пространства X называют
неподвижной точкой отображения А, если Ах = х .
Очевидно, что неподвижная точка х
отображения А представляет собой решение
уравнения (14.9.9).
Теорема 14.9.10. Если при каком-нибудь
натуральном р оператор Ар является
сжимающим оператором, то существует
единственная неподвижная тонка оператора А.
Теорема 14.9.10 справедлива и в том
случае, когда оператор Ар является
сжимающим не на всем пространстве X, а только
на некотором замкнутом множестве Д
которое он отображает в себя, АрD с D .
Данная теорема лежит в основе метода
сжимающих отображений, позволяющего
доказывать существование решений
различных уравнений.
СПИСОК ЛИТЕРАТУРЫ
1. Данфорд Н., Шварц Дж.Т. Линейные
операторы. М.: Изд. иностр. лит., 1962, 4.1;
М.: Мир, 1966, 4.2; 1974, Ч.З.
2. Кириллов А.А., Гвишиани А.Д. Теоремы
и задачи функционального анализа. М.: Наука,
1988.
3. Колмогоров А.Н., Фомин СВ.
Элементы теории функций и функционального
анализа. М.: Наука, 1972.
4. Крейн С.Г. (ред) Функциональный
анализ. М.: Наука, 1972.
5. Пугачев B.C. Лекции по
функциональному анализу. М.: МАИ, 1996.
6. Рудин У. Функциональный анализ.
М.: Мир, 1975.
7. Садовничий В.А. Теория операторов.
М.: Изд-во МГУ, 1986.
8. Треногий В.А. Функциональный
анализ. М.: Наука, 1980.
9. Халмош П.Р. Теория меры. М.: Изд.
иностр. лит., 1953.
Ю.Шилов Г.Е., Гуревич Б.Л. Интеграл,
мера и производная. М.: Наука, 1967.
11. Эдварде Р. Функциональный анализ.
М: Мир, 1969.
Раздел 15
ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
Глава 15.1
НЕОБХОДИМЫЕ УСЛОВИЯ
ЭКСТРЕМУМОВ ФУНКЦИОНАЛОВ
15.1.1. Введение. Введем некоторые
понятия и обозначения, используемые в этом
разделе. Если каждому элементу т некоторого
множества М поставлено в соответствие
действительное число J(m), то говорят, что
задан функционал /. Область определения этого
функционала обозначают Dj = М , а область
значений / обозначают Rj . Обычно в
вариационном исчислении функционал задается на
некотором множестве функций одной или
нескольких переменных, образующих
функциональное пространство с определенной
нормой. Обычно используют пространства
С/7[д,£] функций, п раз непрерывно
дифференцируемых на отрезке [а,Ь], пространства
Z)w[fl,&] функций, п раз кусочно непрерывно
дифференцируемых на [д, Ь], пространства
ЛС/7[д,£] функций, имеющих абсолютно
непрерывные производные на [а,Ь] порядка
до п -1 включительно и производную
порядка п почти всюду на [а, Ь], а также
аналогичные пространства для функций
нескольких аргументов.
Говорят, что функционал / (у)
достигает абсолютного минимума (максимума) на у,
если для любого у е Dj выполняется
неравенство J(y)> J (у)(/ (у) < J (у)). Понятия
минимума и максимума объединяются
понятием экстремума.
В вариационном исчислении
рассматриваются функционалы, заданные в виде
интегралов типа
J(y)=\XlF(x,y,/)dx
(и их обобщений), где F — заданная функция,
относительно которой всегда далее
предполагается, что она непрерывна и ограничена
вместе со всеми своими частными производными.
Задачи вариационного исчисления, как
правило, сводятся к краевым задачам для
дифференциальных уравнений. В примерах,
которые приводятся здесь, использованы
методы решения краевых задач, изложенные в
разд. 10.
15.1.2. Вариационные задачи с
фиксированными концами. Пусть задана выпуклая
область G с R, функция F : R -» R
определена на GxR и заданы (хо,Уо)е ^ »
(х1 > У\)G G Функцию у : R -» R назовем
допустимой функцией, если
У(хо) = Уо> У(Х{) = У{, (15.1.1)
(x,y,/)e{GxR{), xe[x0lx{].
Пусть на Dj определен функционал
J(y)=\XlF(x,y,/)dx. (15.1.2)
JXQ
Если существует такая окрестность S(y)
функции у в пространстве QfjCQ,^], что
584
Глава 15.1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМОВ ФУНКЦИОНАЛОВ
/ (у ) > J (у) (J(y)< J (у)) ДЛЯ ВСЯКОГО
у е S(y), то говорят, что J (у) достигает на
у слабого относительного минимума
(максимума). Если в этом определении заменить
пространство Qfxo^i] на пространство
Со [xq,Х[] (или Dq [xq,Х[]), то получим
определение сильного относительного
экстремума.
Первой вариацией функционала J(y)
называют интеграл
S/(y,n) = fj (fyl + Fyv()dx , (15.1.3)
а второй вариацией функционала J(y)
называют интеграл
б2/(у,Л) =
= ^ £' [ГууЧ2 + 2Fy/r\r\' + F/yrf2]dx.
(15.1.4)
Приращение функционала А/(у,Г|) =
= / (у + Г|) - /(у) выражается через
вариации функционала следующим образом:
А/(у,л) = 6У(у,л) + б2/(у,л) + е, (15.1.5)
где е — бесконечно малая третьего порядка
малости относительно || Л ||г г 1 •
Теорема 15.1.1. Если на у функционал
J (у) достигает слабого относительного
экстремума, то б/(у,Г|) = 0 для всякой
достаточно малой в C|[xq,Xi] функции г\. Если
это минимум, то б /(у,Г|) > 0 , а если
максимум, то б /(у,Г|) < 0 .
Из этой теоремы вытекает следующее
необходимое условие экстремума функционала.
Теорема 15.1.2. (необходимое условие
Эйлера). Если на у функционал J (у) достигает
слабого относительного экстремума, то у
удовлетворяет на [xq,X[] уравнению
Fy>= \X Fydx + C , (15.1.6)
Jxq
называемому уравнением Эйлера в интегральной
форме. Если же дополнительно известно, что
функция у дважды дифференцируема на [*o»xl]»
то она удовлетворяет уравнению Эйлера
Fy~iFy' = 0' (1517)
записанному в дифференциальной форме.
Всякое решение уравнения Эйлера
(15.1.7) называют экстремалью.
Если выполнить дифференцирование в
формуле Эйлера, то получится
дифференциальное уравнение второго порядка
относительно неизвестной функции у:
Fy-Fy>x-Fy>yy'-Fyyy" = 0. (15.1.8)
Это уравнение вместе с краевыми
условиями (15.1.1) образует краевую задачу.
Пример 15.1.1. Исследовать на
экстремум функционал
при краевых условиях у(0) = О , уНМ = 1.
Уравнение Эйлера для этого функционала
имеет вид у" + у = О . Его решением,
удовлетворяющим заданным краевым условиям,
является функция у = sin x . Если
поставленная задача имеет решение, то у = sin x и есть
это решение.
В некоторых случаях порядок уравнения
(15.1.8) может быть понижен. Отметим
следующие из них.
1. Функция F не зависит от у. В этом
случае Fy = О и уравнение Эйлера
принимает вид Fv' = О и имеет первый интеграл
ах у
Fy>(x,y') = const.
2. Функция F не зависит от х. В этом
случае уравнение Эйлера имеет первый
интеграл F (у, У) - y'Fy> (у, У) = const.
Отметим еще случай, когда
подынтегральная функция линейно зависит от У , т.е.
F (х, у, У) = Р(х, у) + Q(x, у)У. В этом
случае уравнение Эйлера имеет вид
ду дх
Если это равенство выполняется
тождественно в G, то интеграл
\X\P + Qy')dx
ВАРИАЦИОННЫЕ ЗАДАЧИ С ФИКСИРОВАННЫМИ КОНЦАМИ
585
равен криволинейному интегралу от полного
дифференциала и на любой дуге в С,
соединяющей точки (х0,Уо) и (*1 >У[)> принимает
постоянное значение. Вариационная задача в
этом случае теряет смысл. Если же равенство
(15.1.9) выполняется не тождественно, то оно
определяет некоторую экстремаль (или
несколько экстремалей), но в общем случае эта
экстремаль не удовлетворяет условиям
(15.1.1), так что в этом случае вариационная
задача не имеет решения.
Рассмотрим теперь вариационную задачу
для функционала, зависящего от нескольких
неизвестных функций:
?{х,Уь •••> уп> Уь •••> y'n)dx ->extr;
Jxq
(15.1.9)
У[Ы = У[ У\{х\) = у1
У2{*о) = У2 У7{х{) = у\
УпЫ = Уп Уп{х{) = У[п
(15.1.10)
Если ввести я-мерный вектор
У = (У1>У2>->Уп)> то П°Д (15.1.2) можно
понимать векторную запись интеграла
(15.1.9), под (15.1.1) — векторную запись
краевых условий (15.1.10), и будут
справедливыми теоремы 15.1.1 и 15.1.2. Уравнение
Эйлера (15.1.7) запишется теперь в виде системы
уравнений
Fy* dx
Fy>. =0, i = l,..., я. (15.1.11)
Эту систему следует решать совместно с
краевыми условиями (15.1.10).
Пример 15.1.2. Рассмотрим задачу об
экстремуме функционала
j*(y'2 + z'2-2yz)dx
при краевых условиях у(0) = 0, z(0) = 0,
у(-|) = -1. Система уравнений Эйлера имеет
вид
dxty '
F7- — /у =0
z dx z
-Z - y" = 0 , -y - z = 0 . Общим решением
этой системы будет у = С^ех + С^е~х +
+ C3sinx + C4COSX, z = Схех + С2е~х -
-С3 cos х - С4 sin х . Используя заданные
краевые условия, получаем единственное
решение у = sinx, z = -sinx . Если
поставленная задача имеет решение, то оно найдено.
Обратимся теперь к необходимым
условиям экстремумов функционалов, дающих
возможность отличать максимумы от
минимумов.
Теорема 15.1.3. (необходимое условие
Лежандра). Пусть вдоль экстремали у
функционала (15.1.2) выполняется неравенство
Fyy > 0 (< 0) . Тогда на у функционал (15.1.2)
может достигать только минимума
(максимума).
Пусть вдоль экстремали функционала
(15.1.9) выполняется неравенство
Х^Л1,Лу>0 (<0). (15.1.12)
Тогда на этой экстремали функционал (15.1.9)
может достигать только минимума
(максимума).
Достаточным условием
неотрицательности квадратичной формы (15.1.12) является
выполнение неравенств
1У\У\
1У2У\
1У\У2
1 У2У2
1 У\У!
1 У2У1
1 У1У\
1 У1У2
i = 1,..., п .
F > >
ГУ1У1
>0,
(15.1.13)
Если в неравенстве (15.1.12) знак ">"
заменен на ">", то условие (15.1.12) называют
усиленным условием Лежандра.
Пример 15.1.3. В примере 15.1.2
Fyy ■■= 2 и
1 у у
lzy
1 yz
1 zz
= 4,
поэтому на найденной в примере 15.1.2
экстремали может достигаться только минимум.
Теорема 15.1.4. (необходимое условие
Вейерштрасса). Если на у достигается сильный
минимум (максимум) в задаче (15.1.1), (15.1.2),
то функция Вейерштрасса
E(x,y,y',k) = F{x,y,k)-F{x,y,y')-
-(y'-k)Fy'(x,y,y) (15.1.14)
неотрицательна (неположительна) вдоль у при
произвольном к.
586
Глава 15.1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМОВ ФУНКЦИОНАЛОВ
Если на вектор-функции у достигается
сильный минимум (максимум) в задаче (15.1.9),
(15.1.10), то функция Вейерштрасса
E(x,y,y,k) = F(x,y,k)-F(x,y,y)-
п
/=1
неотрицательна(неположительна) вдоль у при
произвольном векторе к = (к±, &2,..., кп).
Замечание 15.1.1. Так как если на
кривой достигается сильный экстремум
функционала, на этой же кривой достигается и
слабый экстремум (но не наоборот), то
приведенное необходимое условие Вейерштрасса
для сильного экстремума не является
необходимым условием для слабого экстремума.
Необходимое условие Якоби. Как было
сформулировано в теореме 15.1.1, для того
чтобы на у достигался минимум функционала
(15.1.2), необходимо, чтобы вдоль у
выполнялось неравенство б /(>>,Г|)>0 при
произвольных достаточно малых rj. Если выписать
уравнение Эйлера (15.1.7) для функционала
б / , то оно будет иметь вид
Vi + Vn' - ;£ (Fwn + ^уп') = ° •
(15.1.16)
Уравнение (15.1.16) называют уравнением
Якоби. В это уравнение следует подставить у и
найти решение Г), удовлетворяющее
начальным условиям Г)(х0) = 0, Т|/(х0) = 1. Точку
£ > х0 , такую, что Г)(£) = 0 и Т|(х) Ф 0 при
xg(xq,^), называют сопряженной с точкой
х0.
Для функционала (15.1.9) уравнение
Якоби также записывают в виде (15.1.16), под
у и Г| понимают соответствующие вектор-
функции, под Fyy понимают яхя-матрицу
с элементами Fy.y. , под Fyyr\ -
произведение матрицы на вектор и т.д. Определение
сопряженных точек формулируется в этом
случае аналогично.
Теорема 15.1.5. Для того чтобы в задачах
(15.1.1), (15.1.2) или (15.1.9), (15.1.10)
достигался экстремум, необходимо, чтобы на
(xq,X\ ) не было точек, сопряженных с Xq .
Условие отсутствия на (xqjXj) точек,
сопряженных с Xq , называют условием Якоби,
а условие отсутствия точек, сопряженных с
Xq на (xq,Xi] называют усиленным условием
Якоби.
15.1.3. Экстремумы функционалов,
зависящих от старших производных
неизвестной функции. Рассмотрим задачу об
экстремуме функционала
J(y)=\XlF(x,y,y',...,yW)dx. (15.1.17)
Здесь ye C„[xo,Xj] и заданы краевые условия:
уи)Ы = Уо> y{i)(xi) = yi> / = o,...,/i-i.
(15.1.18)
Теорема 15.1.6. Если на функции у
достигается экстремум функционала (15.1.17) при
условиях (15.1.18), то у удовлетворяет
дифференциальному уравнению порядка 2п :
'/-г'/+г'"+-*(-1)"^'>-0-
(15.1.19)
Это уравнение называют уравнением
Эйлера - Пуассона. Его следует решать
совместно с краевыми условиями (15.1.18). Теорема
15.1.6 остается справедливой, если под у
понимать вектор-функцию.
Пример 15.1.4. Рассматривается задача
об экстремуме функционала
Г1 /,?
у dx -> extr
Jo
при краевых условиях у(0) = 0, у'(0) = 0,
y(i) = 1 , у(1) = 3 . Уравнение Эйлера - Пу-
d2y „
ассона имеет вид ~-2у = 0. Его общим
dx1
решением будет у = С\ + С^х + С^х + С^х .
Используя краевые условия, находим, что
если поставленная задача имеет решение, то
этим решением может быть только функция
3
у = х .
15.1.4. Вариационные задачи с
подвижными границами. Пусть на плоскости
(х,у) заданы две гладкие кривые у = ф(х) и
у = \|/(х). Рассматривается задача об
экстремуме функционала
ЭКСТРЕМАЛИ С УГЛОВЫМИ ТОЧКАМИ
587
J(y) = F(x,y,y)dx -» extr , (15.1.20)
причем точки х0 и Х| не фиксированы, но
требуется выполнение условий
у(х0) = ф(х0), у(х{) = у(х{). (15.1.21)
Другими словами, концы кривой,
доставляющей экстремум этому функционалу, должны
лежать на кривых (р и \|/.
Можно рассмотреть также
пространственную задачу с подвижными границами.
Задается функционал
Ду) = \*1 F{x,y,z,y\z')dx -+ extr (15.1.22)
при условиях, что начало кривой у = у(х),
Z = z(x), вдоль которой вычисляется
интеграл (15.1.22), лежит на поверхности
Z = ф(х, у), а конец — на поверхности
Z = у(х,у), т.е. выполнены условия
Фо) = ф(*<ь У(*о))' Ф0 = У{Х1>У(Х\)) •
(15.1.23)
Теорема 15.1.7. Если на функции у
функционал (15.1.20) достигает экстремума при
условиях (15.1.21), то функция у должна
удовлетворять системе уравнений Эйлера (15.1.11)
и условиям
[F(x9y9?)-W-/)Fs(x9y,y4]\xi=0.
(15.1.24)
Если функционал (15.1.22) достигает
экстремума при условиях (15.1.23), то функции
у и z должны удовлетворять системе уравнений
Эйлера (15.1.7) и условиям
[F-yry>+(yx-z')Fz>]\x=XQ=0,
[^-уТ/+(^-^)^]Ц=0,
[Fy' + FzVy]\x=xi=0.
(15.1.25)
Условия (15.1.21) и (15.1.25) называют
условиями трансверсальности. Для решения
задачи следует найти общее решение
уравнения Эйлера, а произвольные постоянные и
координаты Хц и Х| найти из условий
трансверсальности и условий принадлежности
концов линии у графикам функций (р и \|/,
Может быть, что одна из концевых точек
фиксирована. В этом случае соответствующее
условие трансверсальности надо опустить.
Пример 15.1.5. Требуется определить
кратчайшее расстояние от точки (*о>.Уо) Д°
кривой, задаваемой уравнением у = \|/(х).
Это расстояние задается функционалом
jyl\+y'2dx.
Решения уравнения Эйлера в этом случае -
прямые линии. Условие трансверсальности на
правом конце имеет вид
V^7"+(v-/)-7^T=o.
После упрощений оно превращается в
условие ортогональности 1 + y'\\f = 0 .
15.1.5. Экстремали с угловыми
точками. Иногда функционал (15.1.1) не
достигает экстремума ни на какой гладкой кривой.
Тем не менее, расширив класс допустимых
функций, можно найти решение такой
вариационной задачи.
Пример 15.1.6. Найти экстремум
функционала
Лу) = \*1у2(1-/)<ь
при краевых условиях J>(-1) = 0 , у (2) = V3 .
Уравнение Эйлера для этого функционала
имеет первый интеграл у 11 - у ) = С .
Интегрируя это уравнение и используя краевые
условия, находим, что экстремум в классе
гладких кривых может достигаться только на
гиперболе х2 - у2 = 1 . Однако точки (-1,0)
и (2, v3) лежат на разных ветвях этой
гиперболы. Следовательно, на гладкой кривой
экстремум не достигается.
Определим теперь ломаную, состоящую
из двух отрезков прямых:
[ 0, *е[-1,2-Л],
У = \
х + Л-2, *е[2-Л,2].
588
Глава 15.2. УСЛОВНЫЙ ЭКСТРЕМУМ
Очевидно, / (у) = О , а / (у) > О для всех у,
так что на у достигается абсолютный
минимум этого функционала.
Теорема 15.1.8. Пусть на ye D±
достигается экстремум в задаче с ломаными
экстремалями. Тогда у состоит из конечного числа дуг
экстремалей функционала (15.1.1), в угловых
точках (Зс, у) выполнены условия Вейерштрасса —
Эрдмана:
[р-Уру'%Ар-у'ру']\-х->
psL=p>
(15.1.26)
У \х-'
Глава 15.2
УСЛОВНЫЙ ЭКСТРЕМУМ
15.2.1. Изопериметрическая задача.
Исследуется вариационная задача
J(y)= \XlF(x,y,/)dx (15.2.1)
JXq
при краевых условиях
УЫ = Уо> У(х\) = У\ (15-2-2)
и дополнительных условиях
[Х] Ф, {x,y,/)dx = Dt, / = 1,..., т , (15.2.3)
где Dj — заданные константы.
Теорема 15.2.1. Если на у достигается
экстремум функционала (15.2.1) при условиях
(15.2.2) и (15.2.3) и у не является экстремалью
ни для одного из интегралов (15.2.3), то
существуют такие постоянные Х\,...,Хт, что у
является экстремалью для функционала
( т \
/00=f Г + 2>'Ф'
Jx° i=\
\dx. (15.2.4)
Это означает, что у должно быть
решением уравнения
ц/ __ч/ , - О
(15.2.5)
где
4<=f+x;>a.
15.2.2. Задача Лагранжа.
Рассматривается задача об экстремуме функционала
J(Yy) = Г1 F(x,y,y')dx ,yeR" (15.2.6)
JXq
при краевых условиях
y(x0) = y0,y(x[) = y[,y°,y[eR»
(15.2.7)
и при связях
ср,-(*,>>,/) = 0, / = 1,...,/я</1, (15.2.8)
которые предполагаются независимыми.
Теорема 15.2.2. Если на у достигается
экстремум функционала (15.2.6) при условиях
(15.2.7), (15.2.8), то существует такое число
Xq (как правило, отличное от нуля) и такие
функции Xjix), / = 1,..., т , что у является
безусловной экстремалью для функционала
гхх( '" ^
(15.2.9)
Пример 15.2.1. Линию наименьшей
длины, соединяющую две заданные точки на
поверхности (р(х, >>,£) = 0, называют
геодезической. Требуется найти дифференциальные
уравнения геодезических на заданной
поверхности. Расстояние между двумя точками в
пространстве определяют по формуле
Ух.
Jx0
dx.
Для нахождения минимума этого интеграла
при условии, что кривая лежит на
поверхности y(x,y,z) = 0 , составляем интеграл
Ну) = J*1 [li + y'2 + z2 + Цх)ф, у, z)]dx
и для него выписываем систему уравнений
Эйлера:
Чх)<ру -
Чх)у- -
dx
d
dx
№
z
VU7
+ z'2
+ z'2
= 0,
= 0.
Эти уравнения и являются
дифференциальными уравнениями геодезических. Решая
эту систему совместно с уравнением поверх-
ПОЛЯ ЭКСТРЕМАЛЕЙ
589
ности и используя координаты точек,
соединяемых геодезическими, можно найти
уравнения этих линий.
15.2.3. Задача Майера. Пусть функции
Уо» У[> •••» Ут удовлетворяют уравнениям
связи (15.2.8) и краевым условиям
УО (*о) = "О > У\ (*о) = аЬ ■■■» Ут (*о) = ат >
>;1(^1) = ^Ь-5Ут(^1) = ^- (15.2.10)
Требуется найти такую систему функций,
удовлетворяющих этим условиям, для которой
Уо(х\) минимально (или максимально).
Теорема 15.2.3. Пусть на у0
достигается решение в задаче Майера. Тогда существуют
такие функции %t (х), i = 1,..., т , что у0
является экстремалью функционала
х т
Jx°ti
15.2.4. Задача Больца. Требуется
найти такую функцию у е R" , которая
доставляет экстремум функционалу
МУ) = Г l F(x,y9y)dx + G(xQ,y(x0),xby(x{))
(15.2.11)
при связях
Ф/(дс,^,У) = 0> (/ = 1 m < л) (15.2.12)
и условиях на концах интервала
У]{хО>У(хо)>х{,у(х{)) = 0,
(у = 1, ...,/>< 2/1+ 2). (15.2.13)
Теорема 15.2.4. Если на у достигается
экстремум в задаче Больца, то существует
такая постоянная Xq (как правило, отличная
от нуля) и такие функции Xj(x),
(/ = !,..., т), что у является экстремалью
функционала
1{у)= [{ф(х,у,у',\0,Х{,...,\т)(1х,
Jxq
где
т
<P = \0F + £ А,/(*)<Р/ (х,у,у).
i=\
Кроме того, на концах интервала должны
выполняться условия трансверсальности:
[ф-^]Ц=°'ф^и=0'
Замечание 15.2.1. Задача Больца обобщает
задачи Майера и Лагранжа. Кроме того,
задача Майера сводится к задаче Лагранжа и к
ней же могут сводиться задачи с подвижными
границами. Все эти задачи приведены здесь
раздельно для удобства читателей.
Глава 15.3
ДОСТАТОЧНЫЕ УСЛОВИЯ
ЭКСТРЕМУМОВ ФУНКЦИОНАЛОВ
15.3.1. Поля экстремалей. Рассмотрим
вновь вариационную задачу
J (у) = Г1 F(x,y,y')dx -» extry e Rn
Jxq
(15.3.1)
с краевыми условиями
у(х0) = у°, у(х{) = у{, y°,y[eR".
(15.3.2)
Напомним, что для того чтобы на у
достигался экстремум функционала (15.3.1), эта
функция должна удовлетворять уравнению
Эйлера
ру-^ру' = ° <15-3-3)
и что всякое решение этого уравнения
называют экстремалью.
Если через каждую точку области G
пространства п + \ измерений (х,уу,..., уп)
проходит одна единственная экстремаль, то
говорят, что область G покрыта полем
экстремалей. Область D, покрытая полем
экстремалей, исходящих из одной точки этого
пространства, называют покрытой центральным
полем экстремалей. Наклоном поля
экстремалей называют вектор-функцию
Р = (у'ъ —» Уп)» касательную к экстремалям в
каждой своей точке. Если экстремаль
проходит через точки Л(х0,у°) и В(х{,у1) и
пучок экстремалей, проходящих через точку
А, образует центральное поле экстремалей,
включающее точку В, или, наоборот, пучок
590
Глава 15.3. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМОВ ФУНКЦИОНАЛОВ
экстремалей, проходящих через точку В,
образует центральное поле экстремалей,
включающее точку А, то говорят, что экстремаль у
включена в поле экстремалей.
Теорема 15.3.1. Для того чтобы
экстремаль, соединяющая точки А\х$,у 1 и
Blx^y ), была включена в поле экстремалей,
достаточно, чтобы было выполнено усиленное
условие Якоби, т.е. чтобы на (х§,у\\ не было
точек, сопряженных с х$, или чтобы на
[x0,Xj) не было точек, сопряженных с Х| .
15.3.2. Достаточные условия слабого
экстремума. Теорема 15.3.2. Для того чтобы
на экстремали у, удовлетворяющей краевым
условиям (15.3.2), достигался слабый
относительный минимум (максимум), достаточно,
чтобы экстремаль у была включена в поле
экстремалей и выполнялось усиленное условие Ле-
жандра, т.е. чтобы вдоль у выполнялось
неравенство
Для проверки усиленного условия Якоби
следует решить уравнение Якоби, найти точку
£ , сопряженную с Хц , и проверить условие
^ > Xq . Проверить усиленное условие Лежандра
можно, доказав, что все определители в
(15.1.13) положительны (отрицательны) вдоль у.
Пример 15.3.1. Решить задачу об
экстремуме функционала
при краевых условиях у(0) = 0, у(1) = 0.
Уравнение Эйлера имеет вид 2у - (2 -
~6уу')у" = 0 • Этому уравнению и краевым
условиям удовлетворяет функция у = 0 .
Уравнение Якоби имеет вид Т|" = 0 ; г\ = Сх -
семейство его решений, проходящих через
точку (0, 0), и очевидно, что условие Якоби
выполняется. Так как вдоль экстремали
у = 0 будет Fyy = 2 > 0 , то выполнено
усиленное условие Лежандра, и на у = 0
функционал достигает слабого относительного
минимума. Можно доказать, что на этой
экстремали сильный минимум не достигается.
Теорема 15.3.3. Если функция у является
экстремалью, удовлетворяющей краевым
условиям (15.3.2), может быть включена в
центральное поле экстремалей и функция Вейер-
штрасса E(x,y,p,k)>0 (< 0) в Су
окрестности экстремали, то на у достигается слабый
относительный минимум (максимум).
Пример 15.3.2. Найти экстремум
функционала
\У*у>'
при краевых условиях j'(0) = 0 , у(\) = 2 .
Уравнение Эйлера имеет ви у у' = 0 , и его
решением, удовлетворяющим краевым
условиям, будет у = 2х . Эта экстремаль
включается в центральное поле экстремалей у = Сх ,
так как точек, сопряженных с точкой х = 0 ,
не существует. Функцию Вейерштрасса
записывают в виде Е(х, у, р,к) = к? + к - р3 - р -
-(к - р)(Ър2 + l) = (к - pf (к + 2р). Вдоль
экстремали р = 2 и функция Вейерштрасса
положительна при к, близких к 2.
Следовательно, на функции у = 2х функционал
достигает слабого относительного минимума. Из
вида функции Вейерштрасса следует, что в
зависимости от значений к она может менять
знак, так что сильный минимум на этой
функции не достигается (см. теорему (15.1.5)).
15.3.3. Достаточные условия сильного
экстремума. Теорема 15.3.4. Если у является
экстремалью для функционала (15.3.1),
удовлетворяющей краевым условиям (15.3.2), может
быть включена в поле экстремалей и функция
Вейерштрасса E(x,y,p,k)>0 (< 0) в
некоторой Cq[xq,Xi] окрестности экстремали, то
на у достигается сильный относительный
минимум (максимум) в задаче (15.3.1), (15.3.2).
Пример 15.3.3. Найти экстремум
функционала
i{x+2y+\y,2Y
при краевых условиях у(0) = 0, у(1) = 0.
Уравнение Эйлера имеет вид у" = 2. Его
решение, удовлетворяющее краевым услови-
СИММЕТРИЧНЫЕ КРАЕВЫЕ УСЛОВИЯ
591
ям, есть у - х - х . Уравнение Якоби есть
Т|" = 0, и его решение, проходящее через
точку (0, 0), имеет вид т| = СуХ , откуда
вытекает, что точек, сопряженных с Xq = 0,
нет. Функция Вейерштрасса после
преобразований получает вид Е(х,у,р,к) =
= ~^{к~Р) -0. Отсюда следует, что на
7
у = х - х функционал достигает сильного
относительного минимума.
Теорема 15.3.5. Если у является
экстремалью, удовлетворяющей краевым условиям
(15.3.2), может быть включена в поле
экстремалей, и усиленное условие Лежандра (ср. с
теоремой 15.1.3) выполняется в некоторой
Co[x0,Xi] окрестности экстремали, то на у
достигается сильный относительный
экстремум в задаче (15.3.1), (15.3.2).
Глава 15.4
ВАРИАЦИОННЫЕ ЗАДАЧИ
ДЛЯ НЕЛОКАЛЬНЫХ ФУНКЦИОНАЛОВ
15.4.1. Симметричные краевые
условия. Рассмотрим вариационную задачу для
функционала
f * F(x,y(x),y(x-x),y'(x),y'(x - x))dx -> extr,
т>0, (15.4.1)
при краевых условиях
y(x) = q>(x), xe [х0-т,х0],
(15.4.2)
y(x) = \\f(x), xe[x{ -t,x{].
Функционал этого вида называют
нелокальным, так как нелокально задана
подынтегральная функция. Ранее такие
функционалы называли также функционалами с
отклоняющимся аргументом.
Введем обозначение
Ф = F (х, у(х), у(х - т), у\х), у\х - т)) +
+F{x + х,у(х + т),у(х),у\х + т),/(*)).
Под Фу(х) понимают частную производную
функции Ф по таким аргументам у этой
функции, которые не содержат отклонений
по х Аналогично определяют частную
производную функции Ф по у\х) и вторые
частные производные по у{х)у\х), у\х)у\х) и
т.д.
В отличие от вариационных задач без
отклонений аргумента решения задачи
(15.4.1), (15.4.2) не достигаются, как правило,
на гладких кривых. Поэтому за пространство
допустимых функций принимают пространство
^l[x0»xl ~Т] функций непрерывных и
кусочно дифференцируемых на [xo>*l-T] и
таких, что сложная функция Фу'(х) также
принадлежит Ту [x0,Xj - т].
Предполагают также, что ф(х) е
е Ту [х0 - т,х0] и \\f(x) e Т{ [х{ - х,х{].
Теорема 15.4.1. Если на у достигается
слабый относительный экстремум в задаче
(15.4.1), (15.4.2), то у удовлетворяет
обобщенному уравнению Эйлера
Ф,(,)-£ф/(х)=0 (15.4.3)
всюду на [xq,Xi - х], кроме угловых точек
функции у.
Если т зависит от ху функция х - х(х)
не убывает и имеет обратную функцию
уе Су, интеграл (15.4.1) понимается в смысле
Лебега, функция Ф = F (х, у(х), у (х- х(х)),
у\х),у\х-х(х))) + F(y(x),y(y(x)),y(x),
у'{у(х))>У'(х))у'(х) у допустимые функции
принадлежат пространству А С [xq , Ху - х (ху)]
абсолютно непрерывных функций, таких, что,
Фу(х) е АС[х0,х{ - х(х{)] , ф е АС[х0 -
-т(х0)] , \|/е ЛС^,*! -Т^)] , то у
удовлетворяет обобщенному уравнению Эйлера
(15.4.3) почти всюду на [хо>*1 - т].
Пример 15.4.1.Исследовать на экстремум
функционал
f0(y2(*) + /(*)/(* " 1) + У(х))(Ьс
при условиях у(х) = 0 , х е [-1, .0] и
у(х) = 0, хе[3,4].
Уравнение (15.4.3) имеет вид у"{х - 1) +
+ 2у"(х) + у"(х + 1) = 1, а его решение
592 Глава 15.4. ВАРИАЦИОННЫЕ ЗАДАЧИ ДЛЯ НЕЛОКАЛЬНЫХ ФУНКЦИОНАЛОВ
— + QX + C2, Хб(0,1),
у(х) = \ С3х + С6, хе(1,2),
— + С5х + С6, х e (2,3).
Из условий непрерывности решения в
точках 0, 1, 2, 3 и непрерывности функции
Фу\х) = У(х ~ *) + У(х) + У{х + 1) в точках
2, 3 находим значения произвольных
постоянных С[,...9С^. В итоге получаем, что если
поставленная задача имеет решение, то оно
достигается на функции
х2 3
—+ -х, хе(0,1),
Уо(х) =
I
2'
*б(1,2),
-2 3
— + -х9 хе(2,3).
Дополнительными рассуждениями
можно доказать, что на у$ достигается
абсолютный минимум в поставленной задаче.
Функционал со многими соизмеримыми
отклонениями, как запаздываниями, так и
опережениями, путем замены независимой
переменной и изменения обозначений может
быть приведен к виду
f ' F(x,y(x - г),..., у(х)9..., у(х + г),
у\х - г),..., у'(х),..., у\х + r))dx9
(15.4.4)
где г — целое число. (Предполагается, что
*1 - Xq > 2г.) Для этого функционала
определяется функция
ф = X F(x + '"'-К* "г + 0» •••> у(х + r + О»
/=-г
У(х-г+ /),...,/(х + г + /))
и задаются краевые условия
у(х) = <р(х); хе[х0- г9х0 + г];
у(х) = у(х); хе[х{ -г9х{+г].
(15.4.5)
Теорема 15.3.1 верна и для задачи
(15.4.4), (15.4.5).
Выскажем теперь необходимое условие
экстремума, позволяющее отличить минимум
от максимума.
Теорема 15.4.2. (обобщенное необходимое
условие Лежандра). Пусть на кривой у
достигается минимум (максимум) в задаче (15.4.1),
(15.4.2) (или в задаче (15.4.4), (15.4.5). Тогда
вдоль этой кривой выполняется, обобщенное
условие Лежандра
ф/М/<*)*° (*°)- <15А6)
Если в функционале (15.4.1) (или
(15.4.4) у — вектор-функция, то обобщенное
условие Лежандра (15.4.6) заменяется
условием неотрицательности квадратичной формы
п
X ф^уЛ/Лу * 0 (< 0), (15.4.7)
для чего в свою очередь необходимо, чтобы
выполнялись неравенства (15.1.13), в которых
функция /'заменена на функцию Ф.
Теорема 15.4.3 (необходимое обобщенное
условие Вейерштрасса). Пусть на функции у
достигается сильный относительный минимум
(максимум) в задаче (15.4.1), (15.4.2) (или в
задаче (15.4.4), (15.4.5)). Тогда при произвольных
значениях к вдоль у выполняется неравенство
Е (х, у9у9к) = Ф(х,у,к)-Ф (х, у, у) -
-(/-*)Фу (*,*/)* 0 (<0). (15.4.8)
Функцию Е(х9у9у\к) называют
обобщенной функцией Вейерштрасса. Если в условиях
теоремы (15.4.3) у — вектор-функция, то к —
также вектор-функция, и условие (15.4.8)
заменяется условием
Е(х9у9у'9к) = Ф(х9у9к)-Ф(х9у9у')-
-^{у]-к>)фу}(х9у9у')>0(<0).
(15.4.9)
15.4.2. Асимметричные краевые
условия. Для функционала (15.4.1) кроме
симметричных краевых условий (15.4.2) можно
поставить асимметричные краевые условия
у(х) = <р(х), хе[х0- т,х0]; у(х{) = ух.
(15.4.10)
Определим функцию
[Ф, хе[х0,х{ -т];
¥ = j (15.4.11)
[F, xe(xl -х9х{].
СПИСОК ЛИТЕРАТУРЫ
593
Теорема 15.4.4. Если на у достигается
слабый относительный экстремум в
пространстве Т{[хъ,х{] в задаче (15.4.1), (15.4.10), то
у удовлетворяет обобщенному уравнению Эйлера
ч^м-^чУм-0- <15-4Л2>
Теорема 15.4.5. Если на у достигается
минимум (максимум) в задаче (15.4.1), (15.4.10),
то у удовлетворяет обобщенному условию
Лежандра
У/(х)/(х) > 0 (<0). (15.4.13)
Если т - функция от х,
удовлетворяющая сформулированным выше условиям, то
справедливы аналоги теорем 15.4.4 и 15.4.5, а
уравнение (15.4.12) и неравенство (15.4.13)
удовлетворяются почти всюду на [^o»xl]-
Глава 15.5
ВАРИАЦИОННЫЕ ЗАДАЧИ
С ЧАСТНЫМИ ПРОИЗВОДНЫМИ
Рассматривается задача об экстремуме
функционала
jDJF(x,y,u,p,q)dxdy -> extr , (15.5.1)
где введены обозначения их = р , иу = q , D —
некоторая область на плоскости (х,у),
ограниченная кусочно-гладкой кривой L, на
которой задана функция ф(х,у). Требуется
найти функцию и(х,у), которая доставляет
экстремум функционалу (15.5.1) при краевом
условии
[M(x,y) = 9(x)j')]|(^)eL. (15.5.2)
Теорема 15.5.1. Если на и достигается
экстремум функционала (15.5.1) при условии
(15.5.2), то и удовлетворяет
дифференциальному уравнению в частных производных
Уравнение (15.5.3) называют уравнением Эйлера —
Остроградского.
Пример 15.5.1. Рассмотрим задачу об
экстремуме интеграла Дирихле
Уравнение Эйлера - Остроградского в этом
случае имеет вид
ихх + иуу = ° »
его называют уравнением Лапласа. Методы
решения полученной краевой задачи описаны
в разд. 13.
Теорема 15.5.2. (аналог условия
Лежандра). Пусть на и достигается слабый
относительный экстремум функционала (15.5.1) при
условии (15.5.2). Тогда во внутренних точках
области D выполняется неравенство
причем если это минимум, то Fpp > 0 , а если
максимум, то Fpp < 0 .
СПИСОК ЛИТЕРАТУРЫ
1. Блисс Г.А. Лекции по вариационному
исчислению. М.: Изд. иностр. лит., 1950.
2. Гельфанд И.М., Фомин СВ.
Вариационное исчисление. М.: Физматгиз, 1961.
3. Каменский Г.А., Скубачевский А.Л.
Экстремумы функционалов с
отклоняющимися аргументами. М.: Изд. МАИ, 1979.
4. Лаврентьев М.А., Люстерник Л.А. Курс
вариационного исчисления. М.: Гостехиздат,
1950.
5. Эльсголыд Л.Э. Дифференциальные
уравнения и вариационное исчисление. М.:
Физматгиз, 1965.
6. Янг Л. Лекции по вариационному
исчислению и теории оптимального управления.
М.: МИР, 1974.
Раздел 16
ОБОБЩЕННЫЕ ФУНКЦИИ
Глава 16.1
ОСНОВНЫЕ ПОНЯТИЯ
16.1.1. Понятие обобщенной функции.
Обобщенная функция - это математическое
понятие, обобщающее классическое
определение функции. Потребность в таких
обобщениях возникает во многих технических,
физических и математических задачах. Понятие
обобщенной функции дает возможность
выразить в математически корректной форме
такие идеализированные понятия, как
плотность материальной точки, точечного заряда,
пространственную плотность простого или
двойного слоя, интенсивность мгновенного
источника и т.д. С другой стороны, в понятии
обобщенной функции находит отражение тот
факт, что реально нельзя измерить значение
физической величины в точке, а можно
измерить только ее среднее значение в достаточно
малой окрестности. Таким образом, техника
обобщенных функций служит удобным и
адекватным аппаратом для описания
распределений различных физических величин. Поэтому
иначе обобщенные функции называют
распределениями.
Термин «обобщенная функция» тесно
связан с понятием обобщенного решения —
расширения понятия классического решения
дифференциальных уравнений. Это понятие
возникло в связи со многими задачами
математической физики, когда под решениями
дифференциальных уравнений потребовалось
понимать функции, не имеющие достаточного
числа производных, и даже вовсе не
дифференцируемые функции.
Понятие обобщенной функции
естественным образом возникает при попытке
распространить некоторые естественные
операции (дифференцирование, интегрирование,
решение дифференциальных уравнений,
преобразование Фурье и т.п.) на более широкую
область по сравнению с той, где эти операции
первоначально определены. На первых порах
это приводило к парадоксальным и
противоречивым определениям обобщенной
функции. Например, введенная П. Дираком в
своих исследованиях по квантовой механике
6-функция (дельта-функция) определялась
следующими свойствами
[О, х*0, 7
[оо, JC = 0, _i
Ясно, что обычной функции с такими
свойствами не существует. Дельта-функция может
быть определена также формальным
соотношением:
\ Ь(х - a)y(x)dx = ф(я)
для любой непрерывной функции ф(х). Часто
используемые формальные операторные
соотношения, определяющие свойства 5- функции
5(-х) = 5(х), §(сх) = | с|~ 5(х), с = const,
xb(x) = 0, 5(jc) + хЬ'(х) = О
следует понимать в смысле данного
определения, т.е. эти соотношения принимают смысл
только после интегрирования их с достаточно
гладкими функциями. Таким образом, 5-функ-
ция, а также и любая обобщенная функция не
являются обычными функциями и
определяются как непрерывные линейные
функционалы над тем или иным векторным
пространством достаточно "хороших" (основных)
функций.
ОБОБЩЕННЫЕ ФУНКЦИИ
595
Другой подход к определению
обобщенной функции состоит в предельном переходе
от обычных функций, описывающих
распределение масс, зарядов в малых объемах и
явлений, происходящих в течение малых
интервалов времени, при неограниченном уменьшении
соответствующих объемов и интервалов
времени. Например, 5-функдия может быть
аппроксимирована дельтаобразной
последовательностью функций fn(x), т.е. fn(x) —> 6(x) в том
смысле, что \fn(x)y(x)dx —> ф(0) для любой
непрерывной функции ф(х). В качестве таких
функций можно указать следующие:
/„(*) =
2я, хе
О, иначе,
-iii
п п\
>/2л
причем
j fn(x)dx = l /2 = 1, 2,...
Основы математической теории
обобщенных функ1дий были заложены С.Л.
Соболевым. Систематическое изложение теории
дал Л. Шварц.
16.1.2. Пространство основных
функций. Функцию ф(х): R" —> R называют
финитной, если она отлична от нуля только
на некотором ограниченном множестве.
Замыкание множества, на котором функция
ф(х) отлична от нуля, называют носителем
функции и обозначают suppcp.
Примером пространства основных
(пробных) функций (основного пространства)
является пространство Ю(£1) — совокупность
финитных функций ф, имеющих
непрерывные производные всех порядков, в открытом
множестве Q с Rn . <D(Q) является
линейным пространством с обычными операциями
сложения функций и умножения их на число.
В этом пространстве нельзя ввести нужным
образом норму, однако в нем естественным
образом вводится понятие сходимости.
Последовательность {ф^} элементов из
'D(Q) называют сходящейся к функции
фб <D(ft), если: 1) имеется компакт, вне
которого все фд- равны нулю; 2)
последовательность производных (под производной
нулевого порядка понимают саму функцию)
|ф^/| порядка / е {0,1,...} сходится на этом
множестве равномерно к ф('.
Примером основной функции служит
«шапочка»
щ(х) =
сеехр
л
е2-Ы2
О,
,|*|<е,
|х|>е,
Г we(x)dx = 1,
Rn
1/2
где | х | = (х[ + ... + х„) - евклидова норма
вектора х е R" .
В некоторых задачах используют также и
другие пространства основных функций,
например, пространство всех бесконечно
дифференцируемых в О. функций, пространство
бесконечно дифференцируемых и быстро
убывающих на бесконечности функций в Rn .
16.1.3. Обобщенные функции.
Обобщенной функцией /или распределением,
называют непрерывный линейный функционал
над пространством <D(Q) основных функций
ф(*); / : ф -> (/>ф) • Множество Ю* (ft)
всех непрерывных линейных функционалов
над пространством Ю(0) основных
функций, т.е. пространство, сопряженное к Ю{0.),
называют пространством обобщенных функций.
Непрерывность функционала /
понимают в том смысле, что (/, ф^) -» (/, ф) , если
последовательность {фА;} сходится к ф в
основном пространстве Ю(0). Сходимость
последовательности {fk} обобщенных
функций из Ю* (Q) определяют как слабую
сходимость функционалов из V (Q), т.е.
/д- —> 0 , к -» оо в Ю* (Q) означает, что
(/,фл)->0, к ->0 для всех фб <D(Q).
596
Глава 16.2. ОПЕРАЦИИ НАД ОБОБЩЕННЫМИ ФУНКЦИЯМИ
Пространство Ю* (О.) — полное: если
последовательность обобщенных функций
{fk} из ^* (^) такова, что для любой
основной функции ере <D(Q) числовая
последовательность {(/а;,ф)} сходится, то функционал
(/,ф)= Ит(/Ьф)
к->оо
принадлежит D* (Q). Всякая обобщенная
функция/из Ю* (Q) есть слабый предел (т.е.
слабый предел последовательности
функционалов) некоторой последовательности
основных функций из <D(Q). Это свойство иногда
берется в качестве исходного для определения
обобщенной функции.
Простейшими примерами обобщенных
функций являются те, которые порождаются
локально интегрируемыми (интегрируемыми
на любом ограниченном множестве) в Q
функциями/:
Ф -> (/, Ф) = J А*)ф(х)Лг, Ф 6 Ю (П).
Такие обобщенные функции, определяемые
локально интегрируемыми в О. функциями,
называют регулярными. Все остальные
обобщенные функции, т.е. не представимые в
данном виде, называют сингулярными. Однако
по аналогии с регулярным случаем значение
сингулярной обобщенной функции / на
основной функции ф часто записывают в виде
(/,Ф) = |/(*)Ф(*)Л.
О
Эту запись нельзя понимать буквально —
соответствующий интеграл расходится или
вообще не имеет смысла. Поскольку между
интегрируемыми функциями и регулярными
обобщенными функциями имеется взаимно
однозначное соответствие, то в этом смысле
обычные функции являются регулярными
обобщенными.
Примером сингулярной обобщенной
функции служит 5-функция, определяемая
как
(5)Ф) = ф(0), <ре©(Яя),
которая описывает плотность единичной
массы, сосредоточенной в точке х = О . Если О. —
область в Яп, содержащая начало координат,
то 6-функция может быть задана формулой
|/(дс)ф(дс)Ас = ф(0).
о
Еще один часто используемый вариант
5-функции Дирака вводится следующим
образом:
(8в,ф) = ф(в), <ре©(Ля).
В отличие от обычных функций
обобщенные функции не имеют определенных
значений в точке. Тем не менее, для
обобщенной функции / из Ю* (О.) имеет смысл
выражение «f равна нулю в области U cQ».
По определению, это означает, что (/, ф) = О
для всех основных функций ф, носитель
которых содержится в U, т.е. supp ф с U.
Множество точек О,, ни в какой окрестности
которых обобщенная функция не обращается
в нуль, называют носителем обобщенной
функции / и обозначают supp / . Носитель
обобщенной функции является замкнутым
множеством. Например, для 5-функции supp 6 = {0}.
Легко видеть, что для определения
6-функции достаточно в качестве
пространства основных функций взять пространство
непрерывных функций.
Глава 16.2
ОПЕРАЦИИ НАД
ОБОБЩЕННЫМИ ФУНКЦИЯМИ
16.2.1. Простейшие операции. Для
обобщенных функций определены операции
сложения и умножения на число, т.е. для
любых обобщенных функций /j, /2
(/1 + /2,ф) = (/ьф) + (/2>ф);
(л/1,ф) = л(/1,ф), феЮ(а), аеЯ.
При этом для регулярных обобщенных
функций операция сложения их как
обобщенных функций совпадает с обычной
операцией сложения функций. Сказанное верно и
в отношении умножения на число.
Для обобщенных функций вводится
операция замены переменных. Пусть /е Ю* (О)
и х = Ay + b — неособенное линейное пре-
ДИФФЕРЕНЦИРОВАНИЕ
597
образование й на Ц с невырожденной
матрицей А. Обобщенная функция / (Ay + b) из
Ю (Ц) определяется равенством
Ряд, членами которого служат
обобщенные функции /д. е Ю* (Q),
(/(Ду + £),Ф) =
/,
Ч>(А-[(х-Ь))
\dttA\
сре£>(/Г).
В частности, если А = Х1, X Ф О,
b = О (т.е. преобразование х = Ху — подобие
с отражением при X < О ), то
если А = J (т.е. преобразование х = у + b —
сдвиг на £), то
Если непрерывно дифференцируемая на
R функция а(х) имеет только простые нули
Х{9 *2> ••■» то функция 5(л(х)) определяется
равенством
В частности,
5(-х) = 6(х), 8(x-fl) = 8e(x);
б(х2 - а2) = у-(5(х - я) + 5(х + я)), л > 0 ;
5(sinx)= V 5(x-&7i).
Если я(х) — бесконечно
дифференцируемое взаимно однозначное отображение
прямой на себя, то обобщенная функция
Ь(а(х)) определяется так:
(8(в(ж)),ф) = |а'(о)|ф(в(х))>
где а(х) — функция, обратная а(х). В
частности, справедливо равенство
Ь(ах + Ь) = \аГ[Ь-Ь/(х).
^к/к
сходится (в смысле сходимости
последовательности обобщенных функций) к
обобщенной функции / если числовой ряд
X **(/*• ф)
сходится к (/,ф) для любой основной
функции фб Ю(О). Даже если члены ряда
представляют собой регулярные обобщенные
функции, сумма ряда может оказаться
сингулярной обобщенной функцией.
Для обобщенных функций вводится
операция произведения на бесконечно
дифференцируемые функции. Пусть/— обобщенная
функция из Ю* (О.) и а(х) — бесконечно
дифференцируемая на О. функция. Тогда
произведение af = fa определяется равенством
(Я/,Ф) = (/>Ф), ф6©(«).
Оказывается, что произведение af
является обобщенной функцией из Ю* (О.). Для
обычных локально интегрируемых функций
произведение af совпадает с обычным
умножением функций f(x) на а(х). В
частности, произведение 5-функции на бесконечно
дифференцируемую функцию а(х) есть
а(х)Цх) = а(0Щх).
Операция произведения не допускает
корректного распространения на любые
обобщенные функции. В некоторых классах
обобщенных функций такое произведение
можно определить, однако оно может
оказаться неоднозначным.
16.2.2. Дифференцирование. Пусть/-
обобщенная функция из <D* (Q). Обобщенная
(слабая) производная обобщенной функции /
Daf= Э(*/(*> , laUcCi+... + а,,,
порядка a = (aj,..., an) определяется
равенством
598
Глава 16.2. ОПЕРАЦИИ НАД ОБОБЩЕННЫМИ ФУНКЦИЯМИ
К/,фИ-1)Н(/,/>°ф), Ф^ ©(О). Пх) = *Ш + ркЧх.Хк),
Производная обобщенной функции сама яв- *=1
ляется обобщенной функцией. Для обобщен- j,r
ных производных, определяемых на D(R), гДе f ~ обобщенная, а — - обычная при
производную / обозначают обычным симво- х ф ^ произв0дная, равная нулю при
лом /', к-ю производную — как /^ , и
X = Xfc .
тогда (/(*\ф) = (-1) (/,Ф(*})> Ф6©(Л), 16.2.3. Дифференциальные уравнения
^ _ q | в классе обобщенных функций. Под обоб-
' '""'' - - . ^ щенным решением дифференциального уравне-
Любая обобщенная функция бесконечно J* ^ ^^ к JV
дифференцируема в обобщенном смысле. Для
дифференцирования произведения af беско- L(x D)y = \ a Day(x) = fix)
нечно дифференцируемой функции а и |а|</л
обобщенной функции / справедлива формула
<ь\ ^ ■ ,, \ ,\ где/-обобщенная функция из <0*(Q), а ап -
Лейбница: (af)(к) = J С^<*-'>/<'> . Если ^ ^ 1
v j ) f-4 бесконечно дифференцируемая функция, в
последовательность обобщенных функций классе обобщенных функций <D*(Q) пони-
{/*} сходится к обобщенной функции / , то мается всякдя функция у т D* (Q) ? удоШ1е_
последовательность производных {f'k} схо- ТВОрЯЮЩая уравнению в Q , т.е. для любой
дится к производной /' предельной функ- основной функции (ре D(Q) должно быть
ции. То же верно и для производных любого выполнено оавеНство (Lv т) - ( f <й\ Всякое
порядка. Это равносильно тому, что всякий выполнено равенство (Ly,<p) - (J,у). Ьсякое
сходящийся ряд, составленный из обобщен- уравнение L(D)y = /, где L(D)*0 -
ных функций, можно дифференцировать
почленно любое число раз дифференциальный оператор с постоянными
Пусть 0(JC) - функция Хэвисайда: коэффициентами, имеет обобщенное решение.
Решениями в классе обобщенных функ-
I х > q. ций уравнения
у' = 0
в(х) = щ
[О, х<0
Тогда
служат только регулярные постоянные
функции (константы).
+°° Для каждой обобщенной функции / из
(е',<р) = -(9,ф') = j Q(x)q>'(x)dx = ©* (д) уравнение
y=f(x)
= -[ф'(х)Лс = ф(0) = (8,ф), феОД, имеет решение) являющееся функцией из
Ю* (R). Общее решение этого уравнения
записывается в виде
У(х) = с + у0(х),
О
т.е.
е'(*) = 8(х)
Производные 5-функции вычисляют
следующим образом: , ч
где с — произвольная постоянная, а у^(х) —
(б(/:),ф) = (-1)* (б,ф(*}) = (-1)* ф(*} (0). обобщенная функц ия, определенная
равенством
Пусть / - кусочно-гладкая функция, ( х \
имеющая в точках хь...,хт разрывы пер- Гу0,ф) = (УО'Фо) =
вого рода со скачками /^,..., рт . Тогда
/,-J<Po№<ft
ВЕСОВЫЕ ФУНКЦИИ
599
Фо(*) = ф(*) - Ф(*) j ф(т)</т,
где ф(/) - обобщенная функция, для которой
верно равенство
Г ф(т)^т = 1.
Таким образом, каждая обобщенная функция
имеет первообразную.
Пусть aik(x) - бесконечно
дифференцируемые функции. Тогда однородная
система п линейных дифференциальных уравнений
с п неизвестными функциями
п
y'i=y£<*ik(x)yk; / = l,...,/i,
имеет «классические» бесконечно
дифференцируемые решения, и никаких новых
решений в классе обобщенных функций эта
система не имеет. Для неоднородной системы
вида
п
У1=У£аИс(х)Ук+А>
где fi — обобщенные функции, решение
существует в классе обобщенных функций и
определяется с точностью до произвольного
решения однородной системы.
Линейное дифференциальное уравнение
с 5-функцией в правой части
^ак(х)у^=Цх-х)
к=0
эквивалентно задаче Коши
ХМ*)У*>=0;
у(х) = у(х) = ... = /"-2\х) = 0;
Дифференциальное уравнение
п т
£ ак(х)/к> = £ ^(х)8<*> (х-х),т<п,
к=0 к=0
эквивалентно задаче Коши
y(x) = y'(x) = ... = /"-V(x) = 0;
/«-'»-') (jc) = «„...,/"-1)(x) = am+1>
где cti, ...,am+[ выражаются через значения
коэффициентов ак, Ьк при х = х . Решение
этой задачи равно нулю при х < х.
16.2.4. Весовые функции. На практике
часто используют метод 5-функции для
нахождения функции Грина для линейных
дифференциальных уравнений, т.е. метод
определения функции влияния точечного источника
с помощью дельта-функции 5(х). Функция
Грина G(x,x) линейного
дифференциального оператора L{x,D) определяется из
уравнения
L(x,D)G(x3x') = b(x-x)
как G{x,x) = L~{(x,D)b(x-x), т.е.
описывает влияние точечного источника,
расположенного в точке х , на значение
возмущения в точке х. Наиболее просто вид обратного
оператора 17 (x,D) определяется в случае,
когда L(x,D) является дифференциальным
оператором с постоянными (не зависящими
от х) коэффициентами. Решение
неоднородного линейного дифференциального
уравнения общего вида для возмущения у(х) с
источником g(x)
L(xiD)y(x) = g(x)
с помощью функции Грина G(x,x')
записывается в виде свертки
y(x) = JG(xix')g(x')dx,
где интегрирование осуществляется по всей
области, в которой действует источник g(x) .
Такой подход нашел широкое
применение в теории управления, в связи с чем
появилась соответствующая терминология. Пусть
динамическая система описывается системой
нелинейных дифференциальных уравнений
600
Глава 16.2. ОПЕРАЦИИ НАД ОБОБЩЕННЫМИ ФУНКЦИЯМИ
\У1=А(У1>-,Уп>*) + 8(*)\
[Уп=/п{У1>->Уп>*)-
В качестве воздействия g(t) выбирается
5-функция, «приложенная» к системе в
момент времени т , т.е.
Д0 = я8(/-т).
Импульсной переходной функцией kit^a)
рассматриваемой системы называют решение
описывающих ее уравнений при нулевых
начальных условиях и при воздействии
ab(t - i) . Произвольное непрерывное
воздействие fit) можно представить в виде
/(0 = J/(T)5(f-T)</T,
о
т.е. рассматривать k{t,x,a) как бесконечную
последовательность 5-функций с амплитудой
fix), определяемой ординатой функции
fit), соответствующей моменту приложения
5-функции. Каждая из 5-функций вызывает в
системе переходный процесс, определяемый
текущей импульсной переходной функцией.
Задача анализа системы при произвольном
воздействии /(/) состоит в том, чтобы
выразить решение системы уравнений через
k{t,x,a). В общем случае, когда
несправедлив принцип суперпозиции, эта задача
неразрешима, но в ряде случаев решение может
быть получено, и понятие импульсной
переходной функции приобретает смысл важной
характеристики системы. В частности,
передаточная функция определяется как некоторое
соответствующим образом выбранное
интегральное преобразование от импульсной
переходной функции.
В качестве иллюстрации найдем весовую
функцию линейной системы, поведение
которой описывается уравнением
Щ (t)y' + a0(t)y = f(t), где fit) = 8(f - т).
Решение этого уравнения совпадает с
решением задачи Коши
al(t)k\t9i) + a0(t)k{t,x) = 0;
*(Г,т) = -1_
я,(т)
Интегрируя это уравнение, находим
импульсную переходную функцию рассматриваемой
системы:
щ(х)
Линейная система с постоянными
параметрами, рассматриваемая как динамический
элемент системы регулирования, описывается
системой линейных дифференциальных
уравнений, которая, если представляет интерес
только одна из переменных, например,
у = У[ , может быть сведена к одному
уравнению вида
any(n\t) + ... + aiy'{t) + a0y{t) =
= bmf^\t) + ... + bif'(t) + b0f(t).
Импульсная переходная функция kit)
представляет собой решение уравнения
*„*<">(/)+ ... + в,А'(0 + во*(') =
= */n8<m>(0 + ... + *,6'(0 + *oS(0
с нулевыми начальными условиями. В виду
стационарности системы импульсная
переходная функция не зависит от момента
приложения воздействия и линейно зависит от
амплитуды а 5-функции, т.е. kit,T,a) =
= akit - т), где через kit - т) обозначается
единичная переходная функция,
соответствующая воздействию при а = 1 , т.е.
fit) = bit - т). Весьма важным свойством
линейных систем является то, что для них
справедлив принцип суперпозиции, т.е.
эффект, вызываемый суммой нескольких
воздействий, равен сумме эффектов каждого из
воздействий в отдельности. Пользуясь этим
принципом, можно найти решение xit) при
любом воздействии fit), если известна
импульсная переходная функция kit):
x(t) = jf{t-x)k(x)d%.
о
Передаточная функция линейной
стационарной системы представляет собой
преобразование Лапласа от импульсной переходной
функции.
16.2.5. Преобразования Фурье и
Лапласа. Преобразование Фурье F[f] обобщенной
функции f определяется равенством
СПИСОК ЛИТЕРАТУРЫ
601
где .F[(p](/) - классическое преобразование
Фурье
а в качестве основного пространства
рассматривается пространство бесконечно
дифференцируемых на Rn функций, убывающих на
бесконечности вместе со своими
производными быстрее любой степени | х | .
Соответствующее сопряженное к нему
пространство называют пространством обобщенных
функций медленного роста.
Обратное преобразование Фурье F~ [/]
обобщенной функции /определяется как
(2л)
Имеют место основные формулы
DaF[f] = /"[(a:)01/] , ха = х,а' ...л£" ;
F[Daf] = (ix)aF[f];
F[f*g] = F[f]F[g],
если g финитна. В частности,
F[xa] = (2K)"(-i)\ahad(x);
F[l] = {2n)"b(x);
F[D%] = (-ix)a;
F[S] = l.
Преобразованием Лапласа обобщенной
функции /называют выражение
L[f](z) = F[f(S)e-№yx) ,z = x + iy.
Обратное преобразование к преобразованию
Лапласа задается равенством
Функцию / называют изображением L[f], a
L[f] называют спектральной функцией
функции/
СПИСОК ЛИТЕРАТУРЫ
1. Кириллов А.А., Гвишиани А.Д.
Теоремы и задачи функционального анализа. М.:
Наука, 1988.
2. Колмогоров А.Н., Фомин СВ.
Элементы теории функций и функционального
анализа. М.: Наука, 1972.
3. Кудрявцев Л.Д. Курс математического
анализа. М.: Высшая школа, 1989.
4. Пугачев B.C. Лекции по
функциональному анализу. М.: Изд-во МАИ, 1996.
Раздел 17
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
Глава 17.1
ТЕРМИНОЛОГИЯ И ОБОЗНАЧЕНИЯ
Под интегральным уравнением часто
понимают уравнение, в котором искомая
функция располагается под знаком интеграла.
Данное определение интегрального уравнения
нельзя считать удачным, на что, впрочем,
указывается практически во всех руководствах
по данному вопросу. Поэтому, не пытаясь
дать обшее определение интегрального
уравнения, перечислим некоторые их частные
виды.
Важное место в приложениях занимают
интегральные уравнения, порождаемые
линейным интегральным оператором К,
действующим в банаховом пространстве X, которое
ниже будет обозначаться В-пространство.
Пространство X чаще всего в приложениях
реализуется как одно из функциональных
пространств: C(Q) или Lp(Q), где О. -
компакт в R" и р > 1 . Напомним, что C(Q) -
i?-пространство непрерывных функций с нор-
мой !*!c(Q) = maxlxwl' MQ) ~ в~пр°-
странство суммируемых на Q функций с
нормой MMQ)= \j\x(t)\pdt ' (р>1),
где dt — дифференциал меры Лебега на Q .
L^ (Q.) - i?-пространство измеримых
существенно ограниченных функций на Qc нормой
1х11^(п)=уга;епах1х(,)1-
В таком случае оператор К можно
задать с помощью функции «двух» переменных
к(t,s), Определенной на QxQ и
удовлетворяющей некоторым дополнительным
условиям, следующим образом
(Kx)(t) = \k(t,s)x(s)ds , (17.1.1)
Q
где х = x(t) e X , ds - дифференциал меры
Лебега на Q. Функцию к (t,s) называют
ядром интегрального оператора К. Ядро k(t,s)
называют фредгольмовым ядром, если оно
удовлетворяет неравенству А: (/, 5*) | dtds < °°.
QxQ
Для интегрального оператора
К : X —> X из (17.1.1) можно
сформулировать два вида задач, цель которых найти
неизвестную функцию х = x(t) е X .
Интегральное уравнение I рода: для заданной функции
/(/) е X найти x(t) e X такую, чтобы
выполнялось равенство
(Kx)(t) = jk(t9s)x(s)ds = fit). (17.1.2)
Q
Интегральное уравнение II рода имеет в
виду решение уравнения
x(t) = f{t) + \i(Kx)(t) = f(t) + \ijk(t9s)x(s)ds9
Q
(17.1.3)
где [i — некоторый комплексный параметр.
Если в уравнении (17.1.3) /(0 = 9(0
(6(0 - нулевая функция), то приходим к
уравнению
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ II РОДА С ВЫРОЖДЕННЫМ ЯДРОМ
603
z(t) = \i(Kz)(t) = \LJk(t,s)z(s)ds , (17.1.4)
Q
из которого нужно найти такие значения
параметра и., при которых указанное
однородное уравнение имеет ненулевое решение.
Различные свойства ядра интегрального
оператора приводят к различным способам
решений уравнений (17.1.2 - 17.1.4) и
различным свойствам решений. Отметим здесь
уравнения, в которых ядро является
неограниченной функцией, точнее один вид такого
рода уравнений, называемых сингулярными.
Простейшие из них — одномерное сингулярное
интегральное уравнение — имеет вид
71/ J С - / J
Г^ Г
(17.1.5)
здесь £ и t суть комплексные координаты
точек на кривой Г, которая представляет
собой контур Ляпунова. Можно считать,
например, что Г — кусочно-гладкая кривая
замкнутая или разомкнутая. Функции a{t),
b(t), /(/) заданны на контуре Г, k(t,Q -
фредгольмово ядро (здесь Q = T).
Расходящийся интеграл понимается в смысле его
главного значения по Коши:
•х(0
dl, = lim
е>0 ГЛ ?-/>еу
*(С)
<Ъ.
В ряде приложений возникают
нелинейные интегральные уравнения, простейшим из
которых является уравнение с ядром Урысона,
т.е. уравнение вида
u(t) = n(Au)(t) + f(t) = iiJK{t,s>U(s))ds + f(t),
где k(t,s,u) и f(t) (t e Q) суть известные
функции.
Глава 17.2
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
ТИПА ФРЕДГОЛЬМА
Среди линейных интегральных
операторов простейшими являются вполне
непрерывные интегральные операторы, а среди вполне
непрерывных простейшими являются так
называемые вырожденные операторы, т.е. такие
ограниченные операторы, у которых
dim (lm К) < ©о . Хотя такие операторы
имеют довольно частный характер, тем не менее,
они составляют весьма значимый в
приложениях класс, так как по существу в любой
вычислительной процедуре могут реализоваться
лишь вырожденные операторы. В связи с
этим возникает естественный, но очень
принципиальный вопрос: можно ли
аппроксимировать вполне непрерывный оператор
вырожденным оператором? На этот вопрос
имеется положительный ответ в важнейшем
для приложений случае, когда наше
^-пространство ^ обладает счетным базисом. Точнее,
имеет место следующее утверждение. Пусть
К — вполне непрерывный оператор,
отображающий В-пространство X в себя, и пусть X
обладает счетным базисом, тогда для
произвольного е > 0 найдется такой вырожденный
оператор В, что || К - В | < е.
Приведем простые достаточные условия,
накладываемые на ядро к интегрального
оператора К из (17.1.1), которые обеспечивают
его полную непрерывность.
Теорема 17.2.1 Если к : Q x Q -> R
(или С), где Q — компакт в R'7 , является
непрерывной функцией «двух переменных», то
оператор, порождаемый соотношением (17.1.1)
и действующий в пространстве С (Q), будет
вполне непрерывным.
Теорема 17.2.2. Если k : Q x Q -> R {или
С), где О. - компакт в R" , и справедливо со-
[ V'
отношение \\f(s) = <\\k(t,s)\p dt> e Lq(Q),
где — + — = 1 (p > 1), тогда оператор, поро-
Р Я
ждаемый соотношением (17.1.1) и
действующий в пространстве Lp(p), будет вполне
непрерывным.
17.2.1 Интегральные уравнения II рода
с вырожденным ядром. Предположим, что
интегральный оператор вида (17.1.1 ) имеет
вырожденное ядро и действует в пространстве
Lp(Q) (случай, когда X = C(Q) технически
немного сложнее), тогда его ядро можно
представить в виде
У=1
(17.2.1)
604
Глава 17.2. ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ТИПА ФРЕДГОЛЬМА
где {фу(0}._ cLp(Q) и {vy(0}.=1cI^(Q) том случае, когда det(/ -\iK) = A(|i) Ф 0 .
[— + — = 1,/?>1 . Предполагается, что
Р q )
К : Lp (Q) —> L^ (Q.). Чтобы избежать
ненужных усложнений будем считать, что обе
системы функций линейно независимые.
Уравнение (17.1.3) с учетом (17.2.1)
принимает вид
N
*(0 = /С) + \i^4>j(t))\Vj(s)x(s)ds ,
У'=1 Q
(17.2.2)
следовательно, решение интегрального
уравнения (17.2.2) представимо в виде
N
x(t) = f(t) + \L^jVj(t). (17.2.3)
У=1
Итак, решение уравнения (17.2.2)
свелось к вычислению констант |£у} . , которые
совпадают со значениями линейных
функционалов
bj = {Vj>x) = jvj(s)x(s)ds j = 1, 2,..., N .
Q
Подставив (17.2.3) в (17.2.2) и
воспользовавшись тем, что функции {фу(0} •_, ли~
нейно независимые, получим систему
линейных уравнений относительно искомых
постоянных, которую представим в виде
x = f + \iKx, (17.2.4)
(У2,/)
где
X =
м
«1,1 KJ>2
К2,1
«2,2
/ =
•'• «1,JV
•~ «2,/V
((VN,f)
здесь
«/V,l K/V,2 •'• KN,N I
V J
Q
Система линейных уравнений (17.2.4)
имеет единственное решение в том и только в
Заметим, что A(|i) — многочлен степени не
выше, чем N. Нулями этого многочлена
являются характеристические числа оператора К
и только они. Таким образом, если
комплексный параметр \i не является
характеристическим числом оператора К, то уравнение
(17.1.3) с вырожденным ядром (17.2.1) имеет
единственное решение при любой функции
/е Lp(p), при этом решение имеет вид
(17.2.3), где коэффициенты {!;,■} находят
как решение системы (17.2.4).
Если параметр |1 удовлетворяет условию
A(|i) Ф 0 , то однородная система линейных
уравнений
а = \iKa,
а также однородная система
где
м
а2
V " )
, ь =
fp0
Р2
М
К =
«1,1 К2Д '
«1,2 «2,2 •
«1,7V «2,W •
•• «ЛМ
•• «#,2
• *N,N
(17.2.5)
имеют лишь нулевые решения, и существует
матрица II-\lK\ , которую можно
представить в виде
(/ - Д)'1 = I + \lK (/ - Д)'1 = / + nf (п),
здесь У - единичная матрица, а матрицу-
функцию r(|i) = КII -\х.К\ можно
называть резольвентой Фредгольма для системы
линейных алгебраических уравнений (17.2.4).
Она представляет собой мероморфную
оператор-функцию с конечным числом полюсов.
Нули многочлена A(|i) и только они
являются полюсами резольвенты Фредгольма,
следовательно, ее можно записать в виде
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ II РОДА С ВЫРОЖДЕННЫМ ЯДРОМ
605
1
д(и:
Пи) =
.Ц1.
^
.Ц1.
^.чСОЮЗ 1
-jjr) = —
' А(ц)
/^
^чСОЮЗ
Л(Ц),
2>(ц) = (/-ц*) ,
Если теперь воспользоваться разложе-
N ~ N
ниями x = ^(bj9x}aj и / = £(£у,/)я/
У=1 У=1
и подставить их в (17.2.4), то получим
(bj,x) = (hj,f) + ±(bj,x)=>
^.чСОЮЗ
где (1 - [iK) — союзная матрица к мат-
il -[iK) и представляет собой матрич-
M-^fi'-П
рице
ный многочлен, поэтому D([i) также
является матричным многочленом.
Таким образом, решение системы
(17.2.4) теперь можно представить через
резольвенту Фредгольма следующим образом
x = / + uf(u)/. (17.2.6)
Ситуация становится особенно
прозрачной, если у матрицы К существует
собственный базис, т.е. базис из собственных векто-
ров. Пусть это будут \dj\ т и dj =\ljKdj
j = 1,2,..., N , где ui;j ._ суть
характеристические числа, занумерованные каким-либо
способом, например, в порядке не убывания
их модулей. Тогда у оператора К также
существует собственный базис, т.е. такие ли-
нейно независимые векторы \bj\m , ДЛЯ
которых имеет место bj=\i;K bj
(j = l,2,...,N), где {р Л ._ суть характери-
^*
стические числа оператора К . Важной
особенностью рассматриваемой ситуации
является то, что построенные два базиса образуют
биортогональное семейство, следовательно,
\aj\. и \bj\ можно выбрать так, чтобы
/7 - \ о [I ecjmj = k,
выполнялось (bj,aic) = 0;к = <
\ / у' [0, если j Ф к.
N АГ
Здесь W,flA:) = ^pL Ми , а векторы |я/} _
Из последнего соотношения легко
получить
х = / + цУ-* '-а], (17.2.7)
откуда сразу получается резольвента
Фредгольма:
Теперь рассмотрим случай, когда
значение параметра и. совпадает с одним из
характеристических чисел оператора К, т.е.
|1 = \1к (Д(|1^) = 0). Из разложения (17.2.7)
следует, что в этом случае система уравнений
(17.2.4) не имеет решений, если хотя бы для
одного собственного вектора оператора К ,
соответствующего характеристическому числу
Д^ , выполняется неравенство \bk,f) Ф 0 .
Если же (Ь/с, f) = 0 для V Цу = Ц^ , то
система уравнений (17.2.4) разрешима, но не
единственным образом, и общее решение
представимо в виде
(17.2.8)
где {о/}^_. — произвольные постоянные, а
\Р
I' -
П,
максимальная линейно независи-
(17.2.5).
w=l
имеют вид, как в соотношениях
мая система собственных векторов оператора
К, соответствующих характеристическому
числу \х.к .
Результат, сформулированный выше, в
своей основной части верен и в случае, когда
606
Глава 17.2. ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ТИПА ФРЕДГОЛЬМА
оператор К не обладает собственным
базисом. Если параметр |1 не является
характеристическим числом оператора К , то решение
(17.2.4) существует, единственно и представи-
мо в виде (17.2.6). Если же и, совпадает с
каким-либо характеристическим числом
оператора К, то Д будет характеристическим
числом оператора К , при этом
dim ker (/ - и.К) = dim ker / - \iK . Тогда
либо для v£ e ker / - fLfiT справедливо
b,f) = 0, либо система уравнений (17.2.4)
неразрешима, при этом решение системы,
когда оно существует, будет неединственным
и его можно представить в виде (аналог
соотношения (17.2.8))
Х = XQ +2^°1а >
/=1
где хо — частное решение (17.2.4), <а > —
собственные векторы оператора К ,
соответствующие характеристическому числу |1, и
{°/}л-1 ~ произвольные постоянные.
17.2.2 Интегральные уравнения II рода
с ядром общего вида. Здесь будем обсуждать
решение интегральных уравнений вида
*(') =f(t)+\L(Kx)(t) ^f(t)+\ijk(t9s)x(s)ds9
Q
ядра которых k(t,s) порождают линейный
вполне непрерывный оператор К,
отображающий ^-пространство X в себя. Под
пространством X здесь понимается либо С (Q),
либо Lp (Q) (р > 1).
Как и для уравнения с вырожденным
ядром, удобно, кроме уравнения (17.1.3),
рассматривать два однородных уравнения,
аналогичных уравнениям (17.2.5):
a{t) = jj. | k(t, s)a(s) ds и
Q
b(t) = \ijk(s9t)b(s)ds.
Q
Ненулевые решения этих уравнений дают
собственные функции операторов К и К* .
Значения параметра и. и Д, для которых
существуют собственные функции, являются
характеристическими числами операторов К и
К* . Для рассматриваемых операторов
справедливы следующие утверждения.
Теорема 17.2.3. Операторы К и К*
имеют либо конечное, либо счетное множество
характеристических чисел; если этих чисел
счетное множество, то они стремятся к
бесконечно удаленной точке на комплексной
плоскости.
Теорема 17.2.4. Если jj.q —
характеристическое число оператора К, то До будет
характеристическим числом оператора К , и
при этом будет выполняться равенство
dim ker (/ - [IqK) = dim ker (/ - До ^*) < °° •
Теорема 17.2.5. Если значение параметра
\i не является характеристическим числом
оператора К, то уравнение (17.1.3) имеет
единственное решение для любого элемента
feX.
Можно расширить результат последней
теоремы, если допустить, что параметр |1
принимает произвольные комплексные
значения.
Теорема 17.2.6. Для того чтобы
неоднородное уравнение (17.1.3) имело решение
необходимо и достаточно, чтобы свободный член
fit) был «ортогонален» любому решению
однородного сопряженного уравнения. Другими
словами, для произвольного решения b(t) уравнения
bit) = Д kis, t) bis) ds должно выполняться
Q
соотношение (£,/) = =jbit)fit)dt = 0.
Q
Важным дополнением к указанным
выше утверждениям является следующий факт.
Теорема 17.2.7. Если ядро удовлетворяет
неравенству
ВК=\ \\\kit,s\2dtds\ <oo, (17.2.9)
т.е. является фредгольмовым, и jij, jJ-2, ••• суть
характеристические числа интегрального
оператора К вида (17.1.1), то справедливо
неравенство
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ II РОДА С ЯДРОМ ОБЩЕГО ВИДА
607
М
Вк= \\\k(t9s)\2dtds.
QxQ
Прежде чем переходить к построению
резольвенты Фредгольма, которая дает
решение неоднородного уравнения (17.1.3) при
весьма общих условиях, рассмотрим
представление решения неоднородного уравнения в
виде так называемого ряда Неймана.
Пусть jj-i — наименьшее по модулю
характеристическое число оператора К вида
(17.1.1), тогда для V п. такого, что ||i| < \\\,\ | ,
можно найти решение в виде степенного ряда
по параметру |1. Такое решение допускает
представление:
т=\ q
(17.2.10)
где
k{(t9s) = k(t9s) и
km(t9s) = \k(t9s{)km_x {si9s)ds{ .
Q
Ряд, который представляет решение
интегрального уравнения, сходится, вообще
говоря, по норме #-пространства X. При
практическом применении рядов Неймана приходится
сталкиваться не только с трудоемкой задачей
вычисления итерированных ядер km(t9s) , но
и с нахождением круга сходимости по
параметру |1. В случае, когда интегральный
оператор К не имеет характеристических чисел,
ряд Неймана сходится при всех комплексных
значениях |1. В общей же ситуации нужно
уметь оценить радиус круга сходимости. Если
выполняется (17.2.9), то ряд Неймана заведомо
I I 1
сходится в круге \\i\< .
Пусть выполнены указанные выше
условия, тогда в (17.2.10) можно изменить
порядок суммирования и интегрирования, что
приводит к следующей форме решения
интегрального уравнения (17.1.3):
x(t) = f{t) + \if TXt,s\\L)f(t)ds , (17.2.11)
Q
где
r(t,s;\i)=^\Lm-lk„(t,s). (17.2.12)
Полученная выше функция допускает
аналитическое продолжение по переменной |1
на всю комплексную плоскость. Это
продолжение и является резольвентой Фредгольма.
Отметим важнейшие свойства резольвенты.
1. Резольвента единственна.
2. Если ядро фредгольмово, т.е.
удовлетворяет неравенству (17.2.9), то для любого |1,
которое не совпадает с характеристическим
числом оператора К, выполняется неравенство
jj\r(t,s;\L)\2dtds<.
QxQ
3. Резольвента есть мероморфная
функция от переменного \1.
4. Полюсы резольвенты совпадают с
характеристическими числами оператора К.
5. При малых по модулю комплексных
значениях параметра |1 резольвента предста-
вима в виде степенного ряда Неймана (17.2.12).
6. Резольвента удовлетворяет
интегральным уравнениям
Г(/,s;\i) = k(t,s) + \ijk(t9s{)r(sbs;\i)ds{ ,
Q
r(t9s;\i) = k(t9s) + \i\r(t9s;\i)k(si9s)ds{ .
Q
В силу свойства 4 резольвента предста-
вима в виде
к'-^'^т1' (17213)
где D(t9s'9\i) и D([i) суть целые функции от
|1. Если эти функции удается построить, то
резольвента становится известной функцией,
и решение интегрального уравнения можно
найти, используя соотношение (17.2.11).
Для числителя и знаменателя дроби
(17.2.13) Фредгольмом были получены
представления в виде рядов, называемых теперь
рядами Фредгольма:
D(t,s;n) = У tl¥.B„(t,s)\in , (17.2.14)
Я(н) = Х^г^„ц". <17-2Л5>
л=0
Здесь
с0=1; Bo(t,s) = k(t,s),
c„=JB„_i(t,t)dt, л>0,
608
Глава 17.2. ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ТИПА ФРЕДГОЛЬМА
Л>1,
где используется обозначение
\dS{ds2--dsn ,
(V:
\>ч>-
Лл
S\9S2, .--, Sp
k(t{s{) k(t{s2)
k(t2s{) k(t2s2)
k(t{sp)
k{t2sp)
*(Vl) *('/Л) "• *(^/»)
Представленные соотношения довольно
трудно использовать при практических
вычислениях, поэтому часто используется
рекуррентная формула
B„(t9s) = c„k(t9s) - njk(t9s{)B„_{ (sbs)ds{,
Q
которая позволяет последовательно находить
функции Bn(t9s) и числа сп .
Функцию D(\i) называют определителем
(детерминантом) Фредгольма, а функцию
D(t,s\\\) — первым минором Фредгольма.
Миноры Фредгольма порядка р
определяются из соотношения
D
s{ s2
.. tn
= k
(h h
'П
J| S2 ... Sp
,(-1)"
ZW-J*
n=i
Очевидно, D(t,s\\i) = D
При любом р > 1 и любых (tj9Sj)e Q.
ряд (17.2.16) представляет собой целую
функцию от |1. Это утверждение можно доказать
даже в случае, когда ядро интегрального
оператора является ограниченной, измеримой
функцией в Q х Q. , при условии что Q. —
ограниченное измеримое множество.
Миноры Фредгольма можно
использовать для определения собственных функций
оператора К и К* . Пусть jIq ~~
характеристическое число оператора К , и пусть при
|1 = jj-О все миноры порядка, меньшего р ,
тождественно равны нулю, а минор порядка р
отличен от тождественного нуля.
Предположим также, что для фиксированных
,0 ,0 ,0 _0 _0 _0
Ч >г2>'"г/>>51 >52>'*"5/>
D
h h
-о „о
^0
*0.
Тогда функции
ak(t) = D\
f<?
t°
*к-\
lk+\
S\
sk-\ sk sk+\
£ = 1,2,...,/?,
суть линейно независимые собственные
функции оператора К , соответствующие ха-
Q Q
s{ s2
*l •■' *р
\dzy-dXp.
(17.2.16)
рактеристическому числу jIq • Представленная
система функций является максимальной
линейно независимой системой собственных
функций оператора К, соответствующей
характеристическому числу JJ.Q • Другими словами,
dim ker (/ - М-о^) = Р ■
Аналогично, функции
мо = д
('? •
•■ tf-l
t s°k+l ■
■•',
•• s
Ho
k = 1,2, ...,p
образуют полную систему собственных
функций сопряженного оператора К ,
соответствующую характеристическому числу До»
т.е. dlmkcvll -Ц0К*) = р .
17.2.3 Интегральные уравнения II рода
с симметрическим ядром. Фред гол ьмово
ядро k(t,s) называется симметрическим, если
имеет место
k(t,s) = k(s,t). (17.2.17)
Вещественное ядро симметрично, если
k(t9s) = k(s,t). (17.2.18)
Интегральный оператор К,
порождаемый ядром с условием (17.2.17) или (17.2.18),
естественно рассматривать как оператор,
отображающий Н-пространство L2 (Q) в L2 (Q).
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ II РОДА С СИММЕТРИЧЕСКИМ ЯДРОМ
609
Отметим основные свойства
интегрального оператора с симметрическим ядром.
1. Ненулевой интегральный оператор с
симметрическим ядром имеет, по крайней
мере, одно характеристическое число.
2. Все характеристические числа
являются вещественными величинами.
3. Собственные функции интегрального
оператора с симметрическим ядром,
относящиеся к различным характеристическим
числам, ортогональны.
Может оказаться, что одному и тому же
характеристическому числу соответствует
несколько линейно независимых собственных
функций. Применив к ним процесс ортогона-
лизации, можно получить ортогональную
систему собственных функций, которые
соответствуют одному и тому же
характеристическому числу. Следовательно, у интегрального
оператора с симметрическим ядром имеется
ортогональная система собственных функций,
которую для удобства отнормируем.
Характеристические числа и
собственные функции удобно записывать в виде
последовательности
Ш ^2
a{(t) a2(t)
Ш
*/,(')
в которой характеристические числа
выписываются в порядке возрастания их абсолютных
величин: | \\.п | < | [in+\ | ; каждое
характеристическое число выписывается столько раз,
какова его кратность, поэтому кратные
характеристические числа повторяются;
собственные функции d[(t), a2(t),..., an(t),...
нормированы и попарно ортогональны.
Если собственные функции и
характеристические числа оператора К найдены, т.е.
известны решения уравнений
ап(0 = \injk(t9s)an(s)ds (п = 1, 2,...),
то решение уравнения (17.1.3) можно найти в
виде разложения в обобщенный ряд Фурье по
собственным функциям оператора К:
x(t) = f{t) + VSp^an{t), (17.2.19)
где (tf/,,/)= \an{t)f{t)dt. Соотношению
Q
(17.2.19) можно придать смысл и в том
случае, когда параметр |1 совпадает с каким-
либо характеристическим числом.
Предположим |i = \ip+{ = \х.р+2 = ... = \iq , тогда
решение уравнения (17.1.3) существует в том и
только в том случае, когда
(*„,/) = p"(0/(/)df = 0 (п = р + \,р + 2,...
Q
...,#). В этом случае формула (17.2.19)
принимает вид
x(t) = f(t) + np+i X {a"_J) an(t) +
я
+ X aJ-Pa№>
j=p+l
где {ос ;_Л . — произвольные постоянные.
Из выражения (17.2.19) следует, что
резольвента интегрального уравнения, в
котором интегральный оператор имеет
симметрическое ядро, может быть представлена в виде
Легко получить
откуда сразу можно получить разложение для
итерированных ядер
м,,5) = ££^£) (тя1|2|...).
п »С
(17.2.20)
Следовательно, из последнего равенства
непосредственно вытекает, что система
характеристических чисел и собственных функций
интегрального оператора с итерированным
ядром km(t,s) имеет вид
..т ..т ..т
Hi H2 •"• М-л .
a{(t) a2(t) - an{t)
; w = l,2,...
Из соотношения (17.2.20) также следуют
тождества
п I1" QxQ
Для интегрального оператора L,
действующего в пространстве L2 (Ф), ядро
которого l(t,s) удовлетворяет неравенству
20 — 7706
610
Глава 17.2. ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ТИПА ФРЕДГОЛЬМА
Bi <оо (см. (17.2.9)), можно ввести в
рассмотрение два положительных
самосопряженных оператора Ку = LL* и К2 = L*L с
ядрами k\{t,s) и kjit^s), где
k{(t,s) = fl(sl9t)l(sl9s)ds{;
Q
k2(tis) = jl(t,s[)l(s,sl)dsl.
Q
Ядра ki(t,s) и kjit^s) называют ядрами
Шмидта для ядра l(t, s).
Если Vi,V2,... суть характеристические
числа интегральных операторов, порождаемых
ядрами Шмидта, и |я/;(0( ~ ортонормиро-
ванные собственные функции оператора Kj,
и |£л(0( ~ ортонормированные собственные
функции оператора К\, то оказываются
справедливыми равенства
/(м)=х
a„(t)b„(s)
'? К
an(t)bn(s)
I (t,S) = /(5,0 = > j=
(17.2.21)
Ряды сходятся в среднем в Q по
совокупности переменных t и 5, при этом выполняется
неравенство
Xf <Bl=\\\l{Us)\2dtds.
п п QxQ
17.2.4. Решение интегральных
уравнений I рода. Сначала рассмотрим случай,
когда оператор К, действующий в
Н-пространстве Lj (О) , имеет симметрическое ядро
k(t,s) . При таком предположении решения
однородного уравнения 1 рода
\k(t,s)u(s)ds = 9(0 (17.2.22)
Q
(9(0 ~ нулевая функция)
совпадают с функциями, ортогональными ко
всем собственным функциям оператора К.
Следовательно, решения (17.2.22) будут
состоять лишь из нулевой функции, если
собственные функции оператора К образуют полное
семейство в пространстве Lj (Ф) • Если
указанное семейство не является полным, то
уравнение (17.2.22) будет иметь не более, чем
счетное множество линейно независимых решений.
Неоднородное уравнение 1 рода
f k(t,s)u(s)ds = f(t), (17.2.23)
Q
в котором /gjL2 (Ф), разрешимо в том и
только в том случае, когда выполнены
следующие два условия: (а) /(0 разлагается в
сходящийся в среднем ряд по собственным
функциям оператора К
/<0 = 5>Я,/Н(0;
п
(б) числовой ряд Vu„ (fl/i>/)| сходится.
/1
При таких условиях общее решение (17.2.8)
можно записать следующим образом:
u(t) = u0(t) + £щ (ani f)an{t),
п
где Wq(0 "" произвольное решение
однородного уравнения (17.2.22). Если же собственные
функции оператора К образуют полное
семейство в пространстве Lj (p.), то в последнем
соотношении не будет первого слагаемого:
"(0 = ХМдл>/К(0-
п
Если у интегрального оператора L ядро
несимметрическое, но для него справедливы
разложения (17.2.21), то решениями
однородного уравнения
jl(t,s)u(s)ds = Q(t) (17.2.24)
(9(0 - нулевая функция)
являются функции, ортогональные ко всем
функциям {bn(t)} (собственные функции
оператора К\ = LL* ). Следовательно,
последнее уравнение имеет лишь нулевое
решение в том случае, когда собственные функции
оператора К[ образуют полное семейство в
пространстве Lj (О) .
СПЕКТРАЛЬНЫЕ СВОЙСТВА ИНТЕГРАЛЬНЫХ ОПЕРАТОРОВ С ПОЛОЖИТЕЛЬНЫМИ ЯДРАМИ 611
Для разрешимости неоднородного
уравнения 1-го рода
jl(t,s)u(s)ds = f(t) (/eZ2(Q)) (17.2.25)
n
необходимо и достаточно, чтобы свободный
член /(/) разлагался в ряд по собственным
функциям оператора К2, т.е. по ортонорми-
рованным функциям {an(t)} ,
/с)=хк,/к(о.
п
Здесь (an,f) = J f(s)an(s)ds . При этом ука-
п
занное разложение должно сходиться в
среднем и, кроме того, ряд ]ГДн|(я„,/)| дол-
п
жен быть сходящимся, тогда общее решение
уравнения (17.2.25) можно представить в виде
"(О = "о(0 + £VM^/)M>),
п
где u$(t) ~ произвольное решение
однородного уравнения (17.2.24).
Если собственные функции оператора
К[ образуют полное семейство в
пространстве Li(p) , то Wq(/) = G(/), и решение
уравнения (17.2.25) записывается в виде
/7=1
Глава 17.3
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
С НЕОТРИЦАТЕЛЬНЫМИ ЯДРАМИ
В этой главе рассмотрены интегральные
операторы К, ядра которых k(t,s)
((/,s)e QxQ) являются неотрицательными
функциями и либо непрерывны, либо
удовлетворяют неравенству (17.2.9). Если ядро k(t,s)
непрерывно, то речь будет идти о непрерывных
собственных функциях, если же ядро
квадратично суммируемо, т.е. выполняется (17.2.9), то
будем говорить о собственных функциях,
интегрируемых с квадратом. Аналогично будем
считать, что все функции, встречающиеся в
приводимых ниже рассуждениях и
утверждениях, нужно считать непрерывными, если k(t,s)
непрерывно, и квадратично суммируемыми,
если выполнено условие (17.2.9).
Непрерывное неотрицательное ядро
k(t,s) называется неразложимым, если при
любом разбиении множества Q на две
непустые непересекающиеся части ^ и Г22
найдутся такие t$ e Qy и Sq G ^2 » что
k(t0,s0)>0.
Теорема 17.3.1. Ядро k(t,s) неразложимо
в том и только в том случае, когда для любой
неотрицательной непрерывной функции <р(/),
не равной тождественно нулю, найдется такая
итерация ядра kj^(t,s) (см. соотношение,
следующее после (17.2.10)), где N, вообще говоря,
зависит от <р, что
\kN(t,s)<p(s)ds > 0 (для V t е Q).
Q
Из неразложимости ядра k(t, s) вытекает
неразложимость каждой его итерации km(t,s),
и, наоборот, из неразложимости km(t,s)
следует неразложимость ядра k(t,s) .
Важными примерами неотрицательных
ядер являются функции Грина ряда краевых
задач, которые часто встречаются в
приложениях. В табл. 17.3.1 приведены примеры
функций Грина G(t,s) некоторых краевых
задач, связанных с обыкновенными
дифференциальными уравнениями второго порядка.
Во всех примерах G(t, s) = G(s, t), поэтому
приведены значения функции Грина только
для t < s .
17.3.1. Некоторые спектральные
свойства интегральных операторов с
положительными ядрами. Для интегральных
операторов с положительными ядрами вводится
понятие позитивного собственного значения X ,
т.е. такого собственного значения, для
которого собственная функция неотрицательная.
Теорема 17.3.2. Пусть k(t,s) -
неотрицательное ядро, и пусть существует
положительная на некотором множестве ненулевой
меры функция <Ро(0 , для которой
jk„,(t,s)q>0(s)ds > сиро(0 (/е О),
а > 0 , km(t,s) - итерированное ядро
некоторого порядка т. Тогда оператор К, ядро
которого k(t,s) , имеет, по меньшей мере, одно
20*
612 Глава 17.3. ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ С НЕОТРИЦАТЕЛЬНЫМИ ЯДРАМИ
17.3.1. Функции Грина некоторых краевых задач
Дифференциальный оператор
-/'(')
Ы')/(')Т >
g(t)>o,
-ty -у
{-ty'U^y
Краевые условия
j,(0) = j>(/) = 0
^(0) = /(/) = 0
/(0) = ^(/) = 0
у(0) = у(1) = 0
,(0) = /(/) = 0
у(0) = у(1) + су'(1) с>0
у(0) конечно, у(1) = 0
.у(О) конечно, у(1) = 0
Функция Грина G(t,s)
•И)
s
l-s
а(Л 4(<Ms)g(l)
q(> c + q(l)g(l)
/
1
In
(s) I2"
позитивное собственное значение Xq . Это
позитивное собственное значение удовлетворяет
неравенству Xq > /va .
Приведем еще один признак
существования позитивного собственного значения,
формулируемый в других терминах.
Теорема 17.3.3. Пусть интегральный
оператор К с неотрицательным ядром k(t,s)
имеет хотя бы одно ненулевое (вещественное
или комплексное) собственное значение. Тогда он
имеет позитивное собственное значение.
Позитивные собственные значения
позволяют определить спектральный радиус
оператора К. Действительно, пусть Л —
наибольшее из его позитивных собственных
значений, тогда можно доказать, что все
собственные значения X интегрального оператора
К удовлетворяют неравенству | X | < Л.
Позитивное собственное значение Л
обладает следующим важным свойством,
которое содержится в следующей теореме.
Теорема 17.3.4. Пусть ядро k(t,s)
неразложимо, тогда оно имеет единственное
позитивное собственное значение Л. Это
собственное Л простое, и оно больше абсолютных
величин всех остальных собственных значений.
Все интегральные операторы,
порождаемые функциями Грина, приведенными в
табл. 17.3.1, имеют позитивное собственное
значение Л с указанными в теореме 17.3.4
свойствами.
Важным свойством интегральных
операторов с неотрицательным ядром k (t,s)
является то, что при некоторых естественных
предположениях неоднородное интегральное
уравнение
\iu(t) = /(/) + jk(t,s)u(s)ds (17.3.1)
имеет неотрицательное решение.
Теорема 17.3.5. Пусть и. > Л, где Л -
наибольшее позитивное собственное значение
оператора К с неотрицательным ядром k(t, s) ,
тогда для любой неотрицательной функции f(t)
уравнение (17.3.1) имеет единственное
неотрицательное решение u(t) , которое можно
получить методом последовательных приближений
H"n+l(0 = /(0 + jk(t,s)u„(s)ds
a
при произвольном начальном приближении Ц)(/).
В частности, если положить щЦ) = 0 , то
ИНТЕГРАЛЬНЫЕ ОПЕРАТОРЫ С ОСЦИЛЛЯЦИОННЫМИ ЯДРАМИ
613
"(» = I
(Kmf)(t)
т=[
,т+\
(17.3.2)
Теорема 17.3.5 допускает обобщение.
Теорема 17.3.6. Если уравнение (17.3.1)
имеет положительное решение хотя бы при
одной положительной функции /о (0» то
[I > А , и поэтому уравнение (17.3.1) имеет
неотрицательное решение при произвольной
неотрицательной функции /(/).
Скорость сходимости ряда (17.3.2)
оценивается соотношением
fl«-«j<C(^Aj,
где
С(\1)
некоторая константа,
" (K'"f)(t)
. /и+1
И = ™*И')|,
если ядро k(t,s) и функция /(/)
непрерывны. Если же ядро удовлетворяет условию
(17.2.9), то \у\-
\\y{t)\2dt
17.3.2 Важнейшие свойства
интегральных операторов со стохастическими
ядрами. Неотрицательное непрерывное ядро
k(t,s) называют стохастическим, если
\k(t,s)ds = \ (для We Q).
Очевидно, функция %(t) si (V / е Q)
является собственной функцией,
соответствующей собственному значению Xq = 1,
интегрального оператора, порожденного
указанным выше ядром. Остальные собственные
значения X оператора со стохастическим
ядром удовлетворяют неравенству | X | < 1.
Примеры показывают, что у операторов со
стохастическими ядрами могут быть такие
собственные значения, что X * 1, однако
| X | = 1 . Такие собственные значения
называют пермутаторами.
Отметим важнейшие свойства
интегральных операторов со стохастическими ядрами.
1. Все собственные значения оператора,
по модулю равные единице, суть натуральные
корни из единицы.
2. Множество собственных функций,
отвечающих собственному значению Х$ = 1,
имеет базис, состоящий из неотрицательных
функций {<Zy(0} _, > которые обладают
следующими свойствами
а) для каждой функции fly(f) существует
по меньшей мере одна точка /q е CI такая,
что dj (/о) > 0, в то же время ат (/q ) = 0 для
V т* j и т< р\
б) для каждой точки множества Q
найдется, по крайней мере, одна функция базиса,
положительная в этой точке;
в) множество собственных функций
транспонированного уравнения
\k(s,t)b(s)ds = Xb(t),
соответствующие собственному значению
Л, = Л,о = 1 , имеет базис, состоящий из
неотрицательных функций {^у(0} _. > которые
образуют биортогональную систему функций
к системе {я/(0}._. и которые обладают
свойством
bj{t)bm(t) = 0для V/gQ идля
y,w = l,...,/?; j' *m.
17.3.3. Интегральные операторы с
осцилляционными ядрами. Здесь будет
описан класс интегральных операторов с
неотрицательными ядрами, все собственные
значения которых положительные и простые, а
собственные функции образуют такую систему,
которая во многих отношениях напоминает
систему функций вида {sin nt}~=l (/ e [0; я]) .
Осцилляционные матрицы. Матрицу А
называют вполне неотрицательной (вполне
положительной), если неотрицательны
(положительны) все миноры любых порядков этой
матрицы.
Всякую вполне неотрицательную
матрицу А, некоторая степень которой Ат вполне
положительная, называют осцилляционной
матрицей.
Прежде чем формулировать основные
результаты, относящиеся к свойствам осцил-
ляционных матриц, введем некоторые
понятия и обозначения.
614 Глава 17.3. ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ С НЕОТРИЦАТЕЛЬНЫМИ ЯДРАМИ
Пусть имеется некоторый набор
вещественных чисел
r = {Yi,Y2>Y3>->Ytf}-
Если некоторые из чисел данного набора
равны нулю, то им припишем произвольно
выбранный знак: плюс или минус. После этого
можно подсчитать число перемен знака в
наборе Г. Это число будет меняться в
зависимости от выбора знаков у нулевых членов
системы Г. Наибольшее и наименьшее
значение этих чисел будем называть
соответственно максимальным и минимальным числом
перемен знака в системе Г и их будем
обозначать через S£ и S^ . Если S£ = Sf, то
будем говорить о точном числе перемен знака в
системе Г и будем его обозначать Sr.
Очевидно, j5*p = jS*p в том и только в том случае,
когда Yi и удг отличны от нуля, и если
Yy =0,то Yy-iYy+l <0-
Теорема 17.3.7. 1. Все
характеристические числа осцилляционной матрицы А порядка
пхп положительные и простые. Поэтому
можно считать, что
\i{ >[i2>->[i„>0.
2. Пусть Лу = (ос1у,а2у,...,ослу) -
собственный вектор осцилляционной матрицы,
соответствующий характеристическому числу |1 .•
(у = 1, 2,..., п). Тогда для любых чисел ср,
ср+\> •••> cq
1 < р < q < и; £
4>0
т-р
перемен знака среди координат вектора
я
а = 2_. стат заключено между р - 1 и
т-р
q-\:
q-\>S+a>Sl>p-\.
В частности, среди координат вектора д,-
имеется точно j -1 перемена знака:
Sij=S-.=j-\; (j = 1,2,..., п).
3. Нулевые координаты двух
последовательных собственных векторов а,, a,+j
(у = 2,..., п - 1) осцилляционной матрицы
перемежаются.
При доказательстве осцилляционности
конкретных матриц, встречающихся в
приложениях, фундаментальную роль играет
следующий критерий.
Теорема 17.3.8. Для того чтобы вполне
неотрицательная матрица А с элементами
\ajm) U>m = 1»2,..., /l) была осцилляционной,
необходимо и достаточно, чтобы выполнялись
следующие условия:
1. А — неособенная матрица;
2. aJj+l>0 и aJ+iJ>0 {j = 1,2,..., л-1).
Осцилляционные ядра. Пусть ядро k(t, s)
интегрального оператора определено на
квадрате [а, р] х [а, р] с R , неотрицательно и
непрерывно. Обозначим через / промежуток,
получаемый из (ос, р) присоединением конца
а , если к (а, а) * О, и конца р , если
*(Р,Р)*о.
Ядро k(t,s) ((t,s)e [a,p]x[cc,p])
называют осцилляционным, если для любых
{tm} _. с /, среди которых, по крайней
мере, одна из этих точек принадлежит (ос, р),
матрица k(tj,tm") (j,m = 1, 2,..., п) осцил-
ляционная. Для осцилляционного ядра
справедливы неравенства
\k(ths{) ». k(thsn)\
>0
*('m*l) •• *('/pj/i)|
для произвольных значений [tm] , с/ и
{sm}f =i с I» удовлетворяющих
соотношениям *т < *т+\ и *т < *т+1 ■
Отметим основные свойства
собственных функций и собственных значений
интегрального оператора, порождаемого
осцилляционным ядром:
все его собственные значения
положительные и простые;
собственная функция 0[(t),
соответствующая наибольшему собственному значению
Х\, не имеет нулей в промежутке /;
если собственные значения
занумерованы в порядке их убывания, то собственная
функция am(t), соответствующая собствен-
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
615
ному числу Хт , имеет в точности т - 1
узлов в промежутке / и никаких других нулей в
указанном промежутке не имеет;
узлы двух соседних собственных функций
am{t) и am+\{t) (т = 2, 3,...) перемежаются;
при любых р и q (1 < р < q) и произ-
1слах {сД._
вольных
таких, что
Х«?>°
J=p
линейная
комбинация
u(t) = /^CjQjjt) собственных функций имеет
j=p
в промежутке / не более q -1 нулей и не
менее р -1 узлов. Здесь под умом функции
понимается нуль функции нечетного порядка.
Глава 17.4
ОДНОМЕРНЫЕ СИНГУЛЯРНЫЕ
УРАВНЕНИЯ
Для функций одной независимой
переменной, которыми мы и будем заниматься в
настоящем разделе, введем необходимые
вводные понятия.
17.4.1 Основные определения. Пусть
Г — спрямляемая кривая, замкнутая или
разомкнутая, расположенная в комплексной
плоскости. Кривую Г часто называют
контуром. Пусть С — комплексная координата
точки контура Г. Допустим, что функция
/(C)» определенная почти всюду на нашем
контуре, обладает следующим свойством: на
контуре Г существует такая внутренняя
точка /, что, если эту точку вырезать кругом с
центром в / и произвольного радиуса е > 0,
то на оставшейся части Ге контура Г
функция /(С) суммируема. Если при этом
существует предел
HmJ/«K.
е->0
то его называют сингулярным интегралом.
Здесь используют обычное обозначение
Важный класс сингулярных интегралов
дает нам интеграл типа Коши:
-[?%С (/€Г), (17.4.1)
WfC-'
где Г - ляпуновский контур, т.е. такой
контур, в каждой точке которого определена
касательная, и угол 0 между касательными в
точках t\ и tj удовлетворяет неравенству
0 < Л\ t{ - /2 |V , где Л и v суть
положительные постоянные. В этом случае интеграл
(17.4.1) существует, если функция и (С)
удовлетворяет условию Гельдера с показателем v ,
т.е. справедливо неравенство
|ц(;,)-«(с2)|МС|-С2Г. (,7-4-2)
где Л и v суть положительные постоянные.
Пусть Г - спрямляемый ляпуновский
контур, расположенный на комплексной
плоскости, с началом в точке а и концом в
точке Ь. Если концы а и Ь соединить
контуром Г так, чтобы TUT образовывали
границу dD ограниченной области Д
положительный обход которой на Г совпадал с
движением от точки а к точке Ь (рис. 17.4.1).
Рис. 17.4.1
Тогда, если функция удовлетворяет условию
(17.4.2), справедливо соотношение
KI J С - '
nil C-> ni [ a-t J
(17.4.3)
Если же Г - замкнутый контур, обход
по которому совпадает с обходом «против
часовой стрелки» области Д т.е. dD = Г , то
616
Глава 17.4. ОДНОМЕРНЫЕ СИНГУЛЯРНЫЕ УРАВНЕНИЯ
т J С - / я/ J С - /
гъ г ъ
(17.4.4)
В формулах (17.4.3) и (17.4.4) интегралы,
стоящие справа, абсолютно сходятся.
Интеграл (17.4.1) называют сингулярным
интегралом Коши, функцию - ядром
Коши, а функцию и(С,) — плотностью
интеграла (17.4.1)
С сингулярным интегралом Коши тесно
связан сингулярный интеграл Гильберта
1 +п
— | w(a)ctg ——- do; -к < s < +к .
2л J 2
(17.4.5)
Если функция и(р) - 2 л -периодическая и
удовлетворяет условию Гельдера с
положительным показателем, то интеграл (17.4.5)
существует при любом s и может быть
представлен абсолютно сходящимся интегралом
1 +к
— Jw(a)ctg^y^a =
-тс
1 +к
= 2л J ^(a) ~ tt^)]ct8^2^^-
-тс
Между интегралами Коши и Гильберта
существует тесная связь. Пусть у — единичная
окружность с центром в начале координат; £
и / суть точки на этой окружности, и
£ = е'а , / = els; o,s е [-л; л], тогда
dC, (i o-s П.
—2- = -ctg + - Wo ;
С-/ (2 б 2 2j
полагая w(£) = u(eia) = w(a), получим
я/JC-/
Y
1
Til
J w(a)ctg—
■j, 1
-do + -
J u(o)do.
2л/ J 2 2k
-тс -л
(17.4.6)
17.4.2. Важнейшие свойства
сингулярных интегралов. В последующем будем
предполагать, что контур Г является границей
некоторой, вообще говоря, многосвязной
области D. Обход контура Г совпадает с
положительным обходом области D. Контур Г состоит
из конечного или счетного множества
замкнутых или незамкнутых спрямляемых
непересекающихся кривых {Го,Г;,...} . Для упрощения
формулировок будем предполагать, что каждая
кривая расположена в конечной части
плоскости и имеет непрерывную кривизну.
В п. 17.4.1 было установлено, что
сингулярный интеграл (17.4.1) существует, если
и е Hv (Г), т.е. функция и удовлетворяет
условию Гельдера с положительным
показателем v . Если требовать существования
интеграла (17.4.1) не всюду на Г, а только почти
всюду, то можно сформулировать более
общий результат.
Теорема 17.4.1. Если на контуре Г
направление выпуклости меняется только
конечное число раз, а плотность u(Q суммируема
на Г, то сингулярный интеграл (17.4.1)
существует почти при всех /бГ.
Фундаментальное значение для многих
приложений одномерных сингулярных
интегралов имеет теорема о предельных значениях
интеграла типа Коши.
Рассмотрим интеграл типа Коши
(17.4.7)
где z — точка, расположенная либо внутри
области Д ограниченной контуром Г, либо в
дополнении к D. В первом случае будем
обозначать интеграл (17.4.7) через Ф+(г) , во
втором случае — через Ф~(г) • На вопрос о
существовании пределов
Ф+(/) = НтФ+(г)
Ф-(/) = НтФ-(г),
(17.4.8)
где / е Г , отвечает
Теорема 17.4.2. Если контур Г и
плотность и (С) удовлетворяют условиям теоремы
17.4.1, и z —> t no пути, не касательному к Г,
то почти для всех /бГ существуют пределы
(17.4.8), при этом почти всюду на Г
справедливы равенства
гъ
iic-t ь
1
1 Г "(С)
Ф"(0 = -;ги(0+, ...
2 2л/ J с
№«■
РЕГУЛЯРИЗАЦИЯ
617
Если и е Hv (Г), v > 0 , и Г - ляпуновский
контур, то всюду на Г существуют пределы
(17.4.1) и справедливы вышеуказанные формулы.
В случае, когда функция u(z)
голоморфна в D, ограниченной контуром Г, и
непрерывна вплоть до контура, то
1 г«(0,
KlJL-t
В случае же, когда функция u(z)
голоморфна в дополнении к D, ограниченной
контуром Г, непрерывна вплоть до контура и
обращается в нуль на бесконечности, то
1 г«(С),
niJL-t
17.4.3 Формулы дифференцирования
и интегрирования, содержащие сингулярные
интегралы. Формулы дифференцирования.
Справедливы следующие формулы
дифференцирования: если ие £»(Г), р > 1 , то
•«(О.
£.ju(Qln-l-d^ = niU(t) + j^ldt;-
если и(£) абсолютно непрерывна на Г, а
u'eLp(V) (p>\), то
dth-t ч H-t s'
Jr<"
аналогичные формулы верны и для
интегралов Гильберта:
If»*»
In
sin-
o-s
do =- J w(a)ctg—— */a;
d_
ds
к к
J w(a)ctg—— do = f u(o)ctg—— do.
Последняя формула верна при условии, что
и(о) абсолютно непрерывна на Г,
и е Lp (-я; к) (р > I) и и(-п) - и(к).
Формулы интегрирования: если /е Lp(T),
ge Ьр(Г),то
если при некотором a e (0,1)
#1<р(Иак1и<~-
ГхГ
ТО
формула перестановки порядка интегрирования
в двойном сингулярном интеграле: если
ие Lp(Г) (/? > 1), и Г - замкнутый
контур, то
Ч\—< If 7^rfGU = «(')• (17.4.9)
(я/
Соотношение (17.4.9) является одним из
важнейших в теории одномерных
сингулярных интегральных уравнений, и его часто
называют формулой Пуанкаре-Бертрана.
Формуле (17.4.9) можно придать вид:
S2=I,
(17.4.90
где / - тождественный оператор.
Аналогичные формулы имеют место для
интегралов Гильберта
4я:
1 к
= -u(t)+— \u(o)do. (17.4.10)
In J
Пусть <р(С,т) удовлетворяет по обоим
переменным сразу условию Гельдера с
положительным показателем и пусть Г —
замкнутый или разомкнутый контур,
удовлетворяющий требованиям из п. 17.4.2, тогда
„)'Jt-/|J<;-t J
(га
17.4.4. Регуляризация. Приводимые
ниже понятия и теоремы относятся не
специально к одномерным сингулярным операто-
618
Глава 17.4. ОДНОМЕРНЫЕ СИНГУЛЯРНЫЕ УРАВНЕНИЯ
рам, а вообще к линейным операторам,
действующим из одного В-пространства в другое
В-пространство. Итак, предположим, что
линейный замкнутый оператор А действует из
X в Y Будем говорить, что оператор А
допускает левую регуляризацию, если существует
ограниченный оператор В, действующий из Y
в X, такой, что
ВА = 1Х+К, (17.4.11)
где / — тождественный оператор,
действующий в пространстве X, а К — вполне
непрерывный оператор, действующий также в
пространстве X. Аналогично, оператор А
допускает правую регуляризацию, если существует
ограниченный оператор С, действующий из Y
в X, такой, что
AC = IY + К{, (17.4.11')
где операторы, стоящие в правой части
равенства, действуют в пространстве У, а К[,
кроме того, вполне непрерывный.
Операторы В и С называют
(соответственно левым и правым) регуляриза-
торами оператора А. Если оператор А
допускает правую регуляризацию, то оператор
А* : Y* —> X* допускает левую
регуляризацию и наоборот.
Введем в рассмотрение числа
ос(Л) = сНткегЛ и а(А*) = ситкегЛ*.
Если хотя бы одно из этих чисел конечно, то
разность
1паЛ = сс(Л)-сс(Л*) (17.4.12)
называется индексом оператора А. Очевидно,
\ndA = -\n6A*.
Оператор А называют нормально
разрешимым, если для разрешимости уравнения
Ax-f необходимо и достаточно, чтобы
соотношение (£*,/) = 0 выполнялось для
любого z* e kcrA*. Известна следующая
теорема Хаусдорфа: оператор А нормально
разрешим в том и только в том случае, когда его
образ в Y является подпространством, т.е.
замкнутым линейным многообразием.
Отметим некоторые из важнейших
свойств индекса оператора:
если оператор А допускает левую
регуляризацию, то а (А) < ©о ;
если оператор А допускает правую
регуляризацию, то а [А) < оо ;
если оператор А допускает
двустороннюю регуляризацию, то IndA конечен;
если замкнутый оператор допускает
левую регуляризацию, то он нормально
разрешим;
пусть ограниченный оператор А,
действующий из А" в Y, допускает левую
регуляризацию, тогда для всякого вполне
непрерывного оператора К, действующего из J в Y,
справедливо тождество Ind (А + К) = Ind A.
Теперь перейдем к обсуждению решения
уравнения
(Au)(t) = a(t)u(t) + b(t)(Su)(tj +
+(Ku)(t) = f(t), (17.4.13)
где /е Lp(Г) (Г - замкнутый контур с
непрерывной кривизной); К — вполне
непрерывный оператор, действующий в
пространстве Lp(T); a{t) и b(t) — заданные
непрерывные на Г функции и
(£«)(/) =-Lf£%C- (17.4.14)
ГЪ
Оператор А, определяемый левой частью
уравнения (17.4.13) называется общим
сингулярным оператором, или иногда просто
сингулярным оператором, если К равен нулевому
оператору, то оператор А называется
простейшим.
Решение уравнения (17.4.13) опирается
на соотношение (17.4.9), на возможность
регуляризации оператора А и на следующее
утверждение.
Лемма. Если функция c(t) непрерывна
на Г, то оператор
ш г ^
действующий в пространстве Lp(T), вполне
непрерывен.
Оказывается удобно изучать вопрос
разрешимости уравнения (17.4.13), используя
вспомогательную функцию
<bA(t,Q) = a(t) + Qb(t)y
называемую символом сингулярного оператора А.
У функции Фл(/,6) независимая переменная
РЕГУЛЯРИЗАЦИЯ
619
0 принимает лишь два значения: 6 = ±1.
Непосредственно из определения символа
вытекают простые его свойства:
символ тождественного оператора равен
единице;
символ произвольного вполне
непрерывного оператора равен нулю;
символ суммы двух сингулярных
операторов равен сумме их символов;
по данному символу сингулярный
оператор восстанавливается с точностью до
вполне непрерывного оператора;
символ произведения двух сингулярных
операторов равен произведению символов
этих операторов. Данное свойство является
прямым следствием леммы и формулы
Пуанкаре-Бертрана (17.4.9).
Говорят, что символ вырождается, если
существует хотя бы одна пара значений / е Г
и 0 = ±1, при которых он обращается в нуль.
Очевидно, символ не вырождается в том и
только в том случае, когда
a2(t)-b2(t)±0 для V/g Г.
(17.4.15)
Теорема 17.4.3. Если символ оператора
(17.4.13) не вырождается, то этот оператор
допускает двустороннюю регуляризацию.
Регуляризатором, как левым, так и правым,
является оператор В, определяемый формулой
(Bu)(t) ■■
1
a\t)-
b\t)
{a(t)u(t)-b(t){Su)(t)}.
Теорема 17.4.4. Пусть замкнутый контур
Г имеет непрерывную кривизну, и символ
сингулярного оператора А из (17.4.13) непрерывен и
не вырождается. Тогда этот оператор
нормально разрешим и имеет конечный индекс,
который не зависит от вполне непрерывного
слагаемого в операторе. Индекс оператора
можно вычислить по формуле
2л J &a(t) + b(t)
Если коэффициенты а и b постоянные и
а -Ь фО ,то регуляризация сразу приводит
к решению сингулярного уравнения. Пусть,
для примера, уравнение (17.4.13) имеет вид
au(t) + b(Su)(t) = /(/).
Если подействовать на обе части уравнения
регуляризатором
-^{al-bS),
а -Ь
то сразу найдем решение
al-bl al-bl
В заключение кратко остановимся на
решении сингулярного интегрального
уравнения с ядром Гильберта. В общем случае такое
уравнение имеет вид
(#«)(» = a{t)u(t) + М | M(0)ctg£_l</0 +
-тс
+(Ku)(t) = /(/),
где К — вполне непрерывный оператор,
действующий в пространстве //^[-л,л]. Условие
(17.4.15) для этого уравнения принимает вид
a2(t) + b2(t) * О для V / е [-к,к].
Если это условие выполнено, то для
оператора Н двусторонним регуляризатором будет
оператор
(Bu)(t) = —0 Х—т- х
Индекс оператора Н определяется выражением
azt lb <*(t)-ib(t)
2л J a(t) + n
(t) + ib(t)
Глава 17.5
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
С ЯДРАМИ, ЗАВИСЯЩИМИ
ОТ РАЗНОСТИ АРГУМЕНТОВ
Существует большое многообразие
интегральных уравнений, ядра которых зависят
от разности аргументов. Здесь будут
рассмотрены уравнения, являющиеся частными
случаями уравнения вида
Xx(t) = f(t) + (Gx)(t), (17.5.1)
где X - параметр, вообще говоря,
комплексный; /(/) - заданная функция, которая
принадлежит некоторому функциональному
пространству, которое в дальнейшем будет
уточняться; G - линейный оператор, дейст-
620 Глава 17.5. ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ С ЯДРАМИ, ЗАВИСЯЩИМИ ОТ РАЗНОСТИ
вующий на искомую функцию следующим
образом:
(Cbc)(t) = J^bj(t)jkj(t-s)x(s)ds.
7=1 -со
17.5.1 Важные частные случаи.
Уравнения Вольтерра. Подобного типа уравнения
являются частным случаем уравнения (17.5.1),
в котором п = 1; при / < О k(t) = О и
,., ч л , . ч fl, если t > 0
/(0 = 0, и b{(t) = r Следова-
[0, если / < 0
тельно, в (17.5.1)
(Gx)(t) = jk(t-s)x(s)ds.
о
Уравнение на всей оси (п = 1; by(t) = 1).
В этом случае оператор G из (17.5.1)
принимает вид
(<&)(/)= fk(t-s)x(s)ds.
Уравнения Винера—Хопфа. Такие
уравнения получаются из (17.5.1), если положить
п = 1, считать, что /(/) = 0 при / < 0 и
, , ч fl, если / > 0
[0, если t < 0
(Gx)(t) = jk(t-s)x(s)ds.
о
17.5.2 Символ. Условия нормальной
разрешимости. Будем предполагать, что при
V j = 1, 2,..., п kj{t) е L(-oo,4oo), и введем
в рассмотрение Фурье-преобразование этих
функций
Kj(x)= \eh,kj(t)dt.
Тогда функцию
o(t9x) = X-^bj(t)Kj(x)
называют символом уравнения (17.5.1).
Свойства указанного уравнения во многом зависят
от поведения его символа. Имеют место
следующие свойства уравнения (17.5.1):
для того чтобы уравнение (17.5.1) было
нормально разрешимым в пространстве
Lp(-oo,o°) (\<p<oo) и имело конечный
индекс, необходимо и достаточно, чтобы
предельные значения символа при / —> ±©о нигде
не обращались в нуль, т.е.
o(±9o,%) = \-%bj(±oo)Kj(T)*0
При V Хе (-оо,+оо) ;
(17.5.2)
при выполнении указанного условия
индекс уравнения в любом из этих
пространств определяется выражением
1 а(-оо,т)
2л а(4о°, т)
если X совпадает с каким-либо из
значений фуНКЦИИ а(±оо,т) ПрИ V X Е (-оо, +оо) ,
то либо оператор XI -G не нормально
разрешим, либо dim ker (XI - G) = «> и
dimker(A,/ -G) = °o (/ - тождественный
оператор);
если выполнены условия (17.5.2), то
одним из регуляризаторов (см. п. 17.4.4)
оператора XI -G служит оператор
(Bx)(t):
Yx(0 + j q-(t-s)*(s)ds, если / < 0
1 "~
-~x{t) + | q+(t-s)x(s)ds, если / > 0
X J
где q±(t)E L(-°o;+oo) и определяются своими
преобразованиями Фурье, т.е.
^bj(±oo)Kj(T)
е±(т)
'У=1
X^bj(±Po)Kj(x)
y=i
q±(t) = ±je-iHQ±(T)dT.
17.5.3 Уравнения на полуоси с
суммируемыми ядрами. Метод факторизации. При
описании свойств уравнения Винера-Хопфа
УРАВНЕНИЯ НА ПОЛУОСИ С СУММИРУЕМЫМИ ЯДРАМИ
621
x(t) = f(t) + (Gx)(t) = f(t) + J*(/ - s)x(s)ds
(0 < / < oo)
(17.5.3)
будем здесь предполагать выполненными
следующие условия:
1) *(0еД-оо,4~);
2) 1 - К(х) Ф 0 для всех т е (-©о;-и»).
Тогда справедливы все свойства,
перечисленные п. 17.5.2, и, кроме того, имеют
место следующие дополнения:
в любом из пространств Х+ уравнение
(17.5.3) нормально разрешимо и имеет
конечный индекс, определяемый формулой
'2л
aig[l-tf(T)]
обратно, если в каком-нибудь
пространстве Х+ уравнение (17.5.3) нормально
разрешимо, k{t) e Д-©о?+оо) и имеет конечный
индекс, то с необходимостью выполнено
1 - К(х) Ф 0 для всех т е (-©о; +оо);
число линейно независимых решений
однородного уравнения
Z(t) = j k(t - s)z(s)ds (17.5.4)
0
равно X > если X > 0 . Если же % < 0 , то
указанное однородное уравнение имеет лишь
тривиальное решение.
Здесь под пространством Х+ понимается
любое из следующих пространств:
Lp (0, -и») — пространство функций,
суммируемых на полуоси (0, +«>) в степени р;
М (0, ©о) = L^ (0, +оо) - пространство
функций, в существенном ограниченных на
полуоси (0, +оо);
С(0,+оо) - пространство функций,
ограниченных и непрерывных на полуоси
(0,-Н;
Си(0,+оо) - пространство функций,
равномерно непрерывных на полуоси
(0,4-);
С0(0,+оо) - пространство непрерывных
функций на полуоси (0, -н») 9 которые
стремятся к нулю при t —> +оо .
Все известные методы решения
уравнения (17.5.3) имеют в своей основе так
называемую факторизацию функции (1 - А'(т)) ,
т.е. представление указанной функции в виде
произведения функций, голоморфных в
некоторых полуплоскостях. В случае суммируемых
ядер имеет место следующее утверждение.
Теорема 17.5.1. Пусть k(t) e Д-°°, +оо)
и 1 - А'(т) Ф 0 (те (-оо;-н»)). Если индекс
X > 0 , то существует единственная
факторизация
1
1-*(т)
= о_(т)
(ЗТ*«
такая, при которой функции 0_(т) является
граничным значением функции, голоморфной в
нижней полуплоскости, а 0+(т) является
граничным значением функции, голоморфной в
верхней полуплоскости. Обе голоморфные
функции в своих полуплоскостях аналитичности
нигде не обращаются в нуль.
Для упрощения записи введем
обозначения
о+(т) =
Izif
x + i)
т°(т),
тогда для множителей 0+(т) справедливы
представления
а±(т) = 1 + |у±(0*±//т
dt,
где у±(/)е1(0,оо).
Функции y±(t) находятся по своим
множителям (факторам) (7+(т). Если G+(z) ~
функция, голоморфная в верхней
полуплоскости, которая соответствует о+(т), то
>о+/Л
Y+(0 = v" f e-i,z[o+{z)-\]dz дляА>
2л J
0
о+/Л
(17.5.5)
Если G+(z) ~ функция, голоморфная в
верхней полуплоскости, которая соответствует
а+(т), то
00-/Л
у_(/) = — f eitz [o_(z) - 1] А для A > 0.
2л J
-oo-ih
(17.5.6)
622
Глава 17.6. НЕЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
Функция, найденная в (17.5.5) позволяет
уточнить результат, касающийся свойств
решений однородного уравнения (17.5.4).
Если индекс X > 0, то в качестве
максимальной линейно независимой системы
решений (17.5.4) можно взять систему
функций {<Pfc(0}jLo> которые определяются как
решения задач Коши:
^fit± = y+(0,<Px-i(0)*0;
^- = Ф*+1('),Ф*(°) = 0. *=0,...,Х-2.
Факторизационная теорема 17.5.1 также
позволяет описать решение неоднородного
уравнения (17.5.3).
Терема 17.5.2. Пусть индекс уравнения
(17.5.3) % > 0 w у±(0 - функции из (17.5.5),
(17.5.6), тогда одно из решений уравнения
(17.5.3) {единственное при % = О ) можно
представить в виде
x(t) = f(t) + jr(t,s)f(s)ds,
о
где резольвентное ядро r(t,s) определяется
равенством
r(t,s) = y+(t-s) + y_(t-s) +
m\n(t,s)
+ J Y+(f-*i)Y-(*-*i)<fr|
о
(y±(0 = 0 для t < 0).
Если X < 0 , то единственное решение
уравнения (17.5.3) дается формулой
x(t) = f(t) + jr\t,s)f(s)ds,
о
где резольвентное ядро г (t,s) —
резольвентное ядро транспонированного уравнения.
Глава 17.6
НЕЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ
УРАВНЕНИЯ
Теория нелинейных интегральных
уравнений является частью общей теории
нелинейных операторных уравнений, что
составляет важный и весьма значительный раздел
нелинейного функционального анализа. В
связи с этим в данной главе рассматриваются
лишь некоторые частные виды нелинейных
интегральных уравнений.
17.6.1 Простейшие виды нелинейных
интегральных уравнений. Простейшим и
наиболее важным классом нелинейных
интегральных операторов являются операторы
Урысона. Оператор Урысона определяется
соотношением
(Au)(t) = fK(t,sMs))ds; (17.6.1)
здесь K(t,s,u) — ядро оператора (17.6.1),
является функцией, определенной на
Qxflx(-oo,oo)5 для почти всех (t,s)e
gQxQ непрерывна по переменному и, и
при всех ие (-оо,оо) измеримая по
совокупности переменных (t,s)e QxQ. Оператор
Урысона определен на измеримых функциях
u(s) , для которых функция K(t,s,u(s))
суммируема на Q по s почти при всех t e Q;
значение (Au)(t) оператора (17.6.1) на
каждой такой функции является измеримой
функцией.
Частным случаем операторов Урысона
являются операторы Гаммерштейна. Эти
операторы имеют вид
(&/)(/) = JK(t,s)f(sMs))ds , (17.6.2)
где функция f(s,u) определена при
(5,м)€Йх(-«),оо) почти при всех teQ
непрерывна по и и при всех ие (-оо?оо)
измерима по s на Q . Функция K(t,s) измерима
по совокупности переменных (t,s)e QxQ.
Оператор Гаммерштейна представим в виде
суперпозиции нелинейного оператора / и
линейного интегрального оператора К:
(fu)(t) = f(t,u(t)),
{Ku)(t) = JK(t,s)u(s)ds,
а
(Bu)(t) = ((K°f)u)(t).
Отметим важнейшие свойства
нелинейных отображений (операторов). Пусть
оператор А действует из В-пространства X в В-про-
странство Y. Оператор А называют ограничен-
НЕКОТОРЫЕ СВОЙСТВА НЕЛИНЕЙНЫХ ИНТЕГРАЛЬНЫХ ОПЕРАТОРОВ 623
ным, если он преобразует произвольное
ограниченное множество в пространстве X в
некоторое ограниченное множество в У; его
называют компактным, если он преобразует
произвольное ограниченное множество
пространства X в некоторое компактное
множество в У. Для нелинейных операторов
свойства непрерывности и компактности не связны:
оператор может быть компактным и не
обладать свойством непрерывности; он может
быть непрерывным и не обладать свойством
компактности. Оператор А называется вполне
непрерывным, если он одновременно
непрерывен и компактен.
17.6.2. Некоторые свойства
нелинейных интегральных операторов. Приведем
три утверждения, гарантирующих
непрерывность, полную непрерывность и диффе рении-
руемость интегрального оператора Урысона
(17.6.2).
Теорема 17.6.1. Пусть функция
K(t,s,u), ядро оператора (17.6.1), определена
на flxQx (-оо,©о) f для почти всех
(t,s)e Q х Q непрерывна по переменному и и
при всех и е (-оо, оо) измеримая по
совокупности переменных (t,s)e Q х Q ; пусть при всех
h > О выполняется неравенство
\K(t,s,u)\iRh(t,s)
при V и таких, что | и | < h ,
где Rjj(t,s) - измеримая по совокупности
переменных функция, удовлетворяющая условию
JRh(t,s)ds < a(h) < оо (v h > 0);
ft
пусть, кроме того,
limsup | max \К (t,s,uA- К (t,s,u2)\ds = 0
5->оГ€о£|Му|<л,
|//,-м2|<б
и пусть, наконец, для всякого измеримого
множества D и любого t$ e D выполняется
равенство
lim f K(t,s,u(s))ds = f K(t0,s,u(s))ds,
°D D
тогда оператор Урысона (17.6.1), действующий
из В-пространства £«„(£&) в В-пространство
C(£i), непрерывен.
Теорема 17.6.2. Пусть функция
K(t,s,u) , ядро оператора (17.6.1), определена
на flxQx (-оо,©о) 9 для почти всех
(t,s)e QxQ непрерывна по переменному и и
при всех и € (-оо, ©о) измеримая по
совокупности переменных (t,s)e QxQ; пусть при всех
И > 0 выполняется неравенство
\K(t,s,u)\<Rh(t,s)
при V и таких, что | и | < h ,
где Rfj(t,s) - измеримая по совокупности
переменных функция, удовлетворяющая условию
J Rh(t,s)ds < o(h) < оо (V h > 0);
пусть, кроме того, для V Л > 0 и V /0 е £2
справедливо равенство
lim fmax| А^-у,*/)-А^/съ^и)^^,
тогда оператор Урысона (17.6.1), действующий
из В-пространства ^(Q) в В-пространство
С (Q), вполне непрерывен.
Прежде чем формулировать теорему о
существовании производной у оператора
Урысона, напомним определение
производной по Фреше.
Пусть А - нелинейный оператор,
действующий из В-пространства X в
В-пространство У, тогда будем говорить, что в точке
Xq € X , для V h e X с ненулевой, но
достаточно малой нормой, найдется линейный
ограниченный оператор В, обеспечивающий
равенство
А(х0 + И) - Ах0 = Bh + to(x0,/j),
в котором отображение со обладает свойством
,im Н*.')1к,о
1*Н> Их
Оператор В называют производной Фреше
оператора А в точке х0 € X и его обозначают
через А'(х0). В этом случае говорят, что
оператор А дифференцируем (по Фреше) в
точке х0.
624
Глава 17.6. НЕЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
JK(t,s,u0(s))dseLg(Q),
Во всех известных признаках
дифференцируемое™ производная нелинейного
оператора (17.6.1) в точке Uq является также ин- Q
тегральным оператором. пусть, далее, для почти всех (t,s)eQxQ
Теорема 17.6.3. Пусть функция K(t,s,u), существует предел по мере
ядро оператора (17.6.1), определена на
QxOx(-oo,oo), для почти всех (t,s)eQxQ к (/, д> Uq (,y) + а)-К (/, s, u0 (s))
непрерывна по переменному и и при всех ° д™ ос
и е (-©о, ©о) измерима по совокупности
переменных (t,s)eQxQ; пусть u0eLp(Q); u пУсть> наконец, оператор суперпозиции
пусть Hu = H(t,sMt,s)),ede
H(t,s,u(t,s)) =
K(t,s,u0(s) + u(t,s))-K(t,s,u0(s))
u(t,s)
если u(t,s) Ф 0;
если u(t,s) = 0,
действующий из Lp (Q) в Bpq (flxfl),
непрерывен на нулевом элементе, тогда оператор Уры-
сона (17.6.1), действующий из Lp(Q) в
L„ (Q), дифференцируем в точке Uq и при этом
(A'(u0)h)(t) = JK0(t,s)h(s)ds.
п
Здесь под пространством Bpq (Q. x Q.)
понимается В-пространство функций «двух
переменных» g(t,s) таких, для которых
sup \\\g(t,s)u(tMs)\dtds =
"L-IvL <I^V
м,м
щ~ QxQ.
-М,
< оо.
17.6.3. Простейшие приемы решения
нелинейных интегральных уравнений. В
данном разделе будем рассматривать решение
нелинейного интегрального уравнения с
оператором Урысона, т.е. уравнения вида
и(0 = ц(А)(/) + /(/) = ц| K{t,sMs))ds + f(t).
ft
(17.6.3)
Здесь Q - ограниченное замкнутое
множество из конечномерного пространства
ненулевой лебеговой меры; K(t,s,u)
((t,s)e QxQ и ие (a,b)) и f{t) суть
заданные функции; |Х, вообще говоря,
комплексный параметр; u(t) - искомая функция.
Говорят, что оператор А : X —» X
удовлетворяет на множестве М с X условию
Липшица с константой q, если для V Ш\ и
V т2 e M выполняется неравенство
\Am\-Am2\<q\my-m2\.
Если в последнем соотношении q < 1 ,
то такой оператор называют оператором
сжатия на множестве Л/.
Известно, что если множество М
замкнуто и оператор А на этом множестве является
сжатием, то в Л/ существует единственная
неподвижная точка оператора А, т.е. Зт* е М
такая, что Am* = т*. Из этого свойства
легко получить следующие два утверждения.
Теорема 17.6.4. Пусть функция K(t,s,u)
непрерывна по совокупности переменных
(t, s) e Q х Q и | и | < р и пусть
dK(t,s,u)\
Эй
<С
равномерно относительно
(t,s)e QxQ и | и| < р , тогда при V/e C(Q)
уравнение (17.6.3) имеет единственное
непрерывное решение u*(t)eC(Q),
удовлетворяющее условию
14
р , если
t(Q)
|ц| С mesS2<l и
u I max Г max I K(t, s, и) I ds < p.
ten J |«|<p'
СПЙШКЛИТЕРАТУРЫ
625
Если Wq(/)£C(Q) — произвольная
функция, удовлетворяющая условию || щ Ic<q\ - Р »
то последовательные приближения
un{t) = ^K(t,s,un_y{s))ds + f(t)
п
(п = 1,2,...)
сходятся равномерно на Q к u*(t) .
Теорема 17.6.5. Пусть оператор
(Au)(t)= | K(t,s,u(s))ds действует в про-
странстве Lp(Q) и пусть для него найдется
такая измеримая функция K[(t,s), для
которой справедливо соотношение
V-1
bp = j\JK{-{(t,s)ds
nl n
dt<<
и которая при любых U\,Ui и любых
(t,s)e QxQ обеспечивает неравенство
| К(Г959щ) - K(t,s,u2)\ < K{(t,s)\u{ - и2 |,
тогда при | |х | < — и произвольном f e Lp (Q)
уравнение (17.6.3) имеет в Lp(Q) единственное
решение.
Достаточно простые условия
разрешимости уравнения (17.6.3) вытекают из принципа
Шаудера: если вполне непрерывный оператор А
преобразует ограниченное выпуклое замкнутое
множество М а X в себя, то А имеет в М, по
крайней мере, одну неподвижную точку.
Из принципа Шаудера немедленно
следует, что уравнение (17.6.3) при малых \1
имеет, по крайней мере, одно решение в
пространстве X при условии, что А вполне
непрерывный в X и f е X .
Теорема 17.6.6. Пусть функция K(t,s,u)
((/, s) e Q х ft) непрерывна по и и
удовлетворяет неравенству
\K(t,s,u)\<Ki(t,s)(a + b\u\a)
((/,j)€QxIi;|M|<oo),
где а, Ь и а суть фиксированные
положительные числа и
jj\K{(t,s)\[+adtds<oo,
тогда уравнение (17.6.3) при всех достаточно
малых по абсолютной величине Ц и
f e L[+a (О) имеет решение и^ е Ц+а (Q).
Если а < 1 , то решение существует при всех д.
СПИСОК ЛИТЕРАТУРЫ
1. Вайнберг М.М. Вариационные методы
исследования нелинейных операторов. М.:
Гостехиздат, 1963.
2. Васильева А.Б., Тихонов Н.А.
Интегральные уравнения. М.: Изд-во МГУ, 1989.
3. Габдулхаев Б.Г. Прямые методы
решения сингулярных интегральных уравнений
первого рода: численный анализ. Казань: Изд.
Казанского ун-та, 1994.
4. Гантмахер Ф.Р., Крейн М.Г. Осцилля-
ционные матрицы и ядра и малые колебания
механических систем. М.: Гостехиздат, 1950.
5. Гахов Ф.Д. Краевые задачи. М.: Физ-
матгиз, 1963.
6. Забрейко П.П. и др. Интегральные
уравнения. М.: Наука, 1968.
7. Красносельский М.А. и др.
Интегральные операторы в пространствах
суммируемых функций .М.: Наука, 1966.
8. Манжиров А.В., Полянин А.Д.
Справочник по интегральным уравнениям: Методы
решений. М.: Факториал-пресс, 2000.
9. Полянин А.Д., Манжиров А.В.
Справочник по интегральным уравнениям: Точные
решения. М.: Факториал, 1998.
10. Треногий В.А. Функциональный
анализ. М.: Наука, 1993.
11. Corduneanu С. Integral Equations and
Applications. Cambridge: Cambridge Univ. Press,
1991.
ЧАСТЬ V
СТОХАСТИЧЕСКИЙ АНАЛИЗ
Раздел 18
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
Глава 18.1
ЭЛЕМЕНТАРНЫЕ ПОДХОДЫ
К ОПРЕДЕЛЕНИЮ ВЕРОЯТНОСТИ
18.1.1. Примеры случайных событий.
На практике, повторяя тот или иной опыт,
мы нередко получаем — в одних и тех же
условиях — разные результаты. Так, при
подбрасывании монеты выпадает то герб, то решка;
при подбрасывании игральной кости может
выпасть любая из цифр 1, 2, 3, 4, 5, 6;
стрельба по мишени сопровождается как
попаданиями в цель, так и промахами. Результаты
подобных опытов нельзя рассматривать иначе
как случайные события.
Обычно случайные события выступают
не изолированно друг от друга, а в тесной
связи друг с другом. Насколько вероятно то
или иное случайное событие, как зависимость
между случайными событиями отражается на
их вероятностях? Решение такого рода задач и
составляет основу теории вероятностей —
науки, которая математическими методами
изучает закономерности случайных явлений.
Современная теория вероятностей —
дедуктивная наука, базирующаяся на
определенной системе начальных понятий и
связующих их аксиом. Но аксиомы эти не столь
привычны для нас, как, скажем, аксиомы
элементарной геометрии. Поэтому изложению
формальных основ теории вероятностей мы
предпошлем рассмотрение некоторых
вопросов, решение которых легко достигается на
интуитивном уровне.
18.1.2. Операции над случайными
событиями. Случайные события мы будем
обозначать прописными латинскими буквами
А, В, С, ..., иногда снабжая их индексами.
Объединение, или сумма случайных
событий Aw В (обозначается A U В или А + В), —
это случайное событие, которое происходит
тогда и только тогда, когда происходит хотя
бы одно из событий А и В. (Случай, когда
происходят и событие А, и событие В, при
этом не исключается.)
Пересечение, или произведение случайных
событий А и В (обозначается: А П В или
АВ), — это случайное событие, которое
происходит тогда и только тогда, когда
происходит каждое из событий Aw В.
Отрицание А, или событие,
противоположное событию А (обозначается А ), - это
событие, происходящее тогда и только тогда,
когда событие А не происходит.
Пример. Опыт, состоящий в двукратном
подбрасывании монеты, имеет четыре
элементарных исхода; запишем их в виде
Е{ = {гг}, Е2 = {гр} , Е3 = {рг} , Е4 = {рр}
(г — герб, р — решка). Свяжем с этим опытом
случайные события:
А = {гг, рр] — выпадение одноименных
сторон;
В = {г/?, рг} - выпадение
разноименных сторон;
С = {гг, гр, рг} - выпадение хотя бы
одного герба.
Очевидно, что
A = E{(JE4, B = E2(JE3, B = A,
C = E{(JE2UE3=E4,
Af]C = E{, ВГ)С = В.
Нетрудно также понять, что
A U В = {гг, гр, рг, рр} .
ГЕОМЕТРИЧЕСКИЕ ВЕРОЯТНОСТИ
627
Такое событие в результате опыта происходит
всегда и потому называется достоверным; его
принято обозначать Q. Напротив, событие
А П В не может произойти никогда; поэтому
его называют невозможным событием.
Невозможное событие обозначается 0.
18.1.3. Классическая схема теории
вероятностей. Так называется круг задач, где
каждый рассматриваемый опыт имеет
конечное множество элементарных исходов
Е[, Е2,... Eft , причем:
1) хотя бы один из элементарных
исходов в результате опыта происходит,
E{[jE2[J...EN=Q;
2) элементарные исходы попарно
несовместны, т.е. никакие два из них не могут
наблюдаться в результате одного опыта,
Ег f]Ej=0 при / Ф j;
3) элементарные исходы равновозможны
(равновероятны).
В этих предположениях вероятность
Р(Л) случайного события А определяется
формулой
где N а — число тех элементарных исходов,
которые благоприятствуют событию А, или
при которых событие А происходит. В
частности, для примера, приведенного выше,
Р(Л) = Р(Я) = | = 1; Р(С)Л.
18.1.4. Простейшие свойства
вероятности. Вероятность обладает следующими
свойствами:
1) 0<Р(Л)<1;
2) Р(П) = 1, Р(0) = О;
3) F(A(jB) = F(A) + F(B)-F(Af]B);
в частности, при А П В = 0 , то есть, когда
события А и В несовместны,
F(A\JB) = F(A) + F(B).
Рассматриваемые пока лишь для
классической схемы, эти свойства на самом деле
носят общий характер.
18.1.5. Условные вероятности в
классической схеме. С подбрасыванием игральной
кости свяжем два случайных события: А —
«выпадение цифры 1» и В — «выпадение
нечетной цифры». Очевидно, что
Р(Л) = 1, Р(Д) = 1.
Пусть стало известно, что при
подбрасывании игральной кости выпала нечетная
цифра, то есть, произошло событие В. С
какой вероятностью выпавшей цифрой является
единица? Интуитивно ответ очевиден - Ja ,
ибо речь идет о выборе по классической
схеме одной цифры их трех: 1, 3, 5.
Вообще, если в классической схеме речь
идет об условной вероятности Р(Л|/?)
события А относительно события В (или при
условии, что событие В произошло), то можно
представить себе новую классическую схему с
N в элементарными исходами и
благоприятствующими считать те из них, которые
приводят к появлению события А. Таких исходов
будет Nдв — столько, сколько в исходной
классической схеме благоприятствуют и
событию А и событию В. Иными словами,
естественно считать, что
Р(А\В):
Nab
Nb
Деление числителя и знаменателя дроби
на N приводит к формуле
'И'>-2$-
естественно, в предположении, что Р (В) Ф О .
18.1.6. Геометрические вероятности.
Говоря, что точка бросается наугад (наудачу,
случайно) в некоторую область А,
предполагают следующее: вероятность F(B)
попадания этой точки во всякую подобласть В
области А (рис. 18.1.1) равна отношению меры
(длины, площади, объема) подобласти В к
мере всей области А,
т
Рис. 18.1.1
628
Глава 18.2. СЛУЧАЙНЫЕ СОБЫТИЯ И ИХ ВЕРОЯТНОСТИ
Такое распространение идеи классической
схемы на некоторые опыты с
бесконечным числом элементарных исходов
сохраняет, очевидно, свойства вероятности,
перечисленные в п. 18.1.4.
18.1.7. Статистический подход к
определению вероятности. Классическая схема
и геометрические вероятности охватывают
лишь малую часть задач на определение
вероятности случайного события.
Пусть в большом числе п одинаковых
опытов случайное событие А зафиксировано
\ln раз. Тогда вероятность Р(Л) этого
события воспринимается как число, близкое к
ц/7/я - относительной частоте появления
события А. Это интуитивное представление о
вероятности, подкрепленное
многочисленными экспериментальными данными, дает
основание полагать, что
ik
п
Р(А):
lim
Л->оо
Однако принять данное соотношение за
определение вероятности (а такие
попытки были) нельзя, поскольку в нем
используется случайная величина \in , которая не
была определена раньше; в связи с этим
пока остается неясным и то, в каком
смысле здесь используется понятие предела.
Глава 18.2
СЛУЧАЙНЫЕ СОБЫТИЯ И
ИХ ВЕРОЯТНОСТИ
18.2.1. Аксиомы теории вероятностей.
Пусть Q - произвольное непустое
множество. Всякий элемент (О этого множества
(we Q) условимся называть элементарным
событием, а само множество Q —
пространством элементарных событий. (Эти понятия
отражают наши интуитивные представления
об «опыте» и его «элементарных исходах».)
Таким образом, понятие элементарного
события объявляется исходным, начальным
понятием, которое не выражается через другие,
более простые понятия. Отправляясь от этого,
можно перейти к более сложному понятию -
понятию случайного события.
Рассмотрим класс А некоторых
подмножеств множества Q, удовлетворяющий
следующим трем аксиомам:
Л\). ПеА;
Л2). Если Ап е А для всякого
натурального п, то
[JAneA, f]AneA;
л=1
/7=1
A3). Если А е А , то А = (Q - А) е А .
Всякий класс А подмножеств множества
Q, удовлетворяющий трем перечисленным
условиям, называют о-алгеброй подмножеств
множества Q .
Нетрудно показать, что а-алгебра А
содержит 0 - пустое подмножество
множества Q и наряду с бесконечными — конечные
объединения и пересечения:
/и т
[JAneA, f]AneA.
/7=1
/7=1
Случайным событием называют всякий
элемент а-алгебры А . События Q и 0
называют соответственно достоверным и
невозможным.
Поскольку случайные события — это
подмножества множества Q, операции над
ними осуществляются по общим правилам
операций над множествами, что вполне
согласуется с операциями, использованными в
п. 18.1.2.
События А и В называют несовместными,
если
АГ)В = 0.
Вероятность F(A) случайного события А
определяется следующими тремя аксиомами:
Р1) неотрицательность: Р(Л)>0 для
всякого Ае А;
Р2) нормированность: Р (Q) = 1 ;
РЗ) счетная аддитивность: если Л|, ^,...
...,Ап,...— попарно несовместные случайные
события, то
U^=2P^)-
к=\
к=\
Тройку (£l,A, P) называют
вероятностным пространством. Оно несет в себе
формальное описание того, что в гл. 18.1 мы на
интуитивном уровне рассматривали как опыт,
связанные с ним случайные события и их
вероятности.
Классическая схема теории вероятностей
вписывается в представленную модель
следующим образом:
СВОЙСТВО НЕПРЕРЫВНОСТИ ВЕРОЯТНОСТИ
629
Q = {a>ba>2, ...,©#};
А - класс всех подмножеств множества
Я;
P(co1) = P(a)2) = ... = P(co7V) = ir.
Для геометрических вероятностей имеем:
Q - область меры [X (Q);
А — класс ее измеримых подобластей;
Замечание. Для любого множества Q
класс всех его подмножеств представляет
собой а-алгебру. Однако выбирать эту а-алгебру
в качестве А не всегда целесообразно, а
иногда и вовсе невозможно. Известно,
например, что некоторые плоские фигуры не
относятся к квадрируемым (не имеют
площади). Поэтому в примере с геометрическими
вероятностями такие подмножества
множества Q исключаются из рассмотрения.
Для заданного пространства Q можно
по-разному образовывать a-алгебру А , а уже
при выбранной а-алгебре А по-разному
определять на ней вероятность. Тот или иной
выбор каждый раз диктуется реальным
содержанием той задачи, для которой
конструируется вероятностное пространство.
18.2.2. Элементарные свойства
вероятности.
1). Р(0) = О.
2). Если А[,А2,...,Ап - конечная (в
отличие от аксиомы 3 в п. 18.2.1)
последовательность попарно несовместных случайных
событий, то
( п \ п
р U^rSp(^)-
3). Р(Л) = 1-Р(Л), где А=П-А -
событие, противоположное событию А.
4). Если А с В , то Р(А) < ¥(В)
(условие А с: В часто читают так: из А
следует В).
5). Р(АВ)<тт(¥(А),¥(В)).
6). 0<Р(Л)<1.
( \
где А[,А2,... — конечная или бесконечная
последовательность произвольных
случайных событий.
18.2.3. Свойство непрерывности
вероятности. Этим названием объединяются два
следующих свойства вероятности.
1). Если случайные события А[,А2,....
...,i4„,... образуют монотонно убывающую
последовательность, т.е.
А{ => А2 => А3 z> ... => Ап z> Ап+[ z> ...
(рис. 18.2.1), и
A = f)An,
л=1
то
Р(Л)=ИтР(А)-
Л—»оо
В частности, при f)An = 0 получаем:
limP(4f) = 0.
/J-»oo
2). Если случайные события А\,А2,...
..., Ап,... образуют монотонно возрастающую
последовательность, т.е.
А{ с А2 с Аъ с ... с А„ с An+i с ...
(рис. 18.2.2), и
A = [jAlt,
п=\
то
P(/J)=limP(/ln).
Так, при \JAn = Q имеем: lim Р(А„) = \ .
7). Р
[JAk\<^F(Ak),
^*=i J *=i
Рис. 18.2.]
Рис. 18.2.2
630
Глава 18.2. СЛУЧАЙНЫЕ СОБЫТИЯ И ИХ ВЕРОЯТНОСТИ
18.2.4. Формула сложения вероятно- А{,А2,...,А„ второе элементарное свойство
стен. На произвольные случайные события вероятности обобщается следующим образом:
P(4+4>+... + 4,) =
= [*(А1)+Г(А2) + ... + Г{Ая)]-
-[F{M2) + F{A{A,) + ... + F{An_{Anj\ +
+[F(A{A2A3) + РИМ) + -. + Р(424А)] ~
+(-\)"-1Р(А1А2А3...А„) =
= sl-s2+s3-s4 + ... + (-i)"-lsn.
Здесь Sfr есть сумма вероятностей раз- А это означает, что Р^ (А) можно рас-
личных произведений рассматриваемых собы- сматривать как некоторую новую вероятность,
тий по * в каждом произведении (Sk содер- порождающую новое вероятностное
пространство (Q,A,FB). Отсюда, в частности,
следует, что условные вероятности обладают
жит С„ слагаемых).
В частности,
всеми свойствами обычных вероятностей; так,
F(A + B) = F(A) + P(B)-F(AB),
F(A + B + C) = (F(A) + F(B) + F(C))~
(
\jAk\<^FB(Ak);
к ) к
-(F(AB) + F(AC) + F(BC)) + F(ABC). *в(4 + A2) = FB(A{) + FB(A2)-FB(A{A2).
18.2.6. Формула умножения вероят-
18.2.5. Условная вероятность и ее ностей. Если F(AB) > 0 , то
свойства. Условная вероятность FyA\Bj
события А относительно события В (или при
условии В), обозначаемая также FB(A),
определяется как
г(л\в)-ъ(л)-Ц$
в предположении, что F(B) * 0 . Имеют
место следующие соотношения:
1) FB{A)>0;
2) Р*(П)=1;
F(AB) = F(A\B)F(B) = F(A)F(B\A).
Это - простейший вариант формулы
умножения вероятностей, которая в общем виде
при F(A\ A2 ... Ап_\) > 0 может быть
записана следующим образом:
P(AiA2A3...A„_lA„) =
= P(Al)P{A2\Al)P{A3\AiA2)...
...P(An\AlA2...A„_i).
18.2.7. Независимые события. Случай
3) если случайные события А\,А2,... ные события Aw В называют независимыми,
если
..., Ап,... попарно несовместны, то
ул =Хрил).
к=\
к=[
F(AB) = F(A)F(B).
В случае F(AB) > 0 это условие равносильно
любому из условий
ПОЛИНОМИАЛЬНАЯ СХЕМА
631
F(A\B) = P(A), P(A\B) = P(B).
Независимость трех событий А, В и С
определяется четырьмя равенствами:
Р(АВС) = Р(А)Р(В)Р(С),
Р(АВ) = Р(А)Р(В),
Р(АС) = Р(А)Р(С),
Р{ВС) = Р(В)Р(С).
При этом в общем случае из первого
равенства не следует система трех остальных
равенств так же, как и из трех последних
равенств не вытекает предшествующее им
равенство.
Случай произвольного числа случайных
событий описывается индуктивно. События
А\, А2,..., Ап независимы в совокупности,
если
Р(А А2 ... А„) = ¥(А1)¥(А2)...¥(А„)
и независимы любые т < п из данных
случайных событий.
18.2.8. Формула полной вероятности;
формула Байеса. Пусть А — произвольное
случайное событие, #|,#2>-- ~~ конечная
или бесконечная полная группа попарно
несовместных событий (гипотез), то есть
U#*=Q; Hif]Hj=0 при i*j.
к
Тогда (при Р(#*) * 0 ) справедливы
следующие две формулы:
P{A) = JP{A\Hk)P{Hk);
к
( ' ' £рия*)*<**>
к
(г = 1,2,...).
Первую из них называют формулой
полной вероятности. Ее используют, когда
сравнительно просто отыскиваются условные
вероятности Р(/4|//д.) и вероятности гипотез
P(//fc)> называемые также априорными
вероятностями гипотез.
Вторую формулу называют формулой
Байеса. Ее используют для «переоценки»
исходных гипотез Н^Н^-- в условиях,
когда произошло событие А. Условные
вероятности Р(//г|у4) при этом называют
апостериорными вероятностями гипотез* .
18.2.9. Схема Бернулли.
Предположим, что в результате некоторого испытания
случайное событие А («успех») с вероятностью
р происходит и с вероятностью q = 1 - р не
происходит (0</><1). Пусть, далее, Рп(т) -
вероятность того, что в результате п таких
независимых испытаний событие А
произойдет ровно т раз. Тогда
P„(/w) = 0'V~w {m = 0,1,2, ...,п).
Среди этих вероятностей часто выделяют
наибольшую вероятность, а среди возможных
значений т = О,1, 2,..., п - наиболее
вероятное значение /Wq • Если пр -q - число
целое, то в качестве /Wq выступают два
значения:
Щ^пр-q, m'o=np-q + \ = (n + l)p .
Если же пр - q — число нецелое, то
Щ = [пр - q] + 1,
где [пр - q] — целая часть числа пр -q .
18.2.10. Полиномиальная схема. Эта
схема служит обобщением схемы Бернулли на
случай, когда в результате опыта происходит
одно из попарно несовместных случайных
событий А[, А2,..., Afr с вероятностями р\,
/>2» •••> Рк соответственно (ру +р2 +—+Pk =1) '■>
при этом к > 2 (в схеме Бернулли к = 2 ).
Вероятность Рп(п[, п2,..., п^) того, что в
результате п таких независимых испытаний
событие А[ произойдет Пу раз, событие А2 ~
п2 раз, ... , событие А^ — пк раз, (щ +
+ п2 +... + пк = п) находится по формуле
?„(«„ пъ..., пк) = п; fP?p?...pp.
П\ !АЬ [..М/с!
По-латински a priori и a posteriori означают
соответственно «до» (опыта) и «после» (опыта).
632
Глава 18.3. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
Глава 18.3
СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
18.3.1. Случайная величина и ее
функция распределения. Интуитивно
случайные величины воспринимаются как такие
величины, которые в одних и тех же условиях
проявляют себя по-разному. Например,
производя по цели 10 выстрелов, можно попасть
1, 2, ..., 10 раз, а можно и не попасть ни разу.
В этом смысле и говорят о величине £ —
числе попаданий в десяти выстрелах - как о
случайной величине. Телевизоры, собранные
на одном и том же заводе, оказываются не
одинаково надежными: одни долго не требуют
никакого ремонта, другие быстро выходят их
строя. Поэтому для покупателя телевизора
срок его безотказной работы представляется в
известном смысле случайной величиной.
Понятие случайной величины может
быть и формализовано. Случайной величиной
Z, , рассматриваемой над вероятностным
пространством (£2,Л,Р), называют
вещественную функцию £(co), такую, что для всякого
хе Ш {со: £(со) < х}е А . Это случайное
событие коротко записывают в виде (£ < х),
а его вероятность называют функцией
распределения F(x) случайной величины {;:
F(x) = Р (£ < х). Таким образом,
существование функции распределения у всякой
случайной величины по существу заложено в
самом определении понятия случайной
величины. Естественно, что 0 < F(x) < 1.
Функция распределения F(x) случайной
величины {; обладает следующими свойствами.
1). Монотонность: если Х[ < x-i, то
F(xl)<F(x2).
2). Непрерывность слева:
F(x)= lim F(x + h).
A->0(A<0) V '
3). Поведение на бесконечности:
F(-oo)= lim F(jc) = 0,
/Х+оо) = lim F(x) = 1.
Верно и обратное утверждение: всякая
функция F(x), заданная на Е и
удовлетворяющая этим трем свойствам, может
рассматриваться как функция распределения
некоторой случайной величины.
Пусть задано некоторое число /?,
принадлежащее интервалу (0,1). Квантилью
уровня р функции распределения F(x)
случайной величины {; называется число
хр = min{jc: F(x) > p} . Если F(x) строго
монотонна и непрерывна, то квантиль хр
является единственным решением
(относительно х) уравнения F(x) = р . Квантиль
уровня р = 1/2 называется медианой.
18.3.2. Вероятность попадания
случайной величины в заданный промежуток.
Имеют место следующие соотношения:
P(%>x)=l-F(x);
P{a<Z,<b)=F(b)-F(a);
P£ = c)=F{c + Q)-F(c).
Замечание. Функция распределения
иногда определяется формулой
F(x) = P(^<x).
В этом случае она оказывается непрерывной
справа и для нее
P$>x) = l-F(x),
P(a<^<b)=F(b)-F(a),
P(% = c)=F(c)-F(c-Q).
18.3.3. Математическое ожидание
случайной величины и его основные свойства.
Многократные наблюдения над случайной
величиной £ показывают, что одни свои
значения она принимает чаще, другие реже.
Среднее из всех наблюдаемых значений (с учетом
их «частоты»), очевидно, несет в себе важную
характеристику случайной величины £ . Так,
мы говорим о среднем времени безотказной
работы холодильника, изготовленного на
данном заводе, о среднем уровне осадков,
выпадающих 1 сентября в данной местности, и т.д.
То (не случайное!) значение, которое
интуитивно воспринимается как среднее для
случайной величины {; , называют
математическим ожиданием этой величины и обозначают
М£ (иногда Е£). Формальное определение
этого понятия достаточно сложно. Читателям,
имеющим поверхностное представление об
интеграле Лебега, мы рекомендуем обратиться
к соответствующим учебникам (например, к
НАЧАЛЬНЫЕ И ЦЕНТРАЛЬНЫЕ МОМЕНТЫ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
633
курсам Севастьянова Б.А. и Ширяева А.Н.
[4, 7]). На первых порах можно ограничиться
беглым просмотром приводимых здесь формул;
в дальнейшем мы вернемся к этому вопросу и
приведем его элементарное изложение на
частных (но важных для приложений) примерах.
Математическое ожидание М£
случайной величины {; , рассматриваемой над
вероятностным пространством (£2,Л,Р),
определяется как интеграл Лебега
M£ = j4(co)P(rfco)
при условии, что он сходится. Такой интеграл
Лебега можно преобразовать в абсолютно
сходящийся интеграл Стилтьеса:
М£= j xdF(x), j\x\dF(x)<oo.
—ОО —ОО
Если указанный интеграл Лебега
расходится (это равносильно тому, что
соответствующий интеграл Стилтьеса расходится или
сходится, но не абсолютно), то говорят, что
случайная величина {; не имеет
математического ожидания.
При рассмотрении вопросов
существования математического ожидания часто
оказывается полезным следующее утверждение:
если |£|^Л (с вероятностью 1) и Мл
существует, то существует и каждое из
математических ожиданий М£ и М|^|, причем
|М£|<М|£|<Мл.
Математическое ожидание обладает
следующими свойствами:
М[С] = С;
М[в§] = вМ§;
Здесь £ и л — случайные величины,
заданные на одном вероятностном пространстве, С
и а — константы; предполагается также, что
М£ и Мл существуют. Последние две
формулы часто записывают одним соотношением:
М [а% + Ьг[] = аМ£, + ЬМц .
Если М£ существует, то величину
о
% = £ - М£ называют центрированной
случайной величиной, поскольку М [^ - М£] = 0 .
18.3.4. Начальные и центральные
моменты случайной величины. Если g(x) -
непрерывная или кусочно-непрерывная
функция, то наряду со случайной величиной £ над
вероятностным пространством (Q,A,P) можно
рассматривать и случайную величину #(£),
для которой
M[>ft)] = J^(^(co))P(^co) = J g(x)dF(x)
(в предположении, что интеграл Стилтьеса
сходится абсолютно).
При g(x) = хп (п е N) это дает
начальный момент (или просто — момент) порядка п
случайной величины £
Я„=М[У]= j xndF(x).
В частности, М£ = в\ - это момент первого
порядка.
При g(x) = (x-a{)n (nе N) получаем
центральный момент п-го порядка случайной
величины % :
ая = м[(4-М^)"]= ](x-ai)"dF(x).
Начальные и центральные моменты
случайной величины, если только они существуют,
связаны соотношением
п
k=0
Моменты ап и ап или оба существуют,
или оба не существуют.
Если у случайной величины £
существует момент я-го порядка, то у нее существует
и момент т-го порядка для любого
О < т < п . При этом
(M[«"fS(M[5f.
Рассматриваемые в реальных ситуациях
величины (в том числе и случайные) имеют ту
или иную размерность - метр, секунда,
ньютон и т.д. Наименование я-го момента слу-
634
Глава 18.3. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
чайной величины £ , как начального ап , так
и центрального ап, совпадает с
наименованием величины Ъ,п .
18.3.5. Проблема моментов. Моменты
ап = М к" (п = 1, 2,...) определяются
функцией распределения F(x) однозначно.
Однако в общем случае они неоднозначно
определяют функцию распределения F(x).
Среди множества результатов, связанных с
проблемой моментов, мы выделим следующее
утверждение.
Теорема Карлемана. Если
Zj 2пПГ~ °° '
/1=1 Vfl2/i
то распределение вероятностей случайной
величины £ однозначно определяется своими
моментами.
18.3.6. Дисперсия случайной величины
и ее простейшие свойства. В приложениях
особенно часто используют второй
центральный момент случайной величины {; ; его
называют дисперсией этой величины и
обозначают D£:
Щ = М [ft - М^)2] = J (х - а, )2 dF(x).
Дисперсия случайной величины £
характеризует средний квадратический разброс
значений этой величины относительно ее
среднего значения. Перечислим простейшие
свойства дисперсии:
D£>0,
причем D^ = 0 тогда и только тогда, когда
случайная величина принимает некоторое
значение С с вероятностью 1; если D^ < °о, то
Дисперсия суммы случайных величин в
общем случае не равна сумме их дисперсий:
Дисперсию часто вычисляют по формуле
D!; = M[y]-(MJ;)2.
Наряду с дисперсией часто используют
среднее квадратическое отклонение о
случайной величины £, которое определяется
как корень квадратный из дисперсии:
о = Щ.
Среднее квадратическое отклонение
случайной величины имеет ту же размерность, что и
сама эта величина.
Если 0 < Щ < сю , то случайную величину
*" т
называют нормированной случайной
величиной; для нее
М£ = 0 , Щ; = 1 .
18.3.7. Характеристическая функция
случайной величины. Характеристическая
функция ф(/) случайной величины £ - это
комплекснозначная функция вещественного
аргумента /, равная математическому
ожиданию случайной величины е'^ :
ф(0 = Ме^ = M(cos(/$) + /sin(/$)) =
= Mcos(/£) + /Msin(/£).
Характеристическая функция ф(/)
существует для всякой случайной величины. С
функцией распределения F(x) этой
величины она связана соотношением
ф(/) = f eitxdF(x).
Формула обращения
F(x2)-F(x{) =
I Tr p~itx2 _Р-*Щ
= J_lim Г£ 1 ф(/)^
2л г-**, J -it
-т
(х^ и х-1 — точки непрерывности функции F)
показывает, как по заданной
характеристической функции ф(/) отыскивается
соответствующая функция распределения.
К элементарным свойствам
характеристических функций относят:
1) | ф(/)| < ф(0) = 1 для всякого / е R ;
2) ф(0 ~~ функция, равномерно
непрерывная на Ш ;
ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
635
3) если г\ = а£, + Ьи ф^(/), фп(/)
-характеристические функции случайных
величин соответственно {; и г\, то
ЯЧ, (*) = *%(<!/);
4) (р(~0 = ф(/); в частности, если
характеристическая функция случайной величины
принимает лишь вещественные значения, то
она является четной функцией;
5) если для случайной величины £
существует М£,п, то характеристическая
функция ф(/) имеет непрерывную на всей
числовой прямой производную порядка я, причем
/,;М^=ф(л)(0).
Последнее свойство обратимо при
четном п: если ф^ /и'(0) существует, то
существует и М£ ". На нечетные п это не
распространяется: известны примеры, когда ф'(0)
существует, а М£ - нет.
18.3.8. Дискретные случайные
величины. Случайную величину £ называют
дискретной, если множество принимаемых ею
значений конечно или счетно. В этом случае
все значения величины £ можно
перенумеровать: Х|, #2,..., хю.... Указав для каждого
из этих значений соответствующую
вероятность ру9 Р2,..., рп,..., мы получим полное
представление о законе распределения
случайной величины £ . Табличку
х\ х2 х3 — хп ••
Р\ Pi РЪ ••• Рп ••
в которой значения случайной величины £
перечислены в порядке возрастания
(убывания), называют рядом распределения величины
^ . При этом
P£ = xk) = pk>0 (* = 1,2,...), 2>*=1-
к
Функцию распределения F(x)
дискретной случайной величины £ с таким
распределением вычисляют по формуле
к:хк<х
Она представляет собой (см. рис. 18.3.1)
кусочно-постоянную (ступенчатую) функцию со
Р\+Рг+Рг+Рл
Рх+Рг+Ръ
;Ч LJ"mm,
F(x)
А
;<—j
Pi\ :
—►
«^*3 "™4
Рис 18.3.1
скачками величины рк в точках хк
(к = 1, 2,...). В этом случае
к
an=M[¥] = ^x"kpk,
к
ая = м[(§ - М$)л] = £(**-в, У>*.
В частности,
Щ = ^,ХкРк
Л2
D£ = ^(Хк~ а\ f Рк = ^ZxkPk ~ ^хкРк
Если приведенные выше суммы -
конечные, то никаких оговорок при этом не
требуется. Если же это ряды, то необходимо
дополнительно потребовать, чтобы они
сходились и притом абсолютно. В случае же,
когда какой-нибудь из приведенных рядов
расходится или сходится, но не абсолютно,
говорят, что соответствующего
математического ожидания не существует.
Пусть на координатной прямой в точках
с координатами X|,X2,... сосредоточены
массы соответственно Р\,Р2, — - Тогда М£
дает координату центра масс, а Щ
представляет собой момент инерции рассматриваемой
механической системы относительно центра
масс.
В рассматриваемом случае
характеристическую функцию ф(/) вычисляют как
<pw=5>'te*-
636
Глава 18.3. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
18.3.9. Целочисленные случайные
величины; их характеристические и
производящие функции. Если
Щ = т) = рт (т = 0,±1,±2,...),
т
то характеристическая функция ф(/)
случайной величины £ имеет вид
<К»= X Рте"т,
(и, таким образом, является периодической с
периодом 2к). Однозначно осуществляется и
обратный переход — от характеристической
функции к вероятностям
V{% = m) = ±-]e-i,mq{t)dt
-К
(т = 0,±1,±2,...).
В приложениях особенно часто
приходится рассматривать неотрицательные
целочисленные случайные величины:
Р£ = т) = рт (/я = 0,1, 2,...),
Для таких величин (наряду с понятием
характеристической функции) вводится понятие
производящей функции:
/w=0
Функция \|/(г) является аналитической
функцией, по крайней мере, в области
| Z | < 1 • При этом
А^Ф(ш)(0).
т\
так что производящая функция служит
исчерпывающей характеристикой распределения
целочисленной неотрицательной случайной
величины {; . В частности,
Ml; = V'(1), D^ = V"(1) + V'(1)-(V(1))2
(в предположении, что в точке z = 1
функция y(z) аналитична).
Полезно заметить, что
ч**) = м[у].
Поэтому характеристическая ф(/) и
производящая y(z) функции неотрицательной
целочисленной случайной величины связаны
соотношением
18.3.10. Энтропия дискретной
случайной величины. Энтропия H[£] случайной
величины £ с распределением
х\ х2 ••• хп -Л
Р\ Рг - Рп -)
определяется как
к
Энтропию дискретного распределения
можно рассматривать как меру степени
неопределенности этого распределения
вероятностей.
Замечание. В приложениях (например, в
теории кодирования) вместо натуральных
логарифмов используют двоичные логарифмы.
18.3.11. Примеры дискретных
случайных величин. Постоянная величина. Так
называют случайную величину £,
принимающую одно-единственное значение С с
вероятностью 1. Распределение вероятностей такой
величины называют вырожденным
распределением. Очевидно, что
М^ = С, D£ = 0, (p(/) = e/YC, НЩ = 0.
Равномерное дискретное
распределение. Так называют следующее распределение
вероятностей:
(х\ х2 х3 ... хпЛ
ill I Г
\п п п п )
В этом случае
что особенно хорошо согласуется с нашими
интуитивными представлениями о
математическом ожидании как о среднем значении
случайной величины.
ПРИМЕРЫ ДИСКРЕТНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН
637
Легко показывается, что
Н(£) = 1пл.
Это наибольшая энтропия, какой только
может обладать распределение вероятностей на
множестве {jq, Jt2, ...,*„} .
Для характеристической функции имеем:
в частности, для распределения
1/2 1/2 J
получаем
ф) = ие-" +eif) = cost.
Для величины {; с распределением
(\ 2 3 ... пЛ
\- I I I
(я п п " п)
путем элементарных расчетов получаем
Гипергеометрическое распределение.
Представление о таком распределении дает
следующая задача. Из урны, содержащей т
белых и п черных шаров, наугад достают /
шаров (1 < / < т + п); пусть £ - число
белых среди них. Тогда
Р(£ = /с)=С>пС" (0 < А: < min(/я,/)).
Можно доказать, что
т + п
Распределение Бернулли. Так называют
распределение
с:)
где 0 < /? < 1 , q = 1 - р .
Элементарное представление о нем дает
опыт с двумя исходами: А (успех) и А
(неудача). При вероятности р успеха число {;
успехов в одном опыте имеет указанное
распределение.
Для рассматриваемого распределения
VU) = PZ + q, <p(0 = pelt + q ;
М£ = р, B^ = pq;
H[Z9] = -p\np-(\-p)ln(l-p).
Наибольшее значение величины Н[У
достигается при р = 1/2 , что вполне согласуется с
интуитивным восприятием понятия энтропии.
Биномиальное распределение. Так
называют распределение на множестве {0,1, 2,...
..., я} с вероятностями
Р(§ = щ) = C™pmqn~m (т = О,1, 2,..., п).
Его, например, имеет случайная величина ^ ,
равная числу успехов в п испытаниях,
проводимых по схеме Бернулли с вероятностью р
успеха в отдельном испытании. Это
распределение обозначается Bi(n,p); запись
Z,~Bi(n,p) означает, что случайная
величина {; имеет распределение Бернулли с
параметрами пир. Легко вычисляются
производящая и характеристическая функции, а по
ним - математическое ожидание и дисперсия:
v(z) = {pz + q)n, ф(0 = (/*''+ <?)";
М£ = пр , Щ = npq .
Геометрическое распределение. Так
называют распределение на множестве N
натуральных чисел с вероятностями
P(^ = m) = pqm-[ (/w = 1,2,...).
где 0 < /? < 1 , q = 1 - р .
Его имеет, например, случайная
величина {; , равная числу опытов, проводимых по
схеме Бернулли до первого успеха, включая
этот успешный опыт. Для такой случайной
величины
V(z) = -r^-, M§ = V(l) = i;
l-qz P
638
Глава 18.3. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
Это наибольшая энтропия, какую только
может иметь распределение на множестве
целых неотрицательных чисел с
математическим ожиданием \/р .
Замечание. Иногда под геометрически
распределенной случайной величиной Г]
понимают число опытов, проводимых по схеме
Бернулли до первого успеха, исключая
последний, успешный опыт. В этом случае
р р
Распределение Пуассона. Так называют
распределение
т\
Р£ = т) = ^-е-х (Ь>0;/и = 0,1,2,...).
При этом
Распределение Пуассона можно
рассматривать как предельное для
биномиального распределения Bi(n, p) при
л->оо, £_>0, пр -> X > О.
Ввиду особой важности данного
распределения оно табулировано (табл. 18.3.1).
18.3.12. Непрерывные случайные
величины (распределения вероятностей);
плотность вероятности. Случайная величина £
называется непрерывной, если ее функция
распределения F(x) непрерывна на всей
числовой прямой. Говорят также, что такая величина
имеет непрерывное распределение вероятностей.
Каждое свое значение с непрерывная
случайная величина ^ принимает с нулевой
вероятностью. Верно и обратное: если
случайная величина каждое свое значение принимает
с нулевой вероятностью, то эта величина имеет
непрерывное распределение вероятностей.
В приложениях особую роль играют
абсолютно непрерывные случайные величины
(распределения) — те, для которых функция
распределения представима в виде
F{x) = J p(u)du ,
где р(х) - неотрицательная функция,
называемая плотностью вероятности.
Изменение подынтегральной функции
р(х) на каком-нибудь конечном (и даже
счетном) множестве точек не изменяет
значения этого интеграла. Поэтому плотность
вероятности р(х) определена неоднозначно.
Но эта неоднозначность касается лишь точек
разрыва функции р(х). В каждой точке
непрерывности функции р(х)
F'(x) = Р(х).
Функция р(х) может рассматриваться
как плотность вероятности тогда и только
тогда, когда она удовлетворяет двум условиям:
p(x)>0, j p(x)dx = \
(неотрицательность и нормированностъ).
Вероятность попадания абсолютно
непрерывной случайной величины {; в
промежуток [а, Ь) находится по формуле
Ь
P(a<Z,<b) = jp(x)dx.
а
При этом вместо Р [а < £ < Ь) можно
использовать любое из выражений Р (а < {; < Ь),
Р [а < {; < Ь), поскольку все они равны между
собой. Таким образом, вероятность попадания
абсолютно непрерывной случайной величины
£ в промежуток с концами а и Ь
геометрически можно толковать как площадь той части
подграфика плотности вероятности р(х),
которая приходится на интервал (а,Ь)
(рис. 18.3.2); площадь же всего подграфика
равна 1.
|/>0)
Если х - точка непрерывности функции
р(х), то (при Ах > О )
. Р(х<^<х + Ах)
р(х) = lim — - ,
дх-»о Ах
P(jc < {; < х + Ах) = р(х)Ах + о(Ах),
чем и оправдывается название «плотность
вероятности».
НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
639
18.3.1. Таблица распределения Пуассона
Х/к
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4 1
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
5,0
6,0
7,0
8,0
9,0
| 0
0,9048
8187
7408
6703
6065
5488
4966
4493
4066
3679
3329
3012
2725
2466
2231
2019
1827
1653
1496
1353
1225
1108
1003
0907
0821
0743
0672
0608
0550
0498
0450
0408
0369
0334
0302
0273
0247
0224
0202
0183
0067
0025
0009
0003
0001
1
0905
1637
2222
2681
3033
3293
3476
3595
3659
3679
3662
3614
3543
3452
3347
3230
3106
2975
2842
2707
2572
2438
2306
2177
2052
1931
1815
1703
1596
1494
1397
1304
1217
1135
1057
0984
0915
0850
0789
0733
0337
0149
0064
0027
ООП
2
0045
0164
0333
0536
0758
0988
1217
1438
1647
1839
2014
2169
2303
•2417
2510
2584
2640
2678
2700
2707
2700
2681
2652
2613
2565
2510
2450
2384
2314
2240
2165
2087
2008
1929
1850
1771
1692
1615
1539
1465
0842
0446
0223
0107
0050
3
0002
ООН
0033
0072
0126
0198
0284
0383
0494
0613
0738
0867
0998
1128
1255
1378
1496
1607
1710
1804
1890
1966
2033
2090
2138
2176
2205
2225
2237
2240
2237
2226
2209
2186
2158
2125
2087
2046
2001
1954
1404
0892
0521
0286
0150
4
0001
0003
0007
0016
0030
0050
0077
0111
0153
0203
0260
0324
0395
0471
0551
0636
0723
0812
0902
0992
1082
1169
1254
1336
1414
1488
1557
1622
1680
1733
1781
1823
1858
1888
1912
1931
1944
1951
1954
1755
1339
0912
0573
0337
5
0001
0002
0004
0007
0012
0020
0031
0045
0062
0084
0111
0141
0176
0216
0260
0309
0361
0417
0476
0538
0602
0668
0735
0804
0872
0940
1008
1075
1140
1203
1264
1322
1377
1429
1477
1522
1563
1755
1606
1277
0916
0607
6
0001
0002
0003
0005
0008
0012
0018
0026
0035
0047
0061
0078
0098
0120
0146
0174
0206
0241
0278
0319
0362
0407
0455
0504
0555
0608
0662
0716
0771
0826
0881
0936
0989
1042
1462
1606
1490
1221
0911
7
0001
0001
0002
0003
0005
0008
ООП
0015
0020
0027
0034
0044
0055
0068
0083
0099
0118
0139
0163
0188
0216
0246
0278
0312
0348
0385
0425
0466
0508
0551
0595
0640
0636
0732
0778
0824
8
0001
0001
0001
0002
0003
0005
0006
0009
ООП
0015
0019
0025
0031
0038
0047
0057
0068
0081
0095
0111
0129
0148
0169
0191
0215
0241
0269
0298
0328
0360
0393
0428
0463
9
0001
0001
0001
0002
0003
0004
0005
0007
0009
ООП
0014
0018
0022
0027
0033
0040
0047
0056
0066
0076
0089
0102
0116
0132
0150
0168
0188
0209
0232
640
Глава 18.3. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
Общие формулы для математических
ожиданий (см. п. 18.3.4) в случае абсолютно
непрерывных распределений принимают
следующий вид:
М*($) = jg(x)p(x)dx;
—оо
a„=M[k"]= jx"p(x)dx;
ап = м[(§ - Щ)в] =J(*-e,)" P(x)dx.
В частности,
М§ = J xp(x)dx ;
Щ= \(x-M%)2p(x)dx-
оо ( оо
= | x2p(x)dx - \ xp(x)dx
Все приведенные здесь интегралы
должны быть абсолютно сходящимися. Если какой-
нибудь из них расходится или сходится, но не
абсолютно, то говорят, что соответствующего
математического ожидания не существует.
Характеристическая функция ф(/)
выражается через плотность вероятности р(х)
по формуле
оо
<р(0 = J eilxp(x)dx .
При условии, что | (р(/) | df/< сю , это
соотношение допускает следующее обращение:
p(x) = j-je-itx<p(t)dt.
18.3.13. Энтропия абсолютно
непрерывного распределения вероятностей. Если
р(х) — плотность вероятности случайной
величины £ , то энтропия Н[£] определяется как
Hfc] = -jp(x)lnp(x)dx.
В тех точках, в которых р(х) = 0,
подынтегральная функция полагается также равной
нулю.
Энтропия абсолютно непрерывного
распределения (в отличие от энтропии
дискретного распределения) не может
рассматриваться как мера степени неопределенности (она, в
частности, может оказаться отрицательной).
Однако отдельные результаты,
формулируемые с использованием этого понятия,
существенно расширяют наши представления о
рассматриваемых величинах.
18.3.14. Примеры абсолютно
непрерывных распределений вероятностей.
Равномерное распределение в интервале (а, Ь). Так
называется распределение с плотностью
вероятности
р(х) =
1
-, если хе [а,Ь];
Ъ - а
0, если Jtg [a,b].
Для соответствующей функции распределения
имеем:
F(x) =
0, если х < а;
х-а
-, если а < х < Ь\
Ъ-а
1, если х> Ь.
Графики функций р(х) и F(x)
представлены на рис. 18.3.3.
Рассматриваемое распределение
обозначается Я(а;Ь). Для £ ~ R(a,b)
H[Z,] = ln(b-a).
Это самая большая энтропия, которой только
может обладать распределение вероятностей в
интервале (а, Ь).
Р(*)
Ъ-о
0
i
1
0
К*)
а
Ь
X
а
Ь
X
Рис. 18.3.3
ПРИМЕРЫ АБСОЛЮТНО НЕПРЕРЫВНЫХ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ 641
Показательное (экспоненциальное)
распределение имеет плотность вероятности
, v IXe'7^, если х > О, м АЧ
р(х) = 1 ' (Х>0)
[ 0, если х < О,
и соответственно функцию распределения
О, если х < О,
[1-е , еслих>0
(см. рис. 18.3.4). Для данного распределения
1
1
х х2 А, - //
Случайная величина £, распределенная
по показательному закону с параметром X,
удовлетворяет условию
P($>f + t|$>/) = P($>T)
для любых положительных /их. Пусть,
например, £ - срок безотказной работы
какого-либо технического устройства. Тогда
данное устройство можно (с точки зрения его
долговечности) рассматривать как новое в
любой момент, когда оно работоспособно.
Это свойство показательного распределения
делает его особенно привлекательным в
задачах теории надежности.
Энтропия рассматриваемого
распределения
ни = ше-
является наибольшей энтропией, какую только
может иметь распределение вероятностей на
множестве (0,«>) с математическим
ожиданием ух.
Нормальное распределение с параметрами
|1 на. Так называется распределение с
плотностью вероятности
р(х) =
1
V2tc<
(*-цГ
" 2о2
тс а
где ц — произвольный, а а —
положительный параметр. Соответствующая функция
распределения F(x) (рис. 18.3.5)
записывается в виде интеграла
^2
("-ЦГ
не берущегося в элементарных функциях. Для
характеристической функции в данном случае
имеем:
i/ji-±°2/2
ф) = е 2
Легко устанавливается, что
Поэтому данное распределение обозначается
ЛГ(ц;ст2).
Если % ~ ЛГ(ц;а2) , ТО
i^~JVf(0;l).
а
Распределение Af(0\ 1) называется
стандартным нормальным распределением. Его плотность
вероятности Ф(х) и функция распределения
Ф(х) представлены на рис. 18.3.6. Это
распределение табулировано (табл. 18.3.2).
Если £~ Af(\i;a2), то
Р(.<«<,).^)-(£=Ь).
РЫ
х О
Рис. 18.3.4
F(X)
фО)
Ф<Х>
21 — 7706
642 Глава 18.3. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
18.3.2. Таблица значений функции ф(х)
V2jt
X
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1Д
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
| 0
0,3989
3970
3910
3814
3683
3521
3332
3123
2897
2661
2420
2179
1942
1714
1497
1295
1109
0940
0790
0656
0540
0440
0355
0283
0224
0175
0135
0104
0079
0060
0044
0033
0024
0017
0012
0009
0006
0004
0003
0002
0001
1
3989
3965
3905
3802
3668
3503
3312
3101
2874
2637
2396
2155
1919
1691
1476
1276
1092
0925
0775
0644
0529
0431
0347
0277
0219
0171
0132
0101
0077
0058
0043
0032
0023
0017
0012
0008
0006
0004
0003
0002
0001
2
3989
3961
3894
3790
3653
3485
3292
3079
2850
2613
2371
2131
1895
1669
1456
1257
1074
0909
0761
0632
0519
0422
0339
0270
0213
0167
0129
0099
0075
0056
0042
0031
0022
0016
0012
0008
0006
0004
0003
0002
0001
3
3988
3956
3885
3778
3637
3467
3271
3056
2827
2589
2347
2107
1872
1647
1435
1238
1057
0893
0748
0620
0508
0413
0332
0264
0208
0163
0126
0096
0073
0055
0040
0030
0022
0016
ООН
0008
0005
0004
0003
0002
0001
4
3986
3951
3876
3765
3621
3448
3251
3034
2803
2565
2323
2083
1849
1626
1415
1219
1040
0878
0734
0608
0498
0404
0325
0258
0203
0158
0122
0093
0071
0053
0039
0029
0021
0015
ООП
0008
0005
0004
0003
0002
0001
5
3984
3945
3867
3752
3605
3429
3230
ЗОН
2780
2541
2299
2059
1826
1604
1394
1200
1023
0863
0721
0596
0488
0396
0317
0252
0198
0154
0119
0091
0069
0051
0038
0028
0020
0015
0010
0007
0005
0004
0002
0002
0001
6
3982
3939
3857
3739
3589
3410
3209
2989
2756
2516
2275
2036
1804
1582
1374
1182
1006
0848
0707
0584
0478
0387
0310
0246
0194
0151
0116
0088
0067
0050
0037
0027
0020
0014
0010
0007
0005
0003
0002
0002
0001
7
3980
3932
3847
3725
3572
3391
3187
2966
2732
2492
2251
2012
1781
1561
1354
1163
0989
0833
0694
0573
0468
0379
0303
0241
0189
0147
0113
0086
0065
0048
0036
0026
0019
0014
0010
0007
0005
0003
0002
0002
0001
8
3977
3925
3836
3712
3555
3372
3166
2943
2709
2468
2227
1989
1758
1539
1334
1145
0973
0818
0681
0562
0459
0371
0297
0235
0184
0143
ОНО
0084
0063
0047
0035
0025
0018
0013
0009
0007
0005
0003
0002
0001
0001
9
3973
3918
3825
3697
3538
3352
3144
2920
2685
2444
2203
1965
1736
1518
1315
1127
0957
0804
0669
0551
0449
0363
0290
0229
0180
0139
0107
0081
0061
0046
0034
0025
0018
0013
0009
0006
0004
0003
0002
0001
0001
ПРИМЕРЫ АБСОЛЮТНО НЕПРЕРЫВНЫХ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ 643
18.3.3. Таблица значений функции Лапласа
* / * if -т'2<"
ф°{х)=Ще
X
0,0
од
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1Д
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
ЗД)
зд
3,2
3,3
3,4
| 0
0,0000
0398
0793
1179
1554
1915
2257
2580
2881
3159
3413
3643
3849
4032
4192
4332
4452
4554
4641
4713
4772
4821
4861
4893
4918
4938
4953
4965
4974
4981
4986
4990
4993
4995
4997
1
0040
0438
0832
1217
1591
1950
2291
2611
2910
3186
3437
3665
3869
4049
4207
4345
4463
4564
4684
4719
4778
4826
4864
4896
4920
4940
4955
4966
4975
4982
3,5
3,6
3,7
3,8
3,9
2
0080
0478
0871
1255
1628
1985
2324
2642
2939
3212
3461
3686
3888
4066
4222
4357
4474
4573
4656
4726
4783
4830
4868
4898
4922
4941
4956
4967
4976
4982
49981
49985
49989
49993
49995
3
0120
0517
0909
1293
1664
2019
2356
2673
2967
3238
3485
3708
3906
4082
4236
4370
4484
4582
4664
4732
4788
4834
4871
4901
4924
4943
4957
4968
4977
4983
4
0159
0557
0948
1331
1700
2054
2389
2703
2995
3264
3508
3728
3925
4099
4251
4382
4495
4591
4671
4738
4793
4838
4874
4904
4927
4945
4958
4969
4977
4984
4,0
4,5
5,0
5
0199
0596
0987
1368
1736
2088
2421
2734
3023
3289
3531
3749
3943
4115
4265
4394
4505
4599
4678
4744
4798
4842
4878
4906
4929
4946
4960
4970
4978
4984
499968
499997
4999997
6
0239
0636
1026
1406
1772
2123
2454
2764
3051
3315
3554
3770
3962
4131
4279
4406
4515
4608
4686
4750
4803
4846
4881
4909
4930
4948
4961
4971
4979
4985
7
0279
0675
1064
1443
1808
2157
2486
2793
3078
3340
3577
3790
3980
4147
4292
4418
4525
4616
4692
4756
4808
4850
4884
4911
4932
4949
4962
4972
4979
4985
8
0319
0714
1103
1480
1844
2190
2517
2823
3106
3365
3599
3810
3997
4162
4306
4429
4535
4625
4699
4761
4812
4854
4887
4913
4934
4951
4963
4973
4980
4986
9
0359
0753
1141
1517
1879
2224
2549
2852
3133
3389
3621
3830
4015
4177
4319
4441
4545
4633
4706
4767
4817
4857
4890
4916
4936
4952
4964
4974
4981
4986
21*
644
Глава 18.3. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
Для S~Af(^a2)
и любого к > О
Р(|§-ц|<*о) = 2Ф(*)-1.
С помощью таблиц функции Ф(х)
обнаруживаем, что
Р(| ^ - ц| < За) = 2Ф(3) - 1 - 0,997,
так что практически любое значение
нормально распределенной случайной величины
отклоняется от среднего значения не
болевшем на За, хотя теоретически допустимы
любые, сколь угодно большие отклонения.
В литературе обычно вместо таблицы
значений функции Ф(х) приводится таблица
значений функции Oq(x) = Ф(х) ,
являющейся нечетной функцией (рис. 18.3.7), и
потому — в некотором отношении - более
удобной, чем функция Ф(х) (табл. 18.3.2 и
18.3.3). При этом:
PflS-n|<*c) = 20o(*).
Если £~ Af(\i;o2\, то
Н[У = 1п72ш2.
Это самая большая энтропия, какую
только может иметь случайная величина с
2
дисперсией a .
Распределение Коши имеет плотность
вероятности
Р(х) = --т у (ос > 0)
л а + х
и характеристическую функцию
<р(0 = е-аИ.
Для случайной величины с распределением
Коши не существует ни математического
ожидания, ни, тем более, моментов высших
порядков.
Распределение Вейбулла описывается
функцией распределения
f(x) = |1"e~Ua ПРИ*>0>
} 0 при х < 0
(а, X — положительные параметры). При сс=1
такое распределение совпадает с
экспоненциальным (показательным) распределением.
-1/2
Рис. 18.3.7
Распределение Лапласа — это
распределение с плотностью вероятности
(X — положительный параметр). По
понятным причинам такое распределение называют
также двусторонним экспоненциальным
распределением.
Гамма—распределение имеет плотность
вероятности
р(х) =
Хах
сс-1
Па)
0
-е *■* при х > 0,
при х < 0,
где X и а - положительные параметры, а
Г(х) - гамма-функция Эйлера. При a = 1
данное распределение совпадает с
показательным распределением; если а = пе N , то
р(х) =
(Хх)
П-\
(Л-1)!
0
е *■* при х > 0,
при х < 0.
Такое распределение называют
распределением Эрланга.
18.3.15. Использование 5-функции
при описании случайных величин.
Существуют непрерывные функции распределения,
для которых множество точек роста имеет
меру 0 (нуль). Такие распределения называют
сингулярными. Для сингулярных
распределений плотность вероятности не определена.
Всякая функция распределения F(x)
однозначно представима в виде
F(x) = aFl(x) + bF2(x) + cF3(x),
где а, Ь, с — неотрицательные числа, а + b +
+с = 1 , а f|(x), F2(x), F3(x)
-соответственно дискретная, абсолютно непрерывная и
сингулярная функции распределения.
В случае когда с = 0 , то есть когда
отсутствует сингулярная составляющая, с функцией
МОДЕЛИРОВАНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН С ПОМОЩЬЮ ЭВМ
645
распределения F(x) можно связать
обобщенную плотность вероятности р(х) . Пусть
Fl(х) = j p2(u)du ,
a F[(x) — функция распределения,
соответствующая ряду распределения
х{ х2 ... хп ...
Р\ Рг •• Рп •••
Тогда
р(х) = (1 - я)/?2(х) + а^ркЪ{х -хк),
к
где 5(x) — дельта-функция Дирака. Функция
р(х) во многих задачах может быть
использована как обычная плотность вероятности. Так,
оо оо
М£ = J xp(x)dx = (1 - а) \ xp2{x)dx +
+ "У \xpkb(x-xk)dx =
к L
= (1 - a) J xp2(x)dx + я]Г /?***.
-ов А:
18.3.16. Моделирование случайных
величин с помощью ЭВМ. Предположим, что
с помощью ЭВМ можно получить любое
число п независимых наблюдений Xj, x2,..., х„
над случайной величиной £ ~ /?(0; 1). Как по
ним получить наблюдения у^, у2,..., У„ над
случайной величиной Т|, имеющей данную
функцию распределения F(x) ?
Если Т| имеет дискретное распределение
' Z\ Z2 ... Z„
[Р\ Р2 - Рп
то достаточно положить
fZ\, если 0 < хк < р\;
\Z2, если/?, <** </?, +/?2;
Ук
Z„, если /?, + р2 + ••• + />„_, < хк < 1;
Если функция распределения /\х)
случайной величины Т| непрерывна и строго
монотонна, то задача решается
преобразованием
yk=F-l(xk).
Однако функция распределения F(x),
будучи непрерывной, может не быть строго
монотонной (например, на отдельных
участках она может вести себя как константа). В
этом случае следует рассмотреть функцию
F_{(x) = sup{y:F(y)<x}.
Моделирование значений ук тогда можно
осуществлять по формуле
Ук=Р-\{Хк)-
18.3.17. Функции от случайных
величин. Пусть ^ — случайная величина с
плотностью вероятности р^(х), g(x) — гладко
обратимая функция. Тогда случайная величина
Т| = g (£) имеет следующую плотность
вероятности Рц(х):
РцМ = Р*,(я '(*))
dx
g~lW
В частности, для случая т| = а^ + b (при
а Ф О) имеем:
В приложениях приходится
рассматривать и преобразования Т| = g(£) , для которых
обратное преобразование определено
неоднозначно.
Если каждая из попарно различных
дифференцируемых функций \|/j(x), у2(х),...
..., у„(х) удовлетворяет условию g(y(x)) = х,
а никакие другие функции этому условию не
удовлетворяют, то плотностью вероятности
p^(x) случайной величины Т| = g(£) будет
РцМ = ^Р^щМ)
m=i
d < ч
646
Глава 18.4. СЛУЧАЙНЫЕ ВЕКТОРЫ
Глава 18.4
СЛУЧАЙНЫЕ ВЕКТОРЫ
18.4.1. Случайный вектор и его
функция распределения. Если каждая из случайных
величин £i,£2, ...£„ задана на вероятностном
пространстве (Q,*4,P), то можно говорить и
о случайном векторе £ = (^, £2, •••> *ъп) >
заданном на этом же вероятностном
пространстве. Верхний индекс Т означает
транспонирование; как правило, говоря о векторах,
мы будем иметь в виду векторы-столбцы, что
позволит шире использовать удобные
матричные обозначения.
Функция
/г(х1,х2,...,х„) =
= Р($1 <*1>^2<*2>-Л/<*//)>
определенная для всякого случайного вектора
£ , называется функцией распределения этого
вектора, или совместной функцией
распределения случайных величин ^, £2, •••» Ьп •
Очевидно, что
0<F(x{,x2,...,xn)<\.
По аналогии с одномерным случаем при
а{ <Ьиа2 <Ьъ...,ап < Ьп ,
Р(а{ <^{<bua2<^2<b2, •••> ап ^ Ьп < Ьп) =
Каждый знак А" здесь использован для
ап
обозначения приращения стоящей под ним
функции, соответствующего приращению
аргумента х^ от ак до Ь^. Например,
Р(а, <$, <Ььа2<%2 <Ь2) = a£aJ/-(*i,*2) =
=Aj(/-(Ai,x2)-F(fll,X2)) =
= {F(bl,b2)-F(bl,a2))-(F(ahb2)-F(ai,a2)).
Таким образом, вероятность попадания слу-
т
чайного вектора £ = (£i,l;2) B
прямоугольник flj < Xj < b[, а2< х2< b2 полностью
определяется значениями функции
распределения F{x.\,x-i) в вершинах этого
прямоугольника.
Основные свойства функции
распределения:
1>д£...л£л£/(*1,*2. ■•■.*,,)* о д™
любых а\ < b[, а2 < b2,..., an<bn\
2) F(x^ л*2,..., xn) непрерывна слева по
каждому аргументу;
3) F(-oo, хъ ..., хп) = F(x{,-оо,..., х„) =
= .-. = JF(x1,x2,...,-oo) = 0;
^(+оо, + оо, ..., + оо) = 1.
Всякая функция F (Х[, х2,..., хп),
обладающая тремя приведенными свойствами,
может рассматриваться как функция
распределения некоторого случайного вектора
По функции распределения F(x\,x2,...
...,xw) случайного вектора легко находится
функция распределения любого его подвекто-
ра. Для этого нужно в функции F «лишние»
аргументы положить равными +<». Пусть,
например, F(x,y,z) ~ функция распределе-
т
ния случайного вектора (^,Л>С) • Введем
обозначения: /^(х), F2(y), F3(z) ~ функции
распределения случайных величин £, т|, £ ;
F[2(x,y)y ^1з(*>*)> F23(y,z) ~ функции
распределения векторов соответственно
(^Л)Т,(^С)Ти(л,С)Т.Тогда
F{(x) = ^(x,+oo,+oo), Fi2(x,y) = F(x,y,+*o),
F2(y) = F{+<*>,У,+<*>), Fi3(x,z) = F(x,+*o,z),
F3(z) = /,(+oo,+oo,z); F23(y,z) = F(+*o9y,z).
18.4.2. Независимые случайные
величины. Случайные величины £j, £2,..., £/7
называют независимыми в совокупности (или
просто независимыми), если их совместная
функция распределения равна произведению
частных функций распределения:
F(x{, хъ..., хп) = F{ (x{)F2 (x2) •... • F„(xn).
НЕКОРРЕЛИРОВАННЫЕ ВЕЛИЧИНЫ
647
Если случайные величины £i,£2»—»£/i
независимы и g\(x),g2(x),...,gn(x) -
кусочно-непрерывные функции, то случайные
величины £i(£i), £2(^2)'->£«(£«) также неза"
висимы.
18.4.3. Ковариация и коэффициент
корреляции двух случайных величин. Пусть
£ и Т| — скалярные случайные величины с
конечными вторыми моментами. Это условие
обеспечивает существование ковариации
cov(£,T|) w коэффициента корреляции р(£,Т|),
определяемых следующими формулами:
cov(£,T|) = M
о о
м-Ш-
В последней формуле дополнительно
подразумевается, что D£ * 0 , Dt| Ф О .
Очевидно, что
соу(^л) = соу(л^) , р(^,л) = р(л>§) •
cov(i^) = D^, р(«) = 1-
Формула
соу(^,л) = М[^л]-М^Мл,
часто используемая для вычисления
ковариации, является естественным обобщением
формулы Щ = m[s2] - (М^)2 .
Коэффициент корреляции в отличие от
ковариации - безразмерная и
нормированная величина:
|р&Л)|£1.
Равенство р(£,л)| = 1 достигается тогда и
только тогда, когда величины ^ и Т] (с
конечными ненулевыми дисперсиями) связаны
линейной зависимостью: Р(л = я£ + Ь) = 1;
при этом если а > О , то р(£,л) = 1, если
а <0 , то р(£,л) = -1 •
18.4.4. Некоррелированные величины.
Для любых случайных величин ^ и Т] с
конечными дисперсиями
D [$ + л] = Щ + Щ + 2cov (£,л) •
Случайные величины £ и л (с
конечными дисперсиями) называются
некоррелированными, если их ковариация равна нулю:
соу(£,л) = 0.
Для таких величин равен нулю и
коэффициент корреляции (при ЩБл * 0).
Условие некоррелированности случайных величин
£ и л (с конечными дисперсиями) можно
записать в виде
М[§п] = М£-Мл.
Случайные величины ^, £2> •••> £л (с
конечными дисперсиями) называют попарно
некоррелированными, если
cov($/f$y) = 0 при Ы j.
Для таких случайных величин
D
/с=[
=5>u.
*=i
в то время как в общем случае
D
Л=1
k=\ i<j
Если случайные величины £i,£2»—»£л
с конечными дисперсиями независимы, то
они попарно некоррелированы. Обратное
утверждение неверно: из попарной
некоррелированности случайных величин не вытекает
их независимость.
Замечание. Независимость случайных —
множественное отношение, в то время как
некоррелированность - бинарное отношение.
Можно говорить о множественной
независимости случайных величин ^, ^2» -4« > однако
мы говорим о попарной некоррелированности
этих величин. К тому же решать вопрос о
некоррелированности случайных величин £
и л имеет смысл только тогда, когда
существует каждый из моментов М£ , Мл, М [fyr\] •
Независимыми же эти величины могут быть
даже в том случае, когда ни один из
указанных моментов не существует.
18.4.5. Мультипликативное свойство
математического ожидания. Если случайные
величины £i,£2> •••>£/! с конечными
математическими ожиданиями независимы, то
м & $2 ...§„] = м§,-м^....-»*^.
648
Глава 18.4. СЛУЧАЙНЫЕ ВЕКТОРЫ
18.4.6. Математическое ожидание
случайного вектора и его свойства.
Математическим ожиданием М£ случайного вектора
£ = (£i, ^2» •••» £л) называют вектор
т
(M^i,M^2,—,M^w) , составленный из
математических ожиданий величин £i,£2>—»£л
(если, естественно, эти математические
ожидания существуют).
В теории вероятностей рассматривают и
случайные матрицы, т.е. матрицы,
элементами которых являются случайные величины.
Математическим ожиданием случайной
матрицы порядка тхп
l4ll §12 - §1*1
х =
п
называют матрицу порядка /и х я,
составленную из соответствующих математических
ожиданий
(Щи М$12 ... Щ1я
М[Х] =
\
ми щя2 ... м%„
Справедливы следующие соотношения,
выражающие основные свойства
математического ожидания многомерного распределения:
M[AZ3-tb] = AMZ) + b;
М[АХ] = АМ[Х]\
М[ХВ] = М[Х]В;
М[АХВ] = АМ[Х]В.
Здесь £ - случайный вектор, X — случайная
матрица, А и В - неслучайные матрицы, b —
неслучайный вектор (соответствующих
порядков). Приведенные формулы верны в
предположении, что М£ и MX существуют.
18.4.7. Ковариационная и
нормированная корреляционная матрицы случайного
вектора. Для случайного вектора
т
£ = (£ 1, £ 2»• • •» § //) ковариационная матрица
(или матрица ковариаций) К = к у и
нормированная корреляционная матрица R = р,у
представляют собой матрицы, составленные
из попарных ковариаций и коэффициентов
корреляции соответственно:
^•=COv(^y), p,y =р(£/>£у).
Элементами главной диагонали
ковариационной матрицы К служат дисперсии
величин £i, ^2» •••» £л ; главную диагональ
нормированной корреляционной матрицы R
заполняют единицы.
К и R — симметрические и
неотрицательно определенные матрицы, т.е.
КТ=К, RT=R;
и и
для всяких вещественных Х\,..., хп .
Последние два соотношения, содержащие
квадратичные формы, удобно записывать в
матричной форме
xTKx>0, xTRx>0, (*)
где под х подразумевается вектор
т
х = (х{ух2,...,хп) .
Всякую симметрическую неотрицательно
определенную матрицу порядка п можно
рассматривать как ковариационную матрицу неко-
т
торого случайного вектора £ = (^, ^ — Хп) •
Если на главной диагонали такой матрицы
стоят единицы, то эту матрицу можно
рассматривать и как нормированную
корреляционную матрицу.
Если в (*) равенства достигаются лишь
при х = (Г, то К и R - положительно
определенные матрицы. Противоположный же случай
имеет место тогда и только тогда, когда
случайные величины £|,£2>—>£л связаны
линейной зависимостью:
Р(Х0+Х&+Х£2+- + Хп?,п=0)=\.
Если Т| = АХ + b , где А и b —
неслучайные матрица и вектор, то ковариационные
матрицы К^ и Кл векторов \ и Т| связаны
соотношением
Кл = АК^А1.
АБСОЛЮТНО НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕКТОРЫ
649
18.4.8. Дискретные случайные
векторы. Мы ограничимся рассмотрением дву-
т
мерного случайного вектора (£,Т|) >
распределение которого задается таблицей:
%ы
X,
*2
хт
У\
Р\\
Р2\
Рт\
Уг
Р\г
Р22
Pml
Уп
Pin
Pin
Ртп
Dti = X(>V - Mti) Pv = %{yj ~ Mti) Рч ;
ij J
= ^xiyjPij -J,xiPu ' YiyJpr
и
ij ij
Условие некоррелированности величин
£ и Т| может быть записано в виде
IJ
IJ IJ
Содержание этой таблицы раскрывают
следующие соотношения:
Г \
р(£ = */, л = >>,) = />/,•;
Pi) ^°> ][,/?i,= l
ij
Функцию распределения F(x,y)
рассматриваемого случайного вектора находят по
формуле
F(x,y) = F(Z9<x,T]<y)= ]T Pij.
(ij):xj<x
У)<У
Частные распределения величин £ и Г|
находят из следующих соотношений:
J
Fb = yj) = J,Pij=P-j-
i
Условие независимости случайных
величин £ и Т| может быть записано в виде
Pij = Pi.P.j
для всех допустимых значений / и/
Формулы для начальных моментов 1-го
порядка и центральных моментов 2-го порядка
в данном случае принимают вид:
Mb = ^x<Pij=YlXiPi*>
ij i
ij J
Щ = £(*,- - MS)2 PiJ = £(*,. - MS)2 Pi.;
18.4.9. Абсолютно непрерывные
случайные векторы; многомерные плотности
вероятности. Случайный вектор S = (Sl»^2»---
...,S«) называют абсолютно непрерывным
(имеет абсолютно непрерывное распределение
вероятностей), если его функция
распределения F(x{, x2,..., хп) представима в виде
F{x\,x2,...,xn) =
хп х2 х]
= J J \ P{u\,Ul,-,un)du\dll2- dun>
где р(х\,х2, .~,хп) - неотрицательная на
R" функция, называемая плотностью
вероятности случайного вектора ^ .
Функция р(х\,х2,...9хп)у заданная на
R", может рассматриваться как плотность
вероятности некоторого случайного вектора
тогда и только тогда, когда она
неотрицательна и нормирована:
О Р(х\,х2,...,хп)>0;
2)
J ... j J р(х{, хъ..., x„)dxl dx2...dxn = 1.
Очевидно, что в каждой точке (xj, х2,...
..., хп) непрерывности функции р
р{хихъ...,хп) =
ij
дх{дх2...дхп
F(X\1X2f...9Xn).
650
Глава 18.4. СЛУЧАЙНЫЕ ВЕКТОРЫ
По плотности вероятности p(xi,x2,...,xn)
т
случайного вектора (£j, ^2» •••» £я) может
быть найдена плотность вероятности любого
его подвектора. Для этого нужно функцию
/?(wj, w2,..., w/;) проинтегрировать по
каждому из «лишних» аргументов в пределах от -оо
до ©о. Пусть, например, p(x,y,z) ~ плотность
вероятности случайного вектора (£,Т|>С) .
Введем обозначения: Р\(х), р2(у), p3(z) ~
плотности вероятности случайных величин
£,Л и £; pi2(x,y),Pi3(x,z),P23(y,Z) ~
плотности вероятности случайных векторов
(£, Т|) , (£, С) » (Л» С) соответственно. Тогда
л(*) = JJ/K*,.v,*)4'<fe;
Л 00 = ffp(x,y9z)dxdz;
ли)= J J/?(*,}>, z)d*4v;
Р\2(Х>У)= J P(x,y,z)dz;
Вероятность Р(В) попадания
случайного вектора £ с плотностью вероятности
/?(xj, x2,..., хл) в допустимое множество
В с R" может быть вычислена как
Р(Д) = J..JJ/>(*,,Х2> »■> ^и)^1 *2 - dxn -
Составляющие £|,£2> •••>£/! абсолютно
непрерывного случайного вектора £
независимы тогда и только тогда, когда их
совместная плотность вероятности р (х\, х2,..., хп)
связана с частными плотностями вероятности
Р\{х\)>Р2{х2)>—> Рп{хп) почти ВС1°ДУ
соотношением
/?(x1,X2,...,xw) = /?1(x1)/?2(x2)-..
• " Рп \хп) •
18.4.10. Условное распределение и
условное математическое ожидание
случайной величины относительно случайного
события. Пусть £ — случайная величина,
заданная на вероятностном пространстве
(Q, А,Р), А б Л и Р(у4) > 0 . Тогда функция
аргумента х обладает всеми свойствами
обычной функции распределения.
Соответствующее ей математическое ожидание называют
условным математическим ожиданием
случайной величины £ относительно события А:
М[$\А]= J xdF(x\A)
(при условии, что этот интеграл Стилтьеса
сходится абсолютно).
Если Н\,Н2,... — полная группа
попарно несовместных гипотез, то
М& = ]£м[$|Я,]Р(Я,)-
к
18.4.11. Условное распределение одной
случайной величины относительно другой
(случай дискретного совместного
распределения). Предположим, что случайные
величины £ и Т| имеют дискретное совместное
распределение вероятностей и
Р(£ = */, Л = >>;) = />/, •
Тогда
р(л=Уу1§ = *,)..&
м[л|*-*,]-Х>А
j Ры
(см. п. 18.4.8). Функция
Н(х) = М[г\\% = х\,
ФОРМУЛА УМНОЖЕНИЯ ПЛОТНОСТЕЙ
651
заданная на множестве {х|,Х2>---} значений
случайной величины % , называется условным
математическим ожиданием случайной
величины Г) при условии, что ^ = х , а также
регрессией г\ на ^ . С этой неслучайной функцией
#(х) связана случайная величина //(^),
которую мы будем обозначать М[г||^] и
называть условным математическим ожиданием
случайной величины г\ относительно случайной
величины £ . Итак,
Оказывается, что М[#(£)] = Mr] , то
есть
Мл = М[М[л|§]].
Эту формулу называют формулой полного
математического ожидания.
18.4.12. Условное распределение одной
случайной величины относительно другой
(случай абсолютно непрерывного
совместного распределения). Пусть р(х,у)
-совместная плотность вероятности случайных
величин % и Г). Попытки найти распределение
случайной величины Т| при условии £ = х
наталкиваются на то, что вероятность такого
условия в данном случае равна нулю. Это
препятствие можно преодолеть, рассматривая
случайное событие {£ = х} как предел
событий вида х- Ах <£,< х + Ах при ДхчО и
Ах > 0 в предположении, что Р(х-Ах<
< £ < х + Ах) > 0 для всякого Ах > 0 . Тогда
условная функция распределения /^(.у!*)
случайной величины Г] при условии ^ = х
определится как
F2{y\x) = P^<y\\ = x) =
= lim Р(г| < Их- Ах <£ < х + Ах),
Дх->0
(Ах>0)
что приводит к следующей формуле для
условной плотности вероятности />2(.у|*)
случайной величины Г) при условии £ = х:
В случае р\ (х) = 0 обычно полагают, что
р2{у\х) = 0.
Так определенная функция /^2 (з^!^)
аргумента у (содержащая х в качестве
параметра) обладает всеми свойствами обычной
плотности вероятности (неотрицательность и
нормированность). В частности, можно
говорить об условном математическом ожидании
случайной величины Г) при условии, что ^ = х :
оо
H(x) = M[i)\% = x]= \yp2{y\x)dy.
Регрессия Г] на £, — еще одно название
функции Я(х). Случайную величину
называют условным математическим ожиданием
случайной величины г\ относительно случайной
величины {;. Так же, как и в случае
дискретного распределения случайных величин £ и
Т), имеет место формула полного
математического ожидания:
Мл = м[м[л|у].
18.4.13. Наилучшая в среднем квад-
ратическом оценка одной случайной
величины по другой случайной величине.
Предположим, что требуемую нам информацию о
случайной величине Г] мы можем получить
только по наблюдениям над случайной
величиной £ . Тогда возникает задача о выборе
функции g(x) , минимизирующей ошибку
Такой функцией оказывается функция
8(х) = М[ц$ = х] = Н(х).
В соответствии с этим условное
математическое ожидание М[г||^] рассматривается
как наилучшая в среднем квадратическом
оценка случайной величины Г] по случайной
величине £ .
18.4.14. Формула умножения
плотностей. При рассмотрении случайных величин
% и Г), естественно, можно фиксировать
величину г) и говорить об условном распре-
652
Глава 18.4. СЛУЧАЙНЫЕ ВЕКТОРЫ
делении случайной величины £ при условии
Л = у . Формула
я(Ф):
Р(х,у) /lfwn
-—, если P2(y)>Vi
Pi(y)
О, если />2(.К) = 0,
определяет условную плотность вероятности
случайной величины £ при условии Г| = у.
Простым следствием формул для условной
плотности вероятности служит следующая
формула умножения плотностей
Р(х, У) = Р\{х\ у)р2 (У) = Р2{У\ Х)Р\ (*)■
Для независимых случайных величин £
и Г|
Р(х,у) = Р\(х)р2(у),
и, стало быть,
P\(x\y) = pi(x), Pi(y\x) = p2(y).
В частности, с вероятностью 1
М[л|^ = х] = МЛ, М[Л|^] = МЛ.
18.4.15. Обобщения на многомерные
распределения. Представленные выше
результаты легко распространяются с двумерных
на многомерные распределения. Например,
если p(x,y,z) - плотность вероятности
случайного вектора (£,Л>С) » то й(£|*>^) ~~
условная плотность вероятности случайной
величины С, при условии £ = дс, Т| = у
выразится по формуле
1 Рп(х,у)
где Р\2(х,у)>0 - плотность вероятности
случайного вектора (£,л) (при Р\2(х,у) =
= 0 обычно считают, что р$ (z \х,у) = 0).
Следовательно,
случайного вектора £ = (£i, £г»••■ > £л ) оп~
ределяется как
или, в матричных обозначениях,
ф(/) = М^.
Чтобы по заданной
характеристической функции ф(/j, t2 ,..., /„ ) вектора
(^1 у ^2 > • • •»£w ) найти характеристическую
функцию его подвектора, достаточно в ф
положить все «излишние» переменные
равными нулю. Например, если ф(/, т, s),
9l(0, ФгМ, Фз(*), Ф12С *). Ф1зС> *),
Ф2з(т»5) ~~ характеристические функции
соответственно (£, л, С)Т, $, Л, С, (5> Л)Т,
&0Т> (л,От,то
ф,(/) = ф(Г,0,0), ф12(М) = ф(М,0),
Ф2 (*) = ф(0,т,0), ф13 (t,s) = ф(/,0,5),
Фз(0 = ф(0,0,5), ф23 (Т,*) = ф(0,Т,5).
Характеристическая функция случайного
вектора обладает следующими свойствами:
1) |ф(/,,/2,...,Гл)|<ф(0,0,...,0) = 1;
2) ф('ь*2>—>'л) ~ Функция,
равномерно непрерывная на R" ;
3) если л = Л% + Ь, где А и /> -
неслучайные матрица и вектор, то
характеристические функции фе и фп векторов £ и л
связаны соотношением
^(х) = енТ\(АТх);
4) ср(-0 = ф(0;
5) Лф?#...#]
(-//ЭХО
М
р(^,^,г)
Э^Э^.-.Э^"
1 ' J J /Ы*^)
Ы)
18.4.16. Характеристическая функция
случайного вектора и ее свойства.
Характеристическая фуНКЦИЯ ф(/) = ф(/| , t2 ,..., tn )
где t = (t{,...,tn), r = r{+r2+... + rn в
предположении, что указанный смешанный
момент существует;
6) случайные величины (векторы) £ и л
независимы тогда и только тогда, когда их
совместная характеристическая функция пред-
МНОГОМЕРНОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ВЕРОЯТНОСТЕЙ
653
ставима в виде произведения их частных
характеристических функций:
<p(>i, '2) = «л d )Ф2 ('2) = ф(>1 > о)ф(°> h);
7) если случайные величины (векторы
одинаковой размерности) £ и Т|
независимы, то характеристическая функция их суммы
равна произведению их характеристических
функций:
Ф^+л О = <М0 ' Фл (>)•
Это свойство характеристических
функций лежит в основе метода
характеристических функций, широко используемого при
изучении сумм независимых случайных
величин (векторов) - одной из центральных задач
теории вероятностей.
18.4.17. Свертка плотностей
вероятности. Для независимых абсолютно
непрерывных случайных величин £ и Т| плотности
вероятности р^(х), рц(х); р^+ц(х) этих
величин, а также их суммы связаны
соотношением:
оо
Р^ц(х)= J p^(u)pr](x-u)du =
= J p1](v)p^(x-v)dv.
Это так называемая формула свертки
плотностей р^(х) и рц(х).
18.4.18. Многомерное нормальное
распределение вероятностей. Известно, что
если | ~ Л/"(0;1), то
*; = о£ + ц~^(ц;о2).
Этот простой факт кладется в основу
определения многомерного нормального
распределения вероятностей.
Случайный вектор £ = (^ Д2 » — Дл )
с независимыми одинаково распределенными
по закону J\f(0; 1) составляющими
называют стандартным нормальным вектором.
Случайный вектор £ = (£i,^2 »• • • > £л )
называют нормально распределенным, если он
может быть получен в результате некоторого
аффинного преобразования стандартного
нормального вектора,
§ = о| + ц ,
где а — невырожденная квадратная матрица
порядка п. Математическое ожидание М£ и
ковариационная матрица К вектора %
выражаются через характеристики
рассматриваемого аффинного преобразования следующим
образом:
М£ = ц, К = оот.
Любое из приведенных ниже условий
необходимо и достаточно для того, чтобы
случайный вектор £ был нормально
распределенным (часто эти условия кладутся в
основу определения нормально распределенного
случайного вектора):
1) плотность вероятности р(х) = р(х\,
х2,...,хп) случайного вектора £ = (^,
^2> —>£л)Т имеет вид
/>(*) = J-^—exp\--(x-\i)TC(x-\i)\]
\(2я)л I 2 J
2) характеристическая функция (р(/) =
ф(/| ,?2 ,-• ,tn ) случайного вектора £ имеет
вид
9(/) = exp|i7T»i-i/TK/J.
В приведенных формулах /, цеК", а
К и С - положительно определенные
матрицы, являющиеся взаимно обратными:
К = С1
Таким образом, математическое
ожидание и ковариационная матрица полностью
описывают многомерное нормальное
распределение вероятностей. Это находит свое
отражение и в обозначении данного
распределения Af(\i; К). В частности, для стандартного
нормального вектора пишут % ~ Af(0; I).
Если £,~ЛГ(\1\К) и ц = А£, + Ь,
причем строки (неквадратной, вообще говоря)
матрицы А линейно независимы, то
Г) ~ Af(A\i + b\ AKAT ). В частности, любая
нетривиальная линейная комбинация
координат нормально распределенного случайного
вектора распределена нормально. Верно и
обратное утверждение: если любая
нетривиальная линейная комбинация координат
случайного вектора распределена нормально, то
и вектор этот распределен нормально. Это
еще одна характеризация нормального рас-
654
Глава 18.4. СЛУЧАЙНЫЕ ВЕКТОРЫ
пределения вероятностей; она также может
быть положена в основу определения
многомерного нормального распределения
вероятностей.
Если Т| = At, + b и строки матрицы А
линейно зависимы, то характеристическая
функция вектора Т) будет
т>4
ФЛ (х) = ехр /тт (Лц + Ь) - v-xT (AKA
т.е. имеет вид характеристической функции
нормального распределения вероятностей, но
с вырожденной ковариационной матрицей
АКА ; о таком векторе говорят, что он
имеет вырожденное нормальное распределение.
Из попарной некоррелированности
составляющих нормально распределенного
случайного вектора вытекает их совокупная
независимость. С учетом результатов п. 18.4.4
можно считать, что для составляющих
нормально распределенного случайного вектора
понятия попарной некоррелированности и
совокупной независимости равносильны.
С помощью линейного (и даже
ортогонального) преобразования нормально
распределенный случайный вектор можно
преобразовать в нормально распределенный
случайный вектор с независимыми составляющими.
Для (п + т) -мерного нормально
распределенного случайного вектора
т
рассмотрим его взаимно
дополнительные подвекторы С = (^1» ^2 » •••» £>п )Т и
Л = (Л|, Л2 > •••> Лю )Т • Пусть М£ = \1 = (ц,,
^2> •••> МТ> Мл = v = (v,, v2,...,v/w)T;
разобьем на соответствующие блоки
ковариационную матрицу К вектора £ и матрицу
С = К1 :
К =
К.
К
21
К|2^
К
22
, с
-21
-12
-22
(К| | и С| | — матрицы порядка п х п -
в соответствии с размерностью подвектора £,
а К22 и С22 ~" матрицы порядка тхт —
в соответствии с размерностью подвектора г)).
В этих обозначениях
^~^(ц;К„) = ЛА(ц;(С11-С|2С^С21Г1);
Л~ЛА(у;К22) = ЛА(у;(С22-С21С-1С|2Г1).
Обозначим через С (r\ | £ = х) и
£ Оэ | Л = у) условные законы распределения
случайного вектора т\ при условии £ = х и
случайного вектора ^ при условии Г) = у
соответственно. Тогда
£(л|^ = х) = ЛГ(у + К21К-1,(х-ц);К22-К2|К-1К12) = ЛА(у + К21К711(х-ц);С^);
ASh = y) = ./v-(n + K12K-'0>-v); Ku -К|2К2-'К21) = ^(ц + К12К2-]0>-у); q,1).
Теорема о нормальной корреляции доставляет наилучшую в среднем квадратическом оценку
Л(^) подвектора Г) по подвектору ^ , а также ошибку такой оценки в виде соответствующей
матрицы А :
л(^) = м[л|^] = у + к21к-1,(^-Ю;
[(л-л(^))(л-л(^))Т] = К22-К21к-11к12.
А = М
В заключение приведем частные, но ши- распределенного случайного вектора (£,л)Т •
роко распространенные в приложениях ре- Плотность вероятности такого вектора запи-
зультаты, касающиеся двумерного нормально сывается в виде
ФУНКЦИИ ОТ СЛУЧАЙНЫХ ВЕКТОРОВ
655
Р(*,У)
2пО\02 >/1
гехр
1
2(1 V)
(х-V)2 ^(x-\i)(y-v) , (у-v)2
= 2р + =—
о{о2
где М£ = ц, D£ = о], Мл = v, Dti = о\,
р(5, Л) = Р-
Для рассматриваемого случая
М[л|$ = х] = у + р^-(х-ц),
О[л|^ = х] = о2(1-р2),
и теорема о нормальной корреляции
принимает вид
4(U = Mh|$] = v + pH2-($-n),
д = м
(ti-Л^))2
^(l-p2)-
^(tO = H(h)-H(ti|$)
показывает, как изменяется
«неопределенность» случайной величины Т| в результате
наблюдений над величиной £, и поэтому
называется количеством информации о величине
Т), содержащейся в величине £ .
В общем случае
0<^(n) = Jn(^).
Количество информации
неотрицательно; величина ^ несет в себе то же количество
информации о величине Г), что и величина
Т) о величине ^ .
Если ^ и Т| имеют нормальное
совместное распределение J\f(\i,K) , то
18.4.19. Энтропия и количество
информации. Пусть р(х,у) — совместная
плотность вероятности случайных величин ^
и Т| (не обязательно нормально
распределенных), Р[(х) и р2(у) ~ их частные
плотности вероятности, /?2i(j>|x) - условная
плотность вероятности случайной величины
Г) при условии £ = х. Энтропия Н(^,Г|)
случайного вектора (5,Л) определяется как
H(%,4) = -jjp(x,y)lnpix,y)dxdy,
а условная энтропия Н(г) | % - х) - как
Н(Л 15 = х) = - JJ р2{ (У | х) In p2{ (у | x)dy.
R2
Усреднение этой условной энтропии по
распределению случайной величины £
приводит к Н(г) |^) - средней условной энтропии
величины т\ относительно величины £, :
Н(л|4)= J Н(т,|$ = *)*,(*)<**■
Разность
H(^) = lnV(2n*)2detK,
и это - наибольшая энтропия, которую
может иметь двумерное распределение
вероятностей с фиксированным значением detK;
далее
^(л):
1п-
1
VT
где р - коэффициент корреляции данных
величин.
Приведенные здесь понятия легко
обобщаются на случай, когда ^ и Т) —
случайные векторы.
18.4.20. Функции от случайных
векторов. Пусть $ = (§1, £2> •■•> 5л )Т "
случайный вектор с плотностью вероятности
Р$ (х{, х2 , ..., хп ), а вектор г| = (ц\,
Т|2, .,Т|/7 )Т получается в результате
некоторого обратимого преобразования вектора Ъ,:
Л] = Sl(5i, 52, •••> 5л),
Л2 = ^2 (^1, 52 > ••■» 5л),
Л/1 = £л(5ь ^2 » -1 5л )»
656
Глава 18.5. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
\\ =¥1 (Л!, Л2^ ■■•> Л„),
h = Ч>2 (Ль Л2> -> Л„),
.5/1 =Уя(Л1, Л2> •••> Ля),
(все равенства между случайными величинами
рассматриваются здесь с вероятностью I),
причем якобиан
j=dctbi{xi'X2'-'Xn)Lo.
dXj
Тогда для плотности вероятности
случайного вектора Г| имеем:
рц (х, ,...,хп ) = #: (\|/, (х, ,...,*„ ),...,
У„(*1,...,*я))|.7|.
Глава 18.5
ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ
ТЕОРИИ ВЕРОЯТНОСТЕЙ
18.5.1. Неравенство Чебышева. При
е>0
Щ>е):
МЩ
для всякой случайной величины % с М|^| < ©о и
Р(|^-М^|>е)<^
для всякой случайной величины £ с
конечной дисперсией. Каждое из приведенных двух
неравенств называют неравенством Чебышева.
Так же называют и более общее неравенство
(е, / > 0 ) при условии, что МЩ < ©о . В
некоторых источниках оно приводится как
обобщенное неравенство Чебышева, а также как
неравенство Маркова.
18.5.2. Сходимость по вероятности.
Последовательность случайных величин ^,
£г>—»£я>— сходится к случайной
величине £ по вероятности (записывается:
£л —-—>£,), если для всякого е > О
iimP(|^-^|>e) = 0.
Предел по вероятности единствен в
вероятностном смысле: если £,„ —-—>£ и
18.5.3. Сходимость почти наверное.
Последовательность случайных величин £|,
^2 j—j^/i »••• сходится к случайной величине
£ почти наверное или с вероятностью I
(записывается: £л ———>£), если
pjweft: lim^w(w)^^(w)}=0.
Условие сходимости почти наверное
записывают и по-другому, в частности,
lim p(sup|^„ -^|>е} = 0.
П-*оо Ш>П J
Случайная последовательность имеет не
более одного (в вероятностном смысле)
предела почти наверное.
При построении примеров и
контрпримеров, связанных со сходимостью почти
наверное, оказываются полезными следующие
утверждения.
Признак сходимости почти
наверное.
Если для всякого е > О
ХР(|^-^|>е)<оо,
то
18.5.4. Сходимость в среднем.
Последовательность случайных величин £|,
^2 ,...,£я,... сходится к случайной величине
^ в среднем порядка t > О , если
limM|^-^=0.
В приложениях особенно часто
используется сходимость в среднем порядка / = 2
(ввиду простоты соответствующего
аналитического аппарата). Для такой сходимости
приняты специальное название — сходимость
НЕПРЕРЫВНОЕ ПРЕОБРАЗОВАНИЕ СХОДЯЩЕЙСЯ СЛУЧАЙНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ 657
в среднем квадратическом — и специальные
обозначения: £„ ———>£, £ = l.i.m.^,,
(l.i.m. = limit in mean).
18.5.5. Сходимость по распределению.
Последовательность случайных величин ^,
^2 »-ч£л »■•• сходится к случайной величине
£, по распределению, если соответствующая
последовательность {Fn(x)} функций
распределения сходится к функции
распределения F(x) величины £ ,
lim F„(x) = F(x),
в каждой точке непрерывности предельной
функции распределения F(x). Записывается
это так: £„ >£ (d = distribution). Пишут
также Fn(x) => F(x) и говорят, что
последовательность {Fn(x)} функций
распределения сходится в основном к функции
распределения F(x). Если предельная функция
F(x) непрерывна (на всей числовой
прямой), рассматриваемая сходимость будет
равномерной по х.
Ниже приводятся основные
критерии сходимости по
распределению.
1). £,„ »£ тогда и только тогда,
когда соответствующая последовательность
{фя(0} характеристических функций
сходится поточечно к функции (р(0 , непрерывной
в точке t - О; в этом случае ф(/) служит
характеристической функцией случайной
величины £ .
2). £„ >£ тогда и только тогда,
когда для всякой непрерывной и
ограниченной вещественной функции g(x)
limMg(i,) = M*($).
18.5.6. Обзор импликаций, связанных
с видами вероятностной сходимости.
В приводимой схеме (рис. 18.5.1) показано,
как связаны между собой рассмотренные
выше виды вероятностной сходимости.
Необратимость (в общем случае) приведенных
стрелочек лишь усиливает интерес к некоторым
Сходимость
почти
наверное
Сходимость
в среднем
Сходимость
по
вероятности
Сходимость
по
распределению
частным
d
*>п
Рис. 18.5.1
результатам. Так, из условия
->С (сходимость к постоянной ве-
личине) следует, что £„
18.5.7. Сходимость случайных
последовательностей и соответствующих
моментов. Предположим, что £„ —> % в том или
ином смысле. Моменты М к£ и М к |
при этом могут и не существовать; возможен
также случай, когда один из них существует,
а другой - нет. Но если даже каждый из
рассматриваемых моментов существует, условие
М kJ —> М кг может не выполняться.
Если £л
->^ и для некоторого
s>0
supM[V„]
<оо
то для любого положительного г < s
18.5.8. Непрерывное преобразование
сходящейся случайной последовательности.
Если g(x) - непрерывная вещественная
функция и £„ —> % почти наверное, по
вероятности или по распределению, то
g(£>n ) ~~> £(£) в том же смысле. При
дополнительном условии об ограниченности
функции g(x) это утверждение распространяется
и на сходимость в среднем.
658
Глава 18.5. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
18.5.9. Закон больших чисел. Говорят,
что для последовательности случайных
величин £|, £2 >•••>£/! »••• с конечными
математическими ожиданиями ^=М[^]
(А: = 1,2,...) выполняется закон больших
чисел, если
В случае, когда все члены
рассматриваемой последовательности имеют одинаковые
математические ожидания, ак - а ,
приведенное соотношение может быть
преобразовано к виду
Теорема Чебышева. Для случайной
последовательности {£,„} выполняется закон
больших чисел, если:
1) члены такой последовательности
попарно некоррелированы;
2) существует С > О, такое, что
D^n < С для всякого натурального п.
Теорема Хинчина. Для всякой
последовательности независимых одинаково
распределенных случайных величин с конечным
математическим ожиданием закон больших чисел
выполняется.
Частным случаем приведенных теорем
является следующая теорема.
Теорема Бернулли. Если \1п — число
успехов в п испытаниях Бернулли с
вероятностью р успеха в отдельном испытании, то
—>р.
п
18.5.10. Усиленный закон больших
чисел. Говорят, что для последовательности
случайных величин Ъ,\, £2 »•■•»£/!»••• с
конечными математическими ожиданиями
tffc = M[£fc ] (к = 1,2,...) выполняется
усиленный закон больших чисел, если
l£(fe-et)_JLB_»0.
п k=\
В случае, когда все члены
рассматриваемой последовательности имеют одинаковые
математические ожидания, а^ - а ,
приведенное соотношение может быть
преобразовано к виду
п к=\
Теорема. Всякая последовательность £| ,
^2 »• ~Лп »■•• независимых случайных
величин, такая, что
1Н„
У-
<оо,
удовлетворяет усиленному закону больших
чисел.
Теорема Колмогорова. Всякая
последовательность независимых одинаково
распределенных случайных величин с конечным
математическим ожиданием удовлетворяет
усиленному закону больших чисел.
Теорема Бореля. Если \1п — число
успехов в п испытаниях Бернулли с вероятностью
р успеха в отдельном испытании, то
Hi, 1
>р.
п
18.5.11. Центральная предельная
теорема. Говорят, что для последовательности
случайных величин £| , £2 * — &п »■••
выполняется центральная предельная теорема, если
lim P
/7->оо
Vms,+J&+-+U
< X
НОРМАЛЬНАЯ И ПУАССОНОВСКАЯ АППРОКСИМАЦИИ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ 659
Эта теорема раскрывает ту особую роль,
которую в теории вероятностей играет
нормальное распределение.
Пусть
ак=Щк, <з\=Щк, в1=^о\,
Fk(x) = P(^<x).
Центральная предельная теорема в
условии Линдеберга. Если для последовательности
^1, ^2 > •• -Лп> ••• независимых случайных
величин с конечными дисперсиями
выполняется условие Линдеберга
lim-Lf f (x-ak)2dFk(x) = 0
°" *=1|Х-,7*|>Т1?„
для всякого т > 0, то для нее выполняется
центральная предельная теорема.
Можно доказать, что в условии
Линдеберга при п —» ©о
18.5.12. Нормальная и пуассоновская
аппроксимации биномиального
распределения. Приводимые здесь теоремы обычно
выводятся из центральной предельной теоремы.
Но исторически они появились задолго до
нее и послужили первым крупным
достижением на пути к этой теореме.
Локальная теорема Муавра—Лапласа.
Пусть \1п - число успехов в п испытаниях
Бернулли с вероятностью р успеха в
отдельном испытании, 0 < /> < 1, q = 1 - /?,
Р„ (/я) = Р(ц„ = т). Тогда при п -> °о
yfnpqPn(m):^
т-пр
Jnpq
->1
равномерно по всем /я, для которых величина
т-пр
фгрд
max о:
\<к<п К
0.
К
Это соотношение показывает, что вклад
дисперсии D^ в суммарную дисперсию Вп
бесконечно мал при п —» «>.
Простейшая предельная теорема. Для
всякой последовательности ^ , £2 »•••» £л »•■•
независимых одинаково распределенных
случайных величин с математическим ожиданием
2
а и дисперсией а
lim P
(5i +£,2+... + £,„)-па
ijn
< X
= Ф(х)
равномерно по х.
Теорема Ляпунова. Пусть
Для всякой последовательности £|,^2>--->
£„,... независимых случайных величин,
удовлетворяющих условию
с„
lim
В„
О,
выполняется центральная предельная теорема.
заключена в каком-либо конечном интервале.
На практике эта теорема используется в
виде
P„C*) = OV
yfnpq y/2
exp
т-пр
Интегральная теорема Муавра—Лапласа.
В условиях предыдущей теоремы
limP
Я->оо
Ш -W
< X
Ф(Х).
Это позволяет довольно просто
оценивать вероятность попадания числа успехов \in
в заданный интервал:
Р(/и, <\in <т2)~
Ф
\ т2 - пр
{ yfnpq )
-Ф
/И| - пр
Jnpq
Неравенство Берри—Эссеена:
sup
Vn ~ПР
< X
Ф(х)
2 2
р +д
660
Глава 18.5. ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
дает представление о скорости сходимости в
теореме Муавра-Лапласа.
Оно, в частности, показывает, что при
малом р нормальная аппроксимация
биномиального распределения может оказаться
неоправданной. Но в таком случае можно
рассмотреть пуассоновскую аппроксимацию (см.
п. 18.3.11):
Р(ц„=/я):
(npf
т\
т2
-пр
?(т{ <\in<m2)= £
(npf
о-пр
При этом, как можно доказать,
т2
т\
Р(/я, < \хп < т2) - ]£
т—т\
(пр)"
р-пр
; пр
Это в каждом конкретном случае и
решает вопрос о целесообразности
использования пуассоновской аппроксимации
биномиального распределения вероятностей.
СПИСОК ЛИТЕРАТУРЫ
1. Гнеденко Б.В. Курс теории
вероятностей. М.: Наука, 1969.
2. Колмогоров А.Н. Основные понятия
теории вероятностей. М: Наука, 1974.
3. Пугачев B.C. Введение в теорию
вероятностей. М: Наука, 1968.
4. Севастьянов Б.А. Курс теории
вероятностей и математической статистики. М:
Наука, 1982.
5. Феллер В. Введение в теорию
вероятностей и ее приложения. Т. I. M.: Мир, 1967.
6. Чистяков В.П. Курс теории
вероятностей. М.: Наука, 1982.
7. Ширяев А.Н. Вероятность. М.: Наука,
1980.
Раздел 19
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Глава 19.1
ОСНОВНЫЕ ВЫБОРОЧНЫЕ
ХАРАКТЕРИСТИКИ
19.1.1. Основные понятия.
Математическая статистика — наука о математических
методах, позволяющих по статистическим
данным, например, по реализациям
случайной величины (СВ), построить теоретико-
вероятностную модель исследуемого явления.
Задачи математической статистики
являются, в некотором смысле, обратными к
задачам теории вероятностей. Центральным
понятием математической статистики является
выборка.
Определение 19.1.1. Однородной выборкой
(выборкой) объема п при п > 1 называют
случайный вектор Zn = col (Л),..., Хп ) ,
компоненты которого Xj, i = \,п , называемые
элементами выборки, являются независимыми
СВ с одной и той же функцией
распределения F(x). Будем говорить, что выборка Zn
соответствует функции распределения
F(x).
В дальнейшем символом со\(Х[,...,
Хп ) будем обозначать вектор-столбец с
компонентами Х\,..., Хп .
Определение 19.1.2. Реализацией выборки
называют неслучайный вектор zn = col(*j ,...
хп ), компонентами которого являются
реализации соответствующих элементов выборки
Xj, i = 1, п .
Из определений 1 и 2 вытекает, что
реализацию выборки zn можно также
рассматривать как последовательность Xj,...,xw из п
реализаций одной и той же СВ X,
полученных в серии из п независимых одинаковых
опытов, проводимых в одинаковых условиях.
Поэтому можно говорить, что выборка Zn
порождена наблюдаемой СВ X, имеющей
распределение Fx (х) = F(x).
Определение 19.1.3. Если компоненты
вектора Zn независимы, но их
распределения Fy (jcj ),..., Fn (xn) различны, то такую
выборку называют неоднородной.
Определение 19.1.4. Множество S всех
возможных значений выборки Zn называют
выборочным пространством.
Выборочное пространство может быть
всем л-мерным евклидовым пространством
R" или его частью, если СВ X непрерывна, а
также может состоять из конечного или
счетного числа точек из Rw , если СВ Л"дискретна.
На практике при исследовании
конкретного эксперимента распределения F\ (x\),...,
Fn(xn) СВ Х\,...Хп редко бывают
известны полностью. Часто априори (до опыта)
можно лишь утверждать, что распределение
FzH(ZH) = Fiixi):..-F„(xn) случайного
вектора Zn принадлежит некоторому классу
(семейству) Т.
Определение 19.1.5. Пару (S,?)
называют статистической моделью описания серии
опытов, порождающих выборку Zn .
662
Глава 19.1. ОСНОВНЫЕ ВЫБОРОЧНЫЕ ХАРАКТЕРИСТИКИ
Определение 19.1.6. Если распределения
Fz (Zn>Q) из класса ? определены с
точностью до некоторого векторного параметра
0 € 0 с Rs , то такую статистическую модель
называют параметрической и обозначают
{Se,FZ„(Z„,e)), 860cRs.
В некоторых случаях выборочное
пространство может не зависеть от неизвестного
параметра 0 распределения Fz (zn,Q)-
В зависимости от вида статистической
модели в математической статистике
формулируются соответствующие задачи по
обработке информации, содержащейся в выборке.
Определение 19.1.7. СВ Z = (p(Z/7), где
<p(zn) — произвольная измеримая функция,
определенная на выборочном пространстве S
и не зависящая от распределения Fz (гЛ,0),
называется статистикой.
19.1.2. Вариационный ряд.
Упорядочим элементы реализации выборки Х[,...,хп
по возрастанию: х^ < х^ < ... < х^ , где
верхний индекс соответствует номеру
элемента в упорядоченной последовательности.
Обозначим через Х^ ' ,к = 1,Л, случайные
величины, которые при каждой реализации zn
выборки Zn принимают k-t (по верхнему
номеру) значения х' ' . Упорядоченную
последовательность СВ Х^ < ... < Х^п'
называют вариационным рядом выборки.
Определение 19.2.8. Элементы
вариационного ряда называют порядковыми
статистиками, а крайние члены
вариационного ряда Х^\ Х^п' — экстремальными
порядковыми статистиками.
Например, для к = 1 функция (p(z„)
для статистики Х^ ' =(p(Z„) определяется
следующим образом:
ф(гя) = тт{хЛ :к = ТГп}.
Если однородная выборка Zn
соответствует распределению F(x) , то к-я
порядковая статистика Х^ ' имеет следующую
функцию распределения:
Fik)(x) = P{x^)<x) =
«£с£[*(*)],[1-Л*)Г'.
i=k
В частности, для к = 1 и к = п имеем
F(l) (х) = 1 - [1 - F(x)]" , F(n) (x) = [F(x)J .
Если функция распределения F(x)
имеет плотность f(x) , то порядковая
статистика Х^ ' имеет следующую плотность
распределения:
f(k\ (х) = ' х
x[F(x)]k-[[\-F(x)]"-k f{x).
Определение 19.1.8. Квантилью уровня р,
где 0 < р < 1 , распределения F(x)
называют число
хр = min{x : F(x) > р).
Если F(x) — непрерывная и строго
возрастающая функция, то квантиль
однозначно определяется из уравнения F(xp ) =
= р . Если у распределения F(x) существует
симметричная относительно нуля плотность
распределения, то хр = -х^р .
Определение 19.1.9. Порядковую
статистику Jftt'Vl"1"1) с номером [я/?] + 1,где [•] -
целая часть числа, называют выборочной
квантилью уровня р.
Если в некоторой окрестности точки хр
плотность распределения f(x) СВ X
непрерывна вместе с ее производной и, кроме того,
f(xp ) > 0 , то
(х«"?^-хр)
где СВ U имеет распределение N(0, 1).
Таким образом, при больших п можно считать,
что выборочная квантиль Х"пр*+ ' близка
к хр, и, более того, распределение статисти-
ГИСТОГРАММА
663
ки х"пр* ' может быть
аппроксимировано нормальным распределением
F„(x)
(
1
N
. Pd-P)
nf2(x„)
\
2/и
\1п
19.1.3. Выборочная функция
распределения. Пусть серия из п испытаний
проводится по схеме Бернулли, т.е. испытания
проводятся независимо друг от друга и некоторое
событие А при каждом испытании появляется
с одной и той же вероятностью р = Р(А).
Пусть Мп(А) — случайное число появлений
события А в этой серии. Напомним
следующее понятие.
Определение 19.1.10. Частотой события
А в серии из п испытаний называют СВ
К(А) = МпШ.
п
Пусть выборка Zn порождена СВ X с
функцией распределения Fx (x) . Определим
для каждого хе R событие Ах = {X < х),
для которого Р(АХ) = Fx (х). Тогда
М'п(Ах) - случайное число элементов
выборки Zn , не превосходящих х.
Определение 19.1.11. Частоту Wn (Ах )
события Ах как функцию х е Ш называют
выборочной (эмпирической) функцией
распределения СВ Хн обозначают
F„(x) = fV„(Ax).
Для каждого фиксированного хе R
СВ Fn(x) является статистикой,
реализациями которой являются числа 0, \/п,
2/п,... п/п, и при этом
?{Fn(x) = k/n} = P{Mn(Ax) = k}fk = uh~.
Любая реализация Fn(x) выборочной
функции Fn(x) является ступенчатой функцией,
характерный вид которой показан на рис.
19.1.1. В точках х{[) <...<х{п\ где х{к) -
реализация порядковой статистики
функция Fn (x) имеет скачки величиной
\/п и является непрерывной справа.
If!
х0' 0
х<2> х(3)-х<п>
Рис. 19.1.1. Выборочная функция распределения
Свойства Fn(x):
1) мГ?я(дс)1 = /,(дс) для любого
х € Ш1 и любого п > 1 :
2) ^R1 \Fn(x)-F(x)\ "H )0
при п
3) М
(f„(x)-F(x))
F(x)(l-F(x))
d„(x)
<l/(4n);
4) (F„(x)-F(x)yjdn(x)—^U
при п —» oo t где СВ U имеет распределение
N(0,1).
Первые два свойства свидетельствуют о
том, что при увеличении числа п испытаний
происходит сближение выборочной функции
распределения Fn(x) с функцией
распределения F(x) С В X. Последние два свойства
позволяют оценить скорость этого сближения
в зависимости от объема п выборки Zn .
Утверждение 2) называют теоремой Гливенко—
Кантеллиг а утверждение 4) является
следствием теоремы Муавра—Лапласа.
19.1.4. Гистограмма. Рассмотрим
процедуру группирования выборки. Для этого
разделим точками a0,...,a/+j действительную
ось ш} =(-оо?оо) на / +1
непересекающийся полуинтервал (разряд) Ак = [а^ , ct£+] ),
к = 0,/, таким образом, что -<*> = Oq < <Х| < ...
•••<«/ <«/+! =+*>,<*•{ ^*(,),<Х/ ^х{п).
Обычно длина разрядов Ак , к = 1, / - 1,
выбирается одинаковой, т.е. равной hk =
= (а/ - aj)/(/ - 1). Используя реализацию
664
Глава 19.1. ОСНОВНЫЕ ВЫБОРОЧНЫЕ ХАРАКТЕРИСТИКИ
вариационного ряда дг ' < ... < дс'"', для
каждого к-го разряда А^, к = 1,1 -I,
вычислим частоту попадания элементов выборки в
этот разряд. Получаем рк = пк /п , где пк —
число элементов реализации выборки z„,
попавших в к-й разряд. Если рассмотреть
априорную выборку Zn и случайное число
Nk элементов этой выборки, попавших в А;-й
разряд, то получим набор случайных чисел
Рк =Нк1п.
Определение 19.1.12. Последовательность
пар (А^, рк), к = 1, / -1, называют
статистическим рядом, а его реализацию (А^, рк ),
к = 1,/ - 1, представляют в виде таблицы:
[а,, а2)
Р\
...
...
[<*/-!, а/)
Р\-\
Изобразим графически статистический
ряд.
Определение 19.1.13. На оси Ох (рис.
19.1.2) отложим разряды и на них, как на
основании, построим прямоугольники с
высотой, равной Pkl^k > к = \,l -\. Тогда
площадь каждого прямоугольника будет равна
рк . Полученную фигуру называют
столбцовой диаграммой, а кусочно-постоянную
функцию /„(*), образованную верхними гранями
полученных прямоугольников, —
гистограммой.
При этом полагают /„(*) = 0 для всех
х < (Х| и х > а/, т.к. «о = 0 и щ = 0.
7п(х) '
_QL
ау 0
^
-Г
lh
а, а
[Ps.
, а
4 а
т
,.,<*
\£а
л/«
1 ъ
Рис. 19.1.2. Гистограмма
Пусть плотность распределения f(x)
непрерывна и ограничена, а количество
разрядов 1п +1 зависит от объема п выборки
таким образом, что 1п -> оо, но при этом
п/1п -> оо (например, можно выбрать
/„ = С\ + С2 Jn п, где С\, С2 — некоторые
положительные константы). Тогда
выборочная плотность распределения fn(x),
реализациями которой служат гистограммы fn(x) ,
сходится по вероятности к истинной
плотности /(*), т.е. /„(*)—£—»/(*) при
п -> оо для любого х € R . Таким образом,
при достаточно «мелком» разбиении отрезка
[ос], а/ ] и при большом объеме выборки п
высоты построенных прямоугольников можно
принимать в качестве приближенных
значений плотности f(x) в средних точках
соответствующих интервалов. Из этого следует,
что гистограмму можно рассматривать как
статистический аналог плотности
распределения наблюдаемой СВ X. Используя
гистограмму, неизвестную плотность можно
аппроксимировать кусочно-постоя иной
функцией. Но из анализа известно, что если
функция является достаточно гладкой, то кусочно-
линейная аппроксимация оказывается, как
правило, лучше кусочно-постоянной.
Определение 19.1.14. Сглаженную
гистограмму в виде ломаной, у которой прямые
линии последовательно соединяют середины
верхних граней прямоугольников,
образующих столбцовую диаграмму, называют
полигоном частот.
19.1.5. Выборочные моменты. Пусть
имеется выборка Zn = со\(Х\ ,...,Хп ),
которая порождена СВ Л" с функцией
распределения Fx (x).
Определение 19.1.15. Выборочными
начальными и центральными моментами порядка
г СВ X, порождающей выборку Zn ,
называют соответственно следующие СВ:
vr (") = -£(**У. г = 1,2,...;
{ir(n) = -f^(Xk-vr(n))r,r = 2,3,...
РАСПРЕДЕЛЕНИЕ ХИ-КВАДРАТ
665
Определение 19.1.16. Выборочным средним
и выборочной дисперсией С В X называют
соответственно
т
1 "
x(n) = v{(n) = -y£xk,
п к=\
1^Л
dx(n) = ii2(n) = --^Xk-mx)j .
к=\
В дальнейшем мы будем использовать
сокращенные обозначения тх =тх(п),
dх = d% (п), если это не будет приводить к
путанице. Пусть имеется также выборка
Vn = col(У| ,...Yn ), порожденная СВ Y с
функцией распределения Fy (у) .
Определение 19.1.17. Выборочным
коэффициентом корреляции СВ X и К называют
2 _ k=\
r XY ~ и ^ '
nJdx dy
Пусть существуют исследуемые моменты
vr, |ИГ. Тогда справедливы следующие
свойства выборочных моментов:
1) М vr (п) = vr для любого п > 1 и
для всех г = 1,2,...;
2) vr(n)—^-
всех г = 1,2,...;
ветствующим теоретическим моментам.
Пример нахождения объема выборки,
гарантирующего в определенном смысле близость
выборочной характеристики к ее истинному
значению, приведен в гл. 19.6.
Из первого свойства вытекает, что
математические ожидания (МО) выборочных
начальных моментов совпадают с
соответствующими значениями начальных моментов СВ X,
т.е. в этом смысле обладает свойством
«несмещенности». А МО выборочной
дисперсии d х не совпадает с дисперсией dx СВ
X, т.е. в этом смысле СВ dx является
«смещенной» выборочной характеристикой
dx . Поэтому часто вместо d x используют
«исправленную» выборочную дисперсию s x =
d х , для которой М \sx \ = dx.
я-1
Глава 19.2
-> vr при п —» <*> для
3) \ir(n)-
->|ИГ При П —» оо ДЛЯ
всех г = 2,3,...;
4) D[mx] = dx/n, где dx ±D[X);
6) \тх -тх )/-Jdx/п ——-> U при
п —»°°, где СВ U имеет распределение
N(0, 1);
ОСНОВНЫЕ РАСПРЕДЕЛЕНИЯ
В СТАТИСТИКЕ
19.2.1. Распределение хи-квадрат.
Определение 19.2.1. Пусть Uk , k = \,n, -
набор из п независимых нормально
распределенных СВ, Uk ~ N(0, 1). Тогда СВ
к=\
9
имеет распределение хи-квадрат (% -
распределение) с п степенями свободы, что обо-
значают как Xп ~ % (п).
Свойства распределения хи-квадрат:
1) СВ Хп имеет следующую плотность
распределения:
1
/(*,") =
2("/2)Г(л/2)
0,
х{п12)-\е-х12^ х>0>
х<0,
7) {dx -dxy^(\rA - v| )//f—£—>tf где Г(т) = \ ym'xe~ydy - гамма-функция.
при п —» оо f где СВ V имеет распределение
N(0, 1).
Второе и третье свойства указывают, что
с увеличением объема выборки выборочные
моменты будут сколь угодно близки к соот-
Графики функций f(x,n) (рис. 19.2.1),
называемые кривыми Пирсона, асимметричны и,
начиная с п > 2, имеют один максимум в
точке х = п - 2:
666
Глава 19.2. ОСНОВНЫЕ РАСПРЕДЕЛЕНИЯ В СТАТИСТИКЕ
п выборки можно приближенно считать
Хп ~ N(«, 2n). Фактически эта
аппроксимация имеет место уже при п > 30.
Пример 19.2.1. Приведем пример, в
котором возникает распределение хи-квадрат.
Пусть выборка Zn соответствует нормально-
му распределению N(/w, о ). Рассмотрим
выборочную дисперсию
Рис. 19.2.1. Плотности распределений хи-квадрат
2) характеристическая функция СВ Хп
имеет вид
g(t, п) = j%'*/(*, и)</* = (1 - 2//Г"/2;
3) СВ Хп ~ % (я) имеет следующие
моменты:
ЩХ„] = п, D[Xn) = 2n;
4) сумма любого числа т независимых
СВ Х/С,к = \,т, имеющих распределение
хи-квадрат с п^ степенями свободы, имеет
т
распределение хи-квадрат с п = V пК степе-
к=\
нями свободы;
5) распределение хи-квадрат обладает
следующим свойством асимптотической
нормальности:
%п ~п F it
. >U при «-»«>,
где СВ U имеет распределение N(0,1)- Это
означает, что при достаточно большом объеме
1 " л
dX =~МХк-тХ
ь
где т % — выборочное среднее. Тогда СВ
Yn = nd% /<г имеет распределение % (п-\)
и не зависит от тх .
19.2.2. Распределение Стьюдента.
Определение 19.2.2. Пусть U и Хп —
независимые СВ, U ~ N(0,1), Хп~х2 (п).
Тогда СВ Т„ = иЦХп1п имеет
распределение Стьюдента с п степенями свободы, что
обозначают как Т„ ~ S(n).
Свойства распределения Стьюдента:
1) СВ Тп имеет плотность распределения
ДМ)-
п + [
л/тсГ
з)
1+ —
п
Графики плотностей /(/, п) (рис.
19.2.2), называемые кривыми Стьюдента,
симметричны при всех п = 1,2,...
относительно оси ординат;
Рис. 19.2.2. Плотности распределений Стьюдента
РАСПРЕДЕЛЕНИЕ ФИШЕРА
667
2) С В Тп имеет следующие моменты:
М[7;] = 0 для всех п > 2, D[Tn] =
= п/(п - 2) при п > 3. При п = 2 дисперсия
D[r„] = +oo;
3) при я = 1 распределение Стьюдента
совпадает с распределением Коши, плотность
которого
1
ЛМ) =
71(1+ JC2)'
Но, как известно, математическое
ожидание и дисперсия С В 7J не существуют, так
как бесконечен предел
lim 1(a) = -и»,
0->оо
(п -2)тп
п (т+2)
Рис. 19.2.3. Плотность распределения Фишера
Свойства распределения Фишера:
1) СВ
имеет плотность
где
/(а, я, m) = Q при у<0 и
ч
/(и,я,т) = -
4) можно показать, что при п —» <*>
распределение S(ai) асимптотически нормально,
т.е. 7), > £/ , где СВ V имеет
распределение N(0,1). При А7 > 30 распределение
Стьюдента S(n) практически не отличается
от N(0, 1).
Пример 19.2.2. Приведем пример, в
котором встречается распределение Стьюдента.
Пусть выборка Zn соответствует
нормальному распределению N(/w, о ). Пусть тх —
выборочное среднее, a d x — выборочная
дисперсия. Тогда С В
Т„ = 4п^\[тх -ту$х
имеет распределение Стьюдента &(п - 1) при
любом а > 0 .
19.2.3. Распределение Фишера.
Определение 19.2.3. Пусть независимые С В Хп и
Хт имеют распределения хи-квадрат
соответственно спит степенями свободы. Тогда
X In
С В Vn т = ——— имеет распределение Фише-
Хт/т
ра с п и т степенями свободы, что записывают
как Vnm ~ F(n,m).
Ш
при v > 0.
(m+nv)
Графики функции /(у, я,/я), называемые
кривыми Фишера, асимметричны и при п > 2
достигают максимальных значений в точках
(п-2)т
v- 9 близких к единице при ооль-
(т + 2)п
ших значениях тип. Одна из семейства
кривых Фишера приведена на рис. 19.2.3.
2) С В Vn m имеет следующие моменты:
M[Vn т] = т/(т - 2) при т > 2,
D[K.
2тг(т + п-2)
" п(т-2)2(т-4)
при т > 4.
Пример 19.2.3. Пусть Zn =со\(Х[,...,
Xп ) - выборка объема п , порожденная СВ Jf
с нормальным распределением N(mx , О ),
a Wn = col(Kj ,...,Ym) ~ выборка объема /и,
порожденная СВ У с нормальным
распределением N(/wr,o2), и СВ Zn и Wn
независимы. Тогда СВ, образованная отношением
исправленных выборочных дисперсий для СВ
X и Y, т.е.
668
Глава 19.3. ТОЧЕЧНЫЕ ОЦЕНКИ
- \2
имеет распределение F(n - 1, m - 1).
Глава 19.3
ТОЧЕЧНЫЕ ОЦЕНКИ
19.3.1. Основные понятия. Определение
19.3.1. Параметром распределения 0€0cR
С В X называют любую числовую
характеристику этой СВ (математическое ожидание,
дисперсию и т.п.) или любую константу, явно
входящую в выражение для функции
распределения.
В общем случае будем предполагать, что
параметр распределения 0 может быть
векторным, т.е. 060cRs.
В случае параметрической
статистической модели (i^g, Fzn (Z„, 0)1 таким
параметром распределения может служить
неизвестный вектор 0e0cRs,
характеризующий распределение Fz (Z„ , 0) •
Пусть имеется выборка Zn =
= col(X\,...,Xn) с реализацией z„ =
= со1(*|,...,*„).
Определение 19.3.2. Точечной
(выборочной) оценкой неизвестного параметра
распределения 0e0cRs называют
произвольную статистику 0(Z„), построенную по
выборке Zn и принимающую значения в
множестве 0.
Замечание 19.3.1. Реализацию Q(Z„)
оценки Q(Zn) принимают, как правило, за
приближенное значение неизвестного
параметра 0.
Ясно, что существует много разных
способов построения точечной оценки, которые
учитывают тип статистической модели. Для
параметрической и непараметрической
моделей эти способы могут быть различны.
Рассмотрим некоторые общие свойства, которые
характеризуют качество введенной оценки.
Определение 19.3.3. Оценку 0(Z„)
параметра 0 называют несмещенной', если ее МО
равно 0, т.е. М 6(Z„ ) = 6 для любого
0G0.
Определение 19.3.4. Оценку Q(Zn)
параметра 0 называют состоятельной, если она
сходится по вероятности к 0, т.е.
Л Р
d(Zn) »0 при п —> ©о для любого
0 6 0.
Определение 19.3.5. Оценку 0(Z„)
параметра 0 называют сильно состоятельной,
если она сходится почти наверное к 0 , т.е.
Q(Zn)———>0 при я-»°° для любого
0 6 0.
Очевидно, что если оценка сильно
состоятельная, то она является также
состоятельной.
Пример 19.3.1. Оценка Q{(Zn) = тх
неизвестного МО 0| = Шх СВ X является
несмещенной (по свойству 1), см. п. 19.1.3), а
оценка 02(Z/J) = ^^ неизвестной
дисперсии 02 = dx ~ смещенной, так как
М \dx = dx (по свойству 5), см. п.
19.1.3). Оценка 02(ZW) = 5^ является
несмещенной оценкой dx по определению s x •
Если существуют моменты Шх , dx , то
сильная состоятельность оценок тх , dx
гарантируется свойствами 2), 3), см. п. 19.1.3.
Свойствами состоятельности и
несмещенности могут обладать сразу несколько
оценок неизвестного параметра 0 .
Определение 19.3.6. Несмещенную
оценку 0*(ZW) скалярного параметра 0
называют эффективной, если D 0*(Z„) <
<D 8*(ZJ для всех несмещенных оценок
0(ZW) параметра 0, т.е. ее дисперсия ми-
ОСНОВНЫЕ ПОНЯТИЯ
669
нимальна по сравнению с дисперсиями
других несмещенных оценок при одном и том же
объеме п выборки Zn .
Пример 19.3.2. Пусть СВ X имеет
нормальное распределение N \п\х , о\ ) с неиз"
вестными параметрами 0| = rrtx , ^2 = а у •
В этом случае выборочное среднее т%
является эффективной оценкой тх -
В классе параметрических
статистических моделей [Sq, FZfl (z„ , 0)), GgGcR1,
рассмотрим подкласс моделей,
удовлетворяющих некоторым естественным условиям
регулярности. С этой целью введем
следующие понятия.
Определение 19.3.7. Функцией
правдоподобия для неизвестного параметра 0e0cRs
называют: в случае непрерывной
наблюдаемой СВ X — плотность распределения
L(zn,Q{,...,Qs) = fz(zn,Q{,...,Qs) =
'•Y[fX(xk,*l,.'.,*sh
*=1
где fx (х, 0| ,...,65 ) - плотность
распределения СВ Л", а в случае дискретной
наблюдаемой СВ X — произведение вероятностей
А:=1
где рх (хк , 0| ,...,05 ) - вероятность
события {X = хк }.
Аналогично определяется функция
правдоподобия /,(£„, 0j ,...,05) при
неоднородной выборке Zn = col(ЛГ1,..., Хп ),
когда СВ Хк , к = \,п, по-прежнему
независимы, но имеют различные плотности
распределения fxk (хк , 0j ,...,05 ), зависящие
от одного и того же набора неизвестных
параметров 0j ,...,05.
Определение 19.3.8. Логарифмической
функцией правдоподобия для неизвестного
параметра 0 € 0 с R5 называют функцию
1п1(гЛ,0ь...,05).
Определение 19.3.9. Параметрическую
статистическую модель (SQf Fz (Z„,0)),
0G0cR , называют регулярной, если
выполняются следующие условия:
1) функция правдоподобия L(zn ,0) > О
для всех 0 е 0 и дифференцируема по
параметру 0 е 0;
2) для любого измеримого множества
А с S выполняется условие
А А
Из условия 2) вытекает, в частности, что
в случае регулярной модели выборочное
пространство Sq = S, т.е. не зависит от
неизвестного параметра 0.
Пример 19.3.3. Пусть выборка Zn
соответствует равномерному распределению
R(0,£) с неизвестным параметром 0 = Ь. В
этом случае параметрическая статистическая
модель (Sq, Fzn(Z„, 0)) не является
регулярной, так как выборочное пространство Sq
определяется на отрезках [О, Ь], а
следовательно, зависит от параметра Ь.
Определение 19.3.10. В случае
регулярной модели [S, FZn (zn , 0)), BeGcR1,
величину
fb\\\L{Zn^
/Л(е) = м
Э0
называют информацией Фишера о параметре
0 е 0, содержащейся в выборке Zn.
В случае регулярной модели
(iS1, Fz (z„, 0)1 для любой несмещенной
оценки 0(Z„) параметра 0E0cR
справедливо неравенство Рао—Крамера
DK>]*rW
.(в)
Это неравенство дает нижнюю границу
для дисперсии несмещенной оценки.
Определение 19.3.11. Несмещенную
оценку Q(Z„) параметра 0G0CR1
называют R-эффективной оценкой, если для этой
оценки в неравенстве Рао—Крамера
достигается равенство, т.е. D[0(Zw)] = i//w(e).
Если /^-эффективная оценка существует,
то она является также эффективной в смысле
минимума дисперсии.
670
Глава 19.3. ТОЧЕЧНЫЕ ОЦЕНКИ
Способ построения /^-эффективных
оценок вытекает из критерия эффективности,
состоящего в следующем. Оценка Q(Zn)
параметра 0 является /^-эффективной тогда и
только тогда, когда
6(Z„)-e:
(fdbif(Xk,Q))
k=l
эе
'/„(в).
Пример 19.3.4. Приведем примеры
/^-эффективных (а следовательно, и
эффективных) оценок 0(Z„) неизвестных
параметров 0 некоторых распространенных
распределений, их дисперсии D 8(ZJ L
а также значения информации Фишера
/„(в):
Модель
N(6, о\)
Щтх,в)
Bi(k,Q)
П(в)
/„(в)
п
4"
п
кп
0(1-0)
п
"0
kzn)
Л 1 "
*х =4Х<*/-™*)2
«x —i*.
D[e(Z„)]
n
202
n
0(1-0)
kn
0
n
Пример 19.3.5. Приведем пример, когда
эффективная оценка неизвестного параметра
существует, а /^-эффективная оценка не
существует. Пусть выборка Zn соответствует
распределению N(/w, а2) с неизвестными
параметрами 0j = т, 02 = С72 . В данном
случае параметрическая модель является
регулярной. Из п. 19.1.5 следует, что статистика
/i-i
/=i
является несмещенной оценкой неизвестной
дисперсии dx = <Т2 • Как указано в примере
19.2.1 п. 19.2.1, СВ
Yn=(n-\)sx(Zn)/c2
имеет распределение хи-квадрат %2 (п - 1) , а
следовательно, ее дисперсия равна D[}^] =
= 2(п - 1). Поэтому
DpA-(Z„)] = 2a4/(/I-l).
Согласно неравенству Рао—Крамера
нижняя граница дисперсии любой
несмещенной оценки в этой статистической модели
равна 2а4/п. Таким образом, Sx(Zn) не
является R-эффективной оценкой. Но можно
показать, что эта оценка является
эффективной.
19.3.2. Метод максимального
правдоподобия. Как уже отмечалось выше, на
практике часто удается предсказать вид
распределения наблюдаемой СВ с точностью до
неизвестных параметров 0 = col(0j ,...,0Л ) , т.е.
для непрерывной СВ доказывается известной
плотность f(x, 0), а для дискретной СВ X —
вероятности p(xt, 0) = Рв {X = xi}, i = 1, /и,
где JC/, / = 1,/и, - возможные значения СВ
X. Например, может быть 0j = rrtx , 02 = dx
при s = 2. Эти неизвестные параметры
требуется оценить по имеющейся выборке Zn .
Рассмотрим параметрическую
статистическую модель [50, Fz (Zn, 0)),
060cl5, для которой известна функция
правдоподобия L (zn , 0j, • •., 05 ) •
МЕТОД МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ
671
Определение 19.3.12. Оценкой
максимального правдоподобия (МП-оценкой) параметра
9е 0 называют статистику 0(ZW),
максимизирующую для каждой реализации zn
функцию правдоподобия, т.е.
eU„) = arg max L(zniQ).
в€0
Способ построения МП-оценки
называют методом максимального правдоподобия.
Поскольку функция правдоподобия
L(zn,Q) и ее логарифм lnL(^w,0)
достигают максимума при одних и тех же
значениях 9, так как Z,(zw,6)>0, to часто вместо
I(Zw,0) рассматривают логарифмическую
функцию правдоподобия In L(zn , 0).
В случае дифференцируемости функции
h\L(zniQ) по 0 МП-оценку можно найти,
Дифференцируя функцию In L(zn,mx) no
тх и приравнивая нулю получаемое
выражение, находим уравнение, решение которого
e(Z„) = iJT^ =mx.
п k=\
Пример 19.3.7. Пусть СВ X имеет
равномерное распределение R(a,b) с
неизвестными параметрами 6| = a, Qj = &• В данном
случае плотность распределения /(*, я, Ь) =
= \/(Ь - а), если а < х < b и /(*, я, Ь) = 0
в противном случае. Оценим параметры а и
b методом максимального правдоподобия.
Функция правдоподобия в данном случае
имеет вид
Цх{ ,...,х„,а,Ь) =
=Пд**,м)=(^у,
решая относительно 0|,..., вя систему
уравнений правдоподобия
Э1п1(^,,е|,...,е,)_
эе,
Э1п1(г„,Э1,-Л) _0
Отметим, что в тех случаях, когда
существует /^-эффективная оценка параметра 6,
она совпадает с МП-оценкой.
Пример 19.3.6. Если, например, СВ X
имеет нормальное распределение N(mx ,о2х )
с неизвестным математическим ожиданием
0 = тх , то легко установить, что оценкой
максимального правдоподобия параметра
0 = гпх при любых ох является выборочное
среднее тх . Действительно, в этом случае
если а < хк < b для всех к = 1,п и L(x\ ,...,
хп ,а,Ь) = 0 в остальных случаях. Таким
образом, функция правдоподобия отлична от
нуля, если неизвестные параметры а и b
удовлетворяют неравенствам
b > х(") = max хк , а< хО) = min хк .
к=\,п к=\,п
При этом функция L(x\ ,..., хп ,о,Ь)
достигает максимума по а и b , когда разность
b-а оказывается минимально возможной,
ненарушающей полученные неравенства, т.е.
в случае достижения в них равенств. Таким
образом, получаем МП-оценки неизвестных
параметров а и b .
a(Zn) = X0), b(Zn) = X(»),
где Х(п) и ХО) - крайние члены
вариационного ряда.
Как отмечалось выше, данная
параметрическая модель не является регулярной,
поэтому /^-эффективной оценки в данной
модели не существует.
"'■"''-fe-n^.
1
(2п)»По2х
expU<*-^
k=\ 24
672
Глава 19.3. ТОЧЕЧНЫЕ ОЦЕНКИ
Пример 19.3.8. Пусть случайная
величина Л" имеет распределение Пуассона П(я) с
неизвестным параметром 9 = а. Построим
МП-оценку параметра а . Функция
правдоподобия в этом случае будет
т < ч ГТ а%к е~а
к=\ *к '
поэтому логарифмическая функция
правдоподобия
1пДг„, я) =
п
= УхЛ In а - па - ln(*i ! ...xn !).
к=\
Решая соответствующее уравнение
правдоподобия — In L(zn , а) = О, находим МП-
да
оценку неизвестного параметра а :
Пример 19.3.9. Найдем МП-оценку для
вероятности р «успеха» в схеме испытаний
Бернулли. В этом случае имеем распределение
Бернулли Bi(l, p) с неизвестным
параметром 9 = р. Поэтому
п
Шп,а) = \\р*к{\-Ру-ч,
к=[
где хк =\, если в к-м испытании был
«успех», и хк = 0 в противном случае. Решая
уравнение правдоподобия
ъР £\р \-р)
относительно параметра р, находим МП-
оценку
1 п *
P(Zn) = ~YXk =mx.
19.3.3. Метод моментов. Исторически
первым для оценивания неизвестных
параметров был предложен следующий метод.
Пусть имеется параметрическая
статистическая модель
Предположим, что у наблюдаемой СВ X,
порождающей выборку Zn, существуют
начальные моменты Vj =M[X'], i = \,s.
Тогда в общем случае от неизвестных
параметров будут зависеть и начальные моменты, т.е.
v/ = V,- (0). Пусть V/ ,/ = 1,5, -
выборочные начальные моменты. Рассмотрим систему
уравнений
v/(0) = v/, / = 1,5,
и предположим, что ее можно разрешить
относительно параметров 0j,...,05, т.е. найти
функции в,- =(p,(v, ,...,v5 J, / = 1,5.
Определение 19.3.13. Решение
полученной системы уравнений 9,- = (р,- [Vj ,...,v5 I,
1 = 1,5, называют оценкой параметра 9 ,
найденной по методу моментов, или ММ-
оценкой.
Если функции (р) (•),..., ф5()
оказываются непрерывными, то ММ-оценки
являются состоятельными.
Замечание 19.3.1. Уравнения метода
моментов часто оказываются более простыми по
сравнению с уравнениями правдоподобия, и
их решение не связано с большими
вычислительными трудностями.
Пример 19.3.10. Пусть Zn =
= со\(Х\,...,Хп) — выборка,
соответствующая нормальному распределению N(/w,a2)
с неизвестными параметрами 9| = т и
92 = а2 . Оценим параметры т и а2 с
помощью метода моментов. В данном случае
Vj = w, V2 = /я2 + О2 и система уравнений
для метода моментов принимает вид
1 п
п к=\
Решая эту систему, находим ММ-оценки
9,(Zw) = 0|,92(ZJ = v2 -Of.
Пример 19.3.11. Пусть Zn =
= со\(Х\,...,Хп) - выборка,
соответствующая равномерному распределению R(fl, b) с
неизвестными параметрами 9j = а и 92 = £ •
Оценим параметры а и b с помощью метода
моментов. Поскольку для данного
распределения
СХЕМА ГАУССА-МАРКОВА
673
a + b (b-a)2 (b + aY
Vl=— V2=-12- + [— J'
то система уравнений метода моментов
принимает вид
Решая эту систему, получаем ММ-
оценки неизвестных параметров
a{Zn ) = v, - y]3dx , b(Zn ) = v, + y]3dx ,
i n ^
где ** =йХ(** -w*)2-
Оценки, полученные в примере 19.3.10 с
помощью метода моментов, совпадают с МП-
оценками, найденными в примере 19.3.6
п. 19.3.2, а ММ-оценки в примере 19.3.11 не
совпадают с МП-оценками, построенными в
примере 19.3.7 из того же параграфа.
Глава 19.4
РЕГРЕССИОННЫЙ АНАЛИЗ
19.4.1. Модели регрессии. Пусть К и X-
зависимые С В и требуется по результатам
наблюдений (х\,...,хп) за вектором X и
(>Ъ — >.Ул) за вектором К сделать
обоснованное заключение о характере зависимости Кот X.
Определение 19.4.1. Зависимость У =
обеспечивающую
наилучшее (в среднем квадратическом смысле)
приближение СВ У:
м[(г-ф*(Л)2]<м[(г-Ф(Х))2],
где (р(Х) — произвольная функция,
называют функцией теоретической регрессии. При
этом X называют регрессором, а К— откликом.
Для вычисления условного МО
необходимо знание совместной функции
распределения СВ X, Y, а такой информацией
исследователь, как правило, не располагает. В
такой ситуации разумным представляется
ограничиться рассмотрением некоторого
параметрического класса функций ф(х) = (p(x, 0),
где 0 е 0 с Rs — некоторый неизвестный
параметр, который требуется оценить по
имеющейся выборке наблюдений (х\,...,хп)
и (Л,-.ДО-
Определение 19.4.2. Класс линейных по
0 функций
ф(х, е) = е^, (х) +... + е5ф5 (*),
где ф| (x),...,<ps(x) - известные функции,
определяющие план эксперимента, называют
линейной регрессионной моделью. При этом
должно выполняться очевидное требование
s < п .
Часто рассматривают модель
наблюдений за СВ К, в которой вектор X считается
неслучайным и присутствуют случайные
ошибки наблюдений W :
Yk =е,ф,(^) + ... + е5ф5(^) + и^, к = \,п.
В этой модели неизвестными по-
прежнему являются параметры 0|,...,05, а
векторы Х\,...,хп и распределения СВ
Wk , к - 1, л, считаются известными.
19.4.2. Схема Гаусса—Маркова.
Линейную модель наблюдений, приведенную в
предыдущем разделе, можно записать в более
компактном виде
Y = AQ + W,
если ввести обозначения У = col(K|,..., Уп )
для вектора наблюдений, 0 = со1(0| ,...,05 )
для вектора неизвестных параметров,
W - go\{W\,..., Wn ) для вектора случайных
ошибок наблюдения, А = {йщ } для матрицы,
составленной из элементов ащ - фу {хк ),
j = \, s, к = 1, п. При этом часто матрицу А
называют матрицей плана или регрессионной
матрицей. Без ограничения общности
изложения предположим, что М[И/] = 0 и
M[WWT ] = о2/ , где / - единичная
матрица размерности п х п .
Определение 19.4.3. Оценкой вектора
неизвестных параметров 0, найденной по
методу наименьших квадратов (или МНК-
оцепкой), называют вектор
B = argm\n(Y - АВ)Т(Г - АО).
060
22 — 7706
674
Глава 19.4. РЕГРЕССИОННЫЙ АНАЛИЗ
Сформулированную задачу называют
схемой Гаусса—Маркова.
Пусть матрица АтА невырожденная.
Тогда МНК-оценка 0 обладает следующими
свойствами:
1) МНК-оценка 0 существует, она
единственная и определяется формулой
Q = (ATA)-[ATY;
2) МНК-оценка 0 является
несмещенной и ее компоненты имеют минимальные
дисперсии в классе линейных относительно Y
несмещенных оценок;
3) ковариационная матрица МНК-
оценки 0 определяется формулой
К1=о1(АтАТх.
Данное утверждение называют теоремой
Гаусса—Маркова.
Если в схеме Гаусса—Маркова СВ W
имеет нормальное распределение, то:
1) МНК-оценка 9 имеет 5-мерное
распределение N(9, G2 (АТ А)~[);
Л гр гр
2) квадратичная форма (0-0) А х
Х/4(0-0)/а2 имеет распределение хи-квад-
рат %*(s) с 5 степенями свободы;
3) МНК-оценка 0 является также МП-
оценкой.
Пример 19.4.1. Пусть требуется оценить
зависимость
у(х) = 0| + 02х + ... + 05х5-1
по результатам наблюдений
Ук = 9| + Ьхк + - + е**Г! + Wk > к = {>п
в точках х^ , где Wk, к = 1, л, - случайные
ошибки измерений. В данном случае
элементы матрицы плана равны ак: = х£ ,
к = \,п, j = 1,5. Тогда искомую
зависимость можно определить в виде
>> = 0, +Q2x + ... + Qsxs-1,
где оценки 0- параметров 0у, j = 1,5,
находятся по методу наименьших квадратов из
условия минимума квадратической функции
о(вь...,в,) = £
k=i
Ук-^j-k
У=1
у-1
Приравнивая нулю частные производные по
0у квадратической функции Q(0| ,...,0S),
можно получить систему линейных уравнений
для определения оценок неизвестных
параметров 0j ,...,05 :
эо(еь...,е,)
эе,
эб(е,,-л)
О0С
= 0.
В частном случае, когда 5 = 3, приходим к
задаче построения параболической регрессии. В
данном случае после несложных
преобразований можно получить следующую систему
линейных уравнений, определяющих оценки
0j , 02 , 03 :
сс203 + a{Q2 +a0Q{ =р0,
a303 + а202 +CC!©! =рь
сс4 03 + сс3 02 + а2 д{ = р2,
где коэффициенты этих уравнений
расчитывают по формулам:
а;=йХ**> у = 0'4'
Решая полученную систему линейных
уравнений относительно оценок 0Ь02,03 и
подставляя их значения в приведенную выше
формулу, получаем искомую зависимость
rz у(*)-
19.4.3. Простая линейная регрессия.
Пример 19.4.2. Рассмотрим модель простой
линейной регрессии. Пусть С В Y и W связаны
уравнением Y = ах + b + W , где СВ W
может быть интерпретирована, например, как
погрешность вычисления детерминированной
величины у - ах + Ь. Пусть СВ W имеет
нормальное распределение N(0, а2 ) .
Предположим, что в соотношении у = ах + b
параметры а и b неизвестны, а при каждом
k-м наблюдении случайной величины Y
детерминированная величина х принимает
различные значения xfc,k = \,n. Тогда СВ
ПРОСТАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
675
Yfc = ахк + ° + 1Vk , к = 1, п, будет иметь
нормальное распределение N(ax^ + b,G2 ),
так как М[У^ ] = ахк + Ь. Будем считать, что
наблюдения независимы друг от друга, т.е. СВ
Wk являются независимыми для разных к с
одним и тем же распределением N(0,a ).
В данном случае неоднородную выборку Zn
образуют наблюдения Y[,...,Yn. Требуется
по выборке Zn и известным значениям
Х[,...,хп оценить неизвестные параметры а
и b . Рассмотрим для реализации выборки
Zn = со\(у\,...уп) логарифмическую
функцию правдоподобия h\L(zn,u,b) с парамет-
Затем, заменяя в полученных выражениях
реализацию выборки zn на выборку
Zn = col (Y[,..., Yn ), получаем точечные
оценки неизвестных параметров: a(Zn),
kz„).
Пример 19.4.3. Рассмотрим модель
простой линейной регрессии из примера 19.4.2,
не предполагая, что ошибки Wk имеют
нормальное распределение, и, кроме того, считая,
что коэффициенты Хк случайны и
наблюдаемы: Yk = аХк + b + Wk, к = \,п. Пусть
М[»Ы = 0, D[Wk] = o2 и неизвестна, СВ
Wk , k = l,n, независимы. Предположим,
что СВ Хк и Wk, k = \,n, независимы,
причем Хк имеют одно и то же, но
неизвестное распределение*/^ (х). По
результатам наблюдений (у{, х{),...,(уп,хп )
требуется оценить неизвестные параметры а и b
в линейной регрессионной модели. Для
неодрами 0| = я, О2 = Ь, которая в данном
случае имеет вид
h\L(zn,a,b) =
= -—уХ(Л -ахк -Ь)*-п\\\(<5>1Щ.
zo k=\
Необходимое условие максимума этой
функции:
|-1пДгя,а,6) = 0, ^-\nL(z„,a,b) = 0.
да до
Решая получающуюся систему из двух
уравнений с двумя неизвестными а и b для
каждой реализации выборки zn, находим
оценки параметров:
нородной выборки zn = col(j>i, ..., уп,
*Ь • ••» хп ) рассмотрим квадратическую
функцию:
1 "
Q(zn,a,b) = -Y(yk -axk -b)*,
"ш
характеризующую среднюю по п
квадратическую ошибку предсказания того, что в
п наблюдениях СВ У примет значения
ук, к = \,п.
Определение 19.4.4. МНК-оценками,
полученными по методу наименьших квадратов,
неизвестных параметров а и b в линейной
регрессионной модели Yk - aXk + b + Wk ,
k = l,n, называют оценки a(Zn) и
b(Zn), значения которых минимизируют
квадратическую функцию Q(z„,a,b),
построенную по реализации выборки zn •
В данном случае функция Qij.n,a,b)
совпадает с точностью до коэффициентов с
логарифмической функцией правдоподобия
из примера 19.4.2:
a(Z„)-
k=l
ft=l ft=l
i^
It I fl
«Xх*2- Xх*
\2
t=l
U=l ,
■' Ь^п) = -У*Ук
a(Z„)
n
k=\
k=\
22*
676
Глава 19.4. РЕГРЕССИОННЫЙ АНАЛИЗ
Q(znia,b) = -2а2 In L(zn,a,b)/n -
-2а21п(а>/2л).
Поэтому минимум функции Q(zn,a,b) по
параметрам а и b достигается при тех же
значениях я и ft , что и в методе
максимального правдоподобия (минимизация функции
Q(zn,a,b) по а и b эквивалентна
максимизации функции In L(zn ,a,b)), и
определяется соотношениями из примера 19.4.2.
Заменяя в этих соотношениях ~zn на Zn,
получаем
a(Zn) = rXY yjdr /dx ,
b(Zn) = my -a(Zn)mx .
Найденные по методу наименьших
квадратов оценки a(Zn) и ft(Z„)
неизвестных параметров а и b построены для
произвольно распределенных случайных ошибок
Wk и случайных коэффициентов Х^ , тогда
как по методу максимального правдоподобия
аналогичные оценки получены в
предположении нормальности W^ и для
детерминированных значений х^, к = \,п. Иными
словами, МНК-оценки оказываются более роба-
стными (т.е. менее чувствительными к
априорной информации о случайных
коэффициентах Хь и ошибках Wfr) по сравнению с
ММП-оценками.
Исследуем статистические свойства
найденных МНК-оценок a(Zn) и ft(Z„).
Предполагая существование моментов у СВ Y
и X и переходя к пределу в соотношениях для
a{Zn) и b(Zn) при п —> ©о , по усиленному
закону больших чисел получаем
a(Zn)-^-,a*=^LrXYl
b(Zn)—^—>b* = mY -a*mx.
чается в том, чтобы по наблюдениям
(реализациям) Х\,...,хп предсказать
значения наблюдаемой СВ Y на основе
зависимости у = ах/с + ft, к = \,п, зная лишь
числовые характеристики СВ А" и Y. Ясно, что
предсказываемые значения у будут
отличаться от реализаций у^ С В К, а точность
предсказания определяется параметрами а и
Ь. Зададимся целью выбрать параметры я и ft
так, чтобы срвднвквадратическая ошибка
предсказания была минимальна:
(а*, Ь*) = arg min M
а, Ь
Обозначим Q(a,b) = M
(Y-Y(X9a9bjf
(Y-Y(X,a,b)f
Пример 19.4.4. Пусть числовые
характеристики тх , ох , ту , Оу > rXY СВ А" и У
известны, но функциональная связь между
СВ X и Y неизвестна. Рассмотрим новую СВ
Y = аХ + Ь, где а и b — некоторые заданные
параметры. Задача предсказания СВ Узаклю-
= М Г( Y - аХ - ft)21. Тогда можно
установить, что
Q(a,b) = a\ (l-r}Y) + (aox -orrxr)2 +
+ (ту -атх -Ь) .
Для того чтобы функция Q(a,b)
достигала минимума по а и ft, достаточно
выбрать
а* = (оу /ох )rXY , ft* =my - а*тх .
В этом случае Q(a* ,b*) =
= ау(1-г2у]. Значения параметров а* и
ft* совпадают с предельными значениями
оценок a(Zn) и ft(Z„), полученными в
примере 19.4.3.
Проанализируем минимальное значение
функции
Q(a\b*) = D[Y-a*X-b*] = o2y(\-rly),
так как М Г У - а*Х - ft* ] = ту - а*тх -
-ft* =0. Таким образом, имеем
\-r\y =D[Y-a*X-b*]/o2y.
Отсюда следует, что коэффициент
корреляции характеризует относительную (в единицах
<5у ) величину среднего квадратического
отклонения СВ У от линейной оценки наилуч-
ИСПОЛЬЗОВАНИЕ ЦЕНТРАЛЬНОЙ СТАТИСТИКИ
677
шего приближения Y*=a*X + b*, т.е. гХу
численно характеризует степень линейной
стохастической зависимости между СВ X и Y.
Чем ближе |r^y | к единице, тем теснее будут
группироваться выборочные точки (хк,Уь)
около прямой у = а*х + Ь*, называемой
прямой среднвквадратической регрессии СВ Y
на СВ X. Из полученного соотношения
следует, что для любых С В А" и Y коэффициент
корреляции удовлетворяет неравенству
\rXY | < 1. При гХу = ±1 имеем D [Y -
-аХ - £] = 0, т.е. согласно свойствам МО
СВ А" и Y с вероятностью 1 линейно
зависимы: Y = a*X + b*.
Как отмечалось в п. 19.4.1, наилучшей
среднеквадратической оценкой СВ К по СВ X
является условное МО Y*= M[Y\X].
8 частности, если вектор Z = со\(Х,Y) -
гауссовский, то из теоремы о нормальной
корреляции следует, что
Y*=M[Y\X] = mv +°гГхг (Х-тх),
т.е. наилучшая оценка Y* линейно зависит
от А" и совпадает с оценкой, полученной
выше с помощью метода наименьших квадратов
при условии, что функция <р(Х) линейна.
График функции j>* = M[X|x] называют
линией регрессии СВ К на СВ X. В гауссовском
случае линия регрессии - прямая.
Глава 19.5
ИНТЕРВАЛЬНЫЕ ОЦЕНКИ
19.5.1. Основные понятия. Пусть
имеется параметрическая статистическая модель
(^е > Fzn (Zn»6)) 9 е © с R1, и по выборке
Zn = со\(Х\,...,Хп), соответствующей
распределению F(x,9) наблюдаемой СВ X,
требуется определить неизвестный параметр
9 . Вместо точечных оценок, рассмотренных
ранее, рассмотрим другой тип оценок
неизвестного параметра 0е 9cR .
Определение 19.5.1. Интервал [9j (Zn ),
92 (Zn)] со случайными концами,
«накрывающий» с вероятностью 1-сс, 0<а<1,
неизвестный параметр 9 ,т.е.
P{91(Zw)<9<92(Zw)} = l-a,
называют доверительным интервалом уровня
надежности 1 - а (или интервальной оценкой)
параметра 9.
Аналогично определяется доверительный
интервал для произвольной функции от
параметра 9.
Определение 19.5.2. Число 6 = 1 - а
называют доверительной вероятностью или
уровнем доверия.
Определение 19.5.3. Доверительный
интервал [9j (Zn ), 92 (Zn )] называют
центральным, если выполняются следующие
условия:
p{e>e2(Z„)} = <x/2,
p{e,(Z„)>e} = a/2.
Часто вместо двусторонних
доверительных интервалов рассматривают
односторонние доверительные интервалы, полагая
9,(z„) = -oo или е2(гл) = 4~.
Определение 19.5.4. Интервал, граница
которого удовлетворяет условию
P{9>92(Z„)} = a
(или P{9,(Z„)>9} = a,),
называют правосторонним (или левосторонним)
доверительным интервалом.
Рассмотрим два способа построения
доверительных интервалов.
19.5.2. Использование центральной
статистики. Определение 19.5.5. Функция
Y = <7(ZW,9) случайной выборки Zn,
такая, что ее распределение Fy (у) не зависит
от параметра 9 и при любом значении zn
функция (7(z„,9) является непрерывной и
монотонной по 9, называется центральной
статистикой для параметра 9 .
Зная распределение Fyiy)
центральной статистики Y = G(Zn,d), можно найти
числа g\ и #2 » удовлетворяющие условию
678
Глава 19.5. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ
P{g{<G(Z„,e)<g2} = \-a.
Тогда границы доверительного
интервала [Oj (Z„ ), О2 (Zn )] для параметра 0 могут
быть найдены, если разрешить с учетом
свойств функции G(Zn, в) следующие
неравенства:
й <G(ZniQ)<g2.
В частности, если G(zn, 0) — монотонно
возрастающая по 0 функция, то
e,(Z„) = C-|(Z„,^l),
e2(Z„) = C-1(Zn,ft),
где G~ (zn, 0) — функция, обратная по
отношению к G(zn,Q). Если <7(zw,9) -
монотонно убывающая по 0 функция, то
9,(Z„) = C7-|(Z„,^),
e2(Z„) = C-'(Z„,^).
Применим данный метод для
построения доверительных интервалов неизвестных
параметров в случае нормального
распределения N(mx ,Ov) - С этой целью приведем
следующее утверждение, с помощью которого
можно определить центральные статистики
2
для неизвестных параметров тх , Ох .
Пусть Zn =co\(X\,...,Xn) - выборка,
порожденная СВ X, где X ~ N(w^ , ъх ), а
тх и dх — выборочные среднее и
дисперсия. Тогда:
1) СВ Мх =(тх -mx)4nl<5x
имеет распределение N(0,1);
2) СВ Dx = ndх /ох имеет РаспРе'
•л
деление % (п ~ Oi
3) Мх =(тх -тх) yl(n-\) /dx
имеет распределение S(aj-I);
4) СВ тх и dх независимы.
Пример 19.5.1. Для нормальной выборки
Zn требуется построить доверительный
интервал для неизвестного МО т при извест-
9
ной дисперсии ах . Из приведенного выше
утверждения следует, что С В Мх имеет
нормальное распределение N(0,1), которое
не зависит от тх , и, кроме того, функция
G(Zn , тх ) = (тх ~ тХ )Jnfax является
непрерывной и убывающей по тх . Это зна-
*
чит, что С В М х является центральной
статистикой. Поэтому доверительный интервал
для неизвестного тх можно найти, если
разрешить относительно тх двойное
неравенство
(тх
тх
)yfi
<*х
82,
где величины g\ и g2 подобраны таким
образом, что это неравенство выполняется с
вероятностью 1 - а. Заметим, что данное
условие неоднозначно определяет g\ и g2.
Выберем доверительный интервал
минимальной длины. Учитывая симметрию
относительно нуля стандартного нормального
распределения, можно показать, что такой интервал
будет иметь минимальную длину, если
положить g\ = -g2, и при этом он оказывается
центральным. Таким образом получаем
следующий доверительный интервал:
т ,
-pUy<mx <mx +-~wy,
где иу - квантиль уровня у = 1 - а/2
стандартного нормального распределения N(0,1).
В данном случае длина доверительного
интервала А = 2Uy Ox /yJn и не случайна.
Поэтому, задавшись значениями любых двух из трех
величин А, а, п, можно определить
значение третьей величины.
Пример 19.5.2. Используя утверждение
3), можно построить аналогичный
центральный доверительный интервал для
неизвестного тх СВ X, имеющей нормальное
распределение N (тх , ох )' и в слУчае» когда
величина Ох неизвестна:
ИСПОЛЬЗОВАНИЕ ТОЧЕЧНОЙ ОЦЕНКИ
679
™* ~\^Гл^{п-Х)-
тх ^ тх +
■L(n-l),
где ty (п - 1) - квантиль уровня у = 1 - а/2
распределения Стьюдента S(fl-l) с п-\
степенью свободы.
В отличие от предыдущего примера
длина доверительного интервала случайна и
зависит от СВ dх . Но при п > 30 интервалы из
примеров 19.5.1 и 19.5.2 практически
совпадают, так как при п > 30 распределение
Стьюдента близко к стандартному
нормальному распределению.
Пример 19.5.3. Центральный
доверительный интервал для неизвестного параметра
(Т^г СВ X ~ N(w^ ,Оу ) при неизвестном тх
можно получить, используя утверждение 2):
п
dx <o2x<
*1-Y("-1)
1 X >
Ху(/!-1)
где Ху(л-1) и Х|_у(я-1) - квантили
уровней у = 1- а/2 и 1 - у = а/2 для
распределения хи-квадрат с п — 1 степенью
свободы.
Пример 19.5.4. Построим доверительный
интервал для неизвестного параметра b
равномерного распределения R(0, 1). Можно
показать, что СВ G(Z„,b) = (x{n)/b\"
имеет распределение R(0, b) для любого b > 0.
Кроме того, функция G(Zn ,b) - убывающая
по Ь. Следовательно, G(Zn,b) является
центральной статистикой. Тогда получаем условие
#1
'*<">
V
82
1-а
для некоторых чисел g\, g2. Разрешая
двойное неравенство в этом вероятностном
условии относительно £, получаем следующий
доверительный интервал:
л <ь<л
Ч
\/п
*1
\/п
Этот интервал будет иметь наименьшую
длину, если #2 = 1» а #1 является квантилью
уровня а распределения R(0, 1), т.е.
Si =a.
19.5.3. Использование точечной
оценки. Пусть Т = 9(Z„ ) — точечная оценка
неизвестного параметра 0 с функцией
распределения Fp(t,Q), которая монотонна по
0. Пусть tn =Q(zn) "~ реализация оценки
T = Q(Zn). Пусть B{(zn) и 02U„)
-такие два числа, что
e,(^) = max|e:Fr(^,e) = |J,
e2U„) = min|e:Fr(/ll-0,e) = l-|J,
если Fj(t,§) — возрастающая по 0, и
в,(?я) = тах|в:/^(/|1-0,в) = 1-|1,
e2(^) = min|e:7t(^,e) = |J,
если Fj(t,§) — убывающая по 0.
Определение 19.5.6. Интервал [0j (Z„ ),
92(ZW)] со случайными концами,
определенными выше, называют центральным
доверительным интервалом, «накрывающим» с
вероятностью 1 - а неизвестный параметр 0.
Во многих случаях доверительный
интервал из определения 19.5.6 совпадает с
интервалом, построенным на основе
центральной статистики. Например, этот факт имеет
место в случае нормального распределения.
Действительно, в частности, при неизвестном
тх и известном о% в качестве точечной
оценки тх можно принять Т = mx ,
которая имеет распределение N(aw^ ,0х /п) •
Очевидно, что функция распределения
FT(t,mx) является в данном случае
убывающей по Шх функцией. Поэтому, если
строить центральный доверительный интервал
680
Глава 19.5. ИНТЕРВАЛЬНЫЕ ОЦЕНКИ
с помощью распределения точечной оценки,
то он совпадет с доверительным интервалом
минимальной длины, найденным в примере
19.5.1 п. 19.5.2. Но в ряде случаев вообще не
удается построить доверительный интервал на
основе центральной статистики, тогда как
доверительный интервал, основанный на
распределении точечной оценки, существует.
Рассмотрим несколько таких примеров.
Отметим также, что в примере 19.5.4 п. 19.5.2
наблюдается противоположная ситуация.
Пример 19.5.5. Пусть СВ X имеет
распределение Бернулли Bi(l,/j) с неизвестным
параметром р и Zn = со\(Х\ ,...Хп) —
соответствующая выборка. МП-оценкой для р
является выборочное среднее
e(Zn) = ijr*,.
СВ Т = 9(Z„ ) может принимать значения
0,\/п,2/п,...,п/п, а ее функция
распределения имеет вид
^>)Ф>'<'->>"-■•
Дифференцируя по р функцию
Ff(k/n,p), можно убедиться, что ее
производная отрицательна, т.е. Fj (к/п,р)
является мнотонно убывающей по р при к < п .
Поэтому можно применить описанную выше
методику для построения доверительного
интервала для р. Таким образом, границы
центрального доверительного интервала
[6| (Z/i )> ^2(^/1)] находят, решая следующие
уравнения:
\-FT
V п ) i=k 1
^(fe2j=Xc;e'2(i-e2 Г'=§-
Отметим, что при построении одностороннего
доверительного интервала для р можно
положить, например, О2 = 1 и тогда получим
следующее уравнение для определения 0|:
\-FT
к-\
А
Jciejd-e.r^a.
/=*
Пример 19.5.6. Пусть СВ ЛГ имеет
распределение Пуассона П(д) с неизвестным
параметром а. МП-оценкой параметра а
является выборочное среднее
I
°<Z"> = 7;X*<-
/=i
Оценка Т = 9(Z„ ) принимает значения к/п
при к = 0,1,2,..., а ее функция
распределения имеет вид
i-уь
п ) /=о
(паУ
г!
/!
Производная данной функции оказывается
отрицательной, следовательно, функция
F-p(к/п,а) является монотонно убывающей
по а. Поэтому воспользуемся описанным
выше способом построения центрального
доверительного интервала [0| (zt1), 62 (zn )] •
В данном случае для определения 0| и 92
получаем следующие уравнения:
l-Fr
к-\
А -£<
-/»в|
("0,)'
i=k
а
1Ч
,*2 =Х<
-/ie2 ("е2)' _ a
/=0
Правую границу одностороннего
доверительного интервала находят из уравнения
-,е2
-,,е7 ("ЬУ _
1=0
ВЫЧИСЛЕНИЕ ВЕРОЯТНОСТИ СОБЫТИЯ
681
Глава 19.6
МЕТОД СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ
19.6.1. Основные понятия.
Определение 19.6.1. Метод вычисления некоторой
детерминированной величины а как среднего
арифметического Yn независимых одинаково
распределенных СВ Xi,...,Xn, подобранных
таким образом, чтобы Yn———>а,
называют методом статистических испытаний
(методом Монте-Карло) для вычисления а.
Замечание 19.6.1. В некоторых учебниках
метод Монте-Карло называют также методом
статистического моделирования, что, на наш
взгляд, не совсем корректно. Дело в том, что
термин «моделирование» используется также в
теории математического моделирования для
описания процесса создания математических
моделей каких-либо явлений. Подчеркнем,
что в методе Монте-Карло речь идет о
статистической имитации испытаний (опытов), а не
о процессе создания статистических моделей
опытов.
19.6.2. Вычисление вероятности
события. Пример 19.6.1. Рассмотрим
применение метода статистических испытаний
для оценивания неизвестной вероятности
р = Р(А) некоторого события А. В
соответствии с усиленным законом больших чисел
частота события А сходится почти наверное к
вероятности события А, т.е.
W„(A) = M(A)/n-
-> р ПрИ П —> оо .
Кроме того, в соответствии с теоремой
Муавра-Лапласа справедливо другое
предельное соотношение:
vrH = MiArL'v F >u,
где [/-N(0,1).
Воспользуемся приведенными выше
соотношениями для выбора гарантирующего
числа испытаний УУ, при котором можно
было бы сказать, что СВ M(A)/N «близка» к
оцениваемой вероятности р. Поступим
следующим способом. Вначале зададим точность
А оценки вероятности р: \М/п - р\ < А , где
М = М(А). Затем найдем надежность этой
*
оценки, учитывая, что IV,t ~ V,
\м__
\ п
4
Г~\ ( Г—\
-| = 2Ф0
1 Jim
Задав доверительную вероятность
8, получим трансцендентное уравнение
2Фо \AjN/pq) = 8, из которого можно найти
N
б
Va)^1"^)
+ 1,
где Фо*(1+б)/2 =8/2> т.е. х({+Ъ)/2 является
квантилью уровня (1 + 8)/2 распределения
N(0,1). Но величины р и Q = l-p
заранее неизвестны, поэтому заменим величину
р(\-р) на ее максимальное значение,
которое, очевидно, достигается при р = 1/2
и равно 1/4. Поэтому выбираем N§ =
= \(х(. -..у 2&\ +1. В этом примере для
вычисления N§ необходимо задать уровень
доверительной вероятности 8 (вторичный по
отношению к р) и точность А вычисления р.
Замечание 19.6.2. При р > 0,8 обычно
задают А = (1 - р)/10 и 8 = 1 - А.
Пример 19.6.2. Отметим, что в
предыдущем примере гарантирующее число
испытаний было выбрано априори, т.е. до опыта, и
одним и тем же для всех оцениваемых
вероятностей р. Но интуитивно ясно, что N§
должно быть различным в зависимости от
значения р и от реализации числа успешных
испытаний М. Например, пусть в серии из N
испытаний все испытания оказались
успешными, т.е. М = N. Найдем для этого случая
зависимость N$(p) гарантирующего числа
испытаний от доверительной вероятности 8
и вычисляемой вероятности р. С этой целью
рассмотрим, как и в примере 19.6.1, нормиро-
*
ванную СВ W N , но потребуем выполнение
другого вероятностного условия:
PWn <x&
h
где *5 — квантиль уровня 8 для
стандартного нормального распределения N(0,1).
682
Глава 19.6. МЕТОД СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ
Это условие отражает наше желание добиться
того, чтобы частота Wn была не меньше
оцениваемой вероятности р с некоторой
точностью, т.е.
(N-K
N
— Р
N
Pd-P)
Р)
где К = N - М есть случайное число
неуспешных испытаний. Действительно, это
неравенство эквивалентно следующему: Wp/ <р +
+хь
\pQ-p)
\ N •
Если последнее неравенство
выполнено для конкретно реализовавшегося
значения частоты, то можно надеяться (с
доверительной вероятностью 8), что
полученное значение W^ лишь незначительно
меньше вычисляемой вероятности р (см.
более подробно о понятии доверительного
интервала в п. 19.5.1). Выбирая минимальное
N, удовлетворяющее полученному
неравенству, т.е. решая соответствующее квадратное
уравнение (N-k-Np)2 = Nx§p(\- p), где
к — реализация К, находим
#в(Л*) =
2к + xjp + х8 ^4кр + p2xl
2(1 -Р)
+ 1.
В частности, если все испытания оказались
успешными (случай к = 0 ), то
Nb(P,0):
4р
1-р
+ 1.
Например, если при вычислении
вероятности р = 0,99 положить, как
рекомендуется в замечании 19.6.2, А = 0,001; 8 = 0,999,
то по формуле из этого примера получаем
априорное значение гарантирующего числа
испытаний N$ =10300000, так как в этом
случае х§ =3,209. При тех же данных
апостериорное значение гарантирующего числа
непрерывно успешных испытаний
оказывается намного меньше: N$ (p, 0) = 1030.
Пример 19.6.3. Используем теперь
другую предельную теорему для выбора
гарантирующего числа испытаний. Предположим, что
р > 0,9 и воспользуемся теоремой Пуассона.
Пусть q = 1 - р — вероятность неуспешного
испытания, a W^ = K/N — частота
неуспешных испытаний в серии из N
испытаний, где К — число неуспешных испытаний.
В соответствии с теоремой Пуассона при
больших N и малых q распределение
частоты Т = \Vtf можно аппроксимировать
распределением Пуассона Il(Nq), в
соответствии с которым имеем
Воспользуемся результатом из примера
19.5.6, приведенного в п. 19.5.3 для
построения правостороннего доверительного
интервала [0, 02], который «накрывал» бы
неизвестный параметр q с доверительной
вероятностью 8 = 1 - а. Таким образом получаем
уравнение связи между параметрами
N, е2>*, а:
i=o 7!
N
Можно показать, что левая часть этого
уравнения монотонно убывает с ростом N
Поэтому корень данного уравнения по N
может быть легко найден, например, с
помощью метода дихотомии. В частностном
случае, когда в серии из N испытаний все
испытания оказались успешными, т.е. к = 0,
данное уравнение принимает более простой вид:
e-m> = <х.
Откуда находим гарантирующее число
испытаний при условии, что все испытания
успешны,
N* =
ln(l-5)
02
+ 1.
19.6.3. Вычисление определенного
интеграла. Пример 19.6.4. Рассмотрим опреде-
1
ленный интеграл a- g(x)dx, где g(x) —
0
ограниченная на отрезке [0, 1] функция
ВЫЧИСЛЕНИЕ ОПРЕДЕЛЕННОГО ИНТЕГРАЛА
683
(|#(л;)| < с < оо для всех х € [0,1]).
Рассмотрим также С В X, равномерно распределенную
на отрезке [0, 1], плотность которой
fx(x) = \, если *€[0,1] и fx(x) = 0,
если х £ [0,1]. Тогда очевидно, что
+оо
M[g(X)]= \g{x)fx{x)dx =
i
= ]g(x)dx = a.
о
Таким образом, значение определенного
интеграла можно найти как математическое
ожидание СВ X = g(X), где СВ X имеет
равномерное распределение на отрезке [0, I],
Af~R(0,1). Пусть теперь
последовательность {Хп}у п- 1,2,..., состоит из СВ,
независимых и равномерно распределенных на
отрезке [0, I]. Можно убедиться, что в этом
случае СВ Хп = g(Xn), /1 = 1,2,..., будут
также независимы, одинаково распределены с
конечными МО и дисперсиями. Так как МО
СВ Хп ограничены, то по усиленному закону
больших чисел (теорема Колмогорова) после-
1 "
довательность СВ Yn = — V Хк сходится
п к=\
почти наверное к величине a = M[g(X)],
т.е. Yn ———>а при п —> оо. Это значит,
что, проведя большое количество испытаний,
можно с высокой точностью вычислить
значение интеграла а.
Метод Монте-Карло имеет огромную
область приложения. Наиболее трудной
проблемой в его реализации является выбор
необходимого числа испытаний я, такого, чтобы
можно было считать, что СВ Yn достаточно
«близка» к а. Ясно, что из-за вычислительных
трудностей желательно выбирать величину п с
возможно меньшим гарантирующим
значением N Для выбора N обычно используют
центральную предельную теорему, считая, что
распределение нормированной суммы Z^
С В Xfc, k = \,N9 является стандартным
нормальным распределением N(0,1).
Рассмотрим на примерах, как выбирается
величина N.
Пример 19.6.5. Выберем гарантирующее
число статистических испытаний N при
вычислении значения а определенного
интеграла из примера 19.6.4. Рассмотрим дисперсию
СВ X = g(Xn), предполагая, что g(x)$a
и g(x) непрерывна,
-И»
D[g(X)]= j{g(x)-affx(x)dx =
!■ ~~> lr 2
= j{g(x)-a)2dx<j(\g(x)\ + \a\) dx.
о о
По условиям примера 19.6.4 имеем
|g(x)|<c, тогда
ll
а =
jg(x)d>
<с,
*>lg(x)]<](\g(x)\ + cfdx<4c2.
о
Учтем, что к последовательности СВ g(Xn),
л = 1,2,..., применима центральная
предельная теорема, в соответствии с которой СВ
Zn=-^[g(Xk)-mkl
s" *=1
где sn = D
, mk=M[g(Xk)l
сходится по распределению к СВ U ~ N(0,1),
->U при n -> oo.
т.е. Zn -
Далее, по усиленному закону больших
чисел,
Yn =-fg(Xk) nH >a=M[g(X)],
т.е. С В Yn сходится почти наверное к
постоянной а. Это значит, что при больших п СВ
Yn «близка» к а. Предположим, что нужно
вычислить а с точностью А , т.е. |УЛ - а\ < А.
Поскольку Yn является случайной
величиной, выясним степень достоверности этой
оценки:
цг.-4и).
-rb-iS*^
D[g(X)]
Д •
Так как D[g(X)] < Ас1, то
684
Глава 19.7. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Pjr.-H»A}*FJ|r.-H^Z*A£).pj|Z.|*A£|.
В соответствии с центральной
предельной теоремой, Zn
->{/, т.е.
'ki"#
2ФП
'2с
Л Л
1
где Фо(л:) = —;= |ехр| -— I*//. Выберем
л/2тс ^ 2
* о v j
некоторую доверительную вероятность 8,
которая равна требуемой надежности
выполнения неравенства |ГЛ - а\ < А, т.е.
p{|Z„|<A^/2} = 6.
Замечание 19.6.3. На практике величину
8 обычно задают в пределах от 0,95 до 1.
Тогда, решая уравнение
2Фо lAylN/(2c)\ = 8 относительно N ,
можно найти гарантирующее число испытаний
N$. Функция Фц(х) задается таблично, и
поэтому для доверительной вероятности 8
можно найти такое значение *(]+б)/2» что
фо(*(1+5)/2) = §/2- Число *(1+5)/2 является
квантилью уровня (1 + 8)/2 распределения
N(0,1). Таким образом, получаем уравнение
- *(1+5)/2» из которого легко
найти искомое значение
N* =
s /* \2
+ 1,
где символ [■] означает целую часть числа.
Подчеркнем, что для вычисления 7V§
необходимо задать точность А оценки величины
а и уровень доверительной вероятности 8 .
В данном примере рассмотрен случай
вычисления a = M[g(X)] для равномерно
распределенной СВ X ~ R(0,1). Аналогично
можно поступить при вычислении а =
= M[g(Ar)] для произвольной СВ X, такой,
что а < ©о.
Глава 19.7
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
19.7.1. Основные понятия.
Определение 19.7.1. Статистической гипотезой Н,
или просто гипотезой, называют любое
предположение относительно параметров или
закона распределения СВ X, проверяемое по
выборке Zn.
Определение 19.7.2. Проверяемую
гипотезу называют основной (или нулевой) и
обозначают Hq . Гипотезу, конкурирующую
с Hq , называют альтернативной и
обозначают Н\.
Определение 19.7.3 Статистическую
гипотезу Hq называют простой, если она
однозначно определяет параметр или
распределение СВ X. В противном случае гипотезу Hq
называют сложной.
Пример 19.7.1. По выборке Zn
требуется проверить гипотезу Hq о том, что
тХ = Щ j гДе Щ ~ некоторое
фиксированное число, против гипотезы Н\ о том, что
тХ * Mq • Или проверить гипотезу Я0
против гипотезы Н\ о том, что тх > Щ .
Одна из основных задач математической
статистики состоит в проверке соответствия
результатов эксперимента предполагаемой
гипотезе Hq . С этой целью выбирается
некоторая статистика Z = ty(Zn), для которой
предполагается известным условное
распределение F(z\Hq). С помощью этой статистики
строится процедура (правило) проверки
гипотезы.
Определение 19.7.4. Статистическим
критерием (критерием согласия, критерием
значимости или решающим правилом)
проверки гипотезы Hq называют правило, в
соответствии с которым по реализации Z = ty(Zn)
статистики Z гипотеза Hq принимается или
отвергается.
ПРОВЕРКА ГИПОТЕЗЫ О ЗНАЧЕНИИ ПАРАМЕТРА
685
Определение 19.7.5. Критической
областью G статистического критерия называют
область реализаций z статистики Z, при
которых гипотеза Hq отвергается.
Определение 19.7.6. Доверительной
областью G статистического критерия называют
область значений z статистики Z , при
которых гипотеза Hq принимается.
Например, в качестве статистического
критерия можно использовать правило:
1) если значение z = ty{zn ) статистики
Z = (p(Z„) лежит в критической области G ,
то гипотеза Hq отвергается и принимается
альтернативная гипотеза;
2) если реализация z = <p(Z„ )
статистики Z = <p(Zn) лежит в доверительной
области (7, то гипотеза Hq принимается.
При реализации этого правила
возникают ошибки двух видов.
Определение 19.7.7. Ошибкой 1-го рода
называют событие, состоящее в том, что
гипотеза Hq отвергается, когда она верна.
Определение 19.7.8. Уровнем значимости
статистического критерия называют
вероятность ошибки 1-го рода а = PJZ € G\Hq },
которая может быть вычислена, если известно
распределение F(z\Hq) .
Определение 19.7.9. Ошибкой 2-го рода
называют событие, состоящее в том, что
принимается гипотеза Hq , когда верна
гипотеза Н\ .
Вероятность этой ошибки равна
P = PJZe<7|#|} и может быть вычислена,
если известно условное распределение
F(z\H\ ) статистики Z при справедливости
гипотезы Н\ .
Ясно, что с уменьшением вероятности
ошибки 1-го рода возрастает вероятность
ошибки 2-го рода и наоборот, т.е. при выборе
критической и доверительной областей
должен достигаться определенный компромисс.
Поэтому часто при фиксированной
вероятности ошибки 1-го рода критическая область
выбирается таким образом, чтобы вероятность
ошибки 2-го рода была минимальной.
Проверка статистической гипотезы
может быть разделена на следующие этапы:
1) сформулировать проверяемую
гипотезу Hq и альтернативную к ней гипотезу Н\ ;
2) назначить уровень значимости а ;
3) выбрать статистику Z для проверки
гипотезы Hq ;
4) определить распределение F(z\Hq)
статистики Z при условии, что гипотеза Hq
верна;
5) построить, в зависимости от
формулировки гипотезы Н\ , критическую область G ;
6) получить выборку наблюдений
Х],...,хп и вычислить выборочное значение
Z = ф(Х| ,...,хп ) статистики Zкритерия;
7) принять статистическое решение на
уровне доверия 1 -а : если ze G, то
отклонить гипотезу Hq как не согласующуюся с
результатами наблюдений, а если z e G , то
принять гипотезу Hq как не
противоречащую результатам наблюдений.
19.7.2. Проверка гипотезы о значении
параметра. Пусть имеется параметрическая
статистическая модель ISq, F% (z„,0)1,
0€0cR , т.е. выборка Zn соответствует
распределению F(x,Q) с неизвестным
параметром 0. Проверим простую гипотезу Hq ,
состоящую в том, что 0 = 0о , где 0О —
некоторое фиксированное число из множества 0 .
Формулировка альтернативной гипотезы
Н\ и уровень значимости а определяют
размер и положение критической области G
на множестве значений статистики Z.
Например, если альтернативная гипотеза Н\
формулируется как 0 > 0q (или 0 < 0q ), то
критическая область размещается на правом (или
левом) «хвосте» распределения статистики Z, т.е.
G={z>Z\-a} (или G={z<Za}),
где Z\-a и Za ~ квантили уровней
соответственно 1-а и а распределения F(z\Hq)
статистики Zпри условии, что верна гипотеза
Hq . В этом случае статистический критерий
называют односторонним. Если
альтернативная гипотеза Н\ формулируется как 0 ■* 0О ,
686
Глава 19.7. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
то критическая область G размещается на
обоих «хвостах» распределения статистики Д
т.е. определяется совокупностью неравенств
G = {z<Za/2}(j{z>Z[-(X/2},
где Za/2 и Zi-a/2 ~ квантили уровней
соответственно а/2 и 1 - а/2 распределения
F(z\Hq ). В этом случае критерий называют
двусторонним.
Пример 19.7.2. Пусть известно, что СВ X
имеет нормальное распределение. Требуется,
используя реализацию выборки zn,
проверить гипотезу Hq , состоящую в том, что
тХ ~ т0 (Щ ~" некоторое фиксированное
число), против альтернативной гипотезы Н\
о том, что Шх * Щ. Возможны два случая:
дисперсия Ov известна или неизвестна.
Статистики Z для обоих случаев можно выбрать,
используя утверждения 1) и 3) п. 19.5.2.
Представим эти случаи в виде таблицы:
Предположение
2
Ох известна
Од. не известна
Статистика Z критерия
[тх -rriQJyfn
°Х
V^7
Распределение F(z\H0)
N(0, 1)
S(W-1)
Доверительная область G
принятая гипотезы Hq
[-иу, иу]
[-/y(/I-l),/Y(/l-l)]
Здесь Uy,ty(n-l) - квантили уровня у = 1 - а/2 распределений соответственно
N(0, 1) и S(fl-l).
19.7.1. Квантили tp{n) уровня р распределения S(n): Р{Т < tp(n)} = р
п
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Р
0,6
0,325
0,289
0,277
0,271
0,267
0,265
0,263
0,262
0,261
0,260
0,260
0,259
0,259
0,258
0,8
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,9
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
0,95
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
0,975
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
0,99
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
0,995
63,657
9,925
5,841
4,604
4,032
3,707
3,449
3,355
3,250
3,169
3,106
3,055
3,012
2,977
0,9995
636,619
31,598
12,941
8,610
6,859
5,959
5,405
5,041
4,781
4,587
4,437
4,318
4,221
4,140
ПРОВЕРКА ГИПОТЕЗЫ О ЗНАЧЕНИИ ПАРАМЕТРА
687
Продолжение табл. 19.7.1
п
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
00
р
0,6
0,258
0,258
0,257
0,257
0,257
0,257
0,257
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,255
0,254
0,254
0,253
0,8
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
0,851
0,848
0,845
0,842
0,9
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,296
1,289
1,282
0,95
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,684
1,671
1,658
1,645
0,975
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,021
2,000
1,980
1,960
0,99
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,390
2,358
2,326
0,995
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,660
2,617
2,576
0,9995
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,767
3,745
3,725
3,707
3,690
3,674
3,659
3,646
3,551
3,460
3,373
3,291
Пример 19.7.3. Пусть СВ X нормально что а2, ^ а2 на основе реализации z„ вы-
распределена, а ее дисперсия неизвестна.
борки Zn . Возможны два случая: ntv — из-
Требуется проверить гипотезу Hq о том, что
вестно или тх ~ неизвестно. Соогветствую-
®Х ~ а0 ^а0 ~~ некоторое фиксированное щие результаты, полученные с помощью
утверждения 2) п. 19.5.2, представлены в сле-
число), против гипотезы Н\ , состоящей в том, дующей таблице:
Предположение
п\х известно
тх неизвестно
Статистика Z критерия
к=\
°1
ndx
4
Распределение F(z\ //0 )
х2(«)
х2("-0
Доверительная область G
принятая гипотезы Н{)
[х,_у(л), ху(п)\
[х,_у(л-1), ху(п-\)]
Здесь Х\_у(к), Ху(к) - квантили уровней соответственно I - у и у = 1 -а/2
распределения с к степенями свободы, к = п, п - I.
688
Глава 19.7. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Замечание 19.7.1. На практике обычно задают осе [О,
19.7.2. Квантили х$(п) уровня б распределения
01; 0,05].
Х2(п):Р{Х<хь(п)} = д
п
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
5
0 05
0,00
0,10
0,35
0,71
1,15
1,65
2,17
2,73
3,32
3,94
4,58
5,23
5,89
6,57
7,26
7,96
8,67
9,39
10,11
10,85
11,59
12,34
13,09
13,85
14,61
15,38
16,15
16,93
17,71
18,49
0,1
0,02
0,21
0,58
1,06
1,61
2,20
2,83
3,49
4,17
4,86
5,58
6,30
7,04
7,79
8,55
9,31
10,08
10,86
11,65
12,44
13,24
14,04
14,85
15,66
16,47
17,29
18,11
18,94
19,77
20,60
0,2
0,06
0,45
1,01
1,65
2,34
3,07
3,82
4,59
5,38
6,18
6,99
7,81
8,63
9,47
10,31
11,15
12,00
12,86
13,72
14,58
15,44
16,31
17,19
18,06
18,94
19,82
20,70
21,60
22,50
23,40
0/3
0Д5
0,71
1,42
2,20
3,00
3,83
4,67
5,53
6,39
7,27
8,15
9,03
9,93
10,82
11,72
12,62
13,53
14,44
15,35
16,27
17,18
18,10
19,02
19,94
20,90
21,80
22,70
23,60
24,60
25,50
0^5
0,46
1,39
2,37
3,36
4,35
5,35
6,35
7,34
8,34
9,34
10,34
11,34
12,34
13,34
14,34
15,34
16,34
17,34
18,34
19,34
20,30
21,30
22,30
23,30
24,30
25,30
26,30
27,30
28,30
29,30
0/7
Го7
2,41
3,66
4,88
6,06
7,23
8,38
9,52
10,66
11,78
12,90
14,01
15,12
16,22
17,32
18,42
19,51
20,60
21,70
22,80
23,90
24,90
26,00
27,10
28,20
29,20
30,30
31,40
32,50
33,50
0,8
Пб4
3,22
4,64
5,99
7,29
8,56
9,80
11,03
12,24
13,44
14,63
15,81
16,98
18,15
19,31
20,47
21,62
22,76
23,90
25,04
26,17
27,30
28,43
29,55
30,78
31,80
32,91
34,03
35,14
36,25
0,9
2/71
4,60
6,25
7,78
9,24
10,64
12,02
13,36
14,68
15,99
17,28
18,55
19,81
21,06
22,31
23,54
24,78
25,59
27,20
28,41
29,61
30,81
32,01
33,20
34,38
35,56
36,74
37,92
39,09
40,26
0^95
3^84
5,99
7,82
9,49
11,07
12,59
14,07
15,51
16_,92
18,31
19,68
21,03
22,36
23,69
25,00
26,29
27,60
28,87
30,14
31,41
32,67
33,92
35,17
36,42
37,65
38,89
40,11
41,34
42,56
43,77
19.7.3. Проверка гипотезы о виде
закона распределения. Пусть имеется
реализация zn выборки Zn , порожденной СВ X с
неизвестной функцией распределения F(x).
Требуется проверить гипотезу Я0,
состоящую в том, что СВ X имеет определенный
закон распределения F(x, 9) (например,
нормальный, равномерный и т.д.). Для
проверки такой гипотезы можно использовать
статистический критерий хи-квадрат
{критерий Пирсона). Правило проверки состоит в
следующем:
1) формулируется гипотеза //0 ,
состоящая в том, что СВ X имеет распределение
определенного вида F(x, 9j,..., 95) с s
неизвестными параметрами 94,...,9Д (напри-
ПРОВЕРКА ГИПОТЕЗЫ О НЕЗАВИСИМОСТИ ДВУХ СВ
689
мер, т и а для нормального распределения,
а и b — для равномерного и т.д.);
2) по реализации выборки zn методом
максимального правдоподобия находят
оценки 01,..., 05 неизвестных параметров
04 ,...,05 ;
3) действительную ось R разбивают на
/ +1 непересекающийся полуинтервал
(разряд) А0,...,А/ так, как это сделано при
построении гистограммы, см. п. 19.1.4.
Подсчитывают число пк элементов выборки,
попавших в каждый к-й разряд Ак,
к = 1,1-lf за исключением А0 и А/.
Полагают tiQ = щ =0;
4) вычисляют гипотетические
вероятности рк попадания СВ Л" в полуинтервалы
Ак, к = 0, /, по формуле
Рк =F(<*k+i, ^,.-,0, )-^(а*,01,...А).
Если у распределения F(x, 0j,...,05)
имеется плотность f(x, 0j ,...,05 ), то
вероятности рк могут быть вычислены следующим
образом:
«А:+1 _
Рк = J f(x,QX9...,hs)dx,
«А:
где а0 = -°°, ot/+i = +», или приближенно
по формуле
Рк =f(xk9 В{ ,...,05)(а^+1 -а*),
где хк = (а^+1 + аА;)/2 — середина разряда
5) вычисляют реализацию статистики
критерия хи-квадрат по формуле
6) известно, что при соблюдении
некоторых естественных условий регулярности и
достаточно большом объеме п выборки Zn
распределение F(z\Hq ) статистики Z = y(Zn)
хорошо аппроксимируется распределением
X (/ - s) с I - s степенями свободы, где s —
количество неизвестных параметров
предполагаемого закона распределения F(x,
в| ,...,вд ), / + 1 - количество разрядов.
Тогда критическая область G принимает вид:
G = (x{_a(l-s)9+oo)9 где *!_„(/-.*) -
квантиль уровня 1 - а распределения
X (I - s), a — заданный уровень значимости
(обычно а = 0,05 );
7) в соответствии с критерием хи-
квадрат гипотеза Hq принимается (т.е.
реализация выборки zn согласуется с гипотезой
Hq на уровне надежности 1 - а), если
(р(^)е(? = (0;Х]_а(/-5)). Если же
ф(гЛ ) € G , то гипотеза Я0 отвергается.
Замечание 19.7.2. При разбиении на
полуинтервалы Ак необходимо учитывать,
чтобы прк>5 для к = 1,1-1. В противном
случае (прк < 5 ) соседние полуинтервалы
объединяются.
19.7.4. Проверка гипотезы о
независимости двух СВ. Пусть имеется случайный
вектор V = col (Л", Y) с функцией
распределения Fy(x, у). Компонентами К являются
СВ X и Y с функциями распределения
соответственно Fx (x) и Fy (у). Пусть имеется
выборка Zn = col(Ki ,...,КЛ ), где Vk =
= соЦЛ^ , Yk ). Здесь выборка Х\,...,Хп
соответствует распределению Fx (х) СВ X,
а выборка Yi,...,Yn соответствует
распределению Fy(y) СВ Y Требуется проверить
гипотезу Hq о независимости СВ X и Y, т.е.
что Fy(x, у) = Fx{x)FY (у) для всех
х € R , у € R . Для проверки этой
гипотезы используем критерий хи-квадрат,
процедура применения которого состоит в следующих
действиях:
1) множество значений разбивают на s
непересекающихся интервалов (разрядов)
Ад. i,..., Ах s , а множество значений СВ Y-
на г непересекающихся интервалов Ау [,...,
АУ,г>
690
Глава 19.7. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
2) для каждого / = 1,5 и каждого
у = 1,г, вычисляют число Пу элементов
выборки z„, принадлежащих
прямоугольнику Axi xAyJ;
3) вычисляют суммарное число пх /
элементов выборки zn, первая компонента
которой попала в 1-й разряд Ах / для СВ X, и
аналогично — число пу j элементов той же
выборки zn, вторая компонента которой
попала ву-й разряд А» ,• для СВ Y:
Г S
у=1 /=|
s г
4) вычисляют значение статистики
критерия хи-квадрат по формуле
(
Z = q>(Zn) = n
s r п.-
ZuZu п ,п .
/=1 у=| "X,l"y,j
-\
5) при справедливости гипотезы Hq и
достаточно большом п распределение
статистики Z = y(Zn) хорошо аппроксимируется
распределением хи-квадрат с /и = (5-1)х
х(г-1) степенями свободы. Поэтому
критическая область имеет вид G =
= (*1_а(/я), + оо), где Х\_а(т) - квантиль
уровня 1 - а распределения % (/и) ;
6) принимается статистическое решение
на уровне доверия I - а : отклонить гипотезу
#0, если (p(zn)eG, и принять гипотезу
Hq в противном случае.
19.7.5. Проверка гипотезы об
однородности наблюдений. Рассмотрим
вспомогательную задачу. Пусть имеется опыт с г
возможными исходами А^,...,^, имеющими
вероятности Pj = Р(Лу ) , j = \,r .
Осуществляется 5-кратное повторение серий из щ,
/ = 1,5, независимых повторений опыта.
В данном случае выборку Zn образуют
наблюдавшиеся исходы в этих сериях, где
п = щ + ... + ns - общее число опытов.
Требуется проверить гипотезу Hq о том, что во
всех этих сериях наблюдалась одна и та же
совокупность вероятностей pj , j -\,r . Для
решения этой задачи вновь применим
критерий хи-квадрат. Последовательность проверки
этого критерия состоит в следующем:
1) в каждой /-й серии, / = 1,5,
подсчитывают числа rip появлений событий Aj ,
у=Г7;
2) подсчитывают суммарное число N j
появлений события Aj , у = 1,г, во всех
сериях, а также числа щ , / = 1,5, и п:
s г
NJ =Х^'"' =Х"у7>
1=1 у=1
s г
1 = 1 У=1
3) вычисляют значение z статистики
критерия хи-квадрат по формуле
z = y(zn) = n
( 2
1_ _Г_ П;;
ы\ j=\n'iyJ
4) известно, что при больших п
распределение статистики Z = q>(Zn) хорошо
аппроксимируется распределением хи-квадрат
X (т) с т = (5- \){г - 1) степенями
свободы. Формируется критическая область G =
= (х1-а(т)»+°°)» где *1-а(ш) ~" квантиль
уровня 1-а распределения % (т) ;
5) принимается статистическое решение
на уровне доверия 1 - а : отклонить гипотезу
Hq , если y(zn)^G и принять гипотезу
Я0, если (pU„)e G .
Пример 19.7.4. В частном случае, когда
г = 2 , т.е. опыт имеет два схода А, А , для
которых р = Р(А), q = P(A), описанная
процедура устанавливает, что во всех сериях
наблюдений вероятность р остается
неизменной.
СПИСОК ЛИТЕРАТУРЫ
691
Пример 19.7.5. Отметим, что описанная
процедура может быть применена и во
многих других случаях. Например, пусть имеется
выборка Х\ ,...,Хп , соответствующая
функции распределения Fx {x) CB X и, кроме
того, имеется выборка Y\,...,Ym,
соответствующая функции распределения Fy (у) СВ
Y. Требуется проверить гипотезу Hq об
однородности выборок Х\,...,Хп и К| ,...,К/И, т.е.
что Fy (О = Fx (О для всех /gR1. Для того
чтобы применить приведенную выше
процедуру, достаточно предварительно использовать
метод группировки данных, разделяя
множества возможных значений С В X w К на одни и
те же разряды, попадания в которые
интерпретируются как события Л.- , j' = \,г .
В данном случае 5 = 2, и статистика
критерия примет следующий вид:
СПИСОК ЛИТЕРАТУРЫ
1. Асриев А.В., Кибзун А.И. Практикум
по статистическому моделированию на ЭВМ.
М.: Изд-во МАИ, 1989.
2. Горяинова Е.Р., Наумов А.В., Сиротин
А.Н. Практические занятия по курсу теории
вероятностей. М.: Изд-во МАИ, 1999.
3. Ивченко Г.И., Медведев Ю.И.
Математическая статистика. М.: Высшая школа,
1984.
4. Кибзун А.И., Панков А.Р.,
Сиротин А.Н. Учебное пособие по теории
вероятностей. М.: Изд-во МАИ, 1993.
5. Кибзун А.И. и др. Теория
вероятностей и математическая статистика. Базовый
курс с примерами и задачами. М.: Физматлит,
2002.
6. Кожевников Ю.В. Введение в
математическую статистику. Казань: Изд-во Казан,
гос. тех. ун-та, 1996.
7. Колемаев В.А., Староверов О.В., Ту-
рундаевский В.Б. Теория вероятностей и
математическая статистика. М.: Высшая школа,
1991.
8. Королюк B.C. и др. Справочник по
теории вероятностей и математической
статистике. М.: Наука, 1985.
9. Пугачев B.C. Теория вероятностей и
математическая статистика. М.: Наука, 1979.
10. Сборник задач по математике для
втузов. Ч. 3. Специальные курсы / Под ред.
А.В. Ефимова. М.: Наука, 1984.
11. Чистяков В.П. Курс теории
вероятностей. М.: Наука, 1987.
Раздел 20
СЛУЧАЙНЫЕ ПРОЦЕССЫ
Глава 20.1
ОСНОВНЫЕ ПОНЯТИЯ
20.1.1. Определение случайного
процесса. Пусть ГсМ — некоторое
подмножество действительной оси R .
Скалярным случайным процессом
£(г, со), заданным на Т, называется
функция, ставящая в соответствие каждому те Т
случайную величину £т(со) = £(т, со),
определенную на вероятностном пространстве
{Q,.F,P}, где Q = {со} — пространство
элементарных событий, Т — а-алгебра
случайных событий, на которой определена
вероятность Р.
Если при каждом te T£,(t,(u) является
/и-мерным случайным вектором, то
соответствующий процесс £ называют пг-мерным
(векторным) случайным процессом.
В прикладных задачах переменная t
обычно имеет смысл времени. Если Т —
счетное множество точек (например, T = Z =
= {0, ± 1, ± 2, ...}), то £(/,со) называют
процессом с дискретным временем или
случайной последовательностью. Если же Т = (а,Ь),
£(/,со) — процесс с непрерывным временем
или случайная функция.
При каждом фиксированном те Т
случайный вектор £т(со) называется сечением
процесса в точке т. . Если зафиксировать
элементарное событие у е Q , то
соответствующая детерминированная функция
(последовательность) JL =£(/,у) называется реализацией
процесса % на Т или его выборочной
траекторией. Таким образом, любой случайный
процесс можно трактовать либо как
параметрическое семейство случайных величин
(сечений), либо как пучок неслучайных
функций времени (реализаций).
Обычно в технической литературе
зависимость процесса от переменной со явно не
указывается: £(/) = £(/,со).
Случайную функцию £(/)> te T ,
называют регулярной, если в каждой точке t e T
все ее траектории непрерывны справа и
имеют конечные пределы слева. В дальнейшем
всегда предполагается, что мы рассматриваем
только регулярные случайные функции.
20.1.2. Вероятностные
характеристики. Пусть £(/) - скалярный случайный
процесс. Детерминированную функцию 2п
переменных
У^(Х] ,...,хп; Ц ,...,tn) =
= P[£(/J)<xI,...,£(0<x„],
где п > 1, X/ е R1, // е Т, / = 1,...,/1,
называют п-мерной функцией распределения процес-
При фиксированных {t\,..-,tn}
1% (х\ > —9Хп > h > —9 *п ) является функцией
распределения «-мерного случайного вектора
£л = {£(/j ),...,£(/„)} , составленного из
сечений процесса %(t) в точках {Ц , ..., tn},
поэтому ее свойства полностью совпадают со
свойствами функции распределения
произвольного «-мерного случайного вектора.
МОМЕНТНЫЕ ХАРАКТЕРИСТИКИ
693
Для полного описания вероятностных
свойств процесса в общем случае необходимо
задать совокупность всех его конечномерных
распределений (т.е. я-мерных функций
распределения для всех я>1 и всевозможных
наборов {/|, ..., tn} точек из Т ).
Пусть для процессов £(/) и Т|(0>
teT , заданных на {Q, Т, Р}, выполнено
Р[«О*Л(О] = 0 V/67\
В ряде практически важных случаев
полное вероятностное описание процесса
можно получить, зная лишь его двумерное
распределение.
20.1.3. Моментные характеристики.
Рассматриваемые ниже характеристики не
дают в общем случае исчерпывающего
описания процесса, однако они удобны в
прикладных исследованиях и имеют ясный
физический смысл.
Математическим ожиданием (средним
значением) скалярного процесса £(0
называют неслучайную функцию
(последовательность)
»%(/) = M[§(0J= ] xpk(x; t)dx, teT.
Дисперсией скалярного процесса ^(t)
называют неслучайную функцию
(последовательность)
^(/) = D[5(/)] =
= j(x-n^{t)2p^(x\t)dx9 teT.
тогда £(/) и Т|(/) — стохастически
эквивалентные процессы. Все конечномерные
распределения стохастически эквивалентных
процессов совпадают. При этом
стохастическая эквивалентность не означает
тождественности процессов, так как их реализации
могут в общем случае различаться, если / —
непрерывное время.
Если я-мерная функция распределения
Ft допускает представление вида
Из неравенства Чебышева следует, что
для любого е > О
P[\W)-^(t)\>t]<e-2I\(t),teT.
Таким образом, m^(t) можно
трактовать как некоторую «среднюю траекторию»
процесса £(/), около которой группируются
его реализации. При этом дисперсия D^(t)
характеризует степень разброса реализаций
процесса £(/) относительно m^(t).
Из общих свойств математического
ожидания следует:
^ (/) = м [($</)-^ (/))2 ] =
= м[$2 (о]-«£(/).
Ковариационной функцией скалярного
процесса £(/) называют неслучайную
функцию (последовательность) двух аргументов /,
теГ,
х{ хп
)= J $ Р$(Щ,-,ип> tl,...,t„)dul...du„i
то функцию р^(х\ у...,хп; t\ ,...,/„) называют я-мерной плотностью распределения процесса % .
Комплекснозначную функцию переменных Х\,...,Хп из R
Ч^(Х, ,...Д/7; /,,...,/„) = J ...J exp\-i^XjUj \р^(щ ,...,*/„; tli...,tn)dul...dun,
где / = -1 , называют я-мерной характеристической функцией процесса Е .
694
Глава 20.1. ОСНОВНЫЕ ПОНЯТИЯ
^^т) = м[(^(/)-^(/))(^(т)-ш^(т))] = соу(^)Д(т)) =
= J j(x\ -л%(0)(*2 ""Ч (*))#; (*i х2; U i)dxxdx2.
Функцией вторых начальных моментов
скалярного процесса £(0 называют
Г6(/, т) = МК(/)£(т)]=^(/,т) +
Если сечения %(t) являются
случайными величинами дискретного типа, то
интегралы в определениях fn^(t), D^(t) и R^(t, т)
заменяются на соответствующие суммы.
Пусть D^(t)>0 для всех teT.
Детерминированную функцию
r\{t, т) =
^(', т)
^(/)/^(т)
называют корреляционной функцией
(нормированной ковариационной) процесса %(t), она
характеризует степень линейной зависимости
сечений процесса £ в точках t и т . В
частности, если U (/, т) = 1 , то £(т) = 0^(0 + £
для некоторых а, Ь е R . Если же
/£(/, т) = 0, то сечения £(0 и £(т) - ие-
коррелированные (или ортогональные).
Процесс £(0 называют процессом
второго порядка (гильбертовым процессом), если
М £2 (0 < °° ПРИ всех teT . Всякий
гильбертов процесс имеет конечные среднее и
дисперсию, так как ml(t) + I\(t) = М|£2(Ш-
Функции D^(t) и R^(t, т) обладают
следующими свойствами:
1) I\(t) = Rt.{t,t),teT;
2) l\(t)>0, teT;
3) |^(*,ф(^(/)^(т))'/2,*,те7'
(неравенство Коши-Буняковского-Шварца);
4) /^(/, т) = /^(т, /), /, те Г;
5) функция /^ (t, т) является
неотрицательно определенной:
£ ^y^(/f.,/y)^0
для любых п > 1 , действительных чисел
{А,, ,...ДЛ} и {/|,...,/Л}, где tkeT,
Предположим, что процесс Г|(0
получен из £(/) линейным преобразованием
где \|/(/), ф(0 - неслучайные функции. Тогда
/1^(0 = ^(0^(0 + 9(0;
Д,(0 = ¥2(0^(0;
*n(M) = V(0¥(t)^(M).
Пусть ^(0 и Г|(0 - скалярные
гильбертовы процессы, а /7^ (х, у; t, х) -
плотность распределения случайного вектора
{£(0> Л(0} > образованного сечениями
процессов £ и Т| в точках соответственно
/, т.
Взаимной ковариационной функцией
процессов £(0 и Т|(0 называют неслучайную
функцию (последовательность) двух аргументов
^л(/>т) = м[(^(0-^(/))(л(х)-тп(х))] =
= J J(x-ff^(0)(^-/«n(t))^(x, j>; /, х) dxdy.
ПРИМЕРЫ СЛУЧАЙНЫХ ПРОЦЕССОВ
695
Пусть теперь £(0 — л-мерный процесс
с компонентами {£] (t),...,%n (/)}, teT,
причем {£/ (/),/ = 1,...,п) — гильбертовы
процессы.
Математическим ожиданием процесса
£(/) называют векторную неслучайную
функцию m^(t) = {ml (t),...,mn (t)}T, где
/М0 = М[5/(/)].
Ковариационной функцией процесса
называют матричную неслучайную функцию двух
аргументов R^ (t, т) = {Ry (t, т)}, где
Ry(t, T)=COV(^(0, ^(Т)) = ^.(/, Т),
/, у = 1 /f-
Матричную функцию D^(t) = R^(t, t)
называют дисперсионной функцией векторного
процесса £(0 •
Матричной функцией вторых начальных
моментов процесса %{t) называют
+л^(/)т[(т).
Случайный процесс ^(t) называют
центрированным, если ш^ (/) = 0, teT.
20.1.4. Примеры случайных
процессов. Белый шум. Случайную
последовательность £(/), /eZ независимых случайных
величин называют дискретным белым шумом.
Если М£ (/) < оо, то ковариационная
последовательность белого шума имеет вид
R^(t,z) = I\(t)b], t,xeZ,
где 8f — символ Кронекера (Sj = I при
/ = т и 8J = 0 при t*%), Д(/)
—дисперсия белого шума. Если /X (t) = 1 , то белый
шум называют стандартным.
По аналогии с дискретным белым
шумом вводится непрерывный белый шум
£(/), teT , ковариационная функция
которого является обобщенной функцией и имеет
вид /^(/, т) = v(/)5(/-t), где v(/) -
неотрицательная вещественная функция,
называемая интенсивностью белого шума, а 5(х) —
дельта-функция Дирака (см. разд. 16).
Сечениями «-мерного белого шума £(/)
являются независимые случайные векторы, а
{I\(t), teZ) и {v(t),teT}, являются
неотрицательно определенными
симметрическими матрицами.
Часто требование независимости
сечений белого шума ослабляется до требования
их некоррелированности. В этом случае £,(t) —
белый шум в широком смысле.
Канонический процесс. Случайный
процесс £(/) задан в каноническом виде, если
при каждом teT
5(0 = фо(0 + Х^фПО,
k=i
где {ф£ (t)} — неслучайные координатные
функции, a {Vk} — центрированный
дискретный белый шум с конечной дисперсией.
В выражении для £(0 сходимость ряда со
случайными членами понимается в средне-
квадратическом смысле:
Указанный предел существует, если
^(0 = Х/,*ч£ (')<00'
где^=м[к,2].
Моментные характеристики процесса
£(0 имеют вид
"^(0 = <Po(0, /^(>, т) =
*=1
Гауссовский (нормальный) процесс.
Случайный процесс %(t) называют гауссовским
или нормальным, если все его конечномерные
распределения являются многомерными гаус-
совскими.
Характеристическая функция &-мерного
распределения гауссовского процесса имеет
вид
696
Глава 20.2. АНАЛИЗ И ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ
ЧЗД,..., Хк ;/,,..., /*) = М
ехр
к
i^K
j=\
Y|
7$<'у>
/J
= ехр
к к
/X^^(0)-iZZ^^/^y)^^
У=1
/=1 у=1
где А,|,...Д^ — произвольные
вещественные числа, /i, ..., tk e T, m^{t) = М[£(/)],
^(/, t) = cov (£(/), 5(х)).
Из выражения для ^-мерной
характеристической функции гауссовского процесса
£(/) следует, что все его конечномерные
законы распределения определяются заданием
только fn^(t) и /^(/,т). Таким образом,
для исчерпывающего описания гауссовского
процесса достаточно задать его двумерный
закон распределения /^ (х\ , х2 ; /i, /2 ) •
Любое сечение гауссовского процесса
имеет характеристическую функцию
N
Л(0 = l.i.m. У *(/, т)£(т),
тогда последовательность Т|(/) называют
среднеквадратпическим линейным
преобразованием (с.^-преобразованием) £(/), t e Z :
чс)= £*(/,t)^(t).
{#('> т)} — весовая последовательность
линейного преобразования.
Моментные характеристики Г|(/) имеют
вид:
Ч'5(Я.;/) = ехр(Г|Ал%(/)-^2/\(/)| /^(0= £ *('' ТИ<Т)'
Если же дисперсия сечения /X (/) > 0 ,
то распределение этого сечения имеет
плотность
^2^
Р^(х; /)
1
у1ЩЦ)
ехр
V
Гауссовские процессы имеют особое
прикладное значение, так как многие
реальные процессы, встречающиеся на практике, с
высокой степенью точности могут считаться
гауссовскими.
Глава 20.2
АНАЛИЗ И ПРЕОБРАЗОВАНИЯ
СЛУЧАЙНЫХ ПРОЦЕССОВ
20.2.1. Линейное преобразование
последовательности. Пусть Т = Z = {О, ±1,
±2,...} , а £(/), /е Z — скалярная случайная
последовательность второго порядка.
Рассмотрим неслучайную последовательность
{g(t> т), /,те Z. Пусть при каждом te Ъ
существует средиеквадратический предел
Сходимость рядов в выражениях для m~(t) и
R^ (/, т) необходима и достаточна для
существования Т|(0 •
Если £(/) — гауссовская
последовательность, то Т|(/) также будет гауссовским
процессом.
20.2.2. Непрерывность случайной
функции. Пусть Т = (-оо,оо), а £(/) -
гильбертова случайная функция, заданная на 71
Фун*щию £(/) называют непрерывной в сред-
неквадратическом смысле (с. к.-непрерывной) в
точке / е T , если
1л.т.«т) = «0,
m[(£(t)-S(/))2]-*0 при
т->/.
Для с.к.-непрерывности £(/) в точке
to e T необходимо и достаточно, чтобы
ИНТЕГРИРОВАНИЕ СЛУЧАЙНОЙ ФУНКЦИИ
697
tffc (t) было непрерывно в точке /q , a
R^(t,i) — непрерывна в точке (fy »*())•
Функция £(/) с.к.-непрерывна на Т, если она
непрерывна в каждой точке т е Т .
Из с.к.-непрерывности £(/) не следует
непрерывность всех или почти всех ее
выборочных траекторий.
Случайную функцию называют
непрерывной на Т, если
Р[со: ^(/,со) - непрерывная на Тфункция] = 1,
т.е. почти все выборочные траектории £(/) —
непрерывные неслучайные функции.
Пусть £(/) задана на Т = [а, Ь]. Если
существуют положительные константы К, ос,
Р, такие, что для всех /, те Т,
М
[|^)-^(т)|а]</:|/-т|1+р,
то существует непрерывная случайная
функция 4(0 , стохастически эквивалентная £(/).
В этом случае говорят, что £(0 имеет
непрерывную модификацию. Обычно на практике
всегда вместо £(0 используют ее
непрерывную модификацию 4(0 , если последняя
существует.
Для «-мерной функции £(/) понятие
непрерывности вводится покомпонентно.
Если %(t) = {%i(t),...,%„(t)}T - с.к.-
непрерывна (непрерывна), а {ф^ (/)} —
неслучайные непрерывные функции, то
/7
Т|(0 = V ф£ (0£* (О также с.к.-непрерывна
к=[
(непрерывна).
20.2.3. Дифференцирование
случайной функции. Случайную величину 4('о)
называют etc.-производной функции £(/) в
точке /0 е Т, если
Л->о h
Если 4(*Ь) существует, то £(0 с.к.-
дифференцируема в точке /q . Функция £(/)
дифференцируема на Т = (я, Ь), если она
дифференцируема в каждой точке /q е T.
Критерий с.к.-дифференцируемости. Для
того чтобы £(0 была с.к.-дифференцируемой
в точке /0 е Т, необходимо, чтобы
существовали производные
Ляс
»Ч^ = ИГ "*<'.*>- э,Эт
при / = т = /0 ,
и достаточно, чтобы эти производные были
непрерывны в точках соответственно /0 и
(А) >'<>)•
Если условия критерия выполнены, то
М[4(/)] = /!%(/), a cov(4(/),4(x)) =
= Ri(t, т), где /ffe(f) и /fc(f, т)
определены выше.
Операция с.к.-дифференцирования
обладает важными свойствами:
1) если £(/) с.к.-дифференцируема, то
она с.к.-непрерывна;
2) пусть г|(0 = Ха^^ (0 > гДе iak ) ~
k=i
числа, а {^ (/)} — с.к.-дифференцируемые
п
функции, тогда f|(/) = ]£ 0^4* (t);
k=\
3) если £(0 с.к.-дифференцируема,
ф(0 — неслучайная дифференцируемая
функция, а Т](0 = ф(0£(0, тогда
л(0 = ^г^(0 + Ф<0£<0;
at
4) если %{t) — гауссовская функция, то
4(0 также гауссовская;
5) если 4(О = 0(Р-п.н.), то $(/) =
= с(Р-п.н.), (символ (Р-п.н.) означает, что
свойство выполнено почти наверное, т.е. с
вероятностью 1).
Из с.к.-дифференцируемости £(0 на Т
не следует в общем случае ее потраекторная
дифференцируемость.
Если £(/) - «-мерная функция, то ее
дифференцируют покомпонентно.
20.2.4. Интегрирование случайной
функции. Пусть А = [А,ЧсГ,а
неслучайная функция g(t, x) определена при всех
698
Глава 20.2. АНАЛИЗ И ПРЕОБРАЗОВАНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ
te T и те А. Выберем произвольную точку
t e T , некоторое разбиение отрезка А
точками {tk):a = t0<t{< ... < tn_{ <tn=b и
рассмотрим интегральную сумму
А. С) = £*(', 4K(4)(tk-tk_{),
где точки Тк е [tk_\ > tk ] выбираются
произвольно.
Пусть существует Т|(/) = l.i.m./w (t),
когда л —> оо таким образом, что
max |/£ -/jfc_i| —» 0, причем предел Т|(/) не
зависит от способов разбиения А на
подынтервалы и выбора точек {т^ }. Тогда
случайную функцию Т|(/) называют среднеквадра-
тическим интегральным преобразованием ^(t)
с весовой функцией g(t, т) (с.к.-
интегралом) и обозначают
Ь
4(t) = jg(t,T)Z>(x)dr,teT.
а
Для существования Т|(0 (т.е. для с.к.-
интегрируемости £(0 с весом g(t, т))
необходимо и достаточно, чтобы существовали
интегралы
Ь
<l(t) = jg(t, x)m^(x)dx и
а
Ь Ь
G(/t,T) = JJg(r,T1)g(T,T2)/^(T1, x2)dx{dx2.
а а
При этом mr](t) = q(t) и R^ (>,т) = Q(t,x).
Случайную функцию £(0 называют
с.к.-интегрируемой на [я, Ь], если существует
b
т|=£(т)*/т. Условия с.к.-интегрируемости
а
совпадают с условиями существования
интегрального преобразования с g(t, т) = 1 при
всех te T, те А.
Всякая с.к.-непрерывная на конечном
интервале А функция £(/)
с.к.-интегрируема на А .
Интегрирование векторной функции
£(/) осуществляется покомпонентно.
Для с.к.-интеграла справедливы многие
свойства обычного интеграла от неслучайной
функции:
1) линейность интеграла:
Ь п п Ь
)^ak$k(t)dt = ^akj$k(t)dt,
,*=!
k=\
где {(Х£} - неслучайные коэффициенты, а
{£* (0} ~ с.к.-интегрируемы на [а,Ь];
2) формула интегрирования по частям:
t
j5(t)rf9(x) = 9(0«0-9(/o)^)-
-Jq>(T)4(T)rfx,
'о
где ф(т) — непрерывно дифференцируемая
неслучайная функция, a £(f) - случайная
функция, имеющая непрерывную с.к.-произ-
водную;
3) правило дифференцирования по
верхнему пределу:
, t
i](t) = ^j^(x)dx = ^t) (Р-п.н.),
'о
где £(/) — с.к.-непрерьшная случайная
функция.
Среднеквадратическое интефальное
преобразование гауссовской случайной функции
также является гауссовской функцией.
20.2.5. Линейные дифференциальные
уравнения. Пусть я-мерная случайная
функция £(/) описывается системой линейных
дифференциальных (в с.к.-смысле) уравнений
первого порядка
4(0 = a(t)W) + b(tMt) + c{t), Wo) = So ,
где £о — случайный вектор начальных
условий, М М£о| < °°; Л(0 -с.к.-непрерывная
fc-мерная случайная функция; a(t), b(t) и
c(t) — неслучайные матричные функции
соответствующих размеров с кусочно-
непрерывными компонентами.
Рассмотрим матричную функцию 0(/),
удовлетворяющую системе обыкновенных
дифференциальных уравнений
СПЕКТРАЛЬНЫЕ ХАРАКТЕРИСТИКИ
699
е(/) = *(ое(0, е(/0) = /.
Тогда с.к.-интеграл (с.к.-решение) £(0
системы дифференциальных уравнений со
случайной правой частью и случайными
начальными условиями в любой точке / > /0 имеет вид
W) = g(t,t0K0 + j g(t, T)b(T)X)(T)dT +
'О
t
+ jg(t,x)c(z)dT,
'o
a-i.
где g(t, t) = 0(00 (т) - матричная
весовая функция исходной системы
дифференциальных уравнений.
Если £о и Т|(0 образуют гауссовскую
систему, т.е. £0 и любой набор сечений
процесса Т)(0 образуют гауссовский случайный
вектор, то решение ^(0 будет гауссовской
случайной функцией. В частности, это верно,
если £о — неслучайный вектор или же имеет
гауссовское распределение и не зависит от
гауссовского процесса Т|(0 •
Среднее значение m^(t) процесса £(0
удовлетворяет системе уравнений
т^ (0 = a(t)mk (/) + b(t)m^ (/) + c(t)9
а дисперсионная функция D^ (/) = М[(£(0 -
-л^(0)(5(0-^(0) имеет вид
%(t) = g(t,t0)R0gT(t9tb) +
t t
+ J J*C. ^(t)^(V)^(5)/(/, s)dxds,
'o'O
где m0=M[£)0], Rq = cov(£0 Ло )> £o и
t|(0 — независимы.
Если Т|(0 — белый шум с
интенсивностью v(0 , т.е. /^ (т, s) = v(t)8(t - s), то
I\ (0 = a(t) %(t) + I\ (t)aT (0 + b(t)v(t)bT (0,
Глава 20.3
СТАЦИОНАРНЫЕ
СЛУЧАЙНЫЕ ПРОЦЕССЫ
20.3.1. Основные определения. Пусть
скалярный случайный процесс %(t) задан на
7, = (-оо,оо) или r = Z = {0,±l,±2,...}.
Случайный процесс второго порядка
£(0 называют стационарным (в широком
смысле), если для всех t, s e T выполнено:
1) /и^(0 = /И£ = const;
2) ^(f, s) = k^t-s).
Функцию /Ср(т), те 71 называют
ковариационной функцией стационарного процесса
£(0 , она обладает следующими основными
свойствами:
1) к$(0) = 1\ = const;
2) \к$ (т)| < к^ (0) для любого т е 71;
3) ^ (т) = к^ (-т) для любого т е 71;
4) для любого п > 1 , произвольных
действительных чисел {A,j,...,Xrt} и любых из
Сь-Л} из Г
(свойство неотрицательной определенности
функции А^(0)-
Стационарная случайная функция £(0
с.к.-непрерывна, если ^(т) непрерывна в
Э2^(т)
Эх2
нуле, с.к.-дифференцируема, если
также непрерывна в нуле и с.к.-интегрируема
на любом конечном промежутке А , если
\\k^(t-s)dtds<
дд
^(>о) = Д).
20.3.2. Спектральные
характеристики. Пусть Т = Ъ , а ковариационная
последовательность fo(x) абсолютно суммируема,
т.е. V \к^ (т)| < оо , тогда
700
Глава 20.3. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
к^(х) = I s^(X)cosXxdX,
где
1 °°
s^(X) =—V ^(t)cosA,t, Kg [-к, к].
Функцию s,(X) называют спектральной
плотностью стационарной последовательности £(/).
Пусть теперь Г = (-«>,©о), а £(/) -
с.к.-непрерывная на Т стационарная
случайная функция. В этом случае к^(т) —
непрерывна на Т. Пусть также она абсолютно
интегрируема, т.е. | \к^ (т)и/т < ©о, тогда
к^(х) = | s^(X)cosXxdX,
где
s^(X) =— f ^(t)cosA,t*/t, Хе Ш[
Функцию s^(X) называют спектральной
плотностью стационарной функции £(/).
Соотношения, связывающие к^(х) и
л (А,), называют формулами Винера-Хитина.
Из определения .ft (А,) и формул Винера—
Хинчина следует:
1) ^(Х)>0 при любом X е R
(неотрицательность);
2) 5^ (X) = s^ (-Х) (четность);
о
3) 1\ = \ s^ (X)dX , где а = к для дис-
-а
кретного Ти а = оо для непрерывного Т.
Стационарные скалярные случайные
процессы £(/) и Т|(0> t^T, называют
стационарно связанными, если их взаимная
ковариационная функция R^ (/, s)
удовлетворяет условию
R^ (/, s) = к^ (t - s) при любых t,s e T.
Комплексная функция
sfy\W =
— V к^ (т)е~' т (дискретное время),
2л
1
— f А:^л (x)e~iXxdx (непрерывное время),
называется взаимной спектральной
плотностью стационарно связанных процессов £(/)
и л(>).
Пусть $(/) = ft (/),..-,$„ (О}7", где
компоненты ft/(0} _ стационарные и
стационарно связанные случайные процессы.
Тогда £(/) называют векторным (п-мерным)
стационарным процессом. Его матричная
ковариационная функция А^(т) имеет вид
K^) = {kij(x)}jJ = \1...,n,
где ки (т) = *£. (т), а *,у (т) = к^. (т) при
/ * у.
Обобщением понятия спектральной
плотности для векторного случая является
спектральная матрица Si(k) = lsy(k)\, где
sii (*•) = ^ W ' а SU М = S№j М ПРИ ' ф J •
Матрицы AV(t) и &(А,) связаны
соотношениями Винера—Хинчина
(покомпонентно).
Спектральная матрица &(Х) обладает
свойствами:
1) S^(X) = S((X);
2) S^(-X) = Sl(X);
3) a S^(X)a>0 для любого
комплексного вектора а (неотрицательная
определенность);
ПРИМЕРЫ СТАЦИОНАРНЫХ ПРОЦЕССОВ
701
4) ковариационная матрица ZX =
= А^(0) сечения £(т) процесса £(/) в
точке т е Т имеет вид
4= = l%(X)dk,
где а = п для дискретного времени, и а = °° —
для непрерывного.
Математическое ожидание пи и
спектральная матрица S^ (X) достаточны для
полного описания гауссовского
стационарного процесса.
20.3.3. Линейные преобразования.
Пусть задана некоторая вещественная
функция #(т), те Т, дискретного или
непрерывного времени. Предположим, что g(x)
абсолютно суммируема (для дискретного т ) или
абсолютно интегрируема (для непрерывного
т ). Функцию g(x) будем называть весовой
функцией линейного стационарного
преобразования.
Пусть Я(Х) — комплекснозначная
функция, определяемая соотношениями
Я(Х) =
V g(x)e ' т (дискретное время),
Х=-оо
I g(i)e~' *dx (непрерывное время).
Функцию Н(Х) называют частотной
характеристикой линейного преобразования с
весовой функцией g(x).
Случайный процесс Г)(г) называют
стационарным линейным преобразованием
процесса £(/), если он является результатом
линейного с.к.-преобразования следующего
вида:
п(0 =
/t g{i)^{t-i) (дискретное время),
Т=-оо
g(i)^(t -x)dx (непрерывное время).
ется стационарным, а его моментные
характеристики можно определить по общим
соотношениям (см. пп. 20.2.1 и 20.2.4).
Если £(/) имеет спектральную
плотность 5^(А,), то процесс Т|(/) также имеет
спектральную плотность 5„ (X), причем
5„(Х) = |Я(Х)|2^(\);
где А,е[-я, к] для случайной
последовательности и X е R для случайной функции.
В случае когда £(/) - «-мерный
стационарный процесс со спектральной
матрицей S^(X), a g(x) — матричная неслучайная
функция размера (1хп) с абсолютно
суммируемыми компонентами, то спектральную
матрицу ^(А,) процесса Г|(г) вычисляют по
формуле
Если £(/) - стационарный процесс, то
г|(/) в принятых условиях существует, явля-
где Н(Х) — комплекснозначная матрица
размера (/хя), вычисленная по
приведенным выше формулам, где суммирование и
интегрирование производятся покомпонентно.
Если преобразуемый процесс £(/)
является гауссовским, то для полного
вероятностного описания результата его преобразования
г|(/) достаточно знать т^ и 5^ (А,), так как
Т|(/) также является гауссовским в силу
линейности преобразования.
20.3.4. Примеры стационарных
процессов. Стационарный белый шум.
Последовательность некоррелированных случайных
величин {У(п)} с одинаковыми средними
значениями и дисперсиями называют
стационарным дискретным белым шумом. Если Dy =
= D[K(#i)],to
Sy =—-, А, 6 [-71, Л],
2я
т.е. спектральная плотность дискретного
белого шума постоянна на [-я, п].
Случайная функция V(t), te R , с
постоянным средним ту и ковариационной
функцией Ry (/, т) = v5(/ - т), v = const > 0,
называется стационарным непрерывным белым
702
Глава 20.3. СТАЦИОНАРНЫЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
шумом с интенсивностью v . В этом случае
— = const, Хе R1
In
Если Dy = 1 или v = 1 , то
соответствующие стационарные белые шумы называют
стандартными.
Процесс авторегрессии-скользящего
среднего (АРСС). Рассмотрим разностное
стохастическое уравнение, называемое уравнением
авторегрессии-скользящего среднего (АРСС-
уравнением) порядка (р, q):
Р Я
т=0 k=0
где v(n) — стационарный дискретный белый
шум со средним mv и дисперсией Dv; \ат }
и {bk } — неслучайные вещественные
параметры, такие, что все корни алгебраических
уравнений
а0хр +щхр~] +... + ар = 0 и
bQXq +b)Xq-* +... + bq = 0
лежат внутри круга единичного радиуса с
центром в начале координат, а$ Ф 0 . В этом
случае найдется стационарная случайная
последовательность £(я), яе Z,
удовлетворяющая АРСС-уравнению, называемая АРСС-
процессом порядка (p,q). Параметры
процесса £(0 имеют вид
АРСС-процессы и их модификации
активно используются при построении моделей
экономических, биологических и химических
процессов.
Процесс с полосовым спектром.
Стационарный процесс £(/) имеет полосовой
спектр, если его спектральная плотность
отлична от нуля, только если \Х\ е [\\, А,2] для
некоторых значений Х2 > Х\ > 0 :
(
v-l
пи -=
т=0
^ 2п
Ю ) *=0
Я
V bkbt cosX(l - к)
я
I
к, 1=0
]Г amaj cosX( j-m)
mj=0
В частности, если p = \9q = 0,aQ=bo=\,
то мы получаем процес
порядка £(я) + я£(а
\а < 1. В этом случае
/1 ч _ J^0 > 0, если A<! < \Х\ < Х2
5^ '"in
1^, во всех остальных случаях.
Ковариационная функция процесса
£(f) определяется формулой
M,)=i^sin^Tjcos^tJ
Если £,(t) — случайная функция,
Х| = 0 , Х2 = Л > 0 , то
2s
кр(ъ) =——sin At ,
ъ т
a s^ (X) - Sq при |Х| < Л . Для случая
Л»1 £(/) используют на практике как
аппроксимацию для стационарного
непрерывного белого шума.
Процесс с экспоненциально-гармонической
ковариационной функцией. Случайная функция
данного типа имеет ковариационную
функцию
^(т) = De~a™ (cos(0ox + у sin coo |т|),
где Z), а, («о - произвольные
неотрицательные параметры, а Ы < .
1 Щ
Соответствующая спектральная
плотность имеет вид
Dlia + ywoW2 +(а-ущ)Х2]
л[р4 +2(а2 -а)2Д2+Х4]
то мы получаем процесс авторегрессии первого
порядка £(я) + а^(п - 1) = v(n), причем
2 _ ,.Л2 , „2
где Р = cojj + а
В частности, если kt(x) = De '', то
«н
s^(X) =
Dv
2п(\ +а2 +2acosX)
%М-
Da
п(а2 + А2)
Центрированный гаус-
МАРКОВСКОЕ СВОЙСТВО ПРОЦЕССА
703
совский процесс с такими характеристиками
называют процессом Орнстейна — Уленбека.
Ковариационная функция любой
стационарной функции может быть сколь угодно
точно аппроксимирована линейной
комбинацией функций
экспоненциально-гармонического типа с различными значениями
параметров Z), а, а\) и у.
s,teT.
Если для переходной функции
справедливо представление
I\(s, х, t, B) = jp^(s, x, t, y)dy,
Глава 20.4
МАРКОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
20.4.1. Марковское свойство
процесса. Скалярный случайный процесс £(/),
t e Т = [0, ©о), называют марковским
процессом (процессом Маркова), если для
произвольного к > 1, любых // е Г : /| < 12 < ... <
<t/c_y </£,/ = l,...,£ и произвольного бо-
релевского множества В на действительной
оси R выполнено
Р[«/4)бБ|у/,) = Ч «/ы) = хы] =
где X/ — любые допустимые значения
случайной величины (сечения) £,0\), / = 1,...,
А; -1 . Описанное свойство марковского
процесса называется марковским свойством.
Марковское свойство процесса означает,
что условное распределение сечения £(г^)
при заданном сечении £(/jt_i) = х^_\ , где
h-\ < h » не зависит от того, каким образом
процесс £(/) попал в состояние xk_i.
Фактически это означает, что «будущее»
марковского процесса при фиксированном
«настоящем» не зависит от «прошлого»: если
s < и < t, то
r[%(s)eBi\%{u)]r[%(t)eB2\%(u)]
для любых борелевских множеств В\ и В2.
Пусть s <t, xe R , В — произвольное
борелевское множество. Переходной
вероятностью марковского процесса называют
функцию
то функция p$(s, х, г, у) называется
переходной плотностью вероятности.
Марковский процесс называется
однородным, если для произвольных s < t
I\(s, x, t, B) = I\(0, x, t-s, В). В этом
случае обычно обозначают Р^ (0, х, т, В)
через i^(x, т, В) для краткости.
Соответствующая переходная плотность обозначается
#:(*, Т, В).
Все конечномерные распределения
марковского процесса выражаются через
переходную вероятность (плотность) и
распределение я*(0) начального значения процесса
£(0). Например, если существует p^(s, x,
^), а Р$(х) — плотность распределения
сечения £(0), то «-мерная плотность
распределения процесса £(г) имеет вид
Р$(х{,...,хп; t[9...,tn) =
)Pt3(x0)dx0'.
-«,//1=1
Наличие марковского свойства у гаус-
совского процесса проверяется достаточно
просто: центрированный гауссовский процесс
£(/) с положительной дисперсией D^(t) > 0
является марковским тогда и только тогда,
когда для любых tу < 12 < Ц из Т выполнено
ед,'з) =
%(t2,t2)
В частности, процесс Орнстейна —
Уленбека является марковским, так как его
ковариационная функция B^(t, %) = De ™ \
D > 0 , удовлетворяет приведенному выше
требованию.
704
Глава 20.4. МАРКОВСКИЕ СЛУЧАЙНЫЕ ПРОЦЕССЫ
20.4.2. Дискретные цепи Маркова.
Случайная последовательность £(/), teT =
= {0,1,2,...} называется дискретной цепью
Маркова, если:
1) при каждом teT£,(t) — случайная
величина дискретного типа с конечным
или счетным множеством значений Е =
= (0,1,2,...};
2) £(0 обладает марковским свойством.
Цепь Маркова называется конечной, если
множество Е содержит конечное число
значений. Элементы Е называются состояниями
цепи Маркова. Далее рассмотрены конечные
дискретные цепи Маркова £(/).
Величина
л.у (О = р[Ч(0 = у !$<'-!) = *]
называется вероятностью перехода из
состояния к в состояние j за один шаг. Матрица
P(t) = {Pkj (0} , к, j e E , называется
переходной матрицей цепи £(/), f G T .
Вероятностью к-го состояния цепи в
момент / называется величина
а соответствующий неотрицательный вектор
т
и(0 = {ло(/),Я| (0> — >ni(0} называется
распределением вероятностей состояний цепи
£(/) в момент t еТ .
Для любого конечного t выполнено
условие нормировки:
*=0
Векторы я(/) и я(г-1)при любом г>1
связаны соотношением
n(t) = PT(t)n(t-l).
Отсюда следует, что распределение n(t)
в любой момент времени полностью
определяется начальным распределением
вероятностей я(0) и переходными матрицами {Р(/)}:
71(/) =
/-1
црти-к)
*=0
71(0), /е7\
Если £(/) — однородная марковская цепь,
то Р(г) = /* для любого t е Т . В этом
случае n(t) = (РТ У к(0).
20.4.3. Эргодические цепи Маркова.
Пусть £(г) - однородная конечная цепь
Маркова с множеством состояний Е.
Переходной вероятностью за г > 1 шагов
называется величина
4°у = Р|>(') = У |$(0) = *].
Состояние цепи к называется
несущественным, если найдутся состояние j e E и
целое N > 0, такие, что р^ . > 0, но
/*; I = 0 ПРИ любом t > 1 . Все остальные
состояния — существенные.
Состояния к и j называются
сообщающимися, если существуют целые числа п > 0
и m > 0 , такие, что /^ > 0 и pW > 0 .
Состояние j е Е называется
периодическим с периодом rij, если возвращение в j
возможно лишь за число шагов, кратное
п.- > 1 , причем п: — наибольшее целое
число, удовлетворяющее этому требованию. Если
п: = 1 , то состояние называется
апериодическим.
Состояния всякой однородной конечной
цепи Маркова можно разбить на
непересекающиеся классы состояний Е = Eq U
(J E\ (J-..[) Efr , причем Eq содержит все
несущественные состояния, состояния из
любого класса Е: — существенные и
сообщающиеся для j > 1 , а состояния из классов
Ej и Ei не сообщаются, если
Цепь Маркова называется неразложимой,
если все состояния образуют один класс
существенных сообщающихся состояний (т.е.
Е = Е[). Неразложимая цепь называется
апериодической, если хотя бы одно состояние
является апериодическим (при этом
оказывается, что все прочие состояния также
апериодические).
Рассмотрим поведение распределения
вероятностей состояний n(t) при t -»©°.
Т
Вектор п* - <71q ,.--,Я£ | называется
финальным распределением цепи £(/) при
заданном тс(0), если lim n(t) = п*.
t—»оо
МАРКОВСКИЕ СЛУЧАЙНЫЕ ФУНКЦИИ
705
Если тс* не зависит от тс(0), то тс*
называется стационарным распределением цепи, а
сама цепь ^(/) — эргодической цепью Маркова.
Теорема. Для того чтобы конечная
однородная цепь Маркова была эргодической,
необходимо и достаточно, чтобы она была
неразложимой и апериодической. При этом вектор
я > 0 имеет положительные компоненты и
является единственным решением системы
уравнений
L
к =рТп\ ]Г 4 =1.
*=0
Если цепь является периодической или
разложимой, то финальное распределение
либо вообще не существует, либо существует,
но зависит от начального распределения
вероятностей тс(0).
Если Е = Eq U Е\ , то стационарное
распределение тс* также существует, причем
тс* - 0 , если ie Eq, a. тс*- > 0 , если jе Е\.
Последнее объясняется тем, что класс Eq
несущественных состояний цепь с
вероятностью 1 покидает за конечное число шагов и
больше никогда в него не возвращается.
Вероятностью первого возвращения в
состояние j е Е за t шагов называется величина
fj(t) = P[%(t) = W-D* J,-,
№*j\%(Q) = j]-
Рассмотрим однородную цепь Маркова
со счетным множеством состояний Е. Для
того чтобы она была эргодической,
необходимо и достаточно, чтобы она была
неразложимой, апериодической и нашлось состояние
j е Е , такое, что сходится ряд
При этом вектор тс* = {тс*>, л*,...} имеет
положительные компоненты и является
единственным решением бесконечной системы
линейных алгебраических уравнений
тс* = РТп\ £4 =1.
*=0
20.4.4. Марковские случайные
функции. Пусть случайная функция £(/) задана
на Т = [0, ©о) 9 и при каждом t e T сечение
£(/) — дискретная случайная величина с
множеством значений Е = {0,\,...,L], где
L < ©о . Элементы множества Е — возможные
состояния процесса %(t).
Если £(/) описанного типа обладает
марковским свойством, то она называется
марковской случайной функцией с конечным
множеством состояний.
Вероятностью перехода из состояния
/ е Е в момент s е Т в состояние j e E в
момент t е Т, t > s , называется неслучайная
функция
pij(sJ) = F[W) = j\^s) = i],iJeE.
Функция А-(О = Р[£(О = 0» isE>
называется вероятностью состояния / в
момент t е Т .
Вероятности состояний и вероятности
перехода связаны уравнениями Колмогорова —
Чепмена:
L
Р/(О = £/>,/(*> t)pj(s), is E.
у=о
Пусть все вероятности перехода
{Pu(t9 и)} дифференцируемы по и
частным образом. Обозначим (при i * j)
dPjj(t,u)\
ыо=-
ди
При этом A,fy(f)^0
при /*у,а Хи(0 = -^Ху(0<0.
В силу того что рц (t, 0 = 1 » а
Pij (/, 0 = 0 ПРИ I! * j , ФУНКЦИЮ \jj (О
можно представить в виде
Pijjt.t + At)
4(0= lim
J д/io
А/
-, /*У-
Функция \у (/), / Ф j , называется
интенсивностью перехода процесса £(0 из состояния
i е Е в состояние j е Е в момент t еТ .
В любой момент времени t > О
вероятности состояний {Pi(t)} могут быть
определены из системы обыкновенных дифференци-
23 — 7706
706 Глава 20.5. СЛУЧАЙНЫЕ ПРОЦЕССЫ С НЕЗАВИСИМОЫМИ ПРИРАЩЕНИЯМИ
альных уравнений, называемых уравнениями
Колмогорова:
^=i£bji(t)pj(t),i*E,
dt у=о
которые решаются с начальными условиями
PiW = qiy /е E ,
где q{ = Р[£(0) = /], / е Е . Числа qt > 0
удовлетворяют условию нормировки
L
^Qi = 1 • Вектор q = {qo,...,qL}T задает
/=0
начальное распределение вероятностей
состояний процесса %(t) (т.е. в момент t = 0 ).
Марковская функция £,(t) называется
однородной, если Ху (t) = Ху = const при
всех /, j e E, t е T . Пусть также каждое
состояние / е Е достижимо из любого
другого состояния j e E. В этом случае £(/)
обладает эргодическим свойством: вероятности
состояний {pi(t)} имеют предельные
значения
р* = limp, (0, /е Е ,
причем {/?,*} не зависят от начального
распределения q и являются единственным
решением системы алгебраических уравнений
L L
^ХЛр* = 0, isE\ ]T/>* =1.
j=Q j=Q
Вероятности {/>,- } задают стационарное
распределение вероятностей состояний
марковского процесса.
20.4.5. Процесс рождения и гибели.
Марковскую однородную случайную
функцию £(0 с конечным множеством состояний
Е = {0,..., L} называют процессом рождения и
гибели, если интенсивности ее переходов
имеют вид
а) K-l,n =v/i >0> n = l,...,L;
б) К,п-\ = Ця > 0, я = 1,...,£;
в) все остальные интенсивности равны
нулю.
Числа {vw} называются интенсивно-
стями рождения, а числа {\in} — интенсивно-
стями гибели. Данная терминология
объясняется тем, что процесс £(0 указанного вида
описывает случайную динамику численности
некоторой популяции (£(0 — число членов
популяции в момент г > 0).
Процесс рождения и гибели является
эргодическим, а стационарное распределение
u * Г * * I
вероятностей его состоянии п = <щ ,..., я^ >
вычисляют аналитически по формулам:
А) =
1 + Yi +Y1Y2 +- + П7'"
/=1
1-1
Рп =УпРп-[> n = l,2,...,L,
где уп = — > О .
Видно, что итоговые вероятности
состояний зависят только от соотношения уп
между интенсивностями рождения и гибели.
Процессы рождения и гибели широко
используются в социологии, при
моделировании систем массового обслуживания и
исследовании задач надежности.
Глава 20.5
СЛУЧАЙНЫЕ ПРОЦЕССЫ
С НЕЗАВИСИМЫМИ ПРИРАЩЕНИЯМИ
20.5.1. Основные определения. Пусть
£(0 > teT = [0, 00), — вещественная
скалярная случайная функция с конечным
моментом второго порядка: Мк (/)<<».
Приращением £(г) на промежутке
[t,s)czT называется случайная величина
8(f, 5) = ^(5) -%(t).
Случайная функция £(г) называется
процессом с независимыми приращениями, если
для любых моментов 0 < t\ < ... < tn из Т,
п>\, случайные величины {£(0), 6(0, /| ),
8(4 ,*2 )»•••> b(tn_[,tn)} независимы в
совокупности.
ПУАССОНОВСКИЙ ПРОЦЕСС
707
Без ограничения общности можно
полагать, что £(f) выходит из нуля, т.е.
£(0) = 0 . Кроме того, далее всюду
предполагается, что £,(t) с.к.-непрерывна на Т.
Процесс £(f) называется однородным,
если для любых t, s > 0 закон распределения
приращения 6(f, t + s) зависит только от s
и, следовательно, совпадает с законом
распределения 5(0, s) = £(j) .
Предположим, что математическое
ожидание m^(t) и дисперсия £к (t) процесса
£(0 известны. Тогда имеют место
следующие основные свойства процесса £(f) и его
приращений:
1) m^{t) и D^(t) - непрерывные
функции;
2) D^(t) — неубывающая функция;
3)^(/,*) = cw(§(0,«j)) = ^(mn(/,5)),
т.е. дисперсия полностью определяет
ковариационную функцию;
4) для любых t, $>0 М[£($)-£(0] =
= n%(s) -m^{t),
Z)[^(5)-^(0] = ^(max(f, s))-
-I\(mm(t,s))\
5) cov (b(t, $), 6(^ , s{)) = 0 для
любых 0 < t < s <t\ < S\ , т.е. приращения
процесса £(0 на произвольных
непересекающихся промежутках ортогональны
(некоррелирован ы);
6) £(0 - марковская случайная
функция.
В случае когда £,(t) является также и
однородным, его моментные характеристики
имеют весьма простой вид:
1) m^(t) = at, Z^(0 = o2^, где о2 >0 -
интенсивность процесса £(f);
2) R^(t, s) = o2 min(f, s);
3) M[$(5)-«0] = *(J-0,
D[5($)-5(0]= о2!*-*! для любых >,$>0.
Если а = 0, о = 1, процесс £(f)
называется стандартным.
23*
20.5.2. Пуассоновский процесс. Пусть
{7], 72,...} — бесконечная
последовательность независимых случайных величин,
распределенных по показательному закону с
некоторым параметром X > 0 , т.е. Р[7^ < t] =
= l-e~Xt, t>0.
Предположим, что случайная
последовательность {Yn} такова, что Yq = 0, а для
п
« = 1,2,... выполнено Уд = уТк .
*=1
Процесс л(0> teT, определенный
условием
Л(0 = л, если ГЛ </<УЛ+1, « = 0,1,2,...,
называется однородным пуассоновским
процессом (процессом Пуассона) с интенсивностью
Х>0.
Смысл пуассоновского процесса состоит
в следующем: если {Vk} — случайные
события, следующие одно за другим через
случайные промежутки времени, причем событие
Vq появилось в момент t = 0, а Тк - длина
интервала времени между событиями Ук_\ и
Vfi, А; = 1,2,..., то Т|(/) — случайное число
событий, произошедших на промежутке
(О, t) , т.е. до момента времени t > 0 .
Из определения пуассоновского
процесса следует, что все его выборочные
траектории являются кусочно-постоянными
неубывающими функциями, возрастающими
скачком на единицу в моменты tk появления
событий Vk, A; = 1,2,... Таким образом,
пуассоновский процесс дает пример случайной
функции, которая является с.к.-непрерывной,
однако почти все ее траектории являются
разрывными функциями.
Процесс л(0 обладает следующими
основными свойствами:
О Л (О "* однородный процесс с
независимыми приращениями, выходящий из
нуля;
2) mr](t) = Dr](t) = Xt9 />0;
3) приращение b(t, s) = л(^) ~ Л(0
при любых 0 < t < s имеет распределение
Пуассона с параметром |Х = X(s - 0 :
708 Глава 20.5. СЛУЧАЙНЫЕ ПРОЦЕССЫ С НЕЗАВИСИМОЫМИ ПРИРАЩЕНИЯМИ
Р[л(5)-л(0 = *] = ^7е"ц,* = 0,1,2,...;
M[8(/,5)] = D[8(f,*)] = n = M*-0;
4) пуассоновский процесс является
марковской случайной функцией со счетным
множеством состояний £ = {0,1,2,...} и интен-
сивностями переходов Хц = -X, Ху = X при
j = i + 1 и Хуг = 0 в остальных случаях;
5) процесс л (О обладает свойством
ординарности:
Р[Л(' + А) - л(0 = 0] = 1 - ХИ + о(А);
Р [л(> + А) - л(0 = 1] = ХИ + о(А);
Р[л(Г + А)-л(0>1] = о(А),где А 4,0.
Значение последнего свойства состоит в
том, что на интервале малой длины А
процесс л(0 либо не изменяется, либо
совершает лишь один скачок (вероятностью наличия
двух скачков и более можно пренебречь).
Пуассоновский процесс используется
для математического моделирования
поведения сложных систем с отказами, систем
массового обслуживания, физических,
химических и социально-экономических процессов.
20.5.3. Винеровский процесс.
Случайная функция w(r), г > 0 называется винеров-
ским процессом, если
1) w(0) = 0, M[w(0] = 0;
2) w(t) — однородный процесс с
независимыми приращениями;
3) w(t) — гауссовский процесс.
Из определения w{t) и общих свойств
процессов с независимыми приращениями
следует:
1) любое сечение w{t) имеет гауссов-
ское распределение с нулевым средним и
2
дисперсией о t ;
2) любое приращение w(s) - w(t)
имеет гауссовское распределение с нулевым
средним и дисперсией а |/ - s|.
Число о > 0 называется
интенсивностью винеровского процесса. Если о = 1, то
винеровский процесс — стандартный.
Процесс w(t) обладает следующими
важнейшими свойствами:
1) w(t) - марковский процесс,
переходная плотность которого имеет вид
-1/2
/
p(s,x9t,y) = a [(2n\t-s\) exp
(У-хГ
2o2|/-s|
2) w(t) — непрерывная случайная
функция;
3) почти все выборочные траектории
винеровского процесса ни в одной точке
t > 0 не дифференцируемы;
4) с вероятностью 1 на любом конечном
промежутке [t9s]9s>t, траектории
винеровского процесса имеют неограниченную
вариацию;
5) процесс w(t) обладает свойством
симметрии:
p[w<0>o] = P[><o<o] = i
для любого t > 0;
если хх = inf {/: w(t) > x}, х > 0 -
случайный момент первого (по времени) достижения
траекторией w(t) произвольного уровня х,
то дальнейшее развитие процесса также
симметрично:
P[w(0 > х\хх < /] = P[w(0 < х\хх < г] = I;
6) если w(t) — стандартный
винеровский процесс, то тх имеет плотность
распределения (t > 0)
1/2
pTx(t) = x(2nt3)) exp
( 2\
XL '
а случайная величина Wt = sup w(s), т.е.
0<5</
максимум процесса на [0, t], имеет
плотность распределения
1/2 (
pWt{x) = 2(2Kt)-4 exp
х '
It
Структуру винеровского процесса
поясняет следующее утверждение: если
iVk (ОЬ ^ = 1,2,..., - произвольный орто-
нормированный базис в гильбертовом
пространстве ^[0,1] функций, интегрируемых
с квадратом на [0, 1], а {гк } - стандартный
гауссовский дискретный белый шум, тогда
НЕПРЕРЫВНЫЙ БЕЛЫЙ ШУМ
709
оо /
*(0 = £ел Гул(т)</т,/€[0, 1],
*=1 0
является стандартным винеровским
процессом на Т = [0, 1] (каноническое
представление для w(t)).
Винеровский процесс является
математической моделью случайного блуждания
точки по вещественной прямой, которое
известно в физике под названием броуновское
движение.
Если W{t) = {w{{t),...,wm(t)}T, где
wk (t) - стандартный винеровский процесс,
причем процессы wk (t) и Wj (t)
независимы при к * у, к, j = 1,...,m , тогда W(t)
называется m-мерным стандартным
винеровским процессом.
Практическое значение винеровского
процесса очень велико, так как он
используется для построения стохастического
интеграла, стохастических дифференциальных
уравнений и, вообще, для моделирования
поведения стохастических систем в пространстве
состояний.
20.5.4. Непрерывный белый шум.
Любой процесс с независимыми приращениями
£(/) ни в одной точке t > 0 не является
с.к.-дифференцируемым, так как -
dsdx
не существует при s = т = t и, следовательно,
не выполняется критерий с.к.-дифференци-
руемости процесса £(/). Однако можно
ввести понятие обобщенной с.к.-производной
случайной функции £(/) для случая, когда £(/) -
однородный процесс с независимыми
приращениями, т? (/) = 0.
Пусть ф(/) - произвольная финитная
бесконечное число раз дифференцируемая
функция. Тогда существует с.к.-предел
/w = IJnJ,w№Mrf,
/40 J h
о
Предел /(ф) обозначается \(p(t%(t)dt,
0
где ^(/) - обобщенная (слабая) с.к.-произ-
водная процесса ^(/). Если £(/) имеет
ковариационную функцию R?(t,s) =
= G min(f, s), то ковариационная функция
R± (t, т) должна удовлетворять соотношению
jjip(t)ip(s)Ri(t9s)dtds = c2jip2(t)dtJ
00 о
откуда с учетом произвольности ф(/)
следует, что Ri (t, s) = o2S(t - s).
Обобщенная с.к.-производная v(t) = 4(f)
однородного центрированного с.к.-непрерыв-
ного случайного процесса с независимыми
приращениями £(0 называется
стационарным непрерывным белым шумом с интенсивно-
стью а > 0 и имеет характеристики
w„(0 = 0, Rv(t,s) = a28(t-s).
Если о = 1 , то белый шум называется
стандартным. Обобщенная с.к.-производная
винеровского процесса называется гауссовским
белым шумом.
Пусть К(0 = о(/М0 + У(0,где а(/),
y(t) — неслучайные функции, a v(t) —
стандартный белый шум. Тогда
/M0 = Y<0, Ry(t,s) = o2(t)d(t-s).
Обобщенный процесс V(t) называется
нестационарным белым шумом с непрерывным
временем и интенсивностью о (/).
Процесс белого шума v(t) не является
физически реализуемым, однако он
интенсивно используется для моделирования
поведения сложных систем в присутствии
постоянно действующих возмущений и, в
частности, для описания ошибок процесса
наблюдения в непрерывном времени.
Глава 20.6
СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ И
ДИФФЕРЕНЦИАЛЫ
20.6.1. Стохастический интеграл Ито
от неслучайной функции. Пусть w(t),
t > 0, - стандартный винеровский процесс,
Д = [0, Т] - конечный интервал
интегрирования на R1 , а /(/) - вещественная ска-
710
Глава 20.6. СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ И ДИФФЕРЕНЦИАЛЫ
лярная функция, определенная на А и удов- Случайную величину /(/) называют
летворяющая условию стохастическим интегралом Ито и обознача-
\f2(t)dt <oo. ml(f) = jf(t)dw(t).
д д
м ^ Интеграл Ито /(/) обладает свойством
Класс таких функции будем обозначать
Т . А ч линейности:
L2(A).
Функция /„ (/) е £> (А) называется 7 (°Л + РЛ ) = a/(/l ) + Р7(/2 )
простой функцией, если в любой точке / е А для любых /i,/2eZ^(A) и a, P e R
она имеет вид
Кроме того, /(/) — гауссовская цен-
f (f\ = V" f.JA (f) трированная случайная величина с дисперси-
*=1 * ' eM/)/(/)=M[/2(/)] = J/2(OA.
где {А^} - непересекающиеся подынтер- л
Интеграл Ито с переменным верхним
валы [tk , tk+l) промежутка А , причем пределом , е д задается так:
/7
И Ак = А , а /д (/) - индикаторная функ- 'f f -
ция множества А^ , равная 1, если /еА^и л
нулю - в противном случае. Таким образом, где /(т) = у(т) при т < t и /(т) _ q при
/„ (О принимает на А лишь конечное мно- х> t.
жество значений {fk } , причем /(f) = /* , Рассмотрим случайную функцию вида
если /е Ад. , /: = 1,...,я . '
*-,*. /-/.ч г /an - 5(0= [/(О^Мт), fe A.
Для любой функции /(/)е /^(А) наи- ^v ' J ^ v ' "
дется последовательность \fn(t)} простых
Функция q(f) обладает следующими свойст-
функций из Z^(A), аппроксимирующая вами:
/(/) в следующем смысле: 1) 5(0 ~ гауссовский процесс;
J(/(O-/w(O)2A->0 при #i->~. 2) /ц(/) = О, ^(0 = J/2(x)rfx;
А О
Стохастическим интегралом Ито от 3) R^ (t, x) = I\ (min(f, т));
простой функции /„(/) по винеровскому 4) £(0 " непрерывный процесс с неза-
процессу vv(/) называется случайная величина висимыми приращениями.
Пусть на А также задан процесс Т|(0 =
^{ =j9(x)t/w(T), ф(т)е 12(A), тогда
О
Пусть теперь {/„(/)}- последователь-
. /^С, j) = COV (£(/), л(*)) =
ность простых функции, аппроксимирующая
некоторую /(/)е/^(А). Тогда
последовательность интегралов /(/„) с.к.-сходится к
некоторой случайной величине /(/) :
J /(т)<р(т)Л>(т).
о
'(0 = {h'i(/))..., w,„( .,
/(/) = l.i.m./(/„). „ „ ,„ч
л_>оо ' m-мерныи винеровскии процесс, а f(t) —
Если и>(0 = {и>, (/), ..., w,„ (t)f
СТОХАСТИЧЕСКИЙ ИНТЕГРАЛ ИТО ОТ СЛУЧАЙНОЙ ФУНКЦИИ
711
матричная функция размера (1хт) с
компонентами fij{t)&Li(di), тогда /(/) -
случайный вектор с компонентами Ij (/),
j = 1,...,/, где
т
*=1д
При этом /(/) - гауссовский
центрированный случайный вектор с ковариационной
матрицей
Лн/) = cav (/(/), Kf)) = jf(t)fT(t)dt.
А
20.6.2. Стохастический интеграл Ито
от случайной функции. Пусть теперь £(/),
t е А, — гильбертова случайная функция с
нулевым математическим ожиданием.
Ограничимся случаем, когда £(/) регулярна и
имеет интегрируемую дисперсию
|м[(§(/)-^(О)2]л-»0прия
-»оо .
Jm[V(o]
dt < ©о.
В этом случае существует среднеквадратиче-
ский предел
I(?,) = U.m.I (?,„),
/J-»oo
который не зависит от выбора {£л(0}»
называемый стохастическим интегралом Ито
от случайной функции %(t)e //(А). Его
обозначают
/<« = J«0<M/).
А
Перечислим основные свойства
интеграла Ито:
1) /(о*1 +К2) = о/(§,) + р/(§2),
сс.реК'Дь^еЖД);
2) М[/(§)] = 0;
3) Z)[/(^)] = M[/2(^)] = jM^2(0]^;
Пусть w(/), /€А - стандартный
винеровский процесс. Функция £(f )
называется неупреждающей относительно {vv(0,
/gA}, если при любых п > 1 и ^ <
< $2 < ••• < sn - s < * из ^ случайный вектор
{£($!,..., £(.?„)} не зависит от w(f)-w(.s).
Будем писать /(0€ Я(А) j если /(О
удовлетворяет всем перечисленным свойствам.
Функция ^n(t)e Н(А) называется
простой, если она имеет вид
п
5л (о = Х^*/д* о *где ft^}" некот°рые
А:=1
случайные величины.
Интеграл Ито от ^л (О имеет вид
А:=1
Д* = [^ у fk+[ )■
Для любой случайной функции из
//(А) найдется последовательность простых
случайных функций {£>„ (t)}, \n e Я (А),
такая, что
4)М[/($,)/Й2)] = М
J§,(/)§2(0*
5) случайная функция Л(0=
= Г £(t)*/w(t) является центрированным
0
процессом с ортогональными прираще-
/
ниями, дисперсией D^(t) = |М ^ (т) и/т
0
и ковариационной функцией R^(t, s) =
= DA (min(/, s));
6) если М[5(0] = /И£(/)*0, то
/($) = /(/!%) + /($), где !(/) = «/)-
-/я^(/)е Я(А), а интеграл /(аи^)
определен в п. 20.6.1.
Стохастический интеграл Ито от
матричной случайной функции с компонентами
из Я (А) по векторному винеровскому
процессу строится точно так, как это было
сделано в разд. 20.6.1 для матричной неслучайной
функции.
712
Глава 20.7. СТОХАСТИЧЕСКИЕ УРАВНЕНИЯ
20.6.3. Стохастический
дифференциал. Формула Ито. Предположим, что
я-мерная случайная функция £(/) на А
представима в следующем виде:
t t
«0 = 5o+J/(x)rfx + Jo(T)dW(T),
о о
где /(/)€ 12(A); o(t)z #(А); w(t) -
/w-мерный стандартный винеровский процесс;
£о ~~ случайный вектор, не зависящий
от w(t). В этом случае говорят, что £(/)
допускает стохастический дифференциал
g't(x, t) — частная производная по /;
g'x (*> О ~~ градиент по ху g^ (x, t) -
матрица вторых производных по х; tr{} - след
матрицы; (•,•) - скалярное произведение.
Формула Ито используется для
исследования поведения функций от процессов,
допускающих стохастический дифференциал, в
частности, являющихся решениями
стохастических дифференциальных уравнений (см.
п. 20.7.2).
Глава 20.7
СТОХАСТИЧЕСКИЕ УРАВНЕНИЯ
20.7.1. Разностные стохастические
уравнения. Предположим, что л-мерная
случайная последовательность %(t),teZ9 при
всех / > 0 удовлетворяет системе
рекуррентных соотношений
$(0 = Ф,($('-1),е(/)), S(0) = v, (20.7.1)
где ф, (£, е) - я-мерная неслучайная
кусочно-непрерывная функция аргументов £ е R",
d%(t) = Д/)Л + o(t)dw(t), §(0) = &> •
Предположим, что Т|(0 = g(£,(t),t), где
g(x, t) — неслучайная скалярная функция,
непрерывно дифференцируемая по / на А
и дважды непрерывно дифференцируемая
по х. Тогда случайная функция Т|(0 также
допускает стохастический дифференциал
*л(0 = /|(0Л + о1(0ЛЧ0,
где
Формула для вычисления dr\(t)
называется формулой Ито, или формулой замены
переменных в стохастическом дифференциале.
В скалярном случае (т.е. для т — п = 1)
формула Ито принимает более простой вид
eeRw; e(0 - /w-мерный дискретный
белый шум с параметрами М[е(0] = ^е(0
и cov(e(0, е(0) = ^ ; veR" -случайный
вектор начальных условий, не зависящий
от процесса {е(0, t>0}9 M[v] = mv ,
cov(v, v) = /?v.
Уравнение (20.7.1) называют разностным
нелинейным стохастическим уравнением, а
£(0 - решением этого уравнения.
Если при каждом t > 0 найдется
Kt <©о, такая, что |ф, (£, е)| <
< Kt\ 1 + |£| + |е| I, то при условии
М |v| < оо последовательность ^(t) будет
гильбертовой, т.е. М |£(0| < °° •
/i (О = ft (5(0, t) + (g'x{W), t), f(t)) + ^tr{g'„$(t), t)o(t)aT (О),
»i(0 = (&(«/), Of «О,
</n(0 = [ft'(5(0, 0 + fo(«O, 0/(O + ^*«(«O, t)o2(t)]dt +
+g'x(U0,t)o(t)dw(t)-
ЛИНЕЙНЫЕ СТОХАСТИЧЕСКИЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ 713
В прикладных задачах уравнение (20.7.1)
зачастую имеет менее общий вид:
W) = ft (%(t-D)+at {%(t-l))t(t),№ = v -
уравнение дискретной диффузии,
%(t) = a^(t-\) + b,t(t), «0) = v -
линейное разностное стохастическое уравнение,
если at, bt — неслучайные матрицы
соответствующих размеров.
20.7.2. Стохастические
дифференциальные уравнения. Пусть £(/), t > 0 -
л-мерная случайная функция, f(t,x) —
неслучайная функция со значениями в Rn , a
o(t, x) — неслучайная матричная функция
размера (пхт). Пусть также w(t) -
/я-мерный стандартный винеровский процесс;
vgR" - вектор случайных начальных
условий, не зависящий от {vv(/), t > 0}.
Векторная случайная функция %{t)
является решением стохастического
дифференциального уравнения на А = [0, Т]
dW) = f{t,W))dt +
+o(f,S(f))«M0,$(0) = v,
если для каждого t е А ее можно представить
в виде
W) = v + J/(T,$(T))rfT + Jo(t,«t)) **(*),
о о
(20.7.3)
где первый интеграл в правой части (20.7.3)
является с.к.-интегралом от процесса
тК1) =/(т>£(т))> а второй - интегралом
Ито от процесса у(т) = а(т, £(т)).
Предположим, что решение £(/)
уравнения (20.7.2) существует. Оно является
единственным, если для любого другого процесса
r\(t) , удовлетворяющего (20.7.2), выполнено
sup
/еД
|«0-л(0|>о1 =
0.
Рассмотрим условия существования и
единственности решения стохастического
дифференциального уравнения на А .
Пусть /(/, х) и а(/, х) имеют
компоненты, непрерывные по / е А и
1|2
Х€
R" , М T|v|21 < оо . Обозначим \\o(t, x)f
сумму квадратов элементов матрицы а(/, х) .
Для существования и единственности
решения £(/) уравнения (20.7.2) достаточно
выполнения следующих условий:
1) найдется такое К < <*> , что при всех
te A, xeR"
\f(t,xf+\\o(t,x)f<K(\ + \x\f;
2) найдется такое С < °° , что при всех
/е Д, х,уе Ш"
\f(t,x)-f(t,y)f +
+\\o(t, x)-a(t, y)f <C\x-yf.
При этом процесс %{t) является
непрерывным и имеет конечный второй момент:
m[|^)|2]<4[i + m[|v|2]J
1,/еД,
(20.7.2) где Lt < «> и зависит лишь от К.
20.7.3. Линейные стохастические
дифференциальные уравнения. Уравнение
вида
+u(t)dt + b(t)dw(t), £(0) = v,
(20.7.4)
где a(t), u(t) и b(t) — матричные
неслучайные функции соответствующих размеров,
называется линейным стохастическим
дифференциальным уравнением. Если коэффициенты
a(t),'u(t) и b(t) уравнения имеют
непрерывные компоненты, то решение уравнения
(20.7.4) существует и единственно.
Если a(t), u(t) и b(t) не зависят от
времени, то уравнение (20.7.4) называется
однородным. Если, дополнительно, матрица
a = a(t), te А, такова, что все ее
собственные значения (т.е. решения алгебраического
уравнения det(д -XI) = 0) имеют
отрицательные вещественные части (т.е. лежат в
левой полуплоскости), то однородное
уравнение (20.7.4) называется асимптотически
устойчивым.
714
Глава 20.7. СТОХАСТИЧЕСКИЕ УРАВНЕНИЯ
Общее решение £(/) уравнения (20.7.4)
может быть записано в интегральной форме:
t
£(0 = e(/)v + 0(/)|в_1 (т>(т)</т +
о
t
+Q(t)JQ-l(z)b(z)dw(z), /<= A,
о
где матричная функция Коши 6(0 является
решением системы обыкновенных
дифференциальных уравнений
в(/) = в(0в(0. е(0) = /.
Если в уравнении (20.7.4) a(t) = а , то
~ Qkfk
6(0 = ехр[д7] = 2_. ~~ матричная экс-
А:=0
понента.
Линейные стохастические
дифференциальные уравнения используются для
построения моделей случайных процессов и, в
частности, для моделирования стационарных
случайных функций с дробно-рациональной
спектральной плотностью.
Пусть гауссовская случайная функция
£(0 , te R , имеет спектральную плотность
вида
/$(*> =
|я(а>|2
2n\F(i\)\2 '
(20.7.5)
где
F(x)=^akxk, a0 = l; Н(х) =
к=0
т
= ^\b/cx , т < п - 1 , причем все корни
А:=0
многочлена F(x) лежат в левой
полуплоскости. В этом случае говорят, что £(0 ~~
случайная функция с дробно-рациональной
спектральной плотностью. Будем полагать также,
что m^(t) = 0.
Пусть Т|(0 ~" л-мерный гауссовский
случайный процесс, удовлетворяющий
стохастическому дифференциальному уравнению
</л(0 = Ax\(t)dt + Bdw(t), ti(0) = v, (20.7.6)
где w(t) - скалярный стандартный винеров-
ский процесс,
А =
0
0
0
-%
1
0
0
-а.
0
1
0
-а2
0
0
1
• -Я/Ы_
,в =
0 1
0
Qn-m
Яп-т+1
Яп \
{а/с }/J=o ~" коэФФиЦиенты многочлена F(x),
а постоянные параметры {qn-m, — ,qn}
определяются по рекуррентным формулам
к-\
Яп-т =bm> qk = bn-k ~ X ап-к+1Я1
i-n-m
для к = п-т + 1,...,л,
{Ьк }^=0 - коэффициенты многочлена Н(х).
Пусть вектор v является
центрированным гауссовским с ковариационной матрицей
Ry , удовлетворяющей системе
алгебраических уравнений
ARW +RvAT +BBT =0.
Тогда компонента T|l (0 вектора Т|(0
является гауссовской случайной функцией,
моделирующей процесс £(0 •
^,(0 = ^(0 = 0, /„,(*) = /$<*).
Очевидно, что все конечномерные
распределения процессов Т|| (0 и £(0
совпадают.
Уравнения (20.7.6) описывают
формирующий фильтр для процесса £(0 с заданной
спектральной плотностью /^(к).
20.7.4. Метод моментов. Пусть £(0 _
случайный процесс, удовлетворяющий
линейному разностному стохастическому
уравнению
!,(t) = a£(t-\) + bte(t), e(0) = v. (20.7.7)
Математическое ожидание tffr (0 и
дисперсионная функция I\(t) = cov(£(0, £(0)
процесса £(0 удовлетворяют системе
разностных уравнений метода моментов:
ЗАКОНЫ РАСПРЕДЕЛЕНИЯ РЕШЕНИЙ СТОХАСТИЧЕСКИХ УРАВНЕНИЙ 715
ль (t) = atmi (t -1) + btmz (t), m* (0) = mv,
T T (20.7.8)
I\(t) = atI\{t-\)aj +btRi(t)b[, Z\(0) = /?v,
где wE(0 = M[e(0], R^(0 = cov(e(0, e(0), Щ, =M[v], /?v =cov(v, v).
Если e(t) - стационарный белый шум
с постоянными параметрами {тг, Rt},
at = a, bt = b , и уравнение (20.7.7)
асимптотически устойчиво, то при любых (awv, /?v )
выполнено
AW^ (О -> AW^ , /^ (О -> /^ при / -> оо .
Параметры {т^, D^} не зависят от
(п% , /?v ) и могут быть вычислены
посредством решения предельных уравнений метода
моментов
В случае, когда уравнение (20.7.9) -
однородное по времени и асимптотически
устойчивое, также существуют предельные
значения пи и Гк, которые определяются из
системы предельных уравнений:
ат^ + и = 0,
al\ +I\aT +bTb = 0.
Если процесс £(/) - гауссовский, то
параметры {m^(t), D^(t)} полностью
определяют закон распределения сечения £(0»
/gA.
20.7.5. Законы распределения
решений стохастических уравнений. Рассмотрим
способы вычисления одномерной
характеристической функции Ч^(А,; t), \e R", ге А,
решения £(/) линейного разностного
стохастического уравнения (20.7.7).
Пусть заданы Ч\ (X) = М W^y -
характеристическая функция начального усло-
aI\aT + bRtbT = 0,
am^ + bmz = 0.
Аналогичные уравнения имеют место и
для случая, когда £(/) - случайная функция,
удовлетворяющая линейному стохастическому
дифференциальному уравнению
d%(t) = a{t)%(t)dt + u(t)dt +
+b(t)dw(t), £(0) = v.
Уравнения метода моментов в данном случае
являются обыкновенными
дифференциальными и имеют вид
вия v и у\0е(Х; t) = M\eixT*(,) -
характеристическая функция дискретного белого
шума е(/). Тогда Ч*^(\; t) удовлетворяет
рекуррентному уравнению
В случае, когда z(t) — гауссовский
процесс, Ч^Ск; t) имеет вид
П(^') = **\(е,7^)х
fro 1 г о 1 (207|,)
где {0,} определяется из рекуррентного
уравнения
в, =Д,в,-1> % =/>
a aw? (О, D?(t) - решения уравнений
метода моментов (20.7.8), но с нулевыми
начальными условиями.
\m^(t) = a(t)m^(t) + u(t),
т^(0) = awv,
li\(t) = a(t)I\(t) + I\(t)ar +b(t)bT(t), I\(0) = Rv.
(20.7.10)
716
Глава 20.7. СТОХАСТИЧЕСКИЕ УРАВНЕНИЯ
Плотность распределения сечения
р^(х; t) может быть определена по
характеристической функции с помощью
соотношения
#:(*; t) = (2n)~n J ехр(-агх)ч^(А.; t)dX.
В случае, когда ^(t) — решение
линейного стохастического дифференциального
уравнения (20.7.9), характеристическая
функция И*? (\; t) определяется формулой
(20.7.11), где 0, - матрица Коши, a /и?(/),
А (О "~ решения дифференциальных
уравнений (20.7.10) метода моментов с нулевыми
начальными условиями.
Пусть теперь %{t) удовлетворяет
нелинейному стохастическому дифференциальному
уравнению
d%(t) = f(W))dt + a(W))dw(t), $(0) = v,
тогда при определенных условиях на
гладкость функций f(x) и о(х), а также на
гладкость плотности Pt(x; t) последняя
удовлетворяет уравнению Колмогорова — Фок-
кера — Планка:
Э/%(х;/) " Э г, , ч , ^-i
к=\ал*
1 ^
т
где /(х) = {/,(дс),...,/я(дс)} , {gkm(x)} =
= G(x) = о(х)оТ(х). Уравнение для
Pl(x\ О является уравнением в частных
производных параболического типа и
решается с начальным условием р^(х; 0) = /\, (х),
где pv(x) — плотность распределения
вектора v начальных условий в уравнении (20.7.9).
20.7.6. Численное интегрирование
стохастических уравнений. Рассмотрим
процедуру дискретизации по времени нелинейного
стохастического дифференциального уравнения
^(/) = /(/^(0)* + o(/,«/))^(/),«0) = v.
(20.7.12)
Разобьем А = [0,Г] на п подынтервалов
длины h = Т/п точками /0 = 0 < t[ < ... < tn_{ <
<tn=T и рассмотрим последовательность
\п, определяемую разностным
стохастическим уравнением
+ 4ho{tk,%k)vk, £0 =v,
(20.7.13)
где {vk } - дискретный стандартный гауссов-
ский AW-мерный белый шум. На А с
помощью {^к} определим кусочно-постоянный
случайный процесс ^(t):
1(0 = \к , если te[tk, tk+[); %(T) = %п .
(20.7.14)
Случайная функция ^(t) называется
аппроксимацией £(/) no методу Эйлера и
обладает следующей характеристикой точности
(с.к. -погрешностью аппроксимации):
М
|«о-*<о|2] =
O(h) WeA.
Усложнение схемы метода Эйлера
позволяет повысить точность аппроксимации,
т.е. уменьшить с.к.-погрешность.
Пусть {^к} удовлетворяет разностному
стохастическому уравнению
%k+\ = $>к+¥
* 4 «*♦*!♦
(20.7.15)
+Jho\tk + ^Лк +^"k' ^0 =v,
где щ = hf(tk, %к) + VAa(^, %k)vk, a
%(t) определяется по %(t) так же, как и
выше. В этом случае можно показать, что
М
"И
%(t)-Ut)\ =0(Л2)УГеД.
Данный метод называется
модифицированным методом Эйлера.
Уравнения (20.7.13) - (20.7.15)
определяют алгоритмы численного интегрирования
нелинейного стохастического
дифференциального уравнения (20.7.12) методом Эйлера,
легко реализуемые на ЭВМ.
ОЦЕНИВАНИЕ МОМЕНТНЫХ ХАРАКТЕРИСТИК
717
Систему линейных стохастических
уравнений можно интегрировать как методом
Эйлера, так и с использованием точной
процедуры дискретизации.
Пусть
dW) = <>(№№ + b(t)dw(t), %{<)) = v,
тогда
Wk+i) = <bkWk) + xVkVk, S(0) = v, (20.7.16)
где Фк = Q(tk+i )0-1 (tk), е(0 = д(0е(0,
0(0) = /. Матрица х¥к такова, что Ч^Ч^ =
= G(tk+y), где матричная функция G(t)
удовлетворяет системе дифференциальных
уравнений:
G(t) = a(t)G(t) + G(t)aT (t) + b(t)bT (/), t>tk,
G(tk) = 0.
Подчеркнем, что ^(tk ) = %(tk ) для
любого 7gA, причем точки {tk} могут быть
произвольно выбраны на А. Если же
h+\ ~h - h» причем h «: 1 , то точная
аппроксимация (20.7.16) дает результат,
практически совпадающий с методом Эйлера:
i(tk+[) = {l + ha(tk))l(tk) +
-Jhb(tk)vk, S(0) = v.
(20.7.17)
Соотношения (20.7.16), (20.7.17) лежат в
основе алгоритмов моделирования
стационарных случайных функций с дробно-
рациональным спектром, так как они
позволяют численно проинтегрировать
стохастические дифференциальные уравнения (20.7.6)
формирующего фильтра.
Глава 20.8
СТАТИСТИКА СЛУЧАЙНЫХ ПРОЦЕССОВ
20.8.1. Оценивание моментных
характеристик. Пусть £(/), teT, - /^-мерный
случайный процесс со средним ffi^(t) и
ковариационной функцией JR^(t,s).
Обозначим через {£,к х, к = 1,...,п} совокупность
независимых реализаций сечения £(т),
те Т . Тогда аи^(т) и дисперсионная
функция Гк (т) = R^ (т, т) могут быть оценены с
помощью соответствующих выборочных
моментов
П к=\
Оценки т{"\т) и D{"\t) - сильно
состоятельны, т.е.
► aw^(t),
->Z^(t) при п -> <
причем
М[го<я)(т)] = ^(т),
м[2>£в)(т)1-»^(т) при п
Для произвольных т, s еТ по выборке
{£/t т> t* s )' к = !>•••,", соответствующей
сечениям £(т) и £(.$) , можно также
построить асимптотически несмещенную и сильно
состоятельную оценку ковариационной функции
Л<")(х,5) =
п k=i
718
Глава 20.8. СТАТИСТИКА СЛУЧАЙНЫХ ПРОЦЕССОВ
Для построения оценок /Wt (т), D* (т)
и R* (x, s) необходимо наблюдать сечения
процесса £(т), что фактически означает
необходимость иметь дело с пучком реализаций
процесса £(/), состоящим из п траекторий,
полученных независимо друг от друга. Если
процесс £(/) исследуется методом
статистического моделирования (методом Монте-
Карло), то построение указанного пучка
траекторий не составляет принципиальных
трудностей.
Если же в распоряжении исследователя
имеется лишь одна реализация £(/)» * G T ,
то оценивание моментных характеристик в
общем случае невозможно. Однако для строго
стационарных процессов при некоторых
дополнительных ограничениях указанная
проблема разрешима.
Пусть £(0> teT — строго
стационарный процесс, т.е. для любого его
конечномерного распределения справедливо
F^(x{,...,xn; t{ +!,...,/„ +т) =
= F^(x{ ,...,хп; t[ ,...,tn)
при любом таком т , что t^ + т е Т , если
tkeT.
Если £(/) является также гильбертовым
процессом, то
m^(t) = М[£(0] = Ю£ = const;
Пусть £(/) — случайная
последовательность, т.е. Т -Ъ. Тогда для т^ и
ур(т), те Г, можно построить оценки по
наблюдениям {£(1),...,1;(л)}:
При определенных дополнительных
условиях указанные оценки будут также и
сильно состоятельными. Пусть £(/) - линейный
процесс, т.е. представим в виде
«/)= JT ete</-*),
где \. \ak I < °°» \ak || "" евклидова норма
матрицы dfc, a {e(t)} — строго стационарный
белый шум, М |е(0| <°°. Тогда
т
(п) пн.
»
т
1 п
п *^
Ы\
Чп)
п х /=1
-(я)
Оценки /Ии ; и у^ (т) - несмещен-
м[т<">] = ^, М[у^7)
(т) =
= У$(1)-
>"^> У^'(т)—<^-*у(т) при
К линейным процессам относятся строго
стационарные процессы с
дробно-рациональной спектральной плотностью и, в
частности, процессы авторегрессии — скользящего
среднего, а также процессы, удовлетворяющие
линейным стационарным устойчивым
разностным стохастическим уравнениям. Если же
£(/) - гауссовский процесс, то он будет
линейным, если имеет спектральную плотность.
Для оценивания дисперсии IX и
ковариационной функции ^(т) процесса £(/)
можно воспользоваться очевидными
соотношениями:
Если £(т), те [0, /] - случайная
функция, то соответствующие оценки для
mt > Yl (т) имеют интегральную форму и
аналогичны по смыслу рассмотренным выше:
о
У^(Т)=7^}^(^Г(5 + Т)Л, Г>Т.
о
Оценки т\' и ус (т) являются
несмещенными, а при некоторых
дополнительных условиях сильно состоятельными.
Последнее выполнено, если £(/) — гауссовская
стационарная функция, имеющая
спектральную плотность.
ОЦЕНИВАНИЕ ПРОЦЕССОВ ПО СРЕДНЕКВАДРАТИЧЕСКОМУ КРИТЕРИЮ 719
20.8.2. Оценивание спектральной
плотности. Пусть £(aw), /wgZ - скалярная
вещественная стационарная (в широком
смысле) случайная последовательность со
спектральной плотностью ft (А,), А,е [-я,я] •
Рассмотрим алгоритм оценивания Д(А,) по
некоторой траектории {^(1),...,^(л)}
последовательности %{т).
Для предварительного оценивания
f^(X) построим функцию /„(А,),
называемую периодограммой:
а
'■w-i
к=\
М[/„(А)]->Д(Х) при л->оо,т.е. 1п(Х) -
асимптотически несмещенная оценка для
/?(А,). Однако D[ln(\)]^>fg(\) при
л->е» и VA, Ф 0, т.е. 1п(Х) не является
состоятельной оценкой.
Оценка /„(А,) называется ядерной
(сглаженной) оценкой для /^ (А,) , если она имеет вид
к
/„(*)= \w„(X-s)In(s)ds,
-7Г
где И^?(А,) — функция, называемая
спектральным окном.
При определенном выборе
последовательности {^(А,)} спектральных окон
/„(А,) будет асимптотически несмещенной и
с.к.-состоятельной оценкой для /^(А,).
Рассмотрим важнейшие виды оценки
/„ (А,). Пусть далее М -> °° , так, что
Л/
► 0.
Предположим, что пь = 0, а
&/7 (т) = V £(0£С + t) ~~ выборочная
п~хы\
оценка ковариационной функции /:^(т)
процесса £(0.
1. Оценка Даниэля (финитное
преобразование Фурье):
^-М,
/=-/i+i
1-^
п
*-<*[$)Г-
если W^ (Я.) =
-, еслиН<-,
0,
W>-ff-
2. Оценка Бартлетта:
М
-=Ul-*MP
М'^
д/
если ^(А,) = 8т"
Л/А./.. • 2
—- / М sur
3. Усеченная оценка:
если Wn = 2 sin —-— Л.
\ < j/SI"2
Для выбора М рекомендуется соотноше-
1
ние М = en q , где <7 > 1 таково, что
JT|^(0|<~.
20.8.3. Оценивание процессов по
среднеквадратическому критерию. Пусть
Т|(0» fe А = [0, Г], - ^-мерная
наблюдаемая случайная функция, а £(/) - /^-мерная
ненаблюдаемая случайная функция, сечения
которой подлежат оцениванию на основе
обработки наблюдений за Т|(/) на А . Далее
предполагается, что М |т|(/)| +|£(')| <°°- Кроме
того, известными предполагаются моментные
характеристики я^(0> ^ (0> ^С>т)>
/^(М) и /^л(М).
Среднеквадратическое интегральное
преобразование вида
l(s) = ф) + jg(s, т)л(т)^/т, s > 0 ,
А
с известной /^-мерной функцией (p(s) и
матричной весовой функцией g(s, т) размера
(pxq) называется линейной оценкой для
£,(s) по наблюдениям {т|(т)> те А}.
720
Глава 20.8. СТАТИСТИКА СЛУЧАЙНЫХ ПРОЦЕССОВ
В зависимости от выбора точки s задачи
оценивания носят различные названия:
1) сглаживание (интерполяция), если
0<s<T;
2) фильтрация, если s -T ;
3) прогнозирование (экстраполяция), если
s>T.
Точность оценки £,(s) характеризуется
величиной среднеквадратической погрешности
(с.к. -погрешности):
/(Ф,*) = М
В(')-£(*Я
где явно указана зависимость погрешности от
выбора (p(s) и g(s, т).
Для обеспечения выполнения условия
М
м2]
< ©о потребуем, чтобы при всех
s > 0 функция g(s, т) удовлетворяла
условию
tr
j jg(s,Tl )ГП (т, ,t2 )gT (j,t2 )di\dx2
A A
<oo
<p(s) = m^ (s) - Jg(5,T)^ (i)dx.
A
С.к.-оптимальная оценка, таким образом,
имеет вид
i(s) = m^ (s) + jg(s,т)(л(х) - /и,, (т))Л.
А
Оценка £,(s) имеет ошибку A£,(s) = ^(^) -
-£(.s), причем = 0 , т.е. £,(s) —
несмещенная оценка; RA (s, 5) = cov IД £ (s),
A§(j))=^(j, 5) - j}(s9 1)^(1, J)rfx -
A
ковариационная матрица ошибки оценки;
J (ф,£) = tr[/?A (j, j)] - оптимальное
значение критерия /(ф, g).
Уравнение для определения g(s,x)
называется интегральным уравнением Винера —
Хопфа. В общем случае оно решается только
численно, хотя в некоторых практически
важных случаях может быть найдено его
аналитическое решение (см. пп. 20.8.4 и 20.8.5).
Если составной (р + q) -мерный
процесс y(0 = (s(0»t1(0) ~~ гауссовский, то
повысить точность оценки £,(s) не удается
даже переходя к произвольным нелинейным
оценкам для £(s) по Т|(/) . Таким образом,
для гауссовской системы наблюдения y(t)
линейная оценка £(s) является глобально
с.к. -оптимальной.
Для случая дискретного времени / все
сформулированные утверждения и
соотношения полностью справедливы с точностью до
замены интегралов на соответствующие суммы.
20.8.4. Фильтр Калмана для
случайных последовательностей. Пусть р-мерная
случайная последовательность %(п)
удовлетворяет разностному стохастическому
уравнению
%{п) = ап%(п-\) + Ьпг(п), п>\,
которое решается с начальным условием
А £(0) = v, где v - случайный вектор со
при каждом te А , а функция ф(^) имеет вид средним т\ и ковариационной матрицей
где Гл (ij ,т2 ) = /^ (ij ,т2 ) + т^ (х{ )т^ (т2 )-
матричная функция вторых начальных
моментов процесса л(0 • Соответствующие
весовые функции g(s, т) и полученные с их
помощью оценки £(/) будем называть
допустимыми.
Допустимая оценка Z,(s) называется
с.к.-оптимальной линейной оценкой, если
k(s) = v(s) + jg(s, xft(x)dt, s>0,
A
где пара (ф, g\ доставляет минимум
критерию /(ф, g) на классе всех допустимых
(ф,£):/(ф,£|</(ф,£), где (ф,#) -
произвольные допустимые функции.
Теорема. Функция g(s,x) удовлетворяет
уравнению
jg(s,x)R4(x,t)dx = ^(s,t)
ФИЛЬТР КАЛМАНА ДЛЯ СЛУЧАЙНЫХ ФУНКЦИЙ
721
Rv ; е(я) — векторный дискретный белый
шум со средним тг(п) и дисперсионной
последовательностью Dz(n), процесс г{п)
не зависит от V, а {ап, Ъп} - неслучайные
матрицы соответствующих размеров.
Предполагается, что £(я) в каждый
момент времени п > 1 доступен наблюдению
по схеме
y\{n) = cn%{n) + v(n), /1 = 1,2,...,
где Г|(я) "" вектор размера (<7х1)
результатов наблюдений, сп ~ известная неслучайная
матрица, a v(n) — дискретный ^-мерный
Ц(л) = \(п) + Кп(ц(п) -
где \(п) = а„1(п-\) + Ьптг («), Р„ =
= «и £„-| ал + *»A («)*J , *„ = £<£ X
х(ся/^,ся + ЦДя)) - матричный
коэффициент усиления.
Матрица Рп является ковариационной
матрицей ошибки Д£(я) = £(я) - £(я)
оценки и удовлетворяет разностному матричному
уравнению
Рп = Р„ - ^пспРп, Р0 = Rv
Рекуррентные уравнения для
вычисления £(я) и Рп описывают дискретный
фильтр Калмана.
Пусть все параметры модели
наблюдения Калмана не зависят от времени, а
матрица а — ап такова, что все ее собственные
числа лежат внутри круга единичного радиуса с
центром в нуле (модель наблюдения
асимптотически устойчива), тогда Кп —> К -
= РсТ (сРст + Dv) при п -> оо , где Р
определяется из системы алгебраических
уравнений:
\р = аРат + bDEbT
]p = P-Pcr(cPcT +DV)~] cP.
белый шум со средним mv(n) и
дисперсионной последовательностью Dv(n), причем
процесс {v(n)} не зависит от {е(п)} и v .
Уравнения для {£,(п), ц(п)} описывают
модель наблюдения Калмана в дискретном времени.
Т
Пусть г\" = (цТ(\),...,цТ(п)} -
вектор всех наблюдений до момента п
включительно. Обозначим через £(я) оптимальную
по с.к.-критерию линейную оценку для %(п) по
наблюдениям цп . Из общих уравнений для
с.к.-оптимальной оценки (см. п. 20.8.3)
следует, что
-cn\(n)-mv{nj), n>\,
Заменяя в уравнении для £(я)
переменный коэффициент усиления К„ на его
предельное значение К, получаем уравнения
стационарного алгоритма фильтрации Калмана:
\l(n) = ai(n-l) + bme,i(0) = mv.
Если процессы (е(и)}, {v(n)} и вектор
V — гауссовские, то оценка £,(п) является
с.к.-оптимальной на классе всех возможных
оценок (а не только линейных).
20.8.5. Фильтр Калмана для
случайных функций. Рассмотрим векторные
случайные функции J^(t)GRp и x\(t)eRq ,
удовлетворяющие для t > 0 системе
стохастических дифференциальных уравнений:
ШП = A(t)%(t)dt + B(t)dw{{t),
[</л(0 = a(t)%(t)d1 + b(t)dw2 (0
с начальными условиями £(0) = v и
Г|(0) = 0,где W\(t) и w2(t) -стандартные
векторные винеровские процессы, не
зависящие от v; A(t), Bit), a(t) и b(t) -
матричные неслучайные функции с
непрерывными компонентами.
722
Глава 20.8. СТАТИСТИКА СЛУЧАЙНЫХ ПРОЦЕССОВ
Предположим, что функция b(t)bT (t)
равномерно невырождена, т.е. найдется
константа с > 0 , такая, что для любых / > 0
и X € Rg имеет место неравенство
Хтb(t)bT (t)X > с\х\2 . Тогда с.к.-оптималь-
которая решается с начальными условиями
i(0) = mv, 7(0) = /^,
где щ, Rv — среднее и ковариационная
матрица вектора начальных условий V .
Матричная функция у(г) в каждый
момент времени равна ковариационной
матрице ошибки оценки Д£(г) = £(г) - %(t) .
Уравнения для вычисления ^(г) и у(г)
описывают алгоритм с.к.-оптимальной
линейной фильтрации процесса £(/) в
непрерывном времени, называемый фильтром Кал-
мана-Бьюси.
Если v — гауссовский вектор, то оценка
£(f) является абсолютно оптимальной сред-
неквадратической оценкой для £(/) по
наблюдениям {r|(f )> т < f}.
ноя линейная оценка ^(/) для £,(t) по
наблюдениям {т)(^)» т < f} есть единственное
решение системы стохастических
дифференциальных уравнений:
Для фильтра Кал мана-Бьюси в
стационарном случае также существует упрощенный
стационарный вариант, аналогичный
рассмотренному в п. 20.8.4 для дискретного времени.
СПИСОК ЛИТЕРАТУРЫ
1. Вентцель Е.С., Овчаров Л.А. Теория
случайных процессов и ее инженерные
приложения. М.: Наука, 1985.
2. Дэвис М.Х.А. Линейное оценивание и
стохастическое управление. М.: Наука, 1984.
3. Королюк B.C. и др. Справочник по
теории вероятностей и математической
статистике. М.: Наука, 1985.
4. Пугачев B.C., Синицын И.Н.
Стохастические дифференциальные системы. М.:
Наука, 1990.
5. Розанов Ю.А. Теория вероятностей,
случайные процессы и математическая
статистика. М.: Наука, 1985.
6. Ширяев А.Н. Вероятность. М.: Наука,
1989.
4(0 = A(t)i(t)dt + y(t)aT(t)(b(t)bT(/))' [ЛКО-a(t)i(t)dt],
y(t) = A(t)y(t) + y(t)AT(0 + B(t)BT(t)-y{t)aT(t)(b(t)bT(Г))"' a(t)y(t),
ЧАСТЬ VI
МЕТОДЫ МАТЕМАТИЧЕСКОГО
МОДЕЛИРОВАНИЯ
Раздел 21
МЕТОДЫ ОПТИМИЗАЦИИ
Глава 21.1
УСЛОВИЯ ЭКСТРЕМУМА ФУНКЦИЙ
21.1.1. Постановка задачи
оптимизации и основные положения. Методы
оптимизации — раздел математики, который
посвящен решению задач поиска наилучшего
варианта из множества возможных.
Традиционно к нему относят задачи максимизации и
минимизации функций конечного числа
переменных, т.е. задачи поиска экстремума
функций.
Постановка задачи поиска минимума
функций содержит:
целевую функцию /(*) > где х =
= (*| ,...,*„ ), определенную на «-мерном
евклидовом пространстве Rn. Ее значения
характеризуют степень достижения цели, во
имя которой поставлена или решается задача;
множество допустимых решений
X с Rn , среди элементов которого
осуществляется поиск.
Требуется найти такой вектор х* из
множества допустимых решений, которому
соответствует минимальное значение целевой
функции на этом множестве:
/(**) = mill/(*). (21.1.1)
Замечания. 1. Задача поиска максимума
функции f(x) сводится к задаче поиска
минимума путем замены знака перед
функцией на противоположный:
/(**)= max f(x) = - min [-/(*)] ■
^ ' Y(= У YC У
2. Задача поиска минимума и максимума
целевой функции f(x) называется задачей
поиска экстремума: f (х* ) = extr f(x).
3. Если множество допустимых решений
X задается ограничениями (условиями),
накладываемыми на вектор х, то решается
задача поиска условного экстремума. Если
X = Rn , т.е. ограничения (условия) на
вектор х отсутствуют, решается задача поиска
безусловного экстремума.
4. Решением задачи поиска экстремума
является пара (х*, /(**)), включающая
точку х* и значение целевой функции в ней.
Точка х* е X называется точкой
глобального (абсолютного) минимума функции
f(x) на множестве X, если функция
достигает в этой точке своего наименьшего
значения, т.е.
/(** )</(*) VxeX. (21.1.2)
Точка х* е X называется точкой
локального (относительного) минимума функции
f(x) на множестве X, если функция
достигает в этой точке своего наименьшего
значения, т.е.
/(**)</(*) ЧхеХ.
Точка х* е X называется точкой
локального (относительного) минимума функции
f(x) на множестве X, если существует
е > 0 , такое, что если х е X и \х - х* < е,
724
Глава 21.1. УСЛОВИЯ ЭКСТРЕМУМА ФУНКЦИЙ
то /(**) < f(x) . Здесь ||х| = I £*2 _
евклидова норма вектора х.
Замечания. 1. В первом определении
точка х* сравнивается со всеми точками из
множества допустимых решений X, а во втором —
только с принадлежащими е- окрестности.
2. Если в определениях знак неравенства
< заменить на >, то получатся определения
глобального (абсолютного) и локального
(относительного) максимумов.
3. Глобальный экстремум всегда
является одновременно локальным, но не наоборот.
Поверхностью уровня функции f(x)
называется множество точек, в которых функция
принимает постоянное значение, т.е. f(x) =
= const . Если п = 2, поверхность уровня
изображается линией уровня на плоскости /?2 .
Градиентом Vf(x) непрерывно
дифференцируемой функции f(x) в точке х
называется вектор-столбец, элементами которого
являются частные производные первого
порядка, вычисленные в данной точке:
( Э/(дс) 1
Vf(x) =
(21.1.3)
Градиент функции направлен по
нормали к поверхности уровня, т.е.
перпендикулярно к касательной плоскости, проведенной в
точке X, в сторону наибольшего возрастания
функции в данной точке.
Вместе с градиентом можно определить
вектор антиградиента, равный по модулю
вектору градиента, но противоположный
по направлению. Он указывает в сторону
наибольшего убывания функции в данной
точке.
Матрицей Гессе Н (х), дважды
непрерывно дифференцируемой в точке х функции
f(x), называется матрица частных
производных второго порядка, вычисленных в
данной точке:
(Э2/(х) Э2/(х) Э2/(х))
оХ\ иХп
э2/(*)
//(*)=
Эх,2
оХ\ оХ2
Э2/(х) Э2/(х)
Эх2Эх|
32/(х)
ОХпОХ\
Эх2
Э2/(х)
оХп аХ2
дх2 дхп
Э2/(х)
Эх2
(k
'II
/*2,
пп\
h22
Кг
... h,n\
... h2n
... К
d2f(x)
где k: =———, /, J =l,...,w. Матрица Гес-
J dXjdXj
се является симметрической размера (пхп).
Квадратичная форма АхТ Н(х)Ах
(а также соответствующая матрица Гессе
Н(х)) называется:
положительно определенной (//(л:)>0),
если для любого ненулевого Ал: выполняется
неравенство Ах:7 Н(х)Ах > О ;
отрицательно определенной (//(л")<0),
если для любого ненулевого Ал: выполняется
неравенство Ал*7 Н(х)Ах < О ;
положительно полуопределенной (//(л:) >
> 0), если для любого Ал: выполняется
неравенство Ал:7 Н(х)Ах >0 и имеется
отличный от нуля вектор Ал:, для которого
АхТ Н(х)Ах = 0;
отрицательно полуопределенной (//(л:) <
< 0), если для любого Ал: выполняется
неравенство АхТ Н(х)Ах <0 и имеется
отличный от нуля вектор Ал:, для которого
АхТИ(х)Ах = 0;
НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ БЕЗУСЛОВНОГО ЭКСТРЕМУМА 725
неопределенной (Н(х)<0), если
существуют такие векторы Ах , Ах , что
выполняются неравенства АхтН(х)Ах > О,
АхтН(х)Ах<0;
тождественно равной нулю (Н (х) = 0),
если для любого Ах выполняется
АхТН(х)Ах = 0.
Множество X с R'1 называется
выпуклым, если оно содержит всякий отрезок,
концы которого принадлежат X, т.е. если для
любых я1 , х2 е X и 0 < А, < 1 справедливо
Хх[ + (\-Х)х2е X .
Функция f(x), определенная на
выпуклом множестве X, называется выпуклой, если
f(Xx[ + (\-\)x2)<\f(x*) + (\-X)f{x2)
Vx1, х2 еХ, 0<А,<1.
Функция f(x), определенная на
выпуклом множестве X, называется строго
выпуклой, если
+ (\-X)f(x2) Vx1, x2eX, xl*x2,
0<\<\.
Функция f(x) , определенная на
выпуклом множестве X, называется сильно
выпуклой с константой / > 0, если
f{\xx + (\-\)x2)<\f{xx) + {\-\)f{x2)-
-1mi-X)|*'-*2|2
Vx1, х2 g X, хх фх2, 0<А,<1.
Замечания. 1. Функцию f(x) называют
выпуклой, если она целиком лежит не выше
отрезка, соединяющего две ее произвольные
точки. Функцию называют строго выпуклой,
если она целиком лежит ниже отрезка,
соединяющего две ее произвольные, но не
совпадающие точки.
2. Если функция сильно выпуклая, то
она одновременно строго выпуклая и
выпуклая. Если функция строго выпуклая, то она
одновременно выпуклая.
3. Выпуклость функции можно
определить по матрице Гессе:
если H(x)>0 VxeRn, то функция
выпуклая;
если H(x)>0 VxeRn, то функция
строго выпуклая;
если Н(х) > IE V* е Я" , где Е -
единичная матрица, то функция сильно выпуклая.
При решении задач поиска экстремума
используются следующие свойства.
1. Если f(x) выпуклая функция на
выпуклом множестве X, то всякая точка
локального минимума является точкой ее глобального
минимума на X.
2. Если выпуклая функция достигает
своего минимума в двух различных точках, то она
достигает минимума во всех точках отрезка,
соединяющего эти две точки.
3. Если f{x) строго выпуклая функция
на выпуклом множестве X, то она может
достигать своего глобального минимума на X не
более чем в одной точке.
Функция f(x) удовлетворяет условию
Липшица на отрезке [а, Ь], если существует
такое число L > 0 (константа Липшица), что
\f(x')-f(x')\<L\x'-x"\
для всех х и х", принадлежащих [а, Ь].
Задача поиска максимума или минимума
целевой функции может быть решена с
помощью применения соответствующих
необходимых и достаточных условий экстремума или
численных методов. Необходимые условия
выделяют «подозрительные» на наличие
экстремума точки. Достаточные условия
позволяют судить о том, какой тип экстремума
достигается в «подозрительной» точке:
минимум или максимум (если он достигается).
21.1.2. Необходимые и достаточные
условия безусловного экстремума. Дана
дважды непрерывно дифференцируемая
функция f(x), определенная на множестве
X = R" .
Требуется исследовать функцию f(x)
на экстремум, т.е. определить точки х* е R" ее
локальных минимумов и максимумов на Rn :
f(x*)= min /(*); f(x*)= max/(x).
V } xeR» V ' xeR"
(21.1.4)
Для решения задачи находятся точки х*
локальных экстремумов с помощью
необходимых условий первого и второго порядка
(порядок условий определяется порядком
используемых производных), а также
достаточных условий безусловного локального
экстремума. Вычисляются значения f(x*)
функции в найденных точках локальных
экстремумов.
726
Глава 21.1. УСЛОВИЯ ЭКСТРЕМУМА ФУНКЦИЙ
Теорема 21.1.1. (необходимые условия
экстремума первого порядка).
Пусть х* е R" есть точка локального
минимума (максимума) функции f(x) на
множестве R" и f(x) дифференцируема в точке
х*. Тогда градиент функции f(x) в точке
х* равен нулю, т.е.
V/(**)=0 (21.1.5)
dettf(x*)
hu hn ... h{n
h2\ h22 ... h2n
\hn\ Ki ••• h
Определители А|=Л||, A2 =
dXj
ln\
называются угловыми
О, / = !,...,/!. (21.1.6)
Точки х*, удовлетворяющие условию
(21.1.5) или (21.1.6), называются
стационарными.
Теорема 21.1.2. (необходимые условия
экстремума второго порядка). Пусть точка
х* есть точка локального минимума
(максимума) функции f(x) на множестве Rn
и функция f(x) дважды дифференцируема в
этой точке. Тогда матрица Гессе #(**)
функции f(x), вычисленная в точке х* , является
положительно полуопределенной (отрицательно
полуопределенной), т.е.
Н(х*)>0,
(Я(**)<0).
(21.1.7)
(21.1.8)
Теорема 21.1.3. (достаточные условия
экстремума). Пусть функция f(x) в точке
х* е Rn дважды дифференцируема, ее градиент
равен нулю, а матрица Гессе является
положительно определенной (отрицательно
определенной), т.е.
V/(jc*) = 0 и Я(х*)>0, (21.1.9)
(Я(х*)<0). (21.1.10)
Тогда точка х* есть точка локального
минимума (максимума) функции f(x) на
множестве Rn .
Рассмотрим определитель матрицы Гессе
Н (х* J, вычисленной в стационарной точке
минорами. Определители т-го порядка
(т<п), получающиеся из определителя
матрицы Н (х* ] вычеркиванием каких-либо
(п - т) строк и (п - т) столбцов с одними
и теми же номерами, называются главными
минорами.
Для проверки выполнения достаточных
условий экстремума и необходимых условий
второго порядка используются два способа.
Первый способ (с помощью угловых и
главных миноров).
А. Критерий проверки достаточных
условий экстремума (критерий Сильвестра).
1. Для того чтобы матрица Гессе
И (х* ) была положительно определенной
(Hlx*\>0) // точка х* являлась точкой
локального минимума, необходимо и
достаточно, чтобы знаки угловых миноров были строго
положительны:
А, >0, А2 >0,..., А„ >0. (21.1.11)
2. Для того чтобы матрица Гессе
Я (х* ] была отрицательно определенной
(Я(л:*)<0) и точка х* являлась точкой
локального максимума, необходимо и
достаточно, чтобы знаки угловых миноров чередовались,
начиная с отрицательного:
А, <0, А2 >0, А3 <0,..., (-1)"А„ >0.
(21.1.12)
Б. Критерии проверки необходимых
условий экстремума второго порядка.
1. Для того чтобы матрица Гессе
Н(х*) была положительно полуопределенной
(Н (х*) > 0) и точка х* может быть
являлась точкой локального минимума, необходимо и
НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ БЕЗУСЛОВНОГО ЭКСТРЕМУМА 727
достаточно, чтобы все главные миноры
определителя матрицы Гессе были неотрицательны.
2. Для того чтобы матрица Гессе
Н (х*) была отрицательно полуопределенной
ные миноры нечетного порядка —
неположительны.
Второй способ (с помощью собственных
значений матрицы Гессе).
Собственные значения Xj, / = 1,..., w ,
(И(х*) < 0) и точка х* может быть явля- ,ш/ *\ / ч
v ' матрицы Mix J размера (пхп) находятся
лась точкой локального максимума, необходимо
и достаточно, чтобы все главные миноры
четного порядка были неотрицательны, а все глав-
как корни характеристического уравнения
(алгебраического уравнения Я-й степени):
|я(х*)-А,£|
/*,| -X hn
/*2| h22-X
"п\
пп7
hnn - Х\
(21.1.13)
Если все собственные значения
положительны, то в точке х* - локальный
минимум; если отрицательны - локальный
максимум; если имеют разные знаки - нет
экстремума; если неотрицательны
(неположительны), то может быть минимум (максимум).
Алгоритм решения задачи. Шаг 1.
Записать необходимые условия экстремума
первого порядка в форме (21.1.6) и найти
стационарные точки х* в результате решения
системы п в общем случае нелинейных
алгебраических уравнений с п неизвестными.
Шаг 2. В найденных стационарных
точках JC* проверить выполнение достаточных
условий, а если они не выполняются, то
необходимых условий второго порядка с
помощью одного из двух способов.
Шаг 3. Вычислить значения /(**) в
точках экстремума.
Замечания. 1. Если требуется определить
глобальные экстремумы, то они находятся в
результате сравнения значений функции в
точках локальных минимумов и максимумов с
учетом ограниченности функции на R" .
2. Для случая функции f(x) одной
переменной (я = 1) можно сформулировать
правило, заменяющее п. 2 алгоритма:
Если функция f(x) и ее производные
непрерывны, то точка х* является точкой
экстремума тогда и только тогда, когда число
т — четное, где т — порядок первой не
обращающейся в нуль в точке х* производной.
Если /<w) (х*) > 0 , то в точке х* -
локальный минимум, а если f^m^ (х*)<0, то в
точке х* ~ локальный максимум. Если число
т нечетное, в точке х* нет экстремума.
Пример 21.1.1. Найти экстремум
функции f(x) = -х,2 - xj - я2 " х\ + *|*2 + 2*3
на множестве R .
1. Запишем необходимые условия
экстремума первого порядка:
Э/(х)
дх\
а/И,
дх2
У(*)
дх?
-2*| - 1 + х2 = 0 ,
= -2х2 + х\ = 0,
= -2*з +2 = 0.
В результате решения системы получаем
(2 1 У
стационарную точку ■** = ~Т» ~"Т» Ч •
2. Проверим выполнение достаточных
условий.
Первый способ. Матрица Гессе имеет вид
(-2 1 0 л
«(-•у-
1 -2 0
0 0-2
Д2
Так как Д| = -2 < 0,
4-1 = 3>0, Д3 =(-2)-3 =
-2 1
1 -21
= -6<0, т.е. знаки угловых миноров мере-
728
Глава 21.1. УСЛОВИЯ ЭКСТРЕМУМА ФУНКЦИЙ
дуются, начиная с отрицательного, то точка
х* — точка локального максимума.
Второй способ. Найдем собственные
значения матрицы Гессе, используя (21.1.13):
1-2 -X 1 О I
6ct(H-XE) = \ 1 -2-Х 0 =0.
I 0 0 —2 — Л. I
Отсюда (-2-Л,)Г(-2-Л,)2 -ll = 0 и Х{ =-2<0,
А,2 = -1 < 0, А,з = -3 < 0 . Так как все
собственные значения матрицы Гессе
отрицательны, то в точке х* — локальный максимум.
3. Вычислим значение функции в точке
локального максимума: / (х* ) = — .
Пример 21.1.2. Найти экстремум
функции
/ (jt) = JCj + Xj + Х^ + Х2Х3 - 3*! + 6х2 + 2
на множестве R .
I. Запишем необходимые условия
экстремума первого порядка:
Второй способ. Найдем собственные
значения матрицы Гессе, используя (21.1.13):
\в-Х 0 0
2-Х 1
1 2-AJ
= (6 - ^)Г(2- >.)2 - ll = 0.
Отсюда Х\ =6>0, ^2 = 3 > 0, А.з = 1 > 0, и точ-
1*
ка х является точкой локального минимума.
Исследуем точку х = (-1, - 4, 2) .
Первый способ. Матрица Гессе имеет вид
'-6 0 (П
. Так как Aj = -6 < 0,
"<»2-)=
0 2 1
0 1 2
А2 =
-6 0
0 2
= -12 < 0, А3 = -18 < 0, то
достаточные условия экстремума не
выполняются. Проверим необходимые условия
экстремума второго порядка. Главные миноры
первого порядка (т = 1) получаются из
-6 0 0|
У(*).
дху
У(*)
дх2
Щх)
= 3jcj2 -3 = 0,
2jc2 + хз +6 = 0,
= 2*з + х2 = 0 •
в результате вычеркивания
В результате решения системы получаем
две стационарные точки:
х1* =(1,-4, 2)Т ,хъ =(-1,-4, 2)Т.
2. Проверим выполнение достаточных и
необходимых условий второго порядка в
каждой стационарной точке двумя способами.
Исследуем точку х * = (1, - 4, 2) .
Первый способ. Матрица Гессе имеет вид
(6 0 0\
А3 = 0 2 1
0 1 2|
п - m -3 -I = 2 строк и двух столбцов с
одинаковыми номерами:-6, 2, 2 . Главные
миноры второго порядка (пг = 2) получаются
из А3 в результате вычеркивания п- пг =
= 3-2 = 1 строк и столбцов с одинаковыми
номерами: 3,-12,-12. Главный минор
третьего порядка (пг = 3 ) получается из A3 в
результате вычеркивания п- m = 3-3 = 0
строк и столбцов, т.е. совпадает с A3 = -18 .
Отсюда следует, что необходимые условия
экстремума второго порядка не выполняются.
Так как матрица Гессе не является нулевой,
то можно сделать вывод о том, что в точке
2*
х нет экстремума.
Второй способ. Найдем собственные
значения матрицы Гессе:
"(-'•)=
0 2 1
0 1 2
Так как А| = 6 > 0,
-6-Х 0 0
0 2-Х 1
0 1 2-AJ
= (-6-Х)Г(2-А,)2-11 = 0.
А2
6 0
0 2
12 > 0, А3 =18 > 0, то точка
х" является точкой локального минимума.
Отсюда А,!=-6<0, А,2=3>0, Х3=\>0,
т.е. собственные значения имеют разные
знаки. Поэтому в точке х * нет экстремума.
НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ УСЛОВНОГО ЭКСТРЕМУМА 729
3. Вычислим значение функции в точке
х * локального минимума: fix ) = -12.
Пример 21.1.3. Найти экстремум
функции
/(х) = 5х6 -36jc5 +^*4 -60jc3 +36
на множестве R .
1. Выпишем необходимое условие
экстремума первого порядка:
X
dx
ЗОх5 -180х4 + 330х3 -180х2
= 30х2(х-1)(х-2)(х-3) = 0.
Отсюда получаем стационарные точки:
х2*=1,х3*=2,х4*=3.
2. Проверим выполнение достаточных
условий экстремума:
; ; = 150х4 - 720х3 + 990х2 - ЗбОх;
dx2
/'(*'*) = 0, /'(х2*) = 60>0,
/'(х3*) = -120 < 0,/'(х4*) = 540 > 0.
Поэтому в точках х * , х — л окал ь-
3*
ныи минимум, а в точке х — локальный
г» 1*
максимум. В точке х достаточные условия
не выполняются, поэтому вычислим третью
производную:
/(3)(х1+) = 600х3-2160х2 +
+1980x-360|jci*=0 =-360.
Так как эта производная отлична от ну-
1*
ля и имеет нечетный порядок, то в точке х
нет экстремума.
21.1.3. Необходимые и достаточные
условия условного экстремума. Общая
постановка задачи записывается в форме
(21.1.1). По способу задания множества
допустимых решений X различают три типа
задач:
со смешанными ограничениями
/(**)= min/(x); /(**)= max/(л),
хеХ
(21.1.14)
\gj(x) = 0, у = 1,...,/и;/и< л]
[ \gj(x)<0, j = /и + 1,...,/?
с ограничениями типа равенств
/(**) = min/(x), /(**)= max/(x),
v ' хеХ v ' xeX
(21.1.15)
X ={x\gj (x) = 09 j = 1,...,т\ т<п],
с ограничениями типа неравенств
/(**)= min/ (*); / (**) = max/ (х),
XG A XG Л
(21.1.16)
JT={ x|gy(x)<0, у = 1,...,/я}.
Считается, что функции /(х); gj (*),
7 = 1,...,/? дважды непрерывно
дифференцируемы на множестве Rn .
Для решения задач (21.1.14) - (21.1.16)
находятся точки локальных экстремумов с
помощью необходимых и достаточных
условий первого и второго порядков, после чего в
них вычисляются значения целевой функции.
Для решения поставленных задач
применяется обобщенная функция Лагранжа:
Р
L(x,X0,X) = \0f{x) + y£bJgj{x)A2\AA7)
У=1
где A,Q Д|,... Др — множители Лагранжа (в
задачах (21.1.15), (21.1.16) р = т).
Классической функцией Лагранжа называется функция
Р
L{x,X) = f(x) + y£XjgJ(x). (21.1.18)
Ограничение gj (х) < 0 называется
активным в точке х*, если gj (x* I = 0 . Если
g: (х* 1 < 0 , то ограничение называется
пассивным.
Теорема 21.1.4 (необходимые условия
минимума (максимума) первого порядка).
Пусть х* — точка локального минимума
(максимума) в задаче (21.1.14). Тогда найдется
такое число Xq > 0 и вектор X =
730
Глава 21.1. УСЛОВИЯ ЭКСТРЕМУМА ФУНКЦИЙ
= IХ\,...,\*р I , не равные одновременно нулю
и такие, что выполняются следующие условия:
условие стационарности обобщенной
функции Лагранжа по х:
дь(х* Х0Х)
i— ;- = 0, / = !,...,*; (21.1.19а)
dXj
условие допустимости решения:
gj(x*) = 0, у = 1 /и;
,;/ (21.1.196)
gj\x ]<0,у = /и + 1,...,/>;
условие неотрицательности для условного
минимума:
X* >0, j = m + \,...,/?, (21.1.19b)
(условие неположительности для условного
максимума: X*j < 0 , j = т + 1,..., р );
условие дополняющей нежесткости:
*7*y(**) = 0» J = "* + \,...,p. (21.1.19 г)
Если при этом градиенты активных
ограничений-неравенств и ограничений-равенств в
точке х* линейно независимы (выполняется
условие регулярности), то Xq Ф 0 .
Замечания. 1. Точки х*,
удовлетворяющие системе (21.1.19), называются условно-
стационарными. Условия дополняющей
нежесткости и знакоопределенности множителей
Лагранжа записываются только для
ограничений-неравенств. Условие допустимости
решения, являющееся следствием постановки
задачи, включено в (21.1.19) для удобства
формирования алгоритма решения. Множество
индексов ограничений, активных в точке х ,
обозначается через Ja .
2. Если в решаемой задаче ограничения
записаны в форме gj (х) > 0, то их
необходимо переписать в виде, используемом в
(21.1.14), (21.1.15): -gj(x)<0.
3. Так как точка х* заранее неизвестна,
то проверка условия регулярности затруднена,
поэтому, как правило, рассматриваются два
случая: Xq = 0 и Xq * 0 . Если Xq * 0 , в
системе (21.1.19) полагают Xq = 1. Это
эквивалентно делению системы уравнений (21.1.19 а)
на Xq и замене X*;/Xq на X*:. При этом
обобщенная функция Лагранжа становится
классической. Точка экстремума,
удовлетворяющая системе (21.1.19) при Х^ *0,
называется регулярной, а при Xq = 0 —
нерегулярной. Случай A,j) = 0 отражает вырожденность
ограничений.
4. При Xq * 0 справедливы два важных
утверждения:
1) если функции f (х) , gj (х), j = т +
+!,...,/>, - выпуклые, а функции £/(*),
j = 1,..., т — линейные, то условия теоремы
21.1.4 являются одновременно и достаточными
условиями глобального минимума;
2) если функции «-/(*)», gj(x),
у = /и + 1 ,...,/>, выпуклые, а функции gj (x),
j = 1,..., т , линейные, то условия теоремы
21.1.4 являются одновременно и достаточными
условиями глобального максимума.
В обоих случаях множество допустимых
решений ЛГ выпукло.
5. Из условия дополняющей
нежесткости (21.1.19 г) следует, что если ограничение-
неравенство в точке х* пассивное, т.е.
g:(x*)<0, то X*j = 0 , а если - активное,
т.е. g. (х*) = 0 , то X*j > 0 (для минимума) и
Xj < 0 (для максимума).
Теорема 21.1.5 (достаточные условия
минимума (максимума) первого порядка).
Пусть имеется точка (х*,Х*\,
удовлетворяющая системе (21.1.19) при Xq Ф 0 ,
суммарное число активных ограничений-неравенств в
точке х* и ограничений-равенств совпадает с
числом п переменных (при этом условие
регулярности выполняется). Если Xj > 0 для всех
j е Jа , то точка х* - точка условного
локального минимума в задаче (21.1.14). Если
X* < 0 для всех j е Ja , то х* - точка
условного локального максимума.
Теорема 21.1.6 (необходимые условия
минимума' (максимума) второго порядка).
Пусть х* — регулярная точка минимума
НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ УСЛОВНОГО ЭКСТРЕМУМА 731
(максимума) в задаче (21.1.14) и имеется
решение 1х*,Х*\ системы (21.1.19). Тогда второй
дифференциал классической функции Лагранжа,
вычисленный в точке (х*Д*1, неотрицателен
(неположителен):
d2L(x*X)>0 (rf2L(x*,r)<0)
для всех dxe Rn , таких, что
d8j[x*) = °> 7 = 1,..,"* и
jeJa, X) >0 а* <0);
dgj(x*)<0, jeJa, Х*=0.
Теорема 21.1.7 (достаточные условия
экстремума второго порядка). Пусть имеется
точка 1х*,Х*\, удовлетворяющая системе
(21.1.19) при Xq Ф О. Если в этой точке
</21(х*Д*)>0 U2l(x*X}<Q\ для всех
ненулевых dxe Rn , таких, что
dgjr(**) = 0, у = 1,...,/и и
jeJa, X* >0 Д}<0);
dg;(x*)<0, jeJa, Х*=0,
то точка х* является точкой локального
минимума (максимума) в задаче (21.1.14).
Алгоритм решения задачи. Шаг 1.
Составить обобщенную функцию Лагранжа:
Р
L(x,X0 Д) = X0f(x) + £ Xjgj (x).
j=\
Шаг 2. Записать необходимые условия
минимума (максимума) первого порядка:
dL(x\X*0X)
а) ^— - = 0, / = 1,...,л;
dXj
б) gj(x*) = 0, у = 1,...,/я; gj(x*)<0,
у = /я+1,...,/?;
в) X*j>0, j = /и + 1,...,р (для
минимума), X*j<0, у =/и+ !,...,/> (для
максимума);
г) A,}gy-(x*) = 0, у=/я + 1,...,/>.
/#ог З. Решить систему для двух случаев:
1) Х*0 = О ;
2) A.Q Ф О (при этом поделить условия
«а», «в», «г» на Xq и заменить X*.- /Xq на АЛ ).
В результате найти
условно-стационарные точки х*, выделив из них
полученные при Xq Ф О (они могут быть
регулярными точками экстремума). В каждом из двух
случаев следует начинать с рассмотрения
2р~т вариантов удовлетворения условия «г»
дополняющей нежесткости.
Шаг 4. Для выделенных на шаге 3 точек
проверить достаточные условия экстремума
первого или второго порядка.
Для проверки достаточных условий
первого порядка следует:
а) определить число / ограничений-
равенств и активных ограничений-неравенств;
б) если / = п и X*j > О для всех
j e Ja , т.е. для всех активных ограничений-
неравенств, то в точке х* — локальный
минимум. Если / = п и X*j < О для всех
j e Ja , то в точке jc* - локальный
максимум. Если / < п или соответствующие
множители Лагранжа не удовлетворяют
достаточным условиям первого порядка, проверить
достаточные условия второго порядка.
Для проверки достаточных условий
второго порядка следует:
а) записать выражение для второго
дифференциала классической функции
Лагранжа в точке lx*,X*):d Llx*, Х*) =
п п d2L(x*X)
= Vy i L dxgdxr,
jLuLi дхдх J
б) записать условия, накладываемые на
первые дифференциалы
ограничений-равенств и активных в точке х* ограничений-
неравенств:
732
Глава 21.1. УСЛОВИЯ ЭКСТРЕМУМА ФУНКЦИЙ
п dg;[X*)
/=1 axi
и jeJa\ X) >0 (X) <0); (21.1.20)
. . // dg,- (x*)
/=1 dX'
в) исследовать знак второго
дифференциала функции Лагранжа для ненулевых
dx, удовлетворяющих (21.1.20). Если d2L(x*,
X*) > 0 , то в точке х* - условный
локальный минимум. Если d' L(x*, X*) < 0 , то в
точке х — условный локальный максимум.
Если достаточные условия экстремума не
выполняются, следует проверить выполнение
необходимых условий второго порядка
(теорема 21.1.6), следуя аналогичной процедуре.
Если они выполняются, то требуется
дополнительное исследование, а если нет, то в
точке х* нет условного экстремума.
Шаг 5. Вычислить значения функции в
точках условного экстремума.
Пример 21.1.4. Найти условный
экстремум в задаче
/ (х) = х2 + х\ -» extr ,
*,(*) = *, -1=0,
g2(x) = x{ +х2 -2<0.
1. Составим обобщенную функцию
Лагранжа:
£(хДоД) = ^о(*|2 +х\) +
+Х{ (х, -\) + Х2(х{ +*2 -2).
2. Выпишем необходимые условия
экстремума первого порядка:
Э£(хД0Д)
Во втором случае Xq * 0 ■ Поделим
уравнения системы, приведенной в п. 2, на
X X
Xq , заменяя — на Х{ и — на Х2 . Усло-
Xq Xq
вие «а» записывается в форме
Э£(хД)
дх{
dL(x,X)
Эх7
= 2х{ +Х{ + Х2 = 0,
2х2 + Х2 = 0 .
а)
Эх|
Э£(хД0 Д)
Эх?
= 2^0*1 + А.1 + А.2 =0,
= 2А,о*2 +^2 =^ '
б) х, -1 =0, х, + х2 -2<0;
в) Х2 > 0 (для минимума), А,2 < 0 (для
максимума);
г) ^2 (*, + х2 - 2) = 0 .
3. Решим систему для двух случаев.
В первом случае Xq = 0 . Тогда Х\ = 0
и А*2 = 0 , что противоречит теореме 21.1.4.
Остальные соотношения сохранят свой вид.
Рассмотрим 2р~т = 2 варианта
удовлетворения условия «г» дополняющей нежесткости:
1) Х2 = 0 . Тогда х2 = 0. Из
ограничения следует Х\ = 1 , а из условия «а» Х\ = -2 .
Имеем условно-стационарную точку А :
х\ - 1> *2 = 0» ^| = -2, А.2 = 0 , в которой
удовлетворяются необходимые условия и
минимума, и максимума;
2) Х2 Ф 0. Тогда хх + х2 - 2 = 0, 2х, +
+ Xi +Х2 = 0, 2х2 +Х2 =0, х{ - 1 = 0.
Получаем условно-стационарную точку
В: х,* = 1, Х2 = 1, А.7 = 0, Х*2 = -2 < 0 , в
которой удовлетворяются необходимые
условия максимума.
4. Проверим достаточные условия
экстремума.
Исследуем точку А. Ограничение-
неравенство не является активным. Поэтому
/ = 1 < п - 2 и достаточные условия первого
порядка не выполняются. Проверим условия
второго порядка: d L[A) = 2dx{ + 2dx2-
Так как ограничение g2 (х) < 0 в точке А
пассивно, то dg\ (A) = dx\ = 0 и d L(A) =
= 2dx\ > 0 при dx2 Ф 0 . Следовательно, в
точке А — условный локальный минимум. В
то же время целевая функция задачи
выпуклая, ограничение-равенство — линейное,
ограничение-неравенство — выпуклое. Поэтому
в точке А достигается глобальный минимум, а
достаточные условия второго порядка можно
было не проверять. Если бы искался
экстремум функции f(x) = = -Xj - Xj , то
функция «-/(х)» была бы выпуклой, а в точке А
достигался бы глобальный максимум.
НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ УСЛОВНОГО ЭКСТРЕМУМА 733
Исследуем точку В. Ограничение
g2 (х) ^ 0 является активным. Поэтому
/ = 2 = п = 2. Так как А.2 = -2 < 0 , то в
точке В выполняются достаточные условия
максимума первого порядка, и она является
точкой локального максимума. Из методических
соображений проверим достаточные условия
второго порядка: d2L(B) = 2dx2 + 2dx\ .
В точке В ограничение g2 (х) = О активно:
dg{(B) = dx{ =0, dg2(B) = dx{ + dx2 =0 .
Отсюда dxy = dx2 = 0 и d2L (B) = 0 .
Поэтому требуется дополнительное
исследование.
5. Значения функции в точках
экстремума: f(A) = \,f(B) = 2.
Пример 21.1.5. Найти условный
экстремум в задаче
/(*) = *! +х2 -» extr ,
g{ (x) = х2 + x\ - 2 = О .
Проверим условие регулярности. Так
т
как Vgj (х) = (2xj, 2х2) * 0 Для всех
хе X , то условие выполняется. Поэтому
будем пользоваться классической функцией
Лагранжа.
1. Составим функцию Лагранжа:
L(х,Х{) = х{ +х2 +\{ (х2 + х2 - 2).
2. Выпишем необходимые условия
экстремума первого порядка:
а) \ !/ = 1 + 2\{х{ = О =>
дх\
1 dL(x,X\)
=>Х2=-2^Г;
б) g,(x) = x12+x22-2 = 0.
3. Решением системы являются две
условно-стационарные точки:
A: xf =1,*2 =1Д1 = —^\
В: Х[ =-1,х2 =-1Д1 = —.
4. Проверим достаточные условия
экстремума:
а) d2L (х*, A.J) = 2X1 ^i2 + 2A.J dx\ , так
Э2£(*Л) Э21(дсД!)
как = = 2Х{,
ах, Э^2
d2L(x,Xi) _d2L(x,Xl) _
оХ[ Эх2 ох2 аХ[
б) dg{ (х*) = 2х\ dx{ + 2^2 dx2 = 0, так
dft(*) - Эд(х)
как —г = 2^, — = 2х2 ;
аХ\ оХ2
в) исследуем точку А. Получаем
dgi (A) - 2dxy + 2dx2 = О, откуда dxy = -dx2 .
С учетом полученного соотношения
d2L(A) = - dx2 -dx\ =- 2dx\ < О при
т
dx2*0. Поэтому в точке х*=(1, 1) —
регулярный условный локальный максимум.
Исследуем точку В. Получаем
dgi (B) = -2dxy - 2dx2 = О , откуда dx{ =
= - dx2 . С учетом полученного
соотношения d2L(B) = dx2 +dx2 = 2dx\ >0 при
т
dx2 Ф О . Поэтому в точке х* - (-1, - 1) -
регулярный условный локальный минимум .
5. Значения функции в точках
экстремума: f(A) = 2yf(B) = -2.
Глава 21.2
ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА
БЕЗУСЛОВНОГО ЭКСТРЕМУМА
Применение необходимых и
достаточных условий безусловного экстремума,
изложенных в п. 21.1.2, эффективно для решения
ограниченного числа примеров, в которых
вытекающие из условий соотношения имеют
аналитическое решение. Для решения
большинства практических задач они не могут
быть рекомендованы по следующим
причинам.
1. Целевая функция f (х) может не
иметь непрерывных производных до второго
порядка включительно.
734 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
2. Использование необходимого условия
первого порядка (21.1.6) связано с решением
системы п в общем случае нелинейных
уравнений, что представляет собой
самостоятельную задачу, трудоемкость решения которой
сравнима с трудоемкостью численного
решения поставленной задачи поиска
экстремума.
3. Возможны случаи, когда о целевой
функции известно лишь то, что ее значение
может быть вычислено с нужной точностью, а
сама функция задана неявно.
Большинство численных методов
оптимизации относится к классу итерационных,
т.е. порождающих последовательность точек в
соответствии с предписанным набором
правил, включающим критерий окончания. При
заданной начальной точке х методы гене-
0 1 2
рируют последовательность х , х , х ,...
к 1са-\
Преобразование точки х в х
представляет собой итерацию.
Для определенности рассмотрим задачу
поиска безусловного локального минимума:
f(x*)= min fix). (21.2.1)
v 7 xeRn
Численное решение задачи (21.2.1), как
правило, связано с построением
последовательности \х \ точек, обладающих
свойством
f(xk+l)<f(xk),k = 0,l,... (21.2.2)
Общее правило построения
последовательности \х > имеет вид
xk+l =xk +fkdk ? А: = 0,1,...,(21.2.3)
где точка х — начальная точка поиска; d —
приемлемое направление перехода из точки
к к+\
х в точку х , обеспечивающее
выполнение условия (21.2.2) и называемое
направлением спуска; tk — величина шага.
Начальная точка поиска х задается,
исходя из физического содержания решаемой
задачи и наличия априорной информации о
положении точек экстремума.
Приемлемое направление спуска d
должно удовлетворять условию
(v/(x*),dfM<0, A: =0,1,...,(21.2.4)
обеспечивающему убывание функции f(x).
Примером приемлемого направления
является направление вектора антиградиента:
dk=-Vf(xk).
Величина шага tk > 0 выбирается либо
из условия (21.2.2), либо из условия
минимума функции вдоль направления спуска:
/(xk + tkdk)^> min . (21.2.5)
v ' tk
Выбор шага tk из условия (21.2.5)
делает спуск в направлении d наискорейшим.
Последовательность \х \ называется
сходящейся к точке минимума х*, если
хк - х* -» 0 при к -» оо.
Сходимость последовательности \х >
при выборе приемлемого направления d и
к
величины шага t из условия (21.2.2) или
(21.2.5) зависит от характера функции f(x)
и от выбора начальной точки х .
В зависимости от наивысшего порядка
частных производных функции / (х),
используемых для формирования d и tk ,
численные методы решения задачи
безусловной минимизации (21.2.1) принято делить на
три группы.
1. Методы нулевого порядка,
использующие только информацию о значении
функции f(x) .
2. Методы первого порядка,
использующие информацию о первых производных
функции f(x).
3. Методы второго порядка, требующие
для своей реализации знания вторых
производных функции f(x).
Работоспособность метода еще не
гарантирована доказательством сходимости
соответствующей последовательности — нужна
определенная скорость сходимости. Заметим, однако,
что на практике следствия общей теории
сходимости должны использоваться с большой
осторожностью. Так, например, нельзя
оценивать алгоритмы только по величинам тео-
МЕТОДЫ НУЛЕВОГО ПОРЯДКА
735
ретических скоростей сходимости
генерируемых ими последовательностей, хотя эти
скорости в определенной степени определяют
эффективность методов; условия, при
которых они достижимы, реализуются редко.
Точно так же нельзя пренебрегать алгоритмом
лишь по той причине, что теоремы о
скорости его сходимости не доказаны: это может
объясняться низким качеством метода, но не
исключено, что доказательства нет просто
потому, что провести его очень сложно.
Рассмотрим последовательность \х \,
сходящуюся к х* . Предположим, что все ее
к
элементы различны и ни одна из точек х не
совпадает с х*. Наиболее эффективный
способ оценивания скорости сходимости состоит
к+\
в сопоставлении расстояния между х и
х* и расстояния между х и х* .
Последовательность \х > называется сходящейся с
порядком г , если г — максимальное число,
|х*+1-х'
для которого 0 < lim
*->~ II Jfc
X - X
г
< °о.
Поскольку величина г определяется
предельными свойствами \х >, она называется
асимптотической скоростью сходимости. Если
последовательность \х > — сходящаяся с
порядком г , то число с = lim
называется асимптотическим параметром
ошибки. Если г = 1, с < 1, то сходимость
линейная; если г = 2 , то сходимость
квадратичная; если г > 1 или г = 1, с = 0, то
сходимость сверхлинейная. Линейная сходимость
является синонимом сходимости со
скоростью геометрической прогрессии.
Одним из критериев сходимости, часто
используемым при сравнении алгоритмов,
является их способность эффективно
минимизировать квадратичные функции. Это
объясняется тем, что вблизи минимума
квадратичная функция может быть достаточно
хорошей аппроксимацией целевой функции.
Таким образом, алгоритм, который не дает
хороших результатов при минимизации
квадратичной функции, вряд ли может быть с
успехом использован в случае общей
нелинейной функции, когда текущая точка
находится в окрестности минимума.
21.2.1. Методы нулевого порядка.
Методы одномерной
минимизации. Требуется найти безусловный минимум
функции f(x) одной переменной, т.е. такую
точку х* е R , что /(х*) = min/(x).
xsR
Поставленная задача одномерной
минимизации может быть решена с помощью
необходимых и достаточных условий
безусловного экстремума (см. п. 21.1.2). Однако
проблема получения решения уравнения
df(x)
dx
■ О может оказаться весьма сложной.
Более того, в практических задачах функция
f(x) может быть не задана в аналитическом
виде или часто неизвестно, является ли она
дифференцируемой. Поэтому получение
численного решения поставленной задачи
является актуальным.
Замечания. 1. Для методов одномерной
минимизации типично задание априорной
информации о положении точки минимума с
помощью начального интервала
неопределенности Lq = [tfg , 1>q ] . Предполагается, что
точка минимума х* принадлежит интервалу
Lq , но ее точное значение неизвестно.
2. Большинство известных методов
одномерной минимизации применяется для
класса унимодальных функций.
Функция f(x) называется
унимодальной на интервале Lq = \Oq , b$ J , если она
достигает глобального минимума на [tfQ , Ь$ ]
в единственной точке х* , причем слева от
х* эта'функция строго убывает, а справа от
х* строго возрастает. Если
Oq < у < z < х*, то f(y) > f(z),
а если х* < у < Z ^ А) > то /(У) < /U) •
Отметим, что непрерывная строго
выпуклая функция является унимодальной.
Однако определению могут удовлетворять и
функции, не являющиеся непрерывными и
выпуклыми.
3. Методы одномерной минимизации
широко применяются в методах первого и
736 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
второго порядков для нахождения
оптимальной величины шага. При этом левая граница
начального интервала неопределенности, как
правило, совпадает с началом координат, т.е.
а0 =0.
Существуют две принципиально
различные стратегии выбора точек, в которых
производится вычисление значений функции.
Если все точки задаются заранее, до начала
вычислений, - это пассивная (параллельная)
стратегия. Если эти точки выбираются
последовательно в процессе поиска с учетом
результатов предыдущих вычислений, — это
последовательная стратегия. Примером
реализации пассивной стратегии является метод
равномерного поиска.
Последовательную стратегию можно
реализовать следующими способами:
а) применением квадратичной и
кубической интерполяции, где по нескольким
вычисленным значениям функции строится
интерполяционный полином, а его минимум
указывает на очередное приближение
искомой точки экстремума;
б) построением последовательности
вложенных друг в друга интервалов, каждый из
которых содержит точку минимума.
Стратегия поиска включает в себя три
этапа:
1. Выбор начального интервала
неопределенности. Границы Яо, bo интервала
должны быть такими, чтобы функция /(*)
была унимодальной.
2. Уменьшение интервала
неопределенности.
3. Проверку условия окончания. Поиск
заканчивается, когда длина текущего
интервала неопределенности [а^ , Ь^ ] оказывается
меньше установленной величины.
Ответом является множество точек,
принадлежащих последнему интервалу
неопределенности, среди которых каким-либо
образом выбирается решение задачи х* .
Замечания. 1. В некоторых методах
заранее задается или находится количество /V
вычислений функции. В этом случае
продолжительность поиска ограничена.
2. Для эвристического выбора
начального интервала неопределенности можно
применить алгоритм Свенна [Swann W.N.]:
1) задать произвольно следующие
параметры: х - некоторую точку, / > 0 —
величину шага. Положить к - 0 ;
2) вычислить значение функции в трех
точках: х° - /, х° , х° + t;
3) проверить условие окончания:
а) если /(х0-/)>/(х°)</(х°+г),
то начальный интервал неопределенности
найден: [а0 , ^ ] = Гх° - t, х° + N ;
б) если f(x0-t)<f(x°)>f(x°+t),
то функция не является унимодальной, а
требуемый интервал неопределенности не может
быть найден. Вычисления при этом
прекращаются (рекомендуется задать другую
начальную точку х );
в) если условие окончания не
выполняется, то перейти к шагу 4;
4) определить величину А :
а) если /(x0->)>/(x°)>/(x°+f),
то А = /; а0 = х° ; х[ = х° + /; к = 1;
б) если f(x°-t)<f(x°)<f(x°+t),
то А = -/; bo = х° ; х[ = х° -1\ к = 1 ;
5) найти следующую точку
хк+\ =хк + 2* д .
6) проверить условие убывания
функции:
а) если /(**+| )</(**) и А = / , то
а0=хк;
если f(xk+{ )<f(xk) и А = -/,то
Ьо=хк;
в обоих случаях положить к = к + 1 и
перейти к шагу 5;
б) если / (xk+l 1 > / (хк 1, процедура
завершается. При А = / положить bo = х ,
а при А = -/ положить а$ = jc . В
результате имеем [яо, bo ] - искомый начальный
интервал неопределенности.
3. Уменьшение интервала
неопределенности, осуществляемое при использовании
последовательной стратегии, проводится на
основании вычисления функции в двух
точках текущего интервала. Свойство
унимодальности позволяет определить, в каком из
возможных подынтервалов точка минимума
отсутствует.
МЕТОДЫ НУЛЕВОГО ПОРЯДКА
737
Пусть в точках у и z интервала [я, £]
вычислены значения функции: f (у) и
/(г). Если f(y)>f(z), то х*е[а, у) и
поэтому х* е [у, b] (рис. 21.2.1, а). Если
f(y)<f{z)> TO x*t(z,b] и поэтому
х* е [я, z\ (рис. 21.2.1, б). Иными словами,
в качестве нового интервала берется
«гарантирующий интервал», наверняка
содержащий точку минимума. Если f(y) = f(z),
в качестве нового интервала можно взять
любой из изображенных на рис. 21.2.1.
Для оценки эффективности алгоритмов
уменьшения интервала неопределенности при
заданном числе N вычислений функции
используется критерий R(N).
Характеристикой R(N) относительного
уменьшения начального интервала
неопределенности называется отношение длины
интервала, получаемого в результате N вычислений
функции, к длине начального интервала не-
М
определенности R(N) =
М
Метод равномерного поиска. Метод
относится к пассивным стратегиям. Задается
начальный интервал неопределенности
А) = [д0 > А) ] и количество вычислений
функции N. Вычисления проводятся в N
равноотстоящих друг от друга точках (при этом
интервал Lq делится на N +1 равных
интервалов). Путем сравнения величин /(*,),
i = l,...,N, находится точка хк, в которой
значение функции наименьшее. Искомая
точка минимума х* считается заключенной в
интервале [x*_i, ;fy+i ] .
Алгоритм. Шаг 1. Задать начальный
интервал неопределенности Lq = [cjq , £fo ], N —
количество вычислений функции.
Шаг 2. Вычислить точки дс,- = uq +
.(4)-яо)
+/ , равноотстоящие друг от друга.
N + \
Шаг 3. Вычислить значения функции в
N найденных точках: / (х,), / = 1,..., N.
Шаг 4. Среди точек xt?, / = 1,...,7V,
найти такую, в которой функция принимает
наименьшее значение f (xk ) = min /(*/).
Шаг 5. Точка минимума х*
принадлежит интервалу: х* е [.fy-i, xk+i ] = L^, на
котором в качестве приближенного решения
может быть выбрана точка х* = х^ .
Замечания. 1. Для метода равномерного
поиска характеристика относительного
уменьшения начального интервала
неопределенности находится по формуле R(N) =
2 кг
, где N — количество вычислении
N + \
функции. Если задана величина R(N) , то
требуемое для достижения желаемой точности
количество вычислений функции
определяется как наименьшее целое число,
удовлетворяющее условию N >
R(N)
■-1.
Рис. 21.2.
24 — 7706
738 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
2. Разбиение интервала [#о, Ьц ] на
N +1 равных частей используется также в
методе перебора. Для решения задачи этим
методом следует:
а) вычислить точки xi = я0 +
(А) ~ао)
+/ , / = 0,..., N + 1, равноотстоя-
N + \
щие друг от друга;
б) вычислить значения функции в
найденных точках: /(*/), / = 0,...,N + 1;
в) среди точек X/, / = 0,..., N + 1,
найти такую, в которой функция
принимает наименьшее значение: f{xk) =
= min /(*/).
o<i<N+i v ;
Метод деления интервала пополам. Метод
относится к последовательным стратегиям и
позволяет исключить из дальнейшего
рассмотрения на каждой итерации в точности
половину текущего интервала
неопределенности. Задается начальный интервал
неопределенности, а алгоритм уменьшения интервала,
являясь «гарантирующим» (см. рис. 21.2.1),
основан на анализе величин функции в трех
точках, равномерно распределенных на
текущем интервале (делящих его на четыре
равные части). Условия окончания процесса
поиска стандартные: поиск заканчивается, когда
длина текущего интервала неопределенности
оказывается меньше установленной величины.
Алгоритм. Шаг 1. Задать начальный
интервал неопределенности Z<)=[flo,A)] и
/ > 0 - требуемую точность.
Шаг 2. Положить к = О .
Шаг 3. Вычислить среднюю точку хк =
ак +h
> \kk\ = bk -ак, f(xck).
\kk
Шаг 4. Вычислить точки: ук = ак +
Zk =Ьк -i-ji и f(yk), f(zk).
Заметим, что точки ук, х°к, Zk делят
интервал на четыре равные части.
Шаг 5. Сравнить значения f(yk) и /(-х£)'
а) если f(yk ) < f[xk )» исключить
интервал (хск, Ьк , положив Ьк+[ = х°к, ак+[ =
= ак. Средней точкой нового интервала
становится точка ук '. хк+у - ук (рис. 21.2.2, а).
Перейти к шагу 7;
б) если f[yk) > /(х°к I, перейти к шагу 6.
Шаг 6. Сравнить f(zk) с /(*£):
а) если f(zk ) < f(xk )» исключить
интервал \ак , хск \, положив дл+1 = х£,
bk+\ = £fc . Средней точкой нового интервала
становится точка Zk • *£+| = Zk (рис. 21.2.2, б).
Перейти к шагу 7;
б) если /(zjfc)>/fxjn, исключить
интервалы [ак ,ук ), (zk ,bk ] , положив ял+1 =
= ^ , bk+i = zk • Средней точкой нового
интервала останется х°к :л£+| = *£ (Рис- 21.2.2, в).
Текущий интервал
Текущий интервал
Рис. 21.2.2
Текущий интервал
МЕТОДЫ НУЛЕВОГО ПОРЯДКА
739
Шаг 7. Вычислить U2(Jfc+l) =|^fc+l -tffc+ll
и проверить условие окончания:
а) если Z^+i) < /, процесс поиска
завершается и х* е L2(k+\) = [ак+[, Ьк+[ ].
В качестве приближенного решения можно
взять середину
последнего интервала:
х = х
к+{
б) если U<2(jfc+i) > I, то положить
к = к + 1 и перейти к шагу 4.
Замечания. 1. Средняя точка
последовательно получаемых интервалов всегда
совпадает с одной из трех пробных точек,
найденных на предыдущей итерации. Следовательно,
на каждой итерации требуются два новых
вычисления функции.
2. Для метода деления интервала
пополам характеристика относительного
уменьшения начального интервала неопределенности
находится по формуле R(N) = —-—, где N —
2N/2
количество вычислений функции. Если задана
величина R(N), то требуемое для
достижения желаемой точности количество
вычислений функции находится как наименьшее це-
hr^2hiR(N)
лое, удовлетворяющее условию N > —.
Ill 0,5
3. Текущие интервалы имеют четные
номера Lq, Ь},^,..., где индекс указывает
на сделанное количество вычислений функции.
Метод дихотомии. Метод относится
к последовательным стратегиям. Задается
начальный интервал неопределенности и
требуемая точность. Алгоритм опирается на
анализ значений функции в двух точках (см. рис.
21.2.1). Для их нахождения текущий интервал
неопределенности делится пополам и в обе
е
стороны от середины откладывается по —,
где е - малое положительное число. Условия
окончания процесса поиска стандартные:
поиск заканчивается, когда длина текущего
интервала неопределенности оказывается
меньше установленной величины.
Алгоритм. Шаг 1. Задать начальный
интервал неопределенности Lq = [#o, £fo ],
е > 0 — малое число, / > 0 — точность.
Шаг 2. Положить к = О .
a l + Ьь. - е
Шаг 3. Вычислить ук = ——-= ,
ак + h + e
/(л). ?*=-
:, /(*).
Шаг4. Сравнить /(ук ) с f(zk)'
а) если / (ук ) < / (zk ) , положить
ак+\ = ак > **+l = Zk (рис. 21.2.3, а) и
перейти к шагу 5;
б) если / (ук )> f(Zk), положить
ак+[ = Ук > Ьк+1 = h (Рис- 21-2-3> Ф-
Шаг 5. Вычислить U-2(jfc+l) = |^А:+1 ~
~ак+\ I и проверить условие окончания:
а) если U2(fc+1) - ^' процесс поиска
завершается и х* е Z^(A:+1) = [ак+[ > Ьк+\ ] •
*■ х
Текущий интервал
а)
Новый интервал
1< >|
Текущий интервал
б)
Рис. 21.2.3
24*
740 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
В качестве приближенного решения
можно взять середину последнего интервала:
* „ ак+\ + Ь/с+\ .
2
б) если U2(ife+i) >/, положить к =
= к + 1 и перейти к шагу 3.
Замечания. 1. Для метода дихотомии
характеристика относительного уменьшения
начального интервала неопределенности
находится по формуле R(N) = .... , где N —
2N/2
количество вычислений функции.
2. Текущие интервалы неопределенности
Lq,L2,L4,... имеют четные номера,
указывающие на количество сделанных вычислений
функции, как и в методе деления интервала
пополам.
3. Эффективность методов дихотомии и
деления интервала пополам при малых е
можно считать одинаковой.
Метод золотого сечения. Для построения
конкретного метода одномерной
минимизации, работающего по принципу
последовательного сокращения интервала
неопределенности, следует задать правило выбора на
каждом шаге двух внутренних точек. Конечно,
желательно, чтобы одна из них всегда
использовалась в качестве внутренней и для
следующего интервала. Тогда число вычислений
функции сократится вдвое и одна итерация
потребует расчета только одного нового
значения функции. В методе «золотого сечения»
в качестве двух внутренних точек выбираются
точки золотого сечения.
Точка производит «золотое сечение»
отрезка, если отношение длины всего отрезка к
большей части равно отношению большей
части к меньшей.
На отрезке \oq , bp 1 имеются две
симметричные относительно его концов точки
Уо и *о:
Ад - Дц =А)~.Уо = Ад - flp =Zq -ар =
А) -Уо У о -°о Zq -а0 Ад - *о
= LL^lj618.
Кроме того, точка у$ производит
золотое сечение отрезка [tfQ , Zjq ], а точка Zo ~
отрезка [у0 , ^ ] •
Метод относится к последовательным
стратегиям. Задается начальный интервал
неопределенности и требуемая точность.
Алгоритм уменьшения интервала опирается на
анализ значений функции в двух точках (см.
рис. 21.2.1). В качестве точек вычисления
функции выбираются точки «золотого
сечения». Тогда с учетом свойств «золотого
сечения» на каждой итерации, кроме первой,
требуется только одно новое вычисление
функции. Условия окончания процесса поиска
стандартные: поиск заканчивается, когда
длина текущего интервала неопределенности
оказывается меньше установленной величины.
Алгоритм. Шаг 1. Задать начальный
интервал неопределенности Lq = [tfQ , bp ],
точность / > 0.
Шаг 2. Положить к = 0 .
Шаг 3. Вычислить
Уо = <*о +—— (А) -^о);
ъ-Js
Zo =a0+bo-y0,—^— = 0,38196.
Шаг 4. Вычислить f (Ук ), /(Zk) •
Шаг 5. Сравнить f {Ук) и f{Zk):
а) если f(y/c)^f(Zk)> TO положить
ак+\ = ак > bk+\ = Zk и ук+[ = ак+\ + Ьк+\ -
~Ук> Zk+[ =Ук (Рис- 21.2.4, а). Перейти к
шагу 6;
б) если /{Ук)>/{%к)> положить
ак+\ = Ук > bk+i =Ьк и Ук+[ = Zk , Zk+[ =
= ак+[ + **+1 -Zk (Рис. 21.2.4, б).
Шаг 6. Вычислить А = \вк+[ - bk+[ | и
проверить условие окончания:
а) если А < /, процесс поиска
завершается и х* е [tffc+l, bk+i ] • В качестве
приближенного решения можно взять середину
* ак+[ "*" Ьк+\
последнего интервала: х = ;
б) если А > /, положить к = к + 1 и
перейти к шагу 4.
Замечания. 1. Для метода «золотого
сечения» характеристика относительного
уменьшения начального интервала
неопределенности находится по формуле R(N) =
= (0,618) , где N - количество
вычислений функции. Если задана величина R(N),
МЕТОДЫ НУЛЕВОГО ПОРЯДКА
741
Текущий интервал
ч)
+ X
Текущий интервал
Рис. 21.2.4
pi = !_£"= \-Ц = .. . = 1,618.
то требуемое для достижения желаемой
точности количество вычислений функции
находится как наименьшее целое число, удовле-
„ , In R(N)
творяющее условию /V > 1 + — .
In 0,618
2. Текущие интервалы неопределенности
имеют следующий вид: Lq , Lq, L$, Z4,..
Они отражают тот факт, что на первой
итерации проводится два вычисления функции,
а на последующих — по одному. Сокращение
длины интервала неопределенности постоян-
м м ы
М М М
Метод Фибоначчи. Для построения
эффективного метода одномерной
минимизации, работающего по принципу
последовательного сокращения интервала
неопределенности, следует задать правило выбора на
каждом шаге двух внутренних точек. Конечно,
желательно, чтобы одна из них всегда
использовалась в качестве внутренней и для
следующего интервала. Тогда количество
вычислений функции сократится вдвое, и одна
итерация потребует расчета только одного нового
значения функции. В методе Фибоначчи
реализована стратегия, обеспечивающая
максимальное гарантированное сокращение
интервала неопределенности при заданном
количестве вычислений функции и претендующая на
оптимальность. Эта стратегия опирается на
числа Фибоначчи, которые определяются по
формуле
F0=F{=1 Fk=Fk_{+Fk_2,k = 2,3,4,....
Последовательность чисел Фибоначчи
имеет вид: 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89,
144, 233, ... .
Метод относится к последовательным
стратегиям. Задается начальный интервал
непределенности и количество N вычислений
функции. Алгоритм уменьшения интервала
опирается на анализ значений функции в двух
точках (см. рис. 21.2.1). Точки вычисления
функции находятся с использованием
последовательности из N + I чисел Фибоначчи.
Как в методе золотого сечения, на первой
итерации требуются два вычисления
функции, а на каждой последующей — только по
одному. Условия окончания процесса поиска
стандартные: поиск заканчивается, когда
длина текущего интервала неопределенности
оказывается меньше установленной величины.
Алгоритм. Шаг 1. Задать начальный
интервал неопределенности Lq = [я0 » А) ] 5
/ > 0 — допустимую длину конечного
интервала, е > 0 — константу различимости.
Шаг 2. Найти количество ./V вычислений
функции как наименьшее целое число, при
Ы
котором удовлетворяется условие Ffq > —— ,
и числа Фибоначчи Fq ,/},..., /дг .
Шаг 3. Положить к = О .
Шаг 4. Вычислить у$ = Qq +
rN-2
?N
Шаг 5. Вычислить f(yk ), f(zk ) •
Шаг 6. Сравнить f(yk ) с f(zk ):
а) если f(yk ) < f(zk ), положить
ак+\ = ак; ьк+\ = ч; Zk+\ = Ук \
FN-k-3
Ук+\ = ак+\ +
FN-k-\
-(h+\ ~ак+\)-
742 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
Перейти к шагу 7;
б) если f(yfc)>f(Zfc)y положить
ak+i = Ук i bk+i = h J Ук+1 = *к '•>
, FN-k-2 (и „ \
Zk+\ = ак+\ + -£ {<>к+\ -ак+1)-
Шаг 7. Проверить условие окончания и
в случае необходимости сделать
заключительное N-e вычисление функции для
получения решения:
а) если к ± N -Ъ у положить к = к + 1
и перейти к шагу 5;
б) если к = N - 3, то всегда
(aN_2 + bN_2)
yN-2 = ZN-2 = ^ ' TC- отсУтст-
вует точка нового вычисления функции.
Следует положить: yN_i = yN_2 = Zn-2 '•> Zn-{ =
= .Vjv-l + e. В точках yN_i и Zn-{
вычисляются значения функции и находятся
границы конечного интервала неопределенности:
если / (>>7у-1) < / (zn-\ ), положить
aN-\ = aN-2 » bN-\ = Zn-[ i
если / (ун-\) > / (Zn-\ ) > положить
aN-\ = УИ-\ > bN-\ = &N-2 •
Процесс поиска завершается и
х* е [я#_1, Ьц_\ ]. В качестве
приближенного решения можно взять любую точку
последнего интервала, например, его середину
х* „ aN-l + l>N-l
2
Замечания. 1. Для метода Фибоначчи
характеристика относительного уменьшения
начального интервала неопределенности
находится по формуле R(N) = , где TV —
FN
количество вычислений функции.
2. При заданном количестве N
вычислений функции метод Фибоначчи обеспечивает
минимальную величину конечного интервала
неопределенности.
3. Нумерация интервалов
неопределенности такая же, как в методе золотого
сечения: Lq , Lfi ,L$, I4 ,••• • На к-й итерации
длина интервала неопределенности сокраща-
ется по правилу — .
FN-k
Метод квадратичной интерполяции.
Метод квадратичной интерполяции (метод Пау-
элла [Powell M. J. D.]) относится к
последовательным стратегиям. Задается начальная точка
и с помощью пробного шага находятся три
точки так, чтобы они были как можно ближе
к искомой точке минимума. В полученных
точках вычисляются значения функции. Затем
строится интерполяционный полином второй
степени, проходящий через имеющиеся три
точки. В качестве приближения точки
минимума берется точка минимума полинома.
Процесс поиска заканчивается, когда
полученная точка отличается от наилучшей из
трех опорных точек не более чем на заданную
величину.
Алгоритм. Шаг 1. Задать начальную
точку Х[ , величина шага Дх > О, Е[ и г2 —
малые положительные числа,
характеризующие точность.
Шаг 2. Вычислить х2 = Х\ + Ах .
Шаг 3. Вычислить f{x\)=f\ и f(x2) = fa-
Шаг 4. Сравнить /(Х|) с f(x2):
а) если f(x\)>f (*2)» положить
х3 = х{ + 2Ддс (рис. 21.2.5, а);
б) если / (х[) < / (х2), положить
х3 =х{ -Ах (рис. 21.2.5, б);
Шаг 5. Вычислить /(*з ) = Уз •
Шаг 6. Найти Fmln = min{/j, /2, /3},
*min — xi -J \xi ) = Anin •
Шаг 7. Вычислить точку минимума
интерполяционного полинома, построенного по
трем точкам:
2 (*2-*3)/i+(*3-*l)/2+(*l ~*2)/з '
и величину функции f(x) (рис. 21.2.5).
Если знаменатель в формуле для х на
некоторой итерации обращается в нуль, то
результатом интерполяции является прямая.
В этом случае рекомендуется обозначить
Х\ = хт;п и перейти к шагу 2.
Шаг 8. Проверить выполнение условий
окончания:
Лтип ~ /(*)l o |*min -*| ^ о
Тогда:
а) если оба условия выполнены, проце
дура закончена и х* = х ;
МЕТОДЫ НУЛЕВОГО ПОРЯДКА
743
Хз Ах Х\ Ах х2
б)
Рис. 21.2.5
б) если хотя бы одно из условий не
выполнено и х е [*i, Хз ] , выбрать наилучшую
точку (xmjn или х ) и две точки по обе
стороны от нее. Обозначить эти точки в
естественном порядке и перейти к шагу 6;
в) если хотя бы одно из условий не
выполнено и х g [xj, х3 ] , то положить Xj = х
и перейти к шагу 2.
Замечание. Шаги 1—4 алгоритма
позволяют выяснить направление убывания
функции, а в некоторых случаях определить
интервал, на котором функция является
унимодальной.
Метод конфигураций.
Рассматривается решение задачи (21.2.1). Метод
конфигураций (метод Хука—Дживса [R. Hooke,
Т.А. Jeeves]) представляет собой комбинацию
исследующего поиска с циклическим
изменением переменных и ускоряющего поиска по
образцу. Исследующий поиск ориентирован на
выявление локального поведения целевой
функции и определение направления ее
убывания вдоль «оврагов». Полученная
информация используется при поиске по образцу при
движении вдоль «оврагов».
Исследующий поиск начинается в
некоторой начальной точке х , называемой старым
базисом. В качестве множества направлений
поиска выбирается множество координатных
направлений. Задается величина шага,
которая может быть различной для разных
координатных направлений и переменной в
процессе поиска. Фиксируется первое
координатное направление и делается шаг в сторону
увеличения соответствующей переменной.
Если значение функции в пробной точке
меньше значения функции в исходной точке,
шаг считается удачным. В противном случае
необходимо вернуться в предыдущую точку
и сделать шаг в противоположном
направлении с последующей проверкой
поведения функции. После перебора всех
координат исследующий поиск завершается.
Полученная точка называется новым базисом (на
рис. 21.2.6 в точке х проведен исследующий
поиск и получена точка х — новый базис).
Если исследующий поиск с данной
величиной шага неудачен, то она уменьшается и
процедура продолжается. Поиск
заканчивается, когда текущая величина шага станет
меньше некоторой величины. Поиск по
образцу заключается в движении по направлению
от старого базиса к новому (от точки х че-
J
рез точку х
1 2
из точки х через точку х ,
х через х на рис. 21.2.6). Величина
ускоряющего шага задается ускоряющим
множителем X. Успех поиска по образцу
определяется с помощью исследующего поиска из
полученной точки (например, из точек 6, 11, 15
на рис. 21.2.6). Если при этом значение в
наилучшей точке меньше, чем в точке
предыдущего базиса, то поиск по образцу удачен
(точки 6, 11 — результат удачного поиска по
образцу, а точка 15 — неудачного). Если
поиск по образцу неудачен, происходит возврат
в новый базис, где продолжается
исследующий поиск с уменьшенным шагом.
На рис. 21.2.6 удачный поиск
отображается сплошными линиями, а неудачный —
штриховыми, числа соответствуют
порождаемым алгоритмом точкам. Обозначим через
d\ ,...,dn координатные направления:
, -, dn ='
</, =
f]
0
[°J
, d2 =
f°)
1
1
При поиске по направлению d-t
меняется только переменная х,-, а остальные
переменные остаются зафиксированными.
744 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
/(х) = (*1+1)2+Х22=4
Рис. 21.2.6
Алгоритм. Шаг 1. Задать начальную
точку х , число е > 0 для остановки алгоритма,
начальные величины шагов по координатным
направлениям Д|,..., Дя > е , ускоряющий
множитель X > О , коэффициент уменьшения
шага а > 1 . Положить У = дс° , / = 1, к = О.
Шаг 2. Осуществить исследующий поиск
по выбранному координатному направлению:
а) если /(У + АД) </(У), т.е. fty,
...,у' +А/,...,^)</(у ,...,У ,...,^), шаг
считается удачным. В этом случае следует
положить у = у1 + Ajdj и перейти к шагу 3;
б) если в п. «а» шаг неудачен, то
делается шаг в противоположном направлении. Ее-
ли /(У-ДД-)</(У),т.е. /(У,.-.,У-
-А/,...,^)</(>;|/,...,у,...,^), шаг
считается удачным. В этом случае следует
положить у - у1 - Д/*/,- и перейти к шагу 3;
в) если в пп. «а» и «б» шаги неудачны,
если fly" ) < flxr ), перейти к шагу 4;
если /(У1*1) > fix* ) перейти к шагу 5.
Шаг 4. Провести поиск по образцу. По-
Х(хм-хк),
ДОЖИТЬ JC
.к+\
-.у"+],у] =хк+] +
/ = 1, к = к + 1 и перейти к шагу 2.
Шаг 5. Проверить условие окончания:
а) если все А, < е, то поиск закончить:
х* = хк
б) для тех / , для которых А/ > е,
уменьшить величину шага: А/ =
Поло-
ос
жить У = хк , хк+]
j+\
У'.
положить у
Шаг 3. Проверить условия:
а) если / < п , то положить / = / + 1 и
перейти к шагу 2 (продолжить исследующий
поиск по оставшимся направлениям);
б) если / = п , проверить успешность
исследующего поиска:
дс , к = к + 1, / = 1 и
перейти к шагу 2.
Замечания. 1. В алгоритме можно
использовать одинаковую величину шага по
координатным направлениям, т.е. вместо
Д|, Д2 ,..., Дп применять А.
2. Существует модификация метода, где
при исследующем поиске и поиске по
образцу используется одномерная минимизация.
Тогда, если функция f (х)
дифференцируема, метод сходится к стационарной точке.
Метод деформируемого
многогранника. В основу метода
деформируемого многогранника (метода Нелдера—
Мида [J.A. Nelder, R. Mead]) положено
построение последовательности систем п + 1
МЕТОДЫ НУЛЕВОГО ПОРЯДКА
745
точек х1 (к), i = 1,...,п + 1 , которые
являются вершинами выпуклого многогранника.
Точки системы х1 (к + 1),/ = 1,...,п + 1 на
к + 1 итерации совпадают с точками системы
х1 (к), i = {,...,п + 1 , кроме / = И , где точка
х (к) — наихудшая в системе х1 (к), / = 1,...,
я + 1,т.е. flxh(k))= max fix1 (к)). Точ-
^ ' 1</'<л+1 V /
h
ка х (к) заменяется на другую точку по
специальным правилам, описанным ниже. В
результате многогранники деформируются в
зависимости от структуры линий уровня
целевой функции, вытягиваясь вдоль длинных
наклонных плоскостей, изменяя направление
в изогнутых впадинах и сжимаясь в
окрестности минимума. Построение последовательности
многогранников заканчивается, когда значения
функции в вершинах текущего многогранника
отличаются от значения функции в центре
тяжести системы х1 (к), i = l,...,/i + 1; / Ф И ,
не более чем на е > 0 .
Алгоритм. Шаг 1. Задать координаты
I и+1
вершин многогранника х ,...,х ;
параметры отражения а, сжатия р, растяжения у;
число е > 0 для остановки алгоритма.
Положить к = 0 (последующие шаги 2-6
соответствуют текущему номеру к системы точек).
Шаг 2. Среди вершин найти
/ h
«наилучшую» х и «наихудшую» х ,
соответствующие минимальному и максимальному
значениям функции:
/(**)= min f(xJ),
V I y=l,...,/H-| ^ '
а также точку Xs , в которой достигается
второе по величине после максимального
значение функции /1дсМ.
Шаг 3. Найти «центр тяжести» всех
вершин многогранника, за исключением
наихудшей
xh:x"+2=-
п
и+1
JV -ХИ
Ь'=| J
1 л+1
j*h
Шаг 4. Проверить условие окончания:
а) если
•-Urg'M-'l*"1)]
2 I 2
<е,
процесс поиска можно завершить и в качестве
приближенного решения взять наилучшую
* I
точку текущего многогранника: х = х ;
б) если а > е, продолжать процесс.
Шаг 5. Выполнить операцию
отражения наихудшей вершины через центр
тяжести хп+2 (рис. 21.2.7): хп+3 = х"+2 +
+а(х"+2 -xh У
Шаг 6. Проверить выполнение условий:
а) если / (хп+3 1 < / (х1 1, выполнить
операцию растяжения (рис. 21.2.7, б):
yi+4 =*"+2+у^+3_у1+2|
Найти вершины нового многогранника:
если flxn+4)< fix1), то вершина
х заменяется на х (при п — 1 многогран-
ник будет содержать вершины х , х , х ).
Затем следует положить к = к + 1 и перейти
к шагу 2;
если flxn+4 J > fix1), то вершина xh
заменяется на х (при п = 2
многогранник будет содержать вершины х , х , х ).
Далее следует положить к = к + 1 и перейти
к шагу 2;
б) если f(xs)<f(xn+3)<f(xh), то
выполнить операцию сжатия (рис. 21.2.7, в):
Следует заменить вершину х на х"+ ,
положить к = к + 1 и перейти к шагу 2 (при
п - 2 многогранник будет содержать верши-
I Ч 7
НЫ X , X , X ).
в) если /(*')</(х"+3 )</(**), то
вершину х заменить на х"+ . При этом
следует положить к = к +1 и перейти к
шагу 2;
г) если / (х"+3 ) > f (xh ), выполнить
операцию редукции (рис. 21.2.7, г).
Формируется новый многогранник с уменьшенными
746 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
е"+3 = х5 Д_Ч.
\
хп+3 я х5
х»+4 т х6
Ч
/
А/(*л+4) < /(*')
«;
б)
X2 =ХЛ
х"+3 = Xs
«)
г)
Рис. 21.2.7
вдвое сторонами и вершиной х : х3 =
= х! +0,5(х3 -х1}, у = 1,...,/i + l. При
этом следует положить & = А: + 1 и перейти к
шагу 2.
Замечание. Нел дер и Мид рекомендуют
использовать параметры а = 1;р = 0,5;
у = 2; Павиани (D. Paviani) - а = 1; 0,4 <
< Р < 0,6; 2,8 < у < 3 ; Паркинсон и
Хатчинсон (J.M. Parkinson, D. Hutchinson) -
а = 2; р = 0,25; у = 2,5 . В последнем случае
в рамках операции отражения фактически
выполняется растяжение.
Метод Розенброка.
Применяется для решения задачи (21.2.1).
Пусть d\,d2,-.,dn — линейно
независимые векторы, по норме равные единице.
Они называются взаимно ортогональными,
если для всех / = 1,...,я справедливо условие
d[dj=0J*i.
Суть метода Розенброка [Rosenbrock H.H.]
состоит в следующем. Задается начальная
точка. Из нее осуществляется итеративный
поиск направления убывания функции с
помощью изменяемых дискретных шагов вдоль
п линейно независимых и ортогональных
направлений. В случае удачного шага в
исследуемом направлении его значение на
следующей итерации увеличивается с помощью
коэффициента растяжения, а в случае неудачи
уменьшается за счет умножения на
коэффициент сжатия (при этом направление поиска
изменяется на противоположное). Поиск в
системе текущих направлений проводится до
тех пор, пока все возможности уменьшения
функции не будут исчерпаны. Если по
каждому направлению поиска имеет место
неудача, строится новое множество линейно
независимых и ортогональных направлений, и
циклический поиск по отдельным
направлениям продолжается. Новые направления
поворачиваются по отношению к предыдущим
так, что они оказываются вытянутыми вдоль
оврага (рис. 21.2.8).
МЕТОДЫ НУЛЕВОГО ПОРЯДКА
747
t X2
*\
Рис. 21.2.8
Алгоритм. Шаг I. Задать начальную
точку х°, число е > 0 для остановки алгоритма,
коэффициенты растяжения а > 1 и сжатия
-1 < Р < 0, в качестве начальных линейно
независимых и ортогональных направлений d[,
d2,...,dn выбрать координатные направления:
4 =
о
к0;
1^2 =
v у
,...,dn =
0
V1.
начальную длину шага вдоль каждого из
направлений поиска Aj ,...,Д„ > 0; N —
максимальное число неудачных серий шагов по
всем направлениям на одной итерации.
Положить у = х°, к = 0, / = 1, А,- = А? для
всех /'.
Шаг 2. Сделать шаг по /-му направлению:
а) если / 1у' + А,-*/,-1 < / 1у1), шаг
считается удачным. В этом случае следует
положить У+1 = у' + Ajdj, А, = аА/ и перейти к
шагу 3;
б) если / (У + Ajdj )> fly'), шаг
считается неудачным. Тогда следует положить
У+1 = у19 Aj = рД, и перейти к шагу 3.
Шаг 3. Проверить выполнение условий:
а) если / < п, то положить / = / + 1 и
перейти к шагу 2 (сделать шаги по
оставшимся направлениям);
б) если / -п , проверить успешность
поиска по текущим ортогональным
направлениям:
если / (уп+{) < f (у{), т.е. хотя
бы
один спуск по направлению на шаге 2 был
успешным, положить: у = уп+ , / = 1 и
перейти к шагу 2;
если / (уп+{ 1 = / (у1), т.е. каждый из
п последних шагов был неудачным, оценить
успешность поиска на текущей итерации:
если /[уп+{ ) < / (хк 1, т.е. на А-й итерации
хотя бы один шаг удачный, то перейти к
шагу 4; если /(уп+[ ) = /\хк 1, т.е. не было
ни одного удачного шага на А-й итерации,
процесс поиска приостановить. Если число /
последовательно неудачных серий шагов по
всем направлениям на текущей итерации не
превышает N, проверить условие окончания,
а иначе перейти к шагу 4. Проверяются
величины А,, использованные во время
последней серии шагов. Если |Д/|<е для всех /,
ю найдено приближенное решение задачи:
748 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
х* = х . Если |Л/1 > е хотя бы для одного
' , то положить у = уп+ , / = 1 и перейти
к шагу 2.
Шаг 4. Положить xk+l - уп+[ и
проверить условие окончания:
а) если |дс - х | < е, то поиск за-
* к+[
вершить: х = х ;
i
б) если IIjc^^1 - хк I > е,
вычислить
длины шагов по каждому направлению
поиска на к-н итерации Х\,...,Хп из соотноше-
п
ния
Jfc+1
х = VA,;*//. Далее построить
#=1
новый набор линейно независимых и взаимно
ортогональных направлений поиска d\ ,...,dn
с помощью процедуры Грама—Шмидта:
<//, X,- =0,
п
j=>
Ь =
«/.
/ = 1,
и-1
' hi
Заметим, что если X,- =0, то dt - dt,
т.е. новые направления следует вычислять
только для тех индексов, для которых Х\ Ф 0 .
После нахождения новых направлений
следует положить: d-t = d-x, A,- = А,- для всех
/ = 1,...,/|, Л = Л + 1, У =хк+[, / = 1, и
перейти к шагу 2.
Замечания. 1. Если шаг 2 удачен, то А/
заменяется на аА,, т.е. величина шага
увеличивается, так как а > 1 . Неудача приводит к
сдвигу в обратном направлении вдоль /-го
направления при следующей попытке, так как
р<о.
2. Рекомендуются следующие
коэффициенты растяжения и сжатия: а = 3,
Р = -0,5.
3. Дэвис, Свенн и Кемпи [Davies D.,
Swann W.H., Campey I.G.] модифицировали
метод Розенброка, применив алгоритмы
одномерной минимизации при поиске вдоль
каждого направления dx . Тогда, если
функция /(*) дифференцируема,
последовательность генерируемых точек сходится к
стационарной точке.
Метод сопряженных
направлений. Применяется для решения задачи
(21.2.1).
Пусть Н — симметрическая матрица
размера пхп. Векторы d\ 9d2,..,dn
называются Н-сопряженными или просто сопря-
т
женными, если d-% Hd; = 0 при всех / Ф j.
В методе сопряженных направлений
(методе Пауэлла [Powell M.J.D.] )
используется факт, что минимум квадратичной функции
может быть найден не более чем за п шагов
при условии, что поиск ведется вдоль
сопряженных относительно матрицы Гессе
направлений. Так как достаточно большой класс
целевых функций может быть представлен в
окрестности точки минимума своей
квадратичной аппроксимацией, описанная идея
применяется и для неквадратичных функций.
Задается начальная точка и направления
d\,di,...,dn, совпадающие с
координатными. Находится минимум f(x) при
последовательном движении по (л + 1)
направлениям с помощью одного из методов одномерной
минимизации. При этом полученная ранее
точка минимума берется в качестве исходной
для поиска по следующему направлению, а
направление dn используется как при первом
(do = dn), так и последнем поиске.
Находится новое направление поиска, сопряженное с
dn . Оно проходит через точки, полученные
при первом и последнем поиске. Заменяется
d[ на d*i» ^2 на ^3 и тд- Направление dn
заменяется сопряженным направлением,
после чего повторяется поиск по (п + 1)
направлениям, уже не содержащим старого
направления d\. Для квадратичных функций
2
последовательность п одномерных поисков
приводит к точке минимума (если все
операции выполнены точно). Построение
сопряженного направления для квадратичной
функции при /1 = 2 изображено на рис.
21.2.9. Оно проходит через точки 1 и 3.
МЕТОДЫ НУЛЕВОГО ПОРЯДКА
749
а) если 1хк+{ - хк || < е , то поиск за-
вершить: х = х ;
т
0
W
, d2 =
(°1
1
i°J
,..., d„ =
f°]
0
H
Рис. 21.2.9
Алгоритм. Шаг 1. Задать начальную
точку х , число е > 0 для окончания
алгоритма, начальные направления поиска
</i =
Положим do = dn, / = 0, у0 - х°, А; = 0.
ZZ/дг 2. Найти у1+{ = у1 +1{ dt , где шаг
/,- находится в результате поиска минимума
функции fly1 + tidi) по /,- одним из
методов одномерной минимизации.
Шаг 3. Проверить выполнение условий:
а) если / < п - 1 , положить / = / + 1 и
перейти к шагу 2;
б) если / = п - 1 , проверить успешность
поиска по п первым направлениям. Если
уп - у , то поиск завершить: х* = уп ,
иначе положить / = / + 1 и перейти к шагу 2;
в) если / = п , проверить успешность
поиска по л последним направлениям. Если
уп+ = >> , поиск завершить: х* = >> ,
иначе перейти к шагу 4 для построения
сопряженного направления.
Шаг 4. Положить xk+l = yn+{ и
проверить условие окончания:
„л+1
б) иначе положить: dQ = dn = yw+1 - jr
(новое направление); d\ - di+y, i = \,...,n -1
(исключается старое направление).
Если при этом rang I */i,..., dn J = n , то
новая система направлений линейно
независима. В этом случае положить: d-x - dx-,, / = О,
\,...,п; к = к + \, i = 0 , у0 = xk+l и
перейти к шагу 2.
Если rang (d{,..., dn J < n , то новая
система направлений линейно зависима.
Тогда следует продолжать поиск в старых
направлениях. Для этого положить: d{ = d-t,
/=0,1,...,л; у0 =хк+[, к = к + \, / = 0 и
перейти к шагу 2.
Замечание. Изложенный алгоритм
соответствует описанному в [37]. Имеется также
алгоритм Пауэлла, в котором не
гарантируется линейная независимость направлений
поиска, а в [4] модификация алгоритма
Пауэлла, предложенная Зангвиллом [Zangwill W.I.].
Последняя модификация гарантирует
линейную независимость направлений поиска и
сходимость за конечное число шагов.
Методы случайного поиска.
Адаптивный метод случайного поиска.
Применяется для решения задачи (21.2.1).
Задается начальная точка х . Каждая
последующая точка находится по формуле
хк+1 = хк + ^ {к ^
где tfr > 0 — величина шага; £ —
случайный вбктор единичной длины, определяющий
направление поиска; к — номер итерации. На
текущей итерации при помощи генерирова-
гк
ния случайных векторов q получаются
точки, лежащие на гиперсфере радиуса t^ с
центром в точке хк (рис. 21.2.10). Если значение
функции в полученной точке не меньше, чем
в центре, шаг считается неудачным (точки
У , у2 при поиске из х° ; у1, у при поиске
из х1). Если число неудачных шагов из
текущей точки достигает некоторого числа М,
дальнейший поиск продолжается из той же
750 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
*2
/V'vyv^^
*1
Рис. 21.2.10
точки, но с меньшим шагом, до тех пор, пока
он не станет меньше заранее заданной
величины R. Если же значение функции в
полученной точке меньше, чем в центре, шаг
считается удачным и в найденном направлении
делается увеличенный шаг, играющий роль
ускоряющего шага (как при поиске по
образцу в методе конфигураций). Если при этом
значение функции снова меньше, чем в
центре, направление считается удачным и
дальнейший поиск продолжается из этой точки
(точки z = х при поиске из х , z = х
при поиске из х ). Если же значение
функции стало не меньше, чем в центре,
направление считается неудачным и поиск про-
должается из старого центра (в точке у при
поиске из х функция меньше, чем в х , а в
2
точке z уже не меньше, поэтому
направление \z -х ) неудачное).
Алгоритм. Шаг 1. Задать начальную
точку х , коэффициенты расширения а > 1 и
сжатия 0 < р < 1 , М — максимальное число
неудачно выполненных испытаний на
текущей итерации, /0 = 1 - начальную величину
шага, R — минимальную величину шага, N —
максимальное число итераций. Положить
Шаг 2. Получить случайный вектор
Т
V = №>--• An) > гДе %i ~ случайная
величина, равномерно распределенная на
интервале [-1, 1].
Шаг 3. Вычислить yJ = х + tk
w
Шаг 4. Проверить выполнение условий:
а) если fiyJ ) < fix ), шаг удачный.
Положить zJ = хк + а (yJ - хк ).
Определить, является ли текущее направление
yJ - х удачным:
если / \zJ J < fix j, направление поис-
ка удачное. Положить х = zJ , tk+\ = atk ,
к = к + 1 и проверить условие окончания.
Если к < N , положить j = 1 и перейти к
шагу 2. Если к = N , поиск завершить:
х* =хк;
если fyz3 J > fix ), направление
поиска неудачное, перейти к шагу 5;
б) если fiyJ I > fix j, шаг неудачный
и перейти к шагу 5.
МЕТОДЫ НУЛЕВОГО ПОРЯДКА
751
Шаг 5. Оценить число неудачных шагов
из текущей точки:
а) если j < М, следует положить
j = j + 1 и перейти к шагу 2;
б) если j = М , проверить условие
окончания:
если tk < R, процесс закончить: х* =
= **,/(**) = /(**);
если tk > R , положить tk =р^,у = 1
и перейти к шагу 2.
Замечания. 1. Величина £/ , равномерно
распределенная на интервале [-1, 1],
генерируется обычно с помошью датчиков
псевдослучайных чисел на ЭВМ. Вырабатывается
случайная величина Т|/ , равномерно
распределенная на [0, 1], а затем используется
линейное преобразование: Ц = 2т|/ -1 .
2. Шумер и Стейглиц [Schumer M.A.,
Steiglitz К.] рекомендуют следующие
параметры алгоритма: а = 1,618; р = 0,618; М = 3п .
При а = 1 точка zJ на шаге 4 совпадает с
yJ, т.е. аналог поиска по образцу не
производится. Начальный шаг t$ > R можно
задать произвольно [37].
3. Если выполнено условие окончания
tk < R, то в качестве ответа можно
использовать любую точку внутри шара с радиусом tk
к
и центром в точке х .
4. Многочисленные варианты
случайного поиска изложены в [9] и могут включать
элементы обучения, при котором
направления убывания функции становятся более
вероятными, а другие направления — менее
вероятными.
Метод случайного поиска с возвратом при
неудачном шаге. Задается начальная точка х .
Каждая последующая точка находится по
формуле
Jfc+1
= хк +tk%k,
fit
где tk > 0 - величина шага; с, -
случайный вектор единичной длины, определяющий
направление поиска; к — номер итерации. На
текущей итерации при помощи генерирова-
ния случайных векторов q получаются
точки, лежащие на гиперсфере радиуса tk с цен-
тром в точке х (рис. 21.2.11). Если значение
функции в полученной точке не меньше, чем
в центре, шаг считается неудачным (точки
у1, у2 при поиске из х°; ух, у2, у3 при
поиске из х ), происходит возврат в текущий
*1
Рис. 21.2.11
752 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
центр и поиск продолжается. Если число
неудачных шагов из текущей точки достигает
некоторого числа Л/, дальнейший поиск
продолжается из той же точки, но с меньшим
шагом, до тех пор, пока он не станет меньше
заранее заданной величины R. Если же
значение функции в полученной точке меньше,
чем в центре, шаг считается удачным и
дальнейший поиск продолжается из этой точки.
Алгоритм. Шаг 1. Задать начальную
точку х , коэффициент сжатия 0 < р < 1 ,
М — максимальное число неудачно
выполненных испытаний на текущей итерации, /q —
начальную величину шага, R — минимальную
величину шага, N — максимальное число
итераций. Положить к = О, j = 1.
Шаг 2. Получить случайный вектор
Т
& = fe\J ,.•.,&) , где Ц - случайная
величина, равномерно распределенная на
интервале [-1, 1].
положить у = 1 и перейти к шагу 2. Если
к = N , поиск завершить: х* = х ;
б) если / (yJ ) > /1 х I, шаг неудачный
и перейти к шагу 5.
Шаг 5. Оценить число неудачных шагов
из текущей точки:
а) если j < М, следует положить
j = j + 1 и перейти к шагу 2;
б) если j = М , проверить условие
окончания:
если tfr < Я, процесс закончить:
x*zxk,f(x*)zf(xk);
если tk > R , положить tk = (3/^ ,у = 1
и перейти к шагу 2.
Метод наилучшей пробы. Задается
начальная точка х . Каждая последующая
точка находится по формуле
Jfc+1
= ** +*к%к>
Шаг 3. Вычислить yJ = x +tk тр-тг. где tk > 0 - величина шага; %к - случайный
Шаг 4. Проверить выполнение условий:
а) если f[yJ)<f[x I, шаг удачный.
Jfc+1
вектор единичной длины, определяющий
направление поиска; к — номер итерации. На
текущей итерации при помощи генерирования
случайных векторов £ получается М точек
1 Л/
у ,...,у , лежащих на гиперсфере радиуса
Положить х = У , tk+{ = tk , к = к + 1
и проверить условие окончания. Если к < N, tk с центром в точке х (рис. 21.2.12).
*2
*1
Рис. 21.2.12
МЕТОДЫ НУЛЕВОГО ПОРЯДКА
753
Среди полученных точек выбирается точка
ут, в которой значение функции
наименьшее. Если в выбранной точке значение
функции меньше, чем в центре, то дальнейший
поиск продолжается из этой точки. Иначе
поиск продолжается из старого центра, но с
меньшим шагом, до тех пор, пока он не
станет меньше заранее заданной величины R.
Алгоритм. Шаг 1. Задать начальную
точку х , коэффициент сжатия 0 < (3 < 1 ,
М — число испытаний на текущей итерации,
/q = 1 - начальную величину шага, R —
минимальную величину шага, N —
максимальное число итераций. Положить
* = 0, у = 1.
Шаг 2. Получить М реализаций
Т
случайного вектора ^' = Ш ,...,£„ ) ,
у = 1,...,Л/, где Qj — случайная величина,
равномерно распределенная на интервале
[-и].
Шаг 3. Вычислить
. yi
hi
Шаг 4. Найти ym из условия f(ym) =
= min /(У).
i < j < м
Проверить выполнение условий:
а) если f(ym\< flxk j, шаг удачный.
Положить xk+l = ym, tk+{ = tk , к = к + 1
и проверить условие окончания. Если
к < N , положить j = 1 и перейти к шагу 2.
Если к = N , поиск завершить: х* = х ;
б) если fly"1 ] > / (хк ], шаг
неудачный и перейти к шагу 5.
Шаг 5. Проверить условие окончания:
если tk < R, процесс закончить:
x*=xk,f(x*) = f(xk);
если tk > R , положить tk = $tjc ,j = \
и перейти к шагу 2.
Замечания. 1. Существуют варианты
данного метода, в которых на шаге 4
полагают х + = ут . В этом случае становятся
возможными шаги в направлении возрастания
функции. Они могут позволить преодолевать
локальные минимумы при поиске
глобального экстремума.
2. Недостатком метода является учет
только наилучшей пробной точки. В
отбрасываемых точках содержится полезная
информация о поведении целевой функции.
3. Одним из методов учета информации,
содержащейся во всех сгенерированных
точках, является алгоритм статистического
градиента. Для каждой из М реализаций
£,...,£ случайного вектора £ , полученных
к
в точке х , вычисляются разности
AfJ =f(xk+tnp$k )-/(**),
где /npi — пробное значение шага. В качестве
направления поиска используется вектор
статистического антиградиента d -
\М dk
= У^А/^или вектор 7i—й- Далее
алгоритм решения совпадает с описанным
выше.
4. Одним из эффективных алгоритмов
нулевого порядка является генетический
алгоритм Д. Голланда, Д. Голдберга, К. ДеДжонга
(J. Holland, D. Goldberg, К. DeJong).
Генетический алгоритм был получен в процессе
обобщения и имитации в искусственных
системах таких свойств живой природы, как
естественный отбор, приспособляемость к
изменяющимся условиям среды, наследование
потомками жизненно важных свойств от
родителей и т.д. Так как алгоритм в процессе
поиска использует некоторую кодировку
множества параметров вместо самих
параметров, то он может эффективно применяться
для решения задач дискретной оптимизации,
определенных как на числовых множествах,
так и на конечных множествах произвольной
природы. Поскольку для работы алгоритма в
качестве информации об оптимизируемой
функции используются лишь ее значения в
рассматриваемых точках пространства поиска
и не требуется вычислений ни производных,
ни каких-либо иных характеристик, то
данный алгоритм применим к широкому классу
функций, в частности, не имеющих
аналитического описания. Использование набора
начальных точек позволяет применять для их
754 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
формирования различные способы,
зависящие от специфики решаемой задачи, в том
числе возможно задание такого набора
непосредственно человеком. Сила генетических
алгоритмов в том, что этот метод очень гибок,
и, будучи построенным в предположении, что
об окружающей среде нам известен лишь
минимум информации (как это часто бывает для
сложных технических систем), алгоритм
успешно справляется с широким кругом
проблем, особенно в тех задачах, где не
существует общеизвестных алгоритмов решения
или высока степень априорной
неопределенности [7].
21.2.2. Методы первого порядка.
Стратегия решения задачи (21.2.1) состоит в
построении последовательности точек \х >,
£=0,1,..., таких, что /(х*+1 )</(**),
к = 0, 1,... . Точки последовательности \х \
вычисляются по некоторому правилу.
В методах первого порядка
используются одинаковые условия окончания. Построение
последовательности
и
заканчивается в
точке х k , для которой V/lx j < Z\, где
£| - заданное малое положительное число,
или к > М , где М — предельное число
итераций, или при двукратном одновременном
двух
выполнении
.. к+\
неравенств ||jc -
-х*|<е2, |/(**+1 )-/(**) |<е2,где е2 -
малое положительное число.
Процедура решения задачи (21.2.1)
методами первого порядка содержит два этапа.
1. Используя алгоритм, найти точку
к »
х , в которой выполнен по крайней мере
один из критериев окончания расчетов.
2. Провести анализ точки х с целью
установить, является ли точка х
найденным приближением решения задачи.
Процедура анализа определяется наличием у
функции f(x) непрерывных вторых
производных. Если f(x)e С , то следует провести
проверку выполнения достаточных условий
минимума: Н (х*) > 0 . Если Н (хк ) > 0 , то
точка х есть найденное приближение
искомой точки х*. Если /(х)е С , то следует
провести проверку функции /(*) на
выпуклость в окрестности точки. Если функция
f(x) выпукла (строго выпукла), то х есть
найденное приближение точки х*.
Метод градиентного спуска с постоянным
шагом. Точки последовательности <х |
вычисляются по правилу
хк+\ =хк -tkVf(xk), k=0, 1,..., (21.2.6)
где точка х задается пользователем;
V/lx I - градиент функции f(x),
вычисленный в точке х ; величина шага /^
задается пользователем и остается постоянной до
тех пор, пока функция убывает в точках
последовательности, что контролируется путем
проверки выполнения условия fix + 1-
-/(**)< 0 или f(xk+l)-f(xk)<
<-e|v/(x*)| ,0<е<1 [29].
Алгоритм. Шаг 1. Задать х , 0 < е < 1 ,
£j > 0 , е2 > 0 , М — предельное число
итераций. Найти градиент функции в произ-
I ПГ I Y" I ПТ I rf
вольной точке V/(x)=
(Э/(х) Э/(х)
Эх|
Эх„
Шаг 2. Положить к = 0 .
Шаг 3. Вычислить Vf(xk ).
Шаг 4. Проверить выполнение критерия
окончания V/f хк И < Е\:
а) если критерий выполнен, расчет
закончен, х* = хк ;
б) если критерий не выполнен, то
перейти к шагу 5.
Шаг 5. Проверить выполнение
неравенства к > М :
а) если неравенство выполнено, то рас-
* к
чет окончен: х = х ;
МЕТОДЫ ПЕРВОГО ПОРЯДКА
755
б) если нет, то перейти к шагу 6.
Шаг 6. Задать величину шага t^ .
Шаг 7. Вычислить хк+{ = хк -t^fi^V
Шаг 8. Проверить выполнение условия
/(***')-/(**)<<> (или /(***')-
-/И<-«И*12,:
а) если условие выполнено, то перейти к
шагу 9;
б) если условие не выполнено, положить
tfc = — и перейти к шагу 7.
Шаг 9. Проверить выполнение условий
Р+,-**|<е2,|/(х*+1)-/(х*)|<е2:
а) если оба условия выполнены при
текущем значении к и к = к -I, то расчет
* к+\
окончен, х = х ;
б) если хотя бы одно из условий не
выполнено, положить к = к + \ и перейти к
шагу 3.
Геометрическая интерпретация метода
для я = 2 приведена на рис. 21.2.13.
Теорема 21.2.1. [33] Пусть функция
f(x) дифференцируема и ограничена снизу на
R", а ее градиент удовлетворяет условию
Липшица |v/(je)-V/(y)|s£|x-^|, Vx,
ye R", где L > О . Тогда при произвольной
начальной точке х е R для метода
градиентного спуска с постоянным шагом имеем
0.
lim
к -» о
v/p)|.,
Замечания. 1. Теорема 21.2.1 гарантирует
сходимость последовательности \х \ к
стационарной точке х* у где Vflx*) = Q.
Следовательно, найденная в результате примене-
ния метода точка х нуждается в
дополнительном исследовании с целью ее
классификации.
2. Метод градиентного спуска
гарантирует сходимость последовательности \xr \ к точке
минимума для сильно выпуклых функций [33].
3. При решении примеров
итерационный процесс подбора удачной величины t^
отражается в индексации шагов 7 и 8. Первый
индекс совпадает с номером к , а второй - с
числом делений текущей величины t^ пополам.
4. Оценки скорости сходимости
получены только для сильно выпуклых функций,
когда последовательность \х \ сходится к
точке минимума f (х) со скоростью
геометрической прогрессии:
f(xk)-f(x')<qk(f(x«)-f(x*)),
\хк-х'\\<сЩк,
где q е (0,1), С > 0 - константы [41].
*2 t
/W = c,
/W = c2
с, >с7> с
-v/(*°)
*1
Рис. 21.2.13
756 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
5. Если требуется най™ глобальный ми- Алгоритм. Шаг 1. Задать х°, е, > 0 ,
нимум функции f(x), то для строго выпук- л „ «ж „ „
^ v / ' * J б2>0, предельное число итерации М. Найти
лой f(x) решение этой задачи аналогично градиент функции в произвольной точке
т
поиску локального минимума функции. В (df(x) Э/(х)4
случае когда f(x) имеет несколько локаль- I дх{ дхп
ных минимумов, поиск глобального миниму- Шаг 2. Положить к = О .
ма осуществляется в результате перебора всех Вычислить Vf(xk \
локальных минимумов. оычислить \j ул j.
Метод наискорейшего градиентного спус- Шаг 4. Проверить выполнение критерия
ка. Стратегия решения задачи (21.2.1) состоит II / к \||
в построении последовательности точек окончания Y/Д* j < el:
|х |, к =0,1,..., таких, что f\x j < а) если критерий выполнен, то х* = хк ;
б) если критерий не выполнен, то пе-
< flxk ), А: = 0, 1,.... Точки последователь- рейти к шагу 5.
v ' Шаг 5. Проверить выполнение
неравенства к > М :
а) если неравенство выполнено, то
к .
ности \х \ вычисляются по правилу
хк+\ _ хк _ ^ yflxk \ ^ где точка х° задает-
х = х
б) если нет, то перейти к шагу 6.
ся пользователем; величина шага tk опреде- Шаг 6. Вычислить величину шага t\ из
ляется для каждого значения к из условия условия
9(/*)-/(x*-/ftV/(x*))-»mln. (21.2.7) 9(^) = /(x*-^V/(x*))-,min.
Решение задачи (21.2.7) может осущест- Шаг1- Вычислить х*+| =х* -£V/(**).
вляться с использованием необходимого уело- Шаг 8 Проверить выполнение условий
вия минимума —=- = 0 с последующей про- Jx*+I -x*|<ei. /(x*+')~ f(xk N < е? :
веркой достаточного условия минимума а) если оба условия выполнены при те-
^2 кущем значении к и к = к -I, то расчет
— >0. Другой путь решения этой окончен х* = ХШ .
к б) если хотя бы одно из условий не выпол-
задачи связан с использованием численных Нено, то положить к = к + 1 и перейти к шагу 3.
методов, когда ищется mill <р(^)= Геометрическая интерпретация метода
^еГа,^1 для я = 2 приведена на рис. 21.2.14.
/ . / ь\\ Теорема 21.2.2. Пусть функция fix)
= min f[xk -tkVf(xkX\ (см. п. 21.2.1). . V " f Tl;
t c.\a b\ \ \ 11 удовлетворяет условиям теоремы 21.2.1. Тогда
k L ' J ««On/!:»
при произвольной начальной точке х е К для
Границы интервала [я,£] задаются пользова- метода наискорейшего градиентного спуска
телем. При этом степень близости найденного имеем Wf(xk и -> 0 при к -> °° [33].
значения tk к оптимальному значению " »
Замечания. 1. Теорема гарантирует схо-
t\ , удовлетворяющему условиям — = 0 , димость последовательности \хк } к стацио-
d2(a . г -. нарной точке х*, где V/(x*) = 0. Следова-
—^ > 0, зависит от задания интервала [a, bJ * '
dt} тельно, найденная в результате применения
к
и точности методов одномерной минимиза- метода точка х нуждается в дополнитель-
ции [32]. ном исследовании с целью ее классификации.
МЕТОДЫ ПЕРВОГО ПОРЯДКА
757
*2
с, >с9
/<*) = С,
*1
Рис. 21.2.14
2. Метод наискорейшего спуска
гарантирует сходимость последовательности \х \
к точке минимума для сильно выпуклых
функций [33].
3. Оценки скорости сходимости
получены только для сильно выпуклых функций,
когда последовательность
и
сходится к
точке минимума функции со скоростью
геометрической прогрессии (линейная сходи-
Мит — оценки наибольшего и наименьшего
собственных значений матрицы Н (х)
функции f(x) [33].
Метод покоординатного спуска.
Стратегия решения задачи (21.2.1) состоит в
построении последовательности точек 1х >,
к = 09 1,..., таких, что /(**+1 )</(**),
к = О, 1,.... Точки последовательности \х |
вычисляются по циклам в соответствии с
правилом
Jk+l
= X
Л _
h
dxk+{ ) jk
ек+\, (21.2.8)
где j — номер цикла вычислений; у = 0, 1,
2,...; к — номер итерации внутри цикла,
А: =0, 1,...,л-1; еш, к = 0, 1,...,л - 1 -
единичный вектор, (& + 1) -я проекция кото-
.00
рого равна 1; точка х задается
пользователем, величина шага tk выбирается из условия
/
*lk-h
'bf(x)
dxi
ек+\
V
или
к+{ W*
-/(**)
<0
/(jc^+l)-/(^*)<-e|v/(jc^
Если выбранное условие при текущем
tk не выполняется, шаг уменьшается вдвое и
'У Ml
точка xjk -tk
Эх
V
к+\
ек+\ вычисляет-
JX-X
Jk
ся заново. Легко видеть, что при
фиксированном j за одну итерацию с номером к
изменяется только одна проекция точки xJ ,
имеющая номер к +1 , а в течение всего
цикла с номером у, т.е. начиная с к = 0 и
кончая к - п - 1, изменяются все п проекций
точки xJ . После этого точке xjn
присваивается номер xJ ' и она берется за
начальную точку для вычислений в j +1 цикле.
Расчет заканчивается в точке xJ при
выполнении, по крайней мере, одного из трех
критериев окончания счета: V/fx-7 I < ^i >
или j > M , или двукратного выполнения
неравенств
-/р)|<е2.
758 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
Алгоритм. Шаг 1. Задать х , е > О,
Е\ >0,£2 >0, предельное число М циклов
счета, кратное п, где п — размерность вектора
х. Найти градиент V/ (х).
Шаг 2. Задать номер цикла j = О .
Шаг 3. Проверить условие j > М :
а) если j > М, то х* = х-7 , расчет
окончен;
б) если нет, то перейти к шагу 4.
Шаг 4. Задать к = О .
ZZ/дг 5. Проверить условие & < п - 1:
а) если к < п - 1, то перейти к шагу 6;
б) если к = я , то положить у = у + 1 и
д.У+1,* _ д./" и перейти к шагу 3.
Шаг 6. Вычислить V/ (xjk ).
Шаг 7. Проверить выполнение критерия
|v/p)|<e,:
окончания
а) если критерий выполнен, х = х
расчет окончен;
б) если нет, то перейти к шагу 8.
Шаг 8. Задать t^ .
Шаг 9. Вычислить точку xJk+l : xJk+l
7*
= W* - j
IVM1
ufy+l
^+1
/x=x-
7*
/ [XJk+l) - / (*'* ) < 0 (или / (xJk+l) -
-/(^)<-e|v/p)|2):
а) если условие выполнено, то перейти к
шагу 11;
б) если нет, то положить t^ = — и
перейти к шагу 9.
Шаг 11. Проверить выполнение условий
| *>*+» - х* || < е2 , |/ (*'*+1) - / (х* | < е2:
а) если в двух последовательных циклах
с номерами j и j -1 оба условия выполня-
jk+l
окончен и
Шаг 10. Проверить выполнение условия
ются, то расчет в точке х
x*=xJk+i;
б) если хотя бы одно из условий не
выполнено, положить к = к + 1 и перейти к
шагу 5.
Геометрическая интерпретация метода
для я = 2 приведена на рис. 21.2.15.
Замечания. 1. Если функция f(x)
удовлетворяет условиям теоремы 21.2.1, то
построение последовательности \х [по методу
покоординатного спуска обеспечивает выпол-
условия ||v/(**)||->° ПРИ к-*™ [33].
Найденная в результате применения метода
точка х нуждается в дополнительном
исследовании с целью ее классификации.
2. Скорость сходимости метода
оценивается как линейная.
нение
Рис. 21.2.15
МЕТОДЫ ПЕРВОГО ПОРЯДКА
759
Метод Гаусса-Зейделя. Стратегия метода
Гаусса-Зейделя [Gauss-Seidel] для решения
задачи (21.2.1) состоит в построении
последовательности точек \х \, к = 0, 1,..., таких,
что f[xk+{)<f(xky к = 0, 1,... Точки
и
последовательности
правилу
xy*+l = xjk
(v(*Y
дх/г
вычисляются по
ek+i, (21.2.9)
где j - номер цикла вычислений, у =0,1,
2,...; к - номер итерации внутри цикла,
к = 0,!,...,/!-1; ек+\ - единичный вектор,
(А; + 1)-я проекция которого равна 1; точка
х задается пользователем, величина шага
tk выбирается из условия
ч>('*)=/
tJk -i
(*(*))
Эх
к+\
ек+\
=Yjk
Jx=xJ
-> mm.
Эта задача является задачей одномерной
минимизации функции
ф('*) = /
*Jk-tk
rvwi
дхк
+1
ек+\
= xjk
jx-x-
и может быть решена либо с использованием
условии —— = 0 , —^- > 0 , либо численно с
dh
dti
использованием методов одномерной
минимизации, как задача ф(7*)—> mill (см.
tk*\aM
п. 21.2.1).
Легко видеть, что при фиксированном у
за одну итерацию с номером к изменяется
только одна проекция точки xJ , имеющая
номер к + 1 , а в течение всего цикла с
номером у, т.е. начиная с к = 0 и кончая
к = п - 1, изменяются все п проекций точки
xJ . После этого точке xjn присваивается
номер
xJ+ ' и она берется за начальную
точку для вычислений в (у + 1) -м цикле.
Алгоритм. Шаг 1. Задать х , £j > 0 ,
£2 > 0 ; предельное число М циклов счета,
кратное я, где п — размерность вектора х.
Найти градиент V/(x).
Шаг 2. Задать номер цикла j = 0 .
Шаг 3. Проверить условие j > М :
а) если j > М, то расчет окончен и
х* = х* ;
б) если j < М , то перейти к шагу 4.
Шаг 4. Задать к = 0 .
Шаг 5. Проверить условие к < п - 1:
а) если к < п - 1, то перейти к шагу 6;
б) если к = п , то положить j = j + 1 и
перейти к шагу 3.
Шаг 6. Вычислить Vf(xJk ) .
Шаг 7. Проверить выполнение условия
а) если условие выполнено, то расчет
окончен и х* = xJ ;
б) если нет, то перейти к шагу 8.
Шаг 8. Вычислить t\ из условия
ф('*)=/
**-'*
fvwi
Эх
*+1
**+!
:=W*
-> mm .
tk
Шаг 9. Вычислить
xjk+l = xjk _ f*k
Эх
■k+\
ek+\-
= xJk
Шаг 10. Проверить выполнение условий
p+i -x>*|<e2, |/p+,)-/p|<e2:
а) если оба условия выполнены в двух
последовательных циклах с номерами у и
у -1 , то расчет окончен, найдена точка
х* = х^+|;
б) если не выполняется хотя бы одно
условие, положить к = к + \ и перейти к шагу 5.
и.
Свойства последовательности
А: =0,1,..., полученной по методу Гаусса-
Зейделя, совпадают со свойствами метода
покоординатного спуска.
Геометрическая интерпретация метода
для п = 2 приведена на рис. 21.2.16.
760 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
Рис. 21.2.16
Метод Флетчера-Ривса. Стратегия
метода Флетчера-Ривса [Fletcher R., Reeves СМ.]
для решения задачи (21.2.1) состоит в
построении последовательности точек | х >,
к = 0, 1, ..., таких, что /(х*+1) < /(**),
к = 0, 1, ... Точки последовательности |л* \
вычисляются по правилу:
хк+{ =xk+tkdk , к = 0, 1, ...;
dk=-Vf(xk) + ^^k-{; d° = -Vf(x°);
wi
P*-l
w-i'
(21.2.10)
^0
Точка х задается пользователем,
величина шага tfr определяется для каждого
значения к из условия q>(tk) = f\x +tkd )-»
—> min . Решение этой задачи одномерной
минимизации может осуществляться либо
аналитически, либо численно с
использованием методов одномерной минимизации (см.
предыдущие методы).
Вычисление величины (3^-1 по формуле
(21.2.10) обеспечивает для квадратичной фор-
п п
мы /(*)= ^\^\aijxixj построение после-
/=1 у=1
довательности Я-сонряженных направлений
v0 Л Л
dv, d , ..., d , ..., для которых
(^,Я</') = 0, V/, у =0,1,...,А:; / * J . При
этом в точках последовательности <х \
градиенты функции f(x) взаимно
перпендикулярны, т.е. (v/(^+1),V/(^)) = 0, A: = 0,1,....
Для квадратичных функций f(x) с
матрицей Я > 0 метод Флетчера-Ривса является
конечным и сходится за число шагов, не
превышающее п — размерность вектора х.
При минимизации неквадратичных
функций метод не является конечным, при
этом следует отметить, что погрешности в
решении задачи нахождения величины шага
приводят к нарушению не только
перпендикулярности градиентов, но и Я-сопряжен-
ности направлений. Для неквадратичных
функций, как правило, используется алгоритм
Полака-Рибьера [Polak E., Ribiere G.], когда
величина p^-i вычисляется следующим
образом:
p*-i =
(Vf(xk),[w(xk)-W(xk-1)])
Н**1Г
, **/,
0, keJ,
где / = {0, /i,2/i,...} . В отличие от алгоритма
Флетчера-Ривса алгоритм Полака-Рибьера
предусматривает использование итерации
наискорейшего градиентного спуска через
каждые п шагов.
МЕТОДЫ ПЕРВОГО ПОРЯДКА
761
Алгоритм. Шаг 1. Задать х°, Еу > О,
£2 > 0, М — предельное число итераций.
Найти градиент V/(x).
Шаг 2. Положить к = О .
Шаг 3. Вычислить Vf(xk).
Шаг 4. Проверить выполнение критерия
окончания V/(x | < £j: а) если критерий
* £
выполняется, х = х , расчет окончен;
б) если нет, то перейти к шагу 5.
Шаг 5. Проверить условие к > М:
а) если неравенство выполняется, то расчет
* к
окончен и х = х ; б) если нет, то при
к = 0 перейти к шагу 6, а при к > 1 перейти
к шагу 7.
Д/дг 6. Определить d° = -V/(x°).
Шаг 7. Определить
wt
1|2 '
Р*-1=-
Р*-1 =
kiJ
0, keJ
Шаг 8. Определить dk =-Vf(xk) +
+ Р*-1*-
*-l
ZZ/дг 9. Найти /^ из условия (р(/#) =
= f(xk +tkdk\-+ min .
Шаг 10. Вычислить xk+l = xk + t\dk .
Шаг 11. Проверить выполнение условий
Р+,-х*[<е2, |/(**+,)-/(**|<е2:
а) в случае выполнения обоих условий в двух
последовательных итерациях с номерами к и
к -1 расчет окончен, найдена точка х ;
б) если не выполняется хотя бы одно из
условий, полагаем к - к + 1 и переходим к
шагу 3.
Теорема 21.2.3. Если квадратичная функ-
п п
ция f(x) = jT jT hy XjXj с неотрицательно
i=l j=\
определенной матрицей Н достигает своего
минимального значения на Rn, то метод
Флетчера-Ривса обеспечивает отыскание
точки минимума не более чем за п шагов [41].
Теорема 21.2.4. Если функция f(x)
ограничена снизу, а ее градиент удовлетворяет
условию Липшица |V/(x) - V/(.y| < L\x - у\
Vx,y € R", то в методе Полака-Рибьера
dK1l=o[33]-
Геометрическая интерпретация метода
для п = 2 изображена на рис. 21.2.17.
Рис. 21.2.17
762 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
Замечания. 1. Теорема 21.2.4 гарантирует
сходимость последовательности <х > к
стационарной точке х , где Vflx I = 0 .
Следовательно, найденная в результате применения
k
метода точка х нуждается в
дополнительном исследовании с целью классификации
этой точки.
2. Метод Полака-Рибьера гарантирует
<p{tk) = f(xk-tkAkVf(xk))^mm. При
ении
еспеч!
К)
аналитическом решении задачи нахождения
величины шага обеспечивается построение
положительно оп-
сходимость последовательности
[хк}к
точке
минимума для сильно выпуклых функций.
3. Оценки скорости сходимости
получены только для сильно выпуклых функций,
когда последовательность \х \ сходится к
точке минимума /(*) со скоростью
p+w-/|<Cp-/|2, ke{0,n,2n,...}
[41].
Метод Дэввдона-Флетчера-Пауэлла.
Стратегия метода Дэвидона-Флетчера-Пауэлла
(Д-Ф-П) [Davidon W.C., Fletcher R., Powell
M.J.D.] для решения задачи (21.2.1) состоит в
построении последовательности точек \х \,
А: = 0,1,..., таких, что f(xk+l) < f{xk),
Л = 0,1,... Точки последовательности \х \
вычисляются по правилу
xk+l =xk_ ,^*V/(x*) 9 к = ОД,...,
(21.2.11)
где А есть матрица размера пх п , которая
вычисляется по правилу
последовательности
ределенных матриц, таких, что АК
—> Я~ (х 1 при к —> ©о . Следствием этого
для квадратичной функции f(x) = --(Нх,х) +
+ (Ь,х) , Н > 0, является тот факт, что
направления d , Л = 0,1,..., будут Я-соп-
ряженными и, следовательно, алгоритм
Д-Ф-П сойдется не более чем за п шагов.
Для неквадратичных функций f(x)
алгоритм перестает быть конечным и его
сходимость зависит от точности решения задачи
нахождения величины шага. Глобальную
сходимость алгоритма можно гарантировать лишь
при его обновлении через каждые п шагов,
т.е. при
Ак \Е, keJ;J = {0,n,2n,-},
Ak+l=Ak+Ak, A° = E,
(21.2.12)
Ak =
Дх*(дх*) AkAgk(Agk\ Ak
где Axk =xk+l-xk, Agk = Vf(xk+l) -
-V/(x*).
Точка jc задается пользователем,
величина шага tfc определяется из условия
Алгоритм. Шаг 1. Задать х , 6j >0,
62 > 0 , М — предельное число итераций.
Найти градиент V/(x).
Шаг 2. Положить к = 0, А0 = Е .
ШагЪ. Вычислить Vf(xk\.
Шаг 4. Проверить критерий окончания
V/lx* J < Е\ : а) если критерий выполнен, то
х = х , расчет закончен; б) если нет, то
перейти к шагу 5.
Шаг 5. Проверить условие к > М:
* к
а) если неравенство выполнено, то х = х и
расчет закончен; б) если нет, перейти при
к = 0 к шагу 10, а при к > 1 к шагу 6.
Шаг 6. Вычислить Agk = V/(jc*+1)-
-V/(x*).
Шаг 7. Вычислить Ахк = хк+{ - хк .
Шаг 8. Вычислить
к Axk(Axkf AkAgk(AgkfAk
(Ax*)V _ (&gk)TAk*gk
МЕТОДЫ ПЕРВОГО ПОРЯДКА
763
Шаг 9. Вычислить Ак+{ = Лк + А% .
Шаг 10. Определить dk = -AkVf(xk\.
Шаг 11. Вычислить tk из условия
q>{tk) = f(xk-tkAkVf(xk))^min.
Шаг 12. Вычислить хш = хк -
-t'kAkVf(xk)-
Шаг 13. Проверить условия
P+'-*i<e2) |/(^+1)-/(x*|<e2:
а) если оба неравенства выполняются в двух
последовательных итерациях с номерами к и
к - 1, то расчет окончен и х = х , б) в
противном случае положить к = к + 1 и
перейти к шагу 3.
Теорема 21.2.5. Алгоритм метода Д-Ф-П
в применении к квадратичной функции /(*) =
= -г(Нх,х) + (Ь,х) с положительно
определенной матрицей Гессе Н обеспечивает оты-
екание минимума х = Н о не более чем за п
шагов [41].
Замечания. 1. Если минимизируемая
функция /(х) не является квадратичной и
удовлетворяет условиям теоремы 21.2.1, то
последовательность |х >, построенная по
методу Д-Ф-П с обновлением, такова, что
V/(x И —> 0 при к —> оо , следовательно,
найденная в результате применения метода
к
точка х нуждается в дополнительном
исследовании с целью ее классификации.
2. Если /(х) дважды непрерывно
дифференцируема и Hlx 1 > 0, то метод Д-Ф-П
с обновлением сходится к точке локального
минимума х со сверхлинейной скоростью
[41].
3. Если в дополнение к условиям п. 2
справедливо ||#(x)j>|| < к ||^|| Vy € Rn в ок-
нимизации: fix ) = min fix). Задается на-
* i xeR x '
чальная точка и с помощью серии пробных
шагов находятся две точки, первые
производные в которых имеют противоположные
знаки. По величине функции и ее первых
производных в полученных точках строится
интерполяционный полином третьей степени. В
качестве приближения точки минимума
берется точка минимума полинома. Процесс
поиска заканчивается, если производная в
точке минимума полинома достаточно мала
или процедура становится неэффективной.
Алгоритм, Шаг 1. Задать начальную
точку х , величину шага А > 0 и малые
положительные числа £| и г2.
Шаг 2. Вычислить производную / fx J.
Шаг 3. Проверить знак производной в
точке х : а) если / (х ) < 0, вычислить
хк+1=хк+2кА, Л = 0,1,..., вплоть до
точки хм, в которой f'(xM-iy(xM)uO;
б) если /'(*°) > 0 , вычислить хк+{ = хк -
-2*Д, Л = 0,1,..., вплоть до точки хМ, в
которой f'(xM-iy(xM)uO.
Шаг 4. Положить х{ = хМ~{ , х2 = хМ
и вычислить f(x{) = /i, / (xj) = f{ ,
Шаг 5. Найти точку минимума
кубического интерполяционного полинома по
формуле
х = <
хъ Д<°>
х2 - \i(x2 - х{), 0 < ц < 1, где
Х\, Ц>1,
Д =
/2 + W - Z
,.М1Л)+УГ+/5,
f2-f\+2w x2-x{
1
рестности точки х , то последовательность
сходится к точке х с квадратичной
и
скоростью [41].
Метод кубической интерполяции.
Применяется для решения задачи одномерной ми-
w =
и значение
(г2-/Г/г)2. х\ <*2>
- (z2 - /Г/г)2 >*i >х2>
764 Глава 21.2. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА БЕЗУСЛОВНОГО ЭКСТРЕМУМА
Шаг 6. Проверить условие убывания: а) Выбор rf* по ^^ (21 2 ,4) гарантирует
если fix) < /faci), перейти к шагу 7; б) если „/ ^. i\ „/ *\
v ' v lJ выполнение требования /(*)</(*)
fix) > f(X{), вычислять х по формуле . ,.
при условии, что Н\х }>0. Процедура ре-
х = х ~~z\x ~ х[) Д° тех поР» пока не будет шения и условия окончания процесса такие
_ же, как и в методах первого порядка,
выполнено неравенство f(x)<f(x{). Алгоритм. Шаг 1. Задать х°, е, > 0,
Шаг 7. Проверить выполнение условий г~ > 0 9 Д/ - предельное число итераций,
окончания:
,_ , Найти градиент V/(x) и матрицу Гессе
Шаг 2. Положить к = 0.
а) если оба условия выполнены, процедура ШагЪ Вь|числить у/|х*\
закончена их = х ; б) если хотя бы одно из
условий не выполнено, положить либо Шаг 4- Проверить выполнение критерия
Х] = х , х2 = х{ , если /'(Jc)/'(xj) < 0, либо окончания |v/(** 1 ^ е1 : а) если неравенство
Х| = х , х2 = х2 , если / (x^f (х2) < 0. Пе- выполнено, то расчет окончен и лс* = хк ; б)
с в противном случае перейти к шагу 5.
реити к шагу 5. г „. г л
Замечание. На шагах 2 и 3 реализуется ?<* ш5; ПР°веРить выполнение неравен-
эвристическая процедура поиска границ ин- ства * * ^ : а> если^ неравенство выполнено,
тервала неопределенности, где изменение расчет окончен и х* = хк ; б) если нет, пе-
знака производной свидетельствует о переходе рейти к шагу 6.
через точку минимума. Формула, используе- ж„ ^ п __/ *\
- Шаг 6. Вычислить матрицу Н\х 1.
мая на шаге 5, гарантирует, что точка л: не \ /
выйдет за границы интервала [хьх2]. На Шаг 7. Вычислить матрицу Н~](хк).
шаге 6 проверяется, действительно ли точка ,„ 0 п
_ шяг 8. Проверить выполнение условия
X является приближением к минимуму. На гг ,/ ь\ , i/ *\
- Я-1 х* >0: а) если Я-1 ;Г>0, то пе-
шаге 7 из трех точек Х],л:2,;с выбираются \ / \ /
две, в которых знаки первых производных Рейти к шагУ 9' б> если нет' то пеРейти к
различны, после чего процедура кубической шагу 10, положив dk = -V/(jcM .
интерполяции повторяется. * '
21.2.3. Методы второго порядка. Me- Шаг 9 Определить
тод Ньютона. Стратегия метода Ньютона нк - A/-1/ k\xifl к\
[Newton I.] для решения задачи (21.2.1) со- " -~" \х JV/ \x J.
стоит в построении последовательности точек
{**}, * = 0,1,..., таких, что f(xk+l)< Шаг 10. Найти точку хк+{ = хк +tkdk ,
А к\ ь t\ \ rj, положив /а- = 1 , если d =-Н~ \х )х
< f [х I, к = 0,1,... Точки последователь- к > \ j
ности вычисляются по правилу xV/(;tM, или выбрав tk из условия
xk+] =xk +dk, A: = 0,1,..., (21.2.13)
f(xk+l)< f(xk), если dk = -Vf(xk).
где jc° - задается пользователем, а направле- Шаг II. Проверить выполнение условий
ние спуска dk определяется для каждого |х*+| - х*| < е \f(xk+l)-f(xk)\<e
значения к по формуле II II I V / \ /|
к и-\{ к\ { к\ а) если °^а Условия выполнены при текущем
d = -И \х jY/jx J • (21.2.14) значении к и к = к - 1 , то расчет окончен,
МЕТОДЫ ВТОРОГО ПОРЯДКА
765
х* = хк+{; б) в противном случае положить Найти градиент V/(x) и матрицу Гессе
к = к + 1 и перейти к шагу 3. Н(х)
Теорема 21.2.6. Пусть f(x) - дважды Шаг 2. Положить к = 0.
непрерывно дифференцируемая сильно выпуклая Я/лг 3. Вычислить V/(xM.
функция с константой / > 0 на R" и удовле- „_ _
творяет условию Ша* 4' Проверить выполнение условия
Wf\x и ^ £i : а) если неравенство выполне-
lH(x)-H(ypLlx-yl Vx,yeR», » l *
но, то расчет закончен, х = х , б) если нет,
где L > 0, д начальная точка такова, что перейти к шагу 5.
1.2 й/2 ^#яг 5. Проверить выполнение условия
V/(x°) < 8 —, т.е. V/(x°) = —, где к > М : а) если неравенство выполнено,
расчет окончен, х = х ; б) если нет, перейти к
q € (0, 1). Тогда последовательность \х \ шагу 6.
сходится к точке минимума с квадратичной Шаг 6. Вычислить матрицу Н\х \.
скоростью lxk - xll < -^— [41]. Шаг 7- Вычислить матрицу Н~х[хк} .
Замечания. 1. Сходимость метода Нью- Шаг 8' ПРовеРить выполнение условия
тона доказана лишь для сильно выпуклых Н 1(хА:)>0: а) если условие выполняется,
функций и для достаточно хорошего началь- ^ '
ного приближения. то найти dk = _#-'(** ЫхМ ; б) если нет,
2. При решении задачи поиска безус- \ / \ /
ловного максимума формула (21.2.14) не из- ,к oW к\
J ^ v J v ' то положить а = -V/l jc I.
меняется, так как в этом случае Ях < 0.
„ А * Шаг 9. Определить хк+] = хк + tkdk.
Метод Ньютона-Рафсона. Стратегия ме-
тода Ньютона-Рафсона [Newton-Raphson] для Шаг 10. Найти шаг t*k из условия
решения задачи (21.2.1) состоит в построении
последовательности точек \х |, к = 0, 1, ... , ™\ к> *\ к )
таких, что /(х*+|) </(**), £ = 0,1,... /Z/^г 11. Вычислить хл+1 = хл +/^ .
Шаг 12. Проверить выполнение нера-
хК + tkdK | -> min .
'к
к+\ _ „к L /^
венств
Точки последовательности вычисляются по
правилу
*i * ./ t\ I t\ \\xk+l-xk\\<e2, \f(xk+l)-f(xki<E2:
xk+l=xk -tkH-l(xk)vf{xk)), k = 09 1,..., И И 2 П / yl У| 2
а) если оба условия выполнены при текущем
(21.2.15) значении к и к = к - 1 , то расчет окончен,
* к 4-1
0 х = х ; б) в противное случае положить
где х задается пользователем, а величина У , ,
& = к + I и перейти к шагу 3.
шага tk определяется из условия w ч
Теорема 21.2.7. Пусть функция f(x) -
ф(/^) = f(xk -tkH~Hxk\vf(xk\)-> min. дважды непрерывно дифференцируема и сильно
k выпукла на R", а ее матрица Гессе Н(х)
(21.2.16) удовлетворяет условию Липшица
Задача (21.2.16) может решаться либо щ. _ ш* < L ||х _ у« Vjc y e Rn
аналитически, либо численно как задача од- II v / vii \\ 'и
номерной минимизации.
Алгоритм. Шаг 1. Задать х , £| >0,
7Ъгдд последовательность \х \ сходится
£2 > 0 , Л/ - предельное число итераций. независимо от выбора начальной точки х к
766
Глава 21.3. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА УСЛОВНОГО ЭКСТРЕМУМА
точке минимума х с квадратичной скоростью
lxk+{-xkl<—lxk-х*1 , где т - оценка
наименьшего собственного значения матрицы
[33].
Замечание. Сходимость к точке
минимума метода Ньютона-Рафсона гарантируется
независимо от выбора начального
приближения лишь для сильно выпуклых функций.
Метод Марквардта. Стратегия метода
Марквардта [Marquardt D.W.] для решения
задачи (21.2.1) состоит в построении
последовательности точек \х \, к = 0, 1, ... , таких,
что f(xk+l \ < f(xk), к = О, 1, ... Точки
ШагЪ. Вычислить Vf(xk).
Шаг 4. Проверить выполнение условия
V/fx I < £j : а) если неравенство выполне-
* к
но, то расчет окончен, х = х ; б) если нет,
перейти к шагу 5.
Шаг 5. Проверить выполнение условия
к > М : а) если неравенство выполнено, рас-
* к
чет окончен, х - х ; б) если нет, перейти к
шагу 6.
Шаг 6. Вычислить
Шаг 7. Вычислить
Н(хк).
Е.
последовательности
правилу
вычисляются по
ХШ =хк -Ыхк) + \1кЕТ]Ч/(хк),
к = 0, 1, ..., (21.2.17)
где точка х задается пользователем, Е —
к
единичная матрица, \1 —
последовательность положительных чисел, таких, чго мат-
■**Г'
Шаг 8. Вычислить \н[хк\ + \1ке] .
Шаг 9. Вычислить
dk =-\н(хк)+\хкЕ]~\/(хк).
Шаг 10. Вычислить
хк+\ =хк
\H{xk) + iikEV\f{xky
рица
[H(xk) + iLk
положительно
определена. Как правило, число \i назначается как
минимум на порядок больше, чем самый
большой элемент матрицы Н\х 1, а в ряде
стандартных программ полагается \1 = 1(Г
[37]. Если /|x*-(tf(x*)+|i*tf)"V(jc*)
:/(«*).
ТО \1
к+\
В противном случае
\i = 2[i . Легко видеть, что алгоритм
к
Марквардта в зависимости от величины \х
на каждом шаге по своим свойствам либо
приближается к алгоритму Ньютона, либо к
алгоритму градиентного спуска.
Алгоритм. Шаг 1. Задать х , £j >0,
М — предельное число итераций. Найти
градиент V/(x) и матрицу Гессе Я(х).
Шаг 2. Положить к = 0, \лк = \1°.
Шаг 11. Проверить выполнение условия
fix ) < fix I: а) если неравенство
выполняется, то перейти к шагу 12; б) если нет,
перейти к шагу 13.
Шаг 12. Положить к = к + 1, \1к+] =
ц*
= -— и перейти к шагу 3.
к ^ к
Шаг 13. Положить \i = 2\i и перейти
к шагу 7.
Замечание. В окрестности точки
минимума х метод Марквардта обладает
скоростью сходимости, близкой к квадратичной
[33].
Глава 21.3
ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА
УСЛОВНОГО ЭКСТРЕМУМА
Применение необходимых и
достаточных условий условного экстремума,
изложенных в разд. 21.1.3, эффективно для решения
ограниченного числа примеров, в которых
вытекающие из этих условий соотношения
имеют аналитическое решение. Для решения
большинства практических задач
используются численные методы, которые делятся на две
группы.
МЕТОДЫ ПОСЛЕДОВАТЕЛЬНОЙ БЕЗУСЛОВНОЙ МИНИМИЗАЦИИ
767
1. Методы, использующие
преобразование задачи условной оптимизации в
последовательность задач безусловной оптимизации
путем введения в рассмотрение
вспомогательных функций: методы последовательной
безусловной минимизации.
2. Методы непосредственного решения
задачи условной оптимизации, основанные на
движении из одной допустимой точки, где
выполнены все ограничения, к другой
допустимой точке с лучшим значением целевой
функции. Эти методы часто называют
методами возможных направлений.
Основная идея методов первой группы
состоит в том, чтобы аппроксимировать
исходную задачу условной оптимизации
некоторой вспомогательной задачей, решение
которой менее сложно, чем решение исходной.
Естественно, что ограничившись одной
вспомогательной задачей, можно получить,
вообще говоря, лишь приближенное решение.
Если же использовать последовательность
задач, в определенном смысле "сходящихся" к
исходной, то искомое точное решение в
большинстве случаев окажется пределом
соответствующей последовательности
приближенных решений. Преобразование задачи с
ограничениями в надлежащим образом
построенную последовательность задач без
ограничений представляется целесообразным, главным
образом, в связи с наличием эффективных и
надежных методов безусловной минимизации,
изложенных в гл. 21.2.
В рамках единой методологии можно
выделить несколько подходов к решению
задачи.
Первый называется методом штрафов
(внешних штрафов). В этом методе к целевой
функции добавляется функция,
интерпретируемая как штраф за нарушение каждого из
ограничений. Метод генерирует
последовательность точек, которая сходится к решению
исходной задачи.
Второй подход называется методом
барьеров (внутренних штрафов). Здесь к целевой
функции исходной задачи добавляется
слагаемое, которое не позволяет генерируемым
точкам выходить за пределы допустимой
области.
Третий подход связан с добавлением
штрафной функции не к целевой функции, а
причем при невыполнении ограничений и
гк -><*>, к -> ©о справедливо Р(х, гк ) -> «>.
к
Чем больше г , тем больше штраф за невы-
к ее функции Лагранжа. В результате
возникает модифицированная функция Лагранжа, а
методы, использующие эту функцию,
называются методами множителей.
Четвертый подход базируется на
введении так называемых точных штрафных
функций, позволяющих ограничиться решением
лишь одной задачи безусловной
минимизации.
Методы непосредственного решения
задачи условной оптимизации, образующие
вторую группу, связаны с нахождение предела
х последовательности \х \ допустимых
точек при к -> оо , таких, что f(xk+l ] <
< fix I, к = 0, 1, ... Последовательность
\хк I строится по правилу хк+{ = хк + Ьхк ,
к = О, 1, ..., где вектор §х определяется в
зависимости от применяемого метода. К
описанной группе методов относятся метод
проекции градиента и метод возможных
направлений Зойтендейка.
21.3.1. Методы последовательной
безусловной минимизации. Метод штрафов.
Рассматривается задача (21.1.14):
/(**)= min/(*),
\ \gj(x)=0, j = l,...,m\m<n\
[ |£у(х)<0, j = m + l,...,p J "
Идея метода заключается в сведении
задачи на условный минимум к решению
последовательности задач поиска безусловного
минимума вспомогательной функции:
F(x,rk) = f(x) + P(x,rk) -> min ,
xgR
где Р\х,г J - штрафная функция, г —
параметр штрафа, задаваемый на каждой к-п
итерации. Штрафные функции
конструируются, исходя из условий:
полнение ограничений. Как правило, для
ограничений типа равенств используется
квадратичный штраф, а для ограничений типа
неравенств - квадрат срезки:
V)=L,
при выполнении ограничений,
при невыполнении ограничений,
768
Глава 21.3. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА УСЛОВНОГО ЭКСТРЕМУМА
к \ т р ->
1>1
j=m+\
где
S+(x) = max{0, g,-(x)} =
срезка функции:
Sj(x)> Sj(x)>0,
о, gy(x)a
Начальная точка поиска задается обычно
вне множества допустимых решений X . На
каждой k-Pi итерации ищется точка х (г I
минимума вспомогательной функции
Fix, г 1 при заданном параметре г с
помощью одного из методов безусловной
минимизации. Полученная точка х lr J
используется в качестве начальной на следующей
итерации, выполняемой при возрастающем
значении параметра штрафа. При" неограни-
k
ченном возрастании г последовательность
точек х (г ) стремится к точке условного
*
минимума х .
Алгоритм, Шаг 1. Задать начальную
точку х ; начальное значение параметра штрафа
г > 0; число С > 1 для увеличения
параметра; малое число е > 0 для остановки
алгоритма. Положить к = 0.
Шаг 2. Составить вспомогательную
функцию
/(*, г* ) = /(*)+
Z [у=1 j=m+l J
Шаг 3. Найти точку х (г )
безусловного минимума функции Fix, r по х с
помощью какого-либо метода (нулевого,
первого или второго порядка):
f(x*(r* ),/•*) = minf(jc,r*).
При этом задать все требуемые выбранным
методом параметры. В качестве начальной
точки взять хк . Вычислить Р\х*\гк\гк\.
Шаг 4. Проверить условие окончания:
а) если Plx*lrk\rk)<e , процесс поиска
закончить: х* = х*1гк), /(* j = /fJC*(rj) >
б) если Plx*lrk ), гк) > е , положить:
г*+1=Сг*, хк+1=х*(гк), к = к + 1 и
перейти к шагу 2.
Теорема 21.3.1. Пусть х — локально
единственное решение задачи поиска условного
минимума, а функции f(x) и gj(x)
непрерывно дифференцируемы в окрестности точки х .
Тогда для достаточно больших г найдется
точка х lr 1 локального минимума функции
F\x,rk\ в окрестности х* и x*lrk\->x*
при rk -> оо [35].
Замечания. 1. Так как сходимость метода
к
обеспечивается при г —> <», то возникает
вопрос о том, нельзя ли получить решение
исходной задачи в результате однократного
поиска безусловного минимума вспомога-
к
тельной функции с параметром г , равным
большому числу, например 10 . Однако
такая замена последовательного решения
вспомогательных задач не представляется
к
возможной, так как с ростом г функция
Fix, г ) приобретает ярко выраженную
овражную структуру. Поэтому скорость
сходимости любого метода безусловной
минимизации к решению х lr I резко падает, так что
процесс его определения заканчивается, как
правило, значительно раньше, чем будет
достигнута заданная точность, и, следовательно,
полученный результат не дает возможности
судить об искомом решении х .
2. Точки х lr ) в алгоритме - это
точки локального минимума функции
Однако функция Fix, r ) может быть
неограниченной снизу, и процедуры методов
безусловной минимизации могут расходиться.
Это обстоятельство необходимо учитывать
при программной реализации.
МЕТОДЫ ПОСЛЕДОВАТЕЛЬНОЙ БЕЗУСЛОВНОЙ МИНИМИЗАЦИИ
769
3. В методах штрафных функций
имеется тесная связь между значениями параметров
штрафа и множителями Лагранжа для
регулярной точки минимума (см. п. 21.1.3):
Чг*)=г**4**И]' у'=и"ш;
lim Xj(rk) = \), у = 1,...,/я; j е Ja .
4. Обычно выбирается г° = 0,01; 0,1; 1, а
С е [4,Ш]. Иногда начинают с г = 0 , т.е. с
задачи поиска безусловного минимума.
5. При решении задач процедура
расчетов завершается при некотором конечном
к
значении параметра штрафа г . При этом
приближенное решение, как правило, не
лежит во множестве допустимых решений, т.е.
ограничения задачи не выполняются. Это
является одним из недостатков метода. С рос-
том параметра штрафа г генерируемые
алгоритмом точки приближаются к решению
исходной задачи извне множества допустимых
решений. Поэтому обсуждаемый метод иногда
называют методом внешних штрафов.
6. На практике для получения решения
исходной задачи с требуемой точностью
достаточно бывает решить конечное
(относительно небольшое) число вспомогательных задач.
При этом нет необходимости решать их
точно, а информацию, полученную в результате
решения очередной вспомогательной задачи,
обычно удается эффектно использовать для
решения следующей.
Пример 21.3.1. Найти минимум в задаче
f(x) = х2 - Ах -> min ,
gl(x) = x-l<0.
1. В поставленной задаче т = 0
(ограничения-равенства отсутствуют), р = 1.
Решим задачу аналитически при произволь-
к
ном параметре штрафа г , а затем получим
решение последовательности задач поиска
безусловного минимума.
2. Составим вспомогательную функцию:
к
f(x,rk)) = x2-4x + — [max{0,(jc- I)}]2 .
3. Найдем безусловный минимум
функции fix, г I по х с помощью необходимых
dF(x,rk)
и достаточных условий: — -
дх
\2х - 4 = 0, х - 1 < 0,
2х-4 + гк(х-\) = 09х-\>0.
Отсюда
х = 2 , но при этом не удовлетворяется ус-
4 + г^
ловие х — 1 < 0 , а также х
V)-—t
Так как
**УУ) 2|,,
дх2
> 0 при
г > 0 , то достаточные условия минимума
Fix, r ] удовлетворяются. При /•—>«>
имеем
х* = iim „ Гк = { ' Ах*) = "3 '
Метод барьерных функций.
Рассматривается задача (21.1.16):
/(/)=mm/(x),
X = {x\gj(x)<0,j = l,...,m}.
Идея метода заключается в сведении
задачи на условный минимум к решению
последовательности задач поиска минимума
вспомогательной функции Fix, г 1 = f(x) +
+ P(x,rk), где P\x,rk\ - штрафная
функция, г > 0 — параметр штрафа.
Как правило, используются:
а) обратная штрафная функция
т !
б) логарифмическая штрафная функция
т
P(x,rk) = -rkJjki[-gj(xj\.
У=1
Обе штрафные функции определены и
непрерывны внутри множества X , т.е. на
множестве jx | gj (х) < 0, j = 1,..., m}, и
стремятся к бесконечности при приближении
к границе множества изнутри. Поэтому они
называются барьерными функциями. При
rk > 0 штрафная функция, задаваемая об-
25 - 7706
770
Глава 21.3. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА УСЛОВНОГО ЭКСТРЕМУМА
ратной функцией, положительна.
Логарифмическая штрафная функция положительна при
- 1 < g(x) < 0 и отрицательна при
g(x) < -1, т.е. внутренним точкам области
отдается предпочтение перед граничными
точками.
Начальная точка задается только внутри
множества X. На каждой А>й итерации
ищется точка х
У)
минимума
вспомогательной функции Fix, г 1 при заданном
k
параметре г с помощью одного из методов
безусловной минимизации. Полученная точка
х \г I используется в качестве начальной на
следующей итерации, выполняемой при
уменьшающемся значении параметра штрафа.
При г —> +0 последовательность точек
,у)
стремится к точке условного
минимума х . Барьерные функции как бы
препятствуют выходу из множества X , а если
решение задачи лежит на границе, то процедура
метода приводит к движению изнутри области
к границе.
Заметим, что согласно описанной про-
положить
Л+1 г
цедуре точки
х(гк)
лежат внутри множества
допустимых решений для каждого г . Этим
объясняется то, что метод барьерных функций
иногда называется методом внутренних
штрафов.
Алгоритм. Шаг 1. Задать начальную
точку х внутри области X ; начальное
значение параметра штрафа г > 0 ; число С > 1
для уменьшения параметра штрафа; малое
число е > 0 для остановки алгоритма.
Положить к = 0.
Шаг 2. Составить вспомогательную
функцию:
^У) = /(*)-г*2-1- или
у=1 *ЛХ)
т
F(x,rk) = f{x)-rk^\n[-gj(x)}.
У=1
Шаг 3. Найти точку х (г I минимума
функции Fix, r J с помощью какого-либо
метода (нулевого, первого или второго
порядка) поиска безусловного минимума с
проверкой принадлежности текущей точки
внутренности множества X. При этом задать все
требуемые выбранным методом параметры.
к
В качестве начальной точки взять х .
Вычислить:
P(xyy)=-r'fln[-sj(,yjf\.
У=1
Шаг 4. Проверить выполнение условия
окончания: а) если \Plx lrk\r |^£,
процесс поиска закончить: х = х 1г ),
/(/) = /(/(г*));б)если|р(/(4г*|>е,
с, хк+1=ху),
к = к + 1 и перейти к шагу 2.
Теорема 21.3.2. Пусть функции f(pc),
gj(x), j = l,...,m , выпуклы и конечны,
множество X решений задачи поиска условного
минимума не пусто и ограничено, существует
точка х е X, такая, что gj lx I < 0,
j = l,...,/w . Тогда в методе барьерных
функций X*k = Arg min Fix, rk J * 0 , функции
F(x,rk) выпуклы, последовательность
\xlr И , порожденная алгоритмом,
ограничена и все' ее предельные точки принадлежат
X*, причем f[x[rk))*/(**), ** еХ* [35].
Замечания. 1. Обычно выбирается
г° =1; 10; 100 , а параметр С = Ю;12;16 .
к г\
2. При г —> +0 обеспечивается сходи-
мость, однако с уменьшением г функция
Fix, r ) становится все более овражной.
Поэтому полагать г малым числом сразу
не цел есообразн о.
МЕТОДЫ ПОСЛЕДОВАТЕЛЬНОЙ БЕЗУСЛОВНОЙ МИНИМИЗАЦИИ
771
3. Так как большинство методов поиска
безусловного экстремума использует
дискретные шаги, то вблизи границы шаг может
привести в точку вне допустимой области. Если в
алгоритме отсутствует проверка на
принадлежность точки множеству bc|gy(x)<0,
у = 1,...,/я}, то это может привести к
ложному успеху, т.е. уменьшению
вспомогательной функции в точке, где она теоретически
не определена. Поэтому на шаге 3 алгоритма
требуется явная проверка того, что точка не
покинула допустимую область. Процедура
поиска обычно завершается при некотором
к
малом г , отличном от нуля. Однако
приближенное решение принадлежит множеству
допустимых решений. Это одно из
преимуществ метода барьерных функций.
4. Побочным продуктом вычислений в
методе штрафных функций является вектор
множителей Лагранжа:
*ДХИ)
эбратной штрафной функции;
для
т — для
логарифмической штрафной функции;
X*} = Jim Х,-(гк).
Пример 21.3.2. Найти минимум в задаче
f(x) = х -> min ,
g[(x)=2-x<0.
1. Найдем решение аналитически с
применением обратной штрафной функции.
2. Составим вспомогательную функцию:
Л 1
f(x,rk) =
х-г
2-х
Р(х,гк)
3. Найдем безусловный минимум
fix, г 1 с помощью необходимых и доста-
df(x,rk)j rk
точных условии:
= 1--
= 0.
Э* (2-xf
Так как внутри множества допустимых
решений 2 - х < 0 , то х = 2 ± \rk , a
Достаточные условия ми-
d2F(x*(rk),rk)
нимума выполняются:
Эх2
> 0. При г —» 0 получаем
искомую точку условного экстремума х = 2 .
Комбинированный метод штрафных
функций. Рассматривается задача (21.1.14) поиска
условного экстремума со смешанными
ограничениями. Для ограничений типа равенств
применяется метод штрафов (внешних
штрафов), а для ограничений-неравенств — метод
барьерных функций (внутренних штрафов).
Задача на условный минимум сводится к
решению последовательности задач поиска
минимума смешанной вспомогательной
функции:
'К)=л*)+АХМ*)]
2г*Р
-Г
j=m+\ %j \X)
или
1 т 1
^*)-/W+rrS[*yW]2-
-'* £ >п[-^(х)],
j=m+\
где r^ > 0 — параметр штрафа.
Начальная точка задается так, чтобы
ограничения-неравенства строго выполнялись:
gj (х) < 0, j = т + 1,..., р . На каждой к-й
итерации ищется точка х
V)
минимума
смешанной вспомогательной функции при
к
заданном параметре г с помощью одного из
методов безусловной минимизации.
Полученная точка х
У)
используется в качестве
начальной на следующей итерации,
выполняемой при уменьшающемся значении
параметра штрафа. При гк -> +0
последовательность точек х \г ) стремится к точке услов-
*
ного минимума х .
25*
772
Глава 21.3. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА УСЛОВНОГО ЭКСТРЕМУМА
Алгоритм. Шаг 1. Задать начальную
точку х° так, чтобы gj(x)<0, j = m + 1,...,/>;
начальное значение параметра штрафа
г > О ; число С > 1 для уменьшения
параметра штрафа; малое число е для остановки
алгоритма. Положить к = О.
Шаг 2. Составить смешанную
вспомогательную функцию
'(*''*M*)+tVZ[M*)] -
У=/и+1 *У Vя;
или
^Ю-/(*)+ттХ[«Л*)] -
2г*
у=|
-г* X 1п[-*;(х)] = /(х)+/»(х,г*).
У=т+1
ZZ/дг 3. Найти точку х (г I минимума
функции /чх,г I с помощью какого-либо
метода поиска безусловного минимума с
проверкой выполнения справедливости
неравенств: gj(х) < 0, j = т + 1,..., р . При этом
задать все требуемые выбранным методом
параметры. В качестве начальной точки взять
хк.
Шаг 4. Вычислить Plx*(rk\rk ) и
проверить условие окончания: а) если
г
чить:
(ху),,
г 1 < е, процесс поиска закон-
положить
б) если |Wx*(rM,r*]|>e,
гш =!—, хк+{=х*(гк), к = к + \ и
перейти к шагу 2.
Замечания. 1. Авторы метода — Фиакко А.
и Мак-Кормик Г. [Fiacco A.V., McCormick
G.P.] - рекомендуют выбирать г = 1 ,
С = 4. Теорема о сходимости метода имеется
в [44]. Можно использовать разные
параметры штрафа для внешних и внутренних
штрафов.
2. Побочным продуктом вычислений
является вектор множителей Лагранжа:
Ч'')=-
g
kn
j = 1,...,/и;
, j = /и + 1,...,р
4'ИГ
(для обратной штрафной функции);
x,{rt)"~wn\y=m+l '
(для логарифмической штрафной функции);
lim Х;(гк) = Х), У = !,...,/>.
Метод множителей. Стратегия решения
задачи (21.1.14) аналогична используемой в
методе внешних штрафов, только штрафная
функция добавляется не к целевой функции,
а к классической функции Лагранжа. В
результате задача на условный минимум
сводится к решению последовательности задач
поиска безусловного минимума
модифицированной функции Лагранжа:
т
L(x^ky,rk) = f(x)+^kjgj(x)+
7=1
Л т
►VXhwr
7=1
1
2rk
t{[inax{0,^+r*^(x)}]2-(^)2l,
j=m+\
где Xk =(\k,...,Xkmf, ц*=(ц*+|,...,ц*)Г -
If
векторы множителей; г — параметр штрафа;
к — номер итерации.
Задается начальная точка поиска х . На
каждой к-й итерации ищется точка минимума
модифицированной функции Лагранжа при
л к к к
заданных Л , |Х ,г с помощью одного из
методов безусловной минимизации. Получен-
*{>\к к к\
ная точка х IA , \1 ,г 1 используется в
качестве начальной на следующей итерации,
МЕТОДЫ ПОСЛЕДОВАТЕЛЬНОЙ БЕЗУСЛОВНОЙ МИНИМИЗАЦИИ
773
выполняемой при возрастающем значении
к
параметра штрафа г и пересчитанных
определенным образом векторах множителей
А , |Х . Для достижения сходимости в отли- фа);
\p(x*(\k,iik,rk\ [1к,гЧ > е , положить:
г + = С г (пересчет параметра штра-
чие от метода внешних штрафов не требуется
к
устремлять г к бесконечности.
Алгоритм. Шаг I. Задать начальную
точку х ; начальное значение параметра штрафа
г > 0 ; число С > 1 для увеличения
параметра; начальные значения векторов
множителей X ,|Х ; малое число е > 0 для
остановки алгоритма. Положить к = О.
Шаг 2. Составить модифицированную
функцию Лагранжа:
т
L(x,\k ,цк ,rk) = f(x)+%Xkjgj(x)+
„к т
-IM*)]
7=1
2 1
+ X
Н
2гК
j=m+\ I
Шаг 3. Найти точку x*ikk,\ik,rk\
безусловного минимума функции по х с
помощью какого-либо метода (нулевого, первого
или второго порядка):
L(x\XkyVLk,rk)= min l(x,A*,u/vM.
Х€. R
При этом задать все требуемые выбранным
методом параметры. В качестве начальной
к
точки взять х .
Шаг 4. Вычислить р(х*(хк ,\ik 9гк\
ц*,г*),где P(x,Hk,rk) = ^f[gj(x)f +
У=1
2г'
- ± {[тах{0,^+г^у^}]2-И)2}
у'=/н+1 L J
и проверить выполнение условия окончания:
а) если \p(x*(xk,\ik,rk\ мЛ>^| ^е , про-
* */*к к к\
цесс поиска закончить: х = х (Л ,|Х ,г 1,
f(x*) = f(x*(lky,rk)); б) если
хк+\ = Хк + гЦ/^>иД г*))
(пересчет множителей для ограничений-равенств);
\ik+l = maxjo,uj +rkgj(x*(\k,\ik,rk)j^
(пересчет множителей для ограничений-
неравенств);
x*+1=x*(jVfr*), к = к + 1 и
перейти к шагу 2.
Теорема 21.3.3. (о сходимости метода
множителей в задаче с ограничениями типа
равенств). Пусть функции f(x); gj(x),
у = 1,...,/и (р = т) непрерывны,
последовательность <Х \ ограничена, О < г < г
при всех к , причем г —> ©о , X —
компактное изолированное множество точек локального
минимума в исходной задаче. Тогда найдется
подпоследовательность \х > , сходящаяся к
некоторой точке х е X и такая, что ее
произвольный элемент х , k e К является
точкой локального минимума функции
Цх,Х ,г I. Если при этом X состоит из
единственной точки х , то можно указать
последовательность <х > и номер к > О та-
к * к
кие, что х —> х их является точкой
локального минимума функции Llx,X ,r J при
k>k [8].
Замечания. 1. Сходимость метода
множителей в задаче со смешанными
ограничениями доказана в [8]. Там же показано, что
при определенных дополнительных
предположениях метод сходится не медленнее, чем
линейно, если последовательность <г >
ограничена, и сверхлинейно, если
последовательность \г \ неограниченно
возрастающая.
2. На каждой итерации желательно,
чтобы найденная точка локального минимума
была бы ближайшей к л: .
774
Глава 21.3. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА УСЛОВНОГО ЭКСТРЕМУМА
Метод корректен, если, начиная с некоторого
к , метод безусловной минимизации всякий
раз приводит в окрестность одной и той же
*
точки х условного локального минимума.
Описанная на шаге 3 преемственность задач
позволяет на это надеяться.
3. Если x*(xk,\ik,rk) -> х*, то через
конечное число итераций те множители,
которые соответствуют ограничениям, не
являющимся активными в точке х , обратятся
в нуль.
4. Обычно г° = 0,1; 1, а С е [4, 10].
Целесообразно выбрать X , |Х близкими к
А ,|Х , используя априорную информацию о
решении. Иногда выбирают X= |Х = 0.
В этом случае первая вспомогательная задача
минимизации совпадает с решаемой в методе
внешних штрафов.
5. Методом множителей удается найти
условный минимум за меньшее число
итераций, чем методом штрафов. При этом для
достижения сходимости не требуется устрем-
к
лять г к бесконечности. Доказано, что
минимум модифицированной функции Лагран-
к
жа, начиная с некоторого г , совпадает с
минимумом в исходной задаче. Это приводит
также к тому, что проблема увеличения ов-
ражности не является такой острой, как в
методе штрафов.
6. Метод множителей был предложен
Пауэллом [Powell M.J.D.] и Хестенсом
[Hestenes M.R.] и имеет многочисленные
модификации [8, 37].
Метод точных штрафных функций. Идея
заключается в таком построении
вспомогательных функций, что для выбранных
соответствующим образом параметров штрафа
однократная безусловная оптимизация дает
решение исходной задачи. При построении
вспомогательных функций могут
использоваться:
1) недифференцируемые точные штрафные
функции, безусловный минимум которых по х
ищется при фиксированном значении
параметра штрафа:
/,(xfr*) = /(x) + r*max{Of|g1(jc)|f...f
xeR"
(21.3.18)
2) дифференцируемые точные штрафные
функции (для задач с ограничениями типа
равенств):
F(xXrk,ak) = L(x*)+^[gj(x)]2
\dL(x,X)]2
k n
Эх,
mm ,
(x,X)eR
(21.3.19)
где
k k r\
r , a > 0 - параметры штрафа,
L(x, X) = f(x) + V *Xj8j {x) ~ классическая
функция Лагранжа;
k m
F(xy) = L[x+(x)]+!-Z[gj (x)f -> mill ,
У=1
где
xeRn
(21.3.20)
X(x) = - [vg(x)T Vg(x)Jl Vg(x)T V/(x),
k r\
r > 0 - параметр штрафа. Для
минимизации недифференцируемых вспомогательных
функций можно применять методы нулевого
порядка, а для дифференцируемых — также
методы, использующие производные. Увел и-
к
чивать параметр штрафа г до бесконечности
не требуется: существует конечное пороговое
значение г , такое, что х будет точкой
безусловного минимума Fix, г ) при любом
к ~~ к
г > г. Параметр а задается достаточно
малым положительным числом.
Алгоритм. Шаг 1. Задать начальную
точку х ; начальное значение параметров
штрафа г > 0 , a > 0; число С > 1 для
изменения параметров штрафа; максимальное
число решаемых задач безусловной
минимизации N; малое число е > 0 для остановки
алгоритма. Положить к = 0.
Шаг 2. Составить вспомогательную
функцию вида (21.3.18) или (21.3.19), или
(21.3.20) в зависимости от типа решаемой
задачи.
Шаг 3. Найти точку х г или
1х*\^гк,ак)уХ*(гк,ак)) безусловного
минимума вспомогательной функции по jc для
(21.3.18), (21.3.20), и по х, X для (21.3.19).
МЕТОДЫ ВОЗМОЖНЫХ НАПРАВЛЕНИЙ
775
В качестве начальной точки взять х .
Предусмотреть прекращение процесса
минимизации, если вспомогательная функция не
ограничена снизу.
Шаг 4. Вычислить абсолютное значение
соответствующей штрафной функции:
p(xyy) = rkmax[o,\gl(xy)j
/ ч т
У=1
х 8j(**(rk,а*)) + Y^Lgj(x*(rk'а*)) +
7=1
к п
а ^
2 *
/=1
дХ;
p[xyy)-±Xj[xy)]gJ(xyi
У=1
4Ы-У))2
7=1
и проверить выполнение условия окончания:
а) если вычисленное значение меньше
или равно е , процесс поиска закончить:
х* = x*(rk ) или х* = х*(гк 9ак\;
б) если оно больше е и к = N - 1,
процесс закончить и выдать сообщение о
неудаче;
в) если вычисленное значение больше е
и k<N-l, положить rk+i=Crk,
ак+[=Сак, хш=х*(гк) или хк+{ =
= х*(гк,ак), к = к + 1 и перейти к шагу 2.
Замечания. 1. Приведенные здесь
дифференцируемые точные штрафные функции
могут рассматриваться как
модифицированные функции Лагранжа. Теоремы о
сходимости метода точных штрафных функций
приведены в [8].
2. Пороговые значения параметров
штрафа г зависят от величин, связанных с
*
х и, следовательно, заранее неизвестных.
Поэтому для выбора удачных значений
параметров приходится применять их
корректировку конечное число раз. Если значение г
занижено, вспомогательная функция может
оказаться неограниченной снизу, либо
«область притяжения» точки х будет очень
к
малой. Если же взять г слишком большим,
вспомогательная задача может иметь плохое
решение из-за овражности.
Пример 21.3.3. Найти минимум в задаче
f(x) = х -> mill,
g,(x)= 2-х <0.
Используем недифференцируемую точную
штрафную функцию (21.3.18):
F(x,rk) = f(x) + rk max{0,£,(*)} =
= x + rk max{0,2 - x] -> min.
При r > 1 функция имеет
безусловный минимум в точке х = 2 ,
являющейся решением поставленной задачи.
При гк < 1 функция fx, rk ) не имеет
локального минимума и вообще не ограничена
снизу.
21.3.2. Методы возможных
направлений. Метод проекции градиента. Метод
проекции градиента (метод Розена [Rozen J.В.]
применяется в задачах поиска условного
экстремума с ограничениями типа равенств и
неравенств.
В задаче с ограничениями типа равенств:
/(**) = min/(*),
X = {x\gj(x) = 0, j = l,...,m; m < n),
стратегия поиска решения методом проекции
градиента состоит в построении последова-
п
вычисляемых по пра-
тельности точек
вилу
хк+{ =хк +дхк, к = 0, 1, ...,
где 5х есть вектор, вычисляемый для
каждого значения к . Приращение 5х
определяется из условия проекции вектора
776
Глава 21.3. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА УСЛОВНОГО ЭКСТРЕМУМА
- tkVf\x 1, к = О, 1, ... , на
аппроксимирующую плоскость, задаваемую уравнением
АкЪх = хк ,
к
которая аппроксимирует в точке х ,
к = 0, 1, ..., поверхность Г, задаваемую
уравнениями gj (х) = 0 , j = 1,..., т . Здесь
Ак — матрица размера /их п вида
(Ых)
дХ\
»|(*Л
Эх„
Эх„
а хк — вектор-столбец,
т
**="(*! (**).•••.&» (■**)) •
Вектор 5jc определяется по формуле
&ск = Ь{хк +Ь2хк >
где 5jX называется градиентной
составляющей приращения, она равна
SlXk=4^E-Al(AkAl)'lAk^f(xk) =
= -tkAxk
и обладает следующим свойством:
градиентная составляющая приращения 5|Х в
линейном приближении не меняет вектор
невязки условий связи. Это означает, что под
действием градиентной составляющей точка
к
х движется параллельно или по плоскости
АкЪх = хк . Составляющая Ъ2х называется
компенсационной составляющей приращения и
Величина шага tk может выбираться
как из условия убывания f(x) при переходе
к к
из точки х в точку х -tk
E-Afx
xlAkA^\ Ak V/ х , так и из условия
v{tk) = f(xk-tk\E-A{(AkAZ)~lAk
xVf(xk )]-»min .
к
Расчет заканчивается в точке х , в
которой Ах j ^ е , $2* J - 8 ' где е ~~ за"
данное число. В полученной точке х
требуется обязательная проверка
выполнения достаточных условий минимума функции.
Точное
равенство
\-1
5,** =-tk\E-A%x
х Ык А^ I Ak V/I х I = 0 свидетельствует
о точном выполнении необходимых условий
экстремума, при этом вектор множителей
Лагранжа определяется по формуле X =
= -yAkAjc J AkVf(x\. Знание приближе-
лк л *
ния А вектора А позволит осуществить
к
проверку достаточных условии в точке х .
Алгоритм. Шаг 1. Задать х , г > О,
число итераций М.
Шаг 2. Положить к = О.
Шаг 3. Проверить выполнение условия
к > М : а) если неравенство выполнено, то
. к
расчет окончен. Вычислить А , проверить
необходимые и достаточные условия
минимума и оценить результат; б) если
неравенство не выполнено, то перейти к шагу 4.
Шаг 4. Вычислить матрицу
'dg,{x) дф)^
Эта состав-
равна Ъ2хк = A[\AkAl} хк
ляющая обладает, в линейном приближении,
свойством компенсировать вектор невязки
условий связи на величину хк . Под
действием составляющей Ь2х осуществляется
проекция точки х на плоскость АкЪх = хк .
Ay =
дх{
dgm(x)
дх\
дхп
Эх„
Шаг 5. Вычислить %к =- glxky-
~(*и «.мГ-
МЕТОДЫ ВОЗМОЖНЫХ НАПРАВЛЕНИЙ
777
Шаг 6. Вычислить
b2xk=ATk(AkATk)'\k.
Шаг 7. Вычислить §2* | •
Шаг 8. Вычислить Vf[xk\.
Шаг 9. Вычислить
\-1
АхК =-
Е-Атк(АкЛтк)~ Ak\vf(xk).
Шаг 10. Проверить выполнение условий
|лх*|<еи|б2.фе:
а) если Ах реи §2* | - е > то Рас~
чет окончен. Перейти к вычислению X и
проверке достаточных условий минимума;
б) если то
положить §2Х = 0 и перейти к шагу 11;
в) если IIax^I < е , ||s2x^|
жить Ах = 0 и перейти к шагу 13;
г) если jAxk > е , ю2хк > е, перейти
к шагу 11.
Шаг 11. Получить точку х + tkAx .
Шаг 12. Определить tk из условия
f(xk + tkAxk)-+ min .
Шаг 13. Вычислить хШ = хк +
+ tkAxk + Ъ2хк . Положить к = к + 1 и
перейти к шагу 3.
Замечание. Если ограничения в задаче
линейны, то при к >\ на шаге 3 переходим
к шагу 8. На шаге 10 следует положить
№2Х = 0 • Так как в этом случае ограниче-
п
ния имеют вид 2LaUxj = ^/» ' = 1, •>#* > то
7=1
матрица А постоянна. Это означает, что в
силу свойства компенсационной
составляющей §2Х она вычисляется единственный раз
в точке х . При этом начальная точка
попадает в область допустимых решений за одну
итерацию. Дальнейший процесс построения
последовательности <х \ связан с
вычислением составляющей д^х .
Теорема 21.3.4. Пусть f(x) — выпуклая,
дифференцируемая на R" функция, градиент
которой удовлетворяет на множестве Q
условию Липшица с константой L . Пусть
множество Q — выпуклое и замкнутое, множество
решений задачи X = Arg min f(x) не пусто,
xeQ v '
а 0 < tk < — . Тогда хк -> х е X и, если
, ч к *
f[X) сильно выпукла, х —> х со скоростью
геометрической прогрессии [35].
В задаче с ограничениями типа
неравенств стратегия поиска решения задачи учи-
*
тывает тот факт, что решение х может
лежать как внутри, так и на границе множества
допустимых решений.
Для определения приближения решения
14
> е , то поло- х строится последовательность точек
хк+\ _ %к + §хк ^ £ =0, 1, ..., где прираще-
о к к
ние ох определяется в каждой точке х в
зависимости от того, где ведется поиск -
внутри или на границе множества допустимых
решений.
Решение задачи начинается с обхода
границы допустимой области. Обход границ
множества допустимых решений связан с
к
выявлением активных в точке х ограниче-
Т
ний gj = (gi,...,gp) , аппроксимацией их
плоскостью АкЪх = хк, где Ак =
Эх,-
\х=х
р < п;
матрица размера р х п ,
хк = -gA\x )» и проекцией на нее вектора
- tkVf\x \. Для выявления неравенств, ак-
к
тивных в точке х , задается погрешность
определения активных ограничений 8j<0.
Активными считаются те ограничения, для
которых £| <gj(x)<0. Число р ограниче-
к
ний, активных в точке х , не должно
превышать п — размерности вектора х .
778
Глава 21.3. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА УСЛОВНОГО ЭКСТРЕМУМА
Поиск ограничений, активных в точке
к
х , рассматривается как самостоятельная
задача, которая может быть решена путем
последовательных приближений. Задается
точка х и вычисляется £/(*), j = l,...m.
Если #;(;*:) <£|, то выбираются любые р
ограничений с наименьшими по абсолютной
величине невязками Pj ~ 8j\x) B точке
для всех ограничений, которые не были ак-
к
Разумеется, невязка
£+1
изменяется, и
тивными в точке х
ограничений в точке х
к+2
поэтому вычислению точки х должна
предшествовать процедура выбора активных
ограничений, описанная выше.
Процедура вычисления точек
последовательности <х > обеспечивает последователь
ное движение вдоль границы допустимо»
области. При выполнении неравенств!
находится точка xk+i = хк + Атк(АкАтк)~\к , |***| = " [^ " 4Г(^<* )~Ч] ?/(** I * е2
х , строится матрица Ак, вычисляется хк и
-1
затем снова вычисляются невязки выбранных
р ограничений. Уточнение осуществляется
к
до тех пор, пока не будет найдена точка х ,
в которой £j < gj(x) < О . Проекция вектора
- tkVf[x ) в точке х , в которой активны
р ограничений, определяется точкой
х -х -tk
\е - Атк(АкАтк)~{ Ak~\vf(xk),
Е-А;
\^4)~
где приращение бдс =-/^
Xy4^]V/lx ) осуществляет движение по
плоскости АкЪх = хк в направлении
убывания /(*) • Величина tk выбирается так:
tk = mill /^ > 0, tkmax > О , где tk есть шаг,
при котором
/*'
= min/
tk
Е-Атк(АкАтк)~{ Ак Ы(хк)
xk-tk
Е-А[
\AkAV)
<V/(x*)),
а /,
A; max — наименьший шаг, при котором
gj\x -*kv
Е-Атк(АкАтк)~' Ак
где £2 — заданное достаточно малое
положительное число, вычисляется приближение X
* к
вектора множителей Лагранжа А : X =
= -(АкАтк)'Х AkVf(xk).
Если X > 0, то в точке х выполнены
необходимые условия минимума и в ней
должны быть проверены достаточные условия.
Если среди множителей X; есть отрицатель-
к
ные, то это означает, что х не является
приближением точки х , так как в ней не
выполнены необходимые условия минимума
f(x) при ограничениях gj(x)<0,
j = \,...,m . Однако выбор шага tk
позволяет говорить о том, что значение /(•*) не
может быть уменьшено при заданном составе
активных ограничений и, следовательно,
процесс минимизации f(x) необходимо
продолжить, уменьшив их число: в число
пассивных переводится то из ограничений, которому
соответствует наибольший по абсолютному
значению отрицательный множитель Xj.
Такая процедура поиска позволяет отыскать
решение, лежащее как на границе, так и
внутри множества допустимых решений.
Алгоритм. Шаг 1. Задать х , £| <0,
£2 > 0 , число итераций М .
Шаг 2. Положить к - О.
Шаг 3. Проверить выполнение условия
к > М : а) если неравенство выполнено, то
к
расчет окончен, перейти к вычислению X и
оценке результата; б) в противном случае
перейти к шагу 4.
МЕТОДЫ ВОЗМОЖНЫХ НАПРАВЛЕНИЙ
779
Шаг 4. Вычислить gj(xk), j = 1,..., т .
Шаг 5. Проверить выполнение условий
£l < gjlx ЫО, у = 1,...,/и : а) если
неравенство выполнено хотя бы для одного j ,
вычислить Vf(xk). Если Vf(xk\ * О,
перейти к шагу 7. Если V/(xM = 0 при £>0,
перейти к шагу 9, а если V/lx I = 0, то
следует проверить точку х на принадлежность
области допустимых решений. Если х е X,
перейти к шагу 9. В противном случае задать
заново точку х и перейти к шагу 4; б) если
ни одно из условий не выполнено, перейти к
шагу 6.
Шаг 6. Вычислить точку xv, в которой
будет выполнено условие Z\ < gj[xv\ < 0 , по
крайней мере, для одного значения j :
xv = хк + А[\АкЛ[\ \к . Положить хк = xv
и перейти к шагу 7.
Шаг 7. Вычислить Ахк=-\Е-А%х
х(АкАТк)'' Ak\vf(xk).
Шаг 8. Проверить условие Ах < е2 :
а) если неравенство выполняется, перейти к
шагу 9; б) если нет - к шагу 10.
Шаг 9. Вычислить вектор X =
= -lAkA%\ AkVf(xk). Если \к>0, то
расчет окончен, проверить достаточные
условия минимума. Если нет, то исключить из
состава активных ограничение (оно
переводится в пассивные), которому соответствует
наибольший по модулю отрицательный
множитель, и перейти к шагу 7 (при этом из
матрицы Ак удаляется строка, соответствующая
исключаемому ограничению).
Шаг 10. Получить точку хк + tkAxk .
Шаг 11. Определить tk. Для этого
следует:
а) вычислить tk из условия
flxk +tkAxk)-+ min ;
б) для всех пассивных в точке х
ограничений, кроме переведенных в пассивные на
шаге 9, определить величину tJk из условий
gj[x + tkAx J = 0 , tk > 0 (если условие
gjlx + tkAx I = 0 выполняется только при
tk < 0, то tJk не вычисляется);
в) найти величину tkmax = minimi;
г) вычислить значение tk - min|^,^1Tiax|.
Шаг 12. Вычислить xk+l = хк + tkAxk .
Положить к = к + 1 и перейти к шагу 3.
Теорема 21.3.5. Пусть f(x) ~~ выпуклая
дифференцируемая на Rn функция, градиент
которой удовлетворяет на множестве Q
условию Липшица с константой L . Пусть
множество Q — выпуклое и замкнутое, множество
X = Arg min f(x) не пусто, а величина tk
xeQ
2
удовлетворяет условию 0 < tk < — . Тогда
Li
xk ^> х е X и если /(х) сильно выпукла,
к *
то х —> х со скоростью геометрической
прогрессии [35].
Метод Зойтендейка. В задаче поиска
условного экстремума с ограничениями типа
неравенств:
/(/)=rnin/(x),
X = {x\gj(x)<0, у = 1 /я},
стратегия метода Зойтендейка [Zoutendijk G.]
состоит в построении последовательности
допустимых точек \х \, таких, что
f[xk+X\<f[xkY A: = 0,1, ... Правило
построения точек последовательности \х >:
хк+\ _ хк + f^k ^ £ = fj J, ..., где точка хк ~
допустимая и такова, что - ек < gy (х^ ) < 0,
j e J,Q , JQ ~ множество индексов j
активных ограничений, для которых выполнено
780
Глава 21.3. ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА УСЛОВНОГО ЭКСТРЕМУМА
последнее условие; величина шага 7**0 , Fjaa 3' Проверить выполнение условия
к < М : а) если к = М , расчет закончен;
находится в результате решения задачи одно- б) ^ш к<м п^^п r щагу 4
мерной минимизации: /(** + tkdk) -» min , Щт 4 Вычислить g.^ ^ j = 1>т
gjlx + tkd )^0, у = 1,...,/и. Шаг 5. Проверить выполнение условия
Эта задача может быть решена с исполь- ~^к - 8j\x I - 0 » У = 1,♦. -,/w . Сформиро-
зованием алгоритма применения
необходимых и достаточных условий условного мини- вать множество Ja индексов j , для которых
мума. Иначе величину tk следует выбирать условие выполнено. Если условие выполнено
г + ** I хотя бы для одного j е Ja , то перейти к
из соотношения tk = mimt/, > 0, tk > 0>, с D
К \к ' к J' шагу 6. В противном случае положить
где величина t\ определяется из условия е* = 2е* и повторить вычисления на шаге 5.
Шаг 6. Записать систему неравенств
f[xk + t*kdk\ = min f(xk + fyrfM, а величи-
„ . r,.^0,. V/(**)V<0, Vgjfx')1 dk<0,jeJa.
на /* =ттш>, tJk удовлетворяет условиям v ' x '
Шаг 7. Сформировать задачу линейного
программирования:
gj(xk+tkdk) = 0, tk>0.
Направление спуска
зистеме неравенств
Т т V/(x*V dk < z , Vgj(xk)' dk <z, jeJa,
W(xk)Tdk<0,Vgj(xk)Tdk<0,jeJa, [ > 8J[ >
Направление спуска d удовлетворяет z —> min ,
системе неравенств
к/Я<1, / = !,...,л.
и определяется из решения задачи линейного
программирования:
Шаг 8. Решить задачу линейного про-
Z —> min , граммирования, сформированную на шаге 7.
В результате находится искомое возможное
Т Т ь *
V/(xM dk < z Vg-fjtM dk < z , j £ J , направление спуска г/ и z — минимальное
* ' * ' значение z .
|*/*| < 1 / = 1 л ^ог ^- Вычислить шаг tk , решив задачу
с * /(** + /**/*)-> min ,
Если полученное решение z меньше -ек, \ К )
то для поиска нового возможного направле- / . . v
-А-. 1 „ g; \хк +tkdK < 0, j = l,...,/w;
ния спуска а полагают e^+j = е^- . Если у\ /
же ^ > -ек , то расчет по усмотрению поль- либо иным способом, для чего следует:
*
зователя либо следует закончить, так как в а) найти величину tk из условия
точке х с точностью до ек выполняются л k +f*Hk\= m;n ftxk +f dk\-
необходимые условия минимума в исходной ^ ' ik>0 \ '
задаче, либо продолжить с целью добиться / . ,
более высокой точности, положив б) определить величину tJk, j = ],...,/л,
е*+, = qek , где 0 < q < 1. из условий g^k + ^* j = 0, ^ > 0 (если
Алгоритм. Шаг 1. Задать £q , предельное
число итераций М , допустимую начальную Условие gj(xk + /лАхл) = 0 выполняется
точку х° G ЛГ , в которой V/(jr°j * 0 . только при ^ < 0, то t{ не вычисляется).
Шаг 2. Положить k = v. ^сли в точке хк ограничение с номером j
МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
781
активно и tk = О, то значение t{ не
вычисляется;
в) найти tk = mjnjfji |;
г) вычислить значение tk = minujt,^*}-
Шаг 10. Найти точку хк+[ = хк + tkdk .
Шаг 11. Вычислить величину fix J.
Шаг 12. Проверить условие окончания:
а) если z > -е^ , то расчет может быть либо
закончен, если точность ек
удовлетворительна, либо продолжен при гк+[ = qek,
0 < q < 1. В первом случае х — искомое
приближенное решение поставленной задачи,
во втором — следует перейти к шагу 3; б) если
Z < -гк , то положить гк+1 = ек , к = к + 1
и перейти к шагу 3.
Замечания. 1. Если решаемая задача не
является задачей выпуклого
программирования, в которой все функции f(x): £/(*),
j = l,...,/w, выпуклые, то алгоритм Зойтен-
*
дейка сходится к точке х , удовлетворяющей
с точностью б£ необходимым условиям
минимума функции многих переменных при
ограничениях типа неравенств [33]. Следова-
*
тельно, в точке х должны быть проверены
достаточные условия минимума.
2. Если решаемая задача — задача
выпуклого программирования и ее множество
допустимых решений X = \х\х G Rn,
gj(x)< 0, j = l,...,/wl имеет внутренние
точки, то найденная по алгоритму Зойтендей-
ка точка х есть ее решение [33].
Глава 21.4
ЗАДАЧИ
ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
21.4.1. Методы решения задач
линейного программирования. Симплекс-метод
Данцига. Решение канонической
задачи. Рассматривается частный случай
задачи поиска условного экстремума: найти
максимум функции
7=1
при ограничениях
п
\ajjXj = bj, / = 1,...,/и; т<п, (21.4.2)
У=1
ху >0, j = !,...,«.
(21.4.3)
Задача (21.4.1)—(21.4.3) называется кано-
* ( * *\Т
ническои, а искомое решение х = I jq ,... ,хп I
называется оптимальным.
Замечания. 1. Максимизируемая
функция и ограничения линейны по х.•,
у = 1,...,я.
2. Задача содержит ограничения (21.4.3)
на неотрицательность переменных,
присутствие которых диктуется процедурой
описанного ниже симплекс-метода. Если по
физической постановке задачи какая-либо
переменная, например хп , не ограничена по знаку,
то ее можно представить в виде
хп = хп+\ ~ хп+2 » гле хп+[>хп+2 ^ 0 •
3. Считается, что в ограничениях (21.4.2)
все числа bj > 0, / = l,...,/w. Этого можно
добиться, умножая ограничения, где bj < 0,
на «—1».
Стратегия метода Данцига [Dantzig G.B.]
решения задачи (24.4.1)-(24.4.3) основана на
особенностях постановки этой задачи.
Множество
п
X = \x\YayXj = bj] i = l,...,/и; xeR";
xj >0; j = !,...,«[
допустимых решений задачи, определяемое
ограничениями (21.4.2), (21.4.3), есть
выпуклое множество, которое геометрически
представляет собой выпуклый политоп, имеющий
конечное число крайних точек. Крайней
точкой выпуклого множества X называется
точка х G X , которая не может быть выражена в
виде выпуклой комбинации других точек
уеХ,х±у.
Классический метод Гаусса-Жордана
решения систем линейных уравнений (21.4.2)
состоит в приведении их к виду
782
Глава 21.4. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
*1 + а\т+\Хт+\ + ■•• + «1Л + ■•• + ainxn = Ь ,
хк +акт+\хт+\. +--+aksxs + -~+акпхп = h >
*/я + amm+ixm+i +• • -+д/я.Л +• • -+атпхп ~ "т •
(21.4.4)
Переменные *!,...,xw, входящие
только в одно из уравнений системы (21.4.4) с
коэффициентами 1, а во все остальные
уравнения с коэффициентами, равными нулю,
называются базисными, в то время как
остальные п - т переменных называются
небазисными (свободными).
Базисным решением системы (21.4.4)
называется решение
Xj = bi9 / = 1,...,/и; х
7Я+1
= ...= *„ =0.
Базисное решение называется
допустимым, если X/ > 0 , / = 1,... ,т . Базисное
решение называется невырожденным, если
х( > 0, / = 1,...,/и.
Множество крайних точек политопа X ,
определяемого ограничениями (21.4.2),
(21.4.3), соответствует множеству допустимых
базисных решений системы (21.4.4), и при
этом одному базисному решению
соответствует одна крайняя точка.
Теорема 21.4.1. Если функция /(*) в
задаче (21.4.1) — (21.4.3) достигает максимума
на политопе X, определяемом ограничениями
(21.4.2), (21.4.3), то она достигает его по
крайней мере в одной крайней точке этого
политопа. Если она достигает его в нескольких
крайних точках, то она достигает его на
любой выпуклой комбинации этих крайних точек
[32].
Теорема определяет стратегию решения
задачи, реализованную с помощью симплекс-
метода, — это направленный перебор
базисных решений, определяющих крайние точки
политопа. Направленность перебора
предполагает следующую организацию
вычислительного процесса.
1. Нахождение начального базисного
решения.
2. Переход от одного базисного решения
к другому таким образом, чтобы обеспечить
возрастание f(x).
Способы нахождения начального базисного
решения.
Первый способ. Начальное базисное
решение в симплекс-методе Данцига
определяется по следующему правилу: за начальные
базисные переменные берутся те т
переменных, при которых коэффициенты в
уравнениях (24.4.2) образуют единичную матрицу.
Такой ситуации можно добиться, используя
преобразования Гаусса-Жордана, приводя
систему (21.4.2) к виду (21.4.4), и тогда
начальное базисное решение имеет вид
Xj = bj, i = l,...,/и; хт+[ =...= хп = 0.
Второй способ. Осуществляется переход
к Af-задаче. Задача (21.4.1) - (21.4.3)
записывается в расширенной форме, когда в каждое из
уравнений (21.4.2) записывается по одной
новой переменной, которые называются
искусственными:
п т
f(x) = V CyJCy - Af\ xn+i -> max ; (21.4.5)
j=i /=l
n _
^OjjXj +xn+l =bj, i = l,...,/и; (21.4.6)
7=1
Xj >0, I = l,...,/i;
xn+i >0, / = 1,...,/я, (21.4.7)
где djj = dji , bj = bj . Верхняя черта в
(21.4.6) поставлена с целью унификации
обозначений с (21.4.4). Задача (21.4.5) - (21.4.7)
называется М-задачей. Целевая функция
(21.4.5) содержит дополнительное слагаемое
т
-"X
xn+i , где М > 0 - достаточно боль-
/=1
шое число. Назначение этого слагаемого
состоит в том, чтобы в ходе решения задачи
(21.4.5) — (21.4.7) вывести искусственные
переменные из состава базисных. Если в
результате решения задачи окажется, что
искусственные переменные входят в состав базисных
и их значения не равны нулю, то это
означает, что ограничения (21.4.2) несовместны.
Переменные xn+i являются базисными
и начальное базисное решение имеет вид
xn+i = bit / = 1,...,/и; *!=...= х„ = 0.
(21.4.8)
Геометрически решению (21.4.8)
соответствует начало координат в пространстве
Rn исходных переменных задачи (21.4.1) —
(21.4.3).
МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
783
Переход от одного базисного решения к
другому. Он соответствует переходу от одной
вершины политопа к другой в направлении
возрастания функции f(x). Процедура
расчетов связана с использованием симплекс-
таблиц, каждая из которых соответствует
текущему базисному решению (табл. 21.4.1).
Пропуск вершины при описанном переходе
будет исключен, если состав базисных
переменных нового и старого решений будет
отличаться только на одну координату. Выбор
координаты, которая должна быть введена в
число базисных, определяется из требования
максимального прироста функции при
переходе от одного решения к другому. Прирост
целевой функции при введении в базис
координаты Xj из числа небазисных
характеризуется относительной оценкой А ,•:
AJ=cJ-HciBay
Ci-Zj
i=\
ZJ=lLCiBaV '
где С/ — коэффициент целевой функции при
переменной Xj ; /д - индекс базисной
переменной, расположенной в i-м уравнении
(i-й строке симплекс-таблицы); с, —
коэффициенты целевой функции при текущих
базисных переменных; ау — элементы
столбца коэффициентов при переменной Xj в
системе уравнений, соответствующей
текущему базису.
21.4.1. Симплекс-таблица
с'в
БП
БР
С\
*1
«11
ат\
Z\
А|
С2
*2
а, 2
а/я2
*2
Д2
-м
хп+т
0
1
Zn+m
Ап + т
cj 1
БР
Zj
AJ \
Принятые обозначения: БП — базисные переменные, БР — базисное решение.
При переходе в базис вводится та пере- строке; ^ _ коэффициент при координате
мен нал хг , для которой А- = max А .•, где
jeJ/f xr в i-й строке. Рассматриваются только не-
JH - множество индексов небазисных пере- отрицательные отношения (если коэффици-
менных. Столбец, соответствующий выбран- ент air отрицателен или равен нулю, то от-
ной оценке, в таблице помечается знаком ®. ношение не подсчитывается и на его месте в
Новая переменная хг вводится на ме- приведенных далее таблицах ставится знак
«—»). Строка, соответствующая выбранному
сто переменной хЯв , удаляемой из числа отношеНию, в таблице помечается знаком ®.
базисных, номер которой s$, а также номер Вместо координаты xSB в состав базис-
s соответствующей строки таблицы, опреде- ных вводится координата хг , значение кото-
ляются из условия
рой находится по формуле
mm
1</</и|
^В
_ Х*В
(21.4.9)
XSB
xr =^Л-
(21.4.10)
где х.
1в
значение координаты текущего
Элемент asr называется разрешающим и
базисного решения, соответствующей i-й выделяется в таблице прямоугольником. Ко-
784
Глава 21.4. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
ордината xs становится небазисной и
равной нулю. Новое базисное решение
определяется на основании текущего базисного
решения по формулам
х*в = *iB " Oirxr > Vh'-h * SB ■ (21.4.11)
Процесс перехода заканчивается, когда
найдено такое базисное решение, что все
относительные оценки Ay , j = 1,...,/и + л ,
становятся неположительными. Это базисное
решение и является оптимальным.
Алгоритм решения канонической задачи.
Шаг 1. Найти начальное базисное решение:
а) записать исходную каноническую
задачу одним из двух способов: в форме
(21.4.1), (21.4.4), (21.4.3) при помощи
линейных преобразований; в расширенной форме
(21.4.5) — (21.4.7) с помощью перехода к
М-задаче;
б) выделить базисные переменные (их
можно подчеркнуть), входящие только в одно
из уравнений системы (21.4.4) или (21.4.6) с
коэффициентами 1, а во все остальные — с
коэффициентами, равными нулю;
в) выделить свободные переменные (все
остальные, кроме базисных);
г) найти начальное базисное решение,
полагая свободные переменные равными
нулю.
Шаг 2. Заполнить симплекс-таблицу (см.
табл. 21.4.1);
а) столбец базисных переменных (БП)\
б) столбец базисного решения (БР);
в) строку Cj и столбец с,
коэффициентов функции (21.4.1) или (21.4.5).
В столбец С/ записываются
коэффициенты, соответствующие базисным
переменным; г) совокупность коэффициентов д,у
систем (21.4.4) или (21.4.6).
Шаг 3. Вычислить относительные
оценки
т
1=1
т
Zj =^с1ва0 , у = 1,...,/и + л,
i=i
и записать их в таблицу. Заметим, что для
базисных переменных оценки равны нулю.
Этот факт можно использовать как для
проверки правильности заполнения таблицы, так
и для сокращения вычислений.
Шаг 4. Проанализировать относительные
оценки:
а) если все оценки А у неположительны,
т.е. Ау < 0, j = 1,..., т + п , то расчет
закончен и следует найти полученное базисное
решение. Значения базисных переменных
содержатся в столбце БР, а остальные
переменные полагаются равными нулю, как
свободные.
Проанализировать полученное базисное
решение:
если число нулевых оценок Ау = О
равно числу базисных переменных, задача
имеет единственное решение. Если число
нулевых оценок Ау = 0 превышает число
базисных переменных, то задача имеет бесконечное
множество решений',
если все А, неположительны, но
базисное решение содержит хотя бы одну
искусственную переменную, не равную нулю, то
ограничения задачи несовместны;
б) если среди оценок есть
положительные, то следует найти среди них
максимальную: Аг = max А,-, где Jц — множество
индексов небазисных переменных, и
проанализировать коэффициенты столбца таблицы,
которому соответствует максимальная
положительная оценка (если таких оценок
несколько, принято выбирать оценку с
наименьшим номером). Если этот столбец
содержит хотя бы один положительный
коэффициент, то номер столбца обозначается через г и
переменная, соответствующая ему, должна
быть введена в число базисных. Если среди
коэффициентов этого столбца нет ни одного
положительного коэффициента, то это
означает, что множество допустимых решений
задачи не ограничено, функция f(x) не
ограничена сверху и задача решения не имеет.
.Столбец, соответствующий выбранной
оценке, помечается ®. Он называется
разрешающим.
Шаг 5. Поделить элементы столбца
базисных решений (БР) на соответствующие
элементы разрешающего столбца и среди
полученных частных выбрать наименьшее.
Строка, соответствующая выбранному
отношению, помечается ®. Она называется
разрешающей.
Таким образом, новая переменная хг
вводится на место переменной xs ,
удаляемой из числа базисных, номер которой Sg , a
МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
785
также номер s соответствующей строки
таблицы определяются из условия
mm
1</<т|
*1в
а,,
CLsr
где
xlB — значение
координаты текущего базисного решения,
соответствующей 1-й строке; air — коэффициент
при координате хг в /-й строке. Если таких
переменных окажется больше одной, то из
базиса выводится та переменная, которая
имеет больший номер. Заметим, что
рассматриваются только неотрицательные
отношения, т.е. если коэффициент а1Г отрицателен
или равен нулю, то отношение не подсчиты-
вается и на его месте в приведенных далее
таблицах ставится знак «—».
Элемент asr, расположенный на
пересечении разрешающей строки и
разрешающего столбца, называется разрешающим и
выделяется в таблице прямоугольником.
Удобно использовать следующее
правило: из числа базисных выводится переменная,
соответствующая разрешающей строке, а на
ее место вводится переменная,
соответствующая разрешающему столбцу.
Шаг 6. Вычислить новое базисное
решение, осуществив пересчет таблицы:
а) вместо координаты xs в состав
базисных ввести координату хг , значение
которой находится по формуле
XSR
хг = ^=Л-, и
пересчитать 5-ю строку, в которой произошли
si
изменения по базису: д„=-=г^-, у = 1,...,
asr
т + п.
Таким образом, каждый элемент строки,
отмеченной ®, делится на разрешающий
элемент asr;
б) вычислить все остальные коэффици-
aij = aij " asjair = aij - -=^air >
asr
/ = 1,...,/и; i*s\ j = 1,...,/и + я .
Новое базисное решение определить на
основании текущего базисного решения по
формулам:
х*в = Х'В " airxr > V'lB '• lB * SB -
asj ' air
a.
usr
asr
air
-
;■ *^> asj
au
Рис. 21.4.1
Для упрощения вычислений по
приведенным формулам используется «правило
прямоугольника».
Пусть подсчитывается значение а,;.
Следует соединить элемент йу в предыдущей
таблице с разрешающим элементом \osr .
Получена одна из диагоналей прямоугольника.
Вторую диагональ образует соединение
элементов air и asj. Далее из текущего
значения dy вычитается произведение элементов
а1Г и as;, деленное на разрешающий элемент
asr (рис. 21.4.1).
ач = аи ~
Перейти к шагу 3.
Замечания. 1. Если в задаче (21.4.1) -
(21.4.3) в каждом уравнении имеется базисная
переменная, то на шаге 1 нет необходимости
делать линейные преобразования или вводить
искусственные переменные.
2. Если решается задача поиска
минимума, то стратегия симплекс-метода
аналогична, только в базис вводится переменная,
которой соответствует наименьшая
отрицательная оценка Дг . Процесс перехода
заканчивается, когда найдено такое базисное
решение, что все относительные оценки Ау,
j = 1,..., /и + п становятся
неотрицательными: Ду > 0, ./ = 1,...,/и + я .
3. При условии невырожденности
симплекс-метод сходится за конечное число
шагов [32]. Утверждение базируется на том, что
число вершин выпуклого политопа конечно, а
требование строгого возрастания функции
при переходе от вершины к вершине
исключает прохождение одной и той же вершины
дважды. В вырожденном случае, когда
и соответственно хг = -=— = 0,
*»,=°
происходит замена индексов базисных
координат, но не их значений. В ряде случаев в
результате некоторого числа таких замен
базиса процедура может прийти к
зацикливанию. Предотвратить зацикливание можно,
786
Глава 21.4. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
используя ряд приемов: например, с
помощью лексикографической процедуры,
описанной в [33].
Решение основной задачи.
Рассматривается задача: найти максимум
функции
п
Ax)=yLcjxj (21.4.12)
при ограничениях
п
^ayXjZbj, 1 = 1,...,да; (21.4.13)
У=1
П
]Гд,уху <£,-, / = /и +!,...,/?; (21.4.14)
У=1
Xj>0, 7 = 1,...,*; (21.4.15)
Задача (21.4.12) - (21.4.15) называется
основной. Предполагается, что ty > 0,
/ = 1,...,/>.
Для решения основной задачи
симплекс-методом она должна быть приведена к
канонической задаче путем введения в каждое
ограничение по одной дополнительной
переменной: в каждое ограничение-неравенство со
знаком < вводится дополнительная
переменная со знаком «+» (она становится базисной),
а в каждое ограничение-неравенство со
знаком > вводится дополнительная переменная
со знаком «-».
Каноническая задача записывается
следующим образом:
п
f(x) = ^CjXj -> max , (21.4.16)
j=\
n
^ajjXj - xn+i = fy , / = l,...,/w; (21.4.17)
n
^cijjXj +x^= bi9 / = /w + l, ...,/>;
y=l
(21.4.18)
x, >0,... , x„+p>0. (21.4.19)
Так как в общем случае в уравнениях
(21.4.17) нет базисных переменных, то для
того чтобы можно было применить симплекс-
метод, делается переход к М-задаче. В каждое
из т уравнений (21.4.17) вводится
искусственная переменная со знаком «+» (она
становится базисной), а к целевой функции
добавляется сумма искусственных переменных,
умноженная на «-Л/». В результате получаем
задачу в расширенной форме:
п т
/(*)=^LcJxj - МХ *"+/>+'■ ->тах >
(21.4.20)
п
^ayXj -xn+i+xn+p+i = bt, / = 1,...,/и;
У=1
(21.4.21)
п
7=1
(21.4.22)
*!>(),..., xn+p+m>0. (21.4.23)
Замечание. 1. Если решается задача
поиска минимума целевой функции (21.4.12), то
при переходе к Л/-задаче перед числом М в
(21.4.20) ставится знак «+».
2. В случае двух переменных задача
линейного программирования имеет простую
геометрическую интерпретацию и может быть
решена графически с помощью следующего
алгоритма.
Алгоритм графического решения основной
задачи. 1. Построить множество допустимых
решений. В общем случае оно представляет
собой выпуклый многоугольник. Если
ограничения в задаче несовместны, множество
допустимых решений является пустым
множеством, а задача поиска экстремума не имеет
смысла.
2. Найти градиент целевой функции. В
силу ее линейности градиент постоянен и
может быть построен в любой точке
координатной плоскости (как правило, он строится в
начале координат).
3. Провести линию уровня функции,
перпендикулярную к градиенту.
4. Передвигать линию уровня
параллельно самой себе до касания с множеством
допустимых решений. Точки касания
являются точками экстремума.
5. Классифицировать точки касания с
использованием свойств градиента.
В случае непустого множества
допустимых решений возможны три типовых
ситуации:
МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
787
а) задача имеет единственное решение
(линия уровня касается множества
допустимых решений в одной точке);
б) задача имеет бесконечное множество
решений (линия уровня касается множества
допустимых решений вдоль стороны
многоугольника);
в) задача не имеет решения (множество
допустимых решений не ограничено).
Графически можно решать и задачи с
ограничениями типа равенств, если число
ограничений на единицу или на два меньше
числа переменных. Способ решения: сведение
к задаче соответственно с одной или двумя
переменными. Для этого следует выразить
целевую функцию и базисные переменные
через свободные и воспользоваться условием
неотрицательности, типичным для задач
линейного программирования. Далее следует
пользоваться приведенным алгоритмом
графического решения задач линейного
программирования.
Пример 21.4.1. Найти максимум в задаче
/(х) = Х| - х2 —> max,
-\х{ + 2х2 > 4 ,
Зх, + 2х2 £ 14,
х,, х2 > 0 .
Согласно п. 24.4.2 приведем
поставленную основную задачу к канонической. Так
как первое неравенство имеет знак >, вводим
дополнительную переменную х3 со знаком
«-». Поскольку во втором неравенстве знак <,
то вводим дополнительную переменную х4
со знаком «+» (она становится базисной). В
итоге получаем каноническую задачу:
/(х) = х] - х2 -> max ,
-Xj + 2х2 - х3 = 4 ,
Зх, +2х2 +х4 = 14,
х,,...,х4 >0.
Так как в первом уравнении нет
базисных переменных, то перейдем к Л/-задаче.
Для этого введем искусственную переменную
Хз и добавим ее к целевой функции с
коэффициентом «-М». В результате получаем
задачу в расширенной форме:
/(х) = xj - х2 - Мх5 -> max ,
-\х{ + 2х2 - 1х3 + 0х4 + 1х5 = 4 ,
3xj + 2х2 + 0х3 + 1х4 + 0х5 = 14 ,
хь...,х5 >0.
Применим алгоритм симплекс-метода.
Найдем начальное базисное решение.
Базисными переменными являются Х5,х4, а
свободными Xj,x2,X3. Приравняем
свободные переменные нулю. Тогда
Х[ = х2 = х3 = 0 и х4 = 14, х5 = 4. На-
т
чальное базисное решение (0; 0; 0; 14; 4) .
Начальному базисному решению
соответствует начало координат на рис. 21.4.2.
Вычисляем относительные оценки Ау ,
У-1.....5:
Д, = 1 - [(- Л/) (- 1) + 0 3] = 1 - Л/ ;
д2 = -1 _ [(_ М) ■ 2 + 0 • 2] = -1 + 2М;
Д3=0-[(-Л/)(-1) + 00] = -Л/;
Д4=0-[(-Л/)0 + 01] = 0;
Д5=-Л/-[(-Л/)1 + 00]=0.
Результаты заполняем в таблицу (табл.
21.4.2).
/(*) = 0'-1
788
Глава 21.4. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
21.4.2. Симплекс-таблица
с'в
-м
0
БП
*5
Х4
БР
4
14
1
*1
-1
3
м
1 -М
-1
*2
т
2
-2М
-1 + 2М
0
*3
-1
0
м
-м
0
х4
0
1
0
0
-м
*5
1
0
-м
0
J
БР
2 ® 1
7
*У
АУ |
Проанализируем относительные оценки.
Оценка А2 = -1 + 2М > 0, так как М > 0,
и, следовательно, текущее базисное решение
х4 = 14 , х5 = 4, Xj = Х2 = Хз = 0 не
оптимально. Анализируем коэффициенты столбца
при переменной х2 • Так как оба
коэффициента положительны, то г = 2 и переменная
х2 должна быть введена в число базисных.
Определяем переменную, выводимую из
базиса. Для этого вычисляем отношения
БР 4 14
-zr-. Имеем — , — (см. табл. 21.4.2). Выби-
air 2 2
раем наименьшее значение. Следовательно,
s = 1 , и из числа базисных должна быть
удалена переменная х$ и заменена переменной
х2.
Вычисляем новое базисное решение,
занося результаты пересчета табл. 21.4.2 в табл.
21.4.3. В табл. 21.4.3 в столбец БП введена
переменная х2 вместо х$ . Первой пересчи-
тывается строка, соответствующая введенной
переменной х2 . Она получается в результате
деления каждого элемента разрешающей
строки табл. 21.4.2, помеченной ®, на
разрешающий элемент, равный 2. Остальные
элементы пересчитываются по «правилу
прямоугольника». Для второй строки имеем:
14-
4-2
10, 3-
2-(-1)_
= 4,
2- 2
2- —= 0,
'-¥■'•
2-Н)
1-2
= -1.
Вычисляем оценки Ау , j = 1,..., 5 .
Строка Ау пересчитывается по табл. 21.4.2
также по «правилу прямоугольника»:
21.4.3. Симплекс-таблица
°iB
-1
0
БП
*2
х4
БР
2
10
I
*\
1
2
ш
1
2
1
2
-1
*2
1
0
-1
0
0
*3
1
2
1
1
2
1
2
0
х4
0
1
0
0
-м
*5
1
2
-1
1
2
2
^
ЯР
Я/г
—
— ®
4
^
ДУ
МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
789
21.4.4. Симплекс-таблица
С(в
-1
1
БП
х2
*1
БР
26
8
10
4
1
*1
0
1
1
0
-1
*2
1
0
-1
0
0
*з
3
8
1
4
5
8"
5
8
0
х4
1
8
1
4
1
8
1
8
-М
*5
3
8
1
4
5
8
ш, 5
-М + -
8_j
j
БР
Zj
А • 1
7
Aj =1- М
(-1 + 2М)(-1)_ 1
А7 =0,
А, = -М ■
(-1 + 2Л/)(-1) 1
2'
л (-1 + 2J/V0 л
А4=0--^ ^-= '
л (-1 + 2М)1 1# 1
А5 = 0 - i '— = -М + - .
э 2 2
Проанализируем относительные оценки
и, как следствие, текущее базисное решение
х2 - 2 , х4 = 10, *! = х3 = х5 = 0. Оценка
Aj = — > 0, поэтому анализируем
коэффициенты столбца при переменной Х[ . Так как
этот столбец содержит один положительный
коэффициент, то г = 1 и переменная Х[
должна быть введена в число базисных
переменных.
Определяем переменную, выводимую из
базиса. Для этого вычисляем наименьшее из
- БР о
неотрицательных отношении -=— . Оно равно
air
—. Следовательно, s = 2, и поэтому из ба-
4
зиса должна быть удалена переменная х4 и
заменена переменной Х\ .
Вычисляем новое базисное решение.
Результат пересчета табл. 21.4.3 записываем в
табл. 21.4.4.
Вычисляем оценки А,-, у = 1,...,5, и
10
определяем, является ли решение Х[ = —,
26 л
х2 = —, *з = х4 = *5 = " оптимальным,
о
Все оценки А.- не положительны, следова-
10 26
тельно, решение Х[ = — , х2 = —,
х3 = Х4 = Х5 = 0 является оптимальным.
* 10
Решение исходной задачи Х\ = —,
* 26 ^
Х2 = — получается путем отбрасывания
о
дополнительных переменных х3, х4 и
искусственной переменной х$ . Графически оно
соответствует точке х (рис. 21.4.2).
Двухфазный симплекс-метод. Решается
задача нахождения максимума функции
У=1
(21.4.24)
при ограничениях
£я//*/ = £;, / = 1,...,/и; /п< л; (21.4.25)
У=1
ху > 0, j = 1,...,я.
(21.4.26)
Двухфазный симплекс-метод использует
двухэтапную процедуру решения задачи
(21.4.24) - (21.4.26), минуя решение
^/-задачи.
790
Глава 21.4. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Первая фаза. Определение начального
базисного решения для задачи (21.4.24) -
(21.4.26). Каноническая задача (21.4.24) -
(21.4.26) записывается в расширенной форме
х{ >0, ..., хп+т >0.
Шаг 2. Решить вспомогательную задачу
т
V CjXj -> max ,
(21.4.27)
У. xn+i
-> nun,
1=1
y=i
^OjjXj + x^= b , / = 1,...,/и; (21.4.28)
y=l
*!>(), ...,x„+/w>0. (21.4.29)
Начальное базисное решение ищется в
результате решения вспомогательной задачи
£*„+/ -> mill,
/=1
(21.4.30)
^djjXj +xn+i = biy i = l,...,/я; (21.4.31)
У=1
х, >0, ...,хл+/„>0
(21.4.32)
с использованием симплекс-метода. Так как
решением задачи (21.4.30) - (21.4.32) будет
xn+i = 0 > / = 1,... ,/и , то значения дсу,
у = 1,...,я, могут рассматриваться, как
начальное базисное решение задачи (21.4.24) —
(21.4.26).
Вторая фаза. Решение задачи (21.4.24) -
(21.4.26) при найденном начальном базисном
решении с использованием симплекс-метода.
Алгоритм. Шаг 1. Записать решаемую
каноническую задачу
п
f{x)=^CjXj -> max,
y=i
п
]Гд,уХу = £,, / = 1,...,/и;
У=1
y=i
xj >0,..., xn+m>0.
с использованием процедуры симплекс-
метода.
Шаг 3. Принять оптимальное решение
вспомогательной задачи, полученное на
втором шаге, за начальное базисное решение для
решения исходной канонической задачи
/(х) = ^.CjXj -> max ,
У=1
п
^dijXj = bi9 / = l,...,/w;
y=i
xy >0, у = l,...,/i,
X;>0, y =
расширенной форме:
n
У=1
n
7=1
;Xy + Хя+|- = 0/
1,...,
max
, /' =
n,
>
1,-
и решить ее, используя процедуру симплекс-
метода. Вид ограничений решаемой
канонической задачи определяется элементами
таблицы, соответствующей полученному
решению вспомогательной задачи.
Замечание. Существует класс задач,
сводящихся к задаче линейного
программирования: задача дробно-линейного программирования
(целевая функция дробно-линейная), задача
квадратичного программирования (целевая
функция квадратичная) [1, 30], а также
задачи, решаемые специальными методами,
аналогичными симплекс-методу, например,
транспортные задачи [1, 34].
21.4.2. Методы решения задач
линейного целочисленного программирования.
Метод ветвей и границ. Рассматривается задача
поиска максимума функции
п
/(*)=2/у*у <21АЗЗ>
У=1
при ограничениях
п
^djjXj^bj, / = 1,...,/и; (21.4.34)
У=1
Xj >0, целые, j = 1,...,я. (21.4.35)
МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ЛИНЕЙНОГО ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ 791
Поясним стратегию решения задачи
(21.4.33) - (21.4.35) линейного целочисленного
программирования. Задача (21.4.33) - (21.4.35),
обозначим ее ЗЛП-0, решается симплекс-
методом без учета ограничений на целочис-
ленность переменных. Считается, что она
имеет решение. На оптимальном решении
О* / 0* 0*\^
х = \Х[ ,...,хп I вычисляется значение
целевой функции fix0* J. Если решение х°*
является целочисленным, то поставленная
задача решена. Если решение х
оказывается нецелочисленным, то значение /(*°*)
является верхней границей возможных
оптимальных значений f(x) на целочисленных
решениях. При нецелочисленном решении
дальнейшая процедура решения задачи
(21.4.33) - (21.4.35) состоит в ее ветвлении на
две: ЗЛП-1 и ЗЛП-2 (рис. 21.4.3). Целью этого
ветвления является разбиение множества
допустимых решений, определяемого
ограничениями (21.4.34), (21.4.35), на два
подмножества путем построения дополнительных
ограничений таким образом, чтобы исключить цело-
чений таким образом, чтобы исключить цело-
ЗЛП-1
п
f(x) = ^Г CjXj -» max ,
п
Y,aijxj <bi> / = 1,..-,/и,
У=1
**<[*Г],
Xj>0, у = !,...,/!;
ЗЛП-2
п
f(x)=^CjXj-> max,
П
^a-yXj < bi9 i = 1,...,/и,
У=1
xk>[x°k*] + \,
Xj > 0, j = l,...,/i .
Построение дополнительных
ограничений позволило исключить из рассмотрения
0*
оптимальное нецелочисленное решение х
и обеспечить целочисленность значений
координаты хк .
Задачи ЗЛП-1 и ЗЛП-2 решаются
самостоятельно симплекс-методом без учета
требований на целочисленность значений
координат Xj , y = l,...,/i. Вычисляются
значения функции f(x) на оптимальных
решениях обеих задач. Если ни одна из них не имеет
целочисленного решения, то выбирается
задача для приоритетного дальнейшего ветвления
по установленному правилу: например,
приоритетному ветвлению подлежит та задача, в
0*
численную точку х и сделать решение, по
крайней мере, одной из задач целочисленным
по одной выбранной координате хк .
Координатой хк может быть [37]:
1. Нецелочисленная координата с
наименьшим или наибольшим индексом.
2. Нецелочисленная координата с
наименьшей или наибольшей дробной частью.
3. Нецелочисленная координата,
которой соответствует наибольший коэффициент
в целевой функции.
4. Нецелочисленная координата,
выбранная на основании приоритетов,
определяемых физическим содержанием задачи.
Для построения дополнительных огра-
Г 0*1
ничении выделяется целая часть \хк
значения координаты х® . Дополнительные
ограничения имеют вид хк < \хк ,
хк > [*Г1 + 1 • Задачи ЗЛП-1 и ЗЛП-2
записываются в следующем виде:
которой значение f(x) на оптимальном
нецелочисленном решении максимально.
Допустим, что f[x[*)> fix2*) и задача ЗЛП-1
первой ветвится на ЗЛП-3 и ЗЛП-4, которые
решаются симплекс-методом без учета
требований на целочисленность с последующим
анализом решений. Если ни одна из задач
ЗЛП-3 и ЗЛП-4 не имеет целочисленного
решения, приступают к ветвлению задачи
ЗЛП-2.
Процесс ветвления продолжается до тех
пор, пока не будет получено в одной из
ветвей целочисленное решение. Пусть задача
ЗЛП-4 (см. рис. 21.4.3) имеет целочисленное
решение. Обозначим / - значение функции
792
Глава 21.4. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
ЗЛП-0
.о*
*Л/(х0-)
нецелочисленное
япп-1
х1',Дх1-)>Дх2-)
непепочиспенное
ЗЛП-2
х2',Дх2')>1
нецелочисленное
ягтп-ч
х3',Дх3т)<1
1неиелочисленное
ЗЛП-4
х4*,/(х4') = /
целочисленное
ЗЛП-5
х5*,/(х5*)</|
неиелочмсленное
злп-б
* = 0
первом
целочисленном
Рис. 21.4.3
решении:
f = fix I. Соответствующее целочисленное
решение включается во множество X
возможных оптимальных решений исходной
задачи. После того как найдено первое
целочисленное решение, вопрос о дальнейшем
ветвлении других задач решается на
основании сравнения значени
й /(***)
на
оптимальных нецелочисленных решениях в
оставшихся ветвях со значением / .
х* = х4* , /(* j = / (см. рис. 21.4.3). В
противном случае задача ЗЛП-5 ветвится дальше.
Если в одной из задач получено
целочисленное решение, то ее ветвление далее не
производится. Если соответствующее
значение целевой функции не меньше /, решение
считается принадлежащим множеству X
возможных оптимальных решений исходной
задачи. Если значение целевой функции
меньше /, целочисленное решение не вклю-
Если
/(**>/
для всех оставшихся
чается во множество X .
Таким образом, ветвление какой-либо
задачи заканчивается, если выполняется одно
из условий: решение целочисленное; значение
целевой функции данной задачи не больше
х , для которых fix 1 = /. Если f; множество допустимых решений пустое.
Если ветвление всех задач закончено, то
к , то расчет закончен. Решениями исходной
задачи являются те целочисленные решения
fix ) > / , то соответствующая этому
номеру к задача ветвится далее. Так, на рис.
21.4.3 имеем /(*2*) > / и /(*3*) </•
Задача ЗЛП-2 подлежит ветвлению на ЗЛП-5,
ЗЛП-6, а задача ЗЛП-3 не подлежит. Задача
ЗЛП-6 не имеет решения, так как множество
допустимых решений пустое, и далее не
рассматривается. Задача ЗЛП-5 имеет
нецелочисленное решение х , fix ). Если
/(х5*) < / , то решение задачи закончено и
в множестве X выбирается решение
(решения), которому соответствует наибольшее
значение целевой функции. Оно является
решением исходной задачи. Если множество
X пустое, то исходная задача не имеет
решения.
Алгоритм. Шаг 1. Положить к = О,
решить задачу ЗЛП-0 без учета требований на
целочисленность переменных и определить
х , fix ). Проверить целочисленность
решения: а) если решение целочисленное, то
МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ЛИНЕЙНОГО ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ 793
расчет закончен: х = х , fix*) = fix0*);
б) если решение х нецелочисленное,
включить к = О в множество / = {к}
номеров задач, подлежащих дальнейшему
ветвлению, и перейти к шагу 2.
Шаг 2. Выбрать задачу для
приоритетного ветвления: а) если к = О, выбрать для
ветвления задачу ЗЛП-0, исключить номер
к = 0 из множества J = {к} и перейти к
шагу 3; б) если к Ф О и /^0, выбрать
номер задачи к е J , которому соответствует
максимальное значение целевой функции на
к*
оптимальном решении х , исключить
номер к из множества J = {к} и перейти к
шагу 3; в) если к Ф О и / = 0, перейти к
шагу 7.
Шаг 3. Осуществить ветвление задачи
ЗЛП-А;. Для этого выбрать нецелочисленную
к*
координату Xj по установленному правилу
и сформировать: а) два дополнительных огра-
если fix J < / , исключить номер к
из множества / ;
если fix J > / , оставить задачу с
номером к в множестве / для дальнейшего
ветвления. Перейти к шагу 6;
б) если решение х +/ целочисленное,
значение / уже найдено и fix +l I > /,
2k+i*
то включить решение х в множество
X возможных оптимальных решений
исходной задачи. Если fix ) < /, не
2k+i* i>r*
включать решение х в множество л .
Перейти к шагу 6;
в) если решение х
нецелочисленное и значение / еще не найдено, включить
номер 2к + i в множество J и перейти к
шагу 6;
ничения: ху-<[ху*1, ху- >[*)*]+1; б) две г) если решение x2k+l* нецелочислен-
задачи ЗЛП-2&+/, /'=1,2:
ЗЛП-2АН-1, получаемую в результате
добавления к задаче ЗЛП-А: дополнительного
ограничения
x,<[xf];
ЗЛП-2АН-2, получаемую в результате
добавления к задаче ЗЛП-А: дополнительного
ограничения лгу > |л:у + 1. Положить / = 1
и перейти к шагу 4.
Шаг 4. Решить задачу ЗЛП-2АН-/: а) если
множество допустимых решений задачи
пустое, то исключить задачу из рассмотрения и
перейти к шагу 6; б) если множество
допустимых решений задачи не пустое, определить
x2k+i* ^ y|x2A+z* j и перейти к шагу 5.
Шаг 5. Проверить решение х на
2k+i*
целочисленность: а) если решение х
целочисленное и получено первым при
ветвлении задач, имеющих нецелочисленное
решение, положить / = fix +l ) и включить
2k+i* ix*
решение х в множество л возможных
оптимальных решений исходной задачи.
Сравнить значения fix 1, к е J , с / для
нецелочисленных решений, полученных
ранее, чем первое целочисленное решение:
ное, значение / уже найдено и
fix 1 > / , то включить номер 2к + / в
множество J . В противном случае исключить
номер 2к + i из рассмотрения. Перейти к
шагу 6.
Шаг 6. Проверить условие / < 2 : а) если
/ < 2 , положить / = 2 и перейти к шагу 4; б)
если / = 2 , перейти к шагу 2.
*
Шаг 7. В множестве л выбрать
решение (решения), которому соответствует
наибольшее значение целевой функции. Оно
является решением х исходной задачи. Если
множество X пустое, то исходная задача не
имеет решения.
Замечания. 1. Существует модификация
метода ветвей и границ, в которой на шаге 5
среди решений, принадлежащих множеству
X , ищется решение X , которому
соответствует наибольшее значение функции
(наилучшее текущее целочисленное решение), и
находится новое значение / = f(xj . Тогда на
шаге 7 полагается х = х , fix ) = f .
2. Алгоритм является конечным, если
множество
794
Глава 21.4. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Х = \х
^aijXj<bi, i = \,...,m;xeR",
Xj > 0, Xj - целые, j = l,...,n\
является ограниченным [32, 37].
Метод Гомори. Задача (21.4.33) -
(21.4.35) решается симплекс-методом без
учета требований на целочисленность
переменных. Если полученное решение
* / * *\Т
х =[Х\ ,...,х„\ является целочисленным,
то решение задачи окончено. В противном
случае стратегия дальнейших действий
состоит в формировании путем построения
дополнительных ограничений нового множества
X допустимых решений, которое:
1. Содержало бы все целочисленные
точки множества допустимых решений
V Я/,*, < bh i = 1,...,/и; х е R",
У=1
Xj > 0, Xj - целые, j = 1,...,я>.
2. Не содержало бы оптимальное неце-
*
лочисленное решение х .
Метод Гомори [Gomory R.] позволяет
построить множество X , последовательно
добавляя к ограничениям (24.1.34), (24.1.35)
по одному новому дополнительному
ограничению. Формализация процедуры построения
дополнительного ограничения требует
сформулировать правило выбора переменной,
целочисленность которой необходимо
обеспечить. Практика решения задач утверждает:
следует выбирать ту переменную, которая
имеет в оптимальном значении дс,-
наибольшую дробную часть (Х/ I. Операция
отыскания дробной части данного вещественного
числа а равнозначна отысканию такого
наименьшего положительного числа b, чтобы
разность а - b была целым числом.
Используя определение вещественных чисел,
сравнимых по модулю 1, можно сформулировать
определение дробной части вещественного
числа иначе.
Два числа а и b называются
сравнимыми по модулю 1, если а - b - целое число.
с
Обозначение: а = Ь. Тогда дробной частью
вещественного числа а называется
наименьшее неотрицательное число, сравнимое с а
[17]. Например: (4) = 0,[^j Л ,[!] = !,
НН'(-3'4) = 0'6иТ-Д-
Алгоритм. Шаг I. Преобразовать
исходные ограничения ЗЛП к целочисленному
виду.
Шаг 2. Решить ЗЛП симплекс-методом
без учета требований на целочисленность
переменных. Если решение задачи целочис-
ленно, то вычисления окончены. В
противном случае перейти к шагу 3.
Шаг 3. Выбрать в оптимальной таблице
нецелую переменную Xj, с максимальной
дробной частью (дс,- 1. Под оптимальной
таблицей понимается таблица симплекс-метода,
содержащая нецелочисленное оптимальное
решение.
Шаг 4. Записать, пользуясь оптимальной
таблицей, уравнение
xi =xi ~ X aikxk >
*е/НБ
*
где X/ — оптимальное нецелое значение Xj,
^НБ ~~ множество индексов небазисных
переменных в оптимальном нецелочисленном
решении.
Шаг 5. Так как дс,- должно быть целым,
записать
V i *
2^ aikxk =xi •
*е/НБ
Шаг 6. Взять дробные части всех коэф-
фициентов tf/£ и Х( и записать
к*1нь
0<(aik)<\, 0<(*;)<1.
Шаг 7. Записать новое ограничение
X ы)хк ^(*/■)•
к<=1
НБ
СПИСОК ЛИТЕРАТУРЫ
795
Шаг 8. Записать новое ограничение в
виде равенства
где xv — дополнительная переменная.
Шаг 9. Расширить оптимальную таблицу
на одну строку и один столбец; записать в нее
дополнительное ограничение.
Шаг 10. Выбрать за дополнительную
базисную переменную в новом ограничении ту
переменную из числа старых небазисных,
которой соответствует наименьшая по модулю
из неположительных оценка А .•, и перейти к
шагу 2.
СПИСОК ЛИТЕРАТУРЫ
1. Акулич И.Л. Математическое
программирование в примерах и задачах. М.:
Высшая школа, 1986.
2. Алексеев В.М., Галеев Э.М.,
Тихомиров В.М. Сборник задач по оптимизации. М.:
Наука, 1984.
3. Аоки М. Введение в методы
оптимизации. М.: Мир, 1977.
4. Базара М., Шетти К. Нелинейное
программирование. Теория и алгоритмы. М.:
Мир, 1982.
5. Банди Б. Методы оптимизации.
Вводный курс. М.: Радио и связь, 1988.
6. Банди Б. Основы линейного
программирования. М.: Радио и связь, 1989.
7. Батищев Д.И. Генетические
алгоритмы решения экстремальных задач / Под ред.
Я.Е. Львовича: Учеб. пособие. Воронеж, 1995.
8. Бертсекас Д. Условная оптимизация и
методы множителей Лагранжа. М.: Радио и
связь, 1987.
9. Васильев Ф.П. Численные методы
решения экстремальных задач. М.: Наука,
1980.
10. Волгин Л.Н. Принцип
согласованного оптимума. М.: Сов. Радио, 1977.
11. Габасов Р., Кириллова Ф.М. Методы
оптимизации. Минск: Изд-во БГУ, 1981.
12. Гилл Ф., Мюррей У., Райт М.
Практическая оптимизация. М.: Мир, 1985.
13. Демьянов В.Ф., Васильев Л.В. Не-
дифференцируемая оптимизация. М.: Наука,
1983.
14. Дэннис Дж., Шнабель Р. Численные
методы безусловной оптимизации и решения
нелинейных уравнений. М.: Мир, 1988.
15. Евтушенко Ю.Г. Методы решения
экстремальных задач и их применение в
системах оптимизации. М.: Наука, 1982.
16. Жиглявский А.А., Жилинскас А.Г.
Методы поиска глобального экстремума. М.:
Наука, 1991.
27. Кар Ч., Хоув Ч. Принятие
количественных решений в экономике. М.: Мир, 1966.
28. Карлин С. Математические методы в
теории игр, программировании и экономике.
М.: Мир, 1964.
29. Карманов В.Г. Математическое
программирование. М.: Наука, 1975.
30. Лесин В.В., Лисовец Ю.П. Основы
методов оптимизации. М.: Изд-во МАИ, 1995.
31. Мак Кинси Дж. Введение в теорию
игр. М.: Физматгиз, 1960.
32. Мину М. Математическое
программирование. Теория и алгоритмы. М.: Наука,
1990.
33. Моисеев Н.Н., Иванилов Ю.П.,
Столярова Е.М. Методы оптимизации. М.: Наука,
1978.
34. Пантелеев А. В., Летова Т.А. Методы
оптимизации в примерах и задачах. М.:
Высшая школа, 2002.
35. Поляк Б.Т. Введение в оптимизацию.
М.: Наука, 1983.
36. Пшеничный Б.Н., Данилин Ю.М.
Численные методы в экстремальных задачах.
М.: Наука, 1975.
37. Реклейтис Г., Рейвиндран А., Рэгсдел
К. Оптимизация в технике. В 2-х т. М.: Мир,
1986.
38. Сборник задач по математике для
втузов. Методы оптимизации. Уравнения в
частных производных. Интегральные
уравнения / Под ред. А. В. Ефимова. М.: Наука, 1990.
39. Сборник задач по математике для
втузов. Специальные курсы / Под ред. А.В.
Ефимова. М.: Наука, 1984.
40. Стронгин Р.Г. Численные методы
многоэкстремальной минимизации. М.:
Наука, 1978.
41. Сухарев А. Г., Тимохов А.В., Федоров
В.В. Курс методов оптимизации. М.: Наука,
1986.
42. Федоров В.В. Численные методы
максимина. М.: Наука, 1979.
43. Фиакко А., Мак-Кормик Г.
Нелинейное программирование. Методы
последовательной безусловной минимизации. М.: Мир,
1972.
44. Химмельблау Д. Прикладное
нелинейное программирование. М.: Мир, 1975.
45. Численные методы условной
оптимизации / Под ред. Ф. Гилла, У. Мюррея. М.:
Мир, 1977.
46. Юдин Д.Б. Математические методы
управления в условиях неполной
информации. М.: Советское радио, 1974.
Раздел 2 2
МАТЕМАТИЧЕСКАЯ ТЕОРИЯ
ОПТИМАЛЬНЫХ ПРОЦЕССОВ УПРАВЛЕНИЯ
Теория оптимального управления - раздел
математики, в котором изучаются способы
формализации и методы решения задач о
выборе наилучшего в заранее предписанном
виде способа осуществления управляемого
динамического процесса. Этот динамический
процесс описывается при помощи тех или
иных эволюционных соотношений,
зависящих от системы функций или параметров,
называемых управлениями и подлежащих
определению.
Типовая схема оптимальной системы
изображена на рис. 22.1. Каждая постановка
задачи синтеза оптимального управления
включает математическое описание всех
блоков, образующих систему управления.
Постановка задачи синтеза оптимальной
динамической системы содержит следующие
основные элементы.
Краевые
условия
Внешние
воздействия
1. Модель объекта управления. Обычно
описывается уравнением состояния,
отражающим применение известных законов
физики и техники, например, стохастическим
или обыкновенным дифференциальным
уравнением, уравнением с частными
производными, разностным,
дифференциально-разностным уравнением. Параметры модели задаются
либо статистическими характеристиками,
либо множествами возможных значений.
Состояние модели может задаваться, например,
вектором, объединяющим характерные
изменяющиеся параметры объекта, или функцией,
описывающей поведение модели в
пространстве и времени.
2. Краевые (начальные и конечные)
условия. Они могут быть детерминированными,
определяться своим статистическими
характеристиками или описываться множествами
возможных значений.
Погрешности
измерений, помехи!
Модель объекта
управления
Состояние
Модель измерительной
системы
Измерение
Промежуток времени
функционирования
Ограничения
на состояние
и управление
Управляющее
воздействие
Алгоритм управления
I
Цель управления
Рис. 22.1
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ
797
3. Внешние воздействия. Как правило,
описываются статистическими
характеристиками или множествами возможных значений.
4. Промежуток времени
функционирования системы. Может быть заданным
конечным или полубесконечным, случайным,
оптимизируемым и т.д.
5. Ограничения на состояние и управление.
Они обычно задаются множествами их
допустимых значений.
6. Модель измерительной системы.
Описывается, например, функциями или
операторами состояния, стохастическими
дифференциальными уравнениями. Входом модели
является состояние, а выходом - значение
измерений.
7. Погрешности измерения, помехи. Как
правило, описываются статистическими
характеристиками или множествами возможных
значений.
8. Алгоритм управления. Определяется
характер использования информации об
измерении, способ выработки и приложения
управляющих воздействий. Алгоритм
управления вырабатывает управляющее воздействие
по получаемой информации об измерениях.
9. Цель управления. Как правило, цель
управления описывается некоторым
критерием качества и отражает требования,
предъявляемые проектировщиком к оптимальной
системе (наилучшей с точки зрения
выбранного критерия).
Схема, изображенная на рис. 22.1,
отражает процесс управления объектом при
неполной информации, так как оптимальное
управление строится на основе информации
об измерениях состояния при наличии
погрешностей. В общем случае управляющее
воздействие формируется на основе всей
накапливаемой информации об измерениях.
Частным случаем таких систем являются
оптимальные системы без накопления
информации, где при выработке управляющего
воздействия используются только текущие
(мгновенные) значения измерений, а информация
о предыдущих измерениях не учитывается.
Часто на практике в системах без накопления
информации оптимальное управляющее
воздействие формируется по результатам
измерения части координат вектора состояния, т.е.
по неполному вектору состояния. В предельных
случаях информированности о векторе
состояния оптимальное управление
вырабатывается либо по полному вектору состояния, либо
при отсутствии текущей информации.
Глава 22.1
СИНТЕЗ ОПТИМАЛЬНЫХ
НЕПРЕРЫВНЫХ ДЕТЕРМИНИРОВАННЫХ
СИСТЕМ
22.1.1. Нахождение оптимального
программного управления. Поведение
модели объекта управления описывается
обыкновенным дифференциальным уравнением
x(t) = f(t,x(t),u(tj), (22.1.1)
где х- вектор состояния системы,
т
х = (xj,..., хп ) е R" ; и — вектор управле-
ния, и = (wb...,w9) eUa:Rg, U
-некоторое заданное множество допустимых
значений управления', t — время, / е Т = \t$,t\\ ~
промежуток времени функционирования
системы, f(t,x,u) — непрерывно
дифференцируемая вектор-функция, f{t,x,u) = (/i(/,x,w),
...Jn(t,x,uf, f(t,x,u):TxRnxU->Rn;
R" — л-мерное евклидово пространство.
Момент начала процесса /0 задан, а
момент окончания процесса t{ определяется
первым моментом достижения точкой
(t,x(tyi некоторой заданной поверхности
Г с Rn+i :
r = {(t{,x)\ri(t[,x) = 0,i = l,..J;
(22.1.2)
tle(t0,+ oo),xeRn],
т.е. в момент t[ должны выполняться условия
r,('i,*(>i)) = 0> ' = 1.-.'.
где 0 < / < п + 1, при / = п + 1 множество
Г представлено точкой в пространстве
Rn+{ , функции Г/^,*) - непрерывно диф-
(Щ^х)
ференцируемы; система векторов — ,
^ дх{
...,———-,———- , / = 1,...,/, линеи-
дхп dt{ )
но независима V(/j, х) е R"
798 Глава 22.1. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
Начальное условие х(/0) = *о задает
начальное состояние системы.
Предполагается, что при управлении
используется информация только о времени, т.е.
система управления в данном случае является
разомкнутой по состоянию, и рассматривается
так называемое программное управление
(рис. 22.1.1).
Множество допустимых управлений (Mq
образуют кусочно-непрерывные функции £/(•)
со значениями в множестве U . В точках
разрыва значение управления определяется как
предел справа.
Множество допустимых процессов
Ю(/о,х0) определяется как множество троек
d = (/i,x(),w()), которые включают момент
окончания процесса t[, траекторию х() и
управление £/(•) (где V/ е Т: x(t) e Rn ,
u(t) e U , функции дс(-) непрерывны и
кусочно-дифференцируемы, а £/(■) е ^о
кусочно-непрерывны), удовлетворяющие
уравнению (22.1.1) с начальным условием
х(/0) = Хц почти всюду на множестве Т и
условию (22.1.2).
На множестве ©(/(), *о) определяется
функционал качества управления
'1
j
'о
(22.1.3)
где f (t,x,u), /'(/jjX) - заданные
непрерывно дифференцируемые функции.
Требуется найти такую тройку d =
= (t*{ У (),u*())eD(t0,x0), что
l(d*)= min 1(d).
v ' </е©(/0,*о)
(22.1.4)
'Ч "(')
*('о) = *0
^ = f{Ux{t)Mt))
x(t)
Рис. 22.1
Задача (22.1.4) с функционалом (22.1.3)
называется задачей Больца; если в
функционале (22.1.3) функция F{t[,x) = 0 (отсутствует
так называемый терминальный член) -
задачей Лагранжа; если / {t,x,u) = 0
(отсутствует интегральный член) — задачей Майера.
Искомые функции х (•) и и (•)
называются соответственно оптимальной траекто-
*
риеи и оптимальным управлением, a t[ —
оптимальным моментом окончания процесса.
Замечание. Если любое допустимое
управление w() e Wq порождает
единственную тройку */е Ю(/0,*о) > то задача (22.1.4)
может быть записана в эквивалентной форме:
l(t0,x0,u*())= min I(t0,x0,u()).
х ' и(-)еЩ
Необходимым условием экстремума
функционала в задаче (22.1.4) является
принцип максимума [2, 15, 29, 32].
Теорема 22.1.1. Пусть на тройке d =
= (/j*,**(•),£/*(■)) g <D(/0,^o) достигается
минимум функционала (22.1.3). Тогда существует
такая вектор-функция \\f(t) = (\\f[ (/),..., \\fn (f)) ,
что:
1) в каждой точке непрерывности
управления u*(t) функция H(t,\\f(t),x*(t),u)
достигает максимума по управлению, т. е.
max я(/,у(/),х*(/),и) = я(/, W(t),x\t),u\t)),
где
п
H(t,y,x,u) = Y,Vjm //('>*>") - /°(*>х>и);
- y=i
2) выполняется условие
трансверсальности
dF(t;)-H(t;)dt[+^j(t;) oxj = o
7=1
(22.1.5)
при любых 6t[ и dXj, удовлетворяющих
системе
6Г,(^х*(г,*)) = 0,/ = 1,...,/,
Г,-('Г.**('Г))=°. / = !,.••,/.
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ
799
л u(S\ ulS (S\ *l**\ */>*\\ clS\ Решаемая задача с фиксированным вре-
где h\t{ J = h\tx ,y\tY J,x \t{ ),u [t{ jj, F]t{)= менем окончания записывается в форме
= jFm ,х [Ц }), вариации определяются еле- Т/ . г „П/ . ч , чЧ , . , чЧ
V1' V1// F F I(d)=jf°(t,x(t),u(t))dt + F(x(t[))-> min.
дующим образом:
'о
Решением этой задачи является пара
оптимальные траектория и
8,(,;И4-'К)): _ и.£™
дГн{ ,х ^ и п bF\t{ ,x \t{ II управление.
5/j + V Ъх;, 2. В случае когда начальное состояние и
1 /=1 У момент начала процесса ta не заданы, а
определяются вместе с конечными состояниями
соотношениями
7=1 J момент начала процесса /0 не заданы, а оп
*,('1.х$)) =
ЭГ, /lf* Ы л ЭГ,- *ьдс М
_ \ -ig/ + "V—— far • терминальный член функционала может зада-
<"1 y=j dXj ваться в виде разности F\(t[ix(h))~
оч . */\ /\ 3 -Fo(tf),x(tr))). Тогда решаемая задача запи-
3) функции х (•), \|/(-1 удовлетворяют v\v> \v/j v ~~
сывается в форме
системе уравнении: ^ *
t\
■*,Л_МЫ<)>х\*\»\*)) I{d)=\f{t,x{t),u{t))dt + Fx{tbx{h))-
= fj(t,x(t),u\t)\ -/0(><»*(>o)Hmi">
ху('о) = ^оу. J = 1,-,и. (22.1.6)
. эя(^(>)>**(')>"*(')) . ,
а условия трансверсальности имеют вид
6^(^)-Я(/Г)8/1+Хуу(/Г)8хл
6F0(/5)-^)»o + Xvy('o*)8x.
У=1
7'о
= 0
Используемые в формулировке
утверждения функции У1 (*),-•-,4^(0 называются (22.1.7)
вспомогательными переменными, H(t,\\f,x,u) - при 5Г,-[/q»^*Ко)»^Г>дс*И1*)) = 0 » / = 1,...,/;
гамильтонианом, а система (22.1.6) -
системой канонических уравнений. Ы^У^Ь^х*^)) = 0,1 = 1,...,/ .
Замечания. 1. В частном случае задания \ V / V //
множества У, когда момент времени t{ задан Решением задачи в этом случае является
и фиксировано * координат x{],...,xkl четверка (to/\ ,х*(),и*()), включающая оп-
вектора x(/i), т.е. t\ = l\, Xj(ti) = xyl , тимальные моменты начала и окончания про-
7 = 1,...,А:; 0</с<п, 1 = /с + \, функции Uecca> траекторию и управление.
ч 3. В общем случае гамильтониан следует
rj(t{,x) имеют вид Гу(/, ,х) = ху - ху1 = 0, записывать в форме
7 = 1,...,/:; Гл+1(/,,дс) = /1-Г1=0. Здесь я
при А: = я правый конец траектории фикси- l Y TU ' ' jLj TJ ■/yv /
рован, а при А: = 0 свободен. Отсюда следует, ■/~
что dxj = 0, у = 1,...,*; 6/, =0. +Vo-f°(t,x,u),
800 Глава 22.1. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
а при решении задачи рассматривать два
случая: \|/о(') = 0 и \|/о(0 £ 0 . Приведенное
утверждение соответствует второму случаю,
когда полагают Уо(0 = -1 •
4. Если на управление нет ограничений,
т.е. U = Rn, то максимум гамильтониана
ищется с помощью необходимых и
достаточных условий безусловного экстремума (см.
разд. 21).
5. Если модель объекта управления
описывается линейным дифференциальным
уравнением, а функционал квадратичный,
принцип максимума является необходимым и
достаточным условием оптимальности в
задаче (22.1.4).
6. Принцип максимума получил
многочисленные обобщения и практические
приложения, например, в направлении учета
более сложных неклассических ограничений, в
изучении достаточности соответствующих
условий, в рассмотрении обобщенных
решений (особых или скользящих режимов),
разрывных и логико-динамических систем,
систем с запаздыванием, дифференциальных
включений [7, 8, 10, 14, 16, 19, 20, 26, 32, 44,
49, 50].
7. При отсутствии априорной
информации о системе рассматривают задачу
оптимального управления в условиях
неопределенности. Тогда каждому допустимому управлению
и заданному множеству начальных состояний
соответствует ансамбль (пучок) траекторий в
пространстве. Различные методы решения
этого класса задач при различной степени
информированности о состоянии приведены в
[28, 34, 37, 39, 40].
Алгоритм применения принципа
максимума. 1. Составить гамильтониан: H(t,\|/,х,и) =
= y£yJfj(t,x,u)-f°{t1x,u).
7=1
2. Найти структуру оптимального
управления и (t) = и (t,\\f(t),x(ty) из условия
максимума гамильтониана по управлению.
3. Составить систему канонических
уравнений (22.1.6) с заданными в задаче
условиями.
4. Из условий трансверсальности (22.1.5)
или (22.1.7) получить недостающие краевые
условия для уравнений составленной системы.
5. Решить двухточечную краевую задачу
для системы канонических уравнений,
полученную в п. 3, с учетом результатов пп. 2 и 4.
В итоге определяется тройка m ,x (•),£/ (•)),
на которой может достигаться экстремум
функционала. В соответствии с пп. 1, 2
замечаний к формулировке принципа максимума
решениями задачи в зависимости от
постановки могут быть также пара I x (•), и (•)] или
четверка (t*0/{,x*(•),£/*(•))•
Пример 22.1.1. В задаче
x(t) = x(t) + u(t), x(0) = 0,
xeR; ueR, /e[0;l],
]
/ = ju2(t)dt-x(\)-> mm
о
требуется найти оптимальную пару
fx (•), и (•)], на которой достигается
минимум функционала.
Сравнивая с общей постановкой задачи,
имеем: f(t,x,u) = х + и , /°(/,х,и) = и2 ,
F(thx) = -х , Г^! ,x(f,)) = t{ - 1 = 0 .
Решается задача Больца.
1. Составляем гамильтониан:
H(t,\\f,x,u) = \|/ (х + и)- и2 .
2. Находим максимум гамильтониана по
управлению. Так как ограничения на
управление отсутствуют, можно применить
необходимые условия безусловного экстремума
— #(/,\\f(t),x(t),и) = \\f(t)- 2и = 0. Отсюда
«'О-
Щ
Найденное управление
обеспечивает максимум функции #(/,\|/(?),х(/),и)
по управлению, так как удовлетворяются
достаточные условия экстремума
ди'
■яМ0>
x(t),u) = -2<0.
3. Выписываем уравнения системы
(22.1.6) с учетом результата п.2:
x(t) = x(t) + u\t) = x(t) + -^, x(0) = 0,
4. Проверяем условие трансверсальности
(22.1.5). Так как F(tx, х) = -х , то SF = -Ьх
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ
801
и [-Sx-//"^! )6/i +>|r(/i )Sx] I =0.
Поскольку ty = 1, то ^-1 = 0 и bt[ = 0.
Ограничений на *(/]) не наложено, поэтому
вариация Ьх произвольна. В результате
имеем \y\f(t\ )-l |6х =0 и, следовательно,
V(l)-1 = 0.
5. Решаем полученную двухточечную
краевую задачу:
*(/) = *(0+^,*(о) = о,
v(0 = -v(0, v(i) = i.
Из второго уравнения с конечным условием
имеем \\f(t) = е "'. Поэтому оптимальное
управление и (t) = -—е ч . Решая первое
уравнение системы с начальным условием,
получаем оптимальную траекторию х (t) =
.![.'*'-,'-']■
Пример 22.1.2. В задаче
*,(>) = *2(>)> x,(0) = 0,
x2(t)=-X](t) + u(t), х2(0)=0, |к|<1,
/ = х2(2к) -> min
требуется найти оптимальное программное
управление и (•) и соответствующую ему
траекторию х (•).
Здесь х = (xj ,х2) е Л2 , f e [0; 2л], на
управление наложено ограничение | и\ < 1, т.е.
ке£/=[-1;1], /°(/,х,к) = 0, F(t{,x) =
= *2> f\(t,x,u) = x2, /2(f,x,w) = -x,+w,
Tj (fj ,x(/j)) = f| - 2я = 0. Решается задача
Майера.
1. Составляем гамильтониан
H(t,y,x,u) =\\f\X2+\\f2- [-х{ + и].
2. Находим максимум гамильтониана по
управлению. Так как имеются ограничения на
управление, требуется найти условный
максимум гамильтониана по управлению. В
данной задаче гамильтониан линеен по и на
заданном отрезке изменения управления [-1;
1], поэтому оптимальное управление имеет
вид
и* (t) = argmaxH(t,\\r(t),x(t),u) =
\и\<[ V vv/
= lsign\|/2(r),
т.е. является релейным. Величина управления
определяется знаком функции \|/2(0 •
3. Выписываем канонические уравнения
принципа максимума (22.1.6):
х,(/) = х2(/), *,(<)) = 0,
*2 (0 = -*1 (0+М" (') = -*! (>)+siSn V2 (0 ,
*2(о) = о,
▼■(О—^■я('.^И'>«'(0)-¥2(0.
*а(/) = ~ а|"яМ'И')'"*(')) = -vi (')•
4. Проверяем условия трансверсальности
(22.1.5):
У=1
= 0,
t[=2n
где
ЭЛ х ^ Ьх; J
у=1 ЭхУ
= &с2 . Группируя члены, получаем
- Н{2п)ЪЦ + \|/,(2тс)6х1 + [1 + \|г2(2я)]&с2 = °-
Момент окончания 7| задан, поэтому 5/i =0.
Так как правый конец свободен, то вариации
Ъх\ , 6х2 считаются произвольными. Чтобы
равенство выполнялось для любых вариаций,
необходимо, чтобы Vi(2rc) = 0, \|/2(2я) = -1.
5. Решаем двухточечную краевую задачу
с учетом пп. 2 и 4:
*|(0 = **(')• *|(0) = °;
k2(t) = -х,(t) + sign i|r2(0, *2(0) = 0;
26 — 7706
802 Глава 22.1. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
у2(/) = -у,(/), у2(2тс) = -1.
Имеем: y{(t) = -sin/, \|/2(/) =-cos/, w*(/) =
= sign (- cost) = - sign (cost). Найденное
оптимальное управление и (/) на отрезке
[0,2я] имеет две точки переключения и,
следовательно, три интервала знакопостоянст-
ва:
1) при 0</<|, u*(t)=-l, *,*(/) =
= cos/-l, x\(t) = -sin/;
2) при §*><у,«»-!, *;«=
= cos/- 2sin/ + 1, x2(/) = -sin/- 2cos/;
3) при — < / < 2тс, */*(/) = -1, ;q(/) =
= cos/-4sin/- 1, *2(/) = -sin/-4cos/.
Минимальное значение функционала
равно x-i (2я) = -4 .
Рассмотрим частный случай:
оптимальное управление линейными системами, для
которых уравнение (22.1.1) имеет вид
x(t) = A(t) x(t) + B(t) u(t), (22.1.8)
где у4(/), B(t) - матрицы размера
соответственно (п х л), (л х q), элементы которых
непрерывны; на управление ограничений не
наложено, т.е. и € U = Rq , t еТ = [tQ,t\] -
промежуток времени функционирования
системы, моменты начала процесса /q и
окончания процесса /j заданы, правый конец
траектории x(t{) свободен. Начальное условие
х(/о) = Xq € Rn задано и определяет
начальное состояние.
Функционал качества управления
(22.1.3) квадратичный:
I=\\[xT{t)S{<)x{t)+uT{t)Q{t)u{t)]dt+
'о
4[*Г('1)Л*('|)} (22.1.9)
где S(t) , А - неотрицательно определенные
симметрические матрицы размера (п х п) , а
Q(t) - положительно определенная
симметрическая матрица размера (q x q).
Для нахождения пары d = lx (•), и (•)),
на которой достигается минимум
функционала (22.1.9), требуется решить систему:
i(t) = A(t)x(t)+B(t)Q-l(t)BT{t)v(t),
x(t0) = x0;
(22.1.10)
у (/) = -Л(0 у(/)+S(/) x(f), у (f, ) = -A*(f,);
«•(0=с-|(')л7'(0у(0-
22.1.2. Нахождение оптимального
управления с полной обратной связью.
Поведение модели объекта управления
описывается обыкновенным дифференциальным
уравнением (22.1.1), где моменты начала
процесса /q и окончания процесса /j заданы,
начальное состояние Xq заранее не задано и
может быть произвольным.
Множество допустимых процессов
©(/о,*о) определяется как множество пар
d = (х(),и{-)), которые включают траекторию
дс(-) и управление w(), где V/ € Т:
*(/) € /?" , w(/) € U , функции *(•)
непрерывны и кусочно-дифференцируемы, а £/(•)
кусочно-непрерывны, удовлетворяющие
уравнению (22.1.1) с начальным условием
х(/0) = Xq почти всюду на Т .
На множестве 2)(/о,*о) определяется
функционал качества управления
I{d)=\f%x{tlu{t))dt + F{x{h)),
'о
(22.1.11)
где / (/, х, и), F(x) — заданные непрерывно
дифференцируемые функции.
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 803
Предполагается, что при управлении
используется информация о времени / и
векторе состояния х.
Множество (Ып допустимых управлений
с полной обратной связью (позиционных
управлений) образуют функции u(t,x):T x
х Rn -> U , которые для любых начальных
состояний порождают соответствующие пары
d = (*(•)»#(•)) ^ D(Jq9Xq) , где программные
управления £/(•) € Щ, а V/ € Т u(t) =
= «М'))-
Применяемое в каждый момент времени
/ € Т управление имеет вид управления с
полной обратной связью по вектору состояния
(рис. 22.1.2).
Требуется найти такую функцию
u*(t4x)e Un, что
l(d*)= min 1(d) УхоеД", (22.1.12)
»^-(Л-К0-»Ч^)))-
Функция и (/, х) € (Ып называется
оптимальным управлением с полной обратной
связью. Для любого начального состояния Xq
из множества Rn она порождает
соответствующую оптимальную пару, т.е. оптимальную
траекторию х (•) и оптимальное
программное управление и (•).
Достаточным условием минимума
функционала (22.1.11) является уравнение Беллмана
для непрерывных детерминированных систем
[5, 13, 16, 26, 48].
Обозначим: Q = (t0,t{)x Rn ; CU((?) -
множество функций, непрерывно
дифференцируемых по / их.
Теорема 22.1.2. Если существует функция
ф(/, х) € С ' (Q), удовлетворяющая уравнению
Беллмана с граничным условием
max. ^
ueU dt
л/ ^f dxt *"v' '
1=1 '
(22.1.13)
-/°(/,*,") =° VMe2>
х(/0) = хо € Rn
^ = f(t,x(t)Mt))
u(t) = u(ttx{t))
u(t,x)
x(t)
Рис. 22.1.2
(p(t{,x)=-F(x) VxeR",
и управление и (/, x) € (Un, удовлетворяющее
условию
«*(',*) =
= aiBmaxjy Mlf)/;.(/,x,W)-/0(/,x,4
M€l/ [JT| <**/ J
то и (t9x) является оптимальным
управлением с полной обратной связью.
Алгоритм синтеза оптимального
управления с полной обратной связью. 1. Записать
уравнение Беллмана (22.1.13) с граничным
условием.
2. Найти структуру оптимального
управления с полной обратной связью в результате
поиска максимума в (22.1.13) по управлению.
Искомое управление и (t9x) обычно
выражается через производные функции (р(/,х) .
3. Подставить полученное выражение
для управления в уравнение (22.1.13).
Проблема сводится к решению нелинейного
дифференциального уравнения с частными
производными первого порядка.
4. Найти решение полученного
уравнения и явный вид искомого управления.
Замечания. 1. Уравнение Беллмана
применяется и при негладких функциях <p(t9x)
[5, 16, 32, 48]. В этом случае его решение
понимается как обобщенное (вязкое,
минимаксное и т.д.).
2. Если положить фБ (t9x) = -y(t,x),
то, используя равенство: max f(x) =
=-mill [-/(*)], можно переписать
уравнение Беллмана и граничное условие в
эквивалентной форме:
26*
804 Глава 22.1. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
mm \ ^—^+2,—~—-ft (t,x9u)+
+/0(/,jc,i/)Uo, 9B(/,,jc) = F(4
(22.1.14)
3. Иногда при решении практических
задач удобно использовать функционалы
обобщенной работы [24], минимизация
которых связана с решением линейного уравнения
с частными производными вместо
нелинейного.
4. Если момент окончания процесса
определяется первым моментом достижения
точкой (t,x(t)} поверхности Г, заданной
соотношениями (22.1.2), а функционал имеет
вид (22.1.3), граничное условие для уравнения
Беллмана (22.1.13) записывается в форме
<v(thx) = -F(t{,x) V(/,,x)er.
Пример 22.1.3. В задаче
x(t) = u(t), х е R , и е R, t е [0;1],
I(d) = \\u2(t)dt + ±x2(l)^mm
о z
требуется найти оптимальное управление
и (t,x) с полной обратной связью.
Сравнивая с общей постановкой задачи,
имеем: f(t,x,u) = и , f°(t,x,u) = — и2 ,
F(x) = — х . Решается задача Больца.
1. Выписываем уравнение Беллмана и
граничное условие (22.1.13):
[Эф(Г,х) Э<р(/,х) 1 21
тах<—*—- +—*—Lu—w f = 0,
и [ dt дх 2 J
<p(u) = --^*2-
2. Находим структуру оптимального
управления из условия максимума выражения
в фигурных скобках. Применяя необходимое
3. Подставляем полученное выражение
для управления в уравнение Беллмана:
Эф(*,х) J_
dt + 2
Э(р(;,*)
дх
о, (p(u) = -i*2.
4. Будем искать решение уравнения в
виде y(t,x) = -K2(t)x2, где K2(t) -
неизвестная функция. Подставляя в п. 3 и
2
приравнивая коэффициенты при х нулю,
получаем K2(t) =-K^t), К2([) = -1. 0т"
1
сюда K2(t)-
t-2
, а искомое оптимальное
управление с обратной связью u(t,x) =
-АГ2(')*-7?2-
Пример 22.1.4. В задаче
x(t) = u(t), xeR, i/e[-l; 1], / е [0; Г, ],
требуется найти оптимальное управление
и (t,x) с полной обратной связью,
переводящее объект из любого начального
состояния в начало координат за наименьшее
время, т.е. обеспечивающее минимум функцио-
нала I = jdt Vx(0)eR.
о
Сравнивая с общей постановкой задачи,
имеем: f(t,x,u) = и , f°(t,x,u) = 1 ,
F(t\,x) = 0. Решается задача Лагранжа или, с
учетом смысла функционала, задача
быстродействия с конечным условием x(t[) = 0.
1. Выписываем уравнение Беллмана и
граничное условие (22.1.14):
= 0,
условие безусловного экстремума:
. Э{}_
ди
dv(t,x) л *, \ Эф,х)
^ }-и = 0, получаем и (t,x)= v ;.
дх дх
. ЭФБ(>,х) Э(рБ(>,х)
mm —-+ —-и + \\
\и\<\ Э/ Эх
ФБ(/1,0) = 0.
Так как все траектории системы должны
попасть в точку х = 0 при t = tj , то граничное
условие определено только в этой точке.
2. Находим структуру оптимального
управления из условия минимума выражения
. ЭфБ(>,х)
в фигурных скобках: и (t,x) = -sign .
v ' Эх
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 805
3. Подставляем полученное выражение
для управления в уравнение Беллмана:
ЭфБ(/,х)
dt
Э<РБМ
дх
+1 = 0, фБ(/ь0) = 0.
4. Функция <р (f,x) = |x| является
решением уравнения, так как удовлетворяет ему
в двух областях: при х > 0 и при х < 0, в
чем можно легко убедиться прямой
подстановкой. Граничное условие также
выполняется при х = 0. Искомое оптимальное управ-
ление имеет вид и (t,x) = -sign x.
Рассмотрим частный случай: синтез
оптимальных линейных регуляторов. Уравнение,
описывающее поведение модели объекта
управления, имеет вид (22.1.8), а функционал —
(22.1.9). Тогда искомое оптимальное
управление линейно по состоянию
u\t,x)=Q-l(t)BT(t)K2(t)x, (22.1.15)
где A^f) _ неизвестная симметрическая
матрица (пх п), удовлетворяющая
уравнению Риккати
K2(t) = -AT(t)K2{t)-K2(t)A(t)-
-K2(t)B(t)Q-l(t)BT(t)K2{t)+S{t),
(22.1.16)
АГ2(/,) = -Л.
Решая уравнение Риккати (22.1.16), можно
получить явный вид оптимального
управления (22.1.15) с полной обратной связью.
Замечания. 1. Если обозначить P(t) =
= -K2(t), то соотношения (22.1.15), (22.1.16),
следующие из (22.1.14) при <р (t,x) =
1 т
= —х P(t)x , имеют вид
P(t) = -AT(t)P(t)-P(t)A(t)+
+P{t)B{t)Q-\t)BT(t)P(t)-S(t),
P(ti) = *
(22.1.17)
и* (t,x) = -Q~l (t)BT(t)P(t)x = -F(t)x,
(22.1.18)
F(t) = Q-\t)BT(t)P(t).
2. Если 11 = -и» , матрицы A, B, S, Q
не зависят от t , система является вполне
управляемой [6, 19, 22], то оптимальный
регулятор в задаче
x(t) = Ax(t)+Bu(t), x(0) = x0,
1 *~
/ = i j\xT(t)Sx(t) + uT(t)Qu(tj\dt -> min ,
о
определяется соотношением [29]:
u{x) = -Q-{BTPx = -Fx, F = Q~XBTP,
(22.1.19)
где Р — положительно определенная
симметрическая матрица, удовлетворяющая
алгебраическому уравнению Риккати
- ЛтР - Р А + PBQ-1 ВтР - S = 0.
(22.1.20)
Решение этого уравнения, удовлетворяющее
критерию Сильвестра, единственно. Можно
показать, что замкнутая система, описываемая
уравнением
x(t) = [А-В Ql BTp]x(t), х(0) = х0,
является асимптотически устойчивой, т.е.
x(t) -> 0 при t -> -и» .
Данная проблема получила название
задачи Летова-Калмана аналитического
конструирования оптимальных регуляторов.
Пример 22.1.5. Для задачи
x(t) = -x(t) + u(t), х(0) = х0,
/=iJW2(/)^+ix2(l)->min
о
требуется найти оптимальное управление
u(t,x).
Сравнивая постановку задачи с (22.1.8),
(22.1.9), имеем: A(t) = -\, B(t)=\, Q(t)=\,
S(t) = 0, A = 1, /0 = 0 , /, = 1 . Тогда
уравнение (22.1.16) примет вид: K2(f) = 2К2 - К2 ,
Af2(l) = -1- Находя его решение K2(t) =
2
\-Зе
2-2/
, по формуле (22.1.15) получаем
806 Глава 22.1. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
оптимальное управление и (t, х) = ^-^г •
V ' 1-Зе2"2'
Пример 22.1.6. Для задачи
x\(t) = x2(t)9 i2(*) = "{*)>
/ = I j[x{(t)+ 2xl(t) + u2(t)]dt -> min
о
требуется найти оптимальное управление
и (х) с полной обратной связью.
Сравнивая с общей постановкой задачи,
имеем
а искомая симметрическая матрица
'■Й: £)-*-*■
Составим алгебраическое уравнение
Риккати (22.1.20) с учетом симметричности
матрицы Р и выпишем структуру регулятора
(22.1.19):
и*{х) = -Р2[х[-Р22х2,
/>,22-1 = 0, -РП+РпР22=0,
- 2Р[2 + Р?2 - 2 = 0.
Условию положительной
определенности матрицы Р удовлетворяет решение
р\\ =2> ^12=^21=Ь ^22=2. Отсюда
следует, что оптимальный регулятор и (х) =
= -х{ - 2х2.
22.1.3. Нахождение оптимального
управления с неполной обратной связью.
Поведение модели объекта управления
описывается обыкновенным дифференциальным
уравнением
Yt = /М'МО). ХМ = *<>' (22-1-2D
где х — вектор состояния системы, х =
= (xl,x2f sR", xl=(xu...,xmf, x2 =
т
= (xm+1,..., jcw ) , 0 < m < п (предположим,
что о компонентах вектора jc e У?ш известна
текущая информация, а о компонентах
вектора х € JR/I~/W она отсутствует); и — вектор
управления, и eU с Rg, £/ - некоторое
заданное множество; f - время, t еТ =
= fob * 1 ] = ^ U{^o } U{'i} , Г' -. промежуток
времени функционирования системы,
моменты времени fy и ^ заданы, внешние
воздействия на объект управления отсутствуют,
f(t9x,u): T' х Rn xU -> Rn - непрерывно
дифференцируемая вектор-функция.
Обозначим: В = Rn , В{ = Rm , Я2 =
= R"-m; Q = (t0,t{)xR\ Q' = [t0J{]xR".
Начальные условия х([ц) заданы
множеством Q с Rn, размерность которого
равна /и, т.е.
х(/о) е О = {*|*2 = ^о(^), *' е Д'л = Д,} ,
(22.1.22)
где y0j (x[ j, у = /я + 1,..., я - заданные
непрерывно дифференцируемые функции;
0</я< л.
При /я = 0 множество Q является
точкой, а при m = n совпадает с множеством
Rn. Условия на вектор состояния на правом
конце промежутка времени Т не заданы.
Предполагается, что при управлении
используется информация только о времени t
и о компонентах вектора х , т.е. управление
u(t), применяемое в каждый момент времени
t е Г', имеет вид управления u(t) - ult,x (r)l
с неполной обратной связью по вектору
состояния (рис. ,22.1.3).
Множество допустимых управлений Wm
с неполной обратной связью образуют функции
u(t,xl): ТхВ[ -> U , такие, что функции
fl(t,x,u(t,x^)), / = l,...,/f, определены на
Q, непрерывны вместе с частными
производными по х, кусочно-непрерывны по /.
При этом управление u(t) = u(t,x[(t))
кусочно-непрерывно по /, а в точках разрыва
значение управления определяется как предел
справа.
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С НЕПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 807
*('о) = х0еП
dx
Н ^ = /(',*(>),*('))
и(0-«(/.хЧо)
u(t,xl)
Рис. 22.1.3
x(t) = (xl(t),x2(t))
JW-Wt)9...9xm(l))T
0£m£n
На множестве допустимых процессов
©(*0»*о) (см- п- 22.1.2) определяется
функционал качества управления (22.1.11).
Требуется найти такую функцию
m*(t9xl)sUm94JO
/(</*) = min 1(d) Vx0eQ, (22.1.23)
deD(t0yx0)
где /=(/(), Л) = ЛУЧ))-
Функция u*(t,x*)e Ищ называется
оптимальной синтезирующей функцией на
множестве Q . Для каждого начального условия
из множества О. она порождает оптимальную
пару, т.е. оптимальную траекторию х (•) и
оптимальное программное управление и (■).
Предполагается, что минимум в (22.1.23) и
функция u*(t,x ) существуют. Число
используемых в управлении координат вектора
состояния совпадает с размерностью
множества начальных условий Q . При т = 0
множество Q является точкой Xq, для которой
ищется оптимальное программное управление
и (t), а при т = п множество Q совпадает
с п -мерным пространством состояний и
ищется оптимальное управление с полной
обратной связью по вектору состояния
и* (>,*)•
Для определения оптимальной
синтезирующей функции на множестве Q требуется
решить систему из 2(п - т) + 1 уравнений в
частных производных первого порядка с
2(л-/я) + 1 краевыми условиями на концах
промежутка Т :
Э/ ы\ Эх,
xf,(t,xl,y(t,xl),m*(t,xl)) +
+ fj(t,x\y(t,xx),u*{t,x{)), j = m + 1,...,я,
/j(t0,xl) = y0J(xl), j = m + \,...,n,
mx \bW{t,x{) A ЭЯ'(/,Л/С,*')),.
"*u\ dt j£n dxJ
xyj(t,xl)+H(t,xl ,y*(t,xl),un =0 ,
ЭУу(/,х') ЭЯ'(/,*',/(',*'))
Эх,-
dt
Vj(t\,x )
j = m + \,...,n, (22.1.24)
bF(x\y(tx,xx))t
Эх,-
j = m + \,...,n,
(,)X.)= £ ^(x',/(/hx'))
j=m+\
dXj
;у%,х*)-р(х>,у%,х>)),
где
dW(t,xl)
Н((,х,и)=^0ГГу''Х'ли,х,и) +
/ = 1
j=m+\ i=\
dX;
dVj(t,Xl)
dX;
A(t,x,u) +
+ %Vj(t,xl)-fj(t,x,u)-f0(t,x9u),
j=m+\
H\t,xl\y'(t,xl)) = maxH(t,xl,y*(t,xl),u).
808 Глава 22.1. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
Замечания. 1. В предельных случаях
информированности о векторе состояния (им
соответствуют различные способы задания
множества начальных условий Q) система
(22.1.24) преобразуется к соотношениям
принципа максимума и уравнению Беллмана.
2. Пусть модель объекта управления
описывается соотношением (22.1.8), а модель
измерений - соотношением
)>(/) = С(0*(0, (22.1.25)
где х — вектор состояния, х е Яп; у —
вектор измерений, yeRm; t — время,
t € Т = [tQ,t[] , моменты времени ^ h за-
даны, A(t), B(t), C(t) — матрицы размера
соответственно (пхп), (nxq), (mxn),
элементы которых непрерывны; на
управление ограничений не наложено, т.е. ие Rq;
размерность вектора измерений не больше
размерности вектора состояния (т<п).
Начальное состояние произвольное: Xq e Rn ,
но предполагается, что имеется некоторая
точка Xq , в окрестности которой
расположены возможные начальные состояния. Обычно
это предположение используется для учета
реальных условий функционирования
системы управления. Функционал качества
управления (22.1.9) квадратичный.
Требуется найти управление щ, YJ ),
зависящее от всех доступных к текущему
моменту времени измерений У = \y\t\
t$ < х < t} так, чтобы свойства
синтезируемой системы были близки к
соответствующему случаю полной информации о состоянии.
|*('о)
dx_
dt
= A(t)x(t) + B(t)u*(t)
Модель объекта управления
Идея решения состоит в получении
оценки x(t) вектора состояния x(t) в текущий
момент времени t по результатам измерений
Yj и использовании этой оценки в
управлении (22.1.15) вместо x(t). Тогда чем точнее
оценка x(t), тем ближе синтезированная
система по своим свойствам к оптимальной при
полной информации о состоянии. Структура
такой субоптимальной системы изображена
на рис. 22.1.4. В детерминированных системах
процесс получения оценок вектора состояния
по измерениям называется восстановлением
или наблюдением. Различают наблюдатели
полного и низкого порядка.
Если т = п и матрица C(t) не
вырождена We T , то вектор состояния x(t) может
быть найден по формуле x(t) = С (t)y(t). В
этом случае ошибка оценки вектора х равна
нулю и синтезируемая система совпадает с
оптимальной при полной информации о
состоянии. Для всех начальных состояний
обеспечивается минимум функционала (22.1.9).
Уравнение наблюдателя полного порядка
имеет вид
^ = A(t)x(t)+B(t)u(t)+
+ K(t)[y(t)-C(t)x(t)], x(t0) = 4
(22.1.26)
Матрица K(t) должна быть выбрана такой,
чтобы ошибка е(/) = x(t) - x(t) достаточно
быстро убывала (стремилась к нулю при
х(0
y = C(t)x(t)
y(t)
Модель измерений
|*('о) = *о
«*(/) = Q-\t)BT(t)K2(t)x(t)
u'(t)
Накопление информации и выработка
оценки вектора х
Оптимальный регулятор
Наблюдатель состояния
Рис. 22.1.4
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ
809
/—>+°о). Если все матрицы в (22.1.8),
(22.1.9), (22.1.25) не зависят от времени, то
для этого требуется, чтобы действительные
части собственных значений матрицы
А - КС были отрицательными. Наблюдатель
имеет порядок п по числу координат вектора
оценок, удовлетворяющего
дифференциальному уравнению (22.1.26).
Для стационарных систем, для которых
уравнения (22.1.8), (22.1.25) имеют вид
x(t) = Ax(t)+Bu(t), y{t)=Cx(t), (22.1.28)
а матрица С имеет ранг т , можно
построить наблюдающее устройство порядка п-т.
При этом предполагается, что система
является вполне наблюдаемой [11, 22, 44].
Наблюдатель низкого порядка
(наблюдатель Люенбергера) описывается уравнением
^ = Dl(t)+Hu(t)+Ky(t), i{t0) = Gxl
где матрицы D, Н , К , G должны
выбираться из условия стремления ошибки
оценивания к нулю, т.е. е(/) = z(t) - z(t) —> 0. Если
действительные части собственных значений
матрицы D отрицательные и выполняются
условия: GA - DG - КС = 0 , GB - Н = 0 , то
ошибка оценивания е(/) стремится к нулю
при / —> +°о . Обычно на практике задают
матрицы D, К и находят неизвестные
матрицы Н , G, причем для существования
решения требуется, чтобы собственные
значения матриц А и D были различными.
Глава 22.2
СИНТЕЗ ОПТИМАЛЬНЫХ
НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ
СИСТЕМ
22.2.1. Нахождение оптимального
программного управления. Поведение
модели объекта управления описывается
стохастическим дифференциальным уравнением Ито
[44, 58]:
dX = f{t, X{t\ u{t))dt + o(f, X{t\ u{t))d\V ,
X{t0)=X0, (22.2.1)
где X — вектор состояния системы,
X € Rn ; и — вектор управления, и € U с
с Rq , U — некоторое заданное множество
допустимых значений управления; t € Т =
= 1/о 9 h 1 ~~ промежуток времени
функционирования системы, моменты времени /q и h
заданы; W(t) — А:-мерный стандартный ви-
неровский случайный процесс, не зависящий
от Xq (второй член в уравнении (22.2.1)
характеризует случайные внешние воздействия на
объект); f(t,x,u):TxRnxU-+R", o(t,x,u) -
матричная функция размера (п х к ).
Обозначим: B = R" , Q = {t0,t{)xRn.
Начальное состояние Xq определяется
плотностью вероятности
р{*0,х)=Ро(х)еР, (22.2.2)
где P = h(x)\p(x)eC2(B),jp(x)dx = l
p(x)>0 VxgbI, Ck(B) — множество
к раз непрерывно дифференцируемых
функций.
Предполагается, что при управлении
используется информация только о текущем
времени, т.е. система управления в данном
случае является разомкнутой по состоянию и
рассматривается так называемое программное
управление u(t).
Множество допустимых управлений (Ы$
образуют функции и() :Т -» U, такие, что
функции //%,*) = /■(/, x,i/(/)), dfjXt,x) =
= Ojj(t,x,u(t)),i = [,...,nJ = 1,...,*,
удовлетворяют условиям, при которых решение
уравнения (22.2.1) существует, единственно и
является непрерывным марковским
процессом. Если плотность вероятности этого
процесса p(t,x)e С1' (Q), то она удовлетворяет
уравнению Фоккера-Планка-Колмогорова:
810 Глава 22.2. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ
dp(t.x) уг> д г ^ / /\\/ \1 Теорема 22.2.1. Если элемент dn =
/=1 ' = (Р (v),w*0) e Do(t0,p0(x)) удовлетворяет
условию (22.2.5), то выполняются соотношения
1 " п ^ 2 г л стохастического принципа максимума:
*ij$sz*jh'"•*•"<'»'«•*>!- „.„„ „
д t
= AuU[p(t,x)] V(t,x)eQ (22.2.3)
/>*('о,*) = А)(*)>
с начальным условием (22.2.2). Здесь Л"™[-] — ^^/^ v\
дифференциальный оператор, С' (О) "" Э/
пространство функций p(t,x), непрерывных
на Q вместе с частными производными
<p(/lfx) = -F(x), (22.2.6)
bp(t9x) dp(t,x) d2p(t,x)
(/ = !,....л;
Э/ ' Эх,- ' Элг.Эл:; ' ' и*(0 = argmax f
аиа9х,и) = Тои«,х9и)ол«,х,и). +-1,1, а а */;(*,*, и)-/ (t9x,u)
Обозначим через £?о Со >/>()(*)) множе_ xp*(t,x)dx,
ство пар */о = (/?(■,•), w(-)), где функции
p(v) 6 C''2(0 , «(•) e Щ и удовлетворяют ** *"°W.*>] = ^-f^-f,(t,x,u'(i)) +
1=1 С' Xj
уравнению (22.2.3) с начальным условием
(22.2.2). | 1^Аа2ср(и)д (txuUt))
На множестве ©оСо»А)(х)) определя- 2^^Эх-Эх- /у
ется функционал качества управления ,, ,,
w ' ^ женныи дифференциальный оператор.
ty В результате решения краевой задачи
J(d )= f f f° It x u(t))p(t x)dxdt+ (22.2.6) может быть найдено оптимальное
J J ' ' программное управление и * (•).
Рассмотрим частный случай: опти-
( и/ \ /4 w />т л\ мольное управление линейными системами.
+ J t (x)p(t{ ,x)dx= (22.2.4) Уравнение (22.2.1) имеет вид
dX = [A(t)X(t) + B(t) i/(/)] dt+C(t) dW,
= ЛЛ
'i
\f*(t,X(t)Mt))dt+F{X(tx))
(22.2.7)
где ^4(0, B(t), C(f) - матрицы размеров
где непрерывные функции f°(t,x,u): соответственно (пхп), (nxq), {nxk),
TxBxU->R, F(x):B->R удовлетворяют элементы которых непрерывны; на
управление ограничений не наложено, т.е.
условию полиномиального роста. ^
Требуется найти такой элемент и eU = Rq . Начальная плотность вероятно-
,* / */ ч *,\\ /гч i4 i w сти (22.2.2) — гауссовская с математическим
do = (Р (vM О) е Qo(t0,p0(x)), что ' '
ожиданием щ и ковариационной матрицей
J (do) = mul J (do) • (22.2.5) Rq . Функционал качества управления (22.2.4)
d0eD0(tQ,p0(x))
квадратичный
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 811
J = ^jj[xTS(t)x + uTQ{t)u\p(t,x)dxdt-
tQB
+^j[xTAx]p(t{,x)dx =
в
= М U j[x(t)TS(t)X(t) + u(t)TQ(t)u(t)]dt+
I 'О
+ ^[jf(/l)7,AJf(/1)]}f (22.2.
8)
где S(t), Л - неотрицательно определенные
симметрические матрицы размера (п х п), а
Q(t) - положительно определенная
симметрическая матрица (qxq).
Для нахождения искомого оптимального
программного управления требуется решить
систему
т = A(t)m{t)+ B{t)Q-l{t)BT{t)y(t),
m(t0) = mo, у = S(t)m(t) - ATy(t),
W{tl)=-Am(ti), (22.2.9)
u*(t)=Q-l(t)BT(tMt).
Пример 22.2.1. В задаче
dX = u{t)dt + d\V, X(0) = XQ,
J 4JJ ul Wp^x) dxdt^jx2p(lx) dx ->
0/?
► mm,
где x eR, t€ [0;l], и e R, щ = 1, /2q = 1,
требуется найти оптимальное программное
управление w * (•).
,*(/„) «ЯГ0
В поставленной задаче Л(0 = 0,
Я(0 = 1, С(0 = 1, 5(0 = 0, 6(0 = 1,
Л = 1, <о = 0, f 1 = 1 • Выпишем уравнения
системы (22.2.9):
от = у(г), /я(0)=1;
V = 0, V(l)=-m(l); «*(')=¥С0-
Отсюда находятся оптимальный закон
изменения математического ожидания и
оптимальное программное управление: т* (/) =
-i-i..•«--!.
22.2.2. Нахождение оптимального
управления с полной обратной связью.
Поведение модели объекта управления
описывается стохастическим дифференциальным
уравнением Ито (22.2.1), а начальное
состояние Xq определяется плотностью вероятности
(22.2.2).
Предположим, что о компонентах
вектора состояния X известна полная текущая
информация, т.е. управление u(t),
применяемое в каждый момент времени / € Т,
имеет вид управления с полной обратной
связью: u(t) = u(t,X(t)) (рис. 22.2.1).
Множество допустимых управлений с
полной обратной связью Ы п образуют
функции u(t,x) :ТхВ -» U , такие, что для всех
/ = 1,...,я; у = 1,...,* функции //'()(/,*) =
= fi{t,xMt,x)), of'){t,x) = oij{t,xMt,x))
удовлетворяют условиям, при которых
решение уравнения (22.1.1) существует,
единственно и является непрерывным марковским
процессом. Если плотность вероятности этого
процесса />(/, х) е С ' (Q), то она
удовлетворяет уравнению
Фоккера-Планка-Колмогорова (22.2.3) с начальным условием (22.2.2).
, WW
dX = /(/, X(t), и(0) dt + o(f, X(t),«(/)) dW
u(t) = u(t,X(t))
H(t,x)
- X(t)
Рис. 22.2.1
812 Глава 22.2. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ
Обозначим через ©„(fy» A)(*))
множество пар dn =(/>(•,■), и(у)), гДе функции
р(;-) € С1, (О) , il(y) € £/„ И уДОВЛеТВОрЯЮТ
уравнению (22.2.3) с начальным условием
(22.2.2).
На множестве ©„(/о»А)(*))
определяется функционал качества управления
'1
Ж,)= J J f°(t9x9u(t,x))p{t9x)dxdt +
t0 в
+ J F(x) p(tux)dx y (22.2.10)
где функции /(/,*, w), /X*)
удовлетворяют условию полиномиального роста.
Требуется найти такой элемент */* =
= (/ (v),«* (v))e Ю„ (/0 , Ро (*))> что
/(</*) = min /Ю- (22.2.11)
V / dneDn(t0,p0(x)) * '
Функция и (у) € £/„ называется o/i/itii-
мольным управлением с полной обратной
связью.
Для определения оптимального
управления с полной обратной связью служит
уравнение Беллмана для непрерывных стохастических
систем [6, 23, 27, 48].
Теорема 22.2.2. Если существует функция
ф(г,х)б С ' (Q), удовлетворяющая уравнению
Беллмана и граничному условию
ueU [ at fr{ oXj
z i=[j=\axiaxj J
«pfo.x) =-/•(*) Vxe£, V(r,x)eQ,
(22.2.12)
и управление и (у) € £/„ , удовлетворяющее
условию
W*(,,x) = argmaxf£^^/)(/,*,«)+
«6У [£f Эх,-
то и (t, x) является оптимальным
управлением с полной обратной связью.
Уравнение Беллмана является
нелинейным дифференциальным уравнением с
частными производными второго порядка.
Структура управления определяется в результате
максимизации выражения в фигурных
скобках по управлению. Минимум функционала
достигается для любой начальной плотности
вероятности Ро(х). Если начальная
плотность вероятности дельтаобразная: Pq(x) =
= Ь(х - Xq ), то минимум функционала
достигается для любого начального состояния
х0.
Замечания. 1. Если обозначить ф (t,x) =
= - ф (/, х), то уравнение Беллмана можно
переписать в эквивалентной форме:
. |эФБ(>,х) «эФБм
mm-i —-+ > —-f:(t,x,u)+
««={/[ dt j^ Эх,- ■"***'
q>B(t{,x) = F(x) VxeB, V(t,x)eQ.
2. Решение задачи синтеза оптимальных
линейных регуляторов для модели объекта
управления (22.2.7) и функционала (22.2.8)
требует применения соотношений (22.1.15),
(22.1.16), т.е. оптимальные регуляторы для
линейных стохастических и
детерминированных систем с квадратичным функционалом
совпадают.
3. Для многих практических задач
удобно использовать функционал обобщенной
работы, упрощающий однократное решение
проблемы синтеза регуляторов [24].
4. Алгоритм синтеза оптимального
управления с полной обратной связью по
форме совпадает с изложенным в п. 22.1.2.
Пример 22.2.2. В задаче
dX = u{t)dt + 4^d\V , Х(0) = Х0,
J=±jx2p(T,x)dx,
R
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С НЕПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 813
где XeR, \и\<(/1ШХ, te[0;T]; a, Т,
UmuX — заданные положительные числа,
требуется найти оптимальное управление
и (/, х) с полной обратной связью.
Сравнивая с общей постановкой задачи,
имеем: f(t,x,u) = и , а(/, х,и) = л[а ,
1. Выписываем уравнение Беллмана и
граничное условие:
. ЫБ{1,х) ЭФБ(/,х)
mm {—^—-+—^—-и+
|''|£С/тах| df
Эх
1Э2фьМ
2 Эх
+—
» 2
а =0, Фь(7\х) = ^х
2. Находим структуру оптимального
управления из условия минимума выражения
в фигурных скобках: и (t,x) = -UmuXx
ГэФБ(/,х)1
х sign <
дх
3. Подставляем найденное выражение в
уравнение Беллмана:
Э<рБ(/,х)
dt
V„
Э<рБ(/,х)
Эх
2 Эх2
<рБ(7\х) = 1х2.
4. Решение уравнения является четной
по х функцией и при х > О может быть за-
°°г
писано в форме срБ (/,*)= Г — y2p(t,x-y)+
+ y(y)p(t,x+y)\dy, где
*и,~7М7^) Р[ 2e(7--/)
4a
2a"
Искомое оптимальное управление с обратной
связью: и (t,x) = - Umax sign*.
22.2.3. Нахождение оптимального
управления с неполной обратной связью.
Поведение модели объекта управления
описывается стохастическим дифференциальным
уравнением (22.2.1), где X — вектор
состояния системы, X = [X , X ) е R" , Х{ =
= Иь-Д/и) > X = (Хт+1,...,Хп) ,
О < т < п ; и — вектор управления, и е U с
с Л9, {/ - некоторое заданное множество,
t е Т = [/q , t\ ], 71 — промежуток времени
функционирования системы, моменты времени
/q и /| заданы. Начальное состояние Xq
определяется плотностью вероятности (22.2.2).
Предполагается, что о компонентах
вектора X е Rm текущая информация известна,
а о компонентах вектора X е Rn~m
отсутствует. Обозначим: В = R" , В{ = Rm ,
B2 = R"-f», О = (/0,/|)хЛя.
Предполагается, что при управлении
используется информация только о времени t
и о компонентах вектора X , т.е. управление,
применяемое в каждый момент времени
t e T, имеет вид управления с неполной
обратной связью u(t) = и (t9X\t)) (рис. 22.2.2).
Число т , 0 < т < п , определяется
условиями информированности. При т = п имеется
информация о всех координатах вектора X,
т.е. система (см. рис. 22.2.2) будет системой с
полной обратной связью, а при т = О —
системой, разомкнутой по состоянию. В
последнем случае рассматривается так называемое
программное управление u{t) .
Множество допустимых управлений с
неполной обратной связью Ъ1 т образуют
функции и(-,-):ТхВ\ -> U , такие, что для всех
/ = 1,...,я;у = 1,...,* функции f"{\t,x) =
= fi(t9x,u(t,xl)),oiju(\t9x) = oij(t9x,ii(t9x1))
удовлетворяют условиям, при которых
решение уравнения (22.2.1) существует,
единственно и является непрерывным марковским
процессом.
Обозначим через ©,л(чэ> РоМ)
множество пар dm = (/?(•, •), и( ■, •)), где функции
814 Глава 22.2. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ
X(t0)
■Х0 I
W(t)
*dX = f(ttX(t),u(1))dt + a(t,X(t),u{.t))dW
u{t) = u(t,X\t))
X(t) = (Xx(t),X\t))
u(t,xl) f
X\t) = (Xy{t) jr„,(0)r
Ойтйп
Рис. 22.2.2
1 ►
1 /K'o>*)
01
u(t,xl;p(.))
P(*,x)
4
—^
u(t,xl) = u(t,xltp(t,))
Рис. 22.2.3
/>(.,.)€ С1'2(Q), u(,)eUm и удовлетво- заДанной начальной плотности вероятности
ряют уравнению Фоккера-Планка-Колмого- порождает управление u\-,)e<Um, т.е. если
имеется решение р (/, х) уравнения (22.2.3)
совместно с и = и (/, х ; />(•)) для
произвольной начальной плотности вероятности
p(t0,x)eP,To и\г,х1,р*())=и*(Г,х[).
Требуется найти такую синтезирующую
функцию u*(t,x[,p()), что
j{p%x\m%x*;p%.))) =
min J(dm) (22.2.15)
dftte<Dfn(t0,p0(x))
рова (22.2.3) с начальным условием (22.2.2).
На множестве ^(/о.РоМ)
определяется функционал качества управления
t\
'M*)=J J /0(r,p(/,xin(f>xl))ifaA +
+ f,(p(/|fx)), (22.2.13)
где/°(/,aw) :TxR+xU ->R, F(p()):
: P -* R — заданные непрерывные функция и
функционал, /?+ = [0, ©о], р(х) = /?(/, х) при
фиксированном Г.
Требуется найти такой элемент dm =
-(р*(-,-)У(-,-))еЮж(4,,Л(х)),-
Vp0(x)eP.
что
'Kb..»
min /(О- (22.2.14)
/л<=~ш('(Ь/>о(*))
Таким образом, проведена редукция
исходной стохастической задачи к
детерминированной задаче управления решением
уравнения с частными производными (22.2.3), что
отражено на рис. 22.2.3.
Здесь роль новой модели объекта
управления играет уравнение (22.2.3), а состояние
Одновременно рассматривается более описывается функцией p(t,x). При решении
общая задача нахождения так называемых on- задачи (22.2.15) следует иметь в виду наличие
тимальных синтезирующих функций вида ДВух уровней определения управления
модеме, х1 ;/>()): F* ^i >< P->U , являющихся лью объекта (22.2.1). Управление на схеме
х ' (см. рис. 22.2.3) для каждой начальной плот-
функциями от / , х и функционалами от ности вероятности p(t0,x) порождает опти-
плотности вероятности. Предполагается, что w/ \
каждая из них (при фиксированном т) для мальное , управление и (/, х ) в задаче
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С НЕПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 815
(22.2.14), которое затем используется в схеме ния u*(/) ^ каадой начальной
(см. рис. 22.2.2) для управления траекториями ^
исходной системы. плотности вероятности p(tQ,x)eP. Из
Теорема 22.2.3. Если существуют функция (22.2.16) следует уравнение Р. Мортенсена:
S(t, /?(•)) el и управление и * (г, х{ ;/>(•)), г г ,
удовлетворяющие уравнению и граничному уело- —V »А // + тах Г I^м —V >Р\')) р/х\ _
вию Э/ г/еС/ J [ L *K*) J
ЭД(/,р(х))
а/
■j
max
J К
(Л/Кх),«>|
'М(/,/>(-))
5/>(х)
-f°(t,p(x)
,u)idx = 0,
(22.2.17)
rfxHdx:1 =0,
S(/i,/>(x)) = -F(/*x)).
*p(x)-f°(
2. Если т-п (имеется полная текущая
(22.2.16) информация о векторе состояния), то соот-
, чч „, , чч , чч ^ л ношения (22.2.16) записываются в виде
5(/ь/Кх)) = -^(р(х)), V(t,p(x))eTxP
VpWeP,
то выполняется условие (22.2.15).
Здесь Л*'[<р(г, х)] — сопряженный опера-
&У(/,/К-))
т,*-))
Ьр{х)
тор, а
М*)
— вариационная (функ-
i£W> + [maxf,tf
-f°(t,p(x),u)idx = 0 , (22.2.18)
S(tbp(x)) = -F(p(x)).
циональная) производная, Z - класс
функций, непрерывных на ТхР, непрерывно Решение данной задачи определяет оп-
дифференцируемых по / и имеющих непре- тимальную синтезирующую функцию
рывную вариационную производную по и* (/, х; р( )): Т х Я" х Р -> U , порождаю-
р(х), принадлежащую C,,2(Q). щую для каждой начальной плотности веро-
Замечания. 1. Если m = 0 (текущая ин- ятности p(t0,x) соответствующее оптималь-
формация о векторе состояния отсутствует), */# л „ „ « елптоли
^к к Ju•7/, ное управление и и, х) с полной обратной
то решается задача поиска оптимальной син- 3 v ч '
* связью,
тезирующей функции u (t\p()): Гх для нахождения оптимального управле-
xP->U , порождающей на решениях урав- ния ы*^) (решения задачи (22.2.14)) тре-
нения (22.2.3) оптимальные программные буется рещить систему уравнений [34, 40):
др(1
= A^\p'(f,x)], p\t0,x) = p0(x),
Э<р(/,х) = »//(/,/(/, х),и*(/,х'))
Э/ 6/>(х)
( ) = _5F(^x)) (222|9)
и)/,*1 Wargmax [ «
^эФ(/,х) ,., . |Д^а2ф(м) ,. v
,=l axi z i=i у=| ол' axj
x/(/,x)-/°(/,/(r,*>4*f2.
816 Глава 22.2. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ
где
Я(/,^,х),.#(/.х,))= J \\±M^-fi(t,xy(ty))+
в lL'=i 0Xi
p\Ux)-f(Up\ux\u%Adx:
+ J F(x)p(tux)dx =
В
Замечания. 1. Соотношения (22.2.19)
получены путем применения необходимых
условий экстремума. Поэтому если найдено
решение системы (22.2.19), то это еще не означает,
что пара dm оптимальна. = М
2. Метод решения задачи (22.2.14)
аналогичен методам решения задач управления
детерминированными системами с распреде- (22.2.20)
ленными параметрами [12, 17, 30, 45].
3. Если функционал (22.2.13) линеен по где непрерывные функции / (f,x,w):
плотности вероятности, т.е. имеет вид ^ n rr ni r>/ \ n n
TxBxU -> R, F(x): В -» R удовлетво-
h . ряют условию полиномиального роста, опти-
•'(flW = J J / ¥>*»Mv>* ))p(t,x)dxdt+ мальное управление u*\t,x) можно найти
'о В из системы
^ = -||-[/.('.--(-.«'))/м]4||^-Ь('.--(м'))/м]=
= Au"\p\t,x)}, рЪ,х)=ро(х),
+/°( ',*>«*( /,х')) = -^'()[Ф (/,*)]+ f0(t,Xy(t,x1)), <p(tl,x)=-F(x), (22.2.21)
i*\f,xlj= argmax Г
"s{/ в2
-f(t,x,u)
2^/лл,,«>411|^Ч<<,,,«>-
Piuxy)dx\ p%xy)= f ({ux) 2,
B2
условная плотность веро-
принципа максимума (22.2.6) для нахождения
где р \t,x Y у ^..„„.«,. .«^ж..^.« -~F~ оптимального программного управления
ятности. u*(t).
Если т = 0 (текущая информация о £сли w = п (имеется полная информа-
векторе состояния отсутствует), система ция 0 векторе состояния), то соотношения
(22.2.21) принимает форму стохастического длЯ общего случая преобразуются в уравнение
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С НЕПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 817
Беллмана для стохастических систем для
определения оптимального управления и (t,x)
с полной обратной связью.
4. Уравнения для синтеза оптимальных
линейных регуляторов при неполной
информации о состоянии [34, 39, 40] в предельных
случаях информированности о состоянии
принимают форму (22.2.9) или (22.2.15),
(22.2.16).
5. Задача нахождения оптимального
управления с незаданным временем
окончания процесса может быть решена в двух
постановках [34, 40]. В первой ищется
наилучший момент окончания процесса, во второй -
момент окончания процесса случайный и
определяется достижением заданной
поверхности.
6. Если использовать понятие
обобщенного решения дифференциальных уравнений,
то ограничения на функции, входящие в
(22.2.1)—(22.2.3), можно ослабить. При этом
соотношения для нахождения оптимального
управления остаются справедливыми.
7. Среди задач с неполной информацией
о состоянии могут быть выделены задачи с
накоплением информации о состоянии.
Пусть, например, модели объекта управления и
измерений описываются стохастическими
дифференциальными уравнениями Ито:
dX = [A{t)X{t)+B{t)u(t]\dt+c{{t)dW{i
*('о) = *0. (22.2.22)
dY = C(t)X(t)dt+o2 (0 d\V2 , У(/0) = 0,
где X - вектор состояния, X е Rn; Y -
вектор измерений, Y e Rm ; время t e T =
= [fo>*lb моменты времени fy , /j начала и
окончания процесса заданы; матрицы A(t),
B(t), C(t), 0\ (t), о2 (t) имеют размеры
соответственно (пхп), (nxq), (mxn),
(nxk), (/их/), а их элементы непрерывны
на Т ; на управление ограничений не
наложено, ueRq; W[(t), W2(i) "Независимые
стандартные винеровские случайные
процессы, начальное состояние Xq определено гаус-
совской плотностью вероятности с
математическим ожиданием /я0 и ковариационной
матрицей Щ , начальное значение вектора
измерений равно нулю.
Обозначим: Y/Q = {У(т), t0 < т < /},
R{(t) = c{(t)cl(t), R2(t) = o2(t)ol(t).
Предполагается, что при управлении в
момент времени / используется информация
Y! о всех измерениях, производимых с
момента tQ .
Множество допустимых управлений
образуют функции u(t) = и (/, Y/Q), зависящие
от предыдущих измерений, причем \fteT
u(t) € Rq, при которых система (22.2.22)
имеет единственное решение (X(t),Y(t)) .
Требуется найти управление и (f, Yf J
из множества допустимых, обеспечивающее
минимум функционала (22.2.8).
Теорема 22.2.4. Оптимальное управление
и*(/, YJ ) в задаче (22.2.22), (22.2.8) имеет вид
u{t) = u[l,Y;o) = Q-\t)BT{t)K2{t)X{t),
(22.2.23)
K2{t) = -AT(t)K2{t)-K2(t)A{t)-
-K2(t)B(t)Q-l(t)BT(t)K2(t)+S(t),
*2('i) = -A;
dX = \A(t)X(t)+B{t)u(t)\dt+
+K{t)[dY(t)-C(t)X(t)dt], X(t0) = m0;
m~*(t)cT№l(t)-
Г = АГ + ГАТ - ГСТЩ1СГ + R{,
где X(t) = M\x(ijpf \ - оценка вектора
состояния модели объекта управления по
результатам наблюдений, K2(t) - симметрическая
матрица коэффициентов усиления
оптимального регулятора, удовлетворяющая уравнению
818 Глава 22.2. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ
(22.1.16), Kit) - матрица коэффициентов иии- ТогДа искомое оптимальное управление
является функционалом от апостериорной
усиления фильтра размера (пхт), r(t) = плотности вероятности и находится в резуль-
Р г1 тате решения нелинейного уравнения в ва-
[jf(0-i(0][jr(/)-i(0] -
= л/
ковариационных производных второго порядка
[41].
Пример 22.2.3. В задаче
риационная матрица ошибки оценивания.
Оптимальное управление (22.2.23) с
накоплением информации является
функционалом измерений, так как оценка вектора X(t)
зависит от Y! . Здесь последние три
уравнения являются уравнениями фильтра Калмана,
обеспечивающего нахождение оптимальной
оценки вектора состояния модели объекта
управления с минимальной нормой
ковариационной матрицы ошибки оценивания, а
остальные соответствуют случаю определения
оптимального управления линейной детерми- требуется найти оптимальное управление
нированной системой при полной информа- t, v
ции о векторе состояния. Задачи синтеза оп- и и,^о)-
тимального управления и оптимального
фильтра можно в данном случае решить
независимо, поэтому теорема 22.2.4 называется
теоремой разделения [3, 10, 11, 23, 33, 44].
Структура оптимальной системы с
накоплением информации, где по измерениям
проводится оценка вектора состояния и ее
использование в управлении, изображена на
рис. 22.2.4.
8. В задачах (22.2.14), (22.2.15)
априорная плотность вероятности p(t9x) играет
роль "информационного состояния",
полностью описывающего поведение динамической
системы. При решении более общей задачи
оптимального управления нелинейным
объектом управления с нелинейными измерениями
эту роль играет апостериорная плотность
вероятности p(t, х | Y(x), /0<x<O,
изменение которой описывается уравнением Дунка-
на-Мортенсена-Закаи нелинейной фильтра-
dX = u(t)dt + d\V{i X(0) = X0,
щ -i» D§ = 2,
dY = X{t)dt + dW2, У(0) = 0,
y-A#|lj«2(/)* + ljr2(l)J
Сравнивая с (22.2.22), (22.2.8), имеем
A(t) = 0, B(t) = l, C(0 = 1, 0,(/) = l,
о2(/) = 1, 5(0 = 0, (3(0 = 1, Л = 1, 4,-0,
/,=1, Л,(0 = 1,Л2(0 = 1.
Выпишем соотношения (22.2.23):
и>)=«'(лг0')=*2(')*(')>
dX = u*(t)dt+K(t)\dY(t)-X(t)dt\,
*(0) = 1,
K2=-Kl, ЛГ2(1) = -1, Щ=Щ,
Г = -Г2+1, Щ = 2.
1—»
J X(t0) | WW
dX^[A(t)X(t) + B(t)u0(t)]dt + ai(t)dWt
Модель объекта управления
I Y(t0) = 0
i™
dY = C(t)X(t)dt + <s2(t)dW2(t)
Модель измерений
\Ш-щ
«*(')
Ч"'(О = Qr\t)BT(t)K2(t)X(t)}r\ dX = [A(t)X(t) + B(t)u*(t)]dt + K(t)[dY-C(t)X(t)dt]H
Оптимальный регулятор
Оптимальный фильтр
Рис. 22.2.4
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ
819
Отсюда K2(t) =
1
t-2
Г(0
3 + е
-it
3-е-2*'
соотношения для оптимального регулятора и
фильтра имеют вид
dX = u\t)dt + ^^[dY{t)-X{t)dt\,
i(o) = i.
Глава 22.3
СИНТЕЗ ОПТИМАЛЬНЫХ ДИСКРЕТНЫХ
ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
22.3.1. Нахождение оптимального
программного управления. Поведение
модели объекта управления описывается
разностным уравнением
x{k + \)=f(k,x{k\u(k)\ * = 0Д,...,ЛГ-1,
(22.3.1)
где х — вектор состояния системы, х е R" ;
и — вектор управления, ие U(k)c:Rg,
U (k) — некоторое замкнутое выпуклое
множество допустимых значений управления;
к — дискретное время, keT = [09\9---,N -\],
число шагов TV задано, f(k,x,u):TxR"x
x(j(k)->Rn — непрерывно
дифференцируемая вектор-функция, f(k, x,u)= (/j {к, х, и\
...,/„(*,*> "F •
Начальное состояние системы (22.3.1)
задано
гДх(Л0)=0, / = 1,..,/, (22.3.3)
где 0</<я, функции Г,(х) - непрерывно
дифференцируемы; система векторов
{ЭГ(-(х(Л0)/Эх„...,ЭГ,Ш))/*<Л ''=!.•••>/.
линейно независима Vx(N)e R" .
Предполагается, что при управлении
используется информация только о дискретном
времени к, т.е. применяется так называемое
программное управление (рис. 22.3.1).
Последовательность векторов w(0),w(l),
...,u(N-l) называется управлением и{), а
последовательность x(0),x(l),...9x(N),
определяемая уравнением (22.3.1) с начальным
условием (22.3.2) и управлением и(), -
траекторией х().
Множество допустимых управлений 1А$
образуют управления «(•), при которых для
заданных начальных условий (22.3.2)
траектория системы (22.3.1) удовлетворяет условию
(22.3.3), причем u{k)el/{k)9 £ = 0,1,..., N-l.
Множество допустимых процессов
D(0,Xq) определяется как множество пар
d = (jcQ «(•)), включающих траекторию х{) и
управление wQe^/q» удовлетворяющих
уравнению (22.3.1) с начальным условием
x(0)=Xq и конечным условием (22.3.3).
На множестве D(09Xq) определяется
функционал качества управления
l(d)=^f°(k9x(lcU(lc)hF(x(N)), (22.3.4)
где /°(&,x,w),F(x) - заданные непрерывно
дифференцируемые функции.
Требуется найти такую
х(0)=*о.
(22.3.2) <f=(x*QM'())e©(Mo),
Конечное состояние x(N) должно
удовлетворять условию:
/(</*)= mill 1(d).
de <D(0,x0)
пару
(22.3.5)
k
►
«(*)
u(k)
►
1 *o
x(k + l) = f(k,x(k),u(k))
x(k +1)
Задержка
x(k)
Рис. 22.3.1
820 Глава 22.3. СИНТЕЗ ОПТИМАЛЬНЫХ ДИСКРЕТНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
Задача (22.3.5) с функционалом (22.3.4) 3) выполняется условие трансверсально-
называется задачей Больца. Если в функцио- сти
нале (22.3.4) функция F(x(N))=0 , , п
(отсутствует так называемый терминальный ог\Х (N))+ ^Ч'ДТу^охД/у )=0 (22.3.8)
член), она называется задачей Лагранжа, а 7=1
если f°(k9x(k\и(к))= 0 (отсутствует «интег- при любых bxj(N), удовлетворяющих системе
рольный» член) — задачей Майера. .
Искомые элементы пары d* траектория м'г vwj=0, ' = !>••■»«»
x*0-U,x'(a...,x*(AO} и управление ьф(М))=0, / = !,...,/;
«*(•) = {н*(0),н*(Ц...,и*(ЛГ-1)j
называются соответственно оптимальной траекторией где ™Риа1<ии определяются следующим образом:
и оптимальным управлением. / • /„Л ^ Э/ус*^)) /^
Необходимым условием экстремума ог\х \1у ))- 2^ -ч охД/VJ ,
функционала в задаче (22.3.5) при некоторых у=1 J
дополнительных предположениях (см.
замечания) является дискретный принцип макси- / \ " ^Г (хЧЛО)
мума. dri{x*{N)) = 2^—'L ;bXj(N) ,
Теорема 22.3.1. Пусть на паре у'=1 J
d*=\x*{\u*{))e Ю(0, Xq ) достигается мини- . _ 1 ,
мум функционала. Тогда существуют не равные
нулю одновременно вектор-столбцы В формулировке утверждения система
Ч'(*)=(Ч>1(4...,4'л(*))7\ k = \,...,N, (2217) дается системой канонических
v / v iv /. /iv // уравнений, функция Я(А:,Т,х,и) - гомиль-
такие, что: . . . .
1)цриюшйаи* = 0,1,...,^-1 #«кц«я ташшшш, a *,(**..., УДА:), k = \,...,N -
I , s »/ч \ вспомогательными переменными.
H\k,V{k + \\x (k\u) достигает максимума Замечания. 1. Если в решаемой задаче
по управлению, т.е. ограничения (22.3.3) на правом конце траек-
/ „ ч ., . «, Л тории отсутствуют, то условие трансверсаль-
Н{к, 4>(к + \),х(к\и {к))= „ости (22.3.8)
= тжк)Н(кМк + 1\х*(к1и), (22.3.6) f Г 9f(x») | (уу)
где
7=1
Эху-
&Су(УУ)=0
л в силу произвольности вариации bx.(N)
Н(к^,х,и)^Мк,Х,и)-/Чк,х,и); приобретаетвид
2) функции **(•),Ч^) удовлетворяют 4'j(N)=- ^х ' J = l>->n' (22-3-9)
системе уравнений
2. Если в функционале (22.3.4)
**•(/: + l)=fj{k,x*(k\u*(k)), x*(0)=x0j, F(x(N))=0 и отсутствуют ограничения
(22.3.3), то условие (22.3.8) в силу произволь-
у = 1,..., я, к = 0,1,..., N - 1 , ности вариации §Xj(N) принимает форму
т ^_dHltMk + \U\kU4k))9 ^(7V)=0, у = 1 л. (22.3.10)
3. Если U(k)=Rq , то для нахождения
j = l,...,/i, A: = 1,...,7V - 1, максимума в (22.3.6) может быть
использовано необходимое условие безусловного экстре-
гДх*(/У))=0, / = !,...,/; (22.3.7) мума
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ
821
dHJfcMk + l\x*(kU)_Q
fc = 0,1,...,7V-1, / = 1,...,?, (22.3.11)
с проверкой соответствующих достаточных
условий.
4. Утверждение справедливо, если
множество U (к) выпукло, а гамильтониан
является вогнутой функцией по и .
Дискретный принцип максимума применим для
систем с выпуклой вектограммой [9, 43].
Вектограммой управляемой системы (22.3.1) в
точке (k,x(k)) называется множество
f(k,x,U(k)) значений функций f(k,x,u)
при фиксированных к и х, когда
управление и принимает все возможные значения из
U{к): f(k,x,U(k)h v( J(k,x,u).
ue U(k)
В общем случае дискретных систем
необходимые условия экстремума не совпадают
с дискретным принципом максимума и
изложены в [7, 43]. По сравнению с
приведенным утверждением в них условие (22.3.6)
заменяется условием
* = 0,1,...,ЛГ-1,
для всех ие U(k), т.е. гамильтониан
достигает в точке и {к) либо наибольшего значения
на множестве U(k), либо и (к) является
стационарной точкой (локальным минимумом
или максимумом, седловой точкой).
Алгоритм применения дискретного
принципа максимума. 1. Составить гамильтониан
Н{к^^и)=^^ fi{k,x,u)- f\k,x,u).
/=i
2. Найти структуру оптимального
управления из условия максимума гамильтониана
по управлению:
н(кМк + 1\х*{к\и*(к))=
= тах н(кМк + 1\х{к\и).
ие U(к)
3. Составить систему канонических
уравнений с заданными в задаче условиями:
x*(k + [)=fj(k,x*(k\u*(k)\ x*{0)=x0j,
у = 1,...,л, *=0Д,...,ЛГ-1,
ху{!с) дн[кМк + 1\х(к\и*(к))^
Э х:
Г/И#))=0, / = 1,...,/. (22.3.12)
4. Из условия трансверсальности (22.3.8)
или их следствий (22.3.9), (22.3.10) в частных
случаях постановки задачи определить
недостающие краевые условия для уравнений
системы (22.3.12).
5. Решить полученную краевую задачу. В
итоге определяется пара (х* (•),*/*(•)), на
которой может достигаться минимум
функционала (22.3.4).
Пример 22.3.1. В задаче
х(* + 1)= *(*) + «(*), х(0)=2, А: =0,1,
хе R\ ueR,
J=Z [u2(k)+x2{k)]-> min
требуется найти оптимальную пару
(х*(•),*/*(•)), на которой достигается минимум
функционала.
Сравнивая с общей постановкой задачи,
имеем: f(k,x,u)=x + и, f°(k,x,u)=u2 +x2 ,
F(x) = 0, U(k)=R, N = 2. Решается задача
Лагранжа.
1. Составляем гамильтониан Н{к,*¥,
х,и) = Ч,{х + и)-(и2 +х2).
2. Находим максимум гамильтониана
по управлению. Так как ограничения на
управление отсутствуют, можно применить
необходимые условия безусловного
экстремума (22.3.11):
ЪН{к^{к + \\х(к\и{к))_
ди
= Ч'(к + \)-2и{к) = 0. Отсюда и (к)= v '.
Найденное управление обеспечивает
максимум функции Н(к,ЧГ{к + \\х(к\и) по
управлению, так как удовлетворяются
достаточные условия экстремума:
д2Н(кМк + 1\х(кЫк))_ ^А
• ди2
822 Глава 22.3. СИНТЕЗ ОПТИМАЛЬНЫХ ДИСКРЕТНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
3, 4. С учетом (22.3.10) составляем
краевую задачу (22.3.12):
x*(* + l) = x*(t) + ^tiif х*(0)=2,
Ч{к)=Ч{к + 1)-2х*(к), У(2)=0.
5. Решение краевой задачи: х (0)=2,
«*(0)=-l,/(l)=l, и*(1)=0, Ч»(1)=-2,
х (2)=1 , 4/(2) = 0 дает искомую пару:
оптимальную траекторию х ()={2,l,l} и
оптимальное управление и (•) = {- 1,0 }.
Пример 22.3.2. В задаче
х{(к + 1)=х{(к)+и(к)9 х,(0)=2, *2(0)=1,
х2(к + 1) = 2хх(к) + х2(*), Л = 0,1,
/ = X|(2)+x2(2)-» min
требуется найти оптимальное программное
управление и (•) и соответствующую ему
траекторию х (•).
Здесь х = (х|, *2) € Л , управление
входит в правую часть разностного уравнения
линейно и ограничено по модулю: | и | < 1 ,
net/(*M-U], />(М,фО, ^(х) = х1+х2,
iY = 2, /,(*,jc,«)=jC| +и, f2{k,x,u)=
= 2xj + x2 , правый конец траектории
свободен. Решается задача Майера.
1. Составляем гамильтониан H{k,yVi
х,и)=Ч,] [х{ +w]+4/2[2x, + х2 ].
2. Так как имеются ограничения на
управление, находим условный максимум
гамильтониана по управлению. В данной
задаче гамильтониан линеен по и на заданном
отрезке изменения управления [-1,1], поэтому
структура оптимального управления имеет вид:
w*(A:)=arg тахН(к,х¥(к + \),х(к),и) =
\и\ < I
= sign4/,(A: + l).
3. 4. С учетом (22.3.9) составляем
краевую задачу (22.3.12):
*,*(* + !)=*,*(*)+sign V|(Jfc + l), Xj*(0)=2,
x*2{k + l)=2x*{(k) + x*2(k), x2{0)=lt
^(лЬ^л + О+г^л + О, ^(2)=-i,
^(^^(t + l), Ч*2(2)=-1.
5. Решаем краевую задачу. Решение:
х,*(0)=2, л£(0)=1, и»=-1;
*Г(1)=1; ^(1)=5,«*(0=-1,
4^(1)—3, Ч»2(1)=-1; х,*(2)=0;
хг(2)=7, Т,(2)=-1, Ч»2(2)=-1
дает искомую пару: оптимальную траекторию
*1*()={2,1,0}, *2()={l,5,7} и
оптимальное управление и (•)={- I,- l}.
22.3.2. Нахождение оптимального
управления с полной обратной связью.
Поведение модели объекта управления
описывается разностным уравнением (22.3.1).
Начальное состояние системы
x(0)=x0eRn (22.3.13)
заранее не задано и может быть любым.
Предполагается, что при управлении
используется информация о времени А: и о
векторе состояния х(к).
Множество <1Ап допустимых управлений
с полной обратной связью образуют функции
и(к, х): Т х Rn -> U(к), которые на
траекториях системы (22.3.1) для различных
начальных состояний (22.3.13) порождают
соответствующие допустимые программные управления
и(-)ейГ0>где \/кеТ u{k)=u(k,x{k))eU{k).
Применяемое в каждый дискретный
момент времени к е Т управление имеет вид
управления с полной обратной связью по
вектору состояния (рис. 22.3.2).
Множество допустимых процессов
D(0,x0) определяется как множество пар
d = (х{\ и{)), включающих траекторию х{) и
управление w()e 2/q , удовлетворяющих
уравнению (22.3.1) с начальным условием
х{0)=х0.
На множестве £)(0,x0) опРеДеляется
функционал качества управления
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 823
|дс(0)с,
*(* + !) = /(*,*(*),!/(*))
х(* + 1)
Задержка
х(к)
и(к) = и(к,х(к))
и(к,х)
х(к)
Рис. 22.3.2
А:=о Структура оптимального управления с
(22 3 14) полной обратной связью определяется в
результате поиска минимума в (22.3.18) по
где f°(k,x,u), F(x) - заданные непрерыв- управлению.
ные функции. Рассмотрим частный случай: синтез on-
Требуется найти такую функцию тимальных линейных регуляторов.
Математическая модель объекта
управления описывается разностным уравнением
х(к + 1)=А{к)х{к) + В{к)и{к),
*=0,1,...,ЛГ-1, x(0)=Xq, (22.3.19)
а функционал качества управления имеет вид
'=Х [xT(k)S{k)x{k)+uT{k)Q{k)u(k)\+
k=0
и (k, x)e t4n , что
/(</*)= min 1(d) Vx0eR", (22.3.15)
где d*=(x*(\ и*(•)=и*(•,**(•))). Функция
и (к,х)е(Ы„ называется оптимальным
управлением с полной обратной связью. Для
каждого начального состояния Xq из
множества R" она порождает соответствующую чЛх^ГЛОЛхСЛГ)] (22.3.20)
оптимальную пару, т.е. оптимальную траекто- L V / V J»
рию **(•) и оптимальное программное где S(k\A - неотрицательно определенные
управление и*{)еЩ. симметрические матрицы размера (пхп), а
Теорема 22.3.2 [9, 16, 26]. Оптимальное Q{k) ~ положительно определенная симмет-
управление и*(к, х)е Un определяется в рическая матрица (q x q).
результате решения уравнения Беллмана для Требуется найти управление и (к,х) с
дискретных детерминированных систем: полной обратной связью, минимизирующее
В(к х) - функционал (22.3.20).
V ' ' Теорема 22.3.3 [22, 33]. В задаче
= min \f°(k,x,u) + B(k + l,f(k,x,u))] (22.3.19), (22.3.20) оптимальное управление
ueU(kf- J определяется соотношением
VxeR\ k = 0,l...,N-\, (22.3.16) и*{к,х)=-Цк)х, к = ОД ЛГ -1, (22.3.21)
с граничным условием г$е /,(£) - матрица коэффициентов усиления
B{N,x)= F{x) Vxe R", (22.3.17) регулятора размера (q x n)
где В{к,х) - функция Беллмана; 1(*)=[б(*)+ BT{k)P(k + l)^*)]"1 x
"*(*>*)= х*г(*И* + 1И*). * = 0Д,...,ЛГ-1,
= arg min [/°(fc, х, и) + £(fc + 1, f(k, x, w)) j (22 3 22)
ueU(k)
824 Глава 22.3. СИНТЕЗ ОПТИМАЛЬНЫХ ДИСКРЕТНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
а матрица Р(к) размера (пхп)
удовлетворяет уравнению
P{k)=S{k)+LT{k)Q{k)L{k) +
+ [A{k)-B{k)L{k)fP{k + l)[A(k)-B{k)L(k)],
k = N-l,...X0, P{N)=A. (22.3.23)
Замечание. Если в поставленной задаче
матрицы A,B,S,Q постоянны, а время
функционирования системы не ограничено
(N = + oo), то соотношения (22.3.19), (22.3.20)
принимают форму
х(к + \)=Ах(к)+Ви{к),
к =0,1,..., х(0)=х0,
/=Х I*7 (k)Sx(k) + "7\k)Qu(k)]->тт.
Тогда оптимальный регулятор будет
иметь вид [38]
u*{x) = -Lx, (22.3.24)
где L - постоянная матрица коэффициентов
усиления регулятора размера (q x п) и
необходимая для ее определения постоянная
матрица Р размера (п х п) удовлетворяют
соотношениям
l=[q + btpb]~{btpa ,
p = s + ltpl + [a-bl]t p[a-bl].
(22.3.25)
Если матрицы S,Q положительно
определены, то искомая матрица Р также
положительно определена.
Пример 22.3.3. В задаче
х(к + \)=х(к)+ и(к), х(0)=х0,
к = 0,1, xeR, ueR,
1(d) =£ [и2{к)+х2{к)] -> min
к=0
требуется найти оптимальный регулятор
и (к,х) и оптимальную траекторию для
*0=2.
Решается задача Лагранжа, А(к) = 1,
B(k) = l, S(k) = l Q(k) = l Л = 0.
1. Составляем уравнения (22.3.22),
(22.3.23):
L(k) = [ l + P(k + l) ]~{ Р(к + \),
Р(к)= 1 + £?(к)+ [1 - L{k)]2P{k + l),
* =0,1; />(2)=0.
2. Получаем решение уравнений:
/40=1, i(i)=o, />(о)=|, i(o)=i.
3. Находим оптимальный регулятор:
и*(0,х)=-1х, и*(1,х)=0.
4. Найдем оптимальное управление и
оптимальную траекторию для начального
условия л:(0)=2 . Для этого решим уравнение
модели объекта совместно с оптимальным
регулятором. Имеем:
х*(0)=2, х*(1)=1, х*(2)=1;
И»=«*(0,х*(0))= -1/(0)=-1, и*(1)=0,
что совпадает с результатами примера 22.3.1,
полученными при использовании дискретного
принципа максимума.
Пример 22.3.4. В задаче
х{к + \)=х(к) + и(к), х(0)=х0, * = 0,1...,
xeR, ueR,
/(</)=£ [х2{к)+и2(к)] -> min
требуется найти оптимальный регулятор
Особенность задачи заключается в том,
что время функционирования системы не
ограничено (N = + ©о). Составляем уравнения
(22.3.25), которые являются алгебраическими:
/, = —?—, P = \ + L2 +[\-LfP, где
L,P- числа.
Получаем решение уравнений. Из двух
- о 1 + ^ D 1-V5 л
решении: Р = и Р =
выбираем положительное, которому соответствует
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 825
величина L = . Находим оптималь-
3 + V5
ный регулятор (22.3.24): и*(х) = j=x,
3 +V5
А: = 0,1,-...
Замечание. Если модель объекта
управления описывается уравнением (22.3.19), а
модель измерений - соотношением
y(k) = C(k)x(k), A; = 0,1,...,W-1, (22.3.26)
где у - вектор измерений, у е Rm, т < п ;
A(k), В(к), С(к) — матрицы размера
соответственно (п х п), (nxq) , (тхп); на
управление ограничений не наложено, т.е.
и е Rq, а функционал имеет вид (22.3.20),
можно рассматривать задачу с накоплением
информации о состоянии. При этом начальное
состояние произвольное: х(0) е Rn, но
предполагается, что имеется некоторая точка
Xq , в окрестности которой находятся
начальные состояния. На практике эта точка
фактически локализует область функционирования
системы и задается из технических
соображений.
Требуется найти управление и(к, Yq ),
зависящее от всех доступных к текущему
моменту времени измерений Yq =
= {.У(0),.У(1), •,.К^)} так, чтобы свойства
синтезированной системы были близки к
достижимым в случае полной информации о
состоянии, в котором оптимальное
управление находится из (22.3.21)—(22.3.23).
Идея решения состоит в получении
оценки х{к) вектора состояния х(к) в текущий
момент времени к по результатам измерений
Yq и использовании этой оценки в
управлении (22.3.21) вместо х(к) . Тогда чем точнее
оценка х[к), тем ближе синтезированная
система по своим свойствам к оптимальной
при полной информации о состоянии.
Структура такой системы изображена на рис. 22.3.3.
В детерминированных системах процесс
получения оценок вектора состояния по
измерениям называется восстановлением или
наблюдением, а соответствующее устройство -
наблюдателем. Различают наблюдатели
полного и низкого порядков.
Если т = п и матрица С (к) не
вырождена для к = 0,1,..., N - 1, то вектор
состояния может быть найден по формуле
х(к) = С~{(к)у(к). В этом случае ошибка
оценки вектора х равна нулю, и
синтезируемая система совпадает с оптимальной при
полной информации о состоянии.
Уравнение наблюдателя полного порядка
имеет вид
x(k + l) = A(k)x(k)+B(k)u(k)+
+K(k)[y(k)-C(k)i(k)]9
*(0)=Х(5.
(22.3.27)
Оценивающее устройство имеет порядок
п по числу координат вектора оценок,
удовлетворяющего разностному уравнению (22.3.27).
Правильным выбором матрицы К(к) можно
х(0)
х(к +1)
х{к +1) = Л(*) х(к) + В(к)и(к)\-М
Задержка
х{к)
у(к) = С(к)х(к)
Лк)
Модель объекта управления
Модель измерений
и'(к)
и\к)ш-Щ)хЩ
х(к)
и
:<о) = *г
и(к)
Накопление информации
и выработка оценки вектора х(к)
Оптимальный регулятор
Наблюдатель состояния
Рис. 22.3.3
826 Глава 22.4. СИНТЕЗ ОПТИМАЛЬНЫХ ДИСКРЕТНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ
добиться уменьшения ошибки, т.е.
х(к) —> х(к) при А;-»+оо. Например, если
все матрицы в (22.3.19),(22.3.20), (22.3.26) не
зависят от к, удобно задавать матрицу
коэффициентов наблюдателя К так, чтобы
собственные значения матрицы А - КС
равнялись нулю. Тогда любое начальное
значение ошибки уменьшается до нуля самое
большое за п шагов.
Для стационарных систем, когда
уравнения (22.3.19), (22.3.26) имеют вид
х(к + \) = А х(к) + Ви(к), к = 0,1,...,7V-1,
Х(0) = Xq ,
(22.3.28)
у(к) = Сх(к), k = 0X...,N-l,
можно построить наблюдатели низкого
порядка, в которых для определения оценки
требуется решить разностные уравнения,
число которых меньше размерности вектора
состояния и равно (п - т). Предполагается,
что система вполне наблюдаема, т.е. выполне-
IT Т Т / Т \ "~~ 7
С А С ...\А ) С
Уравнение наблюдателя низкого порядка
имеет вид
x(k + l) = Ax(k) + Bu(k),
(22.3.29)
x(k + l) = Ax(k)+Bu(k)+
+K[y(k + l)-Cx(k + \)], х(0) = х*0,
где К - неизвестная матрица размера
(п х т). Здесь в начальном условии учтена
априорная информация о системе. Если
rang С = т , го матрица К выбирается из
условия Е -СК = О. Из соотношений
(22.3.29) можно исключить т уравнений и
понизить порядок наблюдателя.
Глава 22.4
СИНТЕЗ ОПТИМАЛЬНЫХ ДИСКРЕТНЫХ
СТОХАСТИЧЕСКИХ СИСТЕМ
22.4.1. Нахождение оптимального
программного управления. Поведение
модели объекта управления описывается
уравнением
X(k + \) = f{k,X(k)Mk\W(k)\
* = 0,1,...,#-1, (22.4.1)
где X — вектор состояния системы,
XeRn, Rn — n -мерное евклидово
пространство; и — вектор управления, ие
е U(к) с Rq, U(к) - некоторое заданное
выпуклое множество допустимых значений
управления; к — дискретное время,
k е Т - [0,1,..., N - 1], число шагов N
задано, /(*,x,u,w):TxRnxU(k)xRm -> Rn -
непрерывно дифференцируемая вектор-
функция; IV(k), к = 0,1,...,ЛГ-1 - т-
мерный случайный вектор с известным
законом распределения, описывающий
случайные внешние воздействия на объект
управления.
Начальное состояние системы (22.4.1)
Хф) = Х0 (22.4.2)
является случайным вектором с заданным
законом распределения.
Предполагается, что при управлении
используется информация только о дискретном
времени к, т.е. применяется так называемое
программное управление (рис. 22.4.1).
Множество допустимых управлений Wq
образуют управления и() = {w(0),w(1),...,
u(N - 1)}, где VA: е Т и(к) е U(k).
Функционал качества управления имеет
вид
J = MlN^f\k,X(k\u(k))+F(X(N))\,
(22.4.3)
где / (k, x,u), F(x) — заданные непрерывно
дифференцируемые функции, М — знак
математического ожидания, причем
осреднение проводится по множеству реализаций
случайного процесса Х[к), порожденного
случайными векторами Х(0) и W(k),
к = 0,1,...,N - 1, и допустимым управлением
и()е
Потребуется найти управление и*(-)е Wq*
обеспечивающее минимум функционала
(22.4.3). Искомое управление и*()е Я/q
называется оптимальным программным
управлением.
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ
827
«(*)
и(к)
1 хо | W(k)
X{k + \) = f{k,X(k),u(k),W(k))
Х(к + \)
Задержка
Х(к)
Рис. 22.4.1
Теорема НАЛ. Пусть на управлении
и (•) g Mq достигается минимум функционала
(22.4.3). Тогда выполняются условия:
1) при каждом к = 0,1,..., N - 1
м[н(к,^(к + \),Х(к)У(к),Щк))] =
= max M^H(k,x¥(k + l),X(k),u,lV(k))^y
(22.4.4)
где H{k,^,Xiu,W)=^i fXk,X,u,W)-
/=1
-/°(Л:,*,и);
2) функции ЛХ),^) удовлетворяют
системе
Ч*у(*) =
дЯ^У (А;+ !),*(£), w* (*),W(*))
dJf,
* = !,...,#-1, у = 1 л , (22.4.5)
Jfy(* + 1) =
ЭЯ(А:,^(А: + 1)Д(А:),^*(А:),^(А:))
Замечание. Теорема справедлива, если
гамильтониан является вогнутой функцией по
и , а несобственные интегралы в выражении
для нахождения М\Н(к,*¥{к+ \\Х{к\
и(к),)У(кщ равномерно сходятся при всех
к = 0,1,..., N - 1. В более общем случае
необходимые условия минимума функционала
(22.4.3) приведены в [4].
Рассмотрим частный случай:
оптимальное управление линейными системами.
Поведение модели объекта управления описывается
уравнением
X(k + l) = A(k)X(k)+B(k)u(k)+W(k),
A: = 0,l,...,iY-l, Х(0) = Х0у (22.4.7)
где ueRg, A(k),B(k) — матрицы размера
(пхп) и (nxq) , a W(k) -
последовательность взаимно независимых гауссовских
случайных п -мерных векторов,
некоррелированных с Xq и удовлетворяющих условиям:
М[Щк)] = 0, м[Щк) WT (/i)] = R{ (к) 5*„,
>кп
_ Jl, к = п,
"[0, кФп.
34*
= fj(kiX{k\u{k\W{k))4
fc = 0,l,...,iV-l, у" = 1 л;
Xj(0) = XOJ,Vj(N) = -
j = !,...,/!.
wWO)
ЭЛ\-
Здесь полагается, что. R\(k) -
симметрическая неотрицательно определенная
матрица размера (пхп). Начальное состояние
Х(0) = Л"о определено гауссовской
плотностью вероятности с математическим
ожиданием mQ и ковариационной матрицей Dq .
Функционал качества управления имеет
(22.4.6)
вид
Система уравнений (22.4.5) называется
системой канонических уравнений, функция
H{k,*¥,X,u,W) - гамильтонианом, а Ч*\(к),
..., ^п{к), к = {,...,N , - вспомогательными
переменными.
= М \±[ХТ (кЩк)Х(к)л
+иГ {к) Q{k) u(k)+XT (N) A X(N)]\, (22.4.8)
828 Глава 22.4. СИНТЕЗ ОПТИМАЛЬНЫХ ДИСКРЕТНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ
где S(k), А - неотрицательно определенные
симметрические матрицы размера (пхп), а
Q(k) — положительно определенная
симметрическая матрица (gxq), М — знак
математического ожидания.
Требуется найти оптимальное
программное управление и*()е ЧАц ,
минимизирующее функционал (22.4.8).
В поставленной задаче оптимальное
программное управление будет таким же, как
оптимальное программное управление в
следующей детерминированной задаче,
решение которой может быть получено с
помощью применения дискретного принципа
максимума (см. п. 22.4.1):
т(к + 1) = А(к)т(к) + В(к)и(к), т(0) = т0,
N-\
I = ^[mT(k)S(k)m(k) + uT (k)Q(k)u(k)\ +
+mT (N) A m(N) -> min . (22.4.9)
22.4.2. Нахождение оптимального
управления с полной обратной связью.
Поведение модели объекта управления
описывается уравнением (22.4.1), начальное
состояние системы Л^О) = Xq g Rn является
случайным вектором с заданным законом
распределения. Предполагается, что при
управлении используется информация о
времени А: и о векторе состояния Х(к).
Множество допустимых управлений с
полной обратной связью И„ образуют
функции и(к, x):TxR" -» U (к), которые на
траекториях системы (22.4.1) для различных
начальных условий порождают
соответствующие программные управления и(), где
Vfc g Т и(к) = и(к,Х(к)) е U(k).
Применяемое в каждый дискретный момент
времени к G Т управление имеет вид управления с
полной обратной связью по вектору состояния
(рис. 22.4.2).
Требуется найти допустимое управление
с обратной связью u*(k,x)e <Un,
обеспечивающее минимум функционала (22.4.3).
Функция и*(к,х)е<14„ называется
оптимальным управлением с полной обратной
связью.
Теорема 22.4.2 [22]. Оптимальное
управление и*(к9х)еЪ(п определяется решением
уравнения Беллмана для дискретных
стохастических систем
+Л/|"д(* + 1>/(*>х,и>^(*)))|х,и1}
VxeR", (22.4.10)
A:=0,l,...,iY-l,
с граничным условием
B(N,x) = F(x) Vx g Rn , (22.4.11)
где B(k,x) - функция Беллмана, М - знак
условного математического ожидания,
u*(k,x)= arg min \f°(k,x,u) +
+м\в(к + \,/(к,х,и,1У(к)))\х,иП
Vxe/J", Jk = 0,l,...,iV-l.
X(0) 6 Rn
fV(k)
X(k + l) = f(k,X(k)Mk),W(k))
Х(к + 1)
и(к) = и(к,Х(к))
и{к,х)
Задержка
Х(к)
^(AO-
Piic. 22.4.2
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 829
Структура оптимального управления с
полной обратной связью определяется в
результате поиска минимума в (22.4.10) по
управлению.
Замечания. 1. Решение проблемы
синтеза оптимальных линейных регуляторов в
задаче (22.4.7), (22.4.8) сводится к
применению соотношений (22.3.21)—(22.3.23) для
соответствующей детерминированной задачи.
2. Среди задач с неполной информацией
о состоянии могут быть выделены задачи с
накоплением информации о состоянии.
Пусть, например, модели объекта управления и
измерений описываются уравнениями:
X(k + l) = A(k)X(k)+B(k)u(k)+lV(k)9
Jfc = ОД W — 1, Х(0) = Х0, (22.4.12)
Y(k) = C(k)X(k) + V(k), k = 0,1,...,N - 1,
где X — вектор состояния, X е R" ; У -
вектор измерений, YeRm; A(t), B(t), C(t) -
матрицы размера соответственно (п х п) ,
(nxq) , (тхп), на управление ограничений
не наложено, т.е. ие Rq; W(k), V(k) -
последовательности взаимно независимых
гауссовских случайных п - и т -мерных
векторов, некоррелированных с Xq и
удовлетворяющих условиям:
Л/[И^)] = 0 , M[V(k)] = 0 ,
м[\У(к)\УТ(п)]=^(к)дкп;
M[v(k)VT(n)] = R2(k)bkn;
n[rWK»].o. иь.-^;;
Здесь полагается, что R\(k) -
симметрическая неотрицательно определенная
матрица (ихя), a R2(k) - симметрическая
положительно определенная матрица
(mxm). Начальное состояние Xq
определено известной гауссовской плотностью
вероятности с математическим ожиданием т$ и
ковариационной матрицей Dq . Обозначим
Y0k ={Y(0),Y(\),...,Y(k)} - вектор,
содержащий информацию о всех измерениях,
проводимых с начала процесса.
Множество допустимых управлений
образуют функции u(k) = u\k,YQ)t зависящие
от предыдущих измерений, причем
Vк = 0,1,...,N -1 и(к) е Rq . Функционал
качества управления имеет вид (22.4.8).
Требуется найти управление и \(c,Yq)
из множества допустимых, обеспечивающее
минимум функционала (22.4.8).
Теорема 22.4.3 [22]. Оптимальное
управление и \k, Yq J имеет вид
и\к) = u*(k,Y0k)) = -Цк)Х(к),
А; = 0,1,...,ЛГ-1, (22.4.13)
где
X(k) = X(k)+K(k)W(k)-C(k)X(k)\,
Х{0) = т0, * = 1,...,ЛГ-1;
Х(к + \) = А(к)1с(к)+В(к)и*(к),
Щ = щ, к = 0,1, ...,7V- 2;
К(к) = Г(к)СТ(к)[с(к)Г(к)СТ(к) + R2(k)jl,
Г(к + \) = А(к)г(к)Ат (к)+ Rt (*),
Г(0)=Я0\ А;=0,1,...,ЛГ-2;
Г(к) = Т(к)-Г(к)Ст(к)х
х\с(к)г(к)Ст (*)+ R2 (*)1 С(к)Г(к),
А: = 1 ЛГ — 1 ;
Цк) = [<2(к) + Вт{к)Р(к + 1)^)]"' х
х5г(А:)/>(А: + 1)4А:), Л = ОД W — 1 ,
P(k) = S(k)+LT (k)Q(k)L(k)+
+ [/*(*) - B(k)L{k)f Р(к + 1)[Л(А:) - *(*)£(*)],
830 Глава 22.4. СИНТЕЗ ОПТИМАЛЬНЫХ ДИСКРЕТНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ
k = N-l..., 1,0,
P{N) = A ,
X(fc) = Af JA^AjyQ \ — апостериорная оценка
вектора состояния модели объекта управления по
результатам наблюдений, Х(к) — априорная
оценка вектора состояния Х(к) до проведения
измерения Y(k), К (к) - матрица
коэффициентов усиления фильтра размера (пхт),
г(к) = м\ \х(к) - Х(к)\ \х(к) - Х(к)Т 1 -
ковариационная матрица ошибки z(k) =
= X(k) - X(k) априорной оценки X[k),
Г(к) = М\\x(k) - X(k)]\x(k) - X(k)]
ковариационная матрица ошибки е(А;) =
= X(k) - X(k) апостериорной оценки X(k)
после проведения измерения Y(k), L(k) —
матрица коэффициентов усиления регулятора
размера (q х п), Р(к) - матрица размера
(пхп).
Первые пять уравнений являются
уравнениями фильтра Калмана для дискретных
линейных систем, обеспечивающего
нахождение оптимальной оценки вектора состояния
модели объекта управления с минимальной
нормой ковариационной матрицы ошибки
оценивания, а два последних соответствуют
случаю определения оптимального
управления линейной дискретной
детерминированной системой при полной информации о
векторе состояния (см. п. 22.3.2). Задачи
синтеза оптимального линейного регулятора и
оптимального фильтра можно в данном
случае решить независимо, поэтому теорема
22.4.3 называется теоремой разделения.
Структура оптимальной системы с
накоплением информации о состоянии, где по
измерениям производится оценка вектора
состояния и ее использование в управлении,
изображена на рис. 22.4.3.
Пример 22.4.1. В задаче
X(k + \) = X(k) + u(k) + W(k), Х(0) = Х0,
£ = 0,1,2, X eR; ueR, R{(k) = l;
Y(k) = X(k) + V(k), YeR, R2{k) = l,
m0 = 1, D$ = 2 ,
требуется найти оптимальный регулятор с
накоплением информации.
Сравнивая с общим случаем, имеем
Л(*) = 1, Д(*) = 1, C(*) = l, Q{k) = U
S(k) = 1, А = 1, N = 3.
1. Находим оптимальный линейный
регулятор для соответствующей
детерминированной задачи
х{к + 1) = х(к) + и(к), х(0) = х0,
А: = 0,1, 2,
2
/ = £[и2(£) + х2(к)] + х2(3) -> min .
Составляем уравнения (22.3.22), (22.3.23):
L(k) = [l + P(k + l)]~{P(k + l),
Р(к) = 1 + L{kf + [1 - L(k)]2P(k + 1),
А: = 0,1,2; Р(3)=1.
Получаем решение уравнений: Р(3) = 1,
Л2) = |, Д2) = 1, Л1)-|, Д1) = |,
21 8
/40) = ■— , ДО) = — . Оптимальный линей-
13 13
ный детерминированный регулятор (22.3.21)
определяется соотношениями: и (0,х) = —-х,
«*(1,х) = -уХ, и'(2,х) = ~х.
2. Синтезируем оптимальный линейный
фильтр:
АГ(*) = Г(*)[г(*)+1]~\ к = 1,2,
Г(к + 1) = Г(к)+1, T(0) = D$ =2, £ = 0,1,
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ
831
I *(0) I
Щк)
г—И Модель объекта
Х(к + 1)
Задержка
Х(к)
У(к)
Модель измерений
Y(k)
и\к)
и-(к) = -Цк)Х(к)
Х(к)
Х(0) = щ
иЧк)
Накопление информации
и выработка оценки вектора Х(к)
Оптимальный регулятор
Г (к) = Г(к)- Г (к) \г(к)+\\ Г (к),
Г(0) = Д*=2, * = 1,2.
Решение: Г(1) = 3, Г(1) = -, Г(2) = -,
4 4
4 11
3. Согласно теореме разделения
оптимальное управление с накоплением
информации находим по формуле (22.4.13):
и*(0) = -у^(0) = -А; и*(1) = -|х(1),
и (2) = --i*(2).
Уравнения блоков, входящих в
замкнутую схему, изображенную на рис. 22.4.3,
имеют вид
Х(к +1) = Х(к) + и*(к) + W(k), Х(0) = Х0,
к = 0,1,2,
Y(k) = X(k) + V(k), к = 1,2,
Х(к +1) = i(A;) + «*(*), * (0) = щ = 1,
* = <U,
£(£) = *(*)+ВД \y (k)- X(k)\,
i(0) = mo = l, к = 1,2,
*0)-f ^2)=it-
3. Оптимальное управление нелинейной
дискретной стохастической системой с
накоплением информации о нелинейных
Оптимальный фильтр
Рис. 22.4.3
измерениях зависит от апостериорной
плотности вероятности, играющей роль
"информационного состояния". Такое
управление обладает дуальным эффектом [47], т.е.
влияет как на вектор состояния, так и на
будущую неопределенность, связанную с ним.
Глава 22.5
СИНТЕЗ ОПТИМАЛЬНЫХ
НЕПРЕРЫВНО-ДИСКРЕТНЫХ
ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
22.5.1. Нахождение оптимального
программного управления. Поведение
модели объекта управления описывается
совокупностью дифференциальных и
разностных уравнений
x(t) = f(t,x(t),y(tk),u(t)), h £'<'*+i.
(22.5.1)
У(*Ы ) = #('*+1 > *('*+1 )> y{fk )> Ч'*+1)) >
£ = 0,1,...,W-1,
где х,у — векторы состояния соответственно
непрерывной и дискретной частей системы,
хе Rn,ye Rm\ u,v - векторы управления
соответственно непрерывной и дискретной
частями, ие U сЛ*,ve V с Rs, U и V -
заданные множества допустимых значений
управления; t — время, te Т = [/o>(w)> ^ ""
промежуток времени функционирования
системы, на котором вьщелены моменты
tk, k =0,1,...,N-1, разбивающие множество
Г на непересекающиеся полуинтервалы
7*=['*Л+1)> * = 0,...,ЛГ-1; f(t,x,y,u):
TxRnxRmxU->Rn, g(t,x,y,v):Tx
832 Глава 22.5. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНО-ДИСКРЕТНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ
х R" х Rm х V -» Rm - непрерывно диффе- Требуется найти процесс d* =
ренцируемые вектор-функции; x(tN) = = (**(•),/(.),w*(),/(•)) e Ю(Г0,х0,^0)> на
= x(tN - 0). Предполагается, что множество КОТором достигается минимум функционала
достижимости I \g(tk+i,x,y,v) выпукло для (22.5.3): l(d*) = min 1(d).
^v V ' de<D(t0,x0,y0) •
любых x,y и £ = 0,1,...,tY-1. Искомые элементы */ : траектория
Начальное состояние системы (22.5.1) за- */\ ,.*/\ f„ ,,* /# \ ,.*/* \1
дано ХУ)> У () = {Уо>У {*1)>->У Vn)] и управ-
x(t0) = x0 е Д\ y(t0) = y0eRm. (22.5.2) ление w*(), v* () = {v* (t{),...,v* (f^)}
называются соответственно оптимальной траекто-
Коненное состояние (*(*#), .v(Ov)) сис_ рией н оптимальным управлением.
темы произвольно. ТеоРема 11S] &9\ ПУС™ ™ ^пусти-
Предполагается, что при управлении ис- мом процессе d* = (**(•),/(•), м*(-), v*(-)) e
пользуется информация только о текущем * '
времени, т.е. рассматривается так называемое е ©(fo,Xo>.Vo) достигается минимум функцио-
программное управление. нша щ 5 3)_ Тогда существуют вектор.
Множество допустимых управлений Mq . .j
образуют кусочно-непрерывные функции фУнкции 44') = (4'l (') *М')) " л(') =
и():Г^£/, u{t)=u(t + 0), и последова- = (^...^(^, удовлетворяющие уравне-
тельности А:) = {^к)}к=г Ч'*)еК- НШШ
к = 1 N. = t ЭЯн(г,У(^х'(/),У>^»'(0)
Множество допустимых процессов '* ' Эх,-
©fe)f^bf>b) определяется как множество / = 1,...,я, / е 7Y , А; = 0,1,..., /V-1,
четверок */ = (jc(), v(), ы(), v()), включающих
траекторию jc(-) непрерывной части, после- х ' v
довательность ,(•) = {^)£, - траекторию "д^лСы).' (^^(^ЛМ
дискретной части, управление °xi
(ы(-), v())е 2/0 , удовлетворяющих уравне- / = 1,...,я, (22.5.4)
нию (22.5.1) с начальным условием (22.5.2).
На множестве ©(f0,x0, у0) определяет- . ЭЯН /,Ч«(г),х (t),y (tk),u (/)
ся функционал качества управления ч\)~ ^. '
yV-1
V п/ ч j = l,...,m, teTk,
f°(t,X(t),y(tk),u(t))dt+
i Чу ftw-0) =
+ F(x(tN),y(tN)), (22.5.3)
9ЯД (/A+1 ,T) {tk+i ),x* (tk+l),/ (/*), v* (fc+1))
y' = l,...,m
с условиями
где /0(/,х,У>и), f°(/,x,y,v), *(*,у) - За- .^ ^(/(^),/(^)) ^ . = ^ ^
данные непрерывно дифференцируемые <**/
функции. (22.5.5)
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ПОЛНОЙ ОБРАТНОЙ СВЯЗЬЮ 833
dF(x\tN)y(tN))
Л/(>#) = " 5 ' у = 1,...,/и,
такие, что в каждой точке непрерывности
управления и (/) и при всех k = Q,l,...,N -I
выполняются условия
u'(t) = argrrm. HH(t,4>(t),x'(t)y(tk),u),
teTk, (22.5.6)
v*('*+i) =
= arg max #д(tk+l, r\(tk+l),x\tk+{ ),/(/*), v),
где
Ян(г,%х^>и) = ^^-/;.(/>х>^и)-
/=i
f{t,x,y,u\
(22.5.7)
Яд (/,ть*. J%v) = ]T riy • £y (/,x,^,v)-
7=1
-£°(>,*,:K,v)
— гамильтонианы непрерывной и дискретной
частей системы (22.5.1) с функционалом
(22.5.3).
22.5.2. Нахождение оптимального
управления с полной обратной связью.
Поведение модели объекта управления
описывается системой (22.5.1), а начальное состояние
x(t0) = х0 € R" , д>(/0) = у о е Rm заранее не
задано и может быть любым.
Предполагается, что при управлении
используется информация о текущем времени и
о векторе состояния (х,у).
Множество допустимых управлений с
полной обратной связью 1Ап образуют
функции u(t,x,y):TxR" xRm ->U и v(t,x,y):
:{th...,tN}x Rn x Rm -» V, которые на
траекториях системы (22.5.1) для различных
начальных состояний порождают допустимые
процессы d = (*(),;kQ,h(),v()) e ©(*0.*<ьЛ))-
Требуется найти такие функции
(u*(t,x,y),v\t,x,y)} е Un , что
l(d*) = mill 1(d)
V / deD(t0,x0,yQ) V '
V(x0,y0)eR"xRm,
где ^^(/(^/(^^^Т'^О'^О)'
^(>^(-У(-)У (■))).
Пара (u*(t,x,y),v*(t,x,y)\ s Un
называется оптимальным управлением с полной
обратной связью. Для каждого начального
состояния {х$,Уо) из множества Rn x Rm это
управление порождает соответствующую
оптимальную четверку, т.е. оптимальную
траекторию [х (•),>> (•)) и оптимальное
программное управление (и (),v ()le £/0 • При этом
u\t)=u\t,x{t),y{tk)) VtzTk, v'(tk+l) =
-''{*ы>х(*к+№к))> k=0,\,...,N-l.
Теорема 22.5.2 [39]. Если существует
функция ф (/, х, у): Т х Rn x Rm -» R,
кусочно-непрерывная по t на Т при фиксированных
х, У, причем ф (/, х, у) = ф (/ + О, X, у),
частные производные которой по переменным t и
х существуют и непрерывны на Т х R" x Rm ,
за исключением конечного числа значений
tsT, и управление lu*(t9x,y),v*(t,x,y)) e
е (1Ап , удовлетворяющие условиям:
max
ueU
'at TT dx,-
-f°(t,x,y,u)[ = 0, t<=Tk,
4>(tN>x>y) = -F(x,y) V{*,y) eRn*Rm,
(22.5.8)
<p('*+i -0,х,у) = тах{ф(/л+| ,х,
#(>*+1 .*. J%v))-*° (/л+1 ,х,у, v)},
A; = 0,...,JV-1,
27 — 7706
834
Глава 22.6. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ СИСТЕМ
u(t,x,y) = aigmax|Y Э(р^х^/^)Х,у9и)-
-f\t,x9y,u)[, teTk,
V(x,y)eR"xRm,
** ('*+! ,x,y) = argmaxWr^ ,x,
veV l
g(*k+i ,x,y,v))-g° (tk+i ,x,y,v)},
A; = 0,...,W-1,
то управление (и {t,x,y\v (t,x,y)j с полной
обратной связью оптимально.
Решение задачи синтеза оптимальных
регуляторов для непрерывно-дискретных
систем [39] приводит к обобщению соотношений
(22.1.15), (22.1.16) и (22.3.21)-(22.3.23).
Глава 22.6
СИНТЕЗ ОПТИМАЛЬНЫХ
НЕПРЕРЫВНЫХ СИСТЕМ
ПО МИНИМАКСНОМУ КРИТЕРИЮ
22.6.1. Нахождение оптимального
программного управления. Поведение
модели объекта управления описывается
обыкновенным дифференциальным уравнением
x(t) = f(t,x(t),u(t),v(t)), x(t0) = x0, (22.6.1)
где х — вектор состояния системы, х =
т
= (*!,...,х„) е Rn, и - вектор управления
первого игрока (оперирующей стороны),
и е U с Rq ; v — вектор управления второго
игрока (противника), v e V с Rr ; t — время,
t e T = \t$,t\\ — интервал времени
функционирования системы, моменты /q начала и Ц
окончания процесса управления
фиксированы; f(t,x,uiv):TxRnxUxV->R"
-непрерывно дифференцируемая вектор-функция
/ = (/i.-.,/Jr.
Движение системы (22.6.1) происходит
под управлением двух сторон (или двух
игроков). Первая оперирующая сторона (первый
игрок) воздействует на систему, задавая
управление и , вторая оперирующая сторона
(второй игрок) влияет на систему, выбирая
управление v . Предполагается, что при
выборе управления каждый из игроков
располагает информацией только о времени t , т.е.
рассматриваются так называемые программные
стратегии управления.
Множества допустимых программных
управлений 11$ , <К0 образуют кусочно-
непрерывные на Т функции и0, v() со
значениями в множествах соответственно U,
V . Элементы множеств £/q » ^0 будем
называть программными управлениями
соответственно первого и второго игроков.
Предполагаем, что каждой паре (м(), v(-))
допустимых управлений м()е 2/0 > v0e ^o отвечает
единственная непрерывная
кусочно-дифференцируемая функция х : Т —> R" ,
удовлетворяющая почти всюду на Т уравнению
движения (22.6.1) при начальном условии
x(/q) = Xq. Эту траекторию движения будем
обозначать x(t)= x(t\ t0, x0, Ы0 vQ).
На множестве допустимых управлений
^0 х %) задается функционал качества
управления
/МЫ))= ) f%x{t\u{t\v{t))dt+F{x{h)),
'о
(22.6.2)
где / {t,x,u, v), F(x) — заданные
непрерывно дифференцируемые функции, а
x(/) = x(/;/0,x0,w(),v()) - траектория
движения, соответствующая управлениям и{) и
V0-
При выборе управлений игроки
руководствуются противоположными целями. Цель
первого игрока - минимизировать критерий
качества (22.6.2), цель второго -
максимизировать его. Функционал (22.6.2) называют
платой игры, т.е. первый игрок платит
второму /(ы0 v(-)) условных единиц. Первый
игрок стремится найти допустимое управление
и (•), минимизирующее плату игры при
самом неблагоприятном для себя выборе
стратегии v 0 вторым игроком (противником):
/,(«*(•)) = min /,(«(•)), (22.6.3)
м(-)е Щ
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПРОГРАММНОГО УПРАВЛЕНИЯ'
835
где /i(w()) - гарантированная плата первого
игрока второму при выборе управления !/(•):
IM))= max /(«(>(■)).
v()g <K0
Второй игрок преследует
противоположную цель, т.е. ищет допустимое управление,
максимизирующее показатель
/2(v*(.))= max /2(vQ), (22.6.4)
v()e <Vo
где ^(vQ) - гарантированная оплата второго
игрока, которую он получает при выборе
управления v(): /2(v())= mill l(u(\v()).
Показатели 7^ и /2 гарантированных
результатов игроков связаны неравенством [25, 36]:
min I\(u()) = min max l(u(), v()) >
//() U W/ /,(•) v() V W W'
> max min l(u(\v()) = max /?fv()).
v() //(•) V W W/ v() A W'
Предполагается, что имеет место точное
равенство
min max l(u(\v()) = max min l(u(\v(-)).
«(.) v(-) v w' w' V(.) «(.) v w v"
(22.6.5)
В этом случае говорят, что игра имеет седло-
вую точку.
Требуется найти допустимые управления
и (•) и v (•), удовлетворяющие условию
/fw*(),v*())= min max l(uC\v()) =
= »ax min /(«Q,vQ), (22.6.6)
v()er0 w()e2/0
т.е. доставляющие минимакс (и максимин)
функционалу (22.6.2).
Искомые функции и (•) и v (•)
называются оптимальными программными
управлениями, а значение /(w Qv (•)) в (22.6.6) -
целой игры.
Теорема 22.6.1. Пусть пара \и*(\v*()j
допустимых управлений удовлетворяет условию
(22.6.6), а х (•) - соответствующая этим
управлениям траектория движения системы
(22.6.1). Тогда существует вектор-функция
Ч>(/) = (Ч*! (г), ..., ¥„ (г)) , удовлетворяющая
уравнениям
*Д')—
ЭЯ(/,У(/),*'(/)У(г)У(/))
Эх,
/ = 1,...,я, /еГ, (22.6.7)
с условиями
Э/-(х*(/,))
f,('i) = ч "> / = 1 "• <2268)
оХ,-
такая, что в каждой точке непрерывности
функций и (/) и v (г) выполняется условие
max min я(г,ЧЧ/),**^),м, v) =
= я(/,у(/),^(0,^(0^Ф(0) =
= min max tf^fr),**^),!*,^, (22.6.9)
где
i=\
(22.6.10)
- гамильтониан системы, Ч/(/) - вектор
вспомогательных переменных.
Соотношения (22.6.1), (22.6.7)-(22.6.9)
представляют собой двухточечную краевую
задачу для нахождения оптимальных
управлений и оптимальной траектории. Эта задача
аналогична рассмотренной в п. 22.1.1.
Замечание. Условие (22.6.5)
существования седловой точки дифференциальной игры
отвечает ситуации равновесия, при которой
информированность каждого из игроков не
имеет ценности. Первый игрок может до
начала игры сообщить противнику свое
управление и (•), и при этом результат игры не
изменится. Такая ситуация складывается
далеко не во всех случаях. Условие
существования седловой точки гамильтониана Н по
допустимым значениям управлений и и v
выполняется, когда, например, переменные и и
v входят в уравнение движения раздельно,
т.е. функции / и /° представимы в виде:
f{t,X,u,v)=f](t,x,u)+f2(t,x,v),
27*
836
Глава 22.6. СИНТЕЗ ОПТИМАЛЬНЫХ НЕПРЕРЫВНЫХ СИСТЕМ
At,x,u9v)=f°%x,u)+f°2{t,x,v).
Пример 22.6.1. В задаче
x(t)=u{t)-v{t), х(0) = х0,
х е R, и е R, v е R, t e [0,l],
/=J [W2(0-2v2(/)]^ + ix2(l)
о 2
требуется найти оптимальные управления
и (•), v (•) и соответствующую им
траекторию х (•), на которых достигается минимакс
функционала.
Сравнивая с общей постановкой задачи,
имеем
/(/,x,w,v) = w-v, f°(t,x,u,v)=u2-2v2,
F(x) = ±x\ /0=0, /1=l,
£/ = /?, [/ = /?.
Составляем гамильтониан: H=yV{u-v)-
-\и — 2v l и находим минимакс
гамильтониана по переменным и и v . Так как
ограничения на управление отсутствуют, можно
использовать необходимые условия
экстремума:
¥L = 4>(t)-2u = 0; ^ = -4>(/)+4v = 0.
Решая систему, находим искомые опти-
1х
мальные управления и (t) = — , v (/) =
= —, соответствующую этим управлениям
траекторию: **(0 = М~Т *0 и ^енУ ИГРЫ
/ =
2x1
*(/)
Ч>(/)
Отсюда iT(/) = -^, /(/)= 4
Найденные управления отвечают седловои точке
гамильтониана, так как матрица производных
второго порядка (матрица Гессе)
<«"Но2:)"
вляется знаконеопределен-
ной. Записываем уравнения системы (22.6.7),
(22.6.8):
Пример 22.6.2. В задаче
i(/) = n(/)-v(/), x(0)=2, |к(0|<2,
| v(/) | < 1, 0 < t < 1,
/ = — х2(\) -» min max
2 W «0 v()
требуется найти оптимальные программные
управления игроков.
Сравнивая условия примера с общей
постановкой задачи, имеем
f(t,x,u,v)=u-v, /°(/,x,w,v) = 0,
/0 = 0, /, = 1.
Составляем гамильтониан: Я = Ч^м - v) и
находим структуру оптимальных управлений
игроков из условия (22.6.9). Если ^(t) < 0, то
м*(/)=-2, v*(/)=-l. Если Ч/(/)>0, то
и (t) = 2 , v (/) = 1 . Следовательно, и (f) =
= 2 sign Ч^/), v*(0 = sign ^(O.
Записываем уравнения системы (22.6.7),
(22.6.8):
x{t)= sign 4?{t), jc(0)=2, Ф(/) = 0, в
4>(l)=-x(l).
Если х(1)>0,то ЧУ(0<0, w*(0=-2,
v*(/) = -l, x(t)=2-t. Если х(1)<0, то
ЧУ(0>0, и*(0=2, v*(/)=l, дг(г)=2 + /.
Из двух траекторий x(t) = 2 ± t выбираем
траекторию x(t)=2-t, так как х (l) =
= 1 > 0 . Таким образом, получаем
оптимальные программные управления игроков
НАХОЖДЕНИЕ ОПТИМАЛЬНОГО ПОЗИЦИОННОГО УПРАВЛЕНИЯ
837
и (/) = -2 , v (/) = -1 ; оптимальную
траекторию х (t) = 2 - t и минимаксное (максимин-
ное) значение цены игры / = —.
22.6.2. Нахождение оптимального
позиционного управления. Поведение
модели объекта управления описывается
обыкновенным дифференциальным уравнением
(22.6.1), а начальное условие х(/0)= х0 е/?"
заранее не задано. Предполагается, что при
выборе управления каждый из игроков
использует информацию о времени t и векторе
состояния, т.е. рассматриваются так
называемые позиционные управления или управления с
полной обратной связью.
Множества Мп , Yn допустимых
управлений с полной обратной связью соответственно
первого и второго игроков образуют функции
u(t,x):TxRn ->U и v(t,x):Tx R" -»K,
которые для любых начальных условий
x(fb)=*o порождают траекторию х()
системы (22.6.1). и допустимые программные
управления н()е 2/0 , v()e Yq , такие, что
u(t)=u(t,x(t)), v(t)=v(t,x(t)) для всех
/€7\
Качество позиционных управлений
оценивается функционалом (22.6.2).
Требуется найти такие функции
u*(t,x)e 14п и v*(t,x)e <Vn , что
I\u*,v*) = min max I(u,v) = max min I(u,v)
V / ue%i„veV„ ' veYnueliH
(22.6.11)
при любых начальных условиях.
Функции и (t,x)e £//;, v (г,х)е У„
называются оптимальными позиционными
управлениями или оптимальными управлениями
с полной обратной связью.
Теорема 22.6.2 [25]. Если существует
функция <p(t,x), непрерывная вместе со своими
частными производными первого порядка,
удовлетворяющая уравнению Айзекса с граничным
условием
fd<p(f,x) ^. Эф(Лх),,
minmax<—^—- + > —*—Lfi(t,x,u,v)-
vzV /,е£/[ dt j?x дХ; Л '
VV^^)UmaxininfM^ +
V ' ueU veV[ dt
+ X^^//(^^v)-/V.«.v)Uo
V(t,x)eTxR",
<p('l ,x) = -F(x) VxeR", (22.6.12)
и управления и (/,*), v (t,x),
удовлетворяющие условиям
H(t,q>x(t,x),x,u*(t,x),v*(t,x)} =
= тахттЯ(/,фх(/,х),х,«,у) =
= тттахЯ(/,фх(/,хи,ы,у), (22.6.13)
где
H(t,q>x (t,x),x,u,v) = X-T^// С'*'"'Vb
/=1 d*'
-f°(t,x,u,v),
то дифференциальная игра имеет седловую
точку (22.6.11), а управления являются
оптимальными управлениями с полной обратной
связью, при этом цена игры определяется
равенством /(n*,v*)=-(p(/0,x0).
При решении задачи синтеза
оптимального управления на основе достаточных
условий в первую очередь определяется структура
управлений и (/,*), v {t,x) из условия ми-
нимакса (максимина) функции //(/,(f)x,x,H,v)
по переменным и и v . Искомые управления
выражаются через производные функции
(р(г,х). После подстановки найденных
выражений в (22.6.12) задача сводится к решению
дифференциального уравнения с частными
производными первого порядка. В результате
решения определяется функция (р(г,х), по
которой окончательно находятся оптимальные
управления игроков.
Замечания. 1. Основной недостаток
минимаксного подхода заключается в том, что
соответствующая ему стратегия, как правило,
оказывается слишком "осторожной". Это
объясняется тем, что решение выбирается из
расчета наихудшего сочетания неопределенных
838
Глава 22.7. ПРЕОБРАЗОВАНИЕ АФФИННЫХ СИСТЕМ
факторов. Устранить отмеченный недостаток
удается с помощью
минимаксно-стохастического подхода [31].
2. Процесс формирования позиционного
управления в условиях неопределенности
может быть усложнен неполнотой
информации о текущем состоянии. Выбор управления
должен быть нацелен на определение
конфигурацией и положением в пространстве
информационных областей в соответствии с
предписанными критериями [28].
Глава 22.7
ПРЕОБРАЗОВАНИЕ
АФФИННЫХ СИСТЕМ
22.7.1. Основные определения.
Нелинейные динамические системы. Систему
обыкновенных дифференциальных уравнений
x=F(x,t,u), (22.7.1)
где
xJf^ x = (xb...,x„)TeR",
и = {и{,...,ит)Т eR'",
F(x,t,u) = {F{(x,t,u\...,Fn(x,t,uf,
называют (л-мерной) нелинейной
нестационарной динамической системой с управлением и и
состоянием х или просто нелинейной
системой, a R'7 = {х} — ее пространством
состояний. Переменные Xj , ..., хп , в которых
записана нелинейная система (22.7.1), называют
переменными пространства состояний.
На состояния х нелинейной системы
могут накладываться ограничения, например,
в виде х е X с Rn . Тогда X называют
множеством допустимых состояний, а х е X —
допустимым состоянием. Часто эти
ограничения задают системой неравенств и уравнений,
например, с, (х) > 0, / = 1, р , dj (х) = 0 ,
Ограничения на состояния могут
зависеть от времени, т.е. иметь вид (х,/) е X , где
X — некоторое подмножество в расширенном
пространстве состояний Rn+ = {(х, г)} .
Ограничения на управления нелинейной
системы записывают в виде «g(/c Rm.
Кроме этих ограничений на значения
управлений предполагают, что управления как
функции времени принадлежат некоторому
классу функций, например, они являются
непрерывными или кусочно-непрерывными и
т.п. Управления, удовлетворяющие
оговоренным в постановке задачи ограничениям по
значениям и по гладкости, называют
допустимыми.
Если управление зависит только от
независимого переменного / (времени), т.е.
и = н(г), то его называют программным, а
управления, зависящие только от состояния
системы, т.е. управления вида и = ы(х),
называют управлениями в виде обратной связи
или просто обратной связью (стационарной).
Нестационарной обратной связью называют
управления и = ы(х,г), зависящие от
состояний и времени.
При фиксировании в системе (22.7.1)
управления (программного или управления в
виде стационарной или нестационарной
обратной связи) получается система
обыкновенных дифференциальных уравнений. Обычно
предполагают, что при фиксировании любого
допустимого управления эта система
обыкновенных дифференциальных уравнений в
рассматриваемом открытом множестве
удовлетворяет теореме Коши существования и
единственности решения, причем решения
определены на рассматриваемом интервале
изменения независимой переменной t .
Каждое такое решение х = х(/) , t e 7*,
задает параметрическую кривую в
пространстве состояний системы (22.7.1), которую
называют траекторией системы (22.7.1),
соответствующей фиксированному управлению.
Геометрическим образом траектории является
кривая х(Т) с R" , которую называют
фазовой кривой. Как и в случае систем
дифференциальных уравнений, ориентация фазовой
кривой задается направлением движения
точки x(t) по ней с ростом независимой
переменной t .
Типы нелинейных динамических систем.
При m = 1 говорят, что нелинейная система
(22.7.1) со скалярным, а при m > 1 - с
векторным управлением. Если правые части
нелинейной системы (22.7.1) не зависят от
переменной t (времени), то систему называют
стационарной. Важный класс составляют
нелинейные системь^ линейные только по
ГЛОБАЛЬНЫЕ УСЛОВИЯ ЭКВИВАЛЕНТНОСТИ
839
управлению. В него входят аффинные
(стационарные) системы х = А[х) + В(х)и ,
х е Rn , weR'", где векторная функция
А(х) = (а{(х)9...,ая(х))Т9* В(х) = (Ьу(х)) -
функциональная матрица типа п х m с
элементами bjj(x). Эти системы при m = 1
называют аффинными системами со скалярным
управлением. Их векторная запись
х = А(х) + В(х)и , xeR", «eR, (22.7.2)
где А(х) = (ах (х)9 ...,а„ (х)) и В(х) =
= [bi(x),...,£w(x)) - векторные функции /7
переменных х = (xj,..., хп ) , в
координатной форме имеет вид:
х{ =а{(х{,...,хп)+Ь{(х{,...,хп)и,
*п = ап(х[9...,х„)+ Ьп(х{,... ,хя)и .
Векторные поля аффинной системы. Все
аффинные системы существенно нелинейны,
но линейность их правых частей по
управлению позволяет каждой аффинной системе
взаимно однозначно сопоставить векторные
поля на ее пространстве состояний или на ее
расширенном пространстве состояний, не
зависящие от управлений. На этом
соответствии основано широкое использование
результатов дифференциальной геометрии в теории
аффинных систем. В случае аффинной
системы (22.7.2) со скалярным управлением таких
векторных поля на ее пространстве состояний
R" два: А и В. Столбцом координат
векторного поля А является А(х) , а столбцом
координат векторного поля В - В(х). Эти
векторные поля обычно записывают в виде
A-±a,(x)JL, В-5>(*)£-
/=1 ' /=1
д^-
Вектор скорости x(t) в точке х = x(t)
траектории системы (22.7.2) равен F =
= A((x)t) + B(x(t))u* , где и* - значение
допустимого управления в момент времени / .
Если А(х) Ф О и В(х) Ф О , то при
отсутствии ограничений на значения
допустимых управлений множество возможных
направлений смещения из точки х «заполняет
открытую полуплоскость» в двухмерной
плоскости, порожденной в точке х векторами
А(х) и В(х).
22.7.2. Глобальные условия
эквивалентности. Эквивалентные стационарные
системы с управлением. Один из путей решения
задач управления для нелинейных систем
состоит в том, что:
нелинейную систему преобразуют к
некоторому специальному виду, удобному для
решения задачи;
решают задачу для преобразованной
системы;
найденное решение записывают в
исходных переменных.
Особенно важны те преобразования
нелинейных систем, которые приводят к
эквивалентным системам.
Ограничимся гладкими
невырожденными заменами переменных в пространствах
состояний стационарных нелинейных систем
и не будем преобразовывать управления и
независимую переменную (время).
Стационарные нелинейные системы с
управлением
х = F(x,u), xeQ,
и
Z = G(z,u), ZtO ,
называют эквивалентными, если существует
диффеоморфизм Ф : Q -» О , отображающий
траектории первой системы в траектории
второй, соответствующие тем же управлениям.
Эквивалентность нелинейных систем с
управлением равносильна существованию
такой гладкой невырожденной замены
переменных в открытом подмножестве
пространства состояний, которая одну систему
преобразует в другую.
Эквивалентные аффинные системы. Для
аффинной системы
х = А(х) + В(х)и , xeflcR", weR,
(22.7.3)
где А(х) = (а{(х\...,ап(х))Т, B(x) = (b[(x),...,
bn(x)f, as(x)9 bg(x)eCT(ti)9 Q
-открытое множество в R" , важно то, что после
любой гладкой невырожденной замены
переменных Z = Ч*(х) , х е Q , снова получается
аффинная система.
840
Глава 22.7. ПРЕОБРАЗОВАНИЕ АФФИННЫХ СИСТЕМ
Если аффинная система имеет вид
Z\ = Z2 , ..-, Zn-\ = Z„,
Zn=f(z) + g(z)u, (22.7.4)
где z = (Zi,...,Z„)TeZcRfl, /(*), g{z) e
e C°°(Z), то ее называют системой
канонического вида, а переменные г ~~ каноническими
переменными.
Систему канонического вида со
скалярным управлением можно записать в виде
одного уравнения. Для этого введем фазовые
переменные у , у jA >, полагая
y = zi, y = z2,..., /я"^ = гя,
и вместо системы (22.7.4) получим уравнение
т
^ = (^Я-^(И_1)) . (22.7.5)
которое наряду с (22.7.4) тоже будем называть
системой канонического вида.
В системе (22.7.5) у е Rn, но R" в
этом случае далее будем обозначать ¥п,
^" = к I' и называть фазовым
пространством системы (22.7.5) канонического вида.
Систему канонического вида называют
регулярной на некотором множестве, если в
точках этого множества коэффициент при
управлении не обращается в нуль.
Определим последовательные
коммутаторы векторных полей А и В аффинной
системы (22.7.3), полагая
adiB = B, adAB = [A,B],
adiB^JA^d^BJ, k>\.
Теорема 22.7.1. Для того чтобы для
аффинной системы (22.7.,3) в Q существовали
переменные, в которых она имеет
канонический вид (22.7.4), необходимо и достаточно,
чтобы существовала такая функция ф(х) е
eC°°(Q), которая в Q. является решением
системы уравнений в частных производных
ad£B(p(x) =0, * = 0, я - 2 , (22.7.6)
и для которой соотношения
Zi =А/-1ф(*)> / = 1,л,
(22.7.7)
задают в Q гладкую невырожденную замену
переменных z = Ф(*) • В этих переменных
аффинная система имеет канонический вид
(22.7.4), причем
g(z) = BA"-lq>(x)
(22.7.8)
1х=Ф_1(г)
где х = ф_1(г) - обратная к (22.7.7) замена
переменных.
Пример 22.7.1. Рассмотрим систему
Лоренца с управлением во втором уравнении —
трехмерную аффинную систему вида
х{ = -ох{ + ох2 ,
х2 = яс{ - х2 - х{х3 + и ,
х3 = х\х2 ~ Ьх$ ,
где a, b, r — положительные постоянные
параметры. В случае и = 0 собственная
динамика системы Лоренца имеет хаотический
характер при, например, а = 10 , b = 8/3 ,
г = 28.
Для рассматриваемой аффинной систе-
мы х = (xi,x2,x^) , п = 3 , и поэтому
система (22.7.6) содержит два уравнения:
Вф(х) = 0, adAB(p(x) = 0 .
Найдем векторное поле adAB = [А, В] >
столбец координат которого обозначим через
В[(х). Учитывая, что столбцы координат
векторных полей А и В будут:
( -
А(х) =
ох{ + ох2 ^
ГХ\ — Х2 — Х\Х$
Х\Х2 - Ьх^
. *(*)=
v°.
находим
В{(х) = В\х)А(х) - А\х)В(х) =
0
( -г
о
Г-Х3 - 1 - Х|
х2 xl - b
0Л (~о\
v°,
l-*l
ГЛОБАЛЬНЫЕ УСЛОВИЯ ЭКВИВАЛЕНТНОСТИ
841
Следовательно, функция ф(х) должна
быть решением системы линейных
однородных уравнений в частных производных
первого порядка:
Эф _ q _ _Э(р_ Эф Эф _ п
оХ2 оХ[ оХ2 оХ3
откуда
is.» о,
дх2
dXi дх3
Согласно первому уравнению решение
ф(х) этой системы не зависит от х2 .
Поскольку от х2 не зависят и коэффициенты
второго уравнения, то достаточно найти все
решения этого уравнения в множестве
гладких функций, зависящих от jq и х3.
Для нахождения всех таких решений
запишем уравнение характеристик для второго
уравнения
dx\ __ dx3
а Х|
откуда odx3 = XydX] и, следовательно, ох3 =
= х2/2 + С. Положив ф = х\* - 2ах3 ,
получим одно из решений системы уравнений в
частных производных в классе гладких
функций.
Учитывая, что §гас1ф = (2*| ,0,-2о) * О
в R , общее решение этого уравнения в
множестве гладких функций имеет вид
щх\ - 2ах3), где ос(-) - произвольная
гладкая функция одного переменного.
Запишем соотношения (22.7.7),
соответствующие решению ф = Х\ - 2(5Х3 . Положим
Z\ = ф = х2 - 2ах3 и, дважды
дифференцируя Z\ в силу рассматриваемой аффинной
системы, последовательно получим:
Z2 = Z\ = 2x|X| - 2ох3 = -2о\х\ - bx3 j,
Z3 =i2 = -2o{2x[x] -bx3) =
= 2oh.ox2 +(b-2o)x{x2 -b2x3).
Соотношения
Z\ = x? - 2ax3,
Z2=-2a(x12-^3), (22.7.9)
Z3 = 2a(2ax2 + (£ - 2a)x!Jt2 - b2x3)
не являются гладкой невырожденной заменой
переменных в R . Действительно, решая
систему (22.7.9) относительно Ху , х2 , х3,
обратную замену переменных можно
представить при b * 2a в виде:
*1
-^
fei Y ^ *2 + 2azi
2a ' 3 2o(ft-2o)'
*2
_ z3/(2a) + b2x3 - 2oxf
(b-2o]x{
Z3 , b2 Z2 + 2q?i
2a 2a(fr-2a)
(£ - 2a)jq - -
2ax,
(£ - 2c]x{
Z3(b-2c) + b2(z2+2cz{) _
2o(b-2ofx{ --
\2„ 2ax,
ft-2a
iZ3(*-2a)+^(z2+2azl)T^ |z2+tei
2a^-2a)3(z2+fe,) \(*-2o)
(22.7.10)
Проанализируем полученное решение,
предполагая, что b <2c. Правые части
равенств в последних двух системах (22.7.9) и
(22.7.10) являются гладкими функциями,
определенными при всех х = (х\,х2,х3) и тех
Z = (Z\ ,Z2,Z3) , ДЛЯ которых Z2 + bZ\ < 0 .
Соответствующее отображение Ф:
R3 -> R3 , Ф(х) = z , определено во всем
R3. Найдем образ ф(к3) этого отображения,
рассмотрев следующие три случая.
1). При z2 + bZ\ > 0 система (22.7.9) не
имеет решения, поскольку иначе из ее первых
двух уравнений следовало бы, что
x?=(z2 + bzi)/(b-2o)<0.
842
Глава 22.7. ПРЕОБРАЗОВАНИЕ АФФИННЫХ СИСТЕМ
Следовательно, множество ФК не
содержит точек из полупространства jz e R3:
Z2 + bz\ > 0} .
2). При z2 + bZ\ - 0 из первых двух
уравнении системы (22.7.9) следует, что
Z\ = -2ох3 ,
Z2 = 2obx3, (22.7.11)
Z3 = -2ob2x3.
Это значит, что все точки (0,х2,х3)
плоскости Х| = 0 отображаются в прямую L в
плоскости z2 + bz\ = 0, причем, заменив в
(22.7.11) х3 на параметр igR, получим
параметрические уравнения этой прямой.
Образ ФШ I содержит лишь те точки
из плоскости Z2+bZ\ = 0 , которые
принадлежат прямой L. Полный прообраз точки с
абсциссой Z\, принадлежащей прямой L,
совпадает с
x:x = (0,v,-z,/(2o))T, vgrJ -
прямой в плоскости Х| = 0, причем
Ф({х,=0})=1.
3). При Zi + bZ\ < 0 система (22.7.9)
всегда имеет два решения, одно в
полупространстве 0+ = {х| > 0}, а другое в
полупространстве 0_ = {х] < 0}. Ограничения
ф+ = ф|0+) ф_ = ф|0
отображения Ф на эти полупространства
являются диффеоморфизмами 0+ и 0_ с
полупространством
Z = lzeR3:z2 + bz\ < о} .
Обратные отображения
<t>-{:Z-*0+, <b~}\Z-*0_
определяются равенствами (22.7.10), где
верхние знаки соответствуют Ф+, а нижние -
Ф_.
Следовательно, рассматриваемая
аффинная система как в 0+, так и 0_
эквивалентна системе канонического вида. Это две
разные системы канонического вида, но обе
они определены в Z . Для их нахождения
продифференцируем z3 в силу, исходной
аффинной системы и исключим старые
переменные Xj , х2 , Хз с помощью соотношений
(22.7.10). В результате получим
Z3 =2о((4ох, +(Ь-2о)х2)х{ +(Ь-2о)х{х2 -
- b2x3) = f±(z)± 2oJ(b-2o)(z2+bzx)u ,
где через f±(z) обозначены слагаемые, не
зависящие от управления и . Теперь можно
записать эквивалентные системы
канонического вида в переменных пространства
состояний:
Z\ = Z2 ,
Z3 = f±(z)± 2oyj(b-2o)(z2 + bz{)u .
Верхние (нижние) знаки (±)
соответствуют системам канонического вида,
эквивалентным системе Лоренца с управлением,
рассматриваемой на 0+ (соответственно на
ол
Поэтому можно сказать, что в области
{х| Ф 0} система Лоренца с управлением
эквивалентна двузначной регулярной
системе канонического вида, определенной в
области Z .
22.7.3. Матрица управляемости.
Стационарный случай. В теории линейных
стационарных систем важную роль играет их
матрица управляемости. Для аффинных
систем тоже можно ввести аналогичное понятие.
Рассмотрим аффинную стационарную
систему (22.7.3) с одним управлением и
соответствующие ей векторные поля А и В.
Каждой гладкой в окрестности некоторой точки
х е R" функции ф(х) сопоставим
определенную в этой же окрестности функцию
Р(х) = (- 1)л",ас1Х",Вф(х). (22.7.12)
Тогда пара функций ф(х), (3(х)
является решением системы уравнений
ЛОКАЛЬНЫЕ УСЛОВИЯ ЭКВИВАЛЕНТНОСТИ
843
(-l)*ad£B<p(x) = 0, * = 0,л-2,
(22.7.13)
(-irladrB9(x) = p(x).
Поскольку левые части этой системы
являются производными Ли функции ф(х) по
векторным полям, то ее можно рассматривать
как систему линейных алгебраических
уравнений относительно частных производных
этой функции. В матричной форме эту
систему можно записать в виде
grad9(x)t/(x) = (0,...,0,p(x)).
Столбцами квадратной матрицы U(x)
являются координатные столбцы векторных полей
(- 1) ас!дВ , к = 0,я - 1. Обозначив столбец
координат векторного поля ас!дВ через
В (х) , можем записать
и(х) = (в°(х)ч-В\х),...,(-\)п-1Вп-1(х)).
(22.7.14)
Матрицу U(x) называют матрицей
управляемости аффинной стационарной системы
(22.7.3). Ее удобно записывать, используя
обозначения для столбцов
(/W=((/,(4..,t/„W),
и вычислять эти столбцы по рекуррентному
соотношению
«.w--(^<x,-^,1(4
А;=г2,л. (22.7.15)
Матрица управляемости U(x) в случае
линейной стационарной системы х =
= Ах+ Ви , х eRn , и gR совпадает с
матрицей [В, АВ, ..., А"~1Ву
22.7.4. Локальные условия
эквивалентности. Приведенные необходимые и
достаточные условия эквивалентности
аффинной системы системе канонического вида
можно отнести к условиям глобального типа,
поскольку они сформулированы для
произвольного открытого множества в пространстве
состояний.
Для выяснения вопроса о
существовании в некотором открытом множестве
эквивалентной системы канонического вида и для
ее нахождения надо решить две задачи.
1. Найти определенное в этом
множестве решение системы линейных однородных
уравнений с частными производными первого
порядка, причем решение с тождественно не
равным нулю градиентом по х .
2. Решить нелинейную систему
уравнений (найти обратную замену переменных).
Решение этих задач в аналитической
форме не всегда возможно. Поэтому важно
иметь более простые условия существования
канонического вида, и, зная что он
существует, но не находя его, научиться использовать
это для решения задач управления.
Теорема 22.7.2. Если для аффинной
стационарной системы (22.7.3) существует такое
решение (p(x) G C°°(Q) системы линейных
однородных уравнений в частных производных
первого порядка (22.7.6), для которого
соответствующая функция р(х) в точке Р
пространства состояний системы удовлетворяет
условию
то в некоторой окрестности точки Р :
матрица управляемости аффинной
стационарной системы (22.7.3) невырождена;
матрица Якоби функций
Zj = А/_|ф(х), / = 1,я,
невырождена;
эти функции задают гладкую
невырожденную замену переменных;
аффинная стационарная система (22.7.3)
эквивалентна регулярной системе канонического
вида.
Функция р является важной
характеристикой соответствующего ей решения (р
однородной системы уравнений в частных
производных и соответствующей системы
канонического вида (если эта система существует
и вводится с помощью функции ф): в
некоторой окрестности любой точки множества
{Р Ф 0} аффинная система эквивалентна
регулярной системе канонического вида, а в
любой окрестности точки из множества
|р = 0} аффинная система или не
эквивалентна системе канонического вида, соответ-
844
Глава 22.7. ПРЕОБРАЗОВАНИЕ АФФИННЫХ СИСТЕМ
ствующей функции ф, или эквивалентна
такой системе (т.е. системе, которая
соответствует решению ф), но эта система будет
нерегулярной в рассматриваемой точке.
Теорема 22.7.3. Для того чтобы для
аффинной стационарной системы (22.1 .Ъ) в
некоторой окрестности точки Р е Q
существовали переменные, в которых она имеет
регулярный канонический вид (22.1 Л), необходимо
и достаточно, чтобы были выполнены два
условия:
1) матрица управляемости (22.7.14)
U{x) = (b(x)-B1 (х),..., (-I)""' В"'1 (х))
системы (22.7.3) невырождена в точке Р ;
2) распределение
span(ad^B, ...,ad£"2B) (22.7.16)
инволютивно в окрестности точки Р (в
окрестности точки Р система (22.1.6)
линейных однородных уравнений в частных
производных ас!д Вф(х) = 0, £ = 0,/f - 2 ,
является полной).
Первые п - 1 столбцов матрицы
управляемости аффинной стационарной системы
(22.7.3) являются как координатными
столбцами векторных полей, порождающих
распределение (22.7.16), так и строками (с
точностью до их знаков) в матрице коэффициентов
системы (22.7.6) линейных однородных
уравнений в частных производных. Поэтому
исследование в окрестности точки Р как инво-
лютивности распределения (22.7.16), так и
полноты системы уравнений (22.7.6)) сводятся
к проверке «инволютивности» матрицы У(х),
составленной из этих /2-1 столбцов матрицы
управляемости.
Эта проверка состоит в следующем. Для
столбцов У/с(х) и Vi(x) матрицы У(х)
вычисляют их «коммутатор»-столбец
Если этот столбец увеличивает ранг матрицы
У(х) в точке Р , то его дописывают (справа)
к этой матрице, а иначе — не дописывают.
Если после перебора всех пар столбцов
У/с(х), Vt(x) (достаточно перебрать пары с
к < I) к матрице У(х) ни один столбец не
добавлен, то в окрестности точки Р матрица
У(х) «инволютивная», система (22 7.6)
полная и распределение (22.7.16) инволютивное.
Иначе система не является полной, а
распределение — инволютивным.
Исследование существования
регулярного канонического вида аффинной
стационарной системы (22.7.3) на основании
полученных результатов можно провести
следующим образом.
1. Вычислить матрицу управляемости
U(x) и найти множество
S = {jtc=Q:det£/(x)=0}
тех точек из области определения Q с Rn
аффинной системы, где ее ранг меньше
размерности пространства состояний системы.
2. Из первых п-\ столбцов матрицы
управляемости U(x) системы составить
матрицу У{х). Для этой матрицы найти
множество R тех точек из £2 , для которых
существуют такие к и / , что
det(K(x)|Kw(x))*0.
3. Согласно теореме 22.7.3 аффинная
система эквивалентна регулярной системе
канонического вида в окрестности любой
точки множества
Q\(JUJl).
4. Согласно теореме 22.7.3 в окрестности
любой точки множества
SURaQ
аффинная система не имеет эквивалентной
системы канонического вида, регулярной в
точках этого множества.
5. В окрестности точки Р е S \ R
аффинная стационарная система может иметь
эквивалентную систему канонического вида,
но она не является регулярной в точке Р .
6. В окрестности точки Р е R\S
аффинная стационарная система не имеет
эквивалентной системы канонического вида. В
этом случае система (22.7.6) в окрестности
точки Р не является полной, а у ее
пополнения матрица коэффициентов в точке Р
будет иметь ранг, равный п. Поэтому
grad ф(*Ля = 0 для любого решения ф(х)
системы (22.7.6). Следовательно,
соответствующая матрица Якоби функций (22.7.7)
будет вырождена в точке Р .
НЕОДНОЗНАЧНОСТЬ КАНОНИЧЕСКОГО ВИДА
845
Если для аффинной стационарной
системы (22.7.3) в окрестности некоторой точки
Р ее пространства состояний выполнены
условия теоремы 22.7.3, то в окрестности этой
точки существует эквивалентная регулярная
система канонического вида. Для ее
нахождения можно воспользоваться теоремой 22.7.1.
В соответствии с этой теоремой в окрестности
W рассматриваемой точки надо найти такое
решение ф(х) системы уравнений в частных
производных (22.7.6), для которого
соотношения (22.7.7) задают в W гладкую
невырожденную замену переменных. Оказывается, что
при выполнении условий теоремы 22.7.3
соотношения (22.7.7) задают в окрестности
точки Р гладкую невырожденную замену
переменных тогда и только тогда, когда
gradcp^ *0.
22.7.5. Неоднозначность
канонического вида. Теорема 22.7.4. Пусть в
некоторой окрестности W точки. Р пространства
состояний аффинной стационарной системы
(22.7.3) функция ф(х) из C°°(IV) является
решением системы уравнений в частных
производных (22.7.6), а ф(х) = F(q>(x)), где F() -
произвольная гладкая функция одного
переменного. Тогда:
1) если функции ф(х) в окрестности
точки Р соответствует эквивалентная
система канонического вида, то при
F'W)\p * ° < F'W)lP = ° > ФУ»**™
ф(х) в окрестности этой же точки
соответствует (не соответствует) эквивалентная
система канонического вида;
2) если функции ф(х) в окрестности
точки Р не соответствует эквивалентная
система канонического вида, то и функции
ф(х) в окрестности этой же точки не
соответствует эквивалентная система
канонического вида;
3) если функции ф(лс) в окрестности
точки Р соответствует эквивалентная
система канонического вида, то F (ф(*)| * О ,
функции ф(х) в окрестности этой же точки
соответствует эквивалентная система
канонического вида и в некоторой окрестности
точки Р эти системы канонического вида,
записанные в переменных фазовых пространств
y(n)=f{y) + g{y)u,y = <p(x),
У(") = 7^] + ^у]«,? = ф(х),
преобразуются друг в друга заменой зависимых
переменных у = Fty);
4) если в некоторой точке F (ф(*)) = 0,
то в окрестности этой точки функции ф(х)
не соответствует эквивалентная система
канонического вида.
Теорема 22.7.5. Пусть в некоторой
окрестности W точки Р пространства
состояний аффинной стационарной системы (22.7.3)
распределение
span(ad^B,...,adr2B)
инволютивно и (п - 1) -мерно, т.е. система
(22.7.6) линейных однородных уравнений в
частных производных аёдВф(х) = 0, /с = 0, /I — 2 ,
полная, и ранг матрицы коэффициентов этой
системы равен п - 1. Если существует такое
решение ф(х) е C°°(W) системы (22.7.6) с
grad ф(дс j Ф 0 , которое в окрестности
точки Р не определяет эквивалентную систему
канонического вида, то для аффинной
стационарной системы (22.7.3) в окрестности точки
Р не существует эквивалентной системы
канонического вида.
Пример 22.7.2. Для системы Лоренца с
управлением было найдено решение ф(х) =
= Ху - 2ax3 системы линейных однородных
уравнений в частных производных, градиент
которого (2*1,0, - 2а) не обращается в нуль
в точках множества [ху = 0}. Эта система
линейных однородных уравнений в частных
производных полная, и ранг матрицы
коэффициентов равен 2 во всех точках
пространства состояний. Поскольку функция ф(х) =
= Ху - 2о*з не определяет эквивалентную
систему канонического вида в окрестности
любой точки множества [ху = 0}, то
согласно теореме 22.7.5 в окрестности любой такой
точки система Лоренца с управлением вообще
не имеет эквивалентного канонического вида.
846
Глава 22.7. ПРЕОБРАЗОВАНИЕ АФФИННЫХ СИСТЕМ
22.7.6. Частично определенное
многозначное представление. Исследование
системы Лоренца с управлением дало
следующие результаты. Эта система как в
области 0+ = [ху > 0}, так и в области
0_ = {*] < 0} эквивалентна системе
канонического вида. Это две разные системы
канонического вида, но их можно считать
определенными в одной и той же области Z
изменения канонических переменных.
Следовательно, эти системы канонического вида в
области Z можно рассматривать как одну
двузначную систему канонического вида в
этой области. В окрестности любой точки
множества Oq = {jCj = 0} — общей границы
областей 0+ и 0_ - рассматриваемая
система не эквивалентна системе канонического
вида. Следовательно, данную аффинную
систему во всем ее пространстве состояний
можно рассматривать как совокупность трех
систем: двух систем канонического вида в
области Z и ограничения самой исходной
системы в сколь угодно малой окрестности Ог
множества Oq .
Приведенное описание системы
Лоренца с управлением можно распространить на
произвольные аффинные системы.
Предположим, что в области определения аффинной
системы найдены открытые множества Оа,
ос е /, на каждом из которых она
эквивалентна системе канонического вида с
соответствующей областью допустимых состояний.
Заменим аффинную систему в области ее
определения набором указанных систем
канонического вида с их областями допустимых
состояний и ограничением самой аффинной
системы на некоторое открытое множество
Ог , содержащее все те допустимые состояния
аффинной системы, которые не попали ни в
одно из множеств Оа . Это описание
аффинной системы будем называть частично
определенным многозначным представлением. Оно
всегда существует для аффинной системы, так
как им является сама система при / = 0 и
Ое , совпадающим со всем множеством
допустимых состояний, хотя это и тривиальный
случай.
Наличие в названии слов «частично
определенное» и «многозначное» оправдано тем,
что для записи указанных систем
канонического вида можно использовать одни и те же
канонические переменные, и тогда вместо
всех этих систем канонического вида можно
рассматривать одну многозначную систему
канонического вида. Каждая ее ветвь будет
соответствовать одной из систем
канонического вида с ее множеством допустимых
состоянии. «Переключение» с ветви а на ветвь
а происходит в соответствии с переходом
траектории аффинной системы из множества
Оа в множество 0а'. Сам же этот переход
происходит или в пересечении множества Оа
с множеством О
или в множестве Ог .
22.7.7. Построение наблюдателей.
При решении задач управления
динамическими системами полный вектор состояния
системы часто неизвестен, а измерению
доступны лишь некоторые функции переменных
состояния — выходы системы. Одним из
путей получения оценки вектора состояния по
выходам является построение наблюдателя —
специальной динамической системы,
состояние которой с течением времени
приближается (асимптотически или экспоненциально) к
состоянию исходной системы.
Систему
х = А(х), y = h(x) (22.7.17)
называют локально наблюдаемой в точке,
если в некоторой окрестности этой точки
ранг матрицы наблюдаемости
т
(dh(x) dLAh(x)
W(x) =
dL"rl
h(x)
дх
дх
дх
(22.7.18)
Эй
равен п, где LAh(x) = —А(х) — производ-
дх
ная Ли функции h(x) по векторному полю
А(х).
Теорема 22.7.6. Для того чтобы локально
наблюдаемая в точке динамическая система
(22.7.17) в некоторой окрестности этой точки
была эквивалентна системе канонического вида,
для построения наблюдателя
X = ^C + V(Xl), У=ЩХ\), (22.7.19)
где Х = (Хь-~>Хп) > D = {dij) -квадратная
матрица порядка п с элементами dy = 1,
если j - i = 1 , и dy = 0, если j -i ф\ ,
V(Xi) = (Vi(Xi),--,¥w(Xi)) > и допускала
ПОСТРОЕНИЕ НАБЛЮДАТЕЛЕЙ
847
построение наблюдателя
X = />X + c(xi-Xi)+v(Xi)> %x=H-\y),
(22.7.20)
т
где вектор G = (gi,...,gw) в наблюдат&ге
задает динамику ошибки и выбран так, что
при С = (1,0,..., 0) матрица D + GC имеет
собственные числа только с отрицательными
действительными частями, необходимо и
достаточно, чтобы существовала такая гладкая
функция р(х), х е R , р(х) > 0, для которой
векторное поле В^х), являющееся в
окрестности рассматриваемой точки решением
уравнения
lV(x)Bl(x)=(0,...,0,p{h(x))f>
удовлетворяло в этой окрестности условиям
[ad^iW,ad5+l^i(jc)]=0, * = 0,л-1.
(22.7.21)
Здесь W(x)- матрица наблюдаемости
системы (22.7.17).
При выполнении приведенных условий
существует локальная гладкая невырожденная
замена переменных х = Ф(х) ,
преобразующая систему (22.7.17) к виду (22.7.19). Она
находится из следующего условия:
ф'{х) = (в[{х),-айАВ]{х\...,
[(-^гй^В^х), B{x)] = 0, i = l, я.
(22.7.24)
Тогда векторное поле В(х) в новых
переменных % постоянно. В этом случае система
(22.7.23), записанная в переменных X > ПРИ~
мет вид
X = Dx + v(X\) + Bu ,
у = Я(ул), В = const . (22.7.25)
Покажем, что система
X = ОХ + C(jci " Х\) + V(Xi) + * ,
Х[=Н-1(у), (22.7.26)
является экспоненциальным наблюдателем
для системы (22.7.25). Действительно,
уравнение относительно ошибки е = х - X оценки
наблюдателем (22.7.26) состояния системы
(22.7.25) при любом (но одинаковом)
управлении в системах (22.7.25)—(22.7.26) имеет вид
e = (D + GC)e, (22.7.27)
где матрицы С и G - из формулировки
теоремы 22.7.6. Поэтому ошибка оценки
состояния не зависит от управления и
экспоненциально стремится к нулю.
Пусть для аффинной системы (22.7.23)
из соотношений (22.7.24) справедливы только
первые п - 1 равенств, т.е.
(-ly-'adrtWl , (22.7.22) [(-l)" ad';'*, (x),B(x)] = 0 , / = 1,я-1.
=ф(х)
где Ф (%) - матрица Якоби.
Предположим, например, что для
векторного поля В(х) аффинной системы
х = А(х) + В(х)и , у = И(х), (22.7.23)
где х е Rn - вектор состояния системы,
А(х) и В(х) - гладкие векторные поля на
Rn, у е R[ - выход системы, h(x) e
е С00!/?"), и е R - управление,
справедливы равенства
(22.7.28)
В этом случае векторное поле В(х) в новых
переменных % зависит от переменной Х\ и
имеет вид #(Х|)- Экспоненциальным
наблюдателем для аффинной системы (22.7.23),
записанной в переменных X (те- >для систе-
мы (22.7.25), где В = В(х\))> является
система (22.7.,26) с В=В(х\). Уравнение на
ошибку оценки этим наблюдателем состояния
системы (22.7.25), где В = В(х\), сохранится
в виде (22.7.27).
848
Глава 22.7. ПРЕОБРАЗОВАНИЕ АФФИННЫХ СИСТЕМ
СПИСОК ЛИТЕРАТУРЫ
1. Айзеке Р. Дифференциальные игры.
М: Мир, 1967.
2. Алексеев В.М., Тихомиров Б.М.,
Фомин СВ. Оптимальное управление. М.: Наука,
1979.
3. Аоки М. Оптимизация стохастических
систем. М.: Наука, 1971.
4. Аркин В.И., Евстигнеев И.В.
Вероятностные модели управления и экономической
динамики. М.: Наука, 1979.
5. Атанс М., Фалб П. Оптимальное
управление. М.: Машиностроение, 1968.
6. Афанасьев В.Н., Колмановский В.Б.,
Носов В.Р. Математическая теория
конструирования систем управления. М.: Высшая
школа, 1989.
7. Ащепков Л.Т. Оптимальное
управление разрывными системами. Новосибирск:
Наука, 1987.
8. Богуславский И.А. Прикладные задачи
фильтрации и управления. М.: Наука, 1983.
9. Болтянский В.Г. Оптимальное
управление дискретными системами. М.: Наука,
1973.
10. Брайсон А., Хо-Ю-Ши. Прикладная
теория оптимального управления. М.: Наука,
1972.
11. Браммер К., Зиффлинг Г. Фильтр
Калмана-Бьюси. М.: Наука, 1982.
12. Бутковский А.Г. Методы управления
системами с распределенными параметрами.
М.: Наука, 1975.
13. Васильев Ф.П. Лекции по методам
решения экстремальных задач. М.: Изд-во
МГУ, 1974.
14. Габасов Р., Кириллова Ф.М. Особые
оптимальные управления. М.: Наука, 1973.
15. Габасов Р., Кириллова Ф.М.
Принцип максимума в теории оптимального
управления. Минск: Наука и техника, 1974.
16. Гурман В.И. Принцип расширения в
задачах управления. М.: Наука, 1985.
17. Дегтярев Г.Л., Сиразетдинов Т.К.
Теоретические основы оптимального
управления упругими космическими аппаратами. М.:
Машиностроение, 1986.
18. Егоров А.И. Оптимальное управление
тепловыми и диффузионными процессами.
М.: Наука, 1978.
19. Иванов В.А., Фалдин Н.В. Теория
оптимальных систем автоматического
управления. М.: Наука, 1981.
20. Иванов Н.М., Лысенко Л.Н.,
Мартынов А.И. Методы теории систем в задачах
управления космическим аппаратом. М.:
Машиностроение, 1981.
21. Казаков И.Е., Гладков Д.И. Методы
оптимизации стохастических систем. М.:
Наука, 1987.
22. Квакернаак X., Сиван Р. Линейные
оптимальные системы управления. М.: Мир,
1977.
23. Колосов Г.Е. Синтез оптимальных
автоматических систем при случайных
возмущениях. М.: Наука, 1981.
24. Красовский А.А. Системы
автоматического управления полетом и их
аналитическое конструирование. М.: Наука, 1973.
25. Красовский Н.Н., Субботин А.И.
Позиционные дифференциальные игры. М.:
Наука, 1974.
26. Кротов В.Ф., Гурман В.И. Методы и
задачи оптимального управления. М.: Наука,
1973.
27. Крылов Н.В. Управляемые процессы
диффузионного типа. М.: Наука, 1977.
28. Куржанский А.Б. Управление и
наблюдение в условиях неопределенности. М.:
Наука, 1973.
29. Летов A.M. Динамика полета и
управление. М.: Наука, 1973.
30. Лурье К.А. Оптимальное управление
в задачах математической физики. М.: Наука,
1975.
31. Малышев В.В., Кибзун А.И. Анализ и
синтез высокоточного управления
летательными аппаратами. М.: Машиностроение,
1987.
32. Математическая теория оптимальных
процессов / Л.С. Понтрягин, В.Г.
Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко. М.:
Наука, 1983.
33. Медич Дж. Статистически
оптимальные линейные оценки и управление. М.:
Энергия, 1973.
34. Методы описания, анализа и синтеза
нелинейных систем управления / В.В.
Семенов, А.В. Пантелеев, Е.А. Руденко, А.С. Бор-
таковский. М.: Изд-во МАИ, 1993.
35. Моисеев Н.Н. Численные методы в
теории оптимальных систем. М.: Наука, 1971.
36. Нейман Дж., Моргенштерн О. Теория
игр и экономическое поведение. М.: Наука,
1970.
37. Овсянников Д.А. Математические
методы управления пучками. М.: ЛГУ, 1980.
38. Пантелеев А.В., Бортаковский А.С.
Теория управления в примерах и задачах. М.:
Высшая школа, 2002.
СПИСОК ЛИТЕРАТУРЫ
849
39. Пантелеев А.В., Бортаковский А.С.,
Летова Т.А. Оптимальное управление в
примерах и задачах. М.: Изд-во МАИ, 1996.
40. Пантелеев А.В., Семенов В.В. Синтез
оптимальных систем управления при
неполной информации. М.: Изд-во МАИ, 1992.
41. Параев Ю.И. Введение в
статистическую динамику процессов управления и
фильтрации. М.: Советское радио, 1976.
42. Пацюков В.П. Дифференциальные
игры при различной информированности
игроков. М.: Советское радио, 1976.
43. Пропой А.И. Элементы теории
оптимальных дискретных систем. М.: Наука,
1973.
44. Сейдж Э.П., Уайт Ч.С. Оптимальное
управление системами. М.: Радио и связь,
1982.
45. Сиразетдинов Т.К. Оптимизация
систем с распределенными параметрами. М.:
Наука, 1977.
46. Федоренко Р.П. Приближенное
решение задач оптимального управления. М.:
Наука, 1978.
47. Фельдбаум А.А. Основы теории
оптимальных автоматических систем. М.: Наука,
1966.
48. Флеминг У., Ришел Р. Оптимальное
управление детерминированными и
стохастическими системами. М.: Мир, 1978.
49. Уткин В.И. Скользящие режимы в
задачах оптимизации и управления. М.:
Наука, 1981.
50. Цирлин A.M., Балакирев B.C.,
Дудников Е.Г. Вариационные методы оптимизации
управляемых объектов. М.: Энергия, 1976.
51. Черноусько Ф.Л., Колмановский В.Б.
Оптимальное управление при случайных
возмущениях. М.: Наука, 1978.
52. Черноусько Ф.Л., Меликян А.А.
Игровые задачи управления и поиска. М.:
Наука, 1978.
Раздел 2 3
ВЫЧИСЛИТЕЛЬНАЯ МАТЕМАТИКА
Глава 23.1
ПРИБЛИЖЕННЫЙ АНАЛИЗ
В настоящее время численные методы
являются мощным математическим средством
решения многих научно-технических
проблем. Это связано как с невозможностью в
большинстве случаев получить точное
аналитическое решение, так и со стремительным
развитием компьютерной техники. Несмотря
на существование многочисленных
стандартных программ и объектно ориентированных
пакетов прикладных программ, для научных и
инженерно-технических работников
необходимо понимание существа основных
численных методов и алгоритмов, поскольку
зачастую интерпретация результатов расчетов
нетривиальна и требует специальных знаний
особенностей применяемых методов. В этой
связи важно понимать структуру
погрешностей при решении конкретных задач и
корректность вычислений.
23.1.1. Структура погрешности.
Существуют четыре источника погрешностей,
полученные в результате численного решения:
математическая и физическая модели,
исходные данные, приближенность метода и
ошибки округления.
Первые два источника погрешностей
приводят к так называемой неустранимой
погрешности. Эта погрешность может
присутствовать, даже если решение
сформулированной задачи найдено точно. Погрешность
метода возникает из-за того, что точный
оператор и исходные данные, в частности,
начальные и краевые условия, заменяются по
определенным правилам приближенными. Так,
производные заменяются их разностными
аналогами, интегралы - суммами, функции -
специальными многочленами; а при решении
многих задач строятся бесконечные
итерационные процессы, которые естественным
образом прекращаются после конечного числа
итераций. Как правило, погрешность метода
может быть оценена и поддается контролю.
Ниже для некоторых методов такая оценка
будет представлена. Погрешность метода
следует выбирать так, чтобы она была не более
чем на порядок меньше неустранимой
погрешности.
Погрешность округления возникает в
связи с тем, что вычисления проводятся с
конечным числом значащих цифр.
Округления проводятся по следующему правилу: если
в старшем из отбрасываемых разрядов стоит
цифра меньше пяти, то содержимое
сохраняемых разрядов не изменяется. В противном
случае в младший сохраняемый разряд
добавляется единица с тем же знаком, что и у
самого числа. Очевидно, что погрешность,
возникающая при округлении, не превышает
младшего оставляемого разряда. Повторное
округление проводить не следует, так как оно
может привести к увеличению погрешности.
Различают абсолютную и относительную
погрешности. Пусть а — точное, вообще
говоря, неизвестное числовое значение некоторой
величины, а а - известное приближенное
числовое значение этой величины, тогда
число
Д(я) = \а -а I
называют абсолютной погрешностью числа
а , а величину
— его относительной погрешностью. Нетрудно
показать, что при сложении и вычитании
складываются абсолютные погрешности, а
при делении и умножении - относительные
КОРРЕКТНОСТЬ ВЫЧИСЛЕНИЙ
851
погрешности. Очевидно, что абсолютная
погрешность характеризуется числом верных
цифр после запятой, а относительная
погрешность - числом верных значащих цифр.
Поскольку на современных
компьютерах число записывается, как правило,
минимум с 10 - 12 десятичными знаками,
то погрешность единичного округления
5 = 10" ...10" обычно пренебрежимо мала
по сравнению с неустранимой погрешностью
и погрешностью метода. При решении
больших задач производятся миллиарды операций
и можно предположить, что ошибки могут
заметно накапливаться, однако, поскольку
они носят случайный характер, может
происходить их взаимная компенсация. Зачастую
строятся специальные алгоритмы, в
частности, итерационные, которые
малочувствительны к ошибкам округления.
23.1.2. Корректность вычислений.
При численном решении основных задач
необходимо знать какие-либо входные
(исходные) данные - начальные, краевые
(граничные) значения искомой функции,
коэффициенты и правые части уравнений и т.д.
Очевидно, что для исследователя важно знать,
существует ли решение поставленной задачи,
единственно ли оно и как оно зависит от
входных данных.
Говорят, что задача поставлена
корректно, если она разрешима при любых
допустимых входных данных в случае, когда имеется
единственное решение, и это решение
непрерывно зависит от входных данных, т.е.
малому их изменению соответствует малое
изменение решения. В этом случае говорят, что
задача устойчива.
Задача поставлена некорректно, если ее
решение неустойчиво относительно входных
данных, т.е. их малому изменению могут
соответствовать большие изменения решения.
Известно, что корректной задачей является
задача численного интегрирования, а
некорректной — задача дифференцирования.
Классическим примером некорректной
задачи является задача Коши для уравнения
Лапласа. Эта некорректность исходной задачи
проявляется и при её численном решении.
В настоящее время развиты методы
решения некорректных задач. К числу их
относятся так называемые методы регуляризации,
которые сводят решение исходной задачи к
решению близкой к ней вспомогательной с
некоторым малым параметром е , так, что
при е —> 0 решение вспомогательной задачи
должно стремиться к решению исходной
задачи. Ниже для некоторых численных
методов будут формулироваться условия
корректности и устойчивости.
Глава 23.2
ЛИНЕЙНЫЕ УРАВНЕНИЯ
Требуется найти решение системы
линейных уравнений
Ах = Ь, (23.2.1)
где А = \ajjj - квадратная матрица
коэффициентов при неизвестных; х = (хА - вектор-
столбец неизвестных; b = (bA ~ вектор-
столбец правых частей системы.
С точки зрения классической теории
линейных алгебраических систем их решение
не вызывает затруднений. По правилу
Крамера система п линейных уравнений с п
неизвестными имеет единственное решение, если
определитель системы отличен от нуля
(det А * 0) и значение каждого из
неизвестных вычисляется как отношение двух
определителей порядка п , т.е.
Xj =det,4y/det,4, у = 1,...,л, (23.2.2)
где det А: — определитель матрицы,
получаемой заменой у-го столбца матрицы А
столбцом правых частей. При
непосредственном вычислении определителей как
алгебраической суммы п\ произведений элементов
для отыскания решения системы линейных
уравнений по правилу Крамера требуется
приблизительно п ■ п! арифметических
операций типа умножения. Тогда компьютер с
быстродействием около 5 млн. опер./с
потратит на вычисление решения системы
линейных уравнений порядка п = 20 около шести
миллионов лет. Мы увидим, что
использование же метода исключения Гаусса позволяет
уменьшить время, необходимое для решения
задачи (23.2.1), до величины менее одной
секунды.
Другое важное обстоятельство,
связанное с решением систем линейных
алгебраических уравнений, состоит в следующем. С
точки зрения теории линейных систем
различаются два случая: определитель матрицы
системы не равен нулю (dety4 Ф 0), т.е. система
уравнений является невырожденной, и
определитель матрицы системы равен нулю
(det>4 = 0) - вырожденная система. Во
втором случае система либо не имеет решения
(при b Ф 0), либо имеет неединственное
решение (при £ = 0). С точки зрения
практических вычислений существуют «почти невы-
852
Глава 23.2. ЛИНЕЙНЫЕ УРАВНЕНИЯ
дг2А
deti4 = 0
Рис. 23.2.1
рожденные системы» — системы, у которых
определитель близок к нулю, но отличен от
нуля (dety4 = 0). Небольшие изменения
коэффициентов матрицы системы или правых
частей системы в «почти невырожденных
системах» могут привести к большим
погрешностям решения.
Все эти случаи хорошо иллюстрируются
на примере решения системы двух линейных
уравнений:
j*ll*l + *12*2 = *>[,
1*21*1 +*22*2 = h-
На рис. 23.2.1 каждому уравнению
соответствует прямая на плоскости Х\Х2 , а точка
пересечения этих прямых есть решение
системы (23.2.1).
Если det А = 0 , то наклоны прямых
равны и они либо параллельны, либо
совпадают. При det A « 0 небольшие погрешности
в коэффициентах и правых частях могут
привести к большим погрешностям в решении,
т.е. к положению точки пересечения.
Системы такого типа, в которых есть
малые погрешности в коэффициентах
системы или в правых частях (эти погрешности
могут быть, в частности, результатом
округлений при вычислениях или записи чисел в
память компьютера), называются плохо
обусловленными.
Плохо обусловленная система
геометрически соответствует почти параллельным
прямым.
23.2.1. Метод Гаусса. Систему
уравнений (23.2.1) представим в виде
апх{ + а{2х2+...+а{пхп = Ь{,
а2{х{ + а22х2+...+а2пхп = ЬЪ
апХхх +ап2х2+...+аппхп = Ь„,
(23.2.3)
Y^dijXj = bt, / = !,...-,/!.
Известно большое число схем метода
исключения, приспособленных для ручного
или машинного счета матриц общего или
специального вида.
Метод Гаусса можно интерпретировать
как метод, в котором первоначально матрица
приводится к верхней треугольной форме
(прямой ход), а далее - к единичной
(обратный ход). Очевидно, что если матрица
единичная, то х; = Ьг.
Пусть матрица системы (23.2.3) —
верхняя треугольная, поэтому а-^ = 0 при / > J ,
т.е. все элементы ниже главной диагонали
равны нулю. Тогда из последнего уравнения
сразу определяем хп . Подставляя его в
предпоследнее уравнение, находим хп_[ и т.д.
Общие формулы имеют вид:
Ч
акк
*к =■
акк
п ,
/=А:+1
(23.2.4)
к = п-\,п- 2,...,1 , при к>1, ак! = 0 .
Приведем матрицу системы (23.2.3) к
верхней треугольной. Вычтем из второго
уравнения системы (23.2.3) первое,
умноженное на такое число, чтобы коэффициент при
Х\ во втором уравнении обратился в нуль.
То же проделаем со всеми остальными
уравнениями. В результате все коэффициенты
первого столбца, лежащие ниже главной
диагонали, обратятся в нуль. Затем, используя
ВЫЧИСЛЕНИЕ ОПРЕДЕЛИТЕЛЯ И ОБРАТНОЙ МАТРИЦЫ
853
второе уравнение, обратим в нуль
соответствующие коэффициенты второго столбца.
Последовательно продолжая этот процесс,
приведем матрицу системы к верхней
треугольной форме.
Запишем общие формулы метода Гаусса.
Пусть проведено исключение коэффициентов
из к -1 столбца. Тогда останутся уравнения
с ненулевыми элементами ниже главной
диагонали:
У=*
•«?'
Xs =Ь,
(*)
k<i<n.
Умножим к-ю строку на число ст^ =
(*) / (*) I
= ат^ J ак£ , т > к , и вычтем из т-и
строки. Первый ненулевой элемент этой строки
обратится в нуль, а остальные изменятся по
формулам:
,(*+о _ „(*).
'ml
*тк
■С J^
um um
Lmkuk
b{k\ k<m.
Проведя вычисления по этим формулам
при всех указанных индексах, обратим в нуль
элементы А:-го столбца, лежащие ниже
главной диагонали. Аналогичная процедура
приводит матрицу системы к верхней треугольной
форме, при этом весь процесс приведения
называется прямым ходом метода Гаусса.
Вычисление неизвестных по формулам (23.2.4)
называют обратным ходом метода.
Обратный ход можно совершить иначе,
если обратить в нуль и все коэффициенты,
лежащие выше главной диагонали. Например,
элементы л-го столбца обращаются в нуль,
(") (")/ И
если a)J умножить на - ^I апп и сло"
жить с соответствующей строкой. Аналогично
обращаются в нуль и все остальные столбцы.
Если, кроме того, разделить затем каждое
уравнение на соответствующий элемент,
стоящий на главной диагонали, то матрица
системы становится единичной, а неизвест-
.(2л) .(2л)
ные Xi = о> ', где о> '
коэффициенты
правой части /-го уравнения после указанных
преобразований.
На некотором шаге прямого хода может
оказаться, что коэффициент я>f- ' Ф О, но мал
по сравнению с остальными элементами
матрицы системы и, в частности, мал по
сравнению с элементами первого столбца. Деление
коэффициентов системы на малую величину
может привести к значительным ошибкам
округления.
Для уменьшения ошибок округления
поступают следующим образом. Среди
элементов первого столбца д£.' каждой
промежуточной матрицы выбирают наибольший по
модулю (главный) элемент и путем
перестановки /-й строки и строки, содержащей
главный элемент, делают главный элемент
ведущим. Такая модификация метода исключения
Гаусса называется методом Гаусса с выбором
главного элемента. Случай появления
нулевых элементов исключается.
Для реализации метода требуется
примерно п /3 операций типа умножения и
п /3 операций типа сложения. Полезно
помнить, что оценка числа операций
определяется в основном операциями, затрачиваемыми
при выполнении прямого хода метода Гаусса.
Обратный ход метода Гаусса требует пример-
но п операций. Следовательно, если
требуется решить несколько систем линейных
алгебраических уравнений Ах - b с одной и
той же матрицей и различными правыми
частями, то общее число операций при решении
S систем будет оцениваться величиной
2 з 9
— n+Sn . В этом случае целесообразно
реализовать алгоритм метода Гаусса в виде
двух подпрограмм: первая подпрограмма
должна реализовывать прямой ход алгоритма
и получать на выходе верхнюю треугольную
матрицу, а вторая подпрограмма должна,
используя полученную матрицу, вычислять
решение системы для произвольной правой
части.
23.2.2. Вычисление определителя и
обратной матрицы. Определитель
треугольной матрицы равен произведению
диагональных элементов. В результате выполнения
прямого хода метода исключения система
линейных уравнений приводится к верхней
треугольной матрице. Следовательно,
определитель матрицы системы может быть
вычислен как произведение ведущих элементов:
л ттЛО
deM = (-l)*n4'
= 1
где к — количество перестановок строк при
использовании метода исключения с выбором
главного элемента. Вычисление определителя
требует примерно (2/3)я операций.
854
Глава 23.2. ЛИНЕЙНЫЕ УРАВНЕНИЯ
Для вычисления обратной матрицы
вспомним, что АА = Е, где А —
обратная матрица, а Е — единичная матрица.
Обозначим элементы обратной матрицы через
а. Тогда соотношение АА = Е можно
записать в виде
п
X*/*<**i = S/7 > 1 * / * л , (23.2.5)
А:=1
6/7 = 0, / * /.
Если рассматривать 1-й столбец
обратной матрицы как вектор, то он является
решением системы (23.2.5) с матрицей А со
специальной правой частью, в которой на /-м
месте стоит единица, а остальные - нули.
Решение этой системы для каждого /
дает элементы 1-го столбца обратной матрицы.
Таким образом, для обращения матрицы
необходимо решить п систем линейных
уравнений л-го порядка с одинаковой матрицей
А и различными правыми частями. Так как
приведение матрицы А к треугольной
выполняется только один раз, то для обращения
матрицы с использованием метода исключе-
ния требуется примерно 2п операций.
23.2.3. Метод прогонки. Системы
линейных уравнений с трехдиагональной
матрицей коэффициентов при неизвестных
являются наиболее важным и
распространенным случаем систем специального вида. В
таких системах отличны от нуля только
элементы, лежащие на главной диагонали и на
нижней и верхней диагоналях, прилегающих
к ней. К системам с трехдиагональными
матрицами приводят, например, задачи о сплайн-
интерполяции, о решении разностными
методами обыкновенных дифференциальных
уравнений и уравнений в частных
производных.
Метод прогонки принадлежит к числу
прямых методов решения систем линейных
уравнений и используется в тех случаях, когда
многие коэффициенты матрицы равны нулю.
Это обстоятельство учтено при реализации
метода прогонки, в котором исключаются
преобразования с нулевыми элементами. В
методе прогонки применительно к системе
линейных уравнений, имеющих трехдиаго-
нальную матрицу, можно выделить
следующие этапы:
1. Приведение трехдиагональной
матрицы к верхней треугольной (прямой ход). В
случае трехдиагональной матрицы это
означает приведение к двухдиагональной, т.е.
приведение исходной системы к системе,
содержащей по два неизвестных в каждом
уравнении, кроме последнего, в котором только
одно неизвестное.
2. Запись обратного хода в виде лс,- =
= Pi+[Xj+i + Ql+\ , так как преобразованная
матрица - двухдиагональная.
3. Вывод рекуррентного соотношения
для Pi+i и Qi+\ через Р-% и Qj и получение
соотношения для Р± и Qj (Р\ = Q\ = 0).
4. Осуществление обратного хода метода
прогонки и определение всех неизвестных.
Рассматриваемый ниже метод прогонки
представляет собой модификацию метода
исключения Гаусса, использующую
специальный регулярный вид матрицы системы.
Запишем систему линейных алгебраических
уравнений с трехдиагональной матрицей в
виде
aixi-\ - bixi + cixi+l = di> ' = 1,2,...,/i ,
a{ = cn = 0 . (23.2.6)
Это так называемый канонический вид
системы линейных уравнений метода
прогонки.
Прямой ход метода прогонки сводится к
исключению неизвестного Xj_[ в каждом
уравнении системы. Получаемая в результате
прямого хода система содержит в каждом
уравнении только два неизвестных х,- и xi+[,
и матрица ее — верхняя треугольная с двумя
диагоналями. Запишем /-ю строку
преобразованной двухдиагональной матрицы в виде
Xi = PMxM+QM. (23.2.7)
Если система (23.2.6) приведена к виду
(23.2.7), то обратный ход метода Гаусса
очевиден. Однако использование общих
алгоритмов прямого и обратного хода не
целесообразно. Построим эффективную
вычислительную схему, которая и составляет суть метода
прогонки. Для этого, уменьшив в (23.2.7)
индекс на единицу, запишем
*i-l = Pixi + Qi •
Подставляя это соотношение в (23.2.6),
имеем
а^Рм + Qi) - Ь(х-Х + eft = dt,
откуда нетрудно получить
ИТЕРАЦИОННЫЕ МЕТОДЫ
855
+[*/-«/fl]"1[fl/0/-d/]-
Сравнивая это соотношение с (23.2.7),
можем записать рекуррентные соотношения
Рм=С1[Ь,-а,Р,у1,
Qui = [a,Qi ~ di][b, - а^]-1 (23.2.8)
для вычисления так называемых прогоночных
коэффициентов.
Подчеркнем, что последующие значения
прогоночных коэффициентов /*-+i , Q/+1
вычисляются только по известным
коэффициентам системы (23.2.6) и известным
предыдущим значениям прогоночных
коэффициентов Р{, Qi.
Метод прогонки устойчив, если |^| < 1.
Метод прогонки корректен, если
bg - а^ * О.
Достаточным условием корректности
метода прогонки и устойчивости его к
погрешностям является условие преобладания
диагональных коэффициентов:
|б(|>|а(|+|с,|, / = 1,2,...,я.
Для реализации метода требуется
примерно 8/2 операций, из которых 3/2
операций типа умножения и 5/2 операций типа
сложения. При численном решении
дифференциальных уравнений используются
различные варианты метода прогонки: метод
встречных прогонок, потоковая прогонка,
матричная прогонка для систем векторных
уравнений.
п
Отметим, что detA = Т~Т[я/^ -Ь{\.
/=1
23.2.4. Итерационные методы. В
итерационных методах предполагается
осуществление трех следующих этапов: построение
итерационного процесса для вычисления
последовательных приближений, сходящегося к
точному решению (т.е. построение последова-
№ 0) (2) (к)
тельности векторов ху ', хК' , хК ', ..., хК ',
сходящихся к точному решению х );
определение критерия сходимости построенного
процесса, позволяющего определить момент
достижения требуемой точности;
исследование скорости сходимости и оптимизация
итерационного процесса с целью уменьшения
числа операций, необходимых для
достижения требуемой точности.
Итерационные методы обладают
свойством, позволяющим получить решение с
наперед заданной точностью, если доказана
сходимость метода. Принципиально точного
решения итерационные методы не дают,
поскольку оно достигается как предел
последовательности векторов. Прямой метод
принципиально дает точное решение, но из-за
ошибок округления, имеющих место на любых
компьютерах, оно не может быть достигнуто,
и априори даже трудно оценить, насколько
это решение отличается от точного. В связи с
отмеченным, иногда итерационные методы
позволяют получить решение с большей
точностью, чем прямые.
Ниже рассмотрим несколько
итерационных методов решения линейных
уравнений.
Метод простой итерации. В методе
простой итерации система (23.2.1) линейных
алгебраических уравнений Ах - Ь приводится
к эквивалентной системе вида
х = out + р . (23.2.9)
Решение системы (23.2.9) и,
следовательно, решение исходной системы (23.2.1)
ищется как предел при к —> ©о
последовательности векторов
х(*+1) = оис^ + р , к = 0,1,2,..., (23.2.10)
где jt ' - начальное приближение для
вектора решения.
Достаточное условие сходимости метода
простой итерации определяется условием
Н<1.
Метод Зейделя. В методе простой
итерации не используется кажущаяся очевидной
возможность улучшения сходимости
итерационного процесса — немедленное введение в
расчет вновь вычисленных компонент вектора
лг '. Эта возможность используется в
итерационном методе Зейделя. Итерационный
процесс для системы (23.2.9) выполняется при
этом по соотношению
/ = 1,2,. ..,/2, (23.2.11)
856
Глава 23.3. НЕЛИНЕЙНЫЕ УРАВНЕНИЯ
или для системы (23.2.1)
Глава 23.3
д-х
.(*+0
-1
^-2></*у - 2><
=i
*yxj •
у=|+1
Не вдаваясь в подробности, отметим,
что метод итераций Зейделя часто
действительно приводит к более быстрой сходимости,
чем метод простой итерации. Однако
возможны случаи, когда метод итераций Зейделя
сходится медленнее метода простой итерации,
и даже возможны случаи, когда метод простой
итерации сходится, а метод итераций Зейделя
расходится.
Отметим, что метод Зейделя сходится,
если матрица А положительно определенная
и симметричная.
Итерационный процесс записывают и в
более общей форме, а именно:
аГ1х\ + ' = (obj + (1 - (о)ацх)
■(*).
со
/-I
7=1
y=i+l
.(*+')
вводя в итерационный процесс для xj
значение х- ;, что не имеет место в методе
простой итерации и методе Зейделя.
Итерационный процесс при со > 1
называют методом верхней релаксации, при
со = 1 (метод Зейделя) — методом полной
релаксации и при со < 1 — методом нижней
релаксации.
Для некоторого простого случая при
специально выбранном со можно дать оценку
для числа итераций N , необходимого для
достижения заданной точности е :
N(e) = 0,2я2 1п(1/е); 0,1я2 1п(1/е);
0,64/i In(1/е)
соответственно для метода простой итерации,
метода Зейделя и метода верхней релаксации.
Очевидно, что число итераций тем больше,
чем больше порядок системы; при этом имеет
место квадратичная зависимость для первых
двух методов и линейная зависимость для
метода верхней релаксации. Очевидно
также, что число итераций тем больше, чем
меньше е .
НЕЛИНЕЙНЫЕ УРАВНЕНИЯ
23.3.1. Отделение корня. Пусть
имеется нелинейное уравнение
/М = о.
(23.3.1)
Требуется найти корни этого уравнения,
т.е. те значения х, которые обращают
уравнение (23.3.1) в тождество. В процессе
приближенного отыскания корней уравнения
(23.3.1) обычно выделяют два этапа:
отделение корня и уточнение корня.
Под отделением корня понимается
определение промежутка, содержащего один и
только один корень уравнения. Одна из точек
этого промежутка принимается за начальное
приближение корня.
На втором этапе уточнения при
нахождении корня используют два типа методов:
прямые и итерационные. В прямых методах
корень уравнения принципиально находится
за конечное, заранее известное число
операций. Прямыми методами удается решить
некоторые простейшие алгебраические и
тригонометрические уравнения.
В итерационных методах корень х
определяется как предел некоторой
последовательности jt ', дг' ',
дг ', и решение
принципиально не может быть достигнуто за
конечное, заранее известное число операций.
Основные методы решения нелинейных
уравнений и систем являются
итерационными, и к их числу принадлежат метод
дихотомии (половинного деления), метод простой
итерации, метод Ньютона (метод
касательных), метод секущих, метод парабол (метод
Мюллера), метод Зейделя. Ниже эти методы
будут рассмотрены.
Важной характеристикой итерационных
методов является скорость сходимости
процесса. Говорят, что метод имеет п-й порядок
I (к+\) *| п\ (к) *Г
сходимости, если \хК ' - х = С иг ' - х \ ,
где С — константа, не зависящая от п . При
п = 1 имеем сходимость первого порядка,
или линейную сходимость, а при /2 = 2 —
второго порядка, или квадратичную.
Говорят, что метод является одношаго-
вым, если для построения итерационной
последовательности нужно вычислить функцию
в одной точке, двушаговой — в двух и т.п.
Сравнение различных методов следует
проводить по числу операций при реализации
одной итерации и по скорости сходимости.
МЕТОД ПРОСТОЙ ИТЕРАЦИИ
857
Изложенные ниже методы решения
нелинейных уравнений и систем широко
используются в численных методах
оптимизации.
23.3.2. Метод дихотомии. Пусть
действительный корень уравнения /(лс) = 0
отделен и функция f(x) непрерывна на
интервале [а,Ь] отделения корня. Построим
процесс сужения интервала [о,Ь] такой, чтобы
искомый корень всегда находился внутри
суженного интервала. Очевидно, что в этом
случае погрешность приближенного значения
Ь^-аЦ
где
*м
корня не превышает
(г ' — граничные точки интервала на к-н
итерации. Найдем середину отрезка лг ' -
= (а + Ь)/2 и вычислим /((я + Ь)/2).
Составим произведения f(a) • /((д + £)/2) и
f(6) ■ ((д + £)/2). Из двух половин отрезков
выберем тот, где произведение отрицательно,
и обозначим новые границы . Затем
новый отрезок делим пополам, вновь
составляем аналогичные произведения и выбираем
тот из отрезков, где произведение
отрицательно.
23.3.3. Метод простой итерации. При
использовании метода простой итерации для
уточнения корня уравнение f(x) = О
заменяется эквивалентным уравнением
х = Ф(х),
(23.3.2)
т.е. таким, что из
fix* J = 0 следует х* =
= (plx j и наоборот. Привести уравнение
(23.3.1) к (23.3.2) можно многими способами,
например, положив ф(х) = х + \|/(лс)/(лс), где
\|/(х) - непрерывная произвольная
знакопостоянная функция.
Геометрически уравнение (23.3.2) на
интервале отделения корня представляется в
виде двух пересекающихся линий у - х
и у = ф(х) (рис. 23.3.1). Полагая, что известно
начальное приближение дг' ' для значения
корня х , построим итерационный процесс
х(*+1) = ф(х(А:)1, к = 0,1,2,..., (23.3.3)
изображенный на рис. 23.3.1 ломаной линией
со стрелочками, указывающими направление
движения. Видим, что для представленного на
рис. 23.3.1 случая взаимного расположения
линий у = х и у = ф(х) неограниченное
повторение вычислений по соотношению
(23.3.3) позволяет сколь угодно близко подой-
ти к точному значению корня х .
Можно показать, что условие
кн
<1
(23.3.4)
является достаточным условием сходимости
итераций.
Исходное уравнение /(х) = 0 может
быть преобразовано к виду х = ф(х) многими
способами, и, очевидно, для метода итерации
целесообразно брать то уравнение X = ф(х),
для которого q имеет наименьшее значение.
Для пояснения рассмотрим
классический пример вычисления квадратного корня.
Исходное уравнение f(x) - х - а = 0
(а > 0) преобразуем к виду х = ф(х) тремя
способами, приведенными в табл. 23.3.1 в
первом столбце.
Анализ поведения ф (х) вблизи корня
(третий столбец таблицы) показывает, что при
удачном выборе представления х = ф(х)
можно обеспечить высокую скорость
сходимости итерационного процесса без
ограничения диапазона параметра а . Третье
уравнение х = (х + а/х)12 используется для
вычисления квадратного корня на компьютере. Таким
Рис. 23.3.1
858
Глава 23.3. НЕЛИНЕЙНЫЕ УРАВНЕНИЯ
23.3.1. К методу простой итерации
ф(*)
а
X
х2 + х- а
(х + а/х)
2
ф'М
а
2х + \
(l-a/x>)
2
Поведение ф (х)
ф'(х л -> 1 при х -> ±4а
W(x)\ < 1 при хе(- 1,0)
|ф'(дс)| > 1 при х е (- 1,0)
ф'М -> 0 при х -> ±Vtf
Сходимость метода
Не сходится
Сходится в ограниченном
интервале к отрицательному
значению корня
Сходится, и очень быстро
образом, в методе простой итерации важен
выбор вида функций ф(х). Отметим, что
метод простой итерации обобщается на
случай систем линейных уравнений.
23.3.4. Метод Ньютона. Метод
секущих. Метод парабол. Вновь рассмотрим
уравнение (23.3.1). Полагая, что погрешность
(к) * (к)
ev ' = х - ху ' имеет малую величину, а
функция f(x) — непрерывную вторую
производную, разложим fix j в ряд Тейлора:
fe(*)f
где Учитывая, что f[x*) = 0
и оставляя только линейную часть
разложения в ряд (отсюда и другое название метода -
метод линеаризации), можем записать
приближенное, линейное относительно
погрешности, уравнение
я погрешности имеем
(А) = -/(^))//'(^)). (23.3.5)
уточненное значение корня, которое обозна-
чим хК '. Тогда можем записать основное
соотношение метода Ньютона в виде
*<*+|) = *(*)-
¥1
(23.3.6)
Это соотношение позволяет построить
последовательность приближений х^ ',
к = 0,1,2,..., к точному значению корня по
заданному начальному приближению jr '.
Геометрически процесс (23.3.6) означает
замену на каждой итерации кривой у - f(x)
касательной к ней в точке
(*<*>,/(*«)). и
определение значения х^ + ' как координаты
точки пересечения касательной и оси абсцисс
(рис. 23.3.2). С рассмотренной
интерпретацией соотношения (23.3.6) связано еще одно
название метода — метод касательных.
откуда для погрешности имеем
е
Так как использована лишь линейная
часть разложения в ряд, то при подстановке
(23.3.5) в соотношение х = х^ ' + е^ ',
следующее из соотношения для погрешности,
*
получим вместо х лишь приближенное
*<*+1> *<*> х
Рис. 23.3.2
МЕТОД НЬЮТОНА. МЕТОД СЕКУЩИХ. МЕТОД ПАРАБОЛ
859
Можно показать, что метод Ньютона
имеет вблизи корня второй порядок
сходимости: на каждой итерации ошибка меняется
пропорционально квадрату ошибки на
предыдущей итерации. Нетрудно видеть, что метод
Ньютона является одношаговым.
Преимущества метода Ньютона состоят в его
квадратичной сходимости, возможности обобщения на
случай систем уравнений, а также в том, что
он является одношаговым.
Метод секущих. В методе секущих
приближенное значение производной / (лс) в
формуле (23.3.6) определяется по двум после-
К особенностям метода следует отнести
следующее: в методе не требуется
непосредственное вычисление производной / (х) на
каждой итерации, что может привести к
существенному уменьшению объема
вычислений; метод является двухшаговым, и, в
частности, на первой итерации вычислений необ-
(о)
и
довательным приближениям
и [*<*Ц*«)],
pM^Mj]
по соотношению
J{ J r(*)_r(*-l)
Ху ' - Ху
что приводит к замене касательной в точке
секущей, проведенной через
рЦ^)]
две точки кривой у = f(x) (рис. 23.3.3); или,
что то же самое, - к аппроксимации функции
f(x) на этом интервале линейной функцией.
Условия сходимости метода секущих
аналогичны условиям сходимости метода
Ньютона. Порядок сходимости метода
секущих определяется соотношениями
(*+|) ~ ™Д*)р(*-о
ае
- а'"[е<*>]'
где о = (1/2)/^)//^*)), /> = V5/2 =
= 1,618.
У1 у = Ях)
ходимо знать два начальных значения х
лг '; сходимость метода может быть
немонотонной даже в малой окрестности корня; в
знаменателе формулы для вычисления дг* + '
стоит разность двух величин:
/(*<*-")],
, w»y
которые имеют вблизи корня
малые и близкие значения, что может
привести к заметным погрешностям вычислений,
особенно для кратных корней.
Метод парабол. Рассмотренный выше
метод секущих можно интерпретировать как
метод, в котором на каждой итерации
исходная функция аппроксимируется линейной
функцией (секущей), построенной по двум
точкам, принадлежащим f(x). Развивая
далее идеи аппроксимации, можно для
построения итерационных формул использовать
информацию о функции в нескольких точках,
предшествующих точке дг '. В методе
парабол по трем последовательным приближениям
[>,/(*(*))]
строится многочлен второй степени
(парабола), приближающий исходную функцию. За
новое приближение берется обычно ближай-
шии к хк ' корень соответствующего
квадратного уравнения. Геометрическая
интерпретация метода парабол дана на рис. 23.3.4.
В качестве JT ' выбирается тот из
корней квадратного уравнения, у которого
величина рг + ' - х^ '\ наименьшая.
Доказывается, что погрешность метода
определяется соотношением
е(*+1) т е(*у*-1)е(*-2) . р)]' >
Рис. 23.3.3
860
Глава 23 3. НЕЛИНЕЙНЫЕ УРАВНЕНИЯ
>Ч
у=№
Х2
х(**1>х<*> *<*-» *<*-*> х
Рис. 23.3.4
где /> = 1,839.
Это означает, что, несмотря на
привлечение дополнительной информации о
функции, метод парабол имеет порядок
сходимости, лишь немного превышающий порядок
сходимости метода секущих. Вместе с тем
возникают задачи решения квадратного
уравнения, выбора одного из двух корней
многочлена и, самое важное, определения области
гарантированной сходимости метода. Если
три приближения для построения многочлена
выбраны далеко от корня и содержат
погрешности, то возможно самое неожиданное
поведение решения.
Отметим, что метод парабол успешно
применяется для отыскания корней
многочленов, в том числе комплексных; при этом
метод обладает тем замечательным свойством,
что начальное приближение может быть
действительным. Метод парабол является трех-
шаговым методом.
23.3.5. Системы нелинейных
уравнений. Наиболее употребительны для уточнения
корней систем нелинейных уравнений методы
итерации (метод простой итерации и метод
Зейделя) и метод Ньютона. Как и в случае
уточнения корней одного нелинейного
уравнения, для систем нелинейных уравнений
требуется определение хорошего начального
приближения (отделение корня),
гарантирующего сходимость метода и высокую
скорость сходимости. Для системы двух
уравнений это может быть сделано графически, но
для систем высоких порядков
удовлетворительных методов отделения корней не
существует.
Метод простой итерации. Систему
нелинейных уравнений запишем в векторной
форме
/М = о,
(23.3.7)
где x = [xi,X2,".9xn) - вектор-столбец
неизвестных (символ «Т» означает операцию
транспонирования), /(дс)=[/1(дс),/2(дс),...,/я(дс)] -
вектор-столбец функций. В методе простой
итерации система (23.3.7) приводится к
эквивалентной системе вида х = ф(х), где ф(х) =
т
= [ф1(*).Ф2(*)»»-.Ф/(*)] 'ИЛИ
х{ =ф1(дс1>х2 ,...,*„),
*2=ф2(*ь*2 ,..,*„), (2338)
*л=ФЛ*1>*2 >".,*„).
Полагая известным начальное прибли-
(0) ( (0) (0) (0)V
жение для корня jcw = jcf ' ,х^ ,.->*л
построим итерационный процесс хк ' =
= Jx^\ к = 0,1,2,..., или
(*+0
х\ > = щ
г(*+0
:ф2
1 » 2 '" * ' "
(23.3.9)
<^ = ^\4к1--Лк))
Достаточное условие сходимости
итерационного процесса (23.3.9) формулируется
следующим образом: если какая-либо норма
матрицы Др, согласованная с
рассматриваемой нормой вектора х, меньше единицы, то
метод итераций сходится. Условие сходимости
Др < 1 есть обобщение на случай
нелинейной системы условия (23.3.4) для одного
уравнения.
Метод Ньютона. Основная идея метода
Ньютона - решение системы нелинейных
уравнений f(x) = 0 — сводится к решению
последовательности линейных задач, дающих
в пределе решение исходной задачи.
Линейная задача получается путем выделения из
нелинейных уравнений главной линейной
части.
По аналогии с решением одного
уравнения можем записать итерационный процесс
для нахождения вектора х в виде
x(*+1) = x(*)_[i4(*)j-1/(*),A = 04A...,
МЕТОД ВРАЩЕНИЯ
861
где \ЛК ' \ - матрица, обратная матрице
Якоби (матрице производных системы
функций fj ). Представленная выше формула
есть обобщение формулы (23.3.6) на случай
систем нелинейных уравнений.
Глава 23.4
ВЫЧИСЛЕНИЕ
СОБСТВЕННЫХ ЗНАЧЕНИЙ
И СОБСТВЕННЫХ ВЕКТОРОВ МАТРИЦ
Во многих задачах механики, физики,
химии и связанных с ними задачах алгебры и
вычислительной математики вместе с
квадратной матрицей А порядка п приходится
рассматривать уравнение
det(,4-A,£) = 0, (23.4.1)
называемое характеристическим или вековым
уравнением матрицы А, и однородную
систему
(А - ХЕ)х = О , (23.4.2)
где Е - единичная матрица порядка п , х -
вектор-столбец.
Уравнение (23.4.1) есть алгебраическое
уравнение (многочлен) степени п вида
(-ir(*."-M"-I-M"-2-...-A,) =
= {-\)пР„{\). (23.4.3)
Корни этого многочлена А,,-, / = 1,...,л
называются собственными
(характеристическими) значениями (числами) матрицы А.
Однородная система (23.4.2) имеет ненулевое
решение лишь в том случае, если А,, есть
собственные значения матрицы А.
Соответствующие каждому %i ненулевые решения х
системы (23.4.2) называются собственными
векторами матрицы А.
С точки зрения линейной алгебры
задача о собственных значениях и векторах
включает: составление характеристического
многочлена (23.4.3), отыскание корней этого
многочлена (собственных значений), решение для
каждого А,,- однородной системы (23.4.2) -
определение собственных векторов
матрицы А.
Говорят о полной проблеме собственных
значений, если требуется определить все
собственные значения (и собственные векторы)
матрицы А, и о частичных проблемах
собственных значений, если требуется найти лишь
отдельные собственные значения, например,
максимальное или минимальное. Обобщенная
проблема собственных значений возникает
при решении системы Ах = ХВх, а общая -
тогда, когда все коэффициенты матрицы А
зависят от А,.
Существуют три группы методов
решения второй проблемы линейной алгебры. В
первой группе методов (методы отражения,
вращения (прямой и итерационный) и
QL-алгоритм) матрица приводится к какому-
либо специальному виду, например,
диагональному или трехдиагональному, когда
вычисление собственных чисел - простая задача.
Во второй группе (методы Данилевского, Ле-
верье, Крылова, Ланцоша) матрицы
приводятся к такой форме, чтобы вычисление
коэффициентов характеристического
многочлена было тривиальным, т.е. проводится
восстановление характеристического многочлена. И,
наконец, в третьей группе - методов
интерполяции - собственные числа определяются с
использованием интерполяционных
многочленов.
23.4.1. Метод вращения. Метод
предложен в 1846 г. Якоби и позволяет решить
полную проблему собственных значений для
эрмитовых матриц. Для простоты рассмотрим
метод вращений для частного случая
эрмитовых матриц - действительных
симметрических матриц. В основе метода лежит тот факт,
что действительная симметрическая матрица
может быть приведена подобным
преобразованием к диагональному виду. Метод Якоби
основан на использовании нескольких
оригинальных идей. Во-первых, используется
преобразование подобия S~ AS , сохраняющее
собственные числа. Во-вторых, при этом
преобразовании используются ортогональные
матрицы, приводящие матрицу А к
диагональной матрице Л . Отметим, что априори
соответствующая ортогональная матрица
неизвестна и цель метода — в конечном итоге ее
получить. В-третьих, согласно соотношению
Л = U~ AU , в качестве ортогональной
матрицы в каждой итерации используется
матрица вращения. В-четвертых, итерационный
процесс строится таким образом, чтобы после
каждой итерации происходило уменьшение
суммы квадратов внедиагональных элементов.
В-пятых, реализация такого итерационного
процесса на каждом этапе приводит к
обнулению максимального элемента матрицы и
определению угла ф в матрице вращения.
Матрицей элементарного вращения
называется матрица вида (она ортогональна)
862 Глава 23.4. ВЫЧИСЛЕНИЕ СОБСТВЕННЫХ ЗНАЧЕНИЙ И ВЕКТОРОВ МАТРИЦ
^ =
1 О
О 1
о о
о о
О 0 ... coscp ... -sincp ... О О
О 0 ... 1 ... О О
О О
О О
Slll(p
Название «матрица вращения» связано с
тем, что в пространстве R (на плоскости)
матрица является матрицей преобразования
декартовых координат при повороте осей на
угол ф. Непосредственным умножением
нетрудно убедиться, что Ujj = Uy , ибо, если
матрица ^//(ф) является ортогональной,
обратная матрица равна транспонированной.
Столь простая возможность получения
обратной матрицы, необходимой для выполнения
подобного преобразования, весьма ценна с
точки зрения эффективности метода. В
итерационном методе вращения строится
бесконечная последовательность подобных
преобразований с помощью матриц вращения —
такая, что в пределе исходная матрица
преобразуется к диагональному виду. Рассмотрим
алгоритм метода и покажем, что он
действительно обеспечивает требуемое
преобразование.
Предположим, что на некоторой А>й
итерации построена матрица AS '. Выбираем
в ней какой-либо внедиагональный элемент
ajj ', максимальный по модулю. Так как
матрица симметрична, то без ущерба для
общности можно считать, что / < j . По индексам
i и j строим матрицу вращения (А ' и
выполняем подобное преобразование над
матрицей л" '. В результате получаем
матрицу А^ ' =\U.. Ally \ , отличающуюся от
матрицы AS ' только элементами / и j
строк и столбцов.
О О
О 1
СОБф
т
j
Соотношения для вычисления
элементов / и j строк и столбцов запишутся в
следующем виде (для упрощения записи
введем промежуточную матрицу 12г ' =
= ЫС/у-] )• Учитывая вид матрицы
^|у(ф)» отметим, что все столбцы матрицы
/Г ', кроме / и j, будут такими же, как и
у матрицы
Приравнивая а
(*+0
и
нулю, получаем
выражение для определения угла ф^ ',
обеспечивающего при подобном преобразовании с
помощью матрицы вращения зануление
элемента матрицы Аг + ' с индексами / и у и
симметричного ему элемента. Имеем
tg29W =
2а»
1«
К-*?)
(23.4.4)
Таким образом, подобное
преобразование при выборе матрицы вращения с
соотношением (23.4.4) зануляет элемент с индексами
/ и у и симметричный ему элемент
матрицы AS + '. При этом происходит изменение
всех остальных элементов / и j строк и
столбцов (и, в частности, тех, которые, может
быть, на предыдущих итерациях были
обращены в нуль). Показывается, что в
построенном процессе все внедиагональные элементы
ИНТЕРПОЛЯЦИОННЫЕ МНОГОЧЛЕНЫ ЛАГРАНЖА И НЬЮТОНА
863
матрицы при достаточном числе подобных
преобразований (итераций) становятся сколь
угодно малыми.
Можно показать, что сумма квадратов
внедиагональных элементов t(A) на каждой
итерации уменьшается, так что имеет место
соотношение
д*)4
или /
[,«]=
Можно также показать, что /
< qkt(A), где q < 1 - 2J(n(n + 1)), т.е.
сходимость итерационного метода вращения
ухудшается с увеличением п .
Собственные векторы являются столб-
К
цами матрицы U = ТТ Ш ' . В методе вра-
А:=0
щения для вычисления собственных значений
требуется 50л операций. В качестве
хорошего нулевого приближения к методу Гаусса
служит метод вращения Гивенса,
применимый к неэрмитовым матрицам.
Глава 23.5
ПРИБЛИЖЕНИЕ ФУНКЦИЙ
Во многих практически важных задачах
возникает проблема замены некоторой
функции, заданной аналитически или таблично,
другой, близкой к первой, в некотором
смысле, но более простой и удобной при
вычислениях. Например, замена функции
многочленом позволяет получить простые формулы
численного интегрирования и
дифференцирования; замена таблицы приближающей
функцией позволяет получить значения в ее
промежуточных точках. Эти примеры можно
продолжить и дальше.
Возникает также и вторая задача —
восстановление функции на некотором отрезке
по заданным на этом отрезке значениям
функции в дискретном множестве точек.
Отметим также, что теория приближения
функций является важным вспомогательным
аппаратом при численном решении
дифференциальных уравнений.
В общем случае при постановке задачи
приближения необходимо ответить на
следующие вопросы:
Рис. 23.5.1
во-первых, какой класс приближенных
функций необходимо выбрать. Ответ на такой
вопрос зависит от вида приближаемой
функции и ее целей, для которых в дальнейшем
будет использоваться приближающая
функция. Широко используются следующие
классы функций: многочлены,
тригонометрические функции, показательные функции и др.;
во-вторых, надо выбрать критерий
близости исходной и приближающей функции. В
качестве критерия можно выбрать, например,
точное совпадение приближаемой и
приближающей функций в узловых точках (лагран-
жева интерполяция); минимум суммы
квадратов отклонения в узловых точках (метод
наименьших квадратов) и другие. Как и при
выборе класса приближающих функций, выбор
критерия близости исходной и
приближающей функций определяется целью построения
приближающей функции и может сильно
повлиять на результаты. При аппроксимации
экспериментальных результатов
целесообразно использовать среднеквадратичное
приближение. На рис. 23.5.1 показаны эти два случая
приближения функций. В первом случае
целесообразно использовать интерполяцию
(сплошная линия), во втором —
среднеквадратичное приближение (штриховая линия), так
как интерполяция (сплошная линия) может
неверно описывать свойства функций и лишь
усугублять ошибки эксперимента;
в-третьих, необходимо указать правило,
позволяющее с заданной степенью точности
получить значение функции в промежутках
между узлами, в частности, ответить на
вопросы, какие узлы использовать для
построения приближающей функции и как их
расположить.
Таким образом, построение
приближающей функции существенно зависит от
ответа на перечисленные выше вопросы.
23.5.1. Интерполяционные
многочлены Лагранжа и Ньютона. Пусть на отрезке
\а,Ь\ задано дискретное множество
несовпадающих точек JC;, которые будем называть
864
Глава 23.5. ПРИБЛИЖЕНИЕ ФУНКЦИЙ
узлами и в которых известны значения
функции fi = f(xj), i = 0,...,л . Потребуем,
чтобы приближающая функция ф(л:,я)
совпадала с приближаемой /(•*) в (п + 1) узле
таблицы, т.е. потребуем выполнения равенства
q>(xha09...,an) = /(*,-) = /), / = 0,...,л.
(23.5.1)
Этот способ построения приближающей
функции, при котором в узлах значения
приближаемой и приближающей функций
совпадают, называется интерполяцией, или ла-
гранжевой интерполяцией. Наиболее
распространен способ линейной интерполяции, в
случае которой приближающая функция
ищется в виде линейной комбинации
некоторых базисных функций ф,-(х):
п
ф(дс/,л0,...,ля) = ^А/ф/(дс). (23.5.2)
/=0
Система функций ф/(х) должна быть
линейно независимой, так как в противном
случае число членов в сумме можно было бы
уменьшить и, кроме того,
deti
Фо(*о) ф](*о) ••• Фя(*о)|
ФоЫ <Pi(*i) ... Ф„(*|)
*0.
Подставляя (23.5.2) в (23.5.1), получаем
систему линейных уравнений для
определения коэффициентов аг:
п
fk =ХЛ'Ф'(**)' к = 0,...,п.
/=1
В качестве базисных функций можно
выбрать любую линейно независимую систему
функций, но обычно выбираются степенные
функции 1,х,х ,...9х". Это объясняется
тем, что многочлены легко вычисляются, и
теория интерполяции многочленами хорошо
разработана. В случае приближения
многочленами приближающую функцию ищем в
виде многочлена степени п :
п
/=0
где нижний индекс п указывает на степень
интерполяционного многочлена. Подставляя в
(23.5.3) значения узлов и используя условие
Рп {xi) = fi , получаем систему линейных
алгебраических уравнений относительно
коэффициентов Oj:
п
^я,*'= Д, к = 0,...,п. (23.5.4)
/=0
Определитель системы (23.5.4) является
в случае несовпадения узлов интерполяции
отличным от нуля определителем Вандер-
монда:
1 х0 х0
1 дс, х\
*0
х\
= П(*;-*<>°<
у>/>0
Таким образом, решение системы
(23.5.4) существует и единственно. А это
значит, что интерполяционный многочлен Рп(х)
существует и единствен с точностью до
формы записи.
Интерполяционный многочлен в форме
Лагранжа. Будем искать интерполяционный
многочлен в виде
/=0
(23.5.5)
Здесь //(*) — многочлены степени п, так
называемые лагранжевы многочлены
влияния, удовлетворяющие условию
'/(*;) =
1, при / = У,
0, при / ф j.
Последнее условие означает, что любой
многочлен /,-(*) равен нулю при каждом Xj
кроме xi9 т.е. х0,х,,... ,*,_,,x/+h... 9x„ ~
корни этого многочлена. Следовательно,
/,-(х) имеют вид
li(x) = Cj(x-xQ)(x-Xi)...
...(х-Х1_{)(х-х1+[)...(х-хп).
Так как по условию //(*/) = 1 , то
ИНТЕРПОЛЯЦИОННЫЕ МНОГОЧЛЕНЫ ЛАГРАНЖА И НЬЮТОНА
865
...(Xj -*,_, )(*,- -Xi+l )..,(*, -Хп)}.
Таким образом, лагранжевы многочлены
влияния
1,{х)т П 7ГТ1-
а интерполяционный многочлен (23.5.5)
запишется в виде
м*ы/,- п t-A
/=0 j=0J*i\xi ~xjJ
(23.5.6)
Интерполяционный многочлен,
записанный в форме (23.5.6), называется
интерполяционным многочленом Лагранжа. Важным
преимуществом этой формы записи
интерполяционного многочлена является то, что
число арифметических операций, необходимых
для построения многочлена Лагранжа, про-
2
порционально п и является наименьшим
для всех форм записи. К преимуществам
можно отнести также и то, что формула
(23.5.6) в явном виде содержит значения
функций в узлах интерполяции, что бывает
удобно при некоторых вычислениях, в
частности, при построении формул численного
интегрирования. Формула (23.5.6) применима
как для равноотстоящих, так и для
неравноотстоящих узлов. Преимуществом
интерполяционного многочлена Лагранжа является и то,
что он особенно удобен, когда значения
функций меняются, а узлы интерполяции
неизменны, что имеет место во многих
экспериментальных исследованиях. К недостаткам
этой формы записи можно отнести то, что с
изменением числа узлов приходится все
вычисление проводить заново. Это затрудняет
проведение апостериорных оценок точности
(оценок, получающихся в процессе расчета).
Введем функцию 0)/н_| = (х-Хц)х
п
*(x-Xi)...{x-xn) = Y[{x-xi).
1=0
Отметим, что (D/?+j(.x) есть многочлен
степени п + 1 . Тогда формулу (23.5.6) можно
записать в виде
U*) = tfi{ ""'ft, ,- (23.5.7)
Приведем формулы линейной и
квадратичной интерполяции по Лагранжу
W- /0/^ + /,^Ц, (23.5.8)
(Xq-X{) (*1-*o)
L ,x\ = f (*-*0 I*"*?) , / (*-*0) „
° {хо -х{) fa - х2) [ (*i-*o)
х(*~*2) - {Х-Хр) {Х~Х{)
(х{-х2) 2{x2-Xo)(x2-x{y
(23.5.9)
В (23.5.8) и (23.5.9) многочлен Лагранжа
имеет соответственно первую и вторую
степень.
Эти формулы наиболее часто
используются на практике. Пусть задан (п + 1) узел
интерполяции. На этих узлах можно
построить один интерполяционный многочлен л-й
степени, (п - 1) многочлен первой степени и
большой набор многочленов степени меньше
п , опирающиеся на некоторые из этих узлов.
Теоретически максимальную точность
обеспечивает многочлен более высокой степени.
Однако на практике наиболее часто
используют многочлены невысоких степеней, во
избежание погрешностей при расчетах
коэффициентов при больших степенях
многочлена.
Интерполяционный многочлен в форме
Ньютона. Этот многочлен представляет иную
форму записи интерпрляционного
многочлена. Но так как эта форма записи имеет ряд
преимуществ по сравнению с многочленом
Лагранжа, получим ее.
Для вывода введем понятие разделенной
разности. Разделенные разности нулевого
порядка совпадают со значениями функции в
узлах. Разделенные разности первого порядка
обозначаются f(xi9xA и определяются через
разделенные разности нулевого порядка:
f(xhxj) = UzlL,
V "" Ъ-Xj
разделенные разности второго порядка
определяются через разделенные разности первого
порядка:
, f{xi9xj)-f(xj9xk)
J{Xi,Xj,Xk)- ——
л/ л, к
Разделенная разность порядка п
определяется соотношениями
28 — 7706
866
Глава 23.5. ПРИБЛИЖЕНИЕ ФУНКЦИЙ
J \Xj,Xj ,X/c ,...,Хп_[, Xn J —
_ f(Xi,Xj,Xfc>--->xn-l)- f{xj>xk>'->xn)
X[ — Xn
(23.5.10)
Таким образом, для (п +1) -й точки
могут быть построены разделенные разности
до ai-го порядка; разделенные разности более
высоких порядков равны нулю. Из вида
разделенных разностей можно сделать
заключение, что они являются аналогом производных
соответствующих порядков.
Между разделенными разностями и
производными соответствующих порядков
существует соотношение
f("\x) = n\f(x0,x[9...,xn).
Очевидно, что разделенная разность
(п + 1) -го порядка от многочлена л-й степени
равна нулю.
Во многих учебниках для таблиц с
постоянным шагом h вводят конечные
разности дР f , связанные с разделенными
соотношением
Anf = fi"n\f(x0,xl х„).
Используя выражения для разделенных
разностей, получаем в итоге:
М*) = /(*о)^-*о)/(*0,*1 ) + (*"*() )х
х (х - xl)f(x0,xl,x2)+...+(x - х0\х - х,)...
...(дс-хя)/(х0,дс, ,...,*„). (23.5.11)
Запись многочлена в формуле (23.5.11)
есть так называемый интерполяционный
многочлен Ньютона.
За точностью расчета удобно следить по
убыванию членов суммы (23.5.11). Если
величина членов убывает быстро, то оставляют
только те из них, которые больше допустимой
погрешности. Для повышения точности
интерполяции в сумму могут быть добавлены
новые члены, что требует подключения
дополнительных узлов. При этом безразлично, в
каком порядке подключаются новые узлы.
Этим формула Ньютона выгодно отличается
от формулы Лагранжа, при добавлении в
которую новых узлов все расчеты надо
проводить заново. Интерполяционный многочлен
Ньютона удобен при построении формул
численного дифференцирования, что очевидно
из его вида. Кроме того, он удобен для
проведения апостериорных оценок.
Приведем формулы линейной и
квадратичной интерполяции в соответствии с
многочленом Ньютона. Имеем:
fl (*) = Л+(*-*о}
/о-Л
Xq -X[
(23.5.12)
Р2{х) = /о+(х-хо)^-^ + (х-хо)<
Xq -X|
;(*-*l)
/О-/. /|-/2
*0 - *1 х\~ х2
Xq - Х2
(23.5.13)
Нетрудно убедиться, что эти формулы
будут совпадать с соответствующими
формулами для интерполяционного члена Лагранжа
после простых преобразований. Очевидно, что
это утверждение есть следствие условия
единственности интерполяционного многочлена.
23.5.2. Погрешность и сходимость
интерполяции. Построив для функции f(x)
интерполяционный многочлен Рп(х) или
Ln(x), необходимо выяснить, насколько
близко интерполяционный многочлен
приближается к функции в других точках отрезка.
Ошибку интерполяции можно представить в
следующем виде:
Яп{х) = £п{х) = /{х)-Рп(х) = «>п+{{х)г(х),
(23.5.14)
так как ошибка интерполяции обращается в
нуль в узлах сетки.
Для £я(х) можно записать
-4*1*
(^К+'И,
(23.5.15)
/{"+%)
. £<фо.*л]-
где Мп+[ = max
Формула (23.5.15) дает возможность
провести априорную оценку точности, т.е. для
случая аналитически заданной функции f(x)
провести оценку до начала вычислений.
Однако априорной оценкой пользуются редко.
Удобнее применять апостериорную оценку по
первому отброшенному члену
интерполяционного многочлена Ньютона.
СПЛАЙНЫ
867
Рис. 23.5.2
На рис. 23.5.2 представлена функция
^f/i+nW ддя равноотстоящих узлов. Из рис.
23.5.2 следует (на примере
интерполяционного многочлена пятой степени), что
максимумы (0(п+{)(х) меньше вблизи центрального
узла интерполяции, больше вблизи крайних
узлов и быстро возрастают при выходе за
центральные узлы интерполяции. Приближение,
когда точка, в которой ищется значение
приближающей функции, находится за пределами
отрезка интерполяции, называется
экстраполяцией. При экстраполяции в точках, далеко
отстоящих от концов отрезка интерполяции,
ошибка приближения может стать
значительной. Ошибка интерполяции в центральном
интервале при постоянном шаге таблицы
определяется следующим выражением:
В,;И * VrtM'/+I|fj
(23.5.16)
Поэтому при постоянном шаге таблицы
точку х выгодно выбирать вблизи середины
отрезка интерполирования.
Задача об оптимальном распределении
узлов на отрезке интерполирования,
приводящем к минимизации ошибки
интерполирования, решена П.Л. Чебышевым. Им
показано, что если узлы интерполяции не
распределены равномерно, а совпадают с корнями так
называемых чебышевских полиномов степени
п + 1, то ошибка многочленной
интерполяции минимальна. При таком выборе узлов
интерполяции проблема расходимости
многочлена для процедуры Рунге исчезает. Если
интерполяция проводится на интервале
(а,Ь), то узлы интерполяционного
многочлена следует расположить в нулях многочлена
Чебышева, т.е. в точках х,, где
Ь + а Ь-а
Zi = COS
.(2(«+ 0)
+ /-
л + 1
, / = 0,...,л
На практике для повышения точности
интерполяционного многочлена, как правило,
уменьшают шаг таблицы, оставляя
неизменной степень интерполирующего многочлена.
Для того чтобы уменьшить влияние
колебательных свойств интерполяционного
многочлена, пользуются линейной или
квадратичной интерполяцией.
23.5.3. Сплайны. Использование одной
интерполяционной формулы на большом
числе узлов, как отмечалось в предыдущем
разделе, нецелесообразно. Такой
интерполяционный многочлен сильно проявляет свои
колебательные свойства, и его значения
между узлами могут сильно отличаться от
значений интерполируемой функции. Одна из
возможностей преодоления этого недостатка
заключается в применении
сплайн-интерполяции. Суть сплайн-интерполяции
заключается в определении интерполирующей функции
по формулам одного типа для различных
подмножеств и в стыковке значений функции
и ее производных на границах подмножеств.
Наиболее изученным и широко
применяемым является случай, когда между
любыми двумя точками строится многочлен л-й
степени:
п
SiX)=^aikXk > */-! <*<*/,
к=0
который в узлах интерполяции принимает
значения интерполируемой функции и
непрерывен вместе со своими (п - 1)
производными. Такой кусочно-непрерывный
интерполяционный многочлен называется сплайном.
Его коэффициенты находят из условий в
узлах сетки: равенства значений сплайна и
приближаемой функции, а также равенства п - 1
производной соответствующих многочленов.
Максимальная по всем частичным
отрезкам степень многочленов называется
степенью сплайна, а разница между степенью
сплайна и порядком наивысшей непрерывной
производной — дефектом сплайна (def)-
Одним из наиболее распространенных
интерполяционных сплайнов является
кубический интерполяционный сплайн (def = 1).
Для вывода уравнения кубического интерпо-
28*
868
Глава 23 5. ПРИБЛИЖЕНИЕ ФУНКЦИЙ
ляционного сплайна воспользуемся его
интерпретацией как гибкой линейки, изогнутой
таким образом, что она проходит через
значения функции в узлах сетки, т.е. является
упругим бруском в состоянии свободного
равновесия. Так как это его состояние
описывается уравнением S (х) = 0, где S (х) -
четвертая производная, то между каждой
парой соседних узлов интерполяционная
формула записывается в виде многочлена третьей
степени. Этот многочлен удобно представить
как
S(x) = dj + bt(x - Xj_i) + Cj(x - X/_j) +
+ di(x-Xi_x) ,
JC/_| < X < Xj , / = 1,2,...,Я .
(23.5.17)
Для построения кубического сплайна
необходимо построить п многочленов
третьей степени, т.е. определить An неизвестных
Я/ > Ь\, с,-, dj . Эти коэффициенты ищутся
из условий в узлах сетки. По определению, в
узлах сетки сплайн (23.5.17) должен
принимать табличные значения функции:
Sfc) = я,- + bjhi + qhf + dth} = ft, (23.5.19)
hi
■ X; - X
7-1
Система (23.5.18), (23.5.19) содержит 2л
уравнений. Дополнительные уравнения
можно получить, если потребовать непрерывности
первой и второй производной функции S(x)
во внутренних узлах сетки.
Таким образом, система для отыскания
An неизвестных at, bt , с,-, dj , / = 1,2,...,п,
замкнута. Ее удобно решать, проведя
предварительно следующие преобразования, в
результате которых матрица для некоторых
коэффициентов становится трехдиагональной и
решение системы определяется методом
прогонки.
23.5.4. Метод наименьших квадратов.
До сих пор рассматривалась интерполяция,
т.е. такой способ приближения, когда
значения приближаемой и приближающей
функций совпадают в узлах некоторой сетки.
Однако достаточно часто, например, при
аппроксимации большого числа
экспериментальных точек, найденных с некоторой
погрешностью, интерполяция становится
неразумной. В этом случае целесообразно строить
приближающую функцию таким образом,
чтобы сгладить влияние погрешности
измерения и числа точек эксперимента. Такое
сглаживание реализуется при построении
приближающей функции по методу наименьших
квадратов. Вид приближающей функции
может быть произвольным, ниже рассмотрен
случай, когда приближающая функция
является многочленом. При этом добиваются
минимизации суммы квадратов отклонений
значений приближаемой и приближающей
функций в узлах сетки, называемой
квадратичным отклонением.
Пусть задана таблично в узлах Xj
функция fj при j = 0,1,...,TV . Необходимо
п
построить такой многочлен Fn(x) = Vfl/x' ,
i=0
для которого минимально квадратичное
отклонение
N 2
*=yL[fn{xj)-fj] • <215-20)
у=0
Очевидно, что минимума Ф можно
добиться только за счет изменения
коэффициентов многочлена Fn(x). Необходимые
условия экстремума имеют вид
lLaixj-fj
./=0
А; = 0,1,...,л.
хк.=0.
j
(23.5.21)
Эту систему для удобства преобразуют к
следующему виду:
N
N
Х*<Х*Г'=5>,*
у=0 у=0
* = 0Д,...,л.
;=о
(23.5.22)
Система (23.5.22) называется
нормальной системой метода наименьших квадратов и
представляет собой систему линейных
алгебраических уравнений относительно
коэффициентов dj. Решив систему, построим
многочлен Fn{x), приближающий функцию f(x)
и минимизирующий квадратичное
отклонение.
Рассмотрим одно важное свойство
системы (23.5.22). Предположим, что точки
равномерно распределены на отрезке [0, 1], т.е.
ВЫЧИСЛЕНИЕ ПЕРВОЙ И ВТОРОЙ ПРОИЗВОДНЫХ
869
Xj=(\/N)j, j = 0,1,...,N . В этом случае
N
Vxy+/ можно приближенно заменить ин-
у=0
тегралом:
N N ,
у=о
i J k + i +
будет
Тогда определитель системы (23.5.22)
A = N"+ldetHn+l,
где Нп+\ — матрица Гильберта порядка п + 1
с элементами [l/(A; + / + 1)1.
Определитель этой матрицы
[Ш!(, l),f
' />!(/. + !)!.. .(2/I-I)!
и очень быстро убывает с ростом р , что
приводит к быстрому убыванию величины
определителя системы Д . Так, для
р = 2 (rt = l)det#2 = 1(Г2,
р = Ъ (n = 2)detH3 = \0~5.
Следовательно, система (23.5.22) с
увеличением степени п приближающего
многочлена становится плохо обусловленной, и
решение ее связано с большой потерей
точности. Поэтому при использовании метода
наименьших квадратов, как правило, используют
приближающий многочлен не выше третьей
степени.
Глава 23.6
ЧИСЛЕННОЕ ДИФФЕРЕНЦИРОВАНИЕ
Задача численного дифференцирования
возникает при нахождении производных от
функции у = /(*), заданной таблично, либо
при нахождении производной от
аналитической функции, непосредственное
дифференцирование которой по каким-либо причинам
затруднено. Важное приложение численного
дифференцирования — разностная
аппроксимация производных, которая широко
используется при численном решении
обыкновенных дифференциальных уравнений и
дифференциальных уравнений в частных
производных.
Общий подход к задаче численного
дифференцирования состоит в замене
функции у = f(x) некоторой приближающей,
легко вычисляемой функцией у(х,а),
у = (р(х,а)+ R(x), где R(x) - остаточный
член приближения. Полагают, что у (х) =
= у'(х,а)) + Я\х), a R'(x) = у\х)-ц(х,а} -
погрешность вычисления производной.
Наиболее исследованным и широко
распространенным является случай, когда в
качестве приближающей функции <р(х,а)
берется интерполяционный многочлен. При
этом производные соответствующих порядков
легко определяются дифференцированием
многочлена, а погрешность
дифференцирования — дифференцированием остаточного
члена или погрешности интерполяции:
23.6.1. Вычисление первой и второй
производных. Для вывода формул
численного дифференцирования удобно
пользоваться интерполяционным многочленом в форме
Ньютона, так как он содержит разделенные
разности, являющиеся аналогом производных
соответствующих порядков. Очевидно, что
минимальное число узлов для получения к-и
производной равно [к + 1), так как
дальнейшее дифференцирование многочлена
приводит к производной, равной нулю. Запишем
следующую формулу:
/(ж) =/>„(*)+*„(*). (23.6.1)
Очевидно, что
/(*)=/>„»+<(*),
/»=/>„"(х)+<(*), (23.6.2)
/(*)(*)=/>J*)(*)+*(*)(*).
Для равноотстоящих узлов с шагом h
имеем:
870
Глава 23.6. ЧИСЛЕННОЕ ДИФФЕРЕНЦИРОВАНИЕ
Rik\x) = 0(h"+[-k).
Таким образом, точность расчета
производной при заданной степени
интерполяционного многочлена уменьшается с
увеличением номера производной. При решении
практических задач, в том числе при численном
решении обыкновенных дифференциальных
уравнений и уравнений в частных
производных, приходится использовать
аппроксимации первых и вторых производных.
Значительно реже приходится аппроксимировать
производные более высоких порядков.
В связи с этим проведено вычисление
первой и второй производной с
использованием интерполяционных многочленов
Ньютона первой и второй степени.
Первая производная. Из (23.5.12) и
(23.5.13) с использованием (23.6.1) и (23.6.2)
получаем, дифференцируя по х :
/(*)=/>,'(*)+/?,» =
_/o-/i
х0 ~ х\
[2х - (х0
■*№
(23.6.3)
/'(*)=/»2'(х)+/£(*) =
А^А + [2х_{Хо + Х{)]х
Xq - *|
/o-/i
*о - х\
fl-fl
х\ ~ х2
Х0 -Х2
+ [(*-*оХдс_дс|) +
+ (*-*! Xх " *2 ) + (* " *0 X* " *2)] —зр •
(23.6.4)
Формулы (23.6.3) и (23.6.4) дают
значения первой производной при
неравноотстоящих узлах, при этом (23.6.3) получена
дифференцированием интерполяционного
многочлена первой степени, а (23.6.4) — второй
степени с учетом формул для погрешностей
интерполяции. Рассмотрим более подробно
эти формулы. Очевидно, что при таблично
заданных функциях с использованием
интерполяционных многочленов производные
вычисляются как производные от
интерполяционных многочленов соответствующих
порядков. Приближенное значение первой
производной по формуле (23.6.3), полученное
дифференцированием Р\ (х), будет
f\x) = Р{(х) = А_А = const. (23.6.5)
*0 ~ х\
При вычислении по формуле (23.6.5)
значения производной, которая постоянна на
всем интервале, максимальная ошибка,
согласно (23.6.3), имеет место в крайних точках
интервала Xq и Х\ и пропорциональна
первой степени H = (xq-X\). В средней точке
Ху = (х0 + Xj)/2 , R\(x\) = 0, и значение
производной вычисляется с более высокой
точностью, чем в крайних узлах. Естественно,
дело не в том, что в точке Xj получается
точное значение производной, а в том, что
выражение для Rn(x} является приближенным.
Погрешность в точке х0 :
Л,'(*о) = -(*|-*о)А^
2!
в точке Х|
R;(Xl) = (X{-Xo)lM,
2!
т.е. равна по величине и противоположна по
знаку погрешности в точке л:0 .
Если узел х2 значительно удален и
точка интерполяции расположена в интервале
[xq,Xi], to погрешность вычисления
производной пропорциональна первой степени
шага (х0 -Х\), а не второй.
Вторая производная. Для вычисления
второй производной, очевидно, нужно
использовать интерполяционный многочлен
Ньютона второй степени. Имеем:
f(x)=P2(x)+R2(x) =
/q-/i /i ~fi
Xq-X^ X\-X2
x0-x2
f'"fe)
+ (3x-x0-xl ~xi) —JT-' <23-6-6)
Таким образом, приближенное значение
второй производной на интервале [хо'-*^]
есть константа, равная
ФОРМУЛЫ ПРЯМОУГОЛЬНИКОВ, ТРАПЕЦИЙ, СИМПСОНА
871
/»=ед=
/о ~f\ f\ ~fi
Xq ~X[ Xj — X2
x0 ~x2
(23.6.6a)
Из (23.6.6) и (23.6.6а) следует, что по-
прежнему максимальная погрешность в
вычислении имеет место в крайних точках и
формально по (23.6.6) равна нулю в точке
х2 = {х0 + xl + xl)ft ■ Отметим, что точки
хк = (х0 + Xj +.. лхк )1(к + 1) называются
точками повышенной точности для
производной к-го порядка.
На практике формулы численного
дифференцирования находят с использованием
ряда Тейлора. Разлагая функцию /(*) в ряд
Тейлора по степеням И , где И достаточно
мало, имеем:
f(x + h) = f(x) + hf\x) + ^f"{x) +
+V»+V,vw+-' (236r>
f{x-h) = f(x)-hf\x) + ^f"(x)-
Из (23.6.7') и (23.6.7") имеем
Вычитая из (23.6.7') (23.6.7"), получаем
Л1)./(»')-/(х-"4/-м-
(23.6.9)
В теории разностных схем производную,
вычисленную по формуле (23.6.8'), называют
односторонней правой производной или
производной вперед, вычисленную по формуле
(23.6.8") - односторонней левой производной
или производной назад, а по формуле
(23.6.9) - центральной или симметричной
производной. Складывая (23.6.7') и (23.6.7"),
имеем для второй производной:
„ _ f(x + h)-2f(x) + f(x-h)
h_ f\w
12
Г(х).
(23.6.10)
Глава 23.7
ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ
В тех случаях, когда при вычислении
определенного интеграла
F = )f{*)
dx
(23.7.1)
невозможно найти первообразную или она
очень сложна для вычислений, то обращаются
к формулам численного интегрирования. При
этом подынтегральную функцию /(*)
заменяют такой приближающей, что она, во-
первых, близка в каком-то смысле к f(x):
/(дс)«ф(дг,д),
а, во-вторых, интеграл от
ф(*>я)
легко
вычисляется. Наиболее употребителен случай,
когда подынтегральную функцию заменяют
интерполяционным многочленом Лагранжа:
f(x)=Ln(x)+Rn(x), (23.7.2)
где Rn(x) — остаточный член интерполяции.
Подставляя (23.7.2) в (23.7.1), получаем
Ъ Ь
F = J Ln(x)dx + R , где R = J Rn{x)dx
a a
— остаточный член формулы численного
интегрирования, или ее погрешность.
Заменяя /(•*) интерполяционными
многочленами различной степени, получают
формулы численного интегрирования
различного порядка точности.
23.7.1. Формулы прямоугольников,
трапеций, Симпсона. Заменим
подынтегральную функцию, входящую в (23.7.1),
интерполяционным многочленом Лагранжа
нулевой степени, проходящим через середину
отрезка - точку х = (а + b)J2 (рис. 23.7.1).
872
Глава 23 7. ЧИСЛЕННОЕ ИНТЕГРИРОВАНИЕ
fix)
а а+Ь Ъ х
2
Рис. 23.7.1
Из геометрических соображений
очевидно, что площадь криволинейной трапеции
можно заменить площадью прямоугольника,
т.е.
Ь
F = jf{x)dx ~(b- a)f((a + Ь)/2). (23.7.3)
а
Формула (23.7.3) носит название
формулы средних или прямоугольников. Оценим ее
погрешность:
Ь
R = jf(x)dx-(b-a)f(x). (23.7.4)
а
Величина остаточного члена формулы
прямоугольников может быть достаточно
велика, так как величина отрезка [Ь - д) может
быть достаточно большой. Для повышения
точности введем сетку
а - х0 < х, <... < xN - b
с достаточно мелким шагом ht - х, - Xj_\ и
применим формулу прямоугольников на
каждом шаге сетки. Тогда получим обобщенную
формулу прямоугольников.
На равномерной сетке с шагом /?,- =
= X; - X/_i = const эта формула упрощается
и имеет вид
lf(x)dx~h%f(2=L£±L\, (23.7.5)
а /=1
1 /г »
/? = ^-A2J/ (x)dx. (23.7.7)
а
Для справедливости оценки (23.7.6)
необходимо существование непрерывной второй
производной; если / (х) -
кусочно-непрерывная, то удается сделать лишь
мажорантную оценку, заменяя / (х\ ее максимальной
величиной на [o,b]:
R<-Lh2M2(b-a),
(23.7.8)
где М2 = гпах|/"(х)| .
В том случае, если функция f(x)
задана в виде таблицы, ее значение в середине
интервала неизвестно. Это значение
находится, как правило, интерполированием, что
приводит к ухудшению точности формулы.
В случае таблично заданных функций
удобно в качестве узлов интерполяции
выбрать начало и конец отрезка
интегрирования, т.е. заменить функцию f(x)
многочленом Лагранжа первой степени. Имеем
b Ь Ь
jf(x)dx = J L{(x)dx + JR{(x)dx .
a a a
В этом случае величина интеграла, равная
площади криволинейной трапеции,
приближенно заменяется величиной площади
трапеции (рис. 23.7.2).
Поэтому
b b
jf(x)dx » i(ft - a)[f(a) + f(bj\ = J Ц(x)dx,
a a
(23.7.9)
величина остаточного члена
24 f| i 2
/ = 1
(23.7.6)
Заменяя в (23.7.6) сумму интегралом,
получаем
Рис. 23.7.2
ФОРМУЛЫ ПРЯМОУГОЛЬНИКОВ, ТРАПЕЦИЙ, СИМПСОНА
873
имея в виду, что Xq = а , Xj = Ъ . Эта
формула носит название формулы трапеций.
Для оценки погрешности
интегрирования при использовании формулы трапеций
Ь
\Rx{x)dx . Имеем
вычислим
R = JR](x)dx = -±(b-af/'(£,).
а
Величина погрешности формулы
трапеций вдвое больше, чем формулы
прямоугольников. Это объясняется тем, что выбор в
формуле прямоугольников в качестве узла
интерполяции симметричного узла приводит
к повышению ее точности.
Для повышения точности формулы
(23.7.9) введем на [a,b] сетку
а = х0 < х{ <... < xN = b .
Таким образом, формула трапеций (как
и формула прямоугольников) имеет второй
порядок точности относительно шага сетки, и
погрешность асимптотически стремится к
нулю при h —> О с точностью до членов
более высокого порядка малости.
Для повышения порядка точности
формулы численного интегрирования заменим
подынтегральную кривую параболой —
интерполяционным многочленом Лагранжа второй
степени, выбрав в качестве узлов
интерполяции концы и середину отрезка
интегрирования: Xq = а , х{ = [а + Ь)/2, х2 = Ь
(рис. 23.7.3).
В этом случае, проинтегрировав
интерполяционный многочлен для равноотстоящих
узлов, получим
F = ] L2(x)dx = |[/о + 4/, + /2], (23.7.10)
R =
(b-af
180
/
IV
*¥)■
Формулу (23.7.10) называют формулой
Симпсона. Для неравноотстоящих узлов
Ь
^0>xi»x2 F~\Li(x)dx.
Как и в предыдущих двух случаях, для
повышения точности формулы (23.7.10)
введем сетку с достаточно малым шагом.
Суммируя значения интегралов, полученных по
(23.7.10) для каждого интервала, получаем
обобщенную формулу Симпсона (парабол),
которая на равномерной сетке имеет вид
/г = |[/о+4/1+2/2+4/з+2/4+...
- + 2/Лг_2+4/Лг_1+/Лг],
(23.7.11)
а величина остаточного члена
Ь
я~~ш!/1У{х)с*х> (23-7Л2)
т.е. формула парабол имеет четвертый
порядок точности относительно шага сетки. Как
правило, для оценки величины погрешности
пользуются мажорантной оценкой
щ<(±Ак*м4,
где Л/4 = max /
IV
180
(23.7.13)
Число интервалов TV, на которое делится
отрезок интегрирования, должно быть всегда
четным, так как интерполяционный
многочлен второй степени проводится через три
точки.
а величина остаточного члена
b
R = JR2(x)
dx,
Глава 23.8
ОБЫКНОВЕННЫЕ
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
(а + Ъ)12
Рис. 23.7.3
В главе рассмотрены различные методы
решения задачи Коши и краевой задачи для
обыкновенных дифференциальных
уравнений. Подробно рассмотрен метод Эйлера и
ошибки, возникающие при реализации
метода на компьютере; семейство одношаговых
методов Рунге-Кутты; многошаговые методы.
Из методов решения краевой задачи
рассмотрены метод стрельбы и разностный метод.
874
Глава 23.8. ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
23.8.1. Метод конечных разностей.
Погрешность, аппроксимация, сходимость.
Численное решение обыкновенных
дифференциальных уравнений и уравнений в
частных производных во многих случаях
осуществляется методом конечных разностей. Метод
конечных разностей сводит решение
дифференциальных уравнений к решению
линейных или нелинейных уравнений с достаточно
разреженными матрицами. При этом
построение решения в методе сеток
осуществляется в три этапа:
1. Область непрерывного изменения
аргумента (или аргументов) заменяется
конечным дискретным множеством точек,
называемых разностной сеткой. В разностной
сетке выделяются внутренние и граничные узлы.
Решение разыскивается во внутренних узлах,
а в граничных узлах значение искомой
функции задается при аппроксимации граничных
условий исходной дифференциальной задачи.
Функция дискретного аргумента,
определенная на разностной сетке, называется сеточной
функцией.
2. Дифференциальные уравнения и
граничные условия заменяются по
определенным правилам своими разностными
аналогами. Разностные операторы, соответствующие
дифференциальному уравнению,
записываются во внутренних узлах сетки. Разностные
операторы, соответствующие граничным
условиям, записываются в граничных узлах. В
результате получается система алгебраических
уравнений, число которых пропорционально
числу внутренних узлов разностной сетки.
3. Осуществляется решение системы
алгебраических уравнений каким-либо из
известных методов. В большинстве случаев
получаемая система уравнений есть система
линейных алгебраических уравнений очень
большого порядка (как правило, N > 100),
но с очень разреженной матрицей.
В случае нелинейных систем
итерационные процедуры, как правило, сводят их к
линейным системам.
Продемонстрируем эти этапы на
примере решения задачи Коши для простейшего
линейного уравнения первого порядка. Пусть
требуется найти решение задачи Коши на
интервале (0,1) для уравнения
— + Ли
dx
и(0) = Ц).
Заменим непрерывный интервал
множеством точек 0, X|,X2, ,Xn_i,Xn,...,\ .
Расстояние между точками называется
шагом разностной сетки. В общем случае эти
шаги могут быть переменными. Ниже
рассмотрим случай постоянного шага и примем
xn-nh. Заменим, далее, дифференциальное
уравнение разностным в точке хп :
du , , и(хп_{+И)-и(хп_{)
— + А и «-
dx
+ Аи(хп_{) = 0.
(23.8.2)
Таким образом, первая производная
аппроксимирована односторонней разностью
вперед с первым порядком точности.
Перепишем уравнение (23.8.2) в виде
И
+ Аип_{ = 0
(23.8.3)
0,
(23.8.1)
Здесь и (х„_{ + А)= м„,а и (хп_{) = ип_{ .
Из (23.8.3) следует, что
un=(l-Ah)u„_{. (23.8.4)
Из рекуррентного соотношения (23.8.4)
имеем точное решение разностного уравнения
(23.8.3):
u„=u0(l-Ah)n=u0{l-Ah)x",h.
(23.8.5)
Очевидно, что точное решение
разностных уравнений можно получить лишь для
простейших случаев. Точное решение задачи
(23.8.1) имеет вид
и(х„) = и0е~Ах" . (23.8.6)
Определим погрешность разностного
решения. Имеем
Цхп) = [е-А*»-(\-АИ)х»/Н]и0.
(23.8.7)
Предполагая малым шаг разностной
х I h
схемы, представим (1 - Ah) nl в виде
(l-Ah)
,*./*
-1п(1-ЛЛ)
= е
-АЬ-
+о(л2)
е ^"е
е \ 1 ,
МЕТОД ЭЙЛЕРА. МЕТОД ЭЙЛЕРА С ПЕРЕСЧЕТОМ
875
п-Лхп
А2х1
x-±JEiL + 0(h2) [1+о(л2)] = .-^-л^в-^+о(л2).
Подставляя это выражение в (23.8.7),
имеем
Чхп) = ки0^-е-А*» +0(h2) = 0(h).
(23.8.8)
Таким образом, величина погрешности
имеет первый порядок точности и совпадает в
данном случае с порядком аппроксимации
производной. В общем случае порядок
погрешности решения определяется не только
порядком аппроксимации
дифференциального уравнения, но и порядком
аппроксимации граничных условий.
23.8.2. Метод Эйлера. Метод Эйлера
с пересчетом. Метод Эйлера является
простейшим методом решения задачи Коши и
имеет невысокую точность, поэтому на
практике его используют достаточно редко.
Однако на его основе в дальнейшем легче
объяснить алгоритмы более эффективных (и, как
правило, более сложных) методов и способы
построения и исследования этих алгоритмов.
Рассмотрим задачу Коши для
дифференциального уравнения первого порядка:
-^ = /(*,*/), хе [a,b],
(23.8.9)
и(а) = и0.
Введем на [а, Ь] сетку (в общем случае
неравномерную) значений аргумента х, такую,
чтобы выполнялось следующее соотношение:
а = Xq < Ху < ... < Хуу = b . Разложим
решение и[х) в окрестности узла сетки хп по
формуле Тейлора. Обозначая и (хп) = и„ ,
имеем
"н+1
1 1 1 ч
un+h„u'n + — АХ, + зТ А#Х + -.
х„.
к = *.
7/+I
(23.8.10)
Если функция / имеет непрерывную
/ыо производную, то в (23.8.10) можно
оставлять члены вплоть до О (hp+]). Эти
производные можно найти, дифференцируя правую
часть (23.8.9) требуемое число раз. Например,
для первой и второй производных имеем
u'(x) = f(x,u),
Аналогично можно получить
производные более высоких порядков. Однако
использование формулы (23.8.10) с большим числом
членов имеет ряд недостатков: во-первых, с
ростом порядка производной выражение для
нее может оказаться очень сложным; кроме
того, если функция / известна лишь
приближенно или задана таблично, ее
производные находятся с большой ошибкой.
Поэтому в разложении (23.8.10)
оставляют только два члена. При такой замене
вместо точного решения и{хп+\) получается
его приближенное значение и(х//+|),
которое находят по следующей формуле:
ип+] =u„+h„f(x„,u„). (23.8.11)
Так как значение u(xq) = Uq известно
из начального условия, то, последовательно
пользуясь формулой (23.8.11), находим
приближенные решения щ,U2,...,uN . Формула
(23.8.11) записана для случая неравномерной
сетки. Полагая шаг сетки постоянным, т.е.
хп+\ ~ хп = h = c°nst , получим
ип+\ =un + hf(xfnun). (23.8.11а)
Формула (23.8.11а) является основной
формулой метода Эйлера, или метода
ломаных. Последнее название становится
понятным из геометрической интерпретации схемы,
представленной на рис. 23.8.1, на которой
изображено семейство интегральных кривых
уравнения (23.8.9).
Как следует из рисунка, решение задачи
Коши по методу Эйлера дает решение, не
Рис. 23.8.1
876
Глава 23.8. ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
совпадающее ни с одной из интегральных
кривых, и является ломаной линией,
совпадающей на каждом шаге с касательной к
соответствующей интегральной кривой. Из рис.
23.8.1 следует, что метод Эйлера дает
одностороннее приближение к точному решению
и(х). Из сравнения формул (23.8.10) и
(23.8.11) следует, что метод Эйлера обладает
вторым порядком точности на шаге, являясь в
то же время методом первого порядка
аппроксимации на интервале.
Существует несколько модификаций
метода Эйлера. Остановимся на одной из них -
методе Эйлера с пересчетом, который
называют также методом Эйлера-Коши. В этом
методе значение ип+\ находится по формуле
«||+1=И||+-Х
/7+1 >
(23.8.12)
т.е. вместо тангенса угла наклона касательной
к интегральной кривой в точке хп,ип,
который используется в методе Эйлера (см.
(23.8.11а)), используется полусумма значений
тангенсов углов наклона касательных в
известной (хп,ип) и искомой (хп+\,ип+[)
точках. Поскольку, однако, ww+| неизвестно, то
(23.8.12) есть в общем случае нелинейное
уравнение относительно ип+\ , которое можно
решить различными методами (см. гл. 23.3).
В рассматриваемом случае логично
использовать метод простой итерации (см.
(23.3.3)), поскольку нелинейное уравнение
уже разрешено относительно ип+\ . Тогда
итерационный процесс запишется в виде
tti+!,)=ttii+f[/(^ttii)+/(^ii + A^i+i)]'
(23.8.13)
где верхний индекс означает номер итерации.
В качестве и^п+\ можно принять либо
ип, либо w^+l =un+hf{xn>un)> т.е.
использовать значение, вычисленное по
формуле Эйлера (23.8.11а).
Тогда в первой итерации имеем
я+1 п 2у V л> п) (23.8.14)
23.8.3. Метод Рунге-Кутты. Метод
Рунге-Кутты позволяет строить схемы
различного порядка точности. Основная идея
метода состоит в построении специального
алгоритма, такого, чтобы приращение
функции на шаге Aw = ип+\ - ип совпадало с
приращением Aw , которое определяется из ряда
Тейлора (23.8.10) с учетом возможно
большего числа членов. При этом вторые и
следующие производные рассчитываются не в
результате дифференцирования, а путем
многократного вычисления функции /(x,w)
в некоторых промежуточных точках между
хп и хл+1. Проиллюстрируем основные идеи
метода на примере получения схем второго
порядка точности.
Оставим в разложении (23.8.10) члены
вплоть до 0(h J, имея в виду, что
последний член разложения соответствует
предполагаемому порядку точности схемы. Имеем
1 1
ип+\ = ип + Ki +~jh™л • (23.8.15)
Чтобы избежать явного
дифференцирования, заменим и"п в (23.8.15) разностью
и
„-4:[/(х,и)] = ^П)-^^1
dxl" x ' /J Ax
(23.8.16)
Величины х, и и Ах подбираются так,
чтобы обеспечить нужный порядок точности.
Подставляя (23.8.16) в (23.8.15), получаем
"л+1 ="n+W1+- — [f(x,u)-f(x„,u„j].
(23.8.17)
Полагая х = хп + у/г, и - ии + 5Л ,
обозначая а = (1/2)(/г/Ах) и имея в виду, что
Ах = х - хп и, следовательно, у = 1/2ос, а
также учитывая, что и'п - f (хп,и„),
переписываем (23.8.17) в виде
+afix„+—,un+bh
(23.8.18)
Параметры а и 5 необходимо
определить из условия, чтобы (23.8.18) наилучшим
образом соответствовало ряду (23.8.10).
НЕЯВНЫЕ СХЕМЫ ДЛЯ РЕШЕНИЯ ЖЕСТКИХ СИСТЕМ
877
В результате простых выводов
И/1+1 =un+h{(\-a)f(xn,un) +
(23.8.19)
Схема (23.8.19) при ос Ф О имеет третий
порядок точности на шаге и второй на
интервале. Из (23.8.19) можно получить все
рассмотренные выше разностные схемы. Так, при
сс = 0 имеем метод Эйлера (см. 23.8.11а), при
а = 1/2 - первую итерацию метода Эйлера с
пересчетом (см. (23.8.14)), а при а = 1 - так
называемый метод хорд. При а = 1
"п+\ =И/1+Л/|хя+-,ия+-/(хя,ия)|.
(23.8.20)
Аналогичным образом могут быть
получены и схемы Рунге-Кутты более высокого
порядка точности. В настоящее время
наиболее распространены схемы четвертого порядка
точности. Например, схема Рунге-Кутты
четвертого порядка точности, которая
используется в большинстве стандартных программ на
компьютере, выглядит так:
h h „
K3=f\x„
K4=f(xn + h,un + hK3y.
23.8.4. Метод Адамса. В предыдущих
схемах решение в точке хп+\ вычисляется с
использованием решения только в одной
точке хп. Логично предположить, что можно
повысить точность метода, если использовать
информацию о поведении решения в
предыдущих точках xn,xn_h.... Такие методы
получили название многошаговых.
Общая схема построения многошаговых
методов выглядит следующим образом. Пусть
нам известно приближенное решение в
нескольких узлах сетки х„,хп_\,...,хп_р .
Следовательно, в этих точках отрезка известно и
значение f(Xj,U;) правой части
дифференциального уравнения (23.8.9) при
i = n,n-l,...,n- p , причем /(х,м(х))
будет уже функцией только одной
переменной х: f(x,u (х)) = F (х). Заменим
функцию F (х) интерполяционным многочленом
Лагранжа Lp (x) и вычислим значение ww+J ,
проинтегрировав (23.8.9) на отрезке хп,хп+\ .
Находим
хп+1
"л+1 =«л+ J Lp{x)dx. (23.8.21)
Проводя интегрирование, находим
разностную схему для решения
дифференциального уравнения. Порядок схемы определяется
величиной остаточного члена
интерполяционного полинома.
В случае если для построения
интерполяционного многочлена используются четыре
узла хп,хп_\,хп_2,хп_3 , то получается
формула Адамса, которая на сетке с постоянным
шагом записывается следующим образом:
"/,+. =и„ +^(55/5,-59/^, +37^2 -9F„_3)
(23.8.22)
с локальной ошибкой дискретизации
т.е. метод имеет четвертый порядок точности
на интервале.
Чтобы начать счет по схеме Адамса,
необходимо знать решение в четырех начальных
точках Xq,X\,X2,x3 .
23.8.5. Неявные схемы для решения
жестких систем. Рассмотрим следующую
разностную схему для численного решения
уравнения (23.8.9) при условии, что
вычислено значение функции // в точке хп . Имеем
u„+^u+h[sf(xn,u)+ (23823)
где s — параметр разностной схемы, такой,
что 0 < s < 1 . Говорят, что разностная схема
является явной, если правая часть
дифференциального уравнения записывается в
известной точке (хп,ип). Схема называется
неявной, если правая часть дифференциального
уравнения записывается в неизвестной точке
878
Глава 23.8. ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
(xn+\iun+i)- Схема называется полуявной
(полунеявной), если правая часть с
определенными весами записывается в известной и
неизвестной точках. В соответствии с
вышесказанным схема (23.8.23) является явной при
5 = 1, неявной при 5 = 0 и полуявной
(полунеявной) при 0 < s < 1. В явных схемах
решение в точке xn+i,un+i определяется
непосредственно из алгебраических
соотношений с известными коэффициентами. Все
рассмотренные выше схемы методов Эйлера,
Рунге-Кутты, Адамса (кроме схемы метода
Эйлера с пересчетом) являются явными. В
неявных и полунеявных схемах при s * 1 для
нахождения решения в точке хп+^, ип+[
необходимо решить в общем случае нелинейное
уравнение (23.8.23).
Нелинейное уравнение (23.8.23) можно
разрешить различными методами (метод
простой итерации, метод дихотомии, метод
Ньютона и т.д.) В рассматриваемом случае
логично использовать метод простой итерации,
поскольку нелинейное уравнение (23.8.23)
уже разрешено относительно ипл\ . Тогда
итерационный процесс можно записать в виде
Mi+!l) =un+h[sf(xn,u„)-
Hl-s)f(xn+bu^\j
(23.8.24)
где верхний индекс — номер итерации.
Известно, что сходимость метода
простой итерации зависит от выбора начального
приближения. В рассматриваемом случае в
качестве w^+j можно выбрать ип или какое-
либо другое значение, например, значение,
вычисленное по методу Эйлера, которое
достаточно близко к искомому значению ип+у .
Вычисления по формуле (23.8.24)
продолжаются до получения заданной точности
I (к+\) (к)\
Таким образом, очевидно, что при
расчете на шаге явные схемы требуют
значительно меньшего числа операций, чем неявные.
Однако неявные схемы значительно более
устойчивы, чем явные, в связи с чем в
неявных схемах ограничения на шаг разностной
схемы, связанные с устойчивостью, как
правило, менее жесткие, чем в явных схемах.
В результате может оказаться, что общее
число операций при заданной точности и при
расчетах на интервале интегрирования в
неявных схемах меньше, чем в явных.
В конечном итоге о качестве разностной
схемы следует судить по числу операций,
необходимых для получения решения с
заданной точностью. Этот критерий и является
основным при сравнении явных и неявных
схем.
Понятие о жестких системах уравнений.
Во многих задачах управления, химической
кинетики, неравновесной динамики газов
возникают системы уравнений, в которых
содержатся некоторые уравнения, имеющие
малый параметр при старшей производной.
Соответственно матрица системы
дифференциальных уравнений
du_
dx
= Аи
(23.8.25)
имеет существенно различные собственные
числа. Последнее обстоятельство приводит к
тому, что в решении содержатся быстро и
медленно убывающие члены, которые нужно
рассчитывать с одинаковой точностью, что
накладывает существенные ограничения на
шаги разностной схемы. Дается следующее
определение для жестких систем. Система
называется жесткой, если действительная
часть ReX^ меньше нуля:
^ . ~ max|Re?u|
Re^<0 и / = . * »1,
min|ReAfc|
где Х/с — собственные числа матрицы А, а
/ - так называемое число жесткости. Однако
это определение не пригодно для одного
дифференциального уравнения, так как для
него / = 1 . Поэтому в данном случае говорят,
что уравнение является жестким, если
содержит малый параметр при старшей
производной. Ниже на примере модельного уравнения
для химической кинетики будет показано, что
численное решение жесткого уравнения
рационально строить с использованием неявных
или полунеявных разностных схем, имея в
виду условия устойчивости и ограничения на
шаги.
Рассмотрим модельное жесткое
линейное уравнение, характерное для задач
химической кинетики:
da
~dt
-(а*-а),
(23.8.26)
где а (г) — концентрация химического
компонента; т - время релаксации; а —
равновесное значение химического
компонента, достигаемое при т —» 0 . Примем
МЕТОД СТРЕЛЬБЫ ДЛЯ РЕШЕНИЯ КРАЕВЫХ ЗАДАЧ
879
здесь, что т и ос - константы и т мало,
что характерно для условий приближения
системы к равновесию.
Точное решение уравнения (23.8.26) есть
_t_
а = (а0-а*)е т + а*, (23.8.27)
где а0 =а(0). Заменим (23.8.26) следующим
разностным уравнением:
—I—--1ао-а")+—г ~а»+ч
(23.8.28)
Можно получить следующее точное
решение разностного уравнения:
*л+1
= (а0-а*)
1 - КЗ
-1/7+1
+ а
1 + k(1-j)J
(23.8.29)
а точное решение дифференциального
уравнения в точке п + 1 имеет вид
«/i+l = («О " а*)е"к("+1) + а*. (23.8.30)
Из (23.8.29) и (23.8.30) следует, что
решение разностного уравнения (23.8.29)
стремится к точному при к —> 0 для всех s .
Однако порядок точности схемы и устойчивость
решения разностного уравнения зависят от
величины этого параметра. При s = 1/2
разностная схема является схемой второго
порядка точности, а при остальных s -
первого. При S = 1 (явная схема типа Эйлера или
Рунге-Кутты) и к:» 1 (что имеет место,
когда т мало) решение разностного уравнения
сильно отличается от точного.
Действительно, при 5 = 1 и к» 1 член
в квадратных скобках в уравнении (23.8.29)
/ Ч//+1
равен (-к] , т.е. очень велик при больших
к, в то время как в точном решении соответ-
-к(//+1) ,,
ствующии член е v ' очень мал. Нетрудно
видеть из (23.8.29), что максимальный шаг
интегрирования при s = 1 для обеспечения
устойчивого счета равен 2т . Для задач
химической кинетики характерны х = 10 - 10 .
Поэтому явные схемы позволяют численно
решать жесткие уравнения лишь с очень
малым шагом И « 2т, что делает их абсолютно
непригодными даже при использовании
компьютеров с большим быстродействием.
В связи с этим более предпочтительной
является неявная схема с s = 0, которая при
к» 1 дает решения, близкие к точному.
Действительно, при 5 = 0 член в квадратных
скобках в уравнении (23.8.29) равен [1/к]
и качественно верно отражает поведение экс-
-к(/7+1) г,
поненты с е v ' в точном решении.
Применение неявной схемы позволяет
существенно увеличить шаг интегрирования по
сравнению с явными схемами при
сохранении устойчивости и необходимой точности
расчета.
23.8.6. Метод стрельбы для решения
краевых задач. Краевая задача - это задача
отыскания частного решения системы
обыкновенных дифференциальных уравнений
Их
- = fi{x,ui,u2,...,un), i = 1,2,...л
(23.8.31)
с дополнительными условиями, налагаемыми
на значения функций щ (х) не менее чем в
двух точках отрезка [а, Ь]. Следовательно,
краевая задача для ОДУ ставится для системы
дифференциальных уравнений порядка не
менее второго (или одного
дифференциального уравнения порядка не ниже второго).
Точное аналитическое решение краевой
задачи удается найти крайне редко, так как
для этого надо найти общее решение системы
дифференциальных уравнений (23.8.31) и
выразить из краевых условий значения
входящих в него констант. Поэтому широкое
распространение получили численные методы
решения краевых задач, такие, как метод
стрельбы и разностный метод.
Рассмотрим метод стрельбы на примере
решения дифференциального уравнения
второго порядка
w' = /(x,w,"'), хе[а,Ь] (23.8.32)
с краевыми условиями:
и(а) = а, (23.8.32а)
ы(£) = р. (23.8.326)
Основная идея метода стрельбы
заключается в сведении решения краевой задачи
(23.8.32), (23.8.32а), (23.8.326) для того же
дифференциального уравнения (23.8.32) к
решению серии задач Коши. Для постановки
задачи Коши для уравнения (23.8.32)
необходимо в какой-либо одной точке отрезка задать
два дополнительных условия. В точке а из-
880
Глава 23.8. ОБЫКНОВЕННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
вестно одно дополнительное условие
и(а) = а. Поэтому зададим в этой точке
значение производной функции — и' (а). Так
как это значение заранее неизвестно, то
зададим его равным некоторому произвольному
значению Г|. В результате получим задачу
Коши:
u' = f(x,u,u'), (23.8.33)
и(а) = а, (23.8.33а)
и'(а) = ц. (23.8.336)
Решая эту задачу Коши каким-либо
численным методом, получаем ее решение
и(х,ц), зависящее от Т|, как от параметра.
Так как Г| выбрано произвольно, то решение
задачи Коши удовлетворяет условию краевой
задачи в точке а и не удовлетворяет ее
условию в точке b . Так, необходимо менять
параметр Г] таким образом, чтобы решение
задачи Коши в точке b совпадало с условием
(23.8.326). Следовательно, решение краевой
задачи сводится к нахождению корня
нелинейного алгебраического уравнения
\|/(л) = "(М)-Р = 0- (23.8.34)
При этом функция у (л) задана не
аналитически, а в виде таблицы чисел, которая,
очевидно, составляется при решении серии
задач Коши. Решение уравнения (23.8.34)
можно искать методом дихотомии. Делают
пробные «выстрелы», т.е. решают задачу
Коши с разными значениями г|, до тех пор,
пока среди величин н(£,Г|)-р не окажется
двух разных по знаку. Пара соответствующих
значений \|/(л) делится пополам, и
находится новое значение г\, с которым решается
задача Коши. Такая процедура повторяется до
получения условия (23.8.336) с необходимой
точностью.
Простота алгоритма метода стрельбы и
возможность использования стандартных
программ решения задачи Коши позволяют
успешно использовать его при решении как
линейных, так и нелинейных
дифференциальных уравнений.
23.8.7. Конечно-разностный метод.
Идея метода заключается в сведении краевой
задачи к решению системы алгебраических
уравнений путем замены производных в
дифференциальном уравнении и краевых условий
конечно-разностными соотношениями.
Рассмотрим идею метода на примере краевой
задачи для уравнения второго порядка:
u* + A(x)u' + B(x)u = f(x)> (23.8.35)
и(а) = а, (23.8.35а)
ы(£) = р. (23.8.356)
Введем на [а, Ь] сетку а = х$ < Х[ < ...
... < хп = b. Для простоты будем полагать шаг
сетки постоянным. Будем искать решение не
на всём отрезке [а, Ь], а лишь в (7V-1)
узлах сетки. Таким образом, нам необходимо
найти (7V-1) неизвестных значений
функции и в узлах сетки. Воспользуемся для
аппроксимации производных функций
формулами численного дифференцирования (см. гл.
23.6):
2А v '
«#e^(«M-2«/+«/+i) + 0(4
/ = i,2,...,7V-l.
(23.8.36)
Такую аппроксимацию можно записать
для каждого внутреннего узла сетки и
получить систему линейных уравнений (/V-1)
порядка, если подставить (23.8.36) в (23.8.35).
Два недостающих уравнения получаем из
краевых условий (23.8.35а) и (23.8.356).
Запишем эту линейную систему в виде
ЩЩ-\ ~ Ъ\Щ + qui+[ =dh
/ = 1,2,.../V-1, (23.8.37)
Uq = a,
ci = \-T + —L •
U2 2h)
Нетрудно видеть, что матрица этой
линейной системы — трехдиагональная, и
поэтому решать ее можно методом прогонки
(см. п. 23.2.3). При этом, как обычно, на
прямом ходу определяются прогоночные
коэффициенты, а на обратном - неизвестные
щ . Устойчивость и корректность прогонки,
как известно, обеспечивается условием
преобладания диагональных элементов.
МЕТОД СЕТОК. ЗАДАЧА ДИРИХЛЕ ДЛЯ УРАВНЕНИЯ ЛАПЛАСА
881
Описанный метод можно применить и в
случае, если в краевые условия (23.8.35а) и
(23.8.356) входят линейные комбинации
функций и первых производных.
Глава 23.9
УРАВНЕНИЯ В ЧАСТНЫХ ПРОИЗВОДНЫХ
Уравнения в частных производных
описывают многие физические задачи в таких
областях, как механика сплошных сред,
термодинамика, квантовая механика,
электродинамика, теория упругости и многие другие.
Аналитическое решение уравнения в частных
производных удается получить лишь в
единичных практически важных случаях, и
поэтому роль численных методов для решения
задач, описываемых уравнениями в частных
производных, особенно велика.
В этой главе излагаются основные
методы численного решения уравнений в частных
производных, такие, как метод сеток, метод
прямых и метод характеристик, метод
установления, методы сквозного счета, а также
некоторые специальные методы, нашедшие
применение в последнее время.
Особое внимание уделяется методу сеток
как наиболее развитому и употребительному
методу решения уравнений в частных
производных. При изложении метода сеток
вводятся такие основные понятия, как
аппроксимация, устойчивость и сходимость разностной
схемы, имеющие первостепенное значение
при рассмотрении любого численного метода.
Представлены также некоторые сведения
из теории уравнений в частных производных.
Уравнения математической физики. Ниже
будут рассмотрены в основном классические
уравнения математической физики. В этих
уравнениях в качестве независимых
переменных используются время t и
пространственные координаты: декартовы, цилиндрические
и сферические.
Задача называется стационарной, если
решение не зависит от времени, и
нестационарной, или эволюционной, если оно зависит
от времени. Задачи с одной пространственной
переменной называются одномерными, а с
двумя - двухмерными, с тремя —
трехмерными.
Запишем каноническую форму
уравнений с двумя независимыми переменными.
Заметим, что в общем случае для более чем
двух независимых переменных таких
канонических форм не существует. Имеем
с дважды непрерывно дифференцируемыми
коэффициентами А, Д С, которые не
обращаются в нуль одновременно. Имеем
следующую классификацию дифференциальных
уравнений в частных производных. Пусть
D = В - АС , тогда при D = О имеем
параболическое, при D > О — гиперболическое, а
при D < О - эллиптическое
дифференциальное уравнение. При этом тип одного и того
же уравнения может меняться в зависимости
от области пространства.
Классическим уравнением
гиперболического типа является волновое уравнение
параболического типа — уравнение
теплопроводности, а эллиптического типа — уравнение
Лапласа.
В математической физике различают
следующие задачи: задачу Коши (или задачу с
начальными данными), краевые, или
граничные задачи, смешанные краевые задачи или
краевые (граничные) задачи с начальными
данными. Задачи, в которых в качестве
переменной имеется время / , иногда называют
эволюционными.
В теории уравнений в частных
производных важную роль играют
характеристические поверхности, которые определяются как
поверхности, в окрестности которых решения
задачи Коши не существует либо решение это
не единственно. Можно показать, что в
действительной плоскости характеристические
поверхности существуют для гиперболических
и параболических уравнений и не существуют
для эллиптических уравнений.
Общая теория характеристик позволяет
сформулировать для гиперболических
уравнений некоторые специфические задачи, такие,
как задача Гурса, смешанная задача и ряд
других. Их решение можно построить,
используя как аналитический, так и численный
метод характеристик.
23.9.1 Метод сеток. Задача Дирихле
для уравнения Лапласа. Метод сеток (или
метод конечных разностей) сводит решение
систем уравнений в частных производных к
решению систем, как правило, линейных
алгебраических уравнений с достаточно
разреженными матрицами. При этом построение
решения в методе сеток осуществляется в три
этапа.
1. Область непрерывного изменения
аргумента (или аргументов) заменяется
конечным дискретным множеством точек,
называемых разностной сеткой. В разностной
сетке выделяются внутренние и граничные узлы.
882
Глава 23.9. УРАВНЕНИЯ В ЧАСТНЫХ ПРОИЗВОДНЫХ
Решение ищется во внутренних узлах, а в
граничных узлах значение искомой функции
задается при аппроксимации граничных
условий исходной дифференциальной задачи.
Функция дискретного аргумента,
определенная на разностной сетке, называется сеточной
функцией.
2. Дифференциальное уравнение и
граничные условия заменяются по
определенным правилам своими разностными
аналогами. Разностные операторы, соответствующие
дифференциальному уравнению,
записываются во внутренних узлах сетки. Разностные
операторы, соответствующие граничным
условиям, записываются в граничных узлах. В
результате получается система алгебраических
уравнений, число которых пропорционально
числу внутренних узлов разностной сетки.
3. Осуществляется решение системы
алгебраических уравнений каким-либо из
известных методов. В большинстве случаев
получаемая система уравнений есть система
линейных алгебраических уравнений очень
большого порядка, но с очень разреженной
матрицей. В случае нелинейных систем
итерационные процедуры, как правило, сводят
их к линейным системам.
Основные понятия и этапы метода сеток
продемонстрируем на примере решения
задачи Дирихле для классического уравнения
эллиптического типа — уравнения Лапласа.
Итак, имеем уравнение Лапласа
Аи = —- + —- = 0 (23.9.1)
дх ду
и граничное условие
и(М|г=Ц>(*^)> <23-9-2)
где Г — граница области G (рис. 23.9.1), в
которой ищется решение и(х,у),
удовлетворяющее уравнению (23.9.1) и граничному
условию (23.9.2).
На первом этапе метода сеток область
G непрерывного изменения аргумента с
границей Г заменяют приближающей её
сеточной областью Gfj с границей Гд. Для этого
Рис. 23.9.1
проведем линии х = const и у = const, так
что х = тНх(т = 0,М) и у = nhyIn = О,N\.
Величины hx и hy, называемые шагами
разностной сетки, в общем случае могут быть
различными.
Точки пересечения линий х = const и
у = const называют узлами разностной
сетки. Различают два типа узлов — внутренние и
внешние. Внутренними называют такие узлы,
для которых четыре соседних узла (по два в
каждом направлении) принадлежат области
G = G + Г . Сеточной функции
приписываются нижние индексы. На рис. 23.9.1
внутренние узлы обозначены пустыми
кружочками, а граничные — залитыми.
На втором этапе заменим
дифференциальный оператор Лапласа разностным
оператором. С этой целью выберем шаблон
разностной схемы — набор (конфигурацию) узлов,
с использованием которых проводится замена
производных конечными разностями.
Шаблон, содержащий р точек, называют р -
точечным. Для аппроксимации вторых
производных, входящих в оператор Лапласа,
используем пятиточечный шаблон, показанный
на рис. 23.9.2. Не теряя общности
рассуждений, рассмотрим далее случай, когда шаги
разностной сетки по направлению х w у
одинаковы, т.е. hx = hy = h . Используя
разложение функции на точном решении в ряд
Тейлора в окрестности точки (х,у), имеем:
u(x±h,y) = u(x,y)±h— +
h2 д2и Л3 д3и ^/,4\
u(x,y±h) = u(x,y)±h— +
й2Э2и Л3Э3и _/.4\
Из этих соотношений нетрудно
получить аппроксимации вторых производных со
вторым порядком точности:
д*и _u(x + h,y)-lu(x,y) + u(x-h,y) n(g\
Эх2 = Л2 * ''
&U и{х,у + И)-2и{х,у)+и{х,у-п) | /^ч
ду1 И2 * '
МЕТОД СЕТОК. ЗАДАЧА ДИРИХЛЕ ДЛЯ УРАВНЕНИЯ ЛАПЛАСА
883
Введем для сокращения записи
общепринятые индексные обозначения узлов в
соответствии с рис. 23.9.2 и соответствующие
обозначения сеточных функций в узлах:
ит,п>ит-\,п и Т-Д- Тогда соотношения для
производных запишем в виде
^v2 h2 \ г
(23.9.3)
(23.9.4)
"&
-Ку)
т-\,п
Qu(x,y + h)
т,п +1
и(х.у) u(x + h,y)
-О
т + \>п
дх
ВУ2
^u(x,y-h)
От>п-\
Рис. 23.9.2
ит,п+\ ^ит,п + ит,п-[
Используя соотношение (23.9.3) и
(23.9.4), записываем разностный оператор
Лапласа на пятиточечном шаблоне
следующим образом:
1.2. \ I
(23.9.5)
Для аппроксимации граничных условий
используются различные приемы. Для случая
прямоугольной области с границами,
совпадающими с линиями х = const и у ~ const,
граничные значения известны в узлах точно,
так как u$h = «q (w/zx, nhy ). В случае области
произвольной формы значения сеточной
функции в граничных узлах принимаются
равными значениям функции «q B
ближайших (по какому-либо критерию) точках
кривой Г (см. рис. 23.9.1). В случае задачи
Неймана или смешанной задачи, когда на
границе области задается значение производной
функции и, производится аппроксимация
производной.
Записав разностный оператор (23.9.5) во
всех внутренних узлах, получим систему
«сеточных» уравнений для нахождения
значений сеточной функции итп в узлах
разностной сетки.
На третьем этапе осуществляется
решение системы сеточных уравнений. В общем
случае сеточные уравнения могут быть
нелинейными. Однако в рассматриваемой задаче,
в силу линейности основного
дифференциального уравнения Лапласа, система
уравнений (23.9.5) является системой линейных
алгебраических уравнений для нахождения
значений неизвестных во внутренних узлах. При
этом число уравнений системы точно равно
числу внутренних узлов разностной сетки.
Отметим, что число уравнений может быть
весьма велико. Так, для нахождения
достаточно точного решения рассматриваемой
задачи требуется задать N = М ~ 50 + 100 , и,
следовательно, количество уравнений
достигает нескольких сотен или даже тысяч.
Перепишем систему сеточных решений
в виде
ит+\,п + ит-\,п + ит,п+\ + ит,п-\ ~ ^ит,п = °-
(23.9.6)
Отметим, что каждое из уравнений
системы содержит лишь пять неизвестных
ит+1,п>ит-\,п>ит,п+\>ит,п-\>ит,п> хотя в пол"
ной системе таких неизвестных « N . Таким
образом, матрица системы (23.9.6) является
сильно разреженной. Для решения систем с
сильно разреженными матрицами хорошо
приспособлены итерационные методы
решения систем линейных уравнений — метод
простой итерации, метод итерации Зейделя,
методы релаксации. Рассмотрим их
использование для решения системы (23.9.6).
Систему (23.9.6) запишем в форме
ит,п = -7\ит+\,п + ит-\,п + ит,п+\ + ит,п-\)-
(23.9.7)
Видим, что значение функции в
центральной точке есть среднее арифметическое
значений функции в четырех соседних по
направлениям х и у узлах. Уравнение (23.9.7)
можно интерпретировать как разностный
аналог теоремы о среднем для гармонических
функций.
Рассмотрим применение метода простой
итерации для решения системы (23.9.7). Пусть
область G , в которой разыскивается
решение, имеет для простоты прямоугольную
форму (рис. 23.9.3). Построим итерационный
процесс
884
Глава 23.9. УРАВНЕНИЯ В ЧАСТНЫХ ПРОИЗВОДНЫХ
ит,п ~ 4 у*т+1п + ит-\,п + ит,п+\ + ит,п-\)>
(23.9.8)
где верхний индекс означает номер итерации.
В граничных точках значения известны точно.
Для нахождения решения по соотношению
(23.9.8) необходимо знать начальное
приближение — значения функции на нулевой
итерации ivm'n . Доказывается, что для любого
шага разностной сетки итерационный процесс
(23.9.8) сходится независимо от начального
приближения ivmn. На практике желательно
выбирать начальное приближение возможно
более близким к точному решению.
Например, на основании теоремы о среднем для
гармонических функций в качестве хорошего
начального приближения можно принять
значение функции, полученное
интерполяцией на область G значений функции в
граничных узлах. Так, значение функции ir ' в
центральной точке 1 (рис. 23.9.3) может быть
взято как среднее арифметическое значений
функции в граничных узлах afb,c,d .
Сходимость итерационного процесса
можно улучшить, если использовать
итерационный процесс Зейделя, например, в виде
„(*) -iL(*-') . „(*) + „(*-')+||(*) \
ит,п ~ 4 \"т+\,п + ит-\,п + ит,п+\ + ит,п-\)>
(23.9.9)
Члены с индексами (m-l,/i) и
(aw,n-\) берутся с к-\л итерации, т.е. в
вычислениях используются уточненные
значения функции в этих точках. Как легко понять
из рис. 23.9.3, расчет по формуле (23.9.9) при
движении, например, слева направо от
границы области позволяет последовательно
вычислить значения функции на слоях и
у = const (или х = const). Использование
уточненных значений функции улучшает
сходимость метода итераций и позволяет
уменьшить требуемый для реализации метода объем
оперативной памяти компьютера, так как в
методе Зейделя не требуется одновременно
хранить значение функции в каждой точке на
двух итерациях. Итерации заканчиваются при
w_w(*-o|
выполнении условия max
т,п
заданная погрешность определения
где е -
решения.
В настоящее время распространены
релаксационные методы решения системы
(23.9.7), в которых итерационный процесс
(к) (к-\) 1-0)
строится по формуле итп = амт п ' + —-— х
xUk~l) +и{к) +и{к~]) +и{к) ] где со-
Х[ит+1п + ит-\,п + ит,п+\ + ит,п-\)> ' где ш
параметр релаксации. В методе релаксации
(к-\)
член (оит п ' учитывает информацию о
величине итп из предыдущей итерации. При
со > 1 итерационный метод называется
методом верхней релаксации, при со = 1 —
методом полной релаксации и при со < 1 —
методом нижней релаксации.
Для рассматриваемой нами задачи
можно показать, что число итераций / ,
необходимых для достижения заданной точности,
определяется соотношениями, приведенными
ниже:
Метод простой итерации / =0,2N Ine"
Метод итераций Зейделя / =0, l/V Ine"
Метод верхней релаксации... / = 0,77V In e"
В методе верхней релаксации число
итераций для достижения заданной точности
линейно зависит от числа узлов N, тогда как в
остальных методах зависимость квадратичная.
23.9.2. Явные и неявные разностные
схемы. При решении задач для уравнений
параболического и гиперболического типов
используются различные разностные схемы,
среди которых важное место занимают так
называемые явные и неявные разностные
схемы.
Рассмотрим их на примере
классического уравнения параболического типа —
уравнения теплопроводности
(нестационарного уравнения Лапласа)
= ^Г + ^Ч (23.9.10)
Рис. 23.9.3
со
dt "
д2и
"дх2
Ъ2и
V
следующими начальными
и(х,у
0) =
Щ>(х,у)
(23.9.11)
ЯВНЫЕ И НЕЯВНЫЕ РАЗНОСТНЫЕ СХЕМЫ
885
Рис. 23.9.4
и граничными
u{x,y,t)\r=u°(x,y,t) (23.9.12)
условиями. Решение ищется внутри
полубесконечного цилиндра (рис. 23.9.4).
Задачу (23.9.10) - (23.9.12) называют
эволюционной, имея в виду построение
эволюции решения во времени. Используются
также названия: задача Коши с граничными
условиями, или краевая задача с начальными
данными.
Построим разностную схему. Для этого
проведем линии х = mhx [т = О, М),
y = nhy[n = 0,N) и t = kx(k = 0,K), где
Их и Иу — шаги соответственно по х и у (по
пространственным координатам) и т — шаг
по / (по времени). Плоскости к = const
называют / -слоями или слоями по времени.
Сеточную функцию и (х + mhxi у + nhy, t + кх)
к
обозначим итп .
Запишем разностную аппроксимацию
уравнения (23.9.10) с использованием
шеститочечных шаблонов двух типов, показанных
на рис. 23.9.5.
На этом рисунке пустыми кружочками
обозначены узлы на к -м слое с известными
значениями функции, а зачерненными — узлы
т,п,к + \
т,п + \,к
на (& + 1)-м слое, на котором параметры
неизвестны и должны быть определены. Шаблон
на рис. 23.9.5, а соответствует так называемой
явной схеме, а шаблон на рис. 23.9.5, б -
неявной схеме. В явной схеме оператор Лапласа
аппроксимируется с использованием известных
значений функции на к -м слое, а в неявной
схеме — с использованием неизвестных
значений функции на (& + 1)-м слое. Без потерь
общности будем далее полагать, что шаги по
пространству одинаковы, т.е. hx - hy = h .
Тогда явная разностная схема,
соответствующая шаблону на рис. 23.9.5, а, запишется
следующим образом:
ик+' - ик
X
~ Ufn+I>n * um-l,n "*" utn,n+\ + ит,п-\ ~ ™т,п
и2
+ 0(т,А2).
Из этого соотношения следует, что
искомое значение определяется явным образом
через известные значения на к -м слое по
следующему соотношению:
к+\ к t
/г
х[ит+\,п +ит-\,п +ит,п+\ + ит,п-\ ~^ит,п)-
(23.9.13)
Для неявной разностной схемы,
соответствующей шаблону на рис. 23.9.5, б, имеем
/у^ + 1 _ цк
ит,п ит,п
пк+) , к+\ к+) пк+\ 4//*+1
(23.9.14)
т-\,п,к + \
т-\,п,к s^m,n,k т + 1,п,к
'т,п - 1,А
а)
т,п + \,к + \
т + \,п,к + \
/я,и-1,Лч-1
Ьт,п,к
б)
Рис. 23.9.5
886
Глава 23.9. УРАВНЕНИЯ В ЧАСТНЫХ ПРОИЗВОДНЫХ
Соотношение (23.9.14), записанное для
всех внутренних узлов (к + 1) -го слоя,
порождает систему линейных алгебраических
уравнений для определения неизвестных
значений функции в узлах. Каждое уравнение
этой системы содержит только пять неизвест-
uu.v ик+1 пк+\ nk+l nk+l nk+l vrvra
НЫХ ит+\,п>ит-\,п> w/w,/i+l»итуп-\»ит,п » хотя
общее количество неизвестных равно числу
внутренних узлов на [к + I) -м слое и может
быть весьма велико (число узлов
~ N ,N « 50 + 100 ). Следовательно,
матрица системы линейных уравнений является
пятидиагональной и сильно разреженной. Для
решения этой системы используются, как
правило, итерационные методы, некоторые из
которых описаны выше.
Очевидно, что при одинаковых шагах
разностной сетки число операций,
необходимых для отыскания решения на (к + 1)-м
слое, в явных схемах значительно меньше,
чем в неявных схемах. Однако в дальнейшем
будет показано, что условие устойчивости
разностной схемы накладывает значительные
ограничения на величины шагов в явных
схемах. Так как, в конечном счете, качество
разностной схемы при одинаковой требуемой
точности должно оцениваться количеством
операций, необходимых для получения
решения на всем временном интервале, то в ряде
случаев неявные разностные схемы
оказываются более предпочтительными, чем явные.
23.9.3. Аппроксимация. Устойчивость.
Сходимость. Рассмотрим некоторую задачу,
определяемую дифференциальным
уравнением и граничными условиями. Запишем её в
операторной форме:
Lu = f, (23.9.15)
где L — некоторый дифференциальный
оператор, действующий на искомую функцию
и, / — правая часть. Примем, что оператор
L включает как дифференциальные
уравнения, так и граничные условия. На некоторой
разностной сетке строим разностный
оператор Lfj, действующий на сеточную функцию
U/j. Примером дифференциального оператора
является оператор Лапласа А , а
соответствующий ему разностный оператор возникает
при аппроксимации вторых производных
разностными соотношениями (23.9.3) и (23.9.4).
При подстановке точного решения
уравнения (23.9.15) в оператор Цх имеем
V = //l+6//7>
где величина 6//2 называется невязкой.
Определение 1. Разностная схема
называется аппроксимирующей на решении, если
норма невязки стремится к нулю при
стремлении к нулю шага разностной схемы, т.е.
|5//7| -> 0 при h -> 0 .
Если при этом норма невязки
удовлетворяет условию ||б//7| < Cphp и константа
Ср не зависит от h , то говорят, что
разностная схема имеет р-й порядок аппроксимации
или разностная схема аппроксимирует
дифференциальный оператор с порядком р.
Например, разностный оператор
Lh 1?
аппроксимирует оператор Лапласа
л Э2 Э2
Д = —г- + —г- со вторым порядком точности.
Эх2 ду2
Определение 2. Разностная схема
называется сходящейся, если норма разности
точного и приближённого решений ||и - f//7||
стремится к нулю при стремлении к нулю
шага разностной сетки. Если при этом
\\и - И/,|| <Cqhq , то говорят, что разностная
схема имеет q-й порядок точности или имеет
место сходимость с порядком q.
Порядок аппроксимации
дифференциального уравнения не всегда совпадает с
порядком точности разностной схемы, так как
порядок точности разностной схемы зависит
как от аппроксимации дифференциального
уравнения, так и от аппроксимации
граничных условий.
Не всякая аппроксимирующая схема
является сходящейся. В связи с этим важным
является понятие устойчивости разностной
схемы.
Определение 3. Устойчивостью
разностной схемы называется непрерывная
зависимость решения разностной задачи от правых
частей и граничных условий. Для линейного
оператора схема устойчива, если
||мя|< С Ц.Л, ||, где С- константа, не
зависящая от шага разностной сетки и входных
условий / .
Поясним понятие устойчивости.
Ошибки при вычислении начальных и граничных
условий и правых частей уравнений из-за
ошибок округления и других причин можно
МЕТОД ФУРЬЕ ИССЛЕДОВАНИЯ УСТОЙЧИВОСТИ
887
рассматривать как возмущения начальных и
граничных условий и правых частей
уравнений. Очевидно, что разностная краевая задача
(или задача с начальными данными) будет
корректной и устойчивой, если решение
разностной краевой задачи будет незначительно
изменяться при малом изменении начальных
и граничных условий и правых частей,
связанном со случайными ошибками. В
противном случае разностная краевая задача
является неустойчивой. Важно отметить, что для
неустойчивых разностных схем уменьшение
шага сетки не приводит к устойчивости,
поскольку любые малые возмущения решения
со временем неограниченно возрастают.
Теорема. Пусть разностная задача
L/jU/j = f/j аппроксимирует оператор Lu = f
на решении с порядком р и устойчива. Тогда
решение и^ сходится к точному решению и
имеет место оценка ||и - и Л < Cphp , где С„ —
константа, не зависящая от Л и входных
данных / .
23.9.4. Метод Фурье исследования
устойчивости. Установить устойчивость
разностной схемы с использованием данного
выше определения на практике весьма
затруднительно. Поэтому предложен ряд
способов исследования устойчивости, позволяющих
получить достаточные, а в ряде случаев
необходимые и достаточные условия устойчивости
разностных схем. Из методов исследования
устойчивости упомянем спектральный
признак устойчивости, метод гармоник Фурье,
принцип максимума, метод операторных
неравенств. Последний метод самый сильный из
теоретических методов и дает строгие
результаты для линейных уравнений с переменными
(в том числе — разрывными)
коэффициентами.
Исследование устойчивости разностных
схем, аппроксимирующих сложные и в общем
случае нелинейные уравнения, проводится
следующим образом. Первоначально исходное
дифференциальное уравнение заменяется
более простым, модельным уравнением. Это
достигается либо «замораживанием»
коэффициентов в уравнениях с переменными
коэффициентами, либо, в случае нелинейных
уравнений, путем линеаризации последних.
Для полученного модельного уравнения
выписывается исследуемая разностная схема и
рассматривается задача Кош и при
возмущенных граничных условиях и возмущенных
правых частях. Исследуется эволюция решения
во времени, и если возмущения с течением
времени затухают, то разностная схема
считается устойчивой, в противном случае —
неустойчивой. Действительно, возмущения
граничных условий и правых частей можно
рассматривать как ошибки округления или
аппроксимации, неизбежно возникающие при
расчетах, и если разностная схема будет их
усиливать, то решение будет неустойчивым.
Метод гармоник Фурье занимает одно
из центральных мест среди методов
исследования устойчивости разностных схем. Он
используется для линейных разностных
уравнений с постоянными коэффициентами на
равномерной сетке. В методе гармоник Фурье
при исследовании устойчивости разностных
схем рассматривается задача Коши для
линейного модельного уравнения для
возмущений (добавок) начальных данных и правых
частей. При этом рассматриваются
возмущения (гармоники) специального вида.
Рассмотрим метод гармоник Фурье на
примере задачи Коши для уравнения
переноса
ди ди _п
Э/+Эх ' (23.9.16)
u(x,0) = Uq(x).
Точное решение задачи можно записать
в виде
M(*,/) = -i=y«o(e)e/9(*-'W
где / = . Решение задачи (23.9.16)
представляется как суперпозиция бегущих
монохроматических волн или гармоник вида
и0 (&)el - Поскольку при разной
аппроксимации / -кх , х - mh , то
соответствующую разностную гармонику можно
представить в виде ufn = Xkemmh, а решение
разностного уравнения - в виде
11т = X ОЛ**"""1* • 3Десь *• ~ множитель,
(0=-оо
который выбирается таким образом, чтобы
u,tJ было решением разностной задачи, а
со — номер гармоники в разложении в ряд
Фурье — определяется из разложения
начальной функции (начального возмущения) в
рассматриваемый ряд.
Множитель X , называемый модулем
перехода, в общем случае может быть
комплексным числом и является показателем
роста или затухания соответствующей
гармоники. При Щ > 1 начальные возмущения
возрастают со временем, а при Ш < 1 — зату-
888
Глава 23.9. УРАВНЕНИЯ В ЧАСТНЫХ ПРОИЗВОДНЫХ
хают. Очевидно, что разностная схема будет
устойчивой при условии \Х\ < 1, поскольку
любые возмущения правых частей и
начальных условий (ошибки округления,
аппроксимации и т.д.) будут затухать, так как
kH<i.
Дж. фон Нейманом было
сформулировано следующее условие устойчивости:
|А,| < 1 + о (т), которое также в ряде случаев
является и необходимым, но не достаточным,
условием сходимости. Ниже, однако, при
изучении разностных схем будем
использовать более жесткое условие: Щ < 1.
Применение метода гармоник Фурье для
исследования устойчивости разностных схем
для уравнения переноса. Рассмотрим пять
разностных схем, шаблоны которых показаны на
рис. 23.9.6: явный «уголок вперед» (рис.
23.9.6, а), явный «уголок назад» (рис. 23.9.6,
б), явная схема второго порядка точности
(рис. 23.9.6, в), явная схема Лакса (рис. 23.9.6,
г) и неявный «уголок назад» (рис. 23.9.6, д).
Светлыми точками выделены узлы, в которых
решение известно, а темными - узлы, в
которых требуется определить решение. Выпишем
некоторые вспомогательные формулы:
е1ШХ = cos (сох) + / • sin (сох),
1 - cos (сох) = 2 sin2 (сох/2),
sin (сох) = 2sin (cox/2)cos (сох/2),
(23.9.17)
i£?> = Хк+[ • е*<х-кЫ™) = Xk+l • е*<х+Н\
и^{=Хк-е1<х+Н\^ = Хк+{-е^.
. (23.9.18)
Для явного «уголка вперед» (рис. 23.9.6, а)
имеем следующую разностную схему:
т h
Используя (23.9.18), преобразуем формулу к
виду
Х-\ еы'-1
= 0
т h
и, используя (23.9.17), — к виду
Х = I + [l -cos(co/*)] — — / sin(co/i)—.
Для квадрата модуля X имеем
соотношение
\Х\2 = Tl + sin2 (шА/2)-1 + sin2 (соЛ)\,
из которого следует, что Щ > 1 при любых т
и h , т.е. разностная схема — явный «уголок
вперед» — абсолютно неустойчива. Этот же
результат был получен выше из других
рассуждений.
m9k + l
m,k m + l,k
а)
m,fc + l
m-\9k m,k
б)
тД + 1
m-l,k m9k т + 1Д
в)
m-\,k
Л m,k +1
г)
m + Uk
m-l,fc + l
д)
m9k + \
6 m,k
Рис. 23.9.6
МЕТОД ФУРЬЕ ИССЛЕДОВАНИЯ УСТОЙЧИВОСТИ
889
Для явного «уголка назад» (рис. 23.9.6, б)
имеем следующую разностную схему:
ит ит ! "т "т-\ _ q
Выкладки, аналогичные проведенным
для явного «уголка вперед», дают
|X|2=!+4sin2(coA/2)^^l).
И
Из этого соотношения следует, что
разностная схема - явный «уголок назад», как
это было показано и ранее, условно устойчива
при т/Л < 1.
Рассмотренные разностные схемы имеют
первый порядок аппроксимации по т и Л,
так как отброшены члены порядка малости
0(х,И).
Рассмотрим явную схему второго порядка
точности (рис. 23.9.6, в), в которой
производная по х аппроксимируется со вторым
порядком точности, т.е. отброшены члены
малости 0(т,Л I. Разностная схема имеет
вид
цт ит j "w+1 "m-1 _
Т 2Л
О, (23.9.19)
а для квадрата модуля X может быть
получено соотношение
|X|2 = l + sin2(co/2)^y,
из которого следует, что разностная схема
(23.9.19) абсолютно неустойчива, если
использовать условие |Х| < 1. При условии
|Х|<1 + 0(т) схему можно рассматривать как
т2
частично устойчивую, если —=- < Сх. Не-
/г
смотря на повышение порядка
аппроксимации при использовании условия Щ < 1 схема
абсолютно неустойчива.
Для схемы Лакса разностная схема имеет
вид
Схема Лакса имеет второй порядок
точности по Л и является условно устойчивой
при т/Л < 1. Эта схема обычно используется в
задачах механики сплошных сред и
принадлежит к схемам сквозного счета, так как
позволяет без явного выделения проводить
расчеты областей с поверхностями разрыва.
Для схемы неявный «уголок назад» (рис.
23.9.6, д) разностная схема имеет вид
и(*+,)_и(*)
uLky-uLk^
= 0.
(23.9.21)
Для этой схемы Щ < 1 независимо от
соотношения шагов, и, следовательно, схема
абсолютно устойчива.
Применение метода гармоник Фурье в
задачах исследования устойчивости разностных
схем для уравнения теплопроводности. Для
одномерного уравнения теплопроводности
Ъи_
Э/
дх2
(23.9.22)
рассмотрим две разностные схемы — явную и
неявную, шаблоны которых показаны на рис.
соответственно 23.9.7, а и 23.9.7, б.
Для явной схемы имеем следующую
разностную аппроксимацию с порядком
0(х,Л2):
i*+,)-«L*) i№.-2i£K№,
_ "m-l
т+\
т Л2
(23.9.23)
Нетрудно доказать, что модуль перехода
X для этой схемы
-->-№
^2 .81п^(соЛ/2).
Из этого соотношения следует, что
явная схема (23.9.23) условно устойчива при
А2 2
Для неявной схемы имеем следующую
разностную аппроксимацию с порядком
0(W):
,(*+■)
т 2Л т Л2
(23.9.20)
(23.9.24)
890
Глава 23.10. НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ МЕТОДЫ
т- \,к
• т,к + \
т,к
а)
т + \,к
/Я-1Д + 1
•
т,к + \ /я + 1,£ + 1
Рис. 23.9.7
6 m>k
б)
Можно показать, что для этой схемы
|А.| < 1 при всех т и И и, следовательно,
схема абсолютно устойчива.
Полученные выше результаты
исследования устойчивости различных разностных
схем для уравнения переноса и одномерного
уравнения теплопроводности сведены в
табл. 23.9.1, при этом используется условие
устойчивости Щ < 1. Из представленных
результатов следует, что неявные разностные
схемы более устойчивы, чем явные
разностные схемы, и, как правило, в неявных схемах
не накладываются ограничения на шаги
разностной сетки, связанные с устойчивостью.
Однако при использовании неявных
разностных схем для определения значений
неизвестных на (А; + 1)-м слое необходимо
решать систему алгебраических уравнений
относительно неизвестных щп + \т = 0,М . В то
же время для явных схем значения
неизвестных и^ + ' в каждой точке на [к + 1) -м слое
явным образом выражаются через известные
значения на к-м слое, и их вычисление
элементарно. Поэтому число операций для
нахождения М значений неизвестных на одном
слое в явных схемах значительно меньше, чем
в неявных схемах. В то же время из-за
ограничений, связанных с устойчивостью разностных
схем, число шагов по времени для достижения
конечного значения Т может быть значительно
больше в явных схемах, чем в неявных.
Таким образом, предпочтительность той
или иной разностной схемы при заданной
точности должна определяться с учетом
общего числа операций, необходимого для
полного цикла вычислений. С этой точки зрения
существуют ситуации, когда может быть
предпочтительнее та или иная схема — явная
или неявная. Например, для одномерных по
пространству задач часто более выгодными
оказываются неявные разностные схемы.
Глава 23.10
НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ МЕТОДЫ
На практике приходится иметь дело с
многомерными задачами, когда необходимо
учитывать изменение искомых функций по
координатам х, у, z ■ Для таких задач выбор
разностной схемы является нетривиальным и
требует анализа различных аспектов. Можно
показать, что расчет по явной схеме до
заданного момента времени Т с учетом
ограничений на шаги, связанных с устойчивостью,
требует по явной схеме ~ N операций, а
по неявной схеме ~ N [ операций. Здесь
N — число точек на слое, а Р —
пространственная размерность задачи. Для
рассматриваемого здесь метода переменных
направлений требуется N операций. В
табл. 23.10.1 представлено число операций для
различных схем и различных
пространственных размерностей задачи. Из таблицы
следует, что для задач с пространственной
размерностью больше единицы более
предпочтительным является метод переменных
направлений.
23.10.1. Число операций для различных схем
р
1
2
3
Явная
схема
N*
N*
rf
Неявная
схема
N2
rf
TV8
Метод переменных
направлений
N1
№
N*
23.10.1. Метод переменных
направлений (дробных шагов). Метод переменных
направлений рассмотрим на примере решения
двухмерного уравнения теплопроводности —
уравнения параболического типа с двумя
независимыми пространственными переменными
МЕТОД ПЕРЕМЕННЫХ НАПРАВЛЕНИЙ (ДРОБНЫХ ШАГОВ)
891
о
II
2JI
—J5
О
II
I
+
I
3 I
^1
I
^1
н4
+
1
2J6
^
+
^1
+
%
I
~aEi
«к:
&Й
+
+
3
о
ютн
е^
О
о
ю
<
СЗ
со
S
&
о
н
о
>»
S
о VI
со
о
со
S
VI
о
ж
со
О
О cd
5 «
о о
и н
•*
*
+
+
О
5
+
+0
if
+
+
S
о
+
•А*
I
о
•с
I
+
If
§5
В В
го \го
+1
2 г"^
го I го
го \<ъ
892
Глава 23.10. НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ МЕТОДЫ
эГ^+^г + /(*'*°- (2 °
Требуется найти решение этого
уравнения внутри параллелепипеда [0 < х < а,
0 < у < b,0 < t <Т] при начальном условии
u\t=Q =ио(х,у,0)
(23.10.2)
и граничных условиях на гранях
параллелепипеда
u\r=u°(x9y,t). (23.10.3)
Идея метода переменных направлений
состоит в сведении решения трехмерной
задачи по переменным t,x и у к решению
последовательности двухмерных задач по
переменным t,x и t,y.
Построим разностную схему. Пусть
т, hx и hy — шаги соответственно по t, x и
у и xm = mhx, yn = nhy , tk = кх ,
т = 0,М , л = 0, N , к = 0,К . Введем
разностные операторы
(*) ~ (к) (к)
Г L(*)l- Um-l,n " Шт,п + ит+\,п
т = \,М-\'9
(к) ~ (к) (к)
Г Г„(*) 1 _ "и,Д-1 " т>п + Um,n+\
n = \9N-\,
к = \9К-1
Аппроксимируя уравнение (23.10.1)
разностным, можем записать
+ (Lx + LyY
x[w^,) + (I - °)4*я J = /*,,*,
где а — параметр разностной схемы, который
может принимать значения от 0 до 1.
Погрешность аппроксимации такой схемы
О (тъ,/&/£), где v = 2 при а = 1/2 и
1) = 1 при о * 1/2 . Для явной схемы а = 0 ,
для чисто неявной схемы о = 1 .
Рассмотрим шаблоны, изображенные на
рис. 23.10.1. Отметим, что шаблон 23.10.1, в
не переносится на трехмерный случай.
Явная разностная схема (рис. 23.10.1, а)
1- i. Um п - Jmn
(23.10.4)
устойчива при x/h < 1/4 (полагаем
h - hx = hy). Схема позволяет по известным
значениям функции на временном слое к
найти решение на (к + 1) -м слое.
Неявная разностная схема (рис. 23.10.1, б)
(23.10.5)
абсолютно устойчива и позволяет определить
решение на (А: + 1)-м слое путем решения
системы линейных алгебраических уравнений
с ленточной матрицей с широкой слабо
заполненной лентой. Как следует из
табл. 23.10.1, явная и неявная схемы требуют
при Р = 2 ~ N и ~ N операций
соответственно, но и в том и в другом случае
требуемое количество операций весьма велико.
Между тем метод переменных направлений
требует лишь N операций.
Рассмотрим разностную схему метода
переменных направлений. Для этого введем
дополнительный промежуточный слой
(к + 1/2) и следующую разностную
аппроксимацию уравнения (23.10.1) на этом слое на
шаблоне (рис. 23.10.1, в):
(Л+1/2) (к)
т/2 \ ' > (23.10.6)
+L [и(к+{12)\= f(k)
i-L,y \umn I - Jm^n-
Согласно (23.10.6) вторая производная
по х аппроксимируется на к -м слое, а по
у- на (А: + 1/2)-м слое. Поэтому на
(А: + 1/2) -м слое имеем только три неизвест-
(Аг+1/2) (Л+1/2) (*+1/2)
ных значения и\, „ , , и;„ п ' ', uL ', в
каждом уравнении системы, хотя требуется
найти (/V-1) неизвестных (полагаем
N = М).
МЕТОД ПЕРЕМЕННЫХ НАПРАВЛЕНИЙ (ДРОБНЫХ ШАГОВ) 893
а =1/2
т-\,п,к + \ т,п,к + \ т + \,п,к + \
т-\,пук s' т,п,к
Гт,п-\,к
О = 1
т -\уп,к + 1
т,п + \,к
т + \,п,к
т,п + \,к +
1
т,п-\,к +
т,п + \,к + 1
т + \,п,к + 1
т,п-\ук + 1
О т,п,к
б)
имеем систему линейных уравнений с трех
диагональной матрицей, которую можно за
писать в виде
Дг.»
/
Л
2Л:
2 "т,п-\
1+-
2«
,^+1/2) +
где
Рис. 23.10.1
Итак, во-первых, на (к +1/2) -м слое трехдиагональные системы порядка М -1
для каждого а/2. Независимое решение на
(А: + 1/2) -м слое при фиксированном т
позволяет существенно уменьшить объем
вычислений по сравнению с решением одной
системы порядка (Л/ - 1) .
После того как найдены все неизвестные
и)п „' ' на промежуточном слое, решение на
(23 10 7) (А: + 1) -м слое определяется следующей раз-
, ч ностной аппроксимацией уравнения (23.10.1):
rifi,/i - ит,п 1 \Lx\ ит,п Jm,n вы (*+1) (к+\/2)
2.2 m,«+l
числяется по известным значениям функции
на к-ы слое. Присоединив к (23.10.7) значе-
(к+\/2) (Л+1/2)
ния иг ^ ' и w,w yy ', известные из краевых
условий, можем вычислить значения
неизвестных на {к + 1/2) -м слое. Для этого путем
решения системы линейных уравнений с
трехдиагональной матрицей можно
использовать такой эффективный метод решения, как
метод прогонки (см. п. 23.2.3).
Во-вторых, система линейных уравнений
(23.10.7) распадается на М-\ независимые
т/2
+l Uk+U2A- f(k+i,2)
-гл^у |и/И)/, I — Jm,n
(23.10.8)
Соотношение (23.10.8) может быть
переписано в виде
( - \
1
2А
2 т-\,п
2hi
(23.10.9)
, * „(*+!) _ г-(*+1/2)
+ ТГТ "т+1,п ~ г'",п >
2к
894
Глава 23.10. НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ МЕТОДЫ
mee+1/2)=~^H:1/2)]-^)+«i,r)
вычисляется по известным значениям
функции на (к + 1/2) -м слое. Аналогично
ситуации на предыдущем промежуточном слое
система (23.10.9) (с присоединенными
граничными значениями) распределяется на
(N - 1) независимые трехдиагональные
линейные системы, отвечающие
фиксированным значениям я, каждая из которых
решается методом прогонки. Только прогонка теперь
выполняется по индексу т, т.е. в
направлении оси х. Коэффициенты при неизвестных в
уравнениях (23.10.7) и (23.10.9) таковы, что
прогонка является корректной и устойчивой.
23.10.2. Метод установления. Метод
установления обычно используется для
решения уравнений эллиптического типа или
смешанных эллиптико-гиперболических
уравнений. В задачах газовой динамики
уравнения эллиптического типа описывают
стационарное дозвуковое течение, например,
течение за отошедшей ударной волной при
сверхзвуковом обтекании затупленных тел,
или течение в сужающейся части сопла Лава-
ля. Уравнение для функции тока и
потенциала скорости в плоском несжимаемом течении
является уравнением Лапласа. К
эллиптическому уравнению приводит задача
определения напряжений, возникающих при упругом
кручении длинного цилиндрического
стержня, задача о стационарных потоках тепла в
двухмерном теле и многие другие.
Для уравнений эллиптического типа
характерной является задача Дирихле, когда на
границе Г области G , в которой ищется
решение, задана искомая функция и(х,у)
(рис. 23.10.2, а). В связи с этим идею метода
установления рассмотрим на примере задачи
Дирихле для уравнения Лапласа с двумя
независимыми переменными х и у:
(23.10.10)
Aw
и(х,
д2и
~дх2
У)\г
д2и
= и°(*
= 0,
>У)-
X' Л
Задачу (23.10.10) будем называть
стационарной, так как решение задачи не зависит от
времени. Наряду со стационарной задачей
рассмотрим эволюционную (нестационарную)
задачу для параболического уравнения
теплопроводности с теми же граничными
условиями и произвольно выбранными начальными
данными (рис. 23.10.2, б):
— = Aw,
dt
u(x,y,t)\r=u°(x,y),
и(х,у,0) = ио(х,у).
(23.10.11)
Лг
Рис. 23.10.2
В общем случае задачу (23.10.11)
называют нестационарной краевой задачей, если
граничные условия зависят от времени. В
представленной формулировке задача
(23.10.11) называется вырожденной
нестационарной задачей, так как условие на границе
области не зависит от времени.
Таким образом, в методе установления
вводится новая независимая переменная / , и
задача формально усложняется —
увеличивается размерность задачи. Однако при этом
увеличивается набор возможных разностных
схем решения задачи, что допускает выбор из
них устойчивых и экономичных. Важным
преимуществом метода установления является
то, что краевая задача для эллиптического
уравнения сводится к задаче с начальными и
краевыми условиями. Из физических
соображений достаточно очевидно, что решение
эволюционной задачи (23.10.11) при /-> оо
будет стремиться к решению стационарной
задачи (23.10.10).
23.10.3. Метод сквозного счета. В
задачах механики сплошных сред приходится
иметь дело с течениями, в которых возникают
поверхности сильного разрыва, такие, как
ударные волны, центрированные волны
разрежения, поверхности контактного разрыва.
На этих поверхностях терпят разрыв функции
и их производные. При расчете таких течений
приходится либо явно выделять эти
поверхности, используя законы сохранения, либо
строить специальные методы решения,
называемые методами сквозного счета, в которых
априори неизвестные поверхности разрыва
явно не выделяются и просчитываются
«насквозь» вместе с областями непрерывного
течения.
Среди методов сквозного счета можно
выделить дивергентные схемы - схемы,
обладающие аппроксимационной вязкостью.
Одним весьма эффективным и красивым мето-
МЕТОД СКВОЗНОГО СЧЕТА
895
дом сквозного счета, использующим схемы с
аппроксимационной вязкостью, является
метод Годунова.
В основе метода Годунова лежат две
идеи. Первая состоит в использовании при
построении разностной схемы точных
решений с кусочно-постоянными начальными
данными. Для гиперболических уравнений
такими точными решениями являются
совокупности сравнительно простых и
независимых решений задачи о распаде произвольного
разрыва.
Вторая идея состоит в использовании
гибких и деформирующихся разностных
сеток, связанных с поверхностями разрывов и
выделяемых при расчете начальной стадии.
Рассмотрим применение метода Годунова для
решения задачи Коши для уравнения
акустики:
at р0 Эх
дР 2 bU л
(23.10.12)
где U и Р — соответственно возмущения
скорости и давления в акустической волне,
uq и ро — скорость звука и плотность в
невозмущенном газе. Используя инвариант Ри-
мана /+ = P± uqPqU , для этих уравнений
можно записать общее решение уравнения
(23.10.12) в виде
U = Uf,P = Pf при х
U = Ufl,P = Pfl при х
P = £^[f(x-a0t)-g(x + a0t)l
(23.10.13)
где / и g - произвольные функции,
определяемые из начальных условий.
Построим с использованием (23.10.13)
решение простейшей задачи о распаде. Пусть
в момент / = 0 заданы следующие начальные
условия:
U0(x) = UIiP0(x) = PI при х<х*,
Щ (х) = Uи, Р0 (х) = Рп при х > х\
(23.10.14)
где lfj,Ujj,Pj,Pjj — некоторые константы,
такие, что Uj Ф 11ц н Pj Ф Рц .
Начальные условия (23.10.14) таковы,
что имеет место произвольный разрыв
функций U и Р в точке х , который с течением
времени каким-то образом трансформируется
в пространстве х, /. Такая задача и
называется задачей о распаде произвольного разрыва.
Построим её решение, используя свойства
инвариантов Римана. Поскольку инвариант
Римана /+ постоянен вдоль характеристики
х - a$t = const, а инвариант /_ постоянен
вдоль характеристики х + a$t = const,
приходим к структуре решения, изображенной на
рис. 23.10.3. Нетрудно видеть, что решение
задачи о распаде разрыва имеет вид
U
2 2я0ро
при х* - a$t < х < х
< х* -a^t в области I,
> х* + %t в области II,
Pi+Pii „_ Uu-Ui
2
■ Wo ■
(23.10.15)
+ a^t в области III.
Эти области изображены на рис. 23.10.3.
Построенные функции U(x,t) и
P(x,t) имеют разрыв вдоль характеристик
х + a0t = х* и х - aQt = х*, разделяющих
области I, II и III. Поскольку функции U и
Р не являются непрерывными, то примем,
что полученное решение является
обобщенным решением задачи о распаде разрыва.
Перейдем к построению разностной
схемы метода Годунова. Пусть в момент
времени / = 0 заданы непрерывные функции
Uq (x) и Pq (x) . Заменим область
непрерывного изменения аргумента дискретным
множеством точек — разностной сеткой, узлы
Рис. 23.10.3
896
Глава 23.10. НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ МЕТОДЫ
ад
<0
которой обозначим через jc„
б)
Рис. 23.10.4
Расстояние сетки обозначим Um-\ji и
между соседними узлами есть шаг
разностной сетки. Примем, что между точками
хт-\ и хт функции U и Р постоянны.
Такое предположение эквивалентно тому,
что непрерывные функции Uq (х) и Pq (jjc)
заменены некоторыми кусочно-
постоянными функциями, сохраняющими
постоянные значения между узлами
разностной сетки (рис. 23.10.4, а).
Их значения между узлами разностной
т-1/2 > присвоив
соответствующему слою полуцелый индекс
(ли —1/2). В силу сказанного на границе
между слоями возникает распад разрыва. В
результате в каждом узле сетки образуются
звуковые волны, распространяющиеся вправо и
влево со скоростью звука а$ . Через
некоторое время т структура решения имеет вид,
изображенный на рис. 23.10.4, б. Согласно
формулам (23.10.15) решение в окрестности
точки хт будет иметь вид:
и = ит-\,Ъ р = Рт-\/2 в области I: хт_{ + a0t < х < хт -
и = tf/n+i/2»р = ^«+1/2 в области II: хт + aQt < х < хт+[
dot,
и = ил
_ Um-\/2 + U/n+l/2
Рт+\/2 - Рт-\/2
/и+1/2
р р _ Рт-1/2 + Р*
Здесь через Uт и Рт обозначены значения,
возникающие при распаде разрыва в узле т.
Изображенная на рис. 23.10.4 структура
решения сохранится до тех пор, пока
звуковые волны, вышедшие из соседних узлов, не
встретятся между собой. После этого её
нужно перестроить заново, и даже в случае
равномерной сетки эта процедура оказывается
чрезвычайно громоздкой.
В связи с этим предлагается следующий
способ построения решения в момент
времени t - 1. Заменим решение (23.10.16) другим
решением, таким, которое имеет ту же
структуру, что и в начальный момент t = 0.
Приближенно примем, что решение при г = т
также кусочно-постоянно внутри интервалов,
ограниченных прежними узлами сетки хт.
Новые средние значения этих функций при
2 2я0ро
в области III: хт - a0t < х < хт + <70/,
(23.10.16)
■ Wo *
и,
т+1/2 ~ ит-[/2
и„
и х,„ обозначим
г = т между узлами хт_у
через Um-{l2 и Рт~1'2 .
Оказывается, что эти величины можно
определить по формулам:
цт-\/2 = ц
т-1/2
i<'-
Pm-l)>
рт-'12 = pm-ii2-lwl{um-um-{),
(23.10.17)
где U и Р в правой части определяются по
формулам (23.10.16) для точек соответственно
т и т-\.
23.10.4. Метод прямых. Основная
идея метода прямых и рассматриваемого далее
метода характеристик состоит в сведении
уравнений в частных производных к решению
системы обыкновенных дифференциальных
МЕТОД ПРЯМЫХ
897
У*
Уо+Н
Уо
Уп+\=Уо + (п + 1)Л = const
>>„ = >^0 -h я Л = const
•Уи-1=.Уо + (л-1)Л = const
уравнений. В этом состоит их отличие от
метода сеток, который непосредственно сводит
решение систем уравнений в частных
производных к решению систем алгебраических
уравнений. Метод прямых может быть
использован для решения уравнений в частных
производных любого типа, но используется в
основном для решения эллиптических и
параболических уравнений
Р
Рис. 23.10.5
где фу (х), \|fy (у), j = 0,1 - заданные
функции (рис. 23.10.5).
На отрезке [д^Л) + Н] возьмем точки
Уп = Уо + nh , п = IN , А = #/(1 + N) и
проведем прямые у = уп - const (см. рис.
23.10.5). Предполагая существование доста-
В методе прямых уравнения в частных точно гладкого решения и(х,у) задачи
производных рассматриваются на линиях, v
параллельных одной из координатных осей, (23.10.18) - (23.10.19), положим в уравнении
что приводит к исчезновению зависимости от (23.10.18) у = уп и заменим производные по
одной из независимых переменных. Сущность
метода состоит в следующем. Пусть в
прямоугольной области G = [а < х < р,
Уо < У < Уо + Н] необходимо найти решение
дифференциального уравнения
у разностными отношениями,
воспользовавшись, например, соотношениями
ду
1У=Уп
2h
д2и
Ъ1и
кЭи
а(х>у)т1 + М*> у)—? + с(х>у)т- +
1
Эх
уЭи
ъу1
'Эх
эу2
+ d(x,y)— + e(x9y)u = f(x,y),
ду
(23.10.18)
где а,Ь,сис1 >0. Пусть уравнение (23.10.18)
удовлетворяет следующим граничным условиям:
и(х,Уй) = <Ро(х),и(х,у0 + Н) = у1(х)
при а < х < р,
и(<*>У) = Щ(у)МЬУ) = }У\(у)
при у0 < у < у0 + Н,
(23.10.19)
У=Уп
хК+1 (*)" 2ип (х) + ип-\ (*)] + o(h2),
где и„(х) = и(х,уп).
Проводя такую замену на всех линиях
уп = const (л = 1, N) и пренебрегая малыми
порядка Olh j, получаем систему N
обыкновенных линейных дифференциальных
уравнений второго порядка:
ап (х)и'п (х) + ^р-[ип+{ (х) - 2ип (х) + ця_, (х)] +
+с„ (х)и; (х) + -Ш[цл+| (х) _ „„_, (х)] + вл (х)ы„ (х) = /„ (х), п = Tjf,
(23.10.20)
2h
где ип (х) обозначает приближенное значе- д„ {х),Ьп (х),с„ (х),*/„ (х),^ (*) и Л (*) ~
ние решения и(х,у) на прямой у = уп, а значения коэффициентов a,b,c,d,e,f в
29 — 7706
898
Глава 23.10. НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ МЕТОДЫ
уравнении (23.10.18) на линии
у = уп = const.
Используя граничные условия на
границе области, имеем:
«о(х) = <ро(х), ос<х<р,
И/1+l (*) = Ф/1+2(*)» <*^*^Р>
ип («) = Ч>0 (Л), _3 (Р) = Vi (Уп)>
n = l,N.
(23.10.21)
Ha прямой у = у,7 каждое из уравнений
(23.10.20) содержит три неизвестных значения
функции un+i (х), ип (х), un_i (х). Всего с
учетом граничных значений число
неизвестных равно числу линий уп = const и равно
числу уравнений в системе.
Система (23.10.20) обыкновенных
дифференциальных уравнений с граничными
условиями (23.10.21) аппроксимирует
уравнение (23.10.18) с граничными условиями
(23.10.19) и называется системой уравнений
метода прямых.
Эта система уравнений вместе с
граничными условиями решается численно (см. пп.
23.8.6 - 23.8.7) либо аналитически.
23.10.5. Метод характеристик. Метод
характеристик применяется для решения
уравнений гиперболического типа в задачах
газовой динамики и теории упругости. Метод
характеристик позволяет уменьшать на
единицу размерность задачи и в случае
уравнений в частных производных с двумя
независимыми переменными сводит их к системе
обыкновенных дифференциальных
уравнений. Метод характеристик тесно связан с
решением задачи Коши. Характеристические
поверхности (линии) определяются как
поверхности (линии), на которых решение
задачи Коши либо не существует, либо не
единственно.
Рассмотрим квазилинейную систему
порядка р вида
. ди пди
А — + В —
Эх ду
f,
(23.10.22)
где матрицы А и В и вектор / с элементами
ajj,bjj,fj есть функции независимых
переменных х,у и компонент U[,...,up искомой
вектор-функции. Оказывается, что в
плоскости (х, у) существуют линии, называемые
характеристиками, на которых решение
задачи либо не существует, либо не единственно.
Уравнение этих линий можно получить,
приравняв нулю определитель
В-А
Ъх
= 0.
(23.10.23)
Из соотношения (23.10.23), которое
является многочленом степени /?, можно найти
производные dy/dx, определяющие
характеристические направления. Таким образом,
получаем р дифференциальных уравнений
dy
dx
= \i(x,y,u), / = !,/>, (23.10.24)
которые называют уравнениями направлении
или уравнениями характеристик. Отметим,
что р действительных корней уравнения
(23.10.23) существует только для
гиперболических систем.
Через каждую точку плоскости (х, у)
проходит р характеристик. На
характеристиках выполняются соотношения, называемые
уравнениями совместности. Если приравнять
нулю определитель порядка р расширенной
матрицы [Bdx - Ady, fdx - Adu), то
получаются соотношения, связывающие
дифференциалы искомых функций с дифференциалами
независимых переменных вдоль
характеристик.
Таким образом, можно видеть, что
система дифференциальных уравнений в частных
производных (23.10.22) сводится к
эквивалентной системе обыкновенных
дифференциальных уравнений.
Уравнение (23.10.23) для системы
(23.10.22) имеет вид
Ь[{-Хап Ь\2-Ь>ап
t>l J - Ха2 j ^22 ~~ ^22
=
0
или аХ2 + ck + b - 0,
|,* = |в|,с =
bn h\
a\2 a2l\
-
«и
a\2
t>22
Решив это уравнение, найдем два
уравнения для направлений двух характеристик,
проходящих через каждую точку плоскости
(х,у) (рис. 23.10.6, а):
dy .(i), v -c + >Jc2 -4ab
(23.10.25)
МЕТОД ХАРАКТЕРИСТИК
899
dy_
dx
№(х9у9щ,и2) = -
■4J
Aab
2а
(23.10.26)
Уравнения совместности получим, если
приравняем нулю определители первого и
третьего или второго и третьего столбцов
расширенной матрицы
' Ьх xdx - щ {dy b\2dx - а{2dy f\dx - щ xdux - ax2du2 \
bi\dx-alxdy b^dx-a-ndy f2dx - a2Xdux - a22du2J
Уравнения совместности имеют вид:
\a\W + b\ dux + cdu2 + hdx + edy = 0,
где
* = 1,2,
hdx + edy = (h + eX(kAdx9
(23.10.27)
с = a22bx2 -fl,2^22> h = ^22/1 " ^12/2 >
e = anf2 - a22fx , g = h + e\{kK
Уравнения (23.10.25) - (23.10.27)
образуют систему четырех обыкновенных
дифференциальных уравнений для нахождения
значений х,у,Щ,и2 вдоль характеристик.
Перейдем к изложению существа
численного метода характеристик. Рассмотрим в
плоскости (л:, у) две достаточно близкие
точки/и 2 (рис. 23.10.6, б), не лежащие на
одной характеристике, и зададимся целью
определить значения щ и и2 в точке 3
пересечения характеристик, проходящих через эти
точки.
Переходя в (23.10.25) и (23.10.26) от
дифференциалов к разностям, имеем для определения
координат точки 3 (^З'-Уз) систему двух
линейных уравнений:
|й-Л=*!1)(*з-*1).
[Уз-У2=Ь(2)(х3-х2).
Аналогично из (23.10.27) получаем
(Х{% + ft) (wI3 - щ i) + q (u23 - i*2i) + g\ (*3 ~х\) = 0,
[\{2)а + ft) (|/13 - ип) + с2 (и23 -и22) + g2 (x3 -х2) = 0,
где Ujj = щ [xj>yj) • Решая эту систему
относительно х39у3,ихз и «2з, находим
приближенные значения х3,у3 и WI'W2 в точке 3.
Это приближение может оказаться
недостаточно точным, так как мы заменили
характеристики, выходящие из точек / и 2,
отрезками прямых. В действительности точка 3
должна быть точкой пересечения, вообще
говоря, криволинейных характеристик, и,
кроме того, дифференциалы всюду мы
заменили разностями. Ошибка в определении
x3iy3,uX3 и и23 будет порядка квадрата
расстояния от точки J до точек / и 2
Пусть теперь их и и2 заданы на дуге
ЛВ некоторой кривой, которая ни в одной
точке не имеет характеристического
направления. Требуется определить решение в
окрестности А В. Эта задача — задача Коши.
Выберем на ЛВ ряд точек Л,я, ft, ...,# (рис.
23.10.6, в) и проведем через каждую из них
характеристики обоих семейств (23.10.25) и
(23.10.26). В точках их пересечения
описанным выше способом можно вычислить
искомые функции. Зная решение в этих точках,
можно вычислить решение еще на одном слое,
и так до тех пор, пока не найдем решение в
точке С. Таким образом последовательно
определяется решение и одновременно
выстраивается характеристическая сетка. Аналогично
определяется решение в характеристическом
треугольнике ABD (рис. 23.10.6, в).
УА
а)
Рис. 23.10.6
29*
900
Глава 23.10. НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ МЕТОДЫ
СПИСОК ЛИТЕРАТУРЫ
1. Бахвалов Н.С. Численные методы. М.:
Наука, 1973.
2. Волков Е.А. Численные методы. М.:
Наука, 1987.
3. Демидович Б.П., Марон И.А. Основы
вычислительной математики. М.: Наука, 1970.
4. Калиткин Н.Н. Численные методы.
М.: Наука, 1976.
5. Пирумов У.Г., Росляков Г.С.
Численные методы газовой динамики. М.: Высшая
школа, 1987.
6. Роуч П. Вычислительная
гидродинамика. М.: Мир, 1980.
7. Самарский А.А., Попов Ю.П.
Разностные схемы газовой динамики. М.: Наука, 1975.
8. Самарский А.А. Введение в численные
методы. М.: Наука, 1982.
9. Самарский А.А. Теория разностных
схем. М.: Наука, 1977.
10. Самарский А.А., Николаев Е.С.
Методы решения сеточных уравнений. М.: Наука,
1978.
11. Пирумов У.Г. Численные методы.
Учебное пособие. М.: МАИ, 1998.
12. Киреев В.И., Пантелеев А.В.
Численные методы в примерах и задачах. М: МАИ,
2000.
Раздел 24
ИССЛЕДОВАНИЕ ОПЕРАЦИЙ
Глава 24.1
ОСНОВНЫЕ ПОНЯТИЯ
ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
Зарождение исследования операций как
научной дисциплины и появление самого
термина «исследование операций» относятся
к началу второй мировой войны и
обусловлены практической необходимостью наилучшей
организации широкомасштабных боевых
действий, а также прогнозирования их исхода
при принятии командованием различных
решений.
В настоящее время методы исследования
операций находят широкое применение в
решении самых разных практических задач.
Это связано с тем, что любая операция, в том
числе, и военная, представляет собой
совокупность целенаправленных действий, а
исследование операций — поиск путей
достижения одной или нескольких целей.
Далее исследование операций понимается
как комплексная математическая дисциплина,
занимающаяся построением, анализом и
применением математических моделей
принятия оптимальных (наилучших в каком-то
смысле) решений. Основной задачей
исследования операций является задача выбора в
заданном множестве элемента,
удовлетворяющего тем или иным критериям (от греческого
kriterion - средство для суждения). При этом
любой элемент множества называют
допустимым решением, а выбранный элемент -
оптимальным решением.
24.1.1. Постановки задач и их
классификация. Построение математической
модели любой задачи исследования операций
всегда начинается с описания множества G
допустимых решений и критериев
оптимальности. При этом под критерием оптимальности
понимают признак, на основании которого
проводятся сравнительная оценка допустимых
решений и выбор оптимального решения.
Пример 24.1.1. Пусть имеется четыре
вида продуктов П^ , к = 1,4, из которых
необходимо составить паек, удовлетворяющий
следующим требованиям:
1) в паек должны входить все виды
продуктов;
2) содержание белков, жиров и
углеводов в пайке должно быть не менее
соответственно b\,bi и Ь$ единиц;
3) стоимость пайка не должна
превосходить С денежных единиц;
4) вес пайка не должен превышать
заданной величины р\
5) паек должен быть минимального
объема;
6) паек должен иметь максимальную
калорийность.
Рассматриваемая задача является задачей
исследования операций. Построим ее модель.
Пусть Xfr — количество единиц продукта П^
в пайке и А; = 1,4. В этом случае вектор
т
X = (Х| х2 х3 ха) полностью определяет
состав пайка. Проанализировав требования
1-6, приходим к выводу, что требования 1-4
имеют характер ограничений, накладываемых
на компоненты вектора X, а требования 5 и 6
- явно выраженный критериальный характер.
Для описания множества G допустимых
решений для всех к = 1,4 считаем
известным, что единица продукта П^ содержит
902
Глава 24.1. ОСНОВНЫЕ ПОНЯТИЯ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
ак\ единиц белков, ак2 единиц жиров, ак^
единиц углеводов, стоит ск денежных единиц
и имеет вес рк . В этом случае требования 1-4
приводят к системе неравенств, задающих в
R множество G :
I хк > 0, А: = 1,4;
4
\^akjxk>bj, у = 1,3;
I 4
\£скхк <С;
\к=1
4
U=l
Следовательно, допустимое решение
представляет собой четырехмерный вектор
т
X = (Х[ Х2 Хз ха) > принадлежащий
множеству G .
Если для всех А; = 1,4 считать
известным, что единица продукта Пк имеет объем
vk и калорийность qk , то, согласно
требованиям 5 и 6, приходим к следующим
критериям оптимальности:
4 4
X vkxk -> min, £ gkxk -> max.
к=\ XeG k=\ XeG
При рассмотрении задачи о
формировании пищевого пайка мы выступали как
исследователи операции. По
сформулированным требованиям нами была построена
соответствующая математическая модель, и на
следующем этапе исследований с
использованием этой модели мы должны найти
оптимальное решение из множества G допустимых
решений. Но, как правило, принимает
решение не исследователь операции, который
лишь готовит информацию для принятия
решения, а «лицо, принимающее решения»
(ЛПР). Именно ЛПР сформулировало
требования к пищевому пайку в примере 24.1.1 и
оно же примет окончательное решение о
составе пищевого пайка.
Под ЛПР далее понимается группа
людей, которая, вырабатывая согласованные
требования к допустимым решениям и
критериям оптимальности, принимает решения.
При этом нужно помнить о том, что любое
решение всегда принимается в соответствии с
информационным состоянием ЛПР, т.е. в
соответствии с его содержательными
представлениями о возможных и целесообразных
действиях в рассматриваемых условиях. В
математической модели это отражается на множестве
G допустимых решений и критериях
оптимальности. Поэтому математическая
постановка каждой задачи исследования операций
должна полностью отражать информационное
состояние ЛПР. Заметим, что проверка
адекватности самих содержательных
представлений ЛПР о возможных и целесообразных
решениях уже выходит за рамки исследования
операций.
Пример 24.1.2. Вернемся к задаче о
составлении пищевого пайка, рассмотренной в
примере 24.1.1. Можно представить себе
ситуацию, когда по каким-то причинам у ЛПР
изменилось информационное состояние, что
повлекло за собой замену требований 3, 5 и 6
следующими требованиями:
За) стоимость пайка должна быть
минимальной;
5а) объем пайка не должен превосходить
заданной величины v ;
6а) калорийность пайка должна быть не
меньше заданной величины q .
Для описания множества G допустимых
решений и критериев оптимальности
воспользуемся обозначениями, введенными при
рассмотрении примера 24.1.1.
Проанализировав требования 1, 2, За, 4, 5а, 6а, приходим к
выводу, что в рассматриваемом случае
требования 1, 2, 4, 5а, 6а имеют характер
ограничений, накладываемых на компоненты
вектора X, определяющего состав пайка, а
требование 3 имеет явно выраженный
критериальный характер. В этом случае в соответствии с
требованиями 1, 2, 4, 5а, 6а множество G
допустимых решений описывается системой
неравенств:
Г 4
X**/** *bj, у = 1,3;
\к=1
4
\^ркхк <р\
\к=\
I 4
Xv*** -v;
\к=[
4
А:=1
[Хк>0, к = 1,4,
а единственный критерий оптимальности в
соответствии с требованием За имеет
следующий вид:
КЛАССИФИКАЦИЯ ЗАДАЧ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ ПО СТРУКТУРЕ СОСТОЯНИЯ 903
4
Примеры 24.1.1 и 24.1.2 являются
наглядной иллюстрацией того, что при
изменении информационного состояния ЛПР
нередкими являются случаи, когда некоторые
ограничения, описывающие множество G
допустимых решений, трансформируются в
критерии оптимальности, а критерии
оптимальности - в ограничения.
Для удобства дальнейших рассуждений
остановимся на классификации возможных
постановок задач исследования операций,
которая может проводиться по различным
признакам.
24.1.2. Классификация задач
исследования операций по виду информационного
состояния «лица, принимающего решения».
Если принятие решения происходит в
наперед известном и не изменяющемся во
времени информационном состоянии ЛПР, то
задачу исследования операций называют
статической, а вся процедура принятия решения
может быть реализована за один этап (шаг).
Понятие статической задачи исследования
операций иллюстрируется примерами 24.1.1 и
24.1.2. К классу статических задач относят
также задачи исследования операций с
несколькими различными, но не
изменяющимися во времени информационными
состояниями — ситуация, характерная для группы
«лиц, принимающих решения». В частности,
если считать, что состав пищевого пайка
должен удовлетворять как требованиям,
сформулированным в примере 24.1.1 и
соответствующим информационному состоянию
первого ЛПР, так и требованиям,
сформулированным в примере 24.1.2 и соответствующим
информационному состоянию второго ЛПР,
то мы снова приходим к статической задаче
исследования операций, но уже с двумя
информационными состояниями.
Если в процессе принятия решения
информационное состояние ЛПР изменяется во
времени, то задачу исследования операций
называют динамической. В этом случае
зачастую наиболее целесообразной является
поэтапная (многошаговая) процедура принятия
решения. Кроме того, возможным является
представление процедуры принятия решения
в виде непрерывного во времени процесса.
Пример 24.1.3. Предположим, что
корабль движется со скоростью v(t), где t —
текущий момент времени, относительно
течения, скорость которого w постоянна как по
величине, так и по направлению. Необходимо
найти программу управления рулями корабля,
при которой он достигает заданной конечной
точки из заданной начальной точки за
минимальное время, если \v(t) = vq = const. В
данном случае содержательные представления
ЛПР о возможных и целесообразных
действиях (управление рулями) зависят от текущего
момента времени t , так как от него зависит
угол ф(/) между вектором скорости корабля
v(t) и вектором скорости течения w . Таким
образом, классическая навигационная задача
относится к динамическим задачам
исследования операций.
Задачи исследования операций с одно-
шаговой и многошаговой процедурами
принятия решений зачастую называют
соответственно одношаговыми и многошаговыми
задачами принятия решений.
24.1.3. Классификация задач
исследования операций по структуре
информационного состояния «лица, принимающего
решения». Информационное состояние ЛПР
может соответствовать либо единственному
«физическому» состоянию объекта
исследований, либо множеству «физических»
состояний. В первом случае задачу исследования
операций называют детерминированной, во
втором — стохастической (или задачей
принятия решений в условиях риска), если известны
априорные вероятности пребывания объекта
исследований в каждом из состояний, и
неопределенной (или задачей принятия решений в
условиях неопределенности), если отсутствует
информация об априорных вероятностях.
Задачи принятия решений в условиях
неопределенности являются предметом исследования
теории игр.
Задачи исследования операций,
рассмотренные в примерах 24.1.1—24.1.3,
являются детерминированными.
Для пояснения понятия неопределенной
задачи исследования операций вернемся к
задаче о составлении пищевого пайка (см.
пример 24.1.1). В соответствии с условиями
задачи величины с^, а^ ,j = U3,Pk>vk>Qk
для всех к = 1,4 зависят от вектора
параметров П= (П{ П2 П3 П4 )Т . Таким образом,
нами рассматривалась параметрическая задача
исследования операций, представляющая
собой совокупность задач исследования
операций, каждая из которых однозначно
определяется конкретным значением вектора
параметров П. Задача о составлении пищевого
пайка становится неопределенной, и ее следу-
904
Глава 24.1. ОСНОВНЫЕ ПОНЯТИЯ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
ет отнести к задачам принятия решений в
условиях неопределенности, если паек должен
удовлетворять требованиям 1-6,
сформулированным в примере 24.1.1, но конкретный
набор продуктов не известен.
Принципиальное отличие
параметрической задачи исследования операций от задачи
принятия решений в условиях
неопределенности заключается в том, что решение первой
— совокупность решений всех задач
исследования операций, соответствующих
конкретным значениям вектора параметров, а
решение второй — такое допустимое решение,
которое в известной мере является
желательным, как бы конкретно не реализовывалась
неопределенность.
Для пояснения понятия стохастической
задачи исследования операций рассмотрим
задачу с садовником, к которой мы будем
неоднократно возвращаться в данной книге.
Пример 24.1.4. Каждый год в начале
сезона садовник проводит химический анализ
почвы на своем участке и оценивает
продуктивность сада на новый сезон как «хорошая»,
«удовлетворительная», «плохая», кодируя ее
цифрами соответственно 1, 2, 3. Ведя
наблюдения на протяжении многих лет, садовник
заметил, что продуктивность сада в текущем
году в основном определяется состоянием
почвы в предыдущем году. Он составил
матрицы вероятностей перехода почвы из / -го
состояния продуктивности в j -е как без
дополнительной обработки (матрица
/j = 1р..J), так и с дополнительной
обработкой (матрица Pi=[pA) участка,
включающей внесение минеральных удобрений и т.д.:
Д =
(0,2 0,5 0,3^
0 0,5 0,5
0 0 1
v
Ру =
(0,3 0,6 0,1
0,2 0,5 0,3
0,1 0,4 0,5
где номера строк и столбцов соответствуют
состояниям продуктивности почвы
соответственно в текущем и следующем годах. Так,
вероятность перехода продуктивности почвы
из хорошего состояния в плохое без
дополнительной обработки участка составляет
/?13=0,3, а с дополнительной обработкой
участка — /?13 = 0,1. Матрицы /J и Pi
являются матрицами переходных вероятностей.
С вероятностью перехода почвы из
состояния продуктивности / = 1,2,3 в текущем
году в состояние продуктивности j = 1,2,3 в
следующем году непосредственно связана
величина
потерям
И"
равная доходу y!Jl> 01 или
^ О) садовника в следующем
году в денежных единицах при наличии
(т = 2) или отсутствии (т = \)
дополнительной обработки участка. Поэтому каждой
матрице переходных вероятностей Рт =1р-"\
садовник поставил в соответствие матрицу
Rm = {r-J1 j, отражающую его доходы (эту
матрицу называют матрицей дохода). Пусть
л =
7 6 3]
0 5 1
0 0-1
; л2 =
(6 5
7 4
6 3
-1
о
где элементы матрицы Ri учитывают
расходы, связанные с дополнительной обработкой
участка.
Садовник планирует проработать на
своем участке еще TV лет и получить
максимальную прибыль. Нужно найти
оптимальный вариант его действий: в какие годы, если
это необходимо, проводить дополнительную
обработку участка?
Анализируя задачу с садовником, можно
заметить, что она является не только задачей
принятия решений в условиях риска, на что
указывают матрицы вероятностей перехода
почвы из одного состояния продуктивности в
другое, но и динамической задачей
исследования операций. При этом в отличие от
классической навигационной задачи (см. пример
24.1.3) информационное состояние ЛПР, т.е.
садовника, изменяется во времени
дискретным образом (раз в год после анализа
продуктивности почвы), а сама процедура принятия
решений является поэтапной.
24.1.4. Классификация задач
исследования операций по виду критерия
оптимальности. Классификация задач
исследования операций может быть связана с видом
используемого критерия оптимальности,
который в принципе может иметь любой, в том
числе и неформализуемый, вид.
Критерием оптимальности может быть
требование о максимизации или
минимизации некоторой скалярной функции / ,
определенной на множестве допустимых решений
и называемой целевой функцией. В этом случае
задачу исследования операций называют
задачей математического программирования. Если
же критерием оптимальности является
требование о максимизации или минимизации
ОБ ОДНОМ АСПЕКТЕ РЕШЕНИЯ ЗАДАЧ МНОГОКРИТЕРИАЛЬНОЙ ОПТИМИЗАЦИИ 905
нескольких скалярных функций, то говорят о
задаче многокритериальной (векторной)
оптимизации.
Таким образом, при построении
математических моделей для принятия решений о
составе пищевого пайка в примере 24.1.1 мы
имеем дело с задачей многокритериальной
оптимизации, а в примере 24.1.2 — с задачей
математического программирования.
В математическом программировании
чаще других рассматривают задачи, в которых
множество G допустимых решений является
подмножеством Шп, удовлетворяющим
системе линейных неравенств
^ayXj <bh / = l,/w.
У=1
Такое множество, если оно непустое и
ограниченное, называют выпуклым
многогранником.
Если множество допустимых решений
G с Шп представляет собой выпуклый
многогранник, а целевая функция / линейная,
то исходную задачу называют задачей
линейного программирования. Если множество
G aRn является выпуклым
многогранником, а целевая функция / является
квадратичной, то исходную задачу называют задачей
квадратичного программирования. Если
G с Rn — выпуклое множество, а / —
выпуклая функция, то исходную задачу
называют задачей выпуклого программирования.
Теория решения стохастических задач линейного
программирования является предметом
исследований стохастического программирования.
В других задачах математического
программирования множество G допустимых
решений может быть конечным множеством.
Такие задачи относятся к дискретному
программированию. В них допустимые решения
могут быть точками целочисленной решетки
Ъп (целочисленное программирование) или
векторами, каждая координата которых может
принимать лишь два значения (булево
программирование). В отдельных задачах
элементы множества G допустимых решений могут
представлять собой перестановки конечного
числа символов и т.д.
Множество G допустимых решений
может быть подмножеством некоторого
функционального пространства. В этом случае
получаем задачу вариационного исчисления, или
задачу оптимального управления (см. пример
24.1.3).
Особым случаем задач математического
программирования являются задачи о
нахождении максим una:
maxmin/(Г,Z), Pjle G,
и минимакса:
min max/ (Г, Z), e G.
В заключение приведенной далеко не
полной классификации задач исследования
операции отметим, что задачи
многокритериальной оптимизации, равно как и задачи с
критериями оптимальности, выражаемыми
отношениями порядка на множестве G
допустимых решений, по существу, относятся к
теории игр. Поэтому их классификация
проводится по теоретико-игровым признакам.
24.1.5. Об одном аспекте решения
задач многокритериальной оптимизации. В
общем случае постановки задач
многокритериальной оптимизации являются более
корректными, чем, скажем, постановки задач
математического программирования. Это связано с
тем, что любая операция представляет собой
совокупность целенаправленных действий, и
проведение практически любой операции, как
правило, предполагает достижение не одной,
а нескольких целей.
Пример 24.1.5. При проектировании
нового технического устройства обычно
преследуют несколько целей, среди которых могут
быть снижение массы конструкции и
повышение ее надежности, снижение стоимости
изготовления, повышение технологичности и
т.д. В процессе проектирования указанные
цели достигаются за счет соответствующего
выбора структуры и параметров конструкции,
которые кодируются вектором X. Таким
образом, эта задача оптимального проектирования
является типичной задачей
многокритериальной оптимизации.
В.общем случае математическая
формулировка задачи многокритериальной
оптимизации с множеством допустимых решений
G с Шп и векторной целевой функцией
f{x) = {n{x)...fm{x)?
может быть записана так:
fk (X) -> extr, k = \,m.
Любой скалярный критерий вида
/у (X) -> max
J v ' XeG
906
Глава 24.1. ОСНОВНЫЕ ПОНЯТИЯ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
можно заменить эквивалентным скалярным
критерием
-/)(*)-> nun.
Поэтому понятно, что задачу
многокритериальной оптимизации можно сформулировать
следующим образом:
fk (X) -> min, к = 1, /и,
XeG
или в векторной форме:
'<*>-> Й8-
(24.1.1)
(24.1.2)
Задачу исследования операций называют
некорректной, если она не имеет решения. На
начальном этапе развития исследования
операций некорректными считали задачи
многокритериальной оптимизации, а в качестве
обоснования приводились следующие
соображения.
Пусть для каждого к = \,т элемент
Хк множества G является решением задачи
математического программирования
/*(*)•
mm.
XeG
В этом случае, согласно представлению
(24.1.1), если
Хк sX0, * = 1,/и,
то Xq — решение задачи
многокритериальной оптимизации (24.1.2). Но, как правило,
Хк Ф X; при к Ф j . Поэтому в общем
случае следует ожидать, что задача
многокритериальной оптимизации (24.1.2) не имеет
решения.
Выход состоит в поиске некоторого
компромисса в достижении локальных целей.
ЛПР должно сформулировать некоторый
принцип компромисса и придерживаться его
при выборе оптимального решения. Принцип
компромисса должен определить свойства
оптимального решения и дать ответ на
главный вопрос: в каком смысле оптимальное
решение лучше всех других решений? Число
возможных принципов компромисса очень
велико. Поэтому при решении
многокритериальных задач возникает ряд проблем,
носящих не вычислительный, а концептуальный
характер.
На первый взгляд простейшим выходом
из сложившейся ситуаций является сведение
некорректной задачи многокритериальной
оптимизации (24.1.2) к соответствующей
задаче математического программирования путем
выделения из множества скалярных целевых
функций {fk (^г)}._. одной основной и
использования остальных для формирования
дополнительных ограничений, накладываемых
на множество G допустимых решений.
Трудоемкость и проблематичность
корректной реализации обсуждаемого подхода в
общем случае связана как с трудностями
выбора одной основной целевой функции
fi(X) из множества скалярных целевых
функций {fk (Аг)},_. , так и с обоснованным
назначением верхних границ (/кь—>./м,(Ь
•//+1,0» —»//яо) Л™ скалярных критериев,
переводимых в ограничения:
fj(X)ufJ0, у е {1,...,/-1./ + 1,...,«}.
Перейдем к рассмотрению иных
подходов к решению задач многокритериальной
оптимизации. Будем говорить, что допустимое
решение Х\ е G задачи многокритериальной
оптимизации (24.1.2) является строго более
предпочтительным, чем допустимое решение
Х2 e G , и писать Х\ >- Х2 , если
/ {Х\)< f (Х2) • Последнее неравенство
означает, что fk [Х{) < fk [Х2), к = \,т ,
причем среди этих т неравенств есть хотя бы
одно строгое. Допустимые решения
X\,X2eG задачи многокритериальной
оптимизации (24.1.2) будем называть
эквивалентными решениями и писать Х\ ~ Х2, если
/ (Х\) = / (Х2). Отметим, что:
а) в общем случае из Х\ ~ Х2 не
следует Х\ = Х2;
б) ((*, хХ2)л(Х2 >- Х3)) =*№^3);
в){(Х1-Х2)л(Х2~Х3))=>(Х1~Х3).
Пусть теперь
О = f{G) = [У е R'" : У = f(X),X е (?}-
(24.1.3)
множество возможных значений векторной
целевой функции / в задаче
многокритериальной оптимизации (24.1.2), порождаемое
множеством G допустимых решений. Для
ОБ ОДНОМ АСПЕКТЕ РЕШЕНИЯ ЗАДАЧ МНОГОКРИТЕРИАЛЬНОЙ ОПТИМИЗАЦИИ 907
удобства графических иллюстраций полагаем,
что т = 2, и произвольным образом выбираем
допустимое решение Xq е G , которому соответ-
т
ствует значение f(X0) = (f{ (X0)f2 (X0))
целевой функции f(X) = [f\ (X)f2 (X))
(рис. 24.1.1). Пусть £2 — заштрихованная на
рис. 24.1.1 часть множества Q и
G = /~ Ш I - соответствующее
подмножество множества G допустимых решений. Из
рис. 24.1.1. следует, что
f(xl)<f(X0), XleGl.
Таким образом, любое допустимое
решение из множества G czG является строго
более предпочтительным, чем допустимое
решение Xq e G , т.е.
Х[ >■ X0i Jf'eC'c G.
Продолжая эти рассуждения, приходим
к выводу, что из множества £2 ,
определяемого согласно (24.1.3), можно выделить
подмножество £2 , которое обладает очень
ценными свойствами:
1) для допустимых решений из
множества
G* = f~{ (п*} с: G (24.1.4)
в множестве G допустимых решений задачи
многокритериальной оптимизации (24.1.2)
уже нет строго более предпочтительных
допустимых решений;
2) допустимые решения из множества
G* либо эквивалентны, либо несопоставимы
в смысле строгой предпочтительности.
Множество £2* обычно называют
множеством Парето или множеством
компромисса. На рис. 24.1.2 множество £2* выделено
жирной линией и представляет собой дугу
АСВ, которая является частью границы Tq
множества £2 . При перемещении точки С от
точки А до точки В значения скалярного
критерия /| увеличиваются, а значения
скалярного критерия /2 уменьшаются. Таким
образом, уменьшение значений одного из
скалярных критериев может быть достигнуто лишь
ценой увеличения значений другого.
Аналогичная картина наблюдается и в общем
случае, так как любые допустимые решения
/№)
/№) у.
Рис. 24.1.1 Рис. 24.1.2
X\,X2eG* либо эквивалентны, и для них
/ (Х\) = / (Х2), либо несопоставимы, т.е.
для пар координат fk (Х\), fk (X2),
к = 1, /и, векторов / (Х{), / (Х2) имеют
место хотя бы два из следующих трех соотно-
шений: fi(Xl)>fi(X2), fj(Xl) = fj(X2),
Подмножество G* множества G
допустимых решений, определяемое согласно
(24.1.4), можно считать обобщенным решением
задачи многокритериальной оптимизации
(24.1.2). Это обобщенное решение в общем
случае может состоять более чем из одного
элемента, и тогда ЛПР сталкивается с
проблемой выбора одного допустимого решения
из некоторого множества эквивалентных и
несопоставимых решений.
Естественно, что решение задачи
многокритериальной оптимизации следует искать
среди элементов обобщенного решения.
Чтобы выбрать один из элементов обобщенного
решения, нужно использовать
дополнительную информацию. Остановимся на том,
каким образом можно задействовать
дополнительную информацию.
Ранжировка критериев.
Дополнительная информация, помогающая в
выборе решения, может состоять в том, что
скалярные целевые функции fk (X), k = 1,/и,
в задаче векторной оптимизации (24.1.1)
упорядочены в соответствии с их значимостью. В
этом случае номер целевой функции отражает
ранг (приоритет) соответствующего скалярного
критерия.
Пусть £2* - множество Парето для
задачи векторной оптимизации (24.1.1) и номер
скалярной целевой функции fk(X), где
А: = 1,/и, соответствует ее рангу. Процедуру
выбора единственного решения из
подмножества G* множества G допустимых решений,
определяемого согласно (24.1.4), начнем с
использования критерия первого ранга. По-
908
Глава 24.1. ОСНОВНЫЕ ПОНЯТИЯ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ
лагаем
*, = min/,(Jf), Gi=frl(gi)nG\
XeG
т.е. G[ содержит все допустимые решения из
G*, которые минимизируют в G* целевую
функцию первого ранга. Далее переходим к
целевой функции второго ранга и полагаем
q2 = min /2 (X), G\ = fix (q2)n G[,
XeG i
т.е. множество Gj содержит все допустимые
решения из G\ , которые минимизируют в
G\ целевую функцию второго ранга, и т.д.
Переходим к целевой функции (zw-l)-ro
ранга и полагаем
Ят-\ = min fm-{{X),
XeGm_2
Gm-\ = fm-\ (Ят-\ ) n Gm-2>
т.е. множество G*m_\ содержит все
допустимые решения из G*n_2 , которые
минимизируют в G^_2 критерий (m-l)-ro ранга. Так
как C^_i с G*n_2 с ... с G\ с G*, то для
завершения процедуры решения задачи
(24.1.1) многокритериальной оптимизации в
условиях ранжировки критериев осталось
решить задачу математического
программирования
/„,(*)-» min .
XeG*n_{
Из проведенных рассуждений следует,
что для реализуемости предложенной
процедуры решения задачи многокритериальной
оптимизации подмножеству G*n_\ множества
G допустимых решений должно
соответствовать подмножество множества Парето,
состоящее более чем из одного элемента. Так
как в общем случае это условие может не
выполняться (см. рис. 24.1.2), то на практике
для решения задачи многокритериальной
оптимизации чаще используют метод,
известный как метод компромиссов.
Предположим, что для скалярной
целевой функции f/c(X) назначена допустимая
уступка 5^ > 0 , которая определяет величину
допустимого отклонения значения критерия
к -го ранга от его минимального значения
Рк = min fk (X)
XeG*
на множестве G* (см. (24.1.4)). Очевидно, что
для каждого к = 1, т - 1 уступка 6^
определяет некоторое подмножество
G(8k) = {XeG*:fk(X)<f>h+bk}
в множестве G*. Если
/и-1
* = ПС(8*)*0.
то для нахождения оптимального (в смысле
рассматриваемой процедуры) решения нам
осталось лишь решить задачу математического
программирования:
fm(X)-+mm.
Xeg
При т > 2 множество g может
оказаться пустым. В этом случае уступки
выбраны неудачно и необходима их коррекция.
Завершая описание этого подхода к
решению задачи многокритериальной
оптимизации, отметим, что его практическая
реализация связана, по крайней мере» с двумя
принципиальными трудностями:
1) необходимостью ранжирования
скалярных критериев;
2) назначением уступок и их
коррекцией.
Обе операции формально не
определяются и выполняются экспертным путем.
Обращение к экспертам неизбежно при решении
задач многокритериальной оптимизации, так
как необходима дополнительная информация,
позволяющая ввести отношение предпочтения
на подмножестве G* множества G
допустимых решений, которое соответствует
множеству Парето £2* с £2 . К сожалению,
процедуры ранжирования скалярных критериев и
определения уступок по ним не всегда просты
для экспертов. Поэтому применение
рассмотренного подхода, как правило, ограничивают
лишь теми ситуациями, в которых эксперты
могут квалифицированно преодолеть обе
отмеченные трудности.
Принцип справедливой
абсолютной уступки. Согласно этому
принципу справедливым является такой
компромисс, при котором суммарный
абсолютный уровень повышения одного или
нескольких скалярных критериев не превосходит
ОБ ОДНОМ АСПЕКТЕ РЕШЕНИЯ ЗАДАЧ МНОГОКРИТЕРИАЛЬНОЙ ОПТИМИЗАЦИИ 909
суммарного абсолютного уровня снижения
других критериев.
Рассмотрим две точки А и В множества
Парето. В силу принципа справедливой
абсолютной уступки при переходе от А к В
изменение вектора f (X) характеризуется
величиной
т т т т
лабс=Хл*=Х(//-^)=Хлв-Х/Л
сА fB
k=\
k=i
k=\
где f/c ,fk ~ значения скалярных критериев
в точках А и В. Если Дабс < 0 , то решение,
соответствующее точке В, считается лучшим
по сравнению с решением, соответствующим
А. Поэтому наилучшим в смысле
рассматриваемого принципа будет такое решение, для
которого Аабс > 0 при переходе в любую
другую точку.
Приведенные рассуждения показывают,
что принцип справедливой абсолютной
уступки сводится к минимизации суммы
скалярных критериев на множестве G*:
£/*(*)-> miiv
k=\
XeG*
Недостаток этого принципа в том, что он
допускает дифференциацию по отдельным
критериям: низкое значение суммы
/l + fl + ••• + fm может достигаться, когда
одни критерии имеют сравнительно низкий
уровень, в то время как другие -
сравнительно высокий уровень. Потенциальная
возможность такой дифференциации характерна для
задач, в которых критерии выражены в
различных единицах измерения. В таких задачах
критерии необходимо нормализовать, т.е.
привести к единому, желательно
безразмерному, масштабу измерения.
Синтез глобального
критерия. Идея этого подхода очень проста: для
задачи многокритериальной оптимизации
(24.1.1) строят глобальный скалярный критерий
с целевой функцией
F(X) = <b[fx(X),...,fm(X)-\ = *[f(X)-\,
(24.1.5)
зависящей от исходных скалярных целевых
функций, таким образом, чтобы решение
задачи математического программирования
F{X)->mm
XeG
являлось решением исходной задачи (24.1.2) в
смысле рассматриваемого принципа
компромисса.
Ограничимся лишь кратким
обсуждением синтеза глобального скалярного критерия (от
греческого synthesis — соединение, сочетание,
составление) для задач многокритериальной
оптимизации. Поскольку система неравенств
fk{X0)<fk{X), k=ui, XeG,
эквивалентна системе неравенств
Ш*о)+^Ш*) + сь
k = l,m, XeG,
где lk > 0, к = 1, т и ск е М, к = 1, т , могут
быть выбраны произвольно, то допустимое
решение Xq является решением задачи
многокритериальной оптимизации (24.1.1)
тогда и только тогда, когда Xq является
решением задачи векторной оптимизации
kfk{x) + Ck ->™n, к = \,т.
Леи
Исходя из этого, рассмотрим те
требования, которым должна удовлетворять функция
Ф[/(Х)] в (24.1.5).
Во-первых, функция Ф[/[,.--,/т]
должна быть инвариантна относительно
преобразования сдвига, т.е. для любого набора
действительных чисел {^}л=1 и для любого
допустимого решения XeG должно выполняться
равенство
ф[А(х),...,/т(х)] =
= ф[/1(Х) + с[,...,/т(Х) + ст]. К •'
Во-вторых, функция Ф[/\(Х),...9/т(Х)]
должна быть инвариантна по отношению к
изменению масштаба любого скалярного
критерия /ь,к = \,т, т.е. для любого набора
действительных положительных чисел {lk\=\
и для любого допустимого решения XeG
должно выполняться равенство
ф[/, (*)....,/.(*)]« (2417)
= *[hA(x),...,imfm(x)]. ■■'
Сформулированные требования
означают, что, каков бы ни был набор
действительных чисел Ск,к = 1,/и , набор действительных
910
Глава 24.2. ОСНОВЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
положительных чисел 1к,к = 1,/и и
допустимое решение X е G , верно равенство
Ф[МХ),...,/т(х)] =
= ф[1у/[(Х) + с[,...,1т/[(Х) + ст].
(24.1.8)
Выполнение требований (24.1.6), (24.1.7)
или эквивалентного им требования (24.1.8),
накладываемых на функцию ф[/(Аг)1 при
синтезе глобального скалярного критерия,
определяемого согласно (24.1.5), может
обеспечиваться различными способами. В
частности, функция
т 0
F(X)=^lkfk(X), (24.1.9)
к=\
где
fk(X)-mmfk(X)
f. (Y) XeG*
JkK ] max fk(X)-mm fk(XY
XeG* XeG*
отвечает требованиям (24.1.6), (24.1.7). Кроме
того, эта функция учитывает и требование
нормализации критериев, так как вместо
абсолютных значений скалярных критериев
рассматриваются безразмерные величины их
относительных отклонений от минимальных
значений. Критерий (24.1.9) называют
нормированным скалярным критерием.
В специальной литературе
рассматривают другой вид нормированного скалярного
критерия, в котором учтена важность
отдельных составляющих:
т 0
F(X) = ^Xkfk(X), (24.1.10)
к=\
где Хк, к = 1,/и - некоторые параметры, для
которых
п
^ Хк = 1, 0<Хк<\, к = 1,т.
к=\
(24.1.11)
Эти параметры называют весовыми
коэффициентами. Весовые коэффициенты можно
определять различными способами, но любой
подход в конечном счете сводится к
использованию экспертных оценок. Отметим, что для
эксперта задача определения весовых
коэффициентов ничуть не проще задачи
ранжирования скалярных критериев, так как в данном
случае приоритет каждого скалярного
критерия он должен выразить количественно.
Глава 24.2
ОСНОВЫ ЛИНЕЙНОГО
ПРОГРАММИРОВАНИЯ
24.2.1. Постановка общей задачи
линейного программирования и ее анализ. В
соответствии с классификацией задач
исследования операций (см. п. 24.1.1), если множество
допустимых решений G с Е" — выпуклый
многогранник, а критерий оптимальности —
скалярная линейная целевая функция,
определенная на G , то мы имеем дело с задачей
линейного программирования. Теория этих задач
составляет предмет исследований линейного
программирования, а их примером может
служить задача о составлении пищевого пайка
(см. пример 24.1.2).
Говоря о задаче линейного
программирования, мы фактически имеем в виду не
саму задачу исследования операций, а ее
математическую модель, обладающую
указанными специфическими свойствами. Отметим,
что для решения одной и той же задачи
исследования операций могут быть
использованы разные математические модели.
По виду информационного состояния ЛПР
задачи линейного программирования
являются статическими задачами исследования
операций, а соответствующие процедуры принятия
решений одношаговыми. По структуре
информационного состояния ЛПР задачи линейного
программирования являются
детерминированными параметрическими задачами
исследования операций.
Задача линейного программирования
имеет следующий вид:
f n
скхк ~* maxi
|А:=1
п
l£aikxk <bh iel{;
\к=\
H>,rt=6,,/6/2; (24-2.1)
\к=\
п
l£aikxk >bh is I3;
\k=i
[xk > 0, к = 1,/2,
где aik, ck, b/ - известные числовые
параметры, а множества I^Ij^h попарно не
пересекаются и /j и/2 u/з ={1,...,/я}.
Неизвестные хк,к = 1,я - в задаче (24.2.1), пред-
ПОСТАНОВКА ОБЩЕЙ ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
911
ставляющие собой координаты вектора
т
X = (Х[Х2...хп) , называют управляемыми
переменными, или переменными модели.
Задачи линейного программирования во
многих случаях оказываются задачами
распределительного типа, суть которых заключается
в следующем. Пусть рассматриваемая система
характеризуется наличием п видов
производственной деятельности, для осуществления
которых имеются различные ресурсы с
номерами / = 1,/и. Возможный объем
потребления / -го ресурса ограничен неотрицательной
величиной Ь\, а его расход для производства
единицы продукта к -го вида
производственной деятельности равен aik, где к = 1, п . В
свою очередь, единица продукта к -го вида
производственной деятельности
характеризуется величиной ск , называемой удельной
прибылью. Необходимо определить объемы хк ,
к = 1, п , производственной деятельности
каждого вида, обеспечивающие максимальный
суммарный доход от производственной
деятельности системы в целом без нарушения
ограничений, накладываемых на
использование ресурсов. В общем случае задача
распределительного типа имеет вид
Г п
\£ckxk ->max;
\^aikXk<bhi = T^; <24-2-2>
\к=\
[Хк > О, к = 1,П.
Чтобы задача исследования операций
могла быть представлена как задача
линейного программирования, необходимо
выполнение трех условий: 1) пропорциональности;
2) аддитивности; 3) неотрицательности.
В терминах задач распределительного
типа пропорциональность означает, что
затраты ресурсов на любой вид производственной
деятельности, а также вклад этого вида
производственной деятельности в суммарный
доход прямо пропорциональны его уровню
(объему) производства. Аддитивность
указывает на то, что общий объем ресурсов,
потребляемый всеми видами производственной
деятельности, равен сумме затрат ресурсов на
отдельные виды производственной
деятельности, а общий доход от производственной
деятельности равен сумме доходов от каждого
вида производственной деятельности.
Неотрицательность означает, что ни
одному из видов производственной
деятельности не может быть приписан отрицательный
объем производства. Возможны ситуации,
когда некоторое управляемое переменное хк
может принимать и отрицательные значения.
В этом случае говорят о неограниченном в
знаке переменном модели, и используют
представление этого переменного в виде разности двух
неотрицательных управляемых переменных:
xk=xfk-xl x'k>0, 4>0.
Продолжим рассмотрение частной
задачи исследования операций и воспользуемся
геометрическим методом ее решения.
Основой этого метода является геометрическое
(графическое) представление множества
допустимых решений и целевой функции,
которое, например, удобно в задаче с двумя
управляемыми переменными.
Пример 24.2.1. Рассмотрим простейшую
задачу распределительного типа:
Зх{ + 2х2 -» max;
Х[ + 2*2 ^ 6, 2Х\ + Х2 <8, Х2 - 2,
х{ > О, х2> 0.
(24.2.3)
Математическая модель (24.2.3)
позволяет решить исходную задачу графически.
Первый этап графического решения
заключается в геометрическом представлении
множества G допустимых решений. Искомое
множество допустимых решений, согласно
(24.2.3) изображено на рис. 24.2.1. Стрелками
указано, с какой стороны той или иной
прямой выполняется соответствующее
ограничение из (24.2.3).
Второй этап графического решения
заключается в определении направления
возрастания целевой функции / (х\, х2) =
= Зх{ + 2х2 •
При произвольном фиксированном
значении /q е R уравнение / (xj, х2) = fo ,
которое может быть представлено в виде
х2 = -1,5Х| +0,5./о , определяет на
плоскости XjOx2 прямую, являющуюся линией
уровня целевой функции. Для определения
направления возрастания целевой функции
(на рис. 24.2.1 оно обозначено знаком => )
достаточно графически изобразить линии
уровня f{x{,x2) = f0[ и f(xi9x2) = fo2 при
/oi < /02 (на Рис- 24-21 /oi = 0 и /02 = 6 ).
Чтобы найти оптимальное решение, следует
912
Глава 24.2. ОСНОВЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
перемещать линию уровня в направлении
возрастания целевой функции до тех пор,
пока она целиком не переместится в область
недопустимых решений R \ G .
Из рис. 24.2.1 следует, что максимальное
значение целевой функции достигается в
вершине С многоугольника, являющегося
границей Yq множества G допустимых
решений. А так как С - точка пересечения двух
прямых, задаваемых уравнениями
*1 + 2х2 =6 и 2xj + х2 = 8 , то ее
координаты х\ и х2 удовлетворяют системе этих
линейных алгебраических уравнений.
Следовательно, оптимальное решение
т
X* = (10/3 4/3) . В этом случае доход будет
максимальным и равным (в условных
денежных единицах) /* = 3 • 10/3 + 2 • 4/3 = 38/3.
В рассматриваемом случае удельная
прибыль от производственной деятельности
каждого вида q = 3 и с2 = 2 определяется
доходами от реализации, которые по
неконтролируемым причинам могут колебаться в
различных пределах. А так как суммарный
доход от производственной деятельности
f{x[,x2) = clx[ + с2х2,
то ЛПР необходимо знать диапазоны
допустимых изменений удельных прибылей, не
приводящих к новым оптимальным
решениям. Из рис. 24.2.1 следует, что для любых
положительных значений С\ и с2,
удовлетворяющих условию 0,5 < — < 2 , оптимальным
Рис. 24.2.1
является решение X* = (10/3 4/3) . Во всех
остальных случаях оптимальное решение
будет отличаться от найденного.
ЛПР полезно знать и о том, как
повлияют на оптимальное решение изменение
спроса на выпускаемую продукцию и
увеличение или уменьшение запасов исходных
продуктов. Исследования, позволяющие
получить эту информацию в совокупности с
изучением зависимости оптимального
решения от параметров целевой функция,
представляют собой анализ на чувствительность
математической модели (24.2.3)
рассматриваемой задачи исследования операций.
Для удобства дальнейших рассуждений
обратимся к задаче линейного
программирования (24.2.2) распределительного типа,
предполагая, что непустое множество G
допустимых решений ограничено.
т
Пусть X* = (Х\...Х*А —оптимальное
решение рассматриваемой задачи линейного
программирования распределительного типа.
Ограничение
п
^aikxk <bh /e{l,2,...,/w},
(24.2.4)
в задаче (24.2.2) называют активньш, если
п
^aikx*k =bh
k=\
и пассивным в противном случае. Если
некоторое ограничение является активным, то
соответствующий ресурс называют
дефицитным ресурсом, так как при реализации
оптимального решения он используется
полностью. Ресурс, соответствующий неактивному
ограничению, следует отнести к
недефицитным ресурсам (недефицитные ресурсы
имеются в некотором избытке). Графическое
решение задачи линейного программирования,
рассмотренной в примере 24.2.1, показывает,
что оптимальному решению всегда можно
поставить в соответствие хотя бы одну
вершину многоугольника, изображающего
множество G допустимых решений. Такую
вершину будем называть оптимальной вершиной.
Через оптимальную вершину G (см. рис.
24.2.1) проходят две прямые Х\ + 2х2 = 6 и
2х\ + х2 = 8 , соответствующие активным
ограничениям.
При анализе модели на чувствительность
по правым частям ограничений (24.2.4) опре-
ФОРМЫ ЗАПИСИ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
913
деляются: а) предельно допустимое
увеличение запаса дефицитного ресурса,
позволяющее получить новое оптимальное решение,
которое в смысле значения целевой функции
является более предпочтительным, чем
старое; б) предельно допустимое снижение
запаса недефицитного ресурса, не изменяющее
найденного ранее оптимального решения.
24.2.2. Формы записи задач
линейного программирования. В дальнейших
рассуждениях будем говорить, что задача
линейного программирования представлена в
стандартной форме, если она имеет следующий
вид:
-» max;
к=\
/Ы
ук>0, k = l,N,
где система линейных алгебраических
уравнений
N
£а'*Л=Р<"' / = 1,£, (24.2.6)
к=\
определяющая множество Q допустимых
решений, является базисной, т.е. число
уравнений этой системы равно рангу ее матрицы.
Таким образом, в (24.2.5) имеем L < N . А
так как при L = N система (24.2.6) имеет
единственное решение, и множество Q не
может содержать больше одного элемента, то
в общем случае можно считать, что
L < N. (24.2.7)
Сравнивая задачи (24.2.1) и (24.2.5),
видим, что любая задача линейного
программирования может быть представлена в
стандартной форме, если все ограничения типа
неравенства, за исключением ограничений на
знаки переменных модели, записать в виде
равенств. Ограничение типа неравенства можно
записать как ограничение типа равенства
путем введения нового неотрицательного
переменного.
Для обоснования высказанного
утверждения обратимся к математической модели
(24.2.1) и проведем ее анализ, начав с
системы ограничений, определяющих множество
допустимых решений G .
Пусть для определенности множества
/|,/2,/з в (24.2.1) имеют вид /| =
= {1,2,...,/и,}, /3 ={пц +1,ю, +2,...,/и2},
12 = {щ + 1, Щ + 2,..., т\. Полагаем
У к ~ хк-> к = Ья- Если /е /j , то вводим
новое управляемое переменное:
п
Уп+i =Ь1-^,а1кУк ^0.
к=\
Если же / € /3 , то
JW =^\,а1кУк -Ь>0.
к=\
Таким образом, N = п + т2 в (24.2.5). Если
/ € 1[ , то р; = bj и
1, к = п + i;
0, к > я, к * п + /';
если / € /2, то р/ = bj и
'* [0, k = n + \,N\
если / € /з > то Р/ = ~Ь\ и
-aik, k = \,n\
aik = U, к = п + /;
10, к > п, к * n + i.
Если среди ограничений в (24.2.1) нет
линейно зависимых, то L = т . Если в (24.2.1)
целевая функция минимизируется, то
\-ск, к = \Гп;
1к [0, k = n + l,N;
если в (24.2.1) целевая функция
максимизируется, то
У к =
ск, к = \,п\
0, k = n + \,N.
Понятно, что задача (24.2.5) — это
частный случай задачи линейного
программирования вида (24.2.1), в котором нет
ограничений типа неравенства. Но иногда удобно
сделать наоборот: ограничения типа равенства
преобразовать в неравенства. Рассмотрим
приемы такого преобразования на примере
задачи (24.2.5) линейного программирования
в стандартной форме.
В задаче (24.2.5) система линейных
алгебраических уравнений (24.2.6) является ба-
914
Глава 24.2. ОСНОВЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
зисной, в этой системе N - L неизвестных
являются свободными, a L — базисными.
Обозначим свободные неизвестные
(свободные переменные) через дС|,...,дся, где
п = N - L , а базисные — через хп+\,...,Х]у .
Запишем систему (24.2.6) в следующем виде:
ai,n+[xn+i + — + aiNxN =
= Р/-а/|*1 -...-а/Л, i = l,L.
Вводя матричные обозначения:
(
Ц =
а\,п+\
aL,n+\ '''
Xi =
aw
aLN
\ *2 =
А
[х" )
fx,\
«1,1
I р=
г р.
Pi
\
приходим к следующему представлению
системы линейных алгебраических уравнений:
DlX] = $-D2X2.
Так как матрица D\ является
квадратной порядка L и невырождена (она
соответствует базисному минору матрицы системы),
то имеет обратную матрицу D\ . Поэтому
Хх = -D[lD2X2 + D[l%
что можно записать следующим образом:
п
к=\
(24.2.8)
где gifc - элементы матрицы -D\ D2 , a
<7, — элементы матрицы-столбца D\ p .
Возвращаясь к задаче (24.2.5), заметим,
что ограничения типа равенства в системе
(24.2.6) можно заменить эквивалентными
ограничениями типа неравенства. Так как
xn+i > О, / = 1, L , то из (24.2.8) следует, что
п
к=\
Итак, для перехода от задачи (24.2.5) к задаче
(24.2.1) нужно разделить переменные на
базисные и свободные, выразить базисные
переменные через свободные, а затем
исключить базисные переменные как из целевой
функции, так и из ограничений, заменив
последние неравенствами, означающими, что
исключаемые переменные неотрицательны. В
целевой функции при этом может появиться
постоянное слагаемое, которое можно
отбросить как не оказывающее влияния на
положение точки экстремума.
Напомним, что выбор базисных и
свободных переменных в общем случае не
является однозначным. Поэтому не является
однозначным и переход от (24.2.5) к (24.2.1).
Если задача линейного
программирования представлена в стандартной форме
(24.2.5) и при этом
N-L = 2,
(24.2.9)
то для ее решения можно использовать
геометрический метод.
Действительно, в этом случае система
линейных алгебраических уравнений (24.2.6)
имеет два свободных неизвестных, например,
Х| и х2 , а все остальные неизвестные -
базисные и выражаются через свободные
неизвестные:
*2+/ = ^~ai\x\ -аахъ i = \,L.
Исключая из задачи базисные переменные,
мы приходим к задаче линейного
программирования с двумя переменными и системой
ограничений в виде неравенств:
C|Xj +с2х2 -> min;
\апх{ +ai2x2 <bh i
х, >0, х2 >0.
U,
Частным случаем этой задачи является задача
(24.2.3). Все дальнейшие рассуждения,
относящиеся к возможностям геометрического
метода и техники его применения, ничем Ане
отличаются от рассуждений, проведенных при
рассмотрении примера 24.2.1.
Завершая рассмотрение геометрического
метода, решения задач линейного
программирования, сделаем следующие замечания.
Т
Замечания. 1. Если Y =(У\—У/ч) .
r = (Y|.»Yyv), A=(aik)eMLN(R),
В = (Pi-.-P/J , O/v _ нуль-вектор в М , то
задача линейного программирования,
представленная в стандартной форме (24.2.5),
принимает вид
ITT -> max;
\АУ = в, Y>eN.
(24.2.10)
Здесь неравенство Y > 0/у понимается как
совокупность неравенств ук > 0, к = 1, N .
ЗАДАЧА О КАЛЕНДАРНОМ ПЛАНИРОВАНИИ КОМПЛЕКСА РАБОТ
915
Рис. 24.2.2
2. Задача линейного программирования
может не иметь решения даже тогда, когда
множество G допустимых решений не пусто.
Эту ситуацию иллюстрирует рис. 24.2.2.
3. При N - L = 2 оптимальное
решение У задачи (24.2.5) линейного
программирования в стандартной форме всегда имеет
не менее двух нулевых координат. Это
связано с тем, что оптимальная вершина границы
Г(; множества G допустимых решений
является точкой пересечения как минимум двух
прямых, уравнения которых определяются
ограничениями исходной задачи.
Глава 24.3
ЗАДАЧИ, ПРИВОДЯЩИЕ К ЗАДАЧАМ
ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Для расширения представлений о
возможных сферах практического применения
линейного программирования изложение его
основ завершим анализом нескольких
практически важных задач, обратив особое
внимание на специфические особенности
построения их математических моделей.
24.3.1. Транспортная задача.
Рассмотрим задачу, возникающую перед
транспортным отделом фирмы, имеющей п
предприятий П/, / = 1,/2, производящих однородную
продукцию, и т складов Су, j = 1,/w, для ее
хранения. Производственные мощности
предприятий (Sj - мощность предприятия П, ,
т.е. месячный объем производимой им
продукции) и возможности приема продукции
складами ( Dj — объем продукции, который
может принять склад Су в течение месяца)
известны на каждый месяц. Кроме того,
известны транспортные расходы Сц по доставке
единицы объема продукции с любого
предприятия П/, / = l,/i, на любой склад
Су, j = 1,/w. Требуется распределить
продукцию, производимую предприятиями П,,
по складам С, так, чтобы минимизировать
общие транспортные расходы.
Пусть Ху — объем продукции,
поставляемой на склад Су с предприятия П,. В
этом случае Ху > О при / = 1,п и j = 1,/w . A
так как СуХу - затраты на транспортировку
объема продукции Ху с предприятия П, на
склад Су (в предположении, что
транспортные расходы пропорциональны объему
перевозимого груза), то общие транспортные
расходы фирмы равны значению целевой функции
п т
/ (х,,,..., хпт ) = 2^21 CiJxii>
i=\ j=\
которое необходимо минимизировать путем
выбора неотрицательных значений {*//}>
удовлетворяющих следующим ограничениям:
/и
так как произведенная продукция должна
быть вывезена с каждого предприятия;
/;
]Гх,у < Dj, j = l,m,
i=\
так как объем продукции, который может
принять каждый склад Су , ограничен его
емкостью D,.
24.3.2. Задача о календарном
планировании комплекса работ. Эта задача может
быть сформулирована следующим образом.
Пусть некоторая фирма должна реализовать
проект строительства, состоящий из
конечного набора различных операций (работ).
Специалисты-строители оценили
продолжительность выполнения каждой операции и
для каждой операции, содержащейся в
проекте, установили все другие операции, которые
должны быть выполнены к началу ее
реализации. Руководство фирмы заинтересовано в
минимально возможных сроках реализации
проекта.
916 Глава 24.3. ЗАДАЧИ, ПРИВОДЯЩИЕ К ЗАДАЧАМ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Х{ >tA, X2>tB, X2>tD+Xi9
х3 >tc+xi9 х3 >tE+x2.
Благодаря специфике ограничений
fA > °>*В > °> *С > 0, //> > 0, /^ > 0 нет
необходимости в явном виде задавать условия
неотрицательности хк > О, к = 1,3 .
24.3.3. Задача о минимизации
дисбаланса на автоматической линии.
Фармацевтическая фабрика освоила производство
нового бальзама, запустив автоматическую
линию, на которой специальным образом
обрабатывается смесь равных частей экстрактов
календулы, мяты и зверобоя. Эти экстракты
поставляют две фирмы, использующие
различные технологии и оборудование;
Производительность этих фирм по выпуску каждого
из экстрактов и максимальный суммарный
ресурс времени, которым располагает в
течение недели каждая из них для производства
этих экстрактов, приведены в табл. 24.3.2.
24.3.2. Данные о производительности фирм
Для удобства дальнейших рассуждений
предположим, что весь проект состоит из
пяти операций A,B,C,D,E , и все данные о
нем представлены в табл. 24.3.1, где введена
информация о фиктивной операции F ,
начинающейся в момент завершения
реализации проекта.
24.3.1. Операции при календарном
планировании
Операция
А
В
С
D
Е
F
П родол жите л ьн ость
операции
*л
h
tc
to
tE
tF
Предшествующие
операции
-
-
A
A
В, D
C,E
Фирма
1
2
Максимальный фонд
времени, ч
100
80
Производительность фирмы
по выпуску экстракта, л/ч
календулы
8
6
мяты
5
12
зверобоя
10
4
Фабрика заинтересована в максимально
возможном увеличении выпуска своей
продукции, что фактически эквивалентно
минимизации дисбаланса автоматической линии
вследствие нехватки одного или двух видов
экстрактов. Необходимо определить
еженедельные затраты времени (в часах) на
производство каждого из трех видов экстрактов на
каждой фирме, обеспечивающие максимально
возможный объем производства бальзама и
удовлетворяющие ограничениям по
использованию временных ресурсов этих фирм.
Пусть Xjj - недельный фонд времени (в
часах), выделенный на фирме / = 1,2 для
производства экстракта j = 1,2,3 , где
значение j = 1 соответствует экстракту календулы,
j = 2 — экстракту мяты и j' = 3 — экстракту
зверобоя. Тогда согласно данным,
представленным в табл. 24.3.2, объемы производства
для каждого из экстрактов будут равны:
экстракт календулы (У = 1): 8хц + 6x21;
экстракт мяты (j = 2): 5xJ2 + 12*22 ;
Из табл. 24.3.1 следует, что операцию С
нельзя начать до завершения выполнения
операции Д а к операции Е можно
приступать лишь после реализации операций В и D.
Весь комплекс работ будет выполнен, как
только будет завершено выполнение операций
СнЕ
В рассматриваемой задаче управляемыми
переменными являются моменты начала
выполнения различных операций, за
исключением операций А и В. Это связано с тем, что
операции А и В не имеют предшествующих,
поэтому можно считать их началом нулевой
момент времени. Заметим также, что условия
задачи не ограничивают количества
одновременно начинаемых работ, что позволяет
предполагать совпадение моментов начала
выполнения операций Си Д так как им
непосредственно предшествует одна и та же
операция А. Таким образом, математическая
модель рассматриваемой задачи в качестве
управляемых переменных содержит лишь
следующие: Х\ — момент начала операций С
и D; х2 — момент начала операции Е\ х3 —
момент начала операции F.
А так как х3 — момент завершения
всего комплекса работ, то необходимо
минимизировать X} ПРИ условии выполнения
следующих ограничений (см. табл. 24.3.1):
МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ 917
экстракт зверобоя (у = 3): 10х13 + 4х23 •
Смесь, поступающая на автоматическую
линию, должна состоять из равных частей
трех экстрактов. Поэтому объем производства
бальзама лимитируется тем экстрактом, объем
производства которого минимален, и
определяется следующим образом:
min{8x]i + 6х21;5х12 + 12х22;10х13 + 4х23}.
С учетом ограничений на максимальный сум-
которая формально не имеет отношения к
задачам линейного программирования из-за
характера целевой функции.
Для преобразования рассматриваемой
задачи к задаче линейного программирования
достаточно целевую функцию заменить
другой, введя дополнительное переменное х и
дополнительные ограничения:
Глава 24.4
ЦЕЛОЧИСЛЕННОЕ
ПРОГРАММИРОВАНИЕ
Общая постановка задачи целочисленного
программирования отличается от общей
постановки задачи линейного программирования
лишь наличием дополнительного
ограничения. Этим ограничением является требование
целочисленное/пи, в соответствии с которым
значения всех или части переменных модели в
оптимальном решении являются целыми
неотрицательными числами, т.е. принадлежат
множеству N и {0}. При этом если
требование целочисленности распространяется на все
переменные, то задачу целочисленного
программирования называют полностью
целочисленной задачей. Если же требование
целочисленности относится лишь к части
переменных, то задачу называют частично
целочисленной. Задачу линейного программирования,
отличающуюся от рассматриваемой задачи
целочисленного программирования лишь
отсутствием требования целочисленности,
называют задачей с ослабленными ограниче-
марный ресурс времени для каждой из фирм,
производящих экстракты,
х{i + хп + х[3 < 100, х2{ + х22 + *23 - 80
и естественных ограничений, связанных с
условием неотрицательности управляемых
переменных,
^>0, / = 1,2, j = 1,2,3,
приходим к математической модели
х -» max;
8хц +6х12 -х > 0, 5х2| +12х22 -х >0,
10jc13 +4x23 -х>0, х>0.
В результате получим следующую задачу
линейного программирования:
ниями, соответствующей задаче
целочисленного программирования.
24.4.1. Методы решения задач
целочисленного программирования. Наиболее
естественным методам решения задач
целочисленного программирования является метод
округления, реализация которого состоит из двух
этапов. На первом этапе находят оптимальное
решение задачи линейного программирования
с ослабленными ограничениями,
соответствующей рассматриваемой задаче целочисленного
программирования. На втором этапе значения
переменных в оптимальном решении X*, не
являющиеся целыми, округляют так, чтобы
получить допустимое решение X** с
целочисленными значениями.
Использование метода округления
представляется рациональным, особенно если
погрешность округления невелика по
сравнению со значениями округляемых переменных.
Однако практическая реализация этого метода
может привести к допустимому решению,
значимо отличающемуся от оптимального
решения исходной задачи целочисленного
программирования.
Несостоятельность метода округления
как общего метода решения задач
целочисленного программирования обусловлена не
min{8xn +6x2l;5x12 +12х22;10х13 -ь4х23}-> max;
\ х11 + *12 + ^^ 100, х2[ + х22 + *23 ^ 80,
\х0>0, / = 1,2, j = 1,3,
х -> max;
1*11 + *12 + *13 - Ю0> *21 + *22 + *23 - 80, 8хи + 6х21 ~ X > 0,
j 5х12 + 12х22 - х > 0,_НЬс13 + 4х23 - х > 0,
[Xjj > 0, / = 1Д j = 1Д х > 0.
918
Глава 24.4. ЦЕЛОЧИСЛЕННОЕ ПРОГРАММИРОВАНИЕ
только возможностью получения
неоптимального решения. Дело заключается в том, что
многие задачи математического
программирования, не имеющие, на первый взгляд,
никакого отношения к полностью или частично
целочисленным задачам, могут быть
сформулированы как задачи целочисленного
программирования, в которых переменные
модели принимают значения из множества {0, 1}.
В этой ситуации процедура округления
является логически неприемлемой.
Для иллюстрации основной идеи
методов решения задач целочисленного
программирования, известных как методы отсечений,
рассмотрим полностью целочисленную
задачу, множество допустимых решений которой
изображено на рис. 24.4.1. Допустимым
решениям этой задачи соответствуют не все точки
множества G допустимых решений, а лишь
те, координаты которых удовлетворяют
требованию целочисленности. Теоретически из
множества G всегда можно выделить такое
подмножество G*, что (см. рис. 24.4.1):
а) оно содержит все точки множества G ,
координаты которых удовлетворяют
требованию целочисленности; б) оно является
выпуклым множеством; в) координаты всех его
крайних точек удовлетворяют требованию
целочисленности.
Если в рассматриваемой полностью
целочисленной задаче множество G
допустимых решений заменить множеством G*, то
это не может привести к изменению ее
оптимального решения, так как G* получено из
G путем отсечения от него подмножества,
заведомо не содержащего допустимых
решений, удовлетворяющих требованию
целочисленности. Но в этом случае оптимальное
решение задачи линейного программирования с
ослабленными ограничениями и множеством
G* допустимых решений соответствует
крайней точке множества О*. Как следствие, оно
удовлетворяет требованию целочисленности и
обеспечивает экстремальное значение целевой
функции не только на G* , но и на G , т.е.
является оптимальным решением исходной
полностью целочисленной задачи. Основные
различия в методах отсечений связаны с
процедурами выделения подмножества G*
множества допустимых решений задачи
целочисленного программирования.
В основе комбинаторных методов
решения задач целочисленного программирования
лежит идея перебора всех элементов G
множества допустимых решений,
удовлетворяющих требованию целочисленности, с целью
нахождения оптимального решения. При этом
за счет использования различных
специальных процедур, как правило, непосредственно
рассматривают лишь часть элементов G ,
удовлетворяющих требованию
целочисленности, а оставшиеся элементы учитывают
некоторым косвенным образом.
Наиболее известным комбинаторным
методом является метод ветвей и границ,
использующий процедуру решения задачи
линейного программирования с ослабленными
ограничениями, соответствующей исходной
задаче целочисленного программирования.
Если оптимальное решение X* задачи
линейного программирования с ослабленными
ограничениями не удовлетворяет требованию
целочисленности (на рис. 24.4.2 этому
решению соответствует точка В), то из множества
G допустимых решений выделяют два
непересекающихся выпуклых подмножества К\ и
А^2 > содержащих все допустимые решения из
G, удовлетворяющих требованию
целочисленности и не содержащих X* (см. рис.
24.4.2). Это позволяет заменить
рассматриваемую задачу целочисленного
программирования совокупностью двух эквивалентных ей
(в смысле оптимального решения Х° € G)
задач с множествами допустимых решений
соответственно К у и К 2 , так как X е К\
или X е Ki. Различные аспекты
практической реализации метода ветвей и границ для
решения задач целочисленного
программирования рассмотрены в п. 24.4.2.
\а
^0
Г °
г °
[ 1
|^
0
К
2
s F
0
3
чВ
\е
°\
4
t
<
с(
5
х
Рис. 24.4.1
Рис. 24.4.2
МЕТОД ВЕТВЕЙ И ГРАНИЦ
919
Комбинаторные методы широко
используют для решения задач булева
программирования, т.е. для решения полностью
целочисленных задач, переменные которых принимают
значения из множества {0, 1}. Эти
переменные называют булевыми переменными.
Свойства булевых переменных позволяют
существенно упростить процедуры поиска
оптимального решения.
К настоящему времени разработано
значительное количество частных методов
решения конкретных типов задач целочисленного
программирования. Тем не менее почти все
эти методы и их модификации можно описать
на основе единой принципиальной схемы,
состоящей из трех элементов.
Элемент 1. Предусматривается
процедура формирования и решения
последовательности взаимосвязанных задач, которые
называют задачами, порожденными исходной
задачей, или задачами-истоками. При этом
оптимальное решение, по крайней мере,
одной из задач-истоков должно совпадать с
оптимальным решением породившей их задачи.
Элемент 2. Каждой задаче,
порожденной исходной задачей, ставится в
соответствие так называемая ослабленная задача
(задача с ослабленными ограничениями),
оптимальное решение которой может быть
найдено с гораздо меньшими затратами, чем
оптимальное решение соответствующей ей задачи-
истока. Специфика ослабленной обычно
заключается в том, что ее система ограничений
является менее жесткой по сравнению с
системой ограничений задачи-истока и
определяет множество допустимых решений,
содержащее все допустимые решения задачи-истока.
Как правило, в целочисленном
программировании ослабленная задача представляет собой
задачу линейного программирования с
ограничениями, более слабыми, чем в
соответствующей целочисленной задаче-и стоке.
Очевидно, что если ослабленная задача не имеет
допустимых решений, то их не имеет и
задача-исток. В некоторых модификациях методов
целочисленного программирования целевая
функция ослабленной задачи также может
отличаться от целевой функции задачи-
истока. В этом случае оптимальное значение
целевой функции ослабленной задачи (т.е.
значение, соответствующее оптимальному
решению) должно быть не меньше оптимального
значения целевой функции задачи-истока,
если речь идет о задаче максимизации. Кроме
того, оптимальное значение целевой функции
ослабленной задачи определяет (для задачи
максимизации) верхнюю границу для
оптимального значения целевой функции задачи-
истока.
Элемент 3. В результате анализа
решения ослабленной задачи в зависимости от
специфики метода, как правило, принимается
решение, относящееся к задаче-истоку: а)
исключить ее из рассмотрения; б) заменить
одной порожденной задачей, выбранной по
специальному правилу из определенной
совокупности; в) заменить системой порожденных
задач.
Существуют и другие подходы к
решению задач целочисленного
программирования, которые в общем случае не гарантируют
нахождения оптимального решения, но
приводят к допустимому решению, близкому (в
смысле значения целевой функции) к
оптимальному, а иногда и совпадающему с ним. В
основе одного из таких подходов лежит идея
использования случайной выборки
допустимых решений с последующим улучшением (в
смысле значения целевой функции) каждого
из них, когда, возможность улучшения
допустимого решения достаточно просто
обнаружить.
24.4.2. Метод ветвей и границ. Метод
ветвей и границ, основная идея которого
рассмотрена в п. 24.4.1, является одним из
наиболее широко применяемых комбинаторных
методов. Его можно использовать для
решения как полностью, так и частично
целочисленных задач. Для уяснения специфических
особенностей метода ветвей и границ
обратимся к полностью целочисленной задаче:
Г п
У£,скУк ->тах;
\к=\
п
\^а1кУк = bh / = l,/w, (24.4.1)
\k=i
[ук>0, *=Пя, ft€Nu{0}, *=Ця.
При этом будем считать, что при любых
к = \,п и / = 1,/и параметры с^а-^ и Ьх
являются целыми числами.
Согласно общей идее метода, сначала
решают задачу линейного программирования с
ослабленными ограничениями, соответствующую
исходной задаче целочисленного
программирования, и находят ее оптимальное решение Y .
Затем выбирают базисное переменное У\,
значение которого р,- в оптимальном решении
Y* не является целым числом. Так как
интервал (hit (р/), int (р/) +1) не содержит
целых значений у-г, ТО любое допустимое
920
Глава 24.4. ЦЕЛОЧИСЛЕННОЕ ПРОГРАММИРОВАНИЕ
целое значение этого переменного (значение
yt в допустимом решении Y e Q)
удовлетворяет одному из неравенств: a) yt < int (р,-); б)
yt > int (p/) + 1. Введение этих неравенств в
задачу линейного программирования с
ослабленными ограничениями порождает две
новые задачи, множества допустимых решений
которых не пересекаются (говорят, что
исходная задача разветвляется на две новые задачи,
а саму процедуру ее замены совокупностью
двух задач, эквивалентных ей в смысле
оптимального решения, называют процессом
ветвления). Проводимый в процессе ветвления
учет требования целочисленности позволяет
исключить из рассмотрения часть множества
допустимых решений (см. п. 24.4.1 и рис.
24.4.2).
Выбрав любую из двух задач,
порожденных исходной задачей, решают
соответствующую задачу линейного программирования с
ослабленными ограничениями (с целевой
функцией из рассматриваемой задачи
целочисленного программирования). Если
полученное решение удовлетворяет требованию
целочисленности, то оно является оптимальным
решением порожденной задачи
целочисленного программирования. Это решение
фиксируют как наилучшее, дальнейшего ветвления
рассмотренной задачи не проводят и
переходят к рассмотрению второй порожденной
задачи. В противном случае задача
разветвляется на две новые задачи. В список задач,
порожденных исходной задачей
целочисленного программирования, вместо уже
рассмотренной вносят две порожденные ею задачи. В
этот список внесено уже три задачи, каждую
из которых исследуют по той же схеме, что и
первую. Как только получают оптимальное
решение задачи линейного программирования
с ослабленными ограничениями,
удовлетворяющее требованию целочисленности, его
сопоставляют с уже имеющимся (если таковое
есть) и фиксируют наилучшее из них (в
смысле оптимального значения целевой
функции). Процесс ветвления продолжают до тех
пор, пока каждая порожденная задача не
приведет к оптимальному решению,
удовлетворяющему требованию целочисленности, или
пока не будет установлена невозможность
улучшения (в смысле оптимального значения
целевой функции) уже зафиксированного
наилучшего решения.
Для повышения эффективности
рассмотренной процедуры вводят понятие
границы, на основе которого можно судить о
необходимости дальнейшего ветвления каждой из
задач, порожденных исходной задачей
целочисленного программирования.
Пусть на каждой итерации /
определена нижняя граница /q для оптимального
значения целевой функции / . На первой
итерации значение /q выбирают равным
значению / для любого известного
допустимого решения исходной задачи
целочисленного программирования, а при отсутствии
априорной информации просто полагают
/q = -оо. Помимо нижней границы имеется
список порожденных задач, подлежащих
решению, который на первой итерации
содержит лишь исходную задачу целочисленного
программирования (24.4.1). Реализация
каждой итерации / предполагает
последовательное выполнение следующих этапов.
Этап 1. Прекратить вычисления, если
список задач, порожденных исходной задачей
целочисленного программирования, пуст. В
противном случае выбрать одну задачу и,
вычеркнув ее из списка, перейти к этапу 2.
Этап 2. Решить задачу линейного
программирования с ослабленными
ограничениями, соответствующую выбранной на
этапе 1 задаче целочисленного
программирования. Если множество ее допустимых
решений пусто или полученное оптимальное
значение целевой функции не превосходит /q~ ,
то принять /q =/о и вернуться к этапу 1.
В противном случае перейти к этапу 3.
Этап 3. Если полученное оптимальное
решение задачи линейного программирования
с ослабленными ограничениями
удовлетворяет требованию целочисленности, то
зафиксировать его, принять /q равным
соответствующему значению целевой функции и
вернуться к этапу 1. В противном случае перейти
к этапу 4.
Этап 4. Выбрать любое базисное
переменное у,, значение которого р, в
полученном оптимальном решении не является
целым числом. В список задач, порожденных
исходной задачей целочисленного
программирования, внести еще две задачи. Первая из
них отличается от задачи, выбранной на этапе
1, лишь наличием дополнительного
ограничения yi < [р,-], а вторая — наличием
дополнительного ограничения у,-> [р,-] + 1.
Принять /q = /q и вернуться к этапу 1.
Замечание. Обратим внимание на
специфику описания этапов итерации: не
предполагается полная целочисленность исходной
задачи, равно как и целочисленность ее ко-
ЗАДАЧИ ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ
921
эффициентов. Если же исходная задача
является полностью целочисленной и
коэффициенты ск ее целевой функции — целые числа,
то процесс решения может быть ускорен за
счет видоизменения второго этапа в каждой
итерации: а) решить задачу линейного
программирования с ослабленными
ограничениями, соответствующую полностью
целочисленной задаче, выбранной на этапе 1; б) если
ее множество допустимых решений пусто или
целая часть оптимального значения целевой
функции не превосходит /q~ , то принять
Уо =/о~ и вернуться к этапу 1. В
противном случае перейти к этапу 3.
Различные варианты выбора одной
задачи из совокупности порожденных задач
приводят к разным последовательностям
порожденных задач и, следовательно, к различным
количествам итераций, необходимых для
нахождения оптимального решения исходной
задачи целочисленного программирования.
Основные недостатки метода ветвей и
границ обусловлены как произволом выбора
последовательности рассмотрения задач из
списка задач, порожденных исходной задачей
целочисленного программирования, так и
произволом выбора переменного модели,
которое используется для получения
порождаемых задач на этапе 4 каждой итерации.
Для повышения эффективности метода ветвей
и границ разработаны специальные
эвристические (от греческого heurisko — открываю,
отыскиваю) правила, связанные как с
выбором переменных модели, инициирующих
процессы ветвления в вершинах дерева
решений, так и с выбором на каждой итерации
задачи для рассмотрения из списка
порожденных задач.
24.4.3. Задачи целочисленного
программирования. Здесь рассмотрены три
задачи математического программирования,
которые в их исходных постановках не являются
задачами целочисленного программирования, но
становятся ими после введения новых
переменных.
Задача планирования производства с
постоянными элементами затрат. Рассмотрим
задачу планирования производства п
различных видов промышленной продукции
П /, j = \,п . Обозначим: Xj - объем
производства продукции Пу в соответствующих
единицах измерения; К: — постоянные
элементы затрат, т.е. затраты, связанные с
производством продукции П. и не зависящие от
его объема Xj ; Cj — текущие затраты на
производство единицы продукции Пу (в
единицах измерения объема ее производства
X;). В этом случае суммарные затраты,
связанные с производством продукции Пу ,
определяются следующим образом:
Vj\xJ) \ О, *у=0,
и естественным является желание «лица,
принимающего решения» минимизировать общие
затраты
п
У(Х) = ^У]{ХЛ Х = (х\-Хп) >
У=1
при планировании производства. Не
останавливаясь на описании множества О
допустимых решений и полагая, что оно соответствует
задаче линейного программирования, отметим
специфическую особенность рассматриваемой
задачи планирования производства с
постоянными элементами затрат. Эта особенность
связана с нелинейностью целевой функции
у(Х) по переменным Xj, j = \,n, и не
позволяет использовать методы линейного
программирования для нахождения
оптимального решения.
Для преодоления возникших трудностей
введем булевы переменные
} 1, х, > 0; . —
Если положительная константа М
удовлетворяет условию X: < М для любого j = \,п ,
то Xj < Myj, j = \9n, и математическая
модель рассматриваемой задачи планирования
производства с постоянными элементами
затрат может быть представлена в следующем
виде:
[ п п
1ХСЛ' + Х^^ ->min;
Ъ=1 к=\
[0<Xj<Myj, y = l,/i, ууб{0,1}, j = \,n.
Из неравенства Xj < Myj при Xj > 0
следует, что .Уу = 1 и целевая функция /
учитывает постоянные элементы затрат К j. Если
922
Глава 24.4. ЦЕЛОЧИСЛЕННОЕ ПРОГРАММИРОВАНИЕ
Xj = О , то yj может принимать значения О
или 1, однако, поскольку Kj>0 и целевую
функцию требуется минимизировать,
переменное yj должно быть равно нулю.
Еще раз напомним, что в исходной
постановке задача планирования производства с
постоянными элементами затрат не имеет
никакого отношения к целочисленному
программированию, но после ее преобразования с
использованием булевых переменных она
превращается в частично целочисленную задачу.
Задача с альтернативными ограничениями.
Прежде чем переходить к рассмотрению
нового класса задач математического
программирования, напомним, что под
альтернативой (от латинского alter — один из двух)
обычно понимают ситуацию, в которой
необходимо выбрать одну из двух исключающих
друг друга возможностей (эти возможности
нередко называют альтернативами).
Задачи с альтернативными (т.е.
взаимоисключающими) ограничениями внешне очень
похожи на задачи линейного
программирования, но ими не являются. Тем более они в
своей изначальной постановке не имеют
никакого отношения к задачам целочисленного
программирования. Задачу с альтернативными
ограничениями можно представить в
следующем виде:
скхк """> тах;
к=\
L<*ikXk ^/> '
=1
п >
^\кхк ^1
к=\ j
= 1
*
V
,1, (24.4.2)
( п Л
^e2kxk<d2
[к=\ )
>
хк >0, к = \,п.
Задачи с альтернативными
ограничениями, в частности, естественным образом
возникают из задач о распределении
ограниченных ресурсов при появлении дополнительного
требования типа: если продукт П, вообще
производится, то в количестве, не меньшем
d: (задан минимальный объем партии). В
этом случае, если х.к — объем производства
продукта П; с использованием к -и
технологии, то должно выполняться одно из двух
ограничений:
Пусть определены такие числа М\ и
М2 , что для переменных Х\,...,хп,
удовлетворяющих ограничениям
п
^aikxk<bh / = 1,/и, хк>0, к = 1,п,
к=\
имеют место неравенства
п п
^,е\кхк ~d\< Ml9 ^e2kxk -d2< М2.
к=\
к=1
(24.4.3)
Тогда задача (24.4.2) может быть
преобразована к частично целочисленной задаче:
п
^скхк ->тах;
к=\
п
^aikxk <bh / = l,/w,
к=\
п
^elkxk-M{y<d{, (24.4.4)
к=\
п
к=\
[х*>0, к = \Гп, уе{0,\}.
Действительно, если у = О , то должно
выполняться ограничение ецХ\ +... + е|/7х,7 <d\.
Ограничение ^2\х\ + ■•• + е2пхп ~ ^2 - ^2
можно не учитывать, так как оно
выполняется автоматически согласно второму
неравенству (24.4.3). Если у = 1 , то должно
выполняться ограничение е2\Х\ + ... + е2пхп <d2, a
ограничение е\\х\ + ... + е\пх„ - М\ <d\
можно не учитывать, так как оно
выполняется автоматически согласно первому
неравенству в (24.4.3).
Анализ задач (24.4.2), (24.4.3) позволяет
уяснить следующее: а) задачу с
альтернативными ограничениями можно рассматривать
как совокупность задач линейного
программирования, которые различаются лишь одним
(альтернативным) ограничением; б) решением
задачи с альтернативными ограничениями
является оптимальное решение той задачи
линейного программирования из
соответствующей совокупности задач, оптимальное
значение целевой функции которой является
наибольшим в этой совокупности; в) задача
(24.4.4) позволяет использовать методы цело-
ЗАДАЧИ ЦЕЛОЧИСЛЕННОГО ПРОГРАММИРОВАНИЯ
923
численного программирования для решения
задач с альтернативными ограничениями.
Замечание. Возможны и более сложные
варианты постановок задач с
альтернативными ограничениями, которые могут быть
преобразованы к частично целочисленным
задачам. Примером подобных задач может
служить задача о максимизации целевой
функции / = qX| +... + спхп при условии, что
будут выполнены любые к [к <т) из
следующих т ограничений:
п
^OyXjubj, / = 1,/и. (24.4.5)
У=1
Известно, что к из т различных
элементов можно выбрать Ст способами, где
Ст - число сочетаний (без повторений) из т
элементов по к. Поэтому рассматриваемая
задача с альтернативными ограничениями
может быть представлена как совокупность
С„7 задач линейного программирования. Но
можно для каждого ограничения в (24.4.5)
ввести новое булево переменное у1} которое
принимает значение 0, если это ограничение
выполняется, и значение 1 в противном
случае. Затем нужно выбрать достаточно большое
число М > О и перейти к решению
следующей частично целочисленной задачи:
Г /;
ПГс/*/ ->max;
У=1
п
\5Laijxj-Myi^bh i = lm,
\J=\
т
г£яr= m-k,xj >0,у = 1,/!,л;€ {0,1},/ = 1,/и.
|>1
Задача с взаимозависимыми
альтернативами. Пожалуй, наиболее важными
организационными решениями, приводящими к
задачам целочисленного программирования,
являются альтернативы «да-нет». Альтернативы
такого рода часто возникают в задачах
организационного управления. Обычно в этих
задачах переменное модели Ху определяет выбор
конкретного проекта, операции или варианта
капиталовложения:
{1, у-й проект выполняется;
0, у-й проект не выполняется.
А так как переменные Xj , являются
булевыми переменными, то их можно использовать
для формализации ограничений, часто
возникающих в задачах распределения
капиталовложений.
Для иллюстрации сказанного
предположим, что необходимо формализовать
ограничение, допускающее выбор не более к из N
имеющихся проектов. Ц этом случае имеем
х1 + х2 + ••• + xN < к.
Если же необходимо выбрать ровно к
проектов из 7V имеющихся, то ограничение
принимает вид
х\ + х2 + ••• + XN =k-
Возможными являются ситуации, когда
необходимо учитывать ограничение,
состоящее в том, что / -й проект может
приниматься лишь при условии принятия у -го проекта.
Такое ограничение можно записать
следующим образом:
х, - Xj < 0.
Действительно, если Ху = 0 , то и х, = 0 .
Если же Xj = 1 , то х, < 1, т.е. возможны оба
варианта: х,- = 0 или х, = 1 .
Предположим теперь, что / -й и у -й
проекты являются взаимоисключающими
(альтернативными), а к -й проект может быть
принят лишь при условии принятия одного
из альтернативных проектов. В этом случае
ограничение может быть представлено в
следующем виде:
X/ + Xj = 1, Хк - X, - Xj < 0.
Таким образом, разнообразные зависимости
между решениями о принятии проектов могут
быть выражены с помощью линейных
ограничений, накладываемых на булевы
переменные модели.
Глава 24.5
ЗАДАЧИ ТРАНСПОРТНОГО ТИПА
Эта глава посвящена изучению задач
линейного программирования, известных в
исследовании операций как задачи транспортного
типа. Интерес к этим задачам обусловлен не
только спецификой их формализации и при-
924
Глава 24.5. ЗАДАЧИ ТРАНСПОРТНОГО ТИПА
кладной значимостью, но и рядом других
причин, среди которых отметим следующие.
1. Любая задача транспортного типа как
задача линейного программирования может
быть решена симплекс-методом. Однако
специфические особенности задач
рассматриваемого класса позволили разработать более
эффективные вычислительные методы. А
поскольку в реальных задачах транспортного
типа число ограничений и переменных, как
правило, бывает весьма значительным, то
использование эффективных вычислительных
алгоритмов становится не только выгодным,
но и просто необходимым.
2. Для задач транспортного типа
естественным и удобным является их
геометрическое представление в виде графа
специального вида. Это представление в ряде случаев
позволяет преобразовывать к задачам
транспортного типа даже такие задачи
исследования операций, которые на первый взгляд не
имеют с ними ничего общего, и использовать
для их решения эффективные
вычислительные алгоритмы.
3. Задачи транспортного типа тесно
связаны с детерминированными динамическими
задачами исследования операций, в том числе и
с многошаговыми задачами принятия решений в
условиях определенности, имеющими большое
прикладное значение.
24.5.1. Классическая транспортная
задача. В исследовании операций под
транспортной задачей обычно понимают задачу
выбора плана перевозок некоторого товара
(изделий, груза) от т источников (пунктов
производства, поставщиков) к п стокам
(станциям назначения, пунктам сбыта),
обеспечивающего минимальные ' транспортные
затраты. При этом предполагают, что: а)
мощность i -го источника (объем поставок товара
от / -го источника) равна St > О, / = 1,/w ; б)
мощность j -го стока (объем поставок товара
к у -му стоку) равна Dj > О, у = 1, я ; в)
стоимость перевозки единицы товара (в
условных денежных единицах) от / -го
источника к у -му стоку равна с,у ; г) суммарная
мощность всех источников равна суммарной
мощности всех стоков, т.е.
т п
^Si = ^Dj. (24.5.1)
i=l j=\
Далее под объемом товара будем
понимать его количество в фиксированных
единицах измерения.
Для математического описания
транспортной задачи вводят переменные Хц ,
обозначающие объемы поставок товара от / -го
источника к у -му стоку. В этом случае
ХН + xi2 + ••• + *ш ~~ общий объем поставок
товара от / -го источника, т.е. мощность
этого источника; х1у- + х2у + ••• + xmj —
общий объем поставок товара к у -му стоку, т.е.
мощность этого стока;
с11*11 + с12*12 + - + стпхтп ~ суммарная
стоимость перевозок товара от источников к
стокам. С учетом этого рассматриваемая
задача может быть представлена в следующем
виде:
Г т п
XSc0*if-*min'
/=i y=i
п т
У=1 /=1
[л->0, / = 17Я y=j>. (24.5.2)
Замечание. Один из важнейших
теоретических результатов исследования операций
может быть сформулирован следующим
образом, если выполнены условия
Si e N, / = Ц/й, Dj e N, у = ГЯ
(24.5.3)
то среди всех оптимальных решений
транспортной задачи (24.5.2), по крайней мере,
одно оптимальное решение удовлетворяет
требованию целочисленности. В дальнейших
рассуждениях мы всегда будем предполагать
выполнение условий (24.5.3). В этом случае
транспортную задачу можно рассматривать
как полностью целочисленную задачу,
поскольку введение дополнительного ограничения
x^eNu{0}, / = 1,/и, у = 1,я,
(24.5.4)
не может повлиять на оптимальное значение
целевой функции. В исследовании операций
полностью целочисленную задачу (24.5.2),
(24.5.4) называют классической транспортной
задачей.
Рассмотрим более подробно
ограничения типа равенства, входящие в задачу
(24.5.2):
КЛАССИЧЕСКАЯ ТРАНСПОРТНАЯ ЗАДАЧА
925
^Ху =Sh i = \,m; (24.5.5)
У=1
!LxiJ=DP
j = hn.
(24.5.6)
Г*п •
*il •
[*ml •
• *iy •
•• *i/ •
•*- mj
' x\n ]
•*7/7
xmn J
Заметим, что каждое переменное модели Ху
с ненулевым коэффициентом, равным
единице, входит лишь в / -е уравнение системы
(24.5.5), соответствующее / -му источнику
(поставки), и в j -e уравнение системы
(24.5.6), соответствующее j -му пункту
потребления (спрос). Поэтому если ввести
матрицу переменных модели (24.5.2), (24.5.4)
то легко увидеть, что элементы ее / -й строки
с коэффициентами 1 входят в / -е уравнение
системы (24.5.5), отражающей мощность
источников, а элементы j -го столбца с
коэффициентами 1 входят в j -e уравнение
системы (24.5.6), отражающей спрос потребителей.
Таким образом, классическую транспортную
задачу (24.5.2), (24.5.4) можно представить в
виде так называемой транспортной таблицы
(табл. 24.5.1).
24.5.1. Транспортная таблица
Пункт
производства
Пункт потребления
Поставки
XljjClj
Si
т
хт\ \\ст1
xmj \cmj
Спрос
А
D,
D„
Эта таблица соответствует матрице
переменных модели X , в которую добавлен
один столбец (поставки) и одна строка
(спрос), а в правой половине клетки,
соответствующей каждому переменному Ху , вписано
соответствующее значение Су . Заметим
также, что при решении транспортных задач
транспортные таблицы играют ту же роль, что
и симплекс-таблицы при решении задач
линейного программирования.
Для удобства геометрической
интерпретации классической транспортной задачи,
представленной в табл. 24.5.1, каждый j -й
сток и каждый / -й источник изобразим в
виде узла сети, т.е. в виде окружности, в
центре которой укажем его мощность (-D; для
j -го стока и Sj для / -го источника). Если
узел сети, соответствующий / -му источнику
(/ = 1,/и), соединить ориентированной дугой
с узлом сети, соответствующим j -му стоку
(у = 1,я1, и на этой дуге указать стоимость
Су перевозки единицы товара от / -го пункта
производства к j -му пункту потребления, то
получим представление рассматриваемой
задачи в виде сети. Ее пример при т = 2 и
п = 3 представлен на рис. 24.5.1.
Итак, каждое переменное Ху
соответствует потоку вдоль ориентированной дуги, Су
926
Глава 24.5. ЗАДАЧИ ТРАНСПОРТНОГО ТИПА
Рис. 24.5.1
выражает затраты в расчете на единицу
потока, а сама задача заключается в
распределении мощностей источников по дугам таким
образом, чтобы при минимальных затратах
удовлетворить потребности стоков.
Замечания. 1. Затраты, связанные с
производством единицы товара, как правило, не
одинаковы для различных пунктов
производства. В случае необходимости учет этих затрат
при постановке транспортных задач
осуществляют путем их включения в коэффициенты
Су.
2. Если в силу каких-либо причин / -й
пункт производства не доступен для j -го
пункта потребления, то либо переменное
модели Ху исключается из рассмотрения, либо
величина Су принимается сколь угодно
большой.
3. При постановке классической
транспортной задачи предполагается выполнение
условия (23.5.1), которое не является
обременительным, так как всегда можно ввести
фиктивный пункт производства или сбыта и
скомпенсировать величину невязки
т п
|/=1 у=1 I
4. Иногда возникает необходимость в
учете ограничений, связанных с пропускной
способностью той или иной ориентированной
дуги сети, при постановке транспортной
задачи. В простейшем случае эти ограничения
имеют вид неравенств
xy<lij9 / = П/и, у = 1,/1. (24.5.7)
Задачу исследования операций вида (24.5.1)-
(24.5.4), (24.5.7) называют транспортной
задачей с ограничениями по пропускной способности.
Как правило, введение ограничений (24.5.7) в
математическую модель классической
транспортной задачи приводит лишь к
незначительному увеличению объема вычислений при
поиске оптимального решения. Но иногда эти
ограничения оказываются настолько
жесткими, что множество допустимых решений
рассматриваемой задачи оказывается пустым.
5. При постановке классической
транспортной задачи предполагают, что все пункты
производства выпускают одну и ту же
продукцию. Но, как правило, каждое
предприятие выпускает несколько видов товаров, и
при разработке плана их перевозок
необходимо учитывать всю номенклатуру. В настоящее
время разработаны различные приемы
преобразований этой задачи к классической
транспортной задаче.
24.5.2. Транспортная задача с
промежуточными пунктами. Одно практически
важное обобщение классической транспортной
задачи связано с учетом возможности
доставки товара от / -го источника к j -му стоку
по маршруту, проходящему через некоторый
промежуточный пункт (склад). Так,
например, промежуточные пункты являются
составной частью распределительной системы
любой крупной компании, имеющей сеть
универсальных магазинов во многих городах.
Такая компания обычно имеет зональные
оптовые базы (источники), снабжающие
товарами более мелкие региональные склады
(промежуточные пункты), откуда эти товары
поступают в розничную торговую сеть
(стоки). При этом товар для каждого
фиксированного стока в общем случае может быть
доставлен не из любого источника и по
маршрутам, не обязательно проходящим через
все промежуточные пункты. Кроме того,
промежуточные пункты могут обладать вполне
определенной спецификой. Так, например,
при транспортировке товара от источника к
стоку по маршруту, проходящему через склад,
часть товара может быть использована для
создания неприкосновенного запаса на
складе.
Задачу выбора плана перевозок товаров
от источников к стокам с учетом
промежуточных пунктов, обеспечивающего
минимальные транспортные затраты и потребности
стоков, в исследовании операций называют
транспортной задачей с промежуточными
пунктами.
24.5.3. Задача о назначениях.
Предположим, что имеется п различных работ,
каждую из которых может выполнить любой из п
привлеченных исполнителей. Стоимость
выполнения / -й работы j -м исполнителем
известна и равна qj (в условных денежных
единицах). Необходимо распределить испол-
ЗАДАЧА О НАЗНАЧЕНИЯХ
927
нителей по работам (назначить одного
исполнителя на каждую работу) так, чтобы
минимизировать суммарные затраты, связанные с
выполнением всего комплекса работ.
В исследовании операций задача,
сформулированная выше, известна как задача о
назначениях. Введем переменные Ху, где Ху
принимает значение 1 в случае, когда / -ю
работу выполняет j -й исполнитель, и
значение 0 во всех остальных случаях, i,j = \,n.
Тогда ограничение
п
Х*у = 1, / = 1,11,
7=1
гарантирует выполнение каждой работы лишь
одним исполнителем, ограничение
п
1=1
гарантирует, что каждый из исполнителей
будет выполнять лишь одну работу.
Стоимость выполнения всего комплекса работ
равна
п п
Таким образом, задачу о назначениях можно
записать следующим образом:
Г /; /7
XX<vjc*'->min;
/7 /7
]Х*'>=1, / = 1'Л; Xxv = Ij J = x>n>
\xjje{Q, 1}, i = \,n, j = \,n.
(24.5.8)
Задача о назначениях (24.5.8) является
частным случаем классической транспортной
задачи (24.5.2), (24.5.4), в которой надо
положить п = т , St ■ = 1, / = 1, п , Dj = 1,
j = \,n . При этом условие Ху е {0,1},
/, у = 1,я, означает выполнение требования
целочисленности переменных Ху. Это связано
с тем, что мощности всех источников и стоков
равны единице, откуда следует, что в
допустимом целочисленном решении значениями
переменных могут быть только 0 и 1.
Как частный случай классической
транспортной задачи, задачу о назначениях
можно рассматривать как задачу линейного
программирования. Поэтому в данном случае
используют терминологию и теоретические
результаты линейного программирования.
В задаче о назначениях переменное Ху
может принимать значение 0 или 1. При этом
согласно (24.5.8) в любом допустимом
решении лишь п переменных могут принимать
значения 1. Таким образом, любое допустимое
базисное решение задачи о назначениях будет
вырожденным.
На практике встречаются задачи о
назначениях, в постановках которых параметр
Су для i,j = \,n понимается как
эффективность выполнения / -й работы j -м
исполнителем. В этих случаях нужно так распределить
работы между исполнителями, чтобы
суммарная эффективность их выполнения была бы
максимальной, т.е.
/7 П
/=1 j=\
где максимум ищется при ограничениях,
указанных в (24.5.8).
Параметры Су, /, j = 1, п , задачи о
назначениях (24.5.8) удобно представлять
матрицей С = (су)е Мп(Ш), которую называют
матрицей стоимости. Предположим, что
С* =(c*j) и С = (сА - две матрицы
стоимости, элементы которых связаны следующим
образом:
Су = Cy+dj +ij9 i,j = \,n,
где dj, i = \,n и /у, j = \,n — некоторые
постоянные. Таким образом, для получения
матрицы С* нужно к элементам каждой / -й
строки матрицы С прибавить число dj, а к
элементам ее каждого j -го столбца — число
/у . В этом случае, если X - допустимое
решение, удовлетворяющее ограничениям из
(24.5.8), и
/m=xi>*' /*w=xiw
/=l j=\ i=\ j=\
то с учетом ограничений типа равенства из
(24.5.8) имеем
928
Глава 24.5. ЗАДАЧИ ТРАНСПОРТНОГО ТИПА
rW = H(cu+d^lj)xu =
/=1 у=1
( п \
1=1 y=l 1=1 1у=1 I
где
i=i j=\
Таким образом, для любого допустимого
решения X соответствующие ему значения
функций / и / будут отличаться на
постоянную у, которая не зависит от X. Поэтому,
если есть две задачи о назначениях с одним и
тем же множеством G допустимых решений
и целевыми функциями f и /*
соответственно, то их оптимальные решения совпадают.
Нетрудно убедиться в наличии аналогичного
свойства и у классической транспортной
задачи.
Если задача о назначениях является
задачей максимизации, т.е. ищется максимум
целевой функции на множестве G
допустимых решений, которое задается системой
ограничений из (24.5.8), то эквивалентную ей
задачу минимизации
/7 /7
ХХН/К^;™ <24-5Л°)
/=1 у'=1
формально нельзя отнести к задачам о
назначениях, поскольку коэффициенты ее целевой
функции не являются положительными. Это
несоответствие можно преодолеть, заменив
(24.5.10) эквивалентной задачей
/=1 У=1
в которой
cjj = Су - max Су, j = 1, n,
так как в этом случае для всех /, j = 1, п
имеет место неравенство -Су > 0 .
Обращаем внимание на то, что задачи о
назначениях, возникающие в приложениях,
как правило, не имеют никакого отношения к
оптимизации перевозок или к каким-либо
другим транспортным операциям.
24.5.4. Задача выбора кратчайшего
пути. Пусть задана некоторая сеть (рис.
24.5.2), каждой ориентированной дуге
которой соответствует определенное расстояние.
Необходимо найти кратчайший путь из / -го
узла сети в ее заданный j -й узел. К этой
задаче, известной в исследовании операций как
задача выбора кратчайшего пути, сводятся
такие практически важные задачи, как задача
о замене оборудования, задача о календарном
планировании комплекса работ и т.д.
Как правило, в сети выделяют один
узел, который является конечным (пункт или
станция назначения, сток). Задача
заключается в отыскании кратчайшего пути в этот
конечный узел (на рис. 24.5.2 конечным
является узел с номером 8) из некоторого другого
узла, сети (например, из первого узла сети на
рис. 24.5.2). Величина Су определяет
расстояние от / -го узла сети до ее j -го узла.
Величина Су может измеряться в
единицах, отличных от единиц длины. Так,
например, Су может представлять собой
стоимость проезда от / -го узла до j -го узла
сети. Тогда задача заключается в отыскании
пути минимальной стоимости. Величина Су
может также определять время переезда, от
/ -го до j -го узла сети. При этом
необходимо найти путь с минимальной
продолжительностью переезда.
При решении прикладных задач,
сводящихся к задаче выбора кратчайшего пути,
часто встречаются ситуации, когда с у * Суг .
Кроме того, как правило, не выполняется так
называемое неравенство треугольника:
Су < с,£ + Сц для всех или некоторых
значений индексов i,j,k .
Рис. 24.5.2.
СИМПЛЕКСНЫЙ МЕТОД РЕШЕНИЯ ЗАДАЧ ТРАНСПОРТНОГО ТИПА
929
Существуют сети, содержащие циклы,
каждый из которых представляет собой
замкнутый путь (путь, исходящий из некоторого
узла сети и возвращающийся в него же). Так,
в сети, представленной на рис. 24.5.2 много
циклов, один из них содержит узлы с
номерами 2, 3, 5, 6 и 7. Как правило, в задачах
исследования операций значения Су
положительны, и общая «длина» цикла является
положительной. Следовательно, решение задачи
выбора кратчайшего пути не может содержать
циклов.
24.5.5. Симплексный метод решения
задач транспортного типа. Решать задачу
транспортного типа, которая тем или иным
способом преобразуется в классическую
транспортную задачу, относящуюся к задачам
линейного программирования, можно с помощью
симплекс-метода. Но специфические
особенности классической транспортной задачи
позволили разработать более эффективный
метод ее решения, известный как симплексный
метод (или метод потенциалов).
Одна из особенностей классической
транспортной задачи состоит в избыточности
системы ограничений типа равенства,
определяющих множество допустимых решений.
Действительно, согласно (24.5.2), эти
ограничения имеют следующий вид:
п
2*0=5}, / = !,/№, (24.5.11)
7=1
///
X-ty = 0/. У = 1,л; (24.5.12)
/=1
т //
Х5' = Е°у (24-5-,3>
i=l у=1
Нетрудно убедиться в том, что базисная
система для системы ограничений (24.5.11)-
(24.5.13) типа равенства содержит п + т-\
уравнений. Таким образом, любое допустимое
базисное решение классической транспортной
задачи (24.5.2), (24.5.4) будет содержать
п + т - 1 базисных переменных.
Можно показать, что задача линейного
программирования, двойственная классической
транспортной задаче (24.5.1) - (24.5.4),
состоит в максимизации целевой функции
т п
<v(ub...,um,vl,...,v„) = 1£siui+y£DjVj
i=\ j=\
(24.5.14)
при ограничениях
щ + Vj < Су, i = 1,т, j = 1,я,
(24.5.15)
где переменные uh i = 1,/и и Vj, j = \,n , не
ограничены в знаке. При этом, если величины
Xy,Uj И Vj и = \,т, j = \,п) удовлетворяют
ограничениям (24.5.11)-(24.5.13) и (24.5.15) и,
кроме того,
Ху (су -uf -и®) = О, / = 1,т, j = I,n,
(24.5.16)
то совокупность всех значений Ху
представляет собой оптимальное решение
рассматриваемой классической транспортной задачи.
Основная идея симплексного метода
состоит в том, что на каждой итерации для
допустимых базисных решений исходной
классической транспортной задачи и
двойственной ей задачи линейного программирования
всегда выполняются два из следующих трех
условий: а) условия (24.5.11)-(24.5.13)
существования допустимых решений классической
транспортной задачи (24.5.2), (24.5.4); б)
условия (24.5.15) существования допустимых
решений двойственной ей задачи линейного
программирования; в) условие (24.5.16).
Приступая к рассмотрению симплексного метода,
заметим, что при его реализации на каждой
итерации выполняются условия а) и в), а при
выполнении условия б) вычислительный
процесс прекращается.
Начнем с нахождения начального
базисного решения для рассматриваемой
классической транспортной задачи, воспользовавшись
ее транспортной таблицей (см. табл. 24.5.1) и
так называемым правилом северо-западного
угла.
Следуя правилу северо-западного угла,
полагаем
Й, SX<DX;
" Щ, SX>DX.
Если Х| j = S\ , то выделяем первую строку
транспортной таблицы (возможности первого
источника полностью исчерпаны и
X\j = О, j = 2, п) и заменяем D\ на
D\ - S\ . Полученная транспортная таблица
соответствует классической транспортной
задаче с т - 1 источником и п стоками.
Следовательно, процедуру нахождения
начального базисного решения можно повторить,
30 — 7706
930
Глава 24.5. ЗАДАЧИ ТРАНСПОРТНОГО ТИПА
определив значение переменного модели *21»
расположенного в северо-западном углу
новой транспортной таблицы, и т.д.
Понятно, что если Х\ [ = Д , то нужно
выделить первый столбец транспортной
таблицы (возможности первого стока полностью
исчерпаны и X/j = 0 , / = 2, т ) и заменить
^i на S\ - D\. В этом случае полученная
транспортная таблица соответствует
классической транспортной задаче с т источниками и
п - 1 стоками, а в ее северо-западном углу
расположено переменное модели X\i.
Если S\ = Д , то можно выделить либо
только первую строку исходной транспортной
таблицы, либо только ее первый столбец. Так,
если выделить первую строку, то Д - S\ - 0
и на следующем шаге переменное модели *21
становится базисным и принимает нулевое
значение. Поэтому на втором шаге выделяем
первый столбец. Если сначала выделить первый
столбец, то S{ - Д = 0, на следующем шаге
переменное модели х^ становится базисным
и принимает нулевое значение. Поэтому на
втором шаге выделяем первую строку.
Кроме правила северо-западного угла
разработаны и другие процедуры нахождения
начального базисного решения для
классической транспортной задачи. Остановимся лишь
на одной из них, известной в исследовании
операций как метод минимальной стоимости.
Единственное отличие этого метода от метода
северо-западного угла заключается в том, что
при его реализации используют переменное
Xjj, которому соответствует минимальная
удельная стоимость Сц , а не переменное
модели, расположенное в северо-западном углу
транспортной таблицы.
Изучение симплексного метода решения
классической транспортной задачи при
известном начальном базисном решении начнем
с трех основополагающих утверждений.
Условимся называть систему линейных
алгебраических уравнений треугольной, если она
содержит, по крайней мере, одно уравнение с
единственным неизвестным, при исключении
которого опять найдется, по крайней мере,
одно уравнение с единственным неизвестным,
и так далее, пока не будут исчерпаны все
неизвестные*.
Такая система после соответствующей
перестановки уравнений и переменных преобразуется в
систему с верхней треугольной матрицей.
Теорема 24.5.1. Все допустимые базисные
решения классической транспортной задачи
задаются треугольной системой линейных
алгебраических уравнений.
Теорема 24.5.2. Значение каждого
базисного переменного Ху в допустимом базисном
решении определяется равенством
I S„ - X Dj.
/*е/ y'*e/
где I и J — множества номеров строк и
столбов транспортной таблицы классической
транспортной задачи (см. табл. 24.5.1),
определяющих значение базисного переменного Хц в
допустимом базисном решении.
Теорема 24.5.3. Если для транспортной
задачи (24.5.2) выполнены условия (24.5.3), то в
любом ее допустимом базисном решении
базисные переменные принимают значения из
множества Nu{0}.
Замечание. Поскольку оптимальное
решение транспортной задачи (24.5.1), (24.5.2)
является допустимым базисным решением, то
при выполнении условий (24.5.3) оно
удовлетворяет требованию целочисленности.
Предположим теперь, что для
классической транспортной задачи (24.5.2), (24.5.4)
известно начальное базисное решение. Для этой
задачи ограничения типа равенств
представлены системой линейных алгебраических
уравнений (24.5.11) - (24.5.13), а целевая функция
т п
/=1 у=1
Если каждое / -е уравнение системы (24.5.11)
умножить на ut с последующим их
суммированием по / = 1, т , а каждое j -e уравнение
системы (24.5.12) умножить на Vj с
последующим их суммированием по j = I, n , то с
учетом (24.5.18) получаем
т п
1=1 j=\
т п
/=1 у=1
(24.5.19)
Значения параметров щ, i = \,m и
Vj, у = 1,я, при которых коэффициенты в
ОСНОВНЫЕ ПОНЯТИЯ
931
левой части равенства (24.5.19) при базисных
переменных, входящих в исходное
допустимое базисное решение, были равны нулю,
называют симплекс-множителями,
соответствующими рассматриваемому допустимому
базисному решению.
Можно показать, что для оптимального
решения изучаемой классической
транспортной задачи симплекс-множители являются
значениями двойственных переменных в
оптимальном решении двойственной задачи
линейного программирования. Поэтому для
обозначения симплекс-множителей
используют обозначения двойственных переменных.
Множество £1 пар индексов (/,у),
соответствующих базисным переменным,
содержит /и + п - 1 элементов, и можно
показать, что система /и + и - 1 линейных
уравнений
ui+Vj=cij, (/,у)еО, (24.5.20)
всегда разрешима относительно /и + и
неизвестных щ, / = 1,/и и vj, у = 1, л . При ее
решении, как правило, независимому
неизвестному придают нулевое значение.
Решив систему линейных
алгебраических уравнений (24.5.20) и определив
значения симплекс-множителей, можно найти
значения
djj = Cjj - щ - vJ9 (/, у) * Q, (24.5.21)
для коэффициентов при свободных
переменных в левой части равенства (24.5.19).
Согласно (24.5.19), уменьшить значение целевой
функции / , соответствующей исходному
допустимому базисному решению, можно
путем введения в базис рассматриваемой
задачи линейного программирования лишь того
свободного переменного Ху, для которого
dy < 0 . При этом естественно выбирать то
свободное переменное, для которого
отрицательный коэффициент будет наибольшим по
модулю. Если же коэффициенты при всех
свободных переменных будут
неотрицательными, то уменьшить значение целевой
функции невозможно, и исходное допустимое
базисное решение является оптимальным
решением.
Теперь необходимо найти то базисное
переменное, которое должно быть выведено
из базиса. В симплекс-методе реализация
этого шага связана с условием допустимости
выбора. Заметим, что для транспортной задачи
все коэффициенты при переменных в
ограничениях (24.5.11), (24.5.12) типа равенства
равны либо единице, либо нулю. Поэтому в
отношениях, используемых в симплекс-методе
при проверке условия допустимости выбора, в
знаменателе всегда будет стоять единица, и
они полностью определяются значениями
базисных переменных.
Глава 24.6
МАРКОВСКИЕ МОДЕЛИ
ПРИНЯТИЯ РЕШЕНИЙ
В этой главе рассмотрены приложения
методов математического программирования к
многошаговым задачам принятия решений в
условиях риска, в которых процесс изменения
состояния любой изучаемой системы является
марковским процессом с конечным
множеством возможных состояний и дискретным
временем. Математические модели,
приводящие к таким задачам, называют марковскими
моделями принятия решений, а сами задачи -
марковскими задачами принятия решений.
В марковских моделях принятия
решений поощрения (доход, потери) задают
матрицей доходов, элементами которой являются
доходы (положительные значения) или
затраты (отрицательные значения), возникающие
вследствие перехода системы из одного
возможного состояния в другое. Матрицы
переходных вероятностей и матрицы доходов
зависят от стратегий, т.е. допустимых решений,
которыми располагает «лицо, принимающее
решения». Основная цель — определение
оптимальной стратегии (оптимального решения),
максимизирующей ожидаемый доход за
конечное или бесконечное число этапов
марковского процесса изменения состояния
изучаемой системы.
24.6.1. Основные понятия. Рассмотрим
некоторую динамическую систему S с
возможными дискретными состояниями
Sj, у = 1,/и, которая в фиксированные
последовательные моменты времени t[ <tj < ...
случайным образом переходит скачком
(мгновенно) из одного возможного состояния
в другое или остается в прежнем. При этом
будем предполагать, что сам процесс
изменения состояния изучаемой системы S
является марковским процессом, т.е. вероятность
перехода системы S в любое возможное
состояние в момент времени t-t определяется
состоянием, достигнутым в момент времени
//_!, и не зависит от того, когда и как она
пришла в это состояние. Напомним, что фик-
30*
932
Глава 24.6. МАРКОВСКИЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ
сированные моменты времени f,- принято
называть шагами или этапами марковского
скалярного процесса изменения состояния
системы S.
Для удобства дальнейших рассуждений
некоторый момент времени /q < h будем
считать начальным и введем случайное
событие s'k , состоящее в том, что после / этапов
исходная система S находится в состоянии
Sfc, к = 1, aw . При этом / = 0 соответствует
начальному этапу, и при любом
фиксированном / события s'k, к = \,т, образуют
полную группу событий. Поэтому
Кроме того, вектор
/>(/)=(р[,|]р[^]...р[^])т
является вектором вероятностей состояний
системы S после / этапов при i = l,N и
вектором начальных вероятностей состояний
системы S при / = 0.
В соответствии с исходными
допущениями условная вероятность реализации
случайного события s'k при условии Sj~
зависит от принятого после (/-1)-го этапа
решения X/. из множества G допустимых
решений. Таким образом,
M'K.)-p№"l:Jf«-i]
и матрица переходных вероятностей
P(i\Xl._l) = (pjk(i\Xl._l))eMm(R).
При этом нетрудно убедиться в том, что
верны следующие утверждения:
а) сумма элементов любой строки
матрицы переходных вероятностей Р и \Х/ { )
равна единице;
б) вектор вероятностей состояний
изучаемой системы S после / этапов равен
произведению транспонированной матрицы
переходных вероятностей Р и \Х/ у) на
вектор вероятностей состояний после (/-1)-го
этапа, т.е.
/>('WT('K>(/-1)-
Из приведенных рассуждений, в
значительной степени очевидных, следует вывод о
том, что в общем случае вектор вероятностей
состояний системы S после N этапов
зависит от вектора начальных вероятностей ее
состояний р(0) и вектора
(XhXl{...X,N_{) eGN,
который называют вектором решений.
Действительно,
p(N) = Pr(N\xlN_l)p(N-l) =
-'Т(^К-,)^Т(^-»К-»)/'(^-2) = -
... = PT(N\X,N_1)PT(N-1\XIN_2)...PT(1\XI0)P(0).
Пример 24.6.1. Каждый год в начале
сезона садовник проводит химический анализ
почвы на своем участке и по его результатам
оценивает продуктивность сада на новый
сезон как хорошую, удовлетворительную или
плохую:
Удовлетво-
Хорошая рительная Плохая
S[ 1S2 <5з
Продуктивность
(состояние почвы)..
Состояние
системы
Таким образом, процесс изменения состояния
почвы представляет собой марковский
процесс с тремя возможными состояниями и
дискретным временем.
Пусть в рассматриваемом примере
матрица переходных вероятностей является
постоянной:
По результатам многолетних
наблюдений садовник установил, что продуктивность
сада в текущем году можно считать зависящей
лишь от состояния почвы в предыдущем году.
(0,2
0
0
0,5 0,3^
0,5 0,5
0
1
где номера строк и столбцов - это номера
состояний системы S[, Sj, <5з соответственно
ОСНОВНЫЕ ПОНЯТИЯ
933
в текущем и последующем годах. Так,
например, если в текущем (/ - 1) -м году состояние
почвы хорошее, то вероятность ее перехода в
плохое состояние в последующем / -м году
равна Лз(0 = />[^з|^1"1] = 0,3.
Садовник может принять решение о
применении удобрений с целью повышения
продуктивности сада, т.е. с целью улучшения
состояния почвы, так как в противном случае
переходные вероятности не изменятся. Если
же садовник принял решение о применении
удобрений, то переходные вероятности
задаются матрицей
(0,3 0,6 0,1 ^
Р2=\ 0,1 0,6 0,3
[0,05 0,4 0,55^
наглядно иллюстрирующей улучшение
состояния почвы в последующие годы.
В рассматриваемом примере множество
допустимых решений G = {^,^2}, где Х\ —
решение о невнесении удобрений, a Xj ~
решение о внесении удобрений. Таким
образом, для i = l,N матрица переходных
вероятностей будет
С переходом системы S из одного
состояния в другое связана матрица дохода
* (' К, ) = (Пк ('" К,)) е Мт (Ж), в кото-
рой элемент Гд (/'ЫГ/ ) есть доход
(положительное значение) или убыток
(отрицательное значение) за / -й этап. При
этом доход или убыток за / -й этап связан
лишь с переходом системы из состояния S;,
в котором она находилась после (/-1)-го
этапа, в состояние S^ при принятии
решения X]. . е G .
Величина
т
М*/м)=Х/*№'мЫ'К|)
к=\
(24.6.1)
определяет ожидаемый доход за / -й этап,
если после (/ - 1) -го этапа система
находилась в состоянии S; и было принято
решение Xj е G . Заметим, что ожидаемый
доход связан лишь с переходами системы из
одного возможного состояния в другое при
фиксированном допустимом решении.
Далее в качестве принципа
оптимальности, совпадающего в рассматриваемом случае
с критерием оптимальности, использована
максимизация ожидаемого дохода за N
этапов. При этом специфика решения задачи
прежде всего связана с тем, будет ли число
этапов N конечным или нет. В соответствии
с этим рассматривают задачи принятия
решений с конечным горизонтом планирования,
когда N < ©о f или с бесконечным горизонтом
планирования, когда N = ©о .
Необходимо отметить, что «лицо,
принимающее решения» может интересовать
величина ожидаемого дохода при заранее
определенной стратегии поведения в случае того или
иного состояния системы. Так, например,
«лицо, принимающее решения» может
считать, что если после (/-1)-го этапа система
находится в состоянии S,-, то
безотносительно к конкретному значению / всегда
необходимо принимать решение X* е G . В этом
случае говорят, что процесс принятия
решений описывается стационарными
стратегиями. При этом каждой стационарной стратегии
будут соответствовать свои матрицы
переходных вероятностей и доходов.
Пример 24.6.2. Продолжим анализ
задачи с садовником (см. пример 24.6.1) и для
наглядности будем считать, что матрицы
доходов (в условных денежных единицах),
соответствующие матрицам переходных
вероятностей Р\ и ?2 имеют следующий вид:
Rx =
(1 6 3 ^
0 5
V0 °
-1
Ri =
(6 5 -\}
7 4 0
6 3 -2
где в матрице доходов /?2 учтены затраты,
связанные с внесением удобрений, и
Характер задачи принятия решений,
стоящей перед садовником, прежде всего
связан с тем, будет ли его деятельность
продолжаться конечное число лет (N < °°) или он и
его наследники будут заниматься садом всю
934
Глава 24.6. МАРКОВСКИЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ
г0,2 0,5 0,3]
0 0,5 0,5
0,05 0,4 0,55
, R =
(7 6 3 1
0 5 1
6 3-2]
свою жизнь [N = ©о). Но в любом случае
садовнику необходимо выбирать наилучшую
стратегию поведения (вносить или не вносить
удобрения) при известных результатах
химического анализа почвы, характеризующих ее
состояние, с целью максимизации
ожидаемого дохода за N лет.
В частности, садовник может решить
вносить удобрения тогда и только тогда, когда
состояние почвы плохое. Этой (одной из
возможных) стационарной стратегии
соответствуют свои матрицы переходных вероятностей
Р и доходов R :
Р =
Они отличаются от матриц /J и R[ лишь
третьими строками, заимствованными из
матриц соответственно /^ и Rj .
24.6.2. Принятие решений при
конечном горизонте планирования. При конечном
горизонте планирования (УУ<©о) марковскую
задачу принятия решений с принципом
оптимальности, который состоит в максимизации
ожидаемого дохода за N этапов, можно
представить как задачу динамического
программирования.
Действительно, пусть /} (у) -
оптимальный ожидаемый доход (т.е. наилучший в
смысле используемого принципа
оптимальности) за этапы с номерами /,/ + !,...,N при
условии, что после (/' - 1) -го этапа изучаемая
(/ + 1)-м этапе (рис. 24.6.1). Эта
составляющая равна (см. (24.6.1))
max V:(X/.),
т
^•(^•)=1^(/+1К)^('+1К).
А:=1
где Pjk (i + 1 \Xj. J - условная вероятность
того, что после (/ + 1)-го этапа система S
будет находиться в состоянии S^ , если после
/ этапов она находилась в состоянии Sj и
было принято допустимое решение Х\. ;
rjk г + 1 МО-) "" Д°Х°Д или убыток,
связанный лишь с переходом системы из состояния
S:, в котором она находилась после /
этапов, в состояние Sk на (/ +1) -м этапе в
результате принятия решения Х\. из
множества допустимых решений G .
Вторая составляющая оптимального
ожидаемого дохода /} (у) определяется
совокупностью оптимальных ожидаемых доходов
fi+i (^)» к = \,т, с учетом
y»*iw»*i*i.> ,@ /ж(1)
лея
/*м<*)
находится в состоянии
где
у е {1,2, ...,/я}. Так как горизонт
планирования конечен, то для оптимальных ожидаемых
доходов должны быть выполнены
естественные условия:
/tf+l(y) s °> </ = £*».
Оптимальный ожидаемый доход fx (у)
на этапах с номерами /,/ + 1,..., N
складывается из двух составляющих. Первая
составляющая — оптимальный ожидаемый доход на
(/ + 1)-м этапе, обусловленный одним лишь
переходом системы S из состояния Sj, в
котором она находилась на / -м этапе, в
любое допустимое состояние S^, к = \,т, на
P^+iiw'+'ix,,)^ wm)
Этап i Этап t'4-l
Рис. 24.6.1
переходных вероятностей /?д (/ + 1 \Х/.J,
к = \,т:
т
ц
к=\
В результате проведенных рассуждений
мы приходим к рекуррентному уравнению
динамического программирования с
конечным числом этапов, связывающему
оптимальные ожидаемые доходы ft (у), у = 1,/и
и fi+i{k), к = \,т:
ПРИНЯТИЕ РЕШЕНИЙ ПРИ КОНЕЧНОМ ГОРИЗОНТЕ ПЛАНИРОВАНИЯ
935
вне зависимости от результатов химического
анализа почвы (первые два года оптимальным
является допустимое решение Х2 для всех
возможных состояний), но на последнем
этапе (третий год) ему следует применять
удобрения лишь при удовлетворительном (S2) и
плохом (<5з ) состояниях почвы. В этом
случае суммарный ожидаемый доход составит
10,74 при хорошем состоянии почвы в начале
первого года, 7,92 - при удовлетворительном
и 4,23 - при плохом состоянии почвы в
начале первого года.
При нахождении оптимальной стратегии
поведения садовника в примере 24.6.3 мы
воспользовались тем, что по самой природе
рекуррентного уравнения для определения
оптимальных ожидаемых доходов {/■ (у)} их
значения вычисляются итеративно. Именно
поэтому рассмотренный метод решения задач
дискретного динамического
программирования называют методом итераций по
стратегиям.
В марковских моделях принятия решений
матрицы поощрений <Ru\Xj._.)[, которые в
соответствии со сложившейся терминологией
мы назвали матрицами доходов, в общем
случае не обязательно отражают доходы в
прямом смысле этого слова. Но если матрицы
|/?(/LV/. )> действительно являются
матрицами доходов, а длительность каждого этапа
— год, то при нахождении оптимального
решения необходимо учитывать дисконтирование
путем введения годового коэффициента
дисконтирования
1
1 + х
где к - годовая норма процента и
0 < а < 1 . Годовой коэффициент
дисконтирования указывает на то, что D денежных
единиц будущего года равны qlD денежным
24.6.1. Этап 3 решения задачи
//(У>тах{я)у(^) +
т ' 1
+X^('+lKi)>J+i(*) ■
*=1 J
/ = 0,7V-1, у = 1,/и,
При этом напомним, что /yv+i(£) = 0,
к = 1,/и, и
т
uy(^)=I^(''+iK)o*(''+'K).
k=l
у = 1,/и.
Пример 20.6.3. Вернёмся к задаче с
садовником, которую мы начали рассматривать
в примерах 24.6.1, 24.6.2, и предположим, что
он планирует прекратить занятие
садоводством через три года и за этот период хочет
получить максимальный доход. Для этого ему
необходимо выработать оптимальную
стратегию поведения (в смысле максимума
суммарного дохода).
В рассматриваемом случае горизонт
планирования N = 3 , а элементы матриц
доходов и переходных вероятностей не
зависят от номера этапа.
Воспользовавшись матрицами Р\,Р2, Р\,
Я2 и их независимостью от номера этапа,
вычислим ожидаемые доходы (24.6.1),
обусловленные одним лишь переходом изучаемой
системы S из одного возможного состояния
в другое, при различных вариантах
допустимых решений из множества G :
г)](Аг,) = 0,2-7 + 0,5-6 + 0,3.3 = 5,3,
■u2(*i) = 0-0 + 0,5-5+ 0,5-1=3,
■u3(*i) = 0-0 + 0-0 + l.(-l) = -l,
я>, (Х2) = 0,3 • 6 + 0,6 • 5 + 0,1 • (-1) = 4,7,
я>2(*2) = 0,1-7 + 0,6- 4 + 0,3-0 = 3,1,
я>з(Х2) = 0,05 6 + 0,4 3 + 0,55 (-2) = 0,4.
Для наглядности воспользуемся табличным
алгоритмом решения рассматриваемой задачи
(табл. 24.6.1 этап 3, соответствующий /з(у),
табл. 24.6.2 этап 2, соответствующий f2(j),
табл. 24.6.3 этап 1, соответствующий /j(y)),
при этом нумерация этапов «с конца»
обусловлена определением оптимального
ожидаемого дохода fj (у).
Из оптимального решения следует, что
первые два года садовник должен применять
удобрения при любом состоянии системы, т.е.
j
1
2
3
М*к)
к=\
5,3
3
-1
к=2
4,7
3,1
0,4
Оптимальный
ожидаемый
доход /з(/)
5,3
3,1
0,4
Оптимальное
решение
Хх
х2
Х2
936
Глава 24.6. МАРКОВСКИЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ
24.6.2. Этап 2 решения задачи
j
1
2
3
/=i
k=i
5,3+0,2-5,3+0,5-3,1 +
+0,30,4=8,03
3+0-5,3+0,5-3,1+
+0,5-0,4=4,75
-1+0-5,3+0-3,1 +
+ 10,4=-0,6
к=2
4,7+0,3-5,3+0,6-3,1 +
+0,10,4=8,19
3,1+0,1-5,3+0,6-3,1 +
+0,30,4=5,61
0,4+0,05-5,3+0,4-3,1 +
+0,550,4=2,125
/2 СО
8,19
5,61
2,125
Оптимальное
решение
Х2
Хг
Хг
24.6.3. Этап 1 решения задачи
J
1
2
3
M*O + X/v/(/ + W/2(0
к=\
5,3+0,2-8,19+0,5-5,61 +
+0,32,125=10,38
3+0-8,19+0,5-5,61 +
+0,5-2,125=6,87
-1+0-8,19+0-5,61 +
+ 1-2,125=1,13
к=2
4,7+0,3-8,19+0,6-5,61 +
+0,12,125=10,74
3,1+0,1-8,19+0,6-5,61 +
+0,3-2,125=7,92
0,4+0,05-8,19+0,4-5,61 +
+0,55-2,125=4,23
AU)
10,74
7,92
4,23
Оптимальное
решение
Х2
Х2
Х2
единицам настоящего года. Поэтому в
рассматриваемом случае при построении
марковской модели принятия решений необходимо
использовать коэффициент дисконтирования
ожидаемых оптимальных доходов для
последовательных этапов, вследствие чего значения
{fi (У)} ~~ приведенные величины ожидаемых
оптимальных доходов по всем этапам.
24.6.3. Принятие решений при
бесконечном горизонте планирования. На
практике нередкими являются случаи, когда либо
задача принятия решений охватывает весьма
значительное число этапов, т.е. /V велико,
либо горизонт планирования бесконечен
(/V = оо). В этих ситуациях процедуры
нахождения оптимального решения обладают
специфическими особенностями, в основе
которых — свойства марковских процессов.
Поведение марковского процесса на
долгосрочном горизонте планирования, когда
/V велико, характеризует его независимость
от начального состояния системы. В этом
случае будем говорить, что система достигла
установившегося состояния. Нас будут
интересовать решения, для которых
соответствующие цепи Маркова допускают существование
установившегося состояния изучаемой
системы. При дальнейших рассуждениях
совокупность этапов, предшествующих этапам
функционирования системы в установившемся
состоянии, будем называть переходным
периодом.
При оценке долгосрочной стратегии
целесообразно базироваться на максимизации
ожидаемого дохода или минимизации
ожидаемых затрат за переходный период, так как
при достижении изучаемой системой
установившегося состояния эти показатели
стабилизируются.
Можно указать два основных метода
решения задач принятия решений с
бесконечным числом этапов. Реализация первого
из них связана с перебором всех возможных
стационарных стратегий принятия решений.
В этом случае оптимальное решение может
быть найдено путем оценивания
эффективности каждой стационарной стратегии, а сам
метод называют методом полного перебора.
Применение метода полного перебора
оправдано лишь в тех случаях, когда число
элементов множества G допустимых решений и, как
следствие, число элементов множества А
всех стационарных стратегий невелико в
смысле вычислительных затрат. При
использовании второго метода, называемого методом
итераций по стратегиям (см. п. 24.6.2), труд-
ПРИНЯТИЕ РЕШЕНИЙ ПРИ БЕСКОНЕЧНОМ ГОРИЗОНТЕ ПЛАНИРОВАНИЯ 937
ности вычислительного характера не являются
столь значимыми, как при применении
метода полного перебора.
Для упрощения дальнейших
рассуждений мы будем предполагать, что марковский
процесс изменения состояний изучаемой
системы S однородный. Таким образом, мы
фактически предполагаем независимость матрицы
переходных вероятностей и матрицы доходов
от номера этапа / = 1,©о .
Метод полного перебора. Предположим,
что в рассматриваемой задаче принятия
решений множество всех стационарных
стратегий состоит из К элементов и
Pk = {Pjn (*))е Мт(К), 4 =(/>,(*))е Ц„(Щ -
матрицы одношаговых переходных
вероятностей и доходов, соответствующие
стационарной стратегии с номером к = 1, К, где т —
число возможных состояний изучаемой
системы S. Метод полного перебора включает
следующие этапы реализации.
Этап 1. Вычисление ожидаемого
дохода за один шаг при к -Pi стационарной
стратегии для всех возможных состояний системы
S:
т
"Л*) = XPJ» (k)rJ» (*)' J = *'т'
/7=1
Этап 2. Вычисление стационарных
вероятностей Uj (k),j = l,m, матрицы
переходных вероятностей Р^, соответствующей
стационарной стратегии с номером к = 1, К .
Как известно из курса теории случайных
процессов, эти вероятности, если они
существуют, являются решением следующей системы
линейных алгебраических уравнений:
т
П(*)(/>*-/,„) = ©,„„ £п,(*) = 1,
где П(Л) = (П1(Л)П2(Л)...Пт(Л))еМ1,„(К),//„ -
единичная матрица порядка т, a Э\т -
нулевая матрица типа 1 х т .
Этап 3. Определение ожидаемого
дохода для всех стационарных стратегий:
т
E(k) = ^nj(k)vj{ky к = \,К.
Этап 4. Определение номера к*
оптимальной стационарной стратегии из
условия
*(*•)■
max Е(к).
\<к<К v '
Алгоритм реализации метода полного
перебора не нуждается в обосновании,
поэтому сразу перейдем к рассмотрению примера.
Пример 24.6.4. В задаче с садовником
(см. примеры 24.6.1-24.6.3) имеется всего
восемь стационарных стратегий:
1. Вообще не применять удобрений.
2. Применять удобрения при любом
состоянии почвы.
3. Применять удобрения лишь в том
случае, когда почва находится в состоянии S\
(хорошем).
4. Применять удобрения лишь в том
случае, когда почва находится в состоянии
1$2 (удовлетворительном).
5. Применять удобрения лишь в том
случае, когда почва находится в состоянии
1S3 (плохом).
6. Применять удобрения лишь в том
случае, когда почва находится или в
состоянии S\ , ИЛИ В СОСТОЯНИИ 1$2 •
7. Применять удобрения лишь в том
случае, когда почва находится или в
состоянии S[, или в состоянии <5з .
8. Применять удобрения лишь в том
случае, когда почва находится или в
состоянии 1S2 » или в состоянии <5з .
Как было показано в примере 24.6.2,
матрицы переходных вероятностей и матрицы
доходов для стационарных стратегий с
номерами от 3 до 8 могут быть получены из
соответствующих матриц для стационарных
стратегий с номерами 1 и 2:
Д =
'0,2 0,5 0,3^
0 0,5 0,5
А =
0
v
'0,3
0,1
0,05
0 1
л.=
/
0,3
0,55
0,6
0,6
0,4
(0,3 0,6 0,1^1
0 0,5 0,5
0 0 1
R7
Ъ
о
о
(6
7
6
ч
'6 5
0 5
0 0
3^
1
-1
-П
938
Глава 24.6. МАРКОВСКИЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ
(0,2 0,5 0,ЗЛ
0,1 0,6 0,3 , У?4 =
0 0 1
f0,2 0,5 0,3^
0 0,5 0,5
0,05 0,4 0,55
(0,3 0,6 0,П
(1 6 Ъ\
7 4 0
0 0-1
(7 6 3^
^ =
0 5 1
6 3-2
Pi =
Ря =
(0,3 0,6 0,1
О 0,5 0,5
0,05 0,4 0,55
(0,2 0,5 0,3 \
Rn =
Rr =
(6
О
6
(1
1
6
-п
1
-2
3 ^
О
-2
0,1 0,6 0,3
О 0 1
. *6
(в 5
7 4
О О
-1
0,1 0,6 0,3
0,05 0,4 0,05
v. J ч •
На первом этапе вычисляют ожидаемые
доходы v,-(к) для всех стационарных
стратегий (см. пример 24.6.3). Результаты
вычислений приведены в табл. 24.6.4.
24.6.4. Ожидаемые доходы
Я)! (А)
v2(k)
v3(k)
к=[
5,3
3
-1
к=2
4,7
зд
0,4
к=3
4,7
3
-1
к=4
5,3
3,1
-1
к=5
5,3
3
0,4
к=6
4,7
3,1
-1
к=7
4,7
3
0,4
*=8
5,3
3,1
0,4
На втором этапе вычисляют
стационарные вероятности Пу (к) матриц переходных
вероятностей Рк для всех стационарных
стратегий и всех возможных состояний изучаемой
системы. Так, например, для второй
стационарной стратегии стационарные вероятности
Пу (2), у = 1,2,3 , являются решением
системы линейных алгебраических уравнений:
(0,3-1)П1(2) + 0,1П2 (2) + 0,05П3 (2) = 0,
0,6П, (2) + (0,6 -1) П2 (2) + 0,4П3 (2) = 0,
0,1П! (2) + 0,ЗП2 (2) + (0,55 - 1)П3 (2) = 0,
П1(2) + П2(2) + П3(2) = 0.
Результаты вычислений приведены ниже:
П,(*)
П2(к)
п3(*)
k=i
0
0
1
к=2
6/59
31/59
22/59
к=3
0
0
1
к=4
0
0
1
к=5
5/154
69/154
80/154
к=6
0
0
1
к=7
5/137
62/137
70/137
*=8
12/135
69/135
54/135
На третьем этапе вычисляют ожидаемый
доход Е (к) для каждой стационарной
стратегии с учетом результатов, полученных на
первых двух этапах реализации алгоритма.
Результаты вычислений приведены ниже:
к
Е(к)
1
-1
2
2,26
3
0,4
4
-1
5
1,72
6
-1
7
1,73
8
2,22
На четвертом этапе находят
Е(к*)= max Е(к) = Е(2) = 2,26.
V ' *=1,2,...,8 v 7 v 7
Таким образом, оптимальной является
вторая стационарная стратегия, реализация
которой предполагает применение удобрений
при любом состоянии почвы.
В примере 24.6.4 следует обратить
внимание на линейную зависимость трех первых
уравнений системы линейных алгебраических
уравнений для определения стационарных
вероятностей Пу (2). Это обстоятельство не
является случайным, так как в общем случае
требуется найти нетривиальное решение
квадратной однородной системы линейных
алгебраических уравнений
(Рк-1т)ТПт(к) = вт1,
ПРИНЯТИЕ РЕШЕНИЙ ПРИ БЕСКОНЕЧНОМ ГОРИЗОНТЕ ПЛАНИРОВАНИЯ 939
значения неизвестных в которой
неотрицательны, т.е. Пу (к) > О, j = 1, т, а их сумма
равна единице. Таким образом, необходимым
условием существования стационарных
вероятностей для стационарной стратегии с
номером к, к = \,К, является условие
det(/W,„) = 0.
Чтобы оценить трудности, связанные с
практическим использованием метода
полного перебора, предположим, что (см. пример
24.6.1) у садовника множество G допустимых
решений состоит не из двух, а из четырех
элементов: Х\ — решение о невнесении
удобрений; Х^ ~~ решение о внесении
удобрений один раз в сезон; Х$ — решение о
внесении удобрений дважды в сезон; Х^ —
решение о внесении удобрений трижды в
сезон. В этом случае общее число
стационарных стратегий, имеющихся в распоряжении
садовника, равно 64. Сложно перечислить все
стационарные стратегии в явном виде. Кроме
того, велики вычислительные затраты,
необходимые для практической реализации метода
полного перебора.
Метод итераций по стратегиям без
дисконтирования. При анализе марковской задачи
принятия решений с конечным горизонтом
планирования N мы использовали понятие
оптимального ожидаемого дохода fi(j) за
этапы с номерами /, i' + 1,..., N ,
вычисляемого при условии, что после / этапов
изучаемая система S находилась в состоянии
S;. При бесконечном горизонте
планирования удобнее использовать понятие
ожидаемого дохода /^ (у) за этапы с номерами
1,2,...,т| при условии, что к этапу с номером
т| +1 изучаемая система S будет находиться
в состоянии Sj. В этом случае, предполагая
однородность соответствующей цепи
Маркова, для любой конкретной стратегии с
матрицей переходных вероятностей
Р = [pjk )e Mm(R) и матрицей доходов
R = (гд)е Мт (R) можно получить
матричное рекуррентное уравнение
Fr]=v+PFr]_l, (24.6.2)
при записи которого использованы
следующие обозначения:
, 1) =
vm 1
\ т )
т
k=\
Фактически уравнение (24.6.2) является
матричным аналогом рекуррентного уравнения,
лежащего в основе метода итераций по
стратегиям при конечном горизонте
планирования (см. п. 24.6.2). Но оно позволяет
исследовать асимптотическое поведение изучаемого
процесса при неограниченном возрастании
числа этапов, т.е. при т| -» +«> Л
Для удобства дальнейших рассуждений
введем матрицу-столбец
У=(1...1)ТбМ/и1(К)
и вспомним, что сумма элементов любой
строки матрицы переходных вероятностей Р
равна единице, так же как и сумма всех ее
стационарных вероятностей, представленных
матрицей-строкой
П=(П,...П,„)еЛ/„п(К).
Таким образом,
/>/ = У, П/sl. (24.6.4)
А так как матрица-строка П стационарных
вероятностей матрицы переходных
вероятностей Р удовлетворяет уравнению
щр-1,„) = еш,
или, что то же самое,
ПР = П,
то, умножив уравнение (23.6.2) слева на
матрицу-строку П, приходим к равенству
П(/-п-/у,) = 1\.
Таким образом, ожидаемый доход за один
этап при больших значениях номеров этапов
безотносительно к состоянию, в котором
система S окажется в начале следующего этапа,
будет
т
E = Ylv = ^njX>j.
Если учесть, что при долгосрочном
горизонте планирования поведение
однородного марковского процесса характеризует его
независимость от начального состояния
системы S, то можно предположить, что при
больших номерах т| этапа значение ожидае-
940
Глава 24.6. МАРКОВСКИЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ
мого дохода F^ (у) складывается из двух
составляющих. Первой составляющей является
величина т\Е , зависящая лишь от числа
рассмотренных этапов и ожидаемого дохода за
один этап безотносительно к состоянию
системы в начале следующего этапа. Вторая
составляющая, которую обозначим F(у),
полностью определяется лишь состоянием S;, в
котором система будет находиться в начале
(г) + 1) -го этапа. Но в этом случае
FA(J) = i\E + F(j), у=й?,
или
Fn = t\EJ + F,
т
где F = (F(\)...F(m)) , и уравнение (24.6.2)
может быть представлено в следующем виде
T)EJ + F = v + P((r)-\)EJ + F).
А так как имеет место первое из равенств
(24.6.4), то мы приходим к матричному
уравнению
EJ + (Im-P)F = v
относительно скаляра Е и вектора F, т.е.
имеем систему т линейных алгебраических
уравнений
т
к=\
(24.6.5)
относительно т +1 неизвестных
E,F(\),...,F(m). При этом, как и в случае
конечного горизонта планирования, конечной
целью является определение стратегии,
приводящей к максимальному значению Е.
В связи с тем что в нашем
распоряжении имеется система (24.6.5), состоящая из т
уравнений с т + 1 неизвестными,
оптимальное значение Е не может быть определено за
один шаг. Поэтому используют итерационную
процедуру, начиная с произвольной
стратегии, а затем определяя новую стратегию,
дающую лучшее значение Е. Процесс
решения завершают, если две последовательно
определенные стратегии совпадают.
Итерационный процесс состоит из двух
основных этапов, называемых этапом
оценивания параметров и этапом улучшения стратегии.
Этап оценивания
параметров. Предположим, что G = [Xj}._. —
множество допустимых решений. Выбираем
т
произвольную стратегию х = (ХцХ^-.Х^) ,
где Хи е G, у = 1, /я . Используя
соответствующие стратегии т , матрицу переходных
вероятностей Р (т) = (pjk (т)) и матрицу
доходов Я (х) = [rjk (т)) и, полагая
Fx (т) = 0 , решаем систему линейных
алгебраических уравнений
т
к=\
относительно Ех, Fx (1),..., Fx (m - 1).
Этап улучшения стратегии.
Для каждого состояния 5у, у = 1,/и,
находим допустимое решение X*j e G , на
котором достигается
( т
max
XjeG
М**0 + 1Ы*/)М*)
к=\
Эти оптимальные решения образуют новую
т
стратегию / = (Х*\Х*2--Х*т) . Если / = т ,
то стратегия т и является оптимальной. В
противном случае нужно обозначить стратегию
/ через х и вернуться к первому этапу —
этапу оценивания параметров.
Отметим, что, согласно (24.6.5),
т
Ex = vj(Xi) + JjPjk(Xi)Fx(k)-Fx(j),
к=\
т.е. задача максимизации на этапе улучшения
стратегии эквивалентна задаче максимизации
суммарного ожидаемого дохода за один этап
по всему множеству допустимых решений G .
Пример 24.6.5. Вернемся к задаче с
садовником (24.6.1-24.6.3) при бесконечном
горизонте планирования и решим ее методом
итераций по стратегиям. В качестве
произвольной стратегии т используем стратегию,
исключающую использование удобрений. В
этом случае
Р(т) =
(0,2 0,5 0,3^
0 0,5 0,5
0 0 1
. *м=
(1 6 Ъ\
0 5 1
0 0-1
ПРИНЯТИЕ РЕШЕНИЙ ПРИ БЕСКОНЕЧНОМ ГОРИЗОНТЕ ПЛАНИРОВАНИЯ 941
На этапе оценивания параметров, учи- которая имеет единственное решение
тывая, что Fx (3) = 0 , получаем систему
линейных алгебраических уравнений:
Ех = -\, /;(!)= 12,54, Fx(2) = 8.
Ex + (l-0,2)Fx(l)-0,5Fx{2) = 5,3,
Ех+0- Fx(l) + (l-0,5)Fx{2) = 3,
Ex + 0Fx(\) + 0Fx(2) = -\,
В рассматриваемой задаче множество G
допустимых решений содержит всего лишь
два элемента (см. пример 24.6.3). Результаты
соответствующих вычислений на этапе
улучшения стратегии приведены ниже:
Sj
1
2
3
4>j(Xi) = Vj(Xi) + pj[(Xi)Fi(\) + pJ2(Xi)Fi(2)
/ = 1
5,3+0,2.12,88+0,5-8=11,88
3+0-12,88+0,5-8=7
-1+0-12,88+0-8=-!
i = 2
4,7+0,3-12,88+0,6-8=13,36
3,1+0,1-12,88+0,6-8=9,19
0,4+0,05-12,88+0,4-8=4,24
max ф,
G J
13,36
9,19
4,24
хч
x2
x2
Новая стратегия t = [X2X2X2)
предусматривает применение удобрений при любом
состоянии почвы. Она отличается от страте-
т
гии т = [Х\Х]Х]) , поэтому возвращаемся
на этап оценивания параметров, полагая
т = (Х2Х2Х2>)
Новой стратегии т соответствуют
матрицы
/>(!) =
(0,3 0,6 0,1
0,1 0,6 0,3
0,05 0,4 0,55
!.*М =
(6 5 -П
7 4 0
6 3-2
которые при Fx (3) = 0 определяют
следующую систему линейных алгебраических
уравнений (см. табл. 24.6.4, к = 2 ):
£ + (l-0,3)FT(l)-0,6Fx(2) = 4,7,
E-0,lFx(l) + (l-0,6)Fx{2) = 3,\,
Е -0,05FX(\) + 0,4FX(2) = 0,4-
Эта система имеет единственное решение
£ = 2,26, Fx(l) = 6,75, Fx(2) = 3,79.
Результаты вычислений на этапе улучшения
стратегии приведены ниже:
Sj
1
2
3
<Pj(Xi) = vJ(Xi) + pj](Xi)Fi(\) + Pj2(Xi)Fi(2)
/= 1
5,3+0,2-6,75+0,5-3,79=8,54
3+0-6,75+0,5-3,79=4,89
-1+0-6,75+0-3,79=-1
/=2
4,7+0,3-6,75+0,6-3,79=8,99
3,1+0,1-6,75+0,6-3,79=6,05
0,4+0,05-6,75+0,4-3,79=2,25
G J
8,99
6,05
2,25
хч
х2
Х2
х2
Новая стратегия t = (Х2Х2Х2) ,
требующая применения удобрений независимо
от состояния почвы, идентична предыдущей,
т.е. она является оптимальной.
Характерной особенностью метода
итераций по стратегиям является его быстрая
сходимость к оптимальной стратегии.
Глава 24.7
ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ
В УСЛОВИЯХ РИСКА
И НЕОПРЕДЕЛЕННОСТИ
Один из принципов классификации
задач исследования операций связан с типом ин-
942 Глава 24.7. ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКА И НЕОПРЕДЕЛЕННОСТИ
формационного состояния «лица, принимающего
решения» (ЛПР). В соответствии с этим
принципом все задачи исследования операций могут
быть разбиты на три класса:
детерминированные, стохастические и неопределенные.
Детерминированные задачи
исследования операций возникают лишь при наличии
всей необходимой информации. Поэтому их
также называют задачами принятия решений в
условиях определенности.
Ограниченность или неточность
информации приводит к одной из двух возможных
ситуаций: 1) принятие решений в условиях
риска {задачи принятия решений в условиях
риска); 2) принятие решений в условиях
неопределенности (задачи принятия решений в
условиях неопределенности). В первом случае
степень неполноты исходной информации
находит свое отражение в виде законов
распределения случайных величин, входящих в
стохастические модели принятия решений. Во
втором случае априорная информация о законах
распределения соответствующих случайных
величин не известна.
В настоящей главе мы ознакомимся с
общими положениями теории принятия
решений в условиях риска и неопределенности,
т.е. в условиях неполной информации. При
этом мы не будем касаться задач принятия
решений в условиях неопределенности, в
которых ЛПР противостоит мыслящий
противник. Теория, в которой рассматриваются
подобные задачи принятия решений, известна
как теория игр.
24.7.1. Одноэтапные процедуры
принятия решений в условиях риска. При
анализе марковских моделей принятия решений
(см. гл. 24.6) в качестве принципа
оптимальности, формально совпадающего с критерием
оптимальности, был использован критерий
максимальности ожидаемой прибыли.
Проведем анализ скалярных критериев,
наиболее часто используемых при принятии
решений в условиях риска, с тем чтобы для
каждого из них определить области не только
возможного, но и наиболее целесообразного
применения.
Критерий ожидаемого значения.
Использование этого критерия, обусловленное
стремлением максимизировать ожидаемую
прибыль или минимизировать ожидаемые
затраты, представляет собой естественный
переход в задачах принятия решений от
условий определенности к условиям риска.
Количественно критерий ожидаемого значения
можно выразить в денежных единицах или в
единицах полезности денег.
Отметим также, что понятие полезности
сложно формализовать. На практике влияние
полезности денег может быть отражено
введением дополнительных ограничений,
отражающих поведение ЛПР.
В общем случае нецелесообразно
использовать ожидаемое значение стоимостного
выражения как единственный критерий.
Экстремальное значение этого критерия может
служить лишь ориентиром, а окончательное
решение может быть принято только с учетом
всех существующих факторов, определяющих
отношение ЛПР к полезности денег.
Остановимся на формальном аспекте
практического использования скалярного
критерия типа «ожидаемое значение» в
задачах принятия решений в условиях риска.
Пусть ея($) = (Мю)Ыш)..4,И)Т "
случайная выборка объема п из генеральной
совокупности случайной величины ^(<о),
имеющей математическое ожидание т и
дисперсию о , т.е. М[^(со)] = /я и
D[^(co)] = a . В этом случае выборочное
среднее
обладает следующими числовыми
характеристиками Мр(со)] = /я, D[^(co)] = a2/« ->0
при п —> ©о . Таким образом, использование
критерия «ожидаемое значение» допустимо
лишь тогда, когда одно и то же решение
приходится принимать достаточно большое число
раз (значение п велико). Тогда случайная
величина ^(со) начинает проявлять свойство
устойчивости, являющееся основным
содержанием закона больших чисел, и для любого
е > 0 существует предел
lim рП$(ш)-1и|<е|1 = 1.
Критерий «ожидаемое значение —
дисперсия». При анализе критерия ожидаемого
значения мы выяснили, что его использование в
задачах принятия решений в условиях риска
оправдано лишь для многократно
повторяющихся ситуаций. А так как этот критерий
является весьма удобным при решении
практических задач, в чем мы имели возможность
убедиться при изучении марковских моделей
принятия решений, то попытаемся
адаптировать его для редко повторяющихся ситуаций.
Предположим, что величина дохода
^(со) является случайной величиной с мате-
ОДНОЭТАПНЫЕ ПРОЦЕДУРЫ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКАХ 943
матическим ожиданием т и дисперсией о .
Введем функцию полезности дохода ф (£ (со)).
Мы не будем обсуждать это трудно
формализуемое понятие. Функция полезности нужна
нам лишь для обоснования вида
конструируемого критерия. Считая, что скалярная
функция ф(х) является достаточно гладкой в
некоторой окрестности точки х = т ,
приближенно представим функцию полезности
дохода по формуле Тейлора:
ф(£(ю))~ф(т) + ф'(т)(£(со)-/л) +
+ 1ф>)0Цсо)-т)2.
Таким образом, ожидаемое значение функции
полезности дохода определяется следующим
приближенным равенством:
М[ф(^(ш))] = Ф(/я) + 1ф'(т)о2.
Полученное соотношение указывает на то,
что целесообразно учитывать не только
ожидаемую прибыль, но и ее дисперсию.
Из-за сложностей формализации
понятия функции полезности дохода в задачах
принятия решений в условиях риска для
редко повторяющихся ситуаций, как правило,
используют не критерий ожидаемого
значения функции полезности дохода, а критерий
«ожидаемое значение — дисперсия*
M[5(eo)]-AD[^(a))]->max(min),
где значение параметра К интерпретируют
как уровень несклонности к риску.
Так, например, если случайная величина
£(со) представляет собой прибыль, инвестор,
особенно остро реагирующий на возможные
большие отклонения прибыли вниз от ее
ожидаемого значения, может выбрать
большое значение К. Это придаст больший вес
дисперсии и приведет к решению,
уменьшающему вероятность большой потери
прибыли.
Эффектность практического применения
критерия «ожидаемое значение — дисперсия»
в значительной степени связана с
обоснованным назначением уровня несклонности к
риску, что весьма затруднительно. В
основном это связано с тем, что компоненты
критерия «ожидаемое значение — дисперсия» не
являются нормированными.
Критерий предельного уровня.
Рассмотрим ситуацию, когда на продажу выставлен
подержанный автомобиль. Указав
предлагаемую цену, продавец должен в разумно
короткий срок решить, приемлема ли она для него.
С этой целью он может установить цену,
ниже которой автомобиль не может быть продан
(предельный уровень), и согласиться с
первым же предложением цены, превышающим
этот уровень.
В рассмотренной одношаговой процедуре
принятия решений использован критерий,
который называют критерием предельного уровня.
Использование критерия предельного уровня
при принятии решений в условиях риска в
общем случае не приводит к нахождению
оптимального решения, например,
максимизирующего прибыль или минимизирующего
затраты. Скорее, он соответствует
определению приемлемого способа действий.
Одним из преимуществ критерия
предельного уровня является то, что его
практическое использование не предполагает
обязательного знания законов распределения
соответствующих случайных величин.
В общем случае критерий предельного
уровня может быть использован и в задачах
принятия решений в условиях неопределенности.
Критерий наиболее вероятного исхода. В
основе этого критерия лежит преобразование
случайной ситуации к детерминированной
путем замены случайной величины ее
единственно возможным значением, имеющим
наибольшую вероятность реализации.
Критерий наиболее вероятного исхода
можно рассматривать как упрощенный
вариант некоторого более сложного критерия для
принятия решений в условиях риска. Но это
упрощение не связано с чисто
аналитическими соображениями, а обусловлено прежде
всего тем, что с практической точки зрения
знание наиболее вероятного исхода
обеспечивает потребность в информации для принятия
решений.
При использовании критерия наиболее
вероятного исхода для принятия решений в
условиях риска необходимо помнить о том,
что, как и другие рассмотренные критерии,
он не является универсальным. Чтобы понять
это, достаточно представить две элементарные
ситуации:
1) £(со) _ дискретная случайная
величина, принимающая значения Х^ , общее
количество п которых велико, причем
Р[%(<о) = Хк]йО,05, £=й;
2) наибольшую вероятность реализации
имеют несколько возможных значений
дискретной случайной величины.
944 Глава 24.7. ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКА И НЕОПРЕДЕЛЕННОСТИ
В обоих случаях критерий наиболее
вероятного исхода явно не годится для
принятия обоснованного решения.
24.7.2. Одноэтапные процедуры
принятия решений в условиях
неопределенности. При анализе одноэтапных процедур
принятия решений в условиях риска мы уже
отмечали, что практическое применение критерия
предельного уровня в общем случае не
предполагает знания законов распределения
случайных величин. Поэтому критерий предельного
уровня может использоваться и при принятии
решений в условиях неопределенности. В
этом параграфе мы рассмотрим критерии,
наиболее часто применяемые на практике:
1) критерий Лапласа;
2) минимаксный (максиминный) критерий;
3) критерий Сэвиджа;
4) критерий Гурвица.
Основное различие между критериями,
перечисленными выше, определяется
стратегией поведения ЛПР в условиях
неопределенности. Так, например, критерий Лапласа
базируется на более оптимистичных
предположениях, чем минимаксный критерий, а
критерий Гурвица, в свою очередь, можно
использовать при различных подходах: от
наиболее пессимистичного до наиболее
оптимистичного. Таким образом, перечисленные
критерии, несмотря на их количественную
природу, отражают субъективную оценку
ситуации, в которой приходится принимать
решения.
К сожалению, не существует общих
правил оценки практической применимости того
или иного критерия при принятии решений в
условиях неопределенности. Скорее всего, это
связано с тем, что поведение «лица,
принимающего решения», обусловленное
неопределенностью ситуации, по всей видимости,
является наиболее важным фактором при
выборе подходящего критерия.
Информация, необходимая для
принятия решений в условиях неопределенности,
обычно представляется в форме матрицы,
/ -я строка которой соответствует решению
Xj из множества допустимых решений
G = {Xfc}._., a •/~и столбец соответствует
состоянию S; изучаемой системы S с
множеством возможных состояний {Sn} _. •
Каждому допустимому решению Xj e G и
каждому возможному состоянию Sj изучаемой
системы S соответствует результат
\>9=\>(XhSj), i = l,N, j = lm,
определяющий выигрыш или потери при
принятии данного решения и реализации
данного состояния. Таким образом, если
множество G допустимых решений состоит
из N элементов, а система S может
находиться в любом из т возможных состояний,
то матрица
N(G,S) = (viJ)eMNm(R)
и является матрицей исходных данных для
принятия решений в условиях
неопределенности.
Если величина vfX^Sj) определяет
доход (выигрыш), обусловленный принятием
решения Х-х е G и реализацией системой S
возможного события S; , то матрица
N(G,S) является матрицей дохода. Если же
величина v(XhSA определяет затраты
(потери, проигрыш), обусловленные
принятием решения Xj и реализацией системой S
возможного состояния S;, то матрицу
N(G,S) называют матрицей потерь или
матрицей затрат.
Критерий Лапласа. Для обоснования
этого критерия, широко используемого в
задачах принятия решений в условиях
неопределенности, воспользуемся следующими
соображениями, отражающими основную суть
принципа недостаточного обоснования.
Поскольку вероятности пребывания
изучаемой системы S в каждом ее возможном
состоянии S;, j = 1, гп , не известны, то
отсутствует и необходимая информация для
вывода о том, что эти вероятности различны.
В противном случае имела бы место ситуация
принятия решений в условиях риска. Поэтому
мы можем предположить равные вероятности
реализации любых возможных состояний
системы S . Таким образом, исходную задачу
можно рассматривать как задачу принятия
решений в условиях риска, когда выбирают
решение X* е G = {Xj}i=l , обеспечивающее
наибольший ожидаемый выигрыш, т.е.
1 т
ОДНОЭТАПНЫЕ ПРОЦЕДУРЫ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ 945
maxmmx>(X:,SA.
XjeG Sj V ' J}
Здесь учтено, что вероятности пребывания по максиминному критерию выбирают реше
системы S в состояниях Sj, j = \,m , оди- ние X* е G , обеспечивающее
наковы и равны 1/т. Сформулированный
критерий называют критерием Лапласа.
Минимаксный (максиминный) критерий. Критерий Сэвиджа. Минимаксный
Этот критерий является наиболее (максиминный) критерий является настолько
«осторожным», поскольку его реализация «пессимистичным», что может приводить к
предполагает выбор наилучшей из наихудших нелогичным выводам. Необходимость исполь-
возможностей. зования менее «пессимистичного» критерия
дг обычно иллюстрируют задачей принятия ре-
Пусть G ={л/|/_1 — множество допус- шений в условиях неопределенности с матри-
цей потерь
тимых решений, a [Sj\ - множество воз- жг/^ оЧ , х ( , v o .v (11000 90^
- с N{G,S) = {vij ) = {\>(XhSj )) = \
можных состоянии изучаемой системы. Если ' ^lUUUU 1UUUU
v[XhSj) - потери ЛПР при выборе им Применение минимаксного критерия
приводит к выбору решения Х2 и потерям в 10000
решения X,; е G и реализации системой S ~
F ' F при реализации системой одного из возмож-
возможного состояния Sj, то наибольшие ных состояний S± или S2. Но интуитивно
потери независимо от возможных состояний напрашивается вывод о целесообразности
будут равны
mm\>{XhSj), i = UN.
По минимаксному критерию выбирают
решение X* е G , обеспечивающее
min тъху)(X-..SЛ.
XizG Sj V J}
Аналогично, если \)(Xj,Sj) — выигрыш, то
выбора решения Х\ , поскольку не
исключается возможность реализации состояния S2 и
v(X{,S2) = 90.
Для устранения отмеченного недостатка
минимаксного (максимииного) критерия
вместо величины \)(А/,5у), характеризующей
потери (выигрыши) при принятии решения
Xj и реализации возможного состояния Sj ,
введем величину
■(XhSj) =
maxv(X;,Sj)-\)(Xj,Sj), v(Xi9 Sj) - доход;
XteG
Я)(Аг,-,5,у)- min x)(XhSj), x>(XhSj)- потери.
Фактически величина r(XhSj) выражает со- б) если u(A/,5y) -доход, то решение
жаление ЛПР по поводу того, что оно не выбра- выбирают из условия
ло наилучшее решение относительно состояния
Sj изучаемой системы. Поэтому матрицу
R{G,S) = (nj)eMNmR, riJ=r(Xi,SJ),
maxmmr(X;,SA,
Y.^H .С. V ' J/
XieG S
называют матрицей сожалений, а
минимаксный (максиминный) критерий относительно
этой матрицы - критерием Сэвиджа. При
использовании этого критерия:
r(XhSj) = mzxv(Xi,Sj)-v{Xi,Sj),
i = \,N, j = \,m.
В частности, в рассмотренном выше
примере, решение которого с использованием
, минимаксного критерия приводило к нело-
а) если v[XhSj) - затраты, то реше- гичному выводу,
ние выбирают из условия
min maxr(X;,S.),
XieG Sj V J}
r (XhSj) = x>(XhSj) - min ъ(Xi,Sj),
i = \,N, j = \,m;
XjeG
min \)(XhS{) = 10000, min v(XhS2) = 90,
XjsG XjeG
и матрица сожалений имеет вид
R{G,S):
(1000 0 "j
[ 0 9910 J'
946 Глава 24.7. ЗАДАЧИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ РИСКА И НЕОПРЕДЕЛЕННОСТИ
Таким образом,
тэх г (Xx,Sj) = r (Xl,Sl) = \<№,
sj
maxr(X2,Sj) = r(X2,S2) = 99\0,
SJ
min max r (XhSj ) = r(X{,S{) = 1000,
XjGU S;
и по критерию Сэвиджа оптимальным
является решение Х\ . Заметим, что этот же
результат мы получим и при использовании
критерия Лапласа.
Критерии Гурвица. Этот критерий
охватывает ряд подходов к принятию решений в
условиях неопределенности — от наиболее
пессимистичного до наиболее
оптимистичного. Если N(G,S) = (b(XhSj))e MNm(R)~
матрица выигрышей (доходов), то наиболее
оптимистичному подходу соответствует
критерий
maxmaxu(X-,iS\),
X^G Sj V J;
а наиболее пессимистичному — критерий
min n\m\)(Xi,Sj).
XteG Sj V y/
Критерий Гурвица устанавливает баланс между
наиболее оптимистичным и наиболее
пессимистичным подходами путем взвешивания
обоих вариантов принятия решений в
условиях неопределенности с весами а и 1 - а , где
0 < а < 1 . Это значит, что если
N (<7, S) = (v(Xh Sj)) - матрица
выигрышей, то по критерию Гурвица выбирают
решение X* е G , обеспечивающее
max атахх)(Х;.8Л + (\-о)тту)(Х-п8Л \.
x^g\ Sj v JJ v ' Sj v i} I
Если же N(G,S) — матрица затрат, то по
критерию Гурвица выбирают решение
Х*е G, обеспечивающее
mm airing
Параметр ae [0,1] называется
показателем оптимизма. Его значение выбирается
ЛПР в зависимости от опыта принятия
решений в условиях неопределенности и личных
склонностей к оптимизму (а —> 1 - 0) или
пессимизму (а—»0 + 0). При отсутствии
ярко выраженных склонностей a = 0,5
представляется наиболее разумным.
Раздел 25
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
В ТЕХНИКЕ
Глава 25.1
РОЛЬ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ
В ТЕХНИКЕ
25.1.1. Математическое моделирование и
вычислительный эксперимент. С достаточно
общих позиций математическое моделирование можно
рассматривать как один из методов познания
реального мира в период формирования так называемого
информационного общества, как интеллектуальное
ядро быстро развивающихся информационных
технологий. Этот метод не противоречит хорошо
известной формуле: «от живого созерцания к абстрактному
мышлению и от него к практике». Особенность этого
метода состоит в том, что абстрактным отражением
существующего или создаваемого объекта является
его математическая модель в виде совокупности
математических понятий и отношений, выраженных
при помощи системы математических символов и
обозначений и отражающих некоторые свойства
изучаемого объекта, причем ее количественный
анализ позволяет получить новые знания об этом
объекте. Математическое моделирование все глубже
проникает в самые различные сферы человеческой
деятельности, в том числе в технику.
Под математическим моделированием в технике
понимают адекватную (от латинского слова adaequatiis —
приравненный) замену исследуемого технического
устройства или процесса соответствующей
математической моделью и ее последующее изучение методами
вычислительной математики с привлечением средств
современной вычислительной техники. Поскольку
такое изучение математической модели можно
рассматривать как проведение эксперимента на
компьютере при помощи вычислительно-логических алгоритмов,
то в научно-технической литературе термин
вычислительный эксперимент часто выступает как синоним
математического моделирования.
Применение математического моделирования в
технике опирается на тесную связь с инженерной
практикой, на достижения вычислительной
математики, активно использует сведения из
естественнонаучных дисциплин, предполагает уверенное
владение вычислительной техникой и программированием
на ЭВМ. Для инженера любой специальности
математическое моделирование - инструмент, творческое
применение которого может способствовать
прогрессу в любой отрасли техники.
25.1.2. Влияние математического
моделирования на развитие техники. На пути реализации
в технике наиболее перспективных научных открытий
и разработок обычно стоят препятствия, связанные с
отсутствием или ограниченными возможностями
конструкционных или функциональных материалов и
с недостаточностью достигнутого технологического
уровня. Поэтому процесс реализации научных и
технических идей — это процесс поиска, разумного
компромисса между желаемым и возможным, что
доказывает история развития таких быстро
прогрессирующих технических отраслей, как ядерная
энергетика, ракетно-космическая техника, ведущие отрасли
приборостроения и вычислительная техника.
При создании технических устройств и систем
различного назначения обычно рассматривают
несколько возможных вариантов проектных решений,
ведущих к намеченной цели. Эти варианты принято
называть альтернативами. Учет противоречивых
требований и поиск компромисса в решении
комплекса возникающих при этом взаимосвязанных
проблем предполагает наличие достаточно полной и
достоверной количественной информации об
основных параметрах, которые характеризуют возможные
для выбора альтернативы.
В складывавшейся десятилетиями
последовательности основных этапов разработки технических
устройств в большинстве отраслей машиностроения
некоторый начальный объем необходимой
информации формировался путем так называемых
проектировочных расчетов, степень достоверности которых
должна была обеспечивать лишь довольно грубый
отбор альтернатив. Основная часть необходимой для
принятия окончательного решения количественной
информации (как по степени подробности, так и по
уровню достоверности) формировалась на стадии
экспериментальной отработки технических устройств.
По мере их усложнения, удорожания и удлинения
948 Глава 25.1. РОЛЬ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ В ТЕХНИКЕ
стадии экспериментальной отработки значимость
проектировочных расчетов стала расти. Возникла
необходимость в повышении достоверности таких
расчетов, обеспечивающей более обоснованный
отбор альтернатив на начальной стадии
проектирования и формулировку количественных критериев для
структурной и параметрической оптимизации.
Развитие сверхзвуковой авиации,
возникновение ракетно-космической техники, ядерной
энергетики и ряда других быстро развивающихся
наукоемких отраслей современного машиностроения привели
к дальнейшему усложнению разрабатываемых и
эксплуатируемых технических устройств и систем. Их
экспериментальная отработка стала требовать все
больших затрат времени и материальных ресурсов, а
в ряде случаев ее проведение в полном объеме
превратилось в проблему, не имеющую приемлемого
решения.
В этих условиях существенно выросла роль
расчетно-теоретического анализа характеристик таких
устройств и систем. Этому способствовал и прорыв в
совершенствовании вычислительной техники,
приведший к появлению современных электронных
вычислительных машин (ЭВМ) с большим объемом
памяти и высокой скоростью выполнения
арифметических операций. В результате возникла
материальная база для становления и быстрого развития
математического моделирования и появились реальные
предпосылки для использования вычислительного
эксперимента не только в качестве расчетно-
теоретического сопровождения на стадии отработки
технического устройства, но и при его
проектировании, подборе и оптимизации эксплуатационных
режимов, анализе надежности и прогнозировании
отказов и аварийных ситуаций, при оценке
возможностей форсирования и модернизации технического
устройства.
В настоящее время математическое
моделирование и вычислительный эксперимент с
использованием ЭВМ стали составной частью общих подходов,
характерных для современных информационных
технологий. Принципиально важно то, что
математическое моделирование позволило объединить
формальное и неформальное мышление и естественным
образом сочетать способность ЭВМ во много раз
быстрее, точнее и лучше человека выполнять
формальные, арифметические операции, отслеживать
логические цепочки, со свойствами человеческого
интеллекта - интуицией, способностью к
ассоциациям и т.д. Не менее важно и то, что современные
средства отображения информации дают
возможность вести с ЭВМ диалог — анализировать
альтернативы, проверять предположения,
экспериментировать с математическими моделями.
Практическая реализация возможностей
математического моделирования и вычислительного
эксперимента существенно повышает эффективность
инженерных разработок особенно при создании
принципиально новых, не имеющих прототипов,
машин и приборов, материалов и технологий, что
позволяет сократить затраты времени и средств на
использование в технике передовых достижений
физики, химии, механики и других фундаментальных
наук. Отмеченные возможности математического
моделирования и вычислительного эксперимента еще
далеко не исчерпаны, представляются достаточно
перспективными и поэтому заслуживают детального
рассмотрения.
25.1.3. Последовательность этапов
моделирования и вычислительного эксперимента.
Основные подходы к математическому
моделированию технических устройств и процессов целесообразно
рассмотреть при помощи условной схемы,
определяющей последовательность проведения отдельных этапов
общей процедуры вычислительного эксперимента.
Исходной позицией этой схемы служит технический
объект (ТО), под которым будем понимать конкретное
техническое устройство, его агрегат или узел, систему
устройств, процесс, явление или отдельную ситуацию в
какой-либо системе или устройстве.
На первом этапе осуществляют неформальный
переход от рассматриваемого (разрабатываемого или
существующего) ТО к его расчетной схеме (PC) (рис.
25.1.1). При этом в зависимости от направленности
вычислительного эксперимента и его конечной цели
акцентируют те свойства, условия работы и
особенности ТО, которые вместе с характеризующими их
параметрами должны найти отражение в PC, и,
наоборот, аргументируют допущения и упрощения,
позволяющие не учитывать в PC те качества ТО,
влияние которых предполагают в рассматриваемом
случае несущественным. Иногда вместо PC
используют термин содержательная модель ТО, а в
некоторых случаях — концептуальная модель.
В сложившихся инженерных дисциплинах
помимо описательной (вербальной) информации для
характеристики PC разработаны специальные приемы
и символы наглядного графического изображения
(например, в сопротивлении материалов,
электротехнике и электронике). По ряду новых направлений
развития техники подобная символика находится в
стадии формирования.
При разработке новых ТО успешное
проведение первого этапа в значительной мере зависит от
профессионального уровня инженера, его
творческого потенциала и интуиции. Полнота и
правильность учета в PC свойств ТО, существенных с точки
зрения поставленной цели исследования, являются
основной предпосылкой получения в дальнейшем
достоверных результатов математического
моделирования. Наоборот, сильная идеализация ТО ради
получения простой PC может обесценить все
последующие этапы исследования.
Содержание второго этапа состоит, по
существу, в формальном, математическом описании PC. Это
описание в виде математических соотношений,
устанавливающих связь между параметрами,
характеризующими PC TO, и называют математической
моделью этого ТО.
Для некоторых типовых PC существуют банки
ММ что упрощает проведение второго этапа. Более
того, одна и та же ММ может соответствовать PC из
различных предметных областей. Однако при
разработке новых ТО часто не удается ограничиться
применением типовых PC и отвечающих им уже
построенных ММ. Создание новых моделей или
модификация существующих должны опираться на достаточно
глубокую математическую подготовку и владение
математикой как универсальным языком науки.
На третьем этапе проводят качественный и
оценочный количественный анализ построенной
ММ. При этом могут быть выявлены противоречия,
ликвидация которых потребует уточнения или
пересмотра PC (штриховая линия на рис. 25.1.1).
Количественные оценки могут дать основания упростить
ММ, исключив из рассмотрения некоторые парамет-
СТРУКТУРА МАТЕМАТИЧЕСКОЙ МОДЕЛИ
949
ры, соотношения или их отдельные составляющие,
несмотря на то, что влияние описываемых ими
факторов учтено в PC. В большинстве случаев, принимая
дополнительные по отношению к PC допущения,
полезно построить такой упрощенный вариант ММ,
который позволял бы получить или привлечь
известное точное решение. Это решение затем можно
использовать для сравнения при тестировании
результатов на последующих этапах. В некоторых случаях
удается построить несколько ММ для одного и того
же ТО, отличающихся различным уровнем
упрощения. В этом случае говорят об иерархии ММ
(греческое слово lepapxui происходит от iepo^ —
священный и архл — власть и в данном случае означает
упорядочение ММ по признаку их сложности и
полноты).
Построение иерархии ММ связано с различной
детализацией свойств изучаемого ТО. Сравнение
результатов исследования различных ММ может
существенно расширить и обогатить знания об этом
ТО. Более того, такое сравнение позволяет оценить
достоверность результатов последующего
вычислительного эксперимента: если более простая ММ
правильно отражает некоторые свойства ТО, то
результаты исследования этих свойств должны быть близки к
результатам, полученным при использовании более
полной и сложной ММ.
Итог анализа на рассматриваемом этапе — это
обоснованный выбор рабочей ММ ТО, которая
подлежит в дальнейшем детальному количественному
анализу. Успех в проведении третьего этапа зависит,
как правило, от глубины понимания связи отдельных
составляющих ММ со свойствами ТО, нашедшими
отражение в его PC, что предполагает органическое
сочетание владения математикой и инженерными
знаниями в конкретной предметной области.
Четвертый этап состоит в обоснованном
выборе метода количественного анализа ММ, в разработке
эффективного алгоритма вычислительного
эксперимента, а пятый этап - в создании работоспособной
программы, реализующей этот алгоритм средствами
вычислительной техники. Для успешного проведения
четвертого этапа необходимо владеть арсеналом
современных методов вычислительной математики, а
при математическом моделировании достаточно
сложных ТО выполнение пятого этапа требует
профессиональной подготовки в области
программирования на ЭВМ.
Получаемые на шестом этапе в итоге работы
программы результаты вычислений должны прежде
всего пройти тестирование путем сопоставления с
данными количественного анализа упрощенного
варианта ММ рассматриваемого ТО. Тестирование
может выявить недочеты как в программе, так и в
алгоритме и потребовать доработки программы или
же модификации и алгоритма, и программы. Анализ
результатов вычислений и их инженерная
интерпретация могут вызвать необходимость в корректировке
PC и соответствующей ММ. После устранения всех
выявленных недочетов триаду «модель — алгоритм -
программа» можно использовать в качестве рабочего
инструмента для проведения вычислительного
эксперимента и выработки на основе получаемой
количественной информации практических рекомендаций,
направленных на совершенствование техническою
объекта, что составляет содержание седьмого,
завершающего «технологический цикл» этапа
математического моделирования
-►>
I этап 1
PC
II этап
ММ
III этап |
|
Рабочая
ММ
IV этап
'
Алгоритм
V этап
п
роп
Практические 1
рекомендации
1
Упрощенный
вариант ММ
,
i
к
VI этап
VII этап
Рис. 25.1.1
Представленная последовательность этапов
носит достаточно общий и универсальный характер,
хотя в некоторых конкретных случаях она может и
несколько видоизменяться Если при разработке ТО
можно использовать типовые PC и ММ, то отпадает
необходимость в выполнении ряда этапов, а при
наличии и соответствующего программного
комплекса процесс вычислительного эксперимента
становится в значительной степени автоматизированным.
Однако математическое моделирование ТО, не
имеющих близких прототипов, как правило, связано
с проведением всех этапов описанного
«технологического цикла».
Глава 25.2
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ТЕХНИЧЕСКОГО
ОБЪЕКТА
25.2.1. Структура математической модели.
В достаточно общем случае изучаемый технический
объект (ТО) количественно можно охарактеризовать
векторами X Е Rk , g Е Rm и J'el"
соответственно внешних, внутренних и выходных параметров.
Одни и те же физические, механические или
информационные характеристики ТО в моделях различного
уровня и содержания могут выполнять роль как
внешних или внутренних, так и выходных
параметров. При создании ТО значения выходных
параметров или диапазоны их возможного изменения
оговаривают в техническом задании на разработку объекта,
тогда как внешние параметры характеризуют условия
его функционирования.
В сравнительно простом случае
математическая модель (ММ) ТО может представлять собой
соотношение
y = f{x,g), xeRk9 gER"7, yeR",
(25.2.1)
где символом f обозначена векторная функция
950
Глава 25.2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ТЕХНИЧЕСКОГО ОБЪЕКТА
векторного аргумента (векторно-значная функция
многих переменных). Модель в виде (25.2.1)
позволяет легко вычислять выходные параметры по
задаваемым значениям внешних и внутренних параметров,
т.е. решать так называемую прямую задачу. В
инженерной практике решение прямой задачи часто
называют поверочным расчетом. При создании ТО
возникает необходимость решать более сложную, так
называемую обратную задачу: по обусловленным
техническим заданием на проектирование ТО значениям
внешних и выходных параметров находить его
внутренние параметры. В инженерной практике решению
обратной задачи соответствует так называемый
проектировочный расчет, часто имеющий целью
оптимизацию внутренних параметров по некоторому
критерию оптимальности. Однако при построении ММ ТО
функция f в (25.2.1) обычно заранее неизвестна и
ее предстоит установить. Это наиболее сложная, так
называемая задача идентификации ММ (латинскому
слову identifico — отождествляю — в данном случае
придают смысл «распознаю»).
Задача идентификации может быть решена
путем математической обработки информации о ряде
таких состояний ТО, для каждого из которых
известны (например, измерены экспериментально)
значения выходных, внутренних и внешних параметров.
Один из таких способов связан с применением
регрессионного анализа. Если информация о внутренних
параметрах отсутствует или же внутреннее устройство
ТО слишком сложно, то ММ такого объекта строят
по принципу черного ящика — устанавливают
соотношение между внешними и выходными
параметрами путем исследования реакции ТО на внешние
воздействия.
Теоретический путь построения ММ состоит в
установлении связи между у, х и g в виде
операторного уравнения
l(n(z)) = 0, (25.2.2)
где L — некоторый оператор (в общем случае
нелинейный), 0 — нулевой элемент пространства, в
котором действует этот оператор, Z — вектор независимых
переменных, в общем случае включающий время и
пространственные координаты, а и — вектор фазовых
переменных, включающий те параметры ТО, которые
характеризуют его состояние. Но даже если возможно
получить решение уравнения (25.2.2) и найти
зависимость u(z) от Z , то далеко не всегда удается
представить ММ ТО в явном относительно вектора у виде
(25.2.1). Поэтому именно (25.2.2) определяет в общем
случае структуру ММ ТО, а (25.2.1) является более
простым частным случаем такой модели.
25.2.2. Свойства математических моделей.
При изучении реально существующего или
создаваемого технического объекта (ТО) математические
методы применяют к его математической модели
(ММ). Это применение будет эффективным, если
ММ обладает определенными свойствами.
Полнота ММ позволяет отразить в достаточной
мере именно те характеристики и особенности ТО,
которые должны быть отражены при проведении
вычислительного эксперимента. Модель может
достаточно полно описывать протекающие в объекте
процессы, но не отражать его габаритные, массовые или
стоимостные показатели. Так, ММ резистора в виде
хорошо известной формулы U = IR закона Ома
обладает свойством полноты лишь с точки зрения
установления связи между падением электрического
напряжения U на резисторе, его сопротивлением R
и протекающим через него током силой / , но не
дает никакой информации о размерах, массе,
теплостойкости, стоимости и других характеристиках
резистора, по отношению к которым она не является
полной. Отметим, что в рассматриваемой ММ
сопротивление R резистора выступает в роли его
внутреннего параметра, тогда как если задано U , то /
будет выходным параметром, a U — внешним
параметром и наоборот.
Точность ММ дает возможность обеспечить
приемлемое совпадение реальных и найденных при
помощи ММ значений выходных параметров ТО,
составляющих вектор У = (У\У2—Уг~Уп) 6 ^" •
м Р
Пусть yi и у{ - найденное при помощи ММ и
реальное значения / -го выходного параметра. Тогда
относительная погрешность ММ по отношению к
этому параметру будет е,- = (у? - У^Уу? , / = 1, /I .
В качестве скалярной оценки вектора
т
е = (е^-..£/...£„) € Rn можно принять какую-
либо его норму, например,
е = /У ef или е = maxle.l.
Так как выходные параметры ТО при помощи ММ
связаны с его внешними и внутренними
параметрами, то е как количественная характеристика точности
модели этого ТО будет зависеть от координат
векторов X И g.
Свойство адекватности ММ — это способность
ММ отражать характеристики ТО с относительной
погрешностью не выше некоторого заданного
значения 8 . Пусть при некоторых ожидаемых
номинальных значениях внешних параметров ТО,
составляющих вектор хн , из условия минимума £ путем
решения задачи конечномерной оптимизации найдены
значения внутренних параметров, составляющие
вектор gH и обеспечивающие минимальное
значение £mjn относительной погрешности ММ. Тогда
при фиксированном векторе gH можно построить
множество X = \х € Ш : е < б| с R , называемое
областью адекватности данной ММ. Ясно, что
X = 0 при 8 < £,„{„ , а чем больше заданное
значение 8 > emjn , тем шире область адекватности ММ,
т.е. эта ММ применима в более широком диапазоне
возможного изменения внешних параметров ТО.
В более общем смысле под адекватностью ММ
понимают правильное качественное и достаточно
точное количественное описание именно тех
характеристик ТО, которые важны в данном конкретном
случае. Модель, адекватная по отношению к этим
характеристикам, может быть неадекватна по
отношению к другим характеристикам того же ТО.
ТЕОРЕТИЧЕСКИЕ И ЭМПИРИЧЕСКИЕ МОДЕЛИ
951
Экономичность ММ оценивают затратами на ее
реализацию вычислительных ресурсов в виде
машинного времени и памяти, которые зависят от числа
арифметических операций при использовании
модели, от размерности пространства фазовых
переменных, от особенностей применяемой ЭВМ и других
факторов. Очевидно, что требования экономичности,
высокой точности и достаточно широкой области
адекватности ММ противоречивы и на практике
могут быть удовлетворены лишь на основе разумного
компромисса. Свойство экономичности ММ часто
связывают с ее простотой. Более того,
количественный анализ некоторых упрощенных вариантов ММ
может быть осуществлен и без привлечения
современной вычислительной техники. Однако его
результаты могут иметь лишь ограниченную ценность на
стадии отладки алгоритма или ЭВМ-программы (см.
п. 25.1.3 и рис. 25.1.1), если упрощение ММ не
согласовано с расчетной схемой ТО.
25.2.3. Структурные и функциональные
модели. Различные особенности и признаки
математических моделей (ММ) лежат в основе их
типизации (или классификации). Среди таких признаков
выделяют характер отображаемых свойств
технического объекта (ТО), степень их детализации, способы
получения и представления ММ.
Один из существенных признаков
классификации связан с отражением в ММ тех или иных
особенностей ТО. Если ММ отображает устройство ТО и
связи между составляющими его элементами, то ее
называют структурной. Если же ММ отражает
происходящие в ТО физические, механические,
химические или информационные процессы, то ее относят к
функциональным. Ясно, что могут существовать и
комбинированные ММ, которые описывают как
функционирование, так и устройство ТО. Такие ММ
естественно называть структурно-функциональными
моделями.
Структурные модели делят на топологические и
геометрические, составляющие два уровня иерархии
ММ этого типа. Первые отображают состав ТО и
связи между его элементами. Топологическую ММ
целесообразно применять на начальной стадии
исследования сложного по структуре ТО, состоящего из
большого числа элементов, прежде всего для
уяснения и уточнения их взаимосвязи. Такая модель имеет
форму графов, таблиц, матриц, списков, и ее
построению обычно предшествует разработка
структурной схемы ТО.
Геометрическая модель дополнительно к
информации, представленной в топологической модели,
содержит сведения о форме и размерах ТО и его
элементах, о их взаимном расположении. В
геометрическую ММ обычно входит совокупность
уравнений линий и поверхностей и алгебрологические
соотношения, определяющие принадлежность областей
пространства телу ТО или его элементов. Такую ММ
иногда задают координатами некоторого множества
точек, по которым интерполированием можно
построить ограничивающие область линии или
поверхности. Границы области задают и кинематическим
способом: линию как траекторию движения точки, а
поверхность как результат перемещения линии.
Возможно представление формы и размеров области
совокупностью типовых фрагментов достаточно
простой конфигурации. Такой способ характерен,
например, для метода конечных элементов, широко
используемою в математическом моделировании.
Геометрические ММ находят применение при
проектировании ТО, разработке технической
документации и технологических процессов изготовления
деталей (например, на станках с числовым
программным управлением).
Функциональные ММ состоят из
соотношений, связывающих между собой фазовые переменные,
т.е. внутренние, внешние и выходные параметры ТО.
Функционирование сложных ТО нередко удается
описать лишь при помощи совокупности его реакций
на некоторые известные (или заданные) входные
воздействия (сигналы). Такую разновидность
функциональной ММ относят к типу черного ящика и
обычно называют имитационной ММ в том смысле,
что она лишь имитирует внешние проявления
функционирования ТО, не раскрывая и не описывая
существа протекающих в нем процессов.
Имитационные модели находят широкое применение в
технической кибернетике (от греческого слова KuJ3epva(o —
управляю рулем) — научном направлении,
изучающем системы управления сложными ТО.
По форме представления имитационная ММ
является примером алгоритмической модели,
поскольку связь в ней между входными и выходными
параметрами ТО удается описать лишь в форме
алгоритма, пригодного для реализации в виде ЭВМ-
программы. По этому признаку к типу
алгоритмических относят более широкий класс как
функциональных, так и структурных ММ. Если связи между
параметрами ТО можно выразить в аналитической форме,
то говорят об аналитических моделях. При
построении иерархии ММ одного и того же ТО обычно
стремятся к тому, чтобы упрощенный вариант ММ
(см. п. 25.1.3 и рис. 25.1.1) был представлен в
аналитической форме, допускающей точное решение,
которое можно было бы использовать для сравнения
при тестировании результатов, полученных при
помощи более полных и поэтому более сложных
вариантов ММ.
Ясно, что ММ конкретного ТО по форме
представления может включать признаки как
аналитической, так и алгоритмической модели. Более того, на
стадии количественного исследования достаточно
сложной аналитической ММ и проведения
вычислительного эксперимента на ее основе разрабатывают
алгоритм, который реализуют в виде ЭВМ-
программы, т.е. в процессе математического
моделирования аналитическую ММ преобразуют в
алгоритмическую ММ.
25.2.4. Теоретические и эмпирические
модели. По способу получения математические модели
(ММ) делят на теоретические и эмпирические (от
греческого слова ёцлефих — опыт). Первые получают
в результате изучения свойств технического объекта
(ТО) и протекающих в нем процессов, а вторые
являются итогом обработки результатов наблюдения
внешних проявлений этих свойств и процессов.
Одним из способов построения эмпирических ММ
является проведение экспериментальных
исследований, связанных с измерением фазовых переменных
ТО, и последующее обобщение результатов этих
измерений в алгоритмической форме или в виде
аналитических зависимостей. Поэтому эмпирическая
ММ по форме представления может содержать
признаки как алгоритмической, так и аналитической
модели. Таким образом, построение эмпирической
ММ сводится к решению задачи идентификации.
При построении теоретических ММ прежде
952
Глава 25.2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ТЕХНИЧЕСКОГО ОБЪЕКТА
всего стремятся использовать известные
фундаментальные законы сохранения таких субстанций, как
масса, электрический заряд, энергия, количество
движения и момент количества движения. Кроме
того, привлекают определяющие соотношения
(называемые также уравнениями состояния), в роли
которых могут выступать так называемые
феноменологические законы (например, уравнение Клапейрона —
Менделеева состояния совершенного газа, закон Ома
о связи силы тока в проводнике и падения
электрического напряжения, закон Гука о связи деформации
и механического напряжения в линейно упругом
материале, закон Фурье о связи градиента
температуры в теле с плотностью теплового потока и т.п.).
Сочетание теоретических соображений
качественного характера с обработкой результатов
наблюдения внешних проявлений свойств изучаемого ТО
приводит к смешанному типу ММ, называемых
полуэмпирическими. При построении таких ММ
используют основные положения теории размерностей, в
том числе так называемую 11-теорему (Пи-теорему):
имеющую физический смысл зависимость между п
параметрами, характеризующими изучаемый объект,
можно представить в виде зависимости между
п -п-k их безразмерными комбинациями, где
к - число независимых единиц измерения, через
которые можно выразить размерности этих
параметров. При этом п определяет число независимых (не
выражаемых друг через друга) безразмерных
комбинаций, обычно называемых критериями подобия.
Объекты, для которых равны значения
соответствующих критериев подобия, считают подобными.
Например, любой треугольник однозначно определен
длинами а,Ь не его сторон, т.е. /1 = 3, к = 1 .
Поэтому, согласно П-теореме, множество подобных
треугольников можно задать значениями
п = п - к = 2 критериев подобия. В качестве таких
критериев можно выбрать безразмерные отношения
длин сторон: b/а и с/о или любые два других
независимых отношения. Так как углы треугольника
однозначно связаны с отношениями сторон и
являются безразмерными величинами, то множество
подобных треугольников можно определить
равенством двух соответствующих углов или равенством угла
и отношения длин прилегающих к нему сторон. Все
перечисленные варианты соответствуют известным
признакам подобия треугольников.
Для успешного применения П-теоремы к
построению моделей ТО необходимо располагать
полным набором параметров, описывающих изучаемый
объект, причем выбор этих параметров должен
опираться на аргументированный качественный анализ
тех свойств и особенностей ТО, влияние которых
существенно в данном конкретном случае.
25.2.5. Особенности функциональных
моделей. Одной из характерных особенностей
функциональной математической модели (ММ) является
наличие или отсутствие среди ее параметров случайных
величин. При наличии таких величин ММ называют
стохастической (от греческого слова С5Т0%аОТ1я0^ —
умеющий угадывать), а при их отсутствии —
детерминированной (от латинского слова determino —
определяю).
Далеко не все параметры реальных технических
объектов (ТО) можно характеризовать вполне
определенными значениями. Поэтому ММ таких ТО, строго
говоря, следует отнести к стохастическим. Например,
если изучаемый ТО является изделием массового
производства и его внутренние параметры могут
принимать случайные значения в пределах допусков,
установленных относительно номинальных значений,
то и выходные параметры ТО будут случайными
величинами. Случайными могут быть и значения внешних
параметров при воздействии на ТО таких факторов,
как порывы ветра, турбулентные пульсации, сигналы
на фоне шума и т.п.
К анализу стохастических ММ необходимо
привлекать методы теории вероятностей, случайных
процессов и математической статистики. Однако
основная трудность их применения обычно связана с
тем, что вероятностные характеристики случайных
величин (математические ожидания, дисперсии,
законы распределения) часто неизвестны или
известны с невысокой точностью. В таких случаях
эффективнее использовать ММ, более грубую по
сравнению со стохастической, но и более устойчивую по
отношению к недостоверности исходных данных.
Если ММ описывает изменение параметров ТО
во времени, то ее относят к нестационарным (или
эволюционным) моделям. Если при этом в ММ
отражено влияние инерционных свойств ТО, то ее
обычно называют динамической. В противоположность
этому ММ, которые не учитывают изменение во
времени параметров ТО, называют статическими.
Если изменение параметров ТО происходит
столь медленно, что в рассматриваемый
фиксированный момент времени этим изменением можно
пренебречь, то говорят о квазистатической модели.
Например, в медленно протекающих механических
процессах можно пренебречь инерционными силами,
при малой скорости изменения температуры —
тепловой инерцией тела, а при медленно изменяющейся
силе тока в электрической цепи — индуктивностью
элементов этой цепи. Стационарные модели
описывают ТО, в которых протекают так называемые
установившиеся процессы, т.е. процессы, в которых
выходные параметры постоянны во времени. К
установившимся относят и периодические процессы, в
которых некоторые выходные параметры остаются
неизменными, а остальные претерпевают колебания.
Например, модель математического маятника
является стационарной по отношению к не зависящим от
времени периоду и амплитуде колебаний, хотя
материальная точка перемещается во времени
относительно положения равновесия.
Если выходные параметры ТО изменяются
медленно и в рассматриваемый фиксированный
момент времени таким изменением можно пренебречь,
то говорят о квазистационарной модели. При
описании некоторых процессов нестационарная ММ
может быть преобразована в квазистационарную
соответствующим выбором системы координат.
Например, температурное поле в свариваемых
электросваркой стальных листах в окрестности движущегося с
постоянной скоростью электрода в неподвижной
системе координат описывает нестационарная ММ, а
в подвижной системе координат, связанной с
электродом*- квазистационарная ММ.
Важным с точки зрения последующего анализа
свойством ММ является ее линейность. В линейной
модели ТО его параметры связаны линейными
соотношениями. Это означает, что при изменении
какого-либо внешнего (или внутреннего) параметра ТО
линейная модель предсказывает линейное изменение
ИЕРАРХИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ И ФОРМЫ ИХ ПРЕДСТАВЛЕНИЯ 953
зависящего от него выходного параметра, а при
изменении двух или более параметров - сложение их
влияний, т.е. такая ММ обладает свойством
суперпозиции (от латинского слова superpositio — наложение).
Если ММ не обладает свойством суперпозиции, то ее
называют нелинейной.
Для количественного анализа линейных ММ
разработано большое количество математических
методов, тогда как возможности анализа нелинейных
ММ связаны, в основном, с методами
вычислительной математики. Для применения к исследованию
нелинейной модели ТО аналитических методов ее
обычно линеаризуют, т.е. нелинейные соотношения
между параметрами заменяют приближенными
линейными и получают так называемую
линеаризованную модель рассматриваемого ТО. Так как
линеаризация связана с внесением дополнительных
погрешностей, то к результатам анализа линеаризованной
модели следует относится с определенной
осторожностью. Дело в том, что линеаризация ММ может
привести к утрате или существенному искажению
реальных свойств ТО. Учет в ММ нелинейных
эффектов особенно важен, например, при описании
смены форм движения или положений равновесия
ТО, когда малые изменения входных параметров
могут вызвать качественные изменения в его
состоянии.
Каждый параметр ТО может быть двух типов —
непрерывно изменяющийся в некотором промежутке
своих значений или принимающий только некоторые
дискретные значения. Возможна и промежуточная
ситуация, когда в какой-то области параметр
принимает все возможные значения, а в другой — только
дискретные. В связи с этим ММ ТО могут быть
непрерывными, дискретными и смешанными. В процессе
анализа ММ этих типов могут преобразованы одна в
другую, но при таком преобразовании следует
контролировать выполнение требования адекватности
модели рассматриваемому ТО.
25.2.6. Иерархия математических моделей
и формы их представления. При математическом
моделировании достаточно сложного технического
объекта (ТО) описать его поведение одной
математической моделью (ММ), как правило, не удается, а
если такая ММ и была бы построена, то она
оказалась бы слишком сложной для количественного
анализа. Поэтому к таким ТО обычно применяют
принцип декомпозиции. Он состоит в условном разбиении
ТО на отдельные более простые блоки и элементы,
допускающие их независимое исследование с
последующим учетом взаимного влияния блоков и
элементов друг на друга В свою очередь, принцип
декомпозиции можно применить и к каждому выделенному
блоку вплоть до уровня достаточно простых
элементов. В таком случае возникает иерархия ММ
связанных между собой блоков и элементов.
Иерархические уровни выделяют и для
отдельных типов ММ. Например, среди структурных моделей
ТО к более высокому уровню иерархии относят
топологические ММ, а к более низкому уровню,
характерному большей детализацией ТО — геометрические.
Среди функциональных ММ иерархические
уровни отражают степень детализации описания
процессов, протекающих в ТО, его блоках или
элементах. С этой точки зрения обычно выделяют три
основных уровня: микро-, макро- и метауровень.
Модели микроуровня описывают процессы в
системах с распределенными параметрами (в
континуальных системах), а модели макроуровня — в
системах с сосредоточенными параметрами (в дискретных
системах). В первых из них фазовые переменные могут
зависеть как от времени, так и от пространственных
координат, а во вторых — только от времени.
Если в ММ макроуровня число фазовых
переменных имеет порядок 10 ...10 , то количественный
анализ такой модели становится громоздким и
требует значительных затрат вычислительных ресурсов.
Кроме того, при столь большом числе фазовых
переменных трудно выделить существенные
характеристики ТО и особенности в его поведении. В таком
случае путем объединения и укрупнения элементов
сложного ТО стремятся уменьшить число фазовых
переменных за счет исключения из рассмотрения
внутренних параметров элементов, ограничиваясь
лишь описанием взаимных связей между
укрупненными элементами. Этот подход характерен для
моделей ме may ровня.
Модели метауровня обычно относят к высшему
уровню иерархии, макроуровня — к среднему, а
микроуровня — к низшему.
Наиболее распространенной формой
представления динамической (эволюционной) ММ микроуровня
является формулировка краевой задачи для
дифференциальных уравнений математической физики.
Такая формулировка включает дифференциальные
уравнения с частными производными и краевые
условия. В свою очередь краевые условия содержат
начальные условия — распределения искомых
фазовых переменных в некоторый момент времени,
принимаемый за начальный, в пространственной
области, конфигурация которой соответствует
рассматриваемому ТО или его элементу, и граничные условия
на границах этой области. При представлении ММ
целесообразно использовать безразмерные
переменные (независимые и искомые) и коэффициенты
уравнений, сократив число параметров,
характеризующих рассматриваемый ТО.
Модель микроуровня называют одномерной,
двухмерной или трехмерной, если искомые фазовые
переменные зависят соответственно от одной, двух
или трех пространственных координат. Два
последних типа моделей объединяют в многомерные ММ
микроуровня. Одномерная ММ микроуровня,
фазовые переменные в которой не зависят от времени,
имеет представление в виде системы обыкновенных
дифференциальных уравнений (ОДУ) с заданными
граничными условиями (в простейшем случае одного
фазового переменного такая ММ включает лишь
одно ОДУ и граничные условия).
Так как краевой задаче, содержащей
дифференциальные уравнения с частными производными и
краевые условия, можно поставить в соответствие
интегральную формулировку, то и модель
микроуровня может также быть представлена в
интегральной форме. При определенных условиях
интегральную форму краевой задачи удается привести к
вариационной формулировке в виде функционала,
который допустимо рассматривать на некотором
множестве функций, содержащем искомую функцию. В
этом случае говорят о вариационной форме модели
микроуровня. Искомая функция обращает в нуль
вариацию функционала, т.е. является его
стационарной точкой.
Построение функционала и соответствующей
ему вариационной формы модели микроуровня
обычно основано на некотором содержательном с
954
Глава 25.2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ТЕХНИЧЕСКОГО ОБЪЕКТА
физической точки зрения вариационном принципе
механики или электродинамики сплошной среды
(например, на принципе минимума потенциальной
энергии континуальной системы в положении
равновесия или на принципе минимума времени
прохождения светового луча между двумя точками оптически
неоднородной среды). В этом случае стационарная
точка функционала соответствует его экстремальному
(в частности, минимальному) значению на
допустимом множестве функций. Такая форма модели
микроуровня, называемая экстремальной вариационной,
позволяет, сравнивая значения функционала на
любых двух функциях из допустимого множества,
оценивать в интегральном смысле близость этих
функций к искомой. Это свойство экстремальной
вариационной формы модели важно при качественном
анализе ММ и при сравнении различных
приближенных решений соответствующей краевой задачи.
При выполнении некоторых ограничений
можно построить двойственную вариационную форму
модели микроуровня, включающую пару
функционалов, достигающих в одной и той же стационарной
точке равных между собой альтернативных
экстремальных значений (минимума и максимума). Такая
форма ММ дает возможность по разности значений
этих функционалов, вычисленных на некоторой
функции из допустимого множества, количественно
оценить погрешность, возникающую при выборе
этой функции в качестве искомой.
Основной формой динамической
(эволюционной) ММ макроуровня являются ОДУ или их
системы вместе с заданными начальными условиями.
Независимым переменным в таких ММ будет время,
а искомыми - фазовые переменные,
характеризующие состояние ТО (например, перемещения,
скорости и ускорения элементов механических устройств, а
также приложенные к этим элементам силы и
моменты; давление и расход жидкости или газа в
трубопроводе, напряжения и силы тока в электрических цепях
и т.п.). В некоторых случаях ММ макроуровня
удается представить в интегральной форме, используя
принцип Гамильтона — Остроградского или
экстремальный вариационный принцип Гамильтона.
Если эволюцию ТО определяет его состояние не
только в текущий момент времени / , но и в некоторый
предшествующий момент t — X , то ММ макроуровня
включает ОДУ вида и (t) = f(t,u{t),u{t - х)) или
!/'(/)= /(f,w(f),w(f-x),w'(f-х)) относительно
искомой функции u(t) . Такие ОДУ называют
уравнениями запаздывающего и нейтрального
типа соответственно и относят к дифференциально-
функциональным уравнениям (ДФУ) (или
дифференциальным уравнениям с отклоняющимся
аргументом). Наиболее широко ДФУ и их системы
представлены в ММ систем автоматического
управления и регулирования.
Запаздывающая реакция ТО на изменение
своего состояния может определяться более чем одним
интервалом времени х . Тогда ДФУ будет включать
не одно, а несколько дискретных запаздываний. В
более общем случае запаздывание может быть
непрерывным во времени, что приводит, например, для
линейной ММ к интегродифференциалыюму уравнению
(ИДУ) вида
u,(t) = JK(tiz)u{x)dx + f(t)i t>t0.
'о
Заданную функцию К (f, х) называют ядром этого
ИДУ, а про рассматриваемый ТО говорят, что он
обладает памятью, поскольку его эволюция зависит
от всей предыстории изменения состояний ТО.
Статическая модель макроуровня не включает
время. Поэтому в нее входят лишь конечное (вообще
говоря, нелинейное) уравнение или система таких
уравнений, в частном случае система линейных
алгебраических уравнений (СЛАУ). Такой же вид
имеют квазистатическая, стационарная и
квазистационарная ММ макроуровня.
Если для рассматриваемого ТО удается
выделить поддающееся количественной характеристике
некоторое важное свойство или сочетание таких
свойств (надежность, долговечность, массу,
стоимость, какой-либо из определяющих качество ТО
выходных параметров) и установить их связь с
фазовыми переменными при помощи действительной
функции, то можно говорить об оптимизации ТО по
критерию, выражаемому этой функцией. Ее называют
целевой функцией, поскольку ее значения
характеризуют меру (или степень) достижения определенной
цели совершенствования ТО в соответствии с
выбранным критерием.
Из-за ограниченности располагаемых ресурсов
в реальной ситуации имеют смысл лишь те
экстремальные значения целевой функции, которые
достигаются в области возможного изменения фазовых
переменных ТО, обычно ограниченной системой
неравенств. Эти неравенства вместе с целевой
функцией и статической моделью ТО в виде конечного
нелинейного уравнения или систем таких уравнений
входят в математическую формулировку задачи
оптимизации ТО по выбранному критерию, называемой
(в общем случае) задачей нелинейного
программирования. В частном случае линейной модели ТО в виде
СЛАУ, линейных целевой функции и неравенств
говорят о задаче линейного программирования. К
таким задачам обычно приходят при рассмотрении
проблем технико-экономического содержания. Задачу
оптимизации ТО, описываемого динамической
(эволюционной) ММ макроуровня, относят к классу
задач оптимального управления.
Для моделей метауровня характерны те же
типы уравнений, что и для моделей макроуровня, но
эти уравнения включают фазовые переменные,
описывающие состояние укрупненных элементов
сложных ТО. Если определен закон непрерывного
перехода ТО из одного состояния в другое, то для анализа
ММ метауровня часто используют аппарат
передаточных функций, а при рассмотрении состояний ТО
в дискретные моменты времени ОДУ и их системы
переходят в разностные уравнения относительно
значений фазовых переменных в эти моменты
времени. В случае дискретного множества состояний ТО
применяют также аппарат математической логики и
конечных автоматов.
В ряде случаев для сложных информационных
систем удается перейти к дискретному представлению
фазовых переменных. Тогда ММ метауровня
становится системой логических соотношений (СЛС),
МОДЕЛИ ЭЛЕКТРИЧЕСКИХ ДВУХПОЛЮСНИКОВ
955
описывающей процессы преобразования сигналов.
Использование СЛС применительно к таким
сложным ТО более экономично, чем описание изменения
в электрических цепях информационной системы
напряжений и токов как непрерывных функций
времени при помощи ОДУ или их систем. К метауровню
также относят имитационные ММ и ММ массового
обслуживания, описывающие функционирование
сложных вычислительных и информационных
систем, производственных участков, линий, цехов,
предприятий и их объединений.
Глава 25.3
ЛИНЕЙНЫЕ МОДЕЛИ
ТИПОВЫХ ЭЛЕМЕНТОВ
25.3.1. Параметры типа потенциала и
потока. При всем разнообразии технических объектов,
в которых протекают процессы различной
физической природы, обычно удается выделить отдельные
блоки, агрегаты или узлы, каждый из которых в
зависимости от переносимой и преобразуемой
физической субстанции можно рассматривать как
электрическую, механическую поступательную или
вращательную, тепловую, гидравлическую или
пневматическую систему. В общем случае эти системы
взаимосвязаны, но, используя принцип декомпозиции, их
можно представить совокупностью простейших
типовых элементов, описываемых сравнительно
несложными математическими моделями макроуровня.
Среди внешних и выходных параметров,
характеризующих состояние каждого типового элемента,
удается выделить величины, имеющие смысл
потенциалов и потоков физических субстанций (например,
разность электрических потенциалов и сила тока,
разность температур и тепловой поток и т.п.). Эти
величины называют параметрами типа потенциала и
потока соответственно. Связь между этими
параметрами устанавливают при помощи так называемых
уравнений состояния элемента, в которые входят
также и его внутренние параметры.
Несмотря на различие физических процессов,
протекающих в типовых элементах разнообразных
ТО, большинство этих элементов удается объединить
в три группы, каждую из которых удобно
охарактеризовать на примере так называемых пассивных
электрических двухполюсников: резистора, конденсатора
без потерь заряда и индуктивной катушки без
сопротивления. Резистор является характерным
представителем типового элемента, обладающего свойством
оказывать сопротивление переносу некоторой
физической субстанции (в данном случае - электрических
зарядов). Для прохождения через такой элемент
потока этой субстанции необходимо располагать
разностью потенциалов на входе и выходе из элемента.
Конденсатор обладает свойством накапливать эту
субстанцию при повышении разности потенциалов, а
индуктивная катушка - свойством инерции,
проявляющимся в стремлении сохранить поток этой
субстанции неизменным.
Среди простейших типовых элементов различных
технических устройств, в которых протекают
процессы иной физической природы по сравнению с
электрической системой, существуют элементы со
свойствами, аналогичными указанным свойствам резистора,
конденсатора и индуктивной катушки. Поэтому
целесообразно сначала рассмотреть уравнения состояния
электрических двухполюсников, а затем по аналогии
с ними строить математические модели (ММ)
типовых элементов, характерных для других технических
систем.
25.3.2. Модели электрических
двухполюсников. Для резистора (рис. 25.3.1, а) как одного из
типовых элементов электрических систем уравнением
состояния является формула
AU = IR (25.3.1)
закона Ома, где AU и / — соответственно падение
электрического напряжения (разность электрических
потенциалов) на резисторе и сила тока, R —
сопротивление резистора. Величину g = \/R называют
проводимостью резистора. Электрическая энергия,
затрачиваемая на преодоление сопротивления при
протекании через резистор тока, переходит в
тепловую энергию, причем мощность тепловыделения на
резисторе равна QR = IAU = J R = (A(J) /R =
= g(AU)2.
Электрический конденсатор (рис. 25.3.1, 6)
накапливает электрический заряд Qe пропорционально
разности потенциалов AU на его обкладках, причем
Qe =CA(J , где С - емкость конденсатора. Для
идеализированного конденсатора с постоянной
емкостью, в котором нет перетекания электрического
заряда через разделяющий обкладки диэлектрик, при
изменении Д(/ во времени t в цепи, содержащей
последовательно включенный конденсатор, протекает
ток силой / = dQe/dt, т.е.
dt
Энергия электрического поля в конденсаторе
Е, = &ДУ/2 = С(Д{/)2/2 = 0?/(2С) ■
При изменении во времени силы тока,
протекающего через индуктивную катушку (рис. 25.3.1, в),
возникает электродвижущая сила (эдс)
самоиндукции, препятствующая изменению силы тока. В случае
идеализированной (без сопротивления) катушки эту
эдс можно представить как разность потенциалов
AU = L^- (25.3.3)
at
на концах катушки, где L — ее индуктивность. При
прохождении электрического тока через катушку
каждый ее виток пронизывает некоторый магнитный
поток. Для катушки индуктивности принимают, что
этот поток одинаков для всех витков (говорят, что он
«сцеплен» с каждым витком) и равен Ч* = LI . Вели-
а) б) в)
Рис. 25.3.1
956
Глава 25.3. ЛИНЕЙНЫЕ МОДЕЛИ ТИПОВЫХ ЭЛЕМЕНТОВ
чину *Р называют потокосцеплением. Энергия
магнитного поля катушки Ет = 4*//2 = LI /2 =
= Т2/(21).
Таким образом, математической моделью
резистора является алгебраическое уравнение, а для
конденсатора и индуктивной катушки ММ имеет форму
обыкновенного дифференциального уравнения
первого порядка. Если считать, что R,C и L в
(25.3.1)-(25.3.3) не зависят от силы тока и
напряжения, то эти уравнения устанавливают линейную связь
между / и AU , что является признаком
линейности ММ.
Наряду с пассивными двухполюсниками к
типовым элементам электрических цепей относят
источники напряжения и тока, условное обозначение
которых представлено соответственно на рис. 25.3.2,
а и 25.3.2, б. Идеальный источник электрического
напряжения является двухполюсником, задающим на
своих полюсах изменение во времени / по
определенному закону AV(/) разности напряжений, не
зависящей от значения / (/) силы тока,
протекающего через него. Это означает, что такой источник
имеет столь малое внутреннее сопротивление R , что
падением / (t) R напряжения на таком
сопротивлении можно пренебречь по сравнению с AU (t) .
Наоборот, идеальный источник электрического
тока - это двухполюсник, обладающий столь большим
внутренним сопротивлением R , что изменяющаяся
по определенному закону / (/) сила проходящего
через такой источник тока не зависит от разности
AU (/) напряжений на его полюсах, т.е. величиной
AU (/) можно пренебречь по сравнению с /(/)/?.
Практически источник тока, близкий к
идеальному, можно получить последовательным
соединением источника достаточно большого напряжения и
резистора с сопротивлением, существенно
превосходящим сопротивление внешней электрической цепи
(рис. 25.3.3, а). Близким к идеальному источнику
напряжения будет двухполюсник, состоящий из
параллельно соединенных источника тока и резистора с
сопротивлением, существенно меньшим
сопротивления внешней цепи (рис 25.3.3, б).
»« а
а) б)
Рис. 25.3.2
а) б)
Рис. 25.3.3
Рассмотренные двухполюсники
идеализированы, так как при построении их ММ использованы
упрощенные расчетные схемы реальных элементов
электрических цепей. К отмеченным выше
допущениям следует добавить, что не учтена конечная
скорость распространения электрических и магнитных
полей, т.е. эти ММ являются квазистационарными.
Такое допущение не приводит к заметным
погрешностям, если наименьшая длительность 7min
протекающих в этих двухполюсниках процессов
удовлетворяет условию fmjn » /max/c » где 'max ~
наибольший линейный размер электрической цепи, а
с ~ 2,9979 • 10 м/с - скорость света в вакууме.
При выполнении этого условия можно пренебречь
влиянием на характеристики двухполюсников
волновых процессов в электрических элементах и
соединительных проводах.
25.3.3. Модели простейших элементов
механических систем. При относительном
перемещении отдельных элементов механической системы на
поверхности их контакта возникают силы трения,
препятствующие этому перемещению. Для
уменьшения сопротивления трения к поверхности контакта
подводят смазочный материал. В этом случае
скорость v скольжения одной детали относительно
другой в первом приближении пропорциональна
приложенной силе Р (рис. 25.3.4), т.е. Р = kjpSv , где
kTp — коэффициент вязкого трения, S — площадь
поверхности контакта. Если в этом случае для
механической системы в качестве параметра типа потенциала
выбрать силу Р, а в качестве параметра типа потока —
скорость v , то записанное равенство можно
рассматривать как аналог формулы (25.3.1) закона Ома
Р = kTpSv = RMv, (25.3.4.)
а величину RM
kTpS
как аналог сопротивления R
резистора.
При вращении, например, цапфы / вала 2
относительно вкладыша 3 подшипника скольжения 4
(рис. 25.3.5) вращающий момент Л/, приложенный к
валу, можно считать при вязком трении
пропорциональным угловой скорости (О. Тогда вместо (25.3.4)
следует написать
J\ Итр
Рис. 25.3.4
4
/
Ш1$Ш1
3
С'\
Рис. 25.3.5
МОДЕЛИ ПРОСТЕЙШИХ ЭЛЕМЕНТОВ МЕХАНИЧЕСКИХ СИСТЕМ
957
М :
ктрк—/«=/?>,
(25.3.5)
где d и / — диаметр и длина цапфы. В данном
случае параметром типа потенциала является М,
параметром типа потока — со, а измеряемая в Н-м-с
величина R^ = k^^nd 1/4 - аналогом
электрического сопротивления R в (25.3.1).
При движении против сил сопротивления
вязкого трения совершается работа. Мощность,
требуемая для преодоления вязкого трения при
поступательном движении, будет W1 = Pv = kTpSv = RMv2 , a
при
вращательном - WT = Mw= kipnd' /or /4 =
= /?^C0 . Эта мощность является аналогом мощности
тепловыделения на резисторе (см. п. 25.3.2).
В технических устройствах различного
назначения механическую связь между отдельными
деталями и агрегатами характеризуют жесткостью узлов
крепления, под которой понимают отношение силы,
приложенной к такому узлу, к перемещению точки
приложения этой силы. Простейшей расчетной
схемой узла крепления некоторой детали / к
неподвижному основанию 2 является пружина 3, один конец
которой присоединен к этой детали, а второй - к
основанию (рис 25.3.6). Жесткостью пружины
называют отношение с = Р/и , где Р - сила,
приложенная к пружине в точке ее присоединения к детали, а
и - перемещение этой точки в направлении действия
силы.
Изменение во времени / силы Р приведет к
изменению перемещения и. Если не учитывать силы
инерции, возникающие при перемещении витков
пружины, и принять значение с постоянным, то
после дифференцирования равенства и - Р/с по
времени получим
— = v = - — -С —
dt~V~ с' dt ~ M dt'
(25.3.6)
где V - скорость перемещения точки приложения
силы Р. В этом случае величину См = \/с ,
называемую податливостью пружины, можно рассматривать
как аналог емкости С электрического конденсатора в
(25.3.2). При растяжении или сжатии пружины она
накапливает потенциальную энергию, равную работе
силы Р на перемещении точки приложения этой
силы:
и и
Еп = | Pdu = \cudu = ^и2
2с'
2. 3
Ф
0] и и
Рис. 25.3.6
Эта энергия является аналогом энергии
электрического поля, накопленной в конденсаторе (см. п.
25.3.2). Так как v-du/dt, I =dQe/dt и скорость
V — аналог силы / электрического тока, то
перемещение // — аналог электрического заряда Qe .
Зависимость вида (25.3.6) характерна для
многих элементов, материал которых при нагружении
сохраняет свойство линейной упругости Так,
например, продольную деформацию линейно упругого
стержня с площадью поперечного сечения S при
растяжении силой Р можно считать одинаковой по
всей длине / стержня (рис 25.3.7) и равной в
соответствии с законом Гука е = а/Е = P/(ES) , где
а = P/S — механическое напряжение в поперечном
сечении стержня, Е — модуль упругости материала
стержня при растяжении (модуль Юнга). При этом
торец стержня, подверженный действию силы,
переместится относительно закрепленного торца на
расстояние и = е/ = Pl/(ES) . При сравнительно
медленном изменении во времени / силы Р,
позволяющем пренебречь силами инерции, получим
du_
dt
ES dt M dt'
где величина См = l/(ES) является аналогом
емкости С в (25.3.2).
Если один из концов упругого стержня длиной
/ с круглым поперечным сечением диаметром d
жестко закреплен, а ко второму приложен крутящий
момент Мк (рис. 25.3.8), то угол закручивания
стержня будет ф = MKl/\GJp j , где G — модуль
сдвига материала стержня,
: nd4/32
полярный момент инерции сечения стержня.
Дифференцированием по времени / находим
~di
I dMK _ „о dMK
Wp dt M~dF
wc:=i/(gjp)
Рис. 25.3.7
Рис. 25.3.8
958
Глава 25.3. ЛИНЕЙНЫЕ МОДЕЛИ ТИПОВЫХ ЭЛЕМЕНТОВ
Таким образом, при различном выполнении
упругих элементов механической системы между
скоростью перемещения (или угловой скоростью) и
скоростью изменения приложенной силы (или
крутящего момента) справедлива зависимость,
аналогичная соотношению (25.3.2) для электрического
конденсатора. Соотношение, аналогичное (25.3.3) для
индуктивной катушки, в случае поступательного
движения тела массой Ш с изменяющейся во времени
скоростью V следует непосредственно из второго
закона Ньютона в виде Р = mdv/dt = LMdv/dt, где
LM = т , т.е. масса т тела служит аналогом
индуктивности L катушки. В случае вращения тела
относительно фиксированной оси с переменной угловой
скоростью со получим М = Jd(a/dt = L°Mdv)/dt,
L° = J , где М — вращающий момент относительно
этой оси, а аналогом индуктивности является момент
инерции J тела относительно оси вращения.
Кинетическая энергия при поступательном движении
равна Ек = tnv /2 = LMv , а при вращательном —
Ек = /со /2 = LM0)2 . Величина Ек
является
аналогом энергии магнитного поля индуктивной
катушки (см. п. 25.3.2).
Количество движения (импульс) тела массой
Ш, имеющего скорость V , равно mv, а момент
количества движения (момент импульса)
вращающегося тела - «/со. Продолжая аналогию с индуктивной
катушкой, приходим к выводу, что аналогом момента
импульса при поступательном движении тела или
момента импульса при вращении тела будет потоко-
сцепление *Р = LI катушки индуктивностью L ,
через которую протекает электрический ток силой /
(см п. 5.3.2).
Аналогию между ММ типовых элементов
механических систем и электрических двухполюсников
называют электромеханической. Ее удобно
использовать при построении ММ сложных механических
систем, состоящих из большого числа
взаимодействующих между собой элементов.
25.3.4. Некоторые элементы тепловых
систем. Под тепловыми понимают технические
системы, в которых происходит накопление и перенос
тепловой энергии. Аналогами разности
электрических потенциалов (напряжений) и силы тока в
тепловой системе является разность (перепад) AT
температур и тепловой поток Q соответственно.
т
о
л
\
\j{2)
f
/S
Q
m
i г
Рис. 25.3.9
Многие элементы конструкции тепловых
систем можно свести к расчетной схеме плоской стенки
толщиной h (рис. 25.3.9). Если на поверхностях
стенки, материал которой имеет коэффициент
теплопроводности X , заданы постоянные значения 7] и
7^ температур, то при X = const установившееся
распределение температуры по толщине стенки будет
линейным: Т (z) = 7] - AT (z/h) , где
Л71 = 71|-772,а z — координата, отсчитываемая
внутрь стенки от поверхности с температурой 7] . В
этом можно убедиться, решив одномерное уравнение
Лапласа d2T(z)/dz2 = 0 , описывающее
стационарное температурное поле в плоской стенке. В
соответствии с эмпирическим законом Фурье тепловой
поток, проходящий через стенку с площадью S
одной из ее поверхностей, будет Q = (X/h)SAT .
Отсюда следует зависимость
AT = Q = £?/£,, (25.3.7)
А, о
аналогичная закону Ома (25.3.1). Величину
Я, = h/(XS) в (25.3.7) называют термическим
сопротивлением плоской стенки.
Если стенка состоит из нескольких плоских
слоев, то при заданных температурах на внешних
поверхностях стенки /^ в (25.3.7) следует
рассматривать как суммарное термическое сопротивление,
равное сумме термических сопротивлений всех слоев.
При неидеальном тепловом контакте между слоями в
эту сумму должны войти контактные термические
сопротивления.
Если некоторая деталь или конструкция
выполнены из материала с высокой теплопроводностью,
то их температура достаточно быстро выравнивается
во всех направлениях и ее можно приближенно
считать не зависящей от пространственных координат. В
этом случае тепловое состояние детали или
конструкции в любой текущий момент времени /
допустимо характеризовать лишь одним значением
температуры Т , однородным по занимаемому ими объему
V. Такое приближение соответствует расчетной схеме
высокотеплопроводного тела с однородной по его
объему температурой и тепловой энергией
Т
UB = jdV(M)jc(T,M)dT1
V О
где с(7\ Л/) — удельная объемная теплоемкость
материала, зависящая в общем случае от температуры
Т и координат точки М е V (когда конструкция
выполнена из различных материалов). При
изменении температуры Т во времени / тепловая энергия
тела постоянной конфигурации изменяется со
скоростью
МОДЕЛИ ЭЛЕМЕНТОВ ГИДРАВЛИЧЕСКИХ СИСТЕМ
959
dt
\с{Т,М)
\
dV
EL
dt '
Из закона сохранения энергии следует, что тепловая
энергия тела может изменяться лишь за счет подвода
к телу (или отвода от него) теплового потока Q (/) :
Ст^ = 0С). CT=fc(T,M)dV,
что аналогично зависимости (25.3.2) для
электрического конденсатора. Величину Ст , аналогичную
емкости С электрического конденсатора, называют
полной теплоемкостью тела.
Установленную аналогию между ММ
элементов тепловых систем и электрических двухполюсников
принято называть электротепловой. Эта аналогия
позволяет для сложной тепловой системы построить
эквивалентную схему в виде электрической цепи,
состоящей из таких двухполюсников, а затем
использовать хорошо разработанные и формализованные
приемы получения ММ электрических цепей для
построения ММ рассматриваемой тепловой системы.
25.3.5. Модели элементов гидравлических
систем. В гидравлической системе разности
электрических потенциалов (напряжений) и силе тока
соответствуют разность (перепад) Ар давлений и
объемный расход @ж жидкости соответственно. Для
участка достаточно длинного трубопровода с
круговым поперечным сечением радиусом /; при
установившемся ламинарном течении вязкой жидкости
справедлива следующая зависимость скорости V.
вдоль оси трубопровода от радиальной координаты
/ч г.2"'2
где TJ > О - коэффициент сдвиговой вязкости
жидкости, Ар = Р\ - Pi > О — перепад давления,
приходящийся на участок трубопровода длиной / .
Величину Rr = 8г|//( л/; ] можно рассматривать как
гидравлическое сопротивление участка трубопровода
длиной / , записав аналогично закону Ома в виде
(25.3.1) Ар = 0ЖЯГ , поскольку
/;
QyK=J2Krv.(r)dr =
о
2n/ J V / 8п/
Если поперечное сечение трубопровода не
является круглым, то выражение для Rr будет зависеть от
формы этого сечения. При увеличении объемного
расхода жидкости через трубопровод растет ее
скорость, и ламинарный режим течения переходит в
турбулентный, a Rr становится функцией 0Ж, т.е.
математическая модель (ММ) установившегося течения в
трубопроводе оказывается нелинейной.
Если при сравнительно медленном заполнении
(или опорожнении) сосуда пренебречь динамическим
давлением pv /2 , где р — плотность жидкости, то
статическое давление р на входе трубопровода в сосуд
Р = А) + PgH > гдс Ро ~ Давление над зеркалом
жидкости (для сосуда, сообщающегося с
атмосферой, оно равно атмосферному давлению), g = 9,81
м/с2 - ускорение свободного падения, Н - высота
уровня жидкости в сосуде (рис. 25.3.10). Изменение
во времени / уровня жидкости и разности
Ар = р - Pq давлений связаны между собой
зависимостью dAp/dt = pgdH/dt. Тогда для объемного
расхода жидкости через трубопровод,
положительного при заполнении сосуда, можно записать
ndH S dAp „ dAp
Qy.=S = — = С. —*-, (25.3.8)
dt pg dt dt
где Cr = *S/(pg) - величина, аналогичная емкости
С электрического конденсатора в (25.3.2). Таким
образом, аналогом конденсатора для гидравлической
системы будет сосуд с жидкостью, подводимой или
отводимой через трубопровод, присоединенный ко
дну сосуда.
Элементом гидравлической системы,
аналогичным идеализированной (без сопротивления)
индуктивной катушке, является участок горизонтального
цилиндрического трубопровода длиной / , по
которому течет с переменным во времени объемным
расходом бж (f) идеальная (невязкая) несжимаемая
жидкость плотностью р . Пусть S — площадь
поперечного сечения трубопровода. Тогда в момент
времени / на рассматриваемом участке трубопровода
будет находиться масса тж = pSl жидкости,
движущаяся со скоростью v(t) = бж (t)/S . При пере-
2ц/
8л/
.X.
Р
Н
.Q
Рис. 25.3.10
960
Глава 25.3. ЛИНЕЙНЫЕ МОДЕЛИ ТИПОВЫХ ЭЛЕМЕНТОВ
менном объемном расходе за счет ускорения этой
массы возникнет сила инерции F = т^ dv {t)/dt =
= pldQ^ (t)/dt. Так как жидкость идеальная, то
гидравлическое сопротивление при ее течении
отсутствует, и сила инерции уравновешена лишь
разностью (/?i - p2)S сил давления в поперечных
сечениях трубопровода. Следовательно,
F р/ </<2ж , dQ^
&Р = Р\-Р2= — = - ~ = Lt >
1 2 S S dt г dt
где Lp = pl/S — величина, которую можно назвать
гидравлической индуктивностью участка
трубопровода. Она аналогична индуктивности L катушки в
(25.3.3).
Аналогию между ММ типовых элементов
гидравлической системы и электрических
двухполюсников называют электрогидравлической. Она дает
возможность в случае сложной гидравлической системы
построить ее эквивалентную схему в виде
электрической цепи, объединяющей такие двухполюсники.
25.3.6. Особенности элементов
пневматических систем. В широком смысле под
пневматическими понимают технические системы, в которых
рабочей средой является воздух или газ. Основное
отличие пневматической системы от гидравлической
состоит в том, что рабочая среда является сжимаемой,
т.е. ее плотность р существенно зависит от давления
р. Газ называют совершенным, если для него
справедливо уравнение Клапейрона-Менделеева р = pRT , где
Т — температура газа, a R — удельная газовая
постоянная для данного газа. В пневматической системе (как
и в гидравлической) параметром типа потенциала
является разность (перепад) Ар давлений. Однако в
качестве параметра типа потока вместо объемного
расхода удобнее рассматривать расход т массы газа.
Пусть в сосуде с фиксированным объемом V
находится газ с температурой Т и давлением р. Если
этот газ допустимо считать совершенным, то его
плотность р = /?/(/?Г) , а масса
m = pV = pV/(RT) . Предположим, что масса газа
в сосуде изменяется во времени / путем закачки
или выпуска газа при условии Т = Tq = const .
Тогда получим соотношение
. _ dm _ V dp щ dp _ dp
dt ~ RT0 dt ~ p0 dt ~ n dt'
аналогичное (25.3.2), причем величину
Сп = V/(RT0) = щ\Pq , где щ и р0 - масса газа
и давление в сосуде перед началом процесса закачки
или выпуска, можно считать аналогом емкости С
электрического конденсатора.
Условие Т = TQ = const соответствует
изотермическому процессу закачки или выпуска газа, и оно
выполнимо лишь при весьма интенсивном
теплообмене газа со стенками сосуда, которые
поддерживаются при этой постоянной температуре Т0 В общем
случае необходимо учитывать конкретный
термодинамический процесс, протекающий при закачке или
выпуске газа.
С увеличением давления р ММ совершенного
газа становится неадекватной по отношению к
реальному газу. Дело в том, что эта ММ не учитывает
объема, занимаемого молекулами газа, и притяжения
между ними. Влияние указанных факторов отражает,
например, уравнение Ва н-дер-Ваал ьса состояния
реального газа
a RT pRT 2
р + — = -, или р = - —-ар.
vl v - b 1 - bp
При постоянной температуре и р —> °° отсюда
следует, что р -> \/b, т.е. b можно интерпретировать
как объем, занимаемый собственно молекулами 1 кг
реального газа, а второй член в правой части,
содержащий параметр а, учитывает влияние притяжения
между молекулами такого газа. Существуют и другие
варианты уравнений состояния реального газа.
При установившемся ламинарном течении по
трубопроводу вязкого газа с постоянным расходом
th линейное соотношение Ар = thRn , аналогичное
закону Ома в виде (25.3.1), можно считать
справедливым лишь при условии, что изменение давления по
длине / трубопровода вызывает пренебрежимо
малое изменение плотности р газа. В этом случае
допустимо принять р = const, что означает
постоянство объемного расхода газа QT - th/p и
сопротивления Rn трубопровода
В достаточно длинном трубопроводе изменение
давления газа может оказаться существенным, что
вызовет заметное изменение плотности газа. В
результате при постоянном расходе m массы газа его
объемный расход по длине трубопровода будет
переменным. В этом случае длинный трубопровод можно
условно разбить на ряд более коротких участков так,
чтобы в пределах каждого из них плотность газа
допустимо было бы считать постоянной. При этом
следует учитывать, что плотность газа в соответствии
с уравнением состояния является функцией не
только давления, но и температуры газа, изменяющейся
по длине трубопровода в зависимости от характера
протекающего в газе термодинамического процесса и
теплового взаимодействия газа со стенками
трубопровода. Как и в случае несжимаемой жидкости (см.
п. 5.3.5) при турбулентном режиме течения газа
зависимость сопротивления /?п трубопровода от расхода
становится нелинейной.
Если для идеального (невязкого) газа,
движущегося с изменяющейся во времени / скоростью
v (f), пренебречь изменением его плотности р по
длине / участка трубопровода с площадью S
поперечного сечения, то в соответствии со вторым зако-
ДУАЛЬНОСТЬ ЭЛЕКТРИЧЕСКИХ ЦЕПЕЙ
961
ном Ньютона SAp = $Sldv(t)jdt , или
Ар = Lndm/dt , где Ln = l/S - величина,
аналогичная индуктивности L катушки в (25.3.3). Учет
изменения плотности по длине трубопровода
приведет к более сложной зависимости перепада Ар
давления от скорости изменения расхода т газа.
Глава 25.4
МОДЕЛИ СИСТЕМ
ИЗ ТИПОВЫХ ЭЛЕМЕНТОВ
25.4.1. Эквивалентная схема технической
системы. При математическом моделировании
технического устройства, в котором протекают процессы
различной физической природы, прежде всего
необходимо для каждого из таких процессов выделить
типовые элементы (см. гл. 25.3), образующие
однородную по физическим свойствам систему:
электрическую, механическую, тепловую, гидравлическую и
т.п. Взаимодействие элементов в каждой из систем
должно быть отражено в ее расчетной схеме.
При переходе от расчетной схемы сложной
системы, состоящей из большого числа
взаимосвязанных между собой типовых элементов, к ее
математической модели (ММ) макроуровня удобно
оперировать эквивалентной схемой, основанной на
аналогиях между ММ элементов, в которых протекают
различные физические процессы, и представляющей
структурную ММ рассматриваемой системы. При
этом предпочтительнее привлекать аналогии между
электрической системой и другими физическими
системами и представлять эквивалентную схему в
виде цепи, объединяющей электрические
двухполюсники. Эти аналогии позволяют при получении ММ
механических, тепловых, гидравлических и
пневматических систем применять достаточно универсальные
приемы построения ММ электрических систем,
формализованные с использованием законов Кирхгофа и
ориентированных графов. Так как ММ макроуровня
типовых элементов различных физических систем
совпадают по форме с ММ электрических
двухполюсников, то при построении эквивалентных схем
обычно используют обозначения, характерные для
электрических систем.
25.4.2. Дуальность электрических цепей.
При построении ММ электрической системы
объединяют ММ входящих в эту систему типовых
элементов: резисторов, конденсаторов и индуктивных
катушек. Такое объединение проводят, применяя к
эквивалентной схеме законы Кирхгофа. Первый из них
устанавливает равенство нулю алгебраической суммы
мгновенных значений силы тока во всех ветвях
электрической цепи, имеющих общий узел, а второй —
равенство нулю алгебраической суммы мгновенных
значений падений напряжения при обходе любого
замкнутого контура электрической цепи в любом
направлении. Например, электрическая цепь,
включающая источник, задающий переменное (в общем
случае) во времени / напряжение Д(/ (/),
резистор сопротивлением R , конденсатор емкостью С и
катушку индуктивностью L (рис. 25.4.1, а) состоит
из одного замкнутого контура и четырех ветвей, в
каждую из которых включен один из указанных
электрических двухполюсников. Применяя к каждому
из узлов этой цепи первый закон Кирхгофа,
получаем, что в любой момент времени t сила /
электрического тока во всех ветвях одинакова. Для падений
напряжения на пассивных двухполюсниках имеем
(см. п. 25.3.2)
AUR = /Я, AUC = - f /dt, AU, = L —
к L С J L dt
'o
(25.4.1)
где /0 — некоторый момент времени, принятый за
начальный. При обходе замкнутого контура по ходу
часовой стрелки в соответствии со вторым законом
Кирхгофа находим -AU* (/) + AUR + AfJc + AUL = О ,
или с учетом (25.4.1)
dl
R/ +-{ Idt+ L— = AU*(t). (25.4.2)
С J dt w
dt
Для электрической цепи, включающей наряду
с пассивными двухполюсниками источник, задающий
по определенному закону / (/) силу тока (рис.
25.4.1, б), из второго закона Кирхгофа следует, что
падение напряжения Ail(/) в каждой из ветвей
этой цепи в любой фиксированный момент времени
/ одинаково. Для токов в ветвях, содержащих
пассивные двухполюсники, запишем (см. п. 25.3.2):
IR=gAU, /C=C
AU
dt
1,
JAUdt,
'о
(25.4.3)
проводимость резистора сопротивле-
где g = \/Я
нием R . Все ветви этой цепи сходятся в два узла.
Применяя первый закон Кирхгофа к одному из узлов
(например, к узлу А), получим
Ig + Ic + 1L - Г (/) = 0, или, учитывая (25.4.3),
- - dAU
gAU + C + ^
dt L
7
AUdt = I*(t).
'о
(25.4.4)
Таким образом, MM рассмотренных
электрических цепей включают идентичные по форме уравнения
(25.4.2) и (25.4.4), содержащие (помимо времени t )
различные величины. Соответствие между этими
величинами можно представить в следующем виде:
-Т^А
AUU)
Рис. 25.4.1
31 — 7706
962
Глава 25.4. МОДЕЛИ СИСТЕМ ИЗ ТИПОВЫХ ЭЛЕМЕНТОВ
/
Ьи
L
С
R
&
С
L
AUR
h
AUC
h
AUL
h
ALT' (0
'*(')
Две электрические цепи, MM которых
удовлетворяют указанному соответствию величин, принято
называть дуальными. При этом зависимости (25.4.1)
для падений напряжений на пассивных
двухполюсниках в одной цепи аналогичны зависимостям
(25.4.3) для токов, протекающих через такие
двухполюсники в дуальной цепи, и наоборот. Если связь
между законами изменения напряжения и силы тока
источников в дуальных цепях подчиняется
зависимости A U (/) = RqI (f) , где Rq — коэффициент
пропорциональности, имеющий размерность
сопротивления, то из сопоставления (25.4.1), (25.4.2) и
(25.4.3), (25.4.4) можно установить, что AU/I =
= MJRjig = AUc/h = aUl/Ic = Яо при вы-
полнении условий R/g = L/C = L/C = J$.
При преобразовании электрической цепи в
дуальную число узлов дуальной цепи на единицу
превосходит число простых замкнутых контуров
исходной цепи (к простым относят такие замкнутые
контуры, внутренняя линия обхода которых не
пересекает ветвей цепи). Проверкой правильности
преобразования цепи в дуальную служит получение исходной
цепи путем построения дуальной цепи по отношению
к дуальной. Дуальность электрических цепей
позволяет расширить возможности построения н
преобразования эквивалентных схем применительно к
различным физическим системам (прежде всего
применительно к механическим системам).
25.4.3. Двойственность
электромеханической аналогам. При построении математических
моделей (ММ) макроуровня сравнительно простых
механических систем, состоящих из небольшого
количества типовых элементов, обычно используют
непосредственно основные законы механики. Но для
более сложной механической системы, включающей
большое число взаимодействующих между собой
элементов, удобнее, используя электромеханическую
аналогию, предварительно составить эквивалентную
схему, соответствующую расчетной схеме этой
системы. Тогда при переходе от эквивалентной схемы к
ММ можно применить приемы, разработанные и
формализованные для электрических цепей.
Установленный в п. 25.3.3 на основе
идентичности ММ типовых элементов механической системы
и электрических двухполюсников вариант
электромеханической аналогии не является единственным, так
как каждой из дуальных электрических цепей можно
поставить в соответствие свой вариант такой
аналогии. В связи с этим допустимо говорить о
двойственности электромеханической аналогии.
Для механической системы, включающей тело
1 массой т, движущееся поступательно по
горизонтальной плоскости и связанное с неподвижной
опорой 2 пружиной 3 жесткостью с (рис. 25.4.2),
эквивалентными схемами могут быть обе дуальные цепи,
представленные на рис. 25.4.1, а и 25.4.1, б.
Действительно, в соответствии со вторым законом Ньютона
запишем
m— = P*(t)- kipSv - си, (25.4.5)
где и — перемещение тела относительно положения
равновесия, v = du/dt — скорость тела, Р* (/) -
внешняя сила, приложенная к телу и изменяющаяся
(в общем случае) во времени t , kjp -
коэффициент вязкого трения при движении тела по
горизонтальной плоскости, S - площадь поверхности
контакта тела с этой плоскостью. Используя введенные в
п. 25.3.3 обозначения RM = kipS, См = \/с и
LM - т , представим (25.4.5) в виде
RMv + —[vdt+LM — = P*(t),
м 'о
(25.4.6)
где /0 - некоторый момент времени, принятый за
начальный. Отметим, что при Р (/) = 0 и klp = 0
(25.4.5) описывает колебания гармонического
осциллятора.
Из сравнения (25.4.6) с (25.4.2) следует, что
ММ рассматриваемой механической системы и
электрической цепи, изображенной на рис. 25.4.1, а,
идентичны при выборе в механической системе силы
в качестве параметра типа потенциала, аналогичного
падению электрического напряжения, и скорости в
качестве параметра типа потока, аналогичного силе
электрического тока. Этот выбор, сделанный в п.
25.3.3, определяет вариант I электромеханической
аналогии. Но если в механической системе
параметром типа потенциала считать скорость, а параметром
типа потока - силу, то ММ этой системы в виде
(25.4.6) будет идентична ММ электрической цепи,
представленной на рис. 25.4.1, б. В самом деле,
полагая gM= RM= klpS , LM=CM= \/c и
См = LM =m, вместо (25.4.6) получаем
gMv + T-\vdt + CM — = P (/),
A*; dt
что с точностью до обозначений совпадает с (25.4.4)
и определяет вариант II электромеханической
аналогии (табл. 25.4.1).
2 3 1
т v
рш
«тр
Рис. 25.4.2
ЭКВИВАЛЕНТНАЯ СХЕМА МЕХАНИЧЕСКОЙ СИСТЕМЫ
963
25.4.1. Электромеханическая аналогия
Механическая
система
Сила
Скорость
Вязкое трение
Податливость
Масса
Перемещение
Импульс
Электрическая система
I вариант
Напряжение
Сила тока
Сопротивление
Емкость
Индуктивность
Заряд
Потокосцепление
11 вариант
Сила тока
Напряжение
Проводимость
Индуктивность
Емкость
Потокосцепление
Заряд
Энергия
потенциальная
кинетическая
электрическая
магнитная
магнитная
электрическая
Мощность
вязкого трения
тепловыделения в резисторе
Применение второго варианта
электромеханической аналогии удобнее при построении
эквивалентной схемы механической системы, поскольку для
этого варианта получают естественное механическое
толкование законы Кирхгофа, используемые затем при
переходе от эквивалентной схемы к ММ системы. В
случае поступательного движения механической
системы первый закон Кирхгофа будет аналогом
уравнения равновесия всех сил (включая
инерционные), действующих на рассматриваемый узел
эквивалентный схемы, а второй - аналогом правила
сложения скоростей при обходе контура этой схемы. При
пространственном движении механической системы
силы и скорости являются векторными величинами.
Поэтому равенства, следующие из законов Кирхгофа,
должны быть выполнены для проекций этих величин
на каждую из координатных осей.
25.4.4. Эквивалентная схема
механической системы. Приведем пример эквивалентной
схемы и математической модели (ММ) для
движущейся поступательно механической системы (рис.
25.4.3), состоящей из автомобиля массой П2[ с
грузом массы ffl2 и прицепа массой 171-$ , на котором
находится груз массой Щ . Грузы закреплены при
помощи упругих элементов податливости
соответственно 1/С| и I/O} , а сцепка между автомобилем и
прицепом имеет податливость I/cq . При движении
автомобиля и прицепа возникают силы
сопротивления, пропорциональные значениям V\ и 1)^ их
ШАт2\Щ с0 УЩ т4 ША
<9^Ъ
<г
\тъ
скорости, причем коэффициенты
пропорциональности равны соответственно ку и &3 . Силы трения
между грузами и кузовами автомобиля и прицепа
пропорциональны значениям Av2 - v2 - Щ и
А^4 = v4 ~ v3 скорости перемещения грузов
относительно этих кузовов (коэффициенты
пропорциональности равны соответственно к2 и к4 ).
Зависимость Р (/) силы тяги автомобиля от времени t
является заданной.
Для построения эквивалентной схемы
используем вариант II электромеханической аналогии.
Аналогом скорости Vj (/ = 1,4) каждой из четырех масс
механической системы относительно дороги будет
электрическое напряжение Uх в одном из четырех
узлов электрической цепи (рис. 25.4.4),
отсчитываемое от напряжения £/5 = О в узле 5, принятого за
нуль отсчета.
Из второго закона Ньютона для центра масс
автомобиля получим уравнение
t t
+c0j(vl-v3)dt + 2c2j(v]-v2)dt = P*(t),
'o
'0
где /q — момент времени, принимаемый за
начальный. Слагаемым в левой части этого уравнения на
эквивалентной схеме (см. рис. 25.4.4) соответствуют
пять ветвей, сходящихся в узел / и содержащих
конденсатор емкостью С| , резисторы проводимостью
#1 , g2 и катушки индуктивностью Z^,Z^, а
правой части — ветвь с источником, задающим ток силой
/* (t) . Для центра масс груза в кузове автомобиля
имеем
Щ-^- + Ь2 (v2 -vl) + 2c2j(v2 - vx)dt = 0.
'о
Первому слагаемому в левой части этого равенства
отвечает на рис. 25.4.4 ветвь, содержащая
конденсатор емкостью С2. Остальные ветви эквивалентной
схемы построены аналогично, но с использованием
уравнений
Рис. 25.4.3
Рис. 25.4.4
3\*
964
Глава 25.4. МОДЕЛИ СИСТЕМ ИЗ ТИПОВЫХ ЭЛЕМЕНТОВ
m3-^- + k3v3+k4(v3-v4) +
at
i t
+c0j(v3 - vx)dt + 2c4j(v3 - v4)dt = 0,
dv2 i (
m4-£+k4{v4
v3) + 2c4 j (v4 - v3) dt = 0
второго закона Ньютона для центров масс прицепа и
находящегося на нем груза.
Электромеханическая аналогия применима при
построении эквивалентных схем и ММ механических
систем с вращательным движением. Если
использовать вариант II этой аналогии, то на основании табл.
25.4.2 силе тока будет соответствовать вращающий
момент, напряжению - угловая скорость,
проводимости резистора — коэффициент вязкого трения,
емкости конденсатора — момент инерции, а
индуктивности катушки — податливость упругой связи при
вращении. Используя электротепловую или
электрогидравлическую аналогию можно построить
эквивалентную схему и ММ соответственно для тепловой
или гидравлической системы.
25.4.5. Формализация построения модели
СЛОЖНОЙ системы. Математическую модель (ММ)
технической системы, состоящей из небольшого числа
типовых элементов, нетрудно построить на основе
эквивалентной схемы этой системы путем
непосредственного применения к такой схеме законов Кирхгофа
(см. п. 25.4.4). Для сложной системы, состоящей из
большого числа элементов, удобно от эквивалентной
схемы перейти к связному ориентированному графу (или
орграфу). При этом узлы эквивалентной схемы
соответствуют вершинам графа, а ее ветви — его ребрам.
На первом этапе каждой ветви эквивалентной
схемы необходимо дать произвольное, но вполне
определенное направление. Так, для эквивалентной схемы
(см. рис. 25.4.4) возможен выбор направлений,
указанных стрелками на рис. 25.4.5. Соответствующий
связный орграф изображен на рис. 25.4.6, причем номера
вершин совпадают с номерами узлов исходной
эквивалентной схемы, а обозначения дуг орграфа — с
обозначением типовых элементов в ее ветвях.
Орграф, соответствующий эквивалентной схеме
технической системы и представленный в виде
рисунка, является удобным и наглядным средством
визуализации связей между элементами этой
системы. Но для отражения этих связей в алгоритме
построения модели системы необходимо перейти к
формализованному представлению орграфа в виде
матрицы инциденций А* размера пх т, где п —
число вершин орграфа, т - число его дуг. Элементы
этой матрицы имеют следующие значения:
f 1, еслиу'-я дуга выходит из /-й вершины;
-1, еслиу'-я дуга входит в /-ю вершину;
[ 0, если /-я вершина не является концом у-й дуги
Рис. 25.4.5
/
fit)
L_£
-" Lo
-— £
с,
1
9\
** з
2
С?
1
-— Я
ч^
са
\
9з
Рис. 25.4.6
Для орграфа, изображенного на рис. 25.4.6, элементы
матрицы инциденций представлены в табл. 25.4.2.
В каждом столбце матрицы инциденций Д,
два ненулевых элемента, в сумме равные нулю,
поскольку каждая дуга орграфа связывает две вершины,
причем из одной вершины она выходит, а в другую
входит. Таким образом, строки матрицы Д.
являются линейно зависимыми, т.е. ее ранг не превышает
п - 1 . Но он и не меньше п - 1 , так как в
противном случае если сумма каких-либо п - 1 или
меньшего числа строк содержит только нулевые
элементы, то это означает, что вершины, соответствующие
этим строкам, не связаны дугами с остальными
вершинами.
Пусть / — матрица-столбец размера т х 1 ,
элементами которой являются значения силы электрического
тока в ветвях эквивалентной схемы (положительные
значения соответствуют выбранным направлениям дуг орграфа).
25.4.2. Матрица инциденций
Номера
вершин
1
2
3
4
5
Обозначения дуг
'*(')
-!
0
0
0
1
с,
1
0
0
0
-1
8\
1
0
0
0
-1
82
1
-1
0
0
0
А)
1
0
-1
0
0
к
1
-1
0
0
0
с2
0
1
0
0
-1
С3
0
0
1
0
-1
8з
0
0
1
0
-1
84
0
0
1
-1
0
L4
0
0
1
-1
0
Q
0
0
0
1
-1
НЕКОТОРЫЕ ПРИЧИНЫ ВОЗНИКНОВЕНИЯ НЕЛИНЕЙНОСТЕЙ
965
-1 1 1
0 0 0
0 0 0
0 0 0
1
-1
0
0
1
0
-1
0
10 0 0 0
-110 0 0
0 0 111
0 0 0 0-1
о о")
0 0
1 0
-1 1-
Тогда получим систему п уравнений Д/ = 0Ш , где
0т е Ш — нулевой вектор, каждое из которых
устанавливает равенство нулю алгебраической суммы
токов во всех ветвях, имеющих общий узел, т.е.
выражает первый закон Кирхгофа. Из этих уравнений
п - I являются независимыми. Поэтому одну из
строк в матрице инциденций орграфа можно
вычеркнуть. Обычно вычеркивают строку, содержащую
наибольшее число ненулевых элементов. Такая
строка соответствует вершине, являющейся общей для
наибольшего числа дуг. В результате получают новую
матрицу А размера (л - 1)х т , причем
Rg/4 = п - 1. Для матрицы инциденций орграфа,
изображенного на рис. 25.4.6, целесообразно
вычеркнуть пятую строку (см. табл. 25.4.2), так что новая
матрица примет вид
/
А =
J
Если ММ модели типовых элементов
рассматриваемой технической системы явно разрешены
относительно параметра типа потока, то ММ этой
системы являются п - I уравнений AI = 0/л
относительно П - 1 параметров типа потенциала в узлах
эквивалентной схемы, отсчитываемых от
принимаемого за нуль значения параметра в узле, который
соответствует строке, вычеркнутой из матрицы
инциденций Д. . Несложно проверить, что для
представленной на рис. 25.4.5 эквивалентной схемы эти
уравнения совпадут с полученными в 25.4.4.
Использование орграфа, соответствующего
эквивалентной схеме технической системы, возможно и
в более общем случае, когда ММ элементов этой
системы не разрешены явно относительно
параметров типа потока. В этом случае орграф путем
удаления некоторых дуг необходимо предварительно
преобразовать в остовпое дерево.
Глава 25.5
НЕЛИНЕЙНЫЕ МОДЕЛИ МАКРОУРОВНЯ
25.5.1. Некоторые причины возникновения
нелинейностей. Достаточно полные и адекватные
реальным техническим объектам (ТО)
математические модели (ММ) обычно оказываются нелинейными.
Количественный анализ нелинейных ММ
существенно сложнее по сравнению с линейными и часто
требует применения численных методов и
вычислительной техники. Вместе с тем полезной является и
информация качественного характера о поведении
нелинейной ММ, позволяющая получить
предварительное представление об ожидаемых результатах
более детального количественного анализа.
Среди причин, приводящих к необходимости
рассматривать нелинейные ММ ТО, одной из
основных является непосредственная зависимость
значений внутренних параметров ТО от их внешних и
выходных параметров. Так, сопротивление R резистора
в выражении (25.3.1) для закона Ома при высокой
частоте переменного тока является функцией силы
/ тока. Связь между векторами электрической поля-
ризованности и напряженности Е электрического
поля для большинства диэлектриков остается
линейной лишь при ограниченных значениях \Е\ , а с
увеличением \Е\ происходит насыщение процесса
поляризации диэлектрика. Это приводит к тому, что
при использовании диэлектрика в электрическом
конденсаторе связь между зарядом Qe и разностью
AU потенциалов на обкладках конденсатора при
достаточно высоких значениях \AU\ оказывается
нелинейной, а в (25.3.2) емкость С электрического
конденсатора становится функцией A U или Qe.
Аналогичная ситуация возникает для зависимости
вектора намагниченности ферромагнетиков от
вектора напряженности магнитного поля. Поэтому связь
потокосцепления и силы / тока для индуктивной
катушки, намотанной на железный сердечник, при
достаточно высоких значениях |/| становится
нелинейной, а в (25.3.3) значение L индуктивности такой
катушки — зависящей от / . Помимо перечисленных
электрических двухполюсников в современных
электрических системах используют различные элементы с
существенно нелинейными характеристиками.
Принято считать, что при малых отклонениях
механической системы от положения равновесия
соотношения между перемещениями или скоростями
ее элементов и возникающими в ней силами
линейны, что позволяет рассматривать линейные ММ.
Однако часто встречаются ситуации, когда даже при
малых перемещениях нелинейность оказывается
существенной. Пусть твердое тело, упруго связанное
при помощи пружины жесткостью С с неподвижной
шарнирной опорой, может перемещаться по
горизонтальной плоскости (рис. 25.5.1). В вертикальном
положении пружина имеет длину /0 и находится в
свободном состоянии. При перемещении // тела
относительно вертикали, проходящей через опору,
длина пружины принимает значение / = -у/д + м ,
а сила натяжения пружины -
с(1 - I0) = cUIq + и2 - /0 I. При этом сила
Р = си U/q + и2 - /0 )/Фо + и2 * стремящаяся
U
Рис. 25.5.1
966
Глава 25.5. НЕЛИНЕЙНЫЕ МОДЕЛИ МАКРОУРОВНЯ
возвратить тело в первоначальное положение,
нелинейно зависит от перемещения, несмотря на то, что
пружина является линейно упругим элементом.
Отметим, что даже при весьма малом перемещении
u-^Iq, используя представление l/^+w ~
- l/(/0 + и2/(2/0 )) - (l - И2/(2/02 ))//0 , получим
нелинейную зависимость
( Л 3
Возникающие в механических системах силы
трения между твердыми поверхностями различным
образом зависят от скорости относительного
перемещения этих поверхностей. Рассмотренной в п. 25.3.3
линейной зависимости от скорости V силы
сопротивления соответствует случай сравнительно
медленного относительного перемещения поверхностей,
разделенных слоем смазки (жидкостной или газовой).
С увеличением V эта зависимость становится
нелинейной. Если слой смазки между поверхностями
отсутствует, то при v = О эта зависимость обычно
терпит разрыв.
Другая причина, приводящая к нелинейным
ММ механических систем, вызвана нелинейными
свойствами элементов этих систем. Например, сила Р
сжатия витой конической пружины зависит от
перемещения (осадки) // ее свободного конца
относительно опорной плоскости (рис. 25.5.2). При Р < РА эта
зависимость близка к линейной, но при Р > РА
витки пружины по мере ее сжатия последовательно
соприкасаются с опорной плоскостью, образуя в
плане плоскую спираль, что приводит к увеличению
жесткости С (w) = dP{ii)jdu с ростом перемещения
и. После соприкосновения с опорной плоскостью
всех витков жесткость резко возрастает (точка В на
рис. 25.5.2). Пружины с переменной жесткостью
используют для создания так называемых равночас-
тотных систем, применяемых для виброизоляции
приборов, оборудования или перевозимых грузов от
вредного воздействия высокочастотных вибраций.
Поведение материала упругих элементов даже
при сравнительно малых деформациях может
отклоняться от закона Гука, устанавливающего линейную
связь деформаций и напряжений, что также является
причиной нелинейной зависимости между силами и
перемещениями в механической системе. При
увеличении нагрузки в материале возникает пластическая
деформация, сохраняющая свое значение после
снятия нагрузки. Хорошо известно, что при растяжении
металлического стержня по мере возрастания
растягивающего напряжения о деформация £ сначала
растет по линейному закону £ = о/Е , где Е —
модуль упругости, а затем начинает прогрессивно
нарастать вплоть до разрушения стержня. Если, не
доводя стержень до разрушения, начать уменьшать
напряжение до нуля, то связь е и О снова
становится близкой к линейной (говорят, что происходит
упругая разгрузка), но при о = О сохраняется
остаточная пластическая деформация £„ (рис. 25.5.3).
оГ "5
Рис. 25.5.2
Рис. 25.5.3
Такое поведение материала при построении
ММ требует привлечения достаточно сложных
теорий пластичности, в том числе использующих
физические представления о микромеханизме
пластического деформирования материалов, что необходимо
при анализе работоспособности высоконагруженных
конструкций и при математическом моделировании
таких технологических процессов, как прокатка,
штамповка и ряд других.
Еще более сложной оказывается ММ
механической системы, если конструкционный материал
проявляет свойство ползучести: увеличивает
деформацию во времени / даже при неизменном
напряжении. В простейшем варианте ползучесть можно
описать зависимостью скорости деформации de/dt
от напряжения О и температуры Т, причем
увеличение о и Тприводят к возрастанию dz/dt.
Аналогично рассмотренным можно выявить
нелинейные зависимости для элементов
гидравлических и тепловых систем. Так, при заполнении
жидкостью сосуда с переменной по высоте площадью
поперечного сечения (например, сферического сосуда)
величина Сг в (25.3.8) будет зависеть от высоты
текущего уровня Н в сосуде относительно
подводящего трубопровода, т.е. от перепада давления
Ар = р - р0 = pgH , где р и Pq — давления
соответственно на входе в сосуд подводящего
трубопровода и над зеркалом жидкости, р - плотность
жидкости (рис. 25.5.4). Действительно, объем жидкости,
заполняющей сосуд при высоте уровня Н,
И
Y* = jS(z)dz,
о
СТАТИЧЕСКИЕ И СТАЦИОНАРНЫЕ МОДЕЛИ
967
Рис. 25.5.4
где S (z) ~ зависимость площади поперечного
сечения сосуда от вертикальной координаты z ,
отсчитываемой от входа подводящего трубопровода. Так как
объемный расход 0Ж = dVyK/dt, то получим в
отличие от линейной зависимости (25.3.8) нелинейное
соотношение
Сж =■*(*/)
dH
dt
S{H) dAp
PS dt
Причины возникновения нелинейности в
пневматических системах рассмотрены в п. 25.3.6.
В тепловых системах одной из причин,
приводящих к необходимости рассматривать нелинейные
ММ, является увеличение теплоемкости всех веществ
с ростом их температуры. В сравнительно небольшом
интервале изменения температур таким увеличением
обычно можно пренебречь, но при рассмотрении
тепловых процессов в широком диапазоне температур
этот эффект оказывает заметное влияние на
количественные результаты математического
моделирования. Зависимость теплопроводности веществ от
температуры является более сложной и также вызывает
необходимость построения нелинейных ММ.
Мощность энерговыделения, сопровождающего
экзотермические химические реакции, зависит от
скорости их протекания, которая, в свою очередь,
является нелинейной функцией температуры Т.
Существенно нелинейна зависимость плотности q
потока теплового излучения тела от его температуры
Т, определяемая в соответствии с законом Стефана—
Больцмана: q = eOqT , где е - коэффициент
излучения, причем ее (0,l], a Oq = 5,6696 • 10~
Вт/(м2К4) - постоянная Стефана—Больцмана.
Поэтому ММ, описывающие процессы теплового
излучения и энерговыделения при экзотермических
реакциях, неизбежно оказываются нелинейными.
25.5.2. Статические и стационарные
модели. При математическом моделировании реального
технического объекта (ТО) полезно иметь в виду
ситуации, когда его параметры не будут изменяться
во времени. Эти ситуации могут и не иметь места в
действительности, но их анализ обычно дает оценки
границ возможного изменения некоторых параметров
ТО. Такие оценки можно получить при помощи
статических математических моделей (ММ), которые
строят с использованием законов сохранения
соответствующих физических субстанций в состоянии
равновесия рассматриваемого ТО, т.е. в ситуации,
когда его параметры остаются постоянными при
постоянных внешних воздействиях.
Пусть на высокой околоземной орбите
находится сферический спутник диаметром D .
Поверхность спутника имеет коэффициент излучения Е и
коэффициент поглощения солнечного излучения As .
Аппаратура спутника при работе в максимальном
режиме выделяет тепловую мощность Q . Плотность
потока солнечного излучения на среднем расстоянии
Земли от Солнца составляет qs = 1373 ± 20 Вт/м2.
В случае высокой орбиты влиянием на температуру
спутника собственного излучения Земли и
отраженного от ее поверхности солнечного излучения можно
пренебречь.
Для оценки усредненной по объему спутника
температуры Т , значение которой остается
неизменным во времени, на основе закона сохранения
энергии запишем уравнение теплового баланса
Asqs-D2 +Q-ec0T4nD2 =0,
(25.5.1)
где Gq ~ постоянная Стефана-Больцмана (см. п.
25.5.1). Первое слагаемое в (25.5.1) соответствует
потоку поглощенного солнечного излучения, а
последнее — потоку собственного излучения. Из
(25.5.1) получим
Т =
АзЯ5
4ео0 ео0л/Г J
ч|/4
(25.5.2)
Значение Т называют равновесной температурой,
поскольку при этом значении «уравновешены» все
действующие на рассматриваемый ТО тепловые
потоки.
Если бы поверхность спутника соответствовала
модели серого тела (As =e), то в случае
неработающей аппаратуры (0 = 0), принимая значения
О0 = 5,67 10~8Вт/(м2К4) и q5=\400 Вт/м2, из
(25.5.2) можно найти значение Т ~ 280 К. При
^ = е = 0,6 и D = 1mb случае Q = 100 Вт
получаем Т « 290 К, а в случае Q = 1000 Вт
температура Т ~ 353 К может оказаться недопустимой с точки
зрения работоспособности некоторых систем
спутника. Отметим, что нелинейность построенной
статической ММ проявляется, в частности, в том, что при
увеличении Q на порядок приращение температуры
по отношению к значению Т = 280 К возрастает
лишь в 7,3 раза.
Нагрев конструкции летательного аппарата при
его движении в плотных слоях атмосферы называют
аэродинамическим. Влияние аэродинамического
нагрева в первую очередь обычно рассматривают
применительно к внешней обшивке летательного аппара-
968
Глава 25.5. НЕЛИНЕЙНЫЕ МОДЕЛИ МАКРОУРОВНЯ
та, которую для верхней оценки возможных значений
температуры принимают идеально
теплоизолированной с внутренней стороны (рис. 25.5.5). При
длительном полете с фиксированной скоростью V на
постоянной высоте И над поверхностью Земли
верхней оценкой температуры обшивки является
значение температуры заторможенного воздушного потока,
равной Т* =ТН{\ +(k-[)MJf/2)j, где Тн-
температура воздуха на высоте //, к — показатель
адиабаты (для воздуха к ~ 1,4), Мц = vja^ -
число Маха, ан - <укЯъТц — скорость звука, RB —
газовая постоянная воздуха. На высотах от 11 до 20
км принимают Ти = 216,55К = -56,45°С , что
соответствует скорости звука ан ~ 295 м/с. Таким
образом, при полете со скоростью v = 1000 м/с
число Маха равно Мц ~ 3, 39 , а Т = 714 К. При
такой температуре алюминиевые сплавы
неработоспособны и приходится применять обшивку из стали
или титановых сплавов.
При обтекании обшивки без угла атаки
температура воздуха у ее поверхности принимает значение
±fi^)<r,
называемое температурой восстановления, где Г -
коэффициент восстановления температуры, равный
г ~ 0,84 при ламинарном режиме течения в
пограничном слое и г « 0,89 при турбулентном. Если
принять г « 0,89 , то для использованных выше
исходных данных получим Tr ~ 660 К, что также
выше границы применения алюминиевых сплавов.
Оценки температуры Т обшивки получены в
предположении, что при длительном полете
наступает термодинамическое равновесие между обшивкой и
прилегающим к ней при обтекании пограничным
слоем воздушного потока, полагая Т = Т или
Т = Тг . Но в действительности Т < Тг , поскольку
обшивка, получая тепловую энергию от воздушного
потока, одновременно излучает ее в окружающее
пространство, причем в соответствии с законом Сте-
фана-Больцмана тем больше, чем выше ее
температура Т (см. п. 5.5.1). Поэтому значение Т следует
найти из условия равновесия подводимого к обшивке
и отводимого от нее тепловых потоков,
приходящихся на единицу ее внешней поверхности:
OL\Tr - Т) = £OqT , где а — коэффициент
теплоотдачи, е - коэффициент излучения внешней
поверхности обшивки (см. рис. 25.5.5). Отсюда следует
V
'//
f ее ТГ
h
алгебраическое уравнение четвертой
NV4 +0-1 = 0, где ;V=-^-7;3, 0 =
а
степени
Т_
из
которого можно найти равновесную температуру Т
обшивки. При обтекании обшивки воздушным
потоком со скоростью v = 1000 м/с коэффициент
теплоотдачи для высоты полета Н = 11 км можно принять
равным а = 180 Вт/(м2К), а для высоты И = 20 км
в силу уменьшения примерно в 5 раз плотности
воздуха - а = 40 Вт/(м2К). Тогда при е = 0,6 для
высоты Н — 11 км получим Т ~ 520 К, а для
высоты Я =20 км- Т = 410 К.
При медленном изменении параметров ТО во
времени t часто можно не учитывать влияние
инерционных свойств объекта, т.е. использовать его
квазистатическую ММ. В механической системе это
означает пренебрежение влиянием инерционных сил.
Пусть трубопровод с круговым поперечным сечением
радиусом г0 и толщиной стенки /fy нагружен
внутренним давлением р, которое приводит к
возникновению в стенке окружных напряжений pr§jh§ .
Материал стенки проявляет свойство ползучести (см. п.
25.5.1), причем зависимость скорости ползучести от
напряжения о имеет вид
dt
А |а|а а, А = const > 0, а > 1.
(25.5.3)
Предположим, что длина трубопровода при
ползучести остается неизменной, а деформация его
материала происходит без изменения объема, т.е.
Г0^Ь = г^ = const , где г и И — текущие значения
радиуса и толщины стенки, для которых получим
рг2
текущее значение напряжения О = — = > 0
К
h r0hQ
Деформацию стенки трубопровода в окружном
направлении представим в виде Е = In (/у г0) . Тогда
dz/dt = (\/r)dr/dt, так что, используя (25.5.3), при
О > 0 , получаем
\_dr_
г dt
= Аса = А
Если отсчет t вести от момента времени, когда
г = г0 , то после интегрирования имеем
Г
[bo
Отсюда следует, что г —> °о при / —> /*,
JL/A
Рис. 25.5.5
2аА I рг0
НЕКОТОРЫЕ НЕСТАЦИОНАРНЫЕ МОДЕЛИ
969
Ясно, что при этом И —» 0 , т.е. трубопровод
разрушится за время, не превышающее tm . Значение /*
называют критическим временем. Но допустимое
время работы трубопровода существенно меньше t+
и может быть найдено, если задать предельно
допустимое отношение r/rQ .
Одной из областей применения стационарных
ММ является описание установившихся процессов в
технических устройствах, когда некоторые выходные
параметры рассматриваемого ТО не изменяются во
времени. В технических устройствах нередко
возникают периодические процессы, одной из важнейших
характеристик которых является период Т (или
угловая частота со = 2к/Т ) колебании параметров таких
процессов. Для получения полной картины
периодических процессов применяют нестационарные
(динамические) ММ, но угловую частоту колебаний
обычно удается найти более простым путем.
Для защиты оборудования, приборов или
транспортных машин от нежелательного воздействия
высокочастотных вибраций, передающихся через
основания, узлы крепления или элементы подвески,
создают специальную систему виброизоляции. При
этом чтобы избежать резонансных явлений,
стремятся обеспечить возможно большее отношение
ожидаемых значений частоты вибраций к частоте СО
свободных колебаний такой системы, включающей и
защищаемый ТО. Если систему виброизоляции
вместе с объектом удается свести к расчетной схеме
гармонического осциллятора с массой /П и
жесткостью с упругой связи, то со = yjc/m .
Однако масса т объекта может изменяться в
широких пределах (например, в случае разной
загрузки железнодорожного вагона или кузова
автомобиля, при использовании в сочетании с одной и той
же системой виброизоляции различных приборов и
оборудования). В этом случае полезным оказывается
так называемый равночастотный виброизолятор,
жесткость упругих элементов которого изменяется в
зависимости от веса защищаемого ТО так, что
частота свободных колебаний системы остается
постоянной. Для этого применяют, например, витые
конические пружины (см. рис. 25.5.2) с нелинейной
статической характеристикой, т.е. с нелинейной
зависимостью Р (и) силы сжатия от перемещения и (осадки)
ее свободного конца.
Чтобы сформулировать требования к статической
характеристике, рассмотрим на ней произвольную точку
А (рис. 25.5.6). Эта точка соответствует массе системы
тА = PA/g , где g — ускорение свободного падения,
вес РА которой вызывает статическое перемещение
иА . При достаточно малых колебаниях относительно
положения системы, определяемого этим перемещением,
криволинейный участок характеристики в окрестности
точки А можно приближенно заменить участком
касательной в этой точке с углом наклона ф^ . В результате
получим линейную колебательную систему,
соответствующую гармоническому осциллятору с массой тА и
Рис. 25.5.6
жесткостью СА . Частота
свободных колебаний такого осциллятора
dP(u)/du\HSHA
(25.5.4)
Отсюда ясно, что частота свободных колебаний
системы виброизоляции вместе с защищаемым
объектом будет постоянной и равной заданному
значено ,
выполнено
равенство
(Оц =(йА = const , или dP(u)/du = (ci^/gj P(u) .
После интегрирования получим \g/<*\) ) In P (0) =
= и + С . Константу С было бы логично найти из
условия прохождения статической характеристики
через начало координат, т.е. Р(0) = 0 . Но ни одна
из бесконечного множества полученных
интегральных кривых, соответствующих произвольным
значениям С, через начало координат не проходит.
Преодолеть это затруднение можно при помощи простых
практических соображений. В техническом задании
на разработку системы виброизоляции задают
наименьшую массу защищаемого объекта. Поэтому при
создании этой системы можно оценить наименьшее
значение Р0 ее веса вместе с этим объектом. При
Р < Pq система может иметь линейную
характеристику Р = CqU с постоянной жесткостью С0 . Чтобы
обеспечить плавность перехода от линейной части
характеристики к нелинейной, нужно выполнить
условие dP(u)/du = с0 при Р = Р0 , или
(j^P0/g = с0 . Таким образом, при Р = Р0 находим
uQ - Pq/cq = g/co0 и затем, используя (25.5.4),
C = (g/o)02)ln/>0-1/0=(g/cflg)(ln/>0-l). В
итоге получаем, что требуемую статическую
характеристику пружины описывают два соотношения:
P = (4/g)P0u при Р<Р0 и P = P^ulg~X
ПРИ Р> Pq.
25.5.3. Некоторые нестационарные
модели. Нестационарные математические модели (ММ)
970
Глава 25.5. НЕЛИНЕЙНЫЕ МОДЕЛИ МАКРОУРОВНЯ
некоторых технических объектов (ТО) можно
привести к нелинейному обыкновенному
дифференциальному уравнению (ОДУ) первого порядка
МО.
dt
f(t,u(t)), t>0, (25.5.5)
с начальным условием и (?0) = Щ в момент времени
t - tQ. Пусть функция / (t,u) определена и
непрерывна в прямоугольной замкнутой области
D = {(Г, и) е Ш2 : \t - /„I < я, \и - и*\ < b) и
удовлетворяет в D условию Липшица относительно //.
Тогда в соответствии с теоремой Коши задача Коши
для ОДУ (25.5.5) имеет при \t - tQ\ < И, где
h = min [a, b/М} , М = max I/ (/, и)\, единст-
венное решение и (?) , принимающее в точке t = t0
значение h(/q) = Wq. Это решение непрерывно
зависит от начального условия и правой части ОДУ
(25.5.5). Если при этом правая часть зависит от
некоторого параметра X е ЛсЕ, т.е. вместо (25.5.5)
имеем ОДУ du/dt = g(t,u,\) с начальным
условием и (tQi X) - и0 (X) , то решение и (t, X) этого
ОДУ непрерывно зависит от параметра X при
дополнительном условии непрерывной дифференци-
руемости функции g (t, w, X) по X на множестве
D х Л . Свойство непрерывной зависимости
решения от перечисленных факторов важно при
рассмотрении прикладных задач, поскольку на практике
начальное условие, правая часть ОДУ или параметр
известны лишь приближенно с некоторой
погрешностью.
Если правая часть ОДУ (25.5.5) не зависит
явно от времени, т.е. /(/, w) = /(м), и уравнение
/ (и) = 0 не имеет действительных корней, то
производная du/dt знакопостоянна, а функция u(t)
строго монотонна (возрастает или убывает). Пусть
уравнение /(и) = 0 имеет т е N действительных
различных корней «,• б R, / = 1,/и. Тогда каждая
из прямых и = //, на плоскости tOi\ будет
интегральной кривой ОДУ
du{t)
одна интегральная кривая и (/) = и,- . Следовательно,
интегральные кривые, расположенные в полосе
между прямыми, параллельными оси (X и
соответствующими соседним значениям и,, / = 1,/я , не
имеют общих точек с этими прямыми. Так как в такой
полосе правая часть (25.5.6) знакопостоянна, то
каждой интегральной кривой в этой полосе соответствует
строго монотонная функция #(/), а
ограничивающие полосу прямые служат горизонтальными
асимптотами графика этой функции (рис. 25.5.7).
Обозначая £(?) = u(t) - и{ , при помощи
формулы конечных приращений, учитывая, что
/ (и,) = 0 , представим (25.5.6) в виде
du(t)_d^(t)
= /(«,+0 = Я«/+<*)$,
dt dt
0g(O,1). (25.5.7)
При 0 = 0 из (25 5.7) следует линейное ОДУ
d^jdt = /' (w,-)£ , которое является уравнением
первого приближения и, согласно теоремам Ляпунова
об устойчивости по первому приближению, при
/'(щ) < 0 частное решение и (t) = щ ОДУ (25.5.6)
асимптотически устойчиво, а при /'(//,)>() -
неустойчиво (соответственно решения // (?) = и^ и
u(t) s щ на рис. 25.5.7).
В случае /'(и,-) = 0 для выяснения вопроса
об устойчивости решения ОДУ (25 5.6) умножим
(25.5.7) на ^ Ф 0 и получим \d\jdt =
= (\/2)d$2/dt = 52/'("i + е0 • Если
V ТОЧКИ II;
существует хотя бы одна полуокрестность, в которой
/'(и,-+ 0£) > 0 (например, уточек и2 и //4 на
рис. 25 5.7), то в этой полуокрестности dt, /dt > 0
и d\Q/dt > 0 , т.е. сколь угодно малое отклонение
£ от положения равновесия и = м,- в этой полу-
dt
:/(w), Г>0, (25.5.6)
при условии, что m(/q) = m,- в некоторый момент
времени t = /0 ■ Если функция /(и) удовлетворяет
условию Липшица в окрестности точки и,-, то в силу
единственности решения ОДУ (25.5.6) через любую
точку (f, i/j)e R плоскости t0u проходит лишь
Рис. 25.5.7
ПЛОТНОСТЬ ФИЗИЧЕСКИХ СУБСТАНЦИЙ
971
окрестности возрастает со временем по абсолютному
значению. Это означает неустойчивость по Ляпунову
Если же при /'(м,) = 0 существует окрестность
точки Uf, в которой /'(м, + 0£) < 0 , то в этой
окрестности dt,2/dt<0 и </|5|/А<0. т.е.
—> 0 при t —> оо 5 что соответствует определению
асимптотической устойчивости.
Пусть на материальную точку массой т
действуют две силы, проекции которых на
положительное направление координатной оси Он
перемещения обозначим Р и Р . Первая из сил не зависит от
скорости v - du/dt и может быть функцией лишь
перемещения и времени, т.е. Р = P(u,t) , а для
второй силы в общем случае имеем
Р* = Р* (w, v, t) . Тогда, согласно второму закону
Ньютона, запишем
dv п/ ч - ,
т — = P(u,t)+ P (u,v,t). (25.5.8)
dt
Скорость изменения кинетической энергии
К - mv /2 рассматриваемой системы равна
dK/dt - mvdv/dt . Поэтому после умножения
(25.5.8) на V получим dK/dt - Pv + P*v . Таким
образом, скорость изменения кинетической энергии
равна мощности действующих на материальную
точку сил, что следует из закона сохранения энергии.
Если существует такая функция П (и, t), что
Р(и, t) - -ЭП(м, t)/du, то П - потенциальная
энергия, а сумма К + П=И/Г - полная энергия
данной системы. Пусть в фиксированные моменты времени
/0 и Ц заданы значения u(t0) = ftQ и м(/,) = й, .
Тогда при Р (м, v, t) = 0 , согласно принципу
Гамильтона, вариация действия по Гамильтону
ч
S[u]=j(K-n)dt (25.5.9)
'о
равна нулю. Условие стационарности функционала
(25.5.9) в виде уравнения Эйлера
</p(*-rm э(*-п)_о
dty dv J ди
соответствует для рассматриваемой простейшей
механической системы уравнению Лагранжа второго
рода.
Обобщением для рассматриваемой простейшей
механической системы является принцип
Гамильтона—Остроградского, выражаемый равенством
ч
1(ЪК + РЬи + P*bu)dt=0.
'о
Отсюда с учетом Ьи (t0 ) = Ьи (t{ ) = 0 следует
(25.5.8).
Если потенциальная энергия не зависит явно
от времени, т.е. П=П(«), то Р - -dX\/du и
Pv = (dU/du)du/dt = dU/dt. Используя (25.5.8),
запишем dK/dt + dU/dt = dW/dt = P*v . При
P = 0 систему называют консервативной. В этом
случае W = К + П = mv1/! + П (и) = const .
Систему называют диссипативной, если Р v < О при
условии, что P*v^0.
Периодическое во времени движение
механической системы возможно, если ее полная энергия
остается неизменной (как, например, в случае
консервативной системы). Движение диссипативной
системы не может быть периодическим, поскольку ее
полная энергия уменьшается. Строго говоря, полная
энергия большинства реальных систем не остается
постоянной. Поэтому ММ консервативных систем
лишь приближенно описывают поведение реальных
систем.
Глава 25.6
МОДЕЛИ МИКРОУРОВНЯ
25.6.1. Плотность физических субстанций.
Так как математические модели (ММ) микроуровня
описывают процессы в континуальных системах, то
теоретической основой их построения являются
механика и электродинамика сплошной среды. При
этом количественной характеристикой любой
физической субстанции является ее объемная плотность,
т.е. количество этой субстанции в единице объема.
Пусть окрестность точки М е Ш имеет объем А V ,
в котором находится масса Am некоторой сплошной
среды. Предел
lim — = рШ) (25.6.1)
ДК-+0ДК V '
называют плотностью среды в той точке М
пространства, к которой стягивается рассматриваемая
окрестность при А V —> 0 .
Аналогично можно ввести понятие объемной
плотности энергии е(А/) и объемной плотности
электрического заряда ре(М), если в левой части
(25.6.1) Am заменить соответственно на количество
энергии АЕ в объеме А К и содержащийся в нем
электрический заряд AQe .
Если функции р(М), е(М) и ре(М) ,
М е О. , ограничены в ограниченной замкнутой
пространственной области О. с 1R и непрерывны
всюду в £1, кроме, быть может, некоторого
множества точек объема нуль, то эти функции интегрируе-
972
Глава 25.6. МОДЕЛИ МИКРОУРОВНЯ
мы в области Q . Тогда для массы т, энергии Е и
электрического заряда Qe в этой области можно
записать
m = jp(M)dV, E = je(M)dV,
о. о.
Qe=jpe(M)dV.
о.
Понятие объемной плотности применимо не
только к физическим субстанциям, выражаемым
скалярными величинами (массе, энергии, заряду), но
и к субстанциям, выражаемым векторными
величинами. Пусть векторное поле скорости движения
среды задано векторной функцией V = v(t, M) ,
зависящей в общем случае от времени / и координат
точки е 1R . Тогда произведение pv будет вектором
объемной плотности количества движения среды, а
векторное произведение х х (pv) - вектором
объемной плотности момента количества движения
среды относительно начала координат.
Если pv - непрерывная функция координат в
пространственной области О. всюду, кроме, быть может,
некоторого множества точек объема нуль, то для
находящейся в этой области среды получим векторы
количества движения и момента количества
движения относительно начала координат:
J = \pvdV, К = \xxpvdV.
25.6.2. Модели переноса физических
субстанций. Большинство процессов в технических
устройствах связано с переносом в пространстве
конкретных физических субстанций: массы, энергии,
электрического заряда, количества движения или
момента количества движения. Интенсивность
переноса физической субстанции определяют плотностью
потока, равной количеству субстанции, переносимой
в единицу времени через единичную площадку,
перпендикулярную к направлению переноса. Среди
механизмов переноса выделяют конвективный (или
молярный) и диффузионный (или молекулярный).
Первый из них связан с движением сплошной
среды, определяемым векторным полем ее скорости
V -v(t, М) , М е R , в момент времени / . Для
физической субстанции, выражаемой скалярной
величиной, плотность потока конвективного
переноса является вектором, коллинеарным вектору
скорости V и равным произведению V и объемной
плотности С этой субстанции. Так, направление и
интенсивность конвективного переноса массы определяет
вектор плотности потока массы pv , где р —
плотность среды, равный вектору объемной плотности
количества движения среды. Модуль этого вектора
равен количеству массы, переносимой в единицу
времени через единичную площадку,
перпендикулярную к направлению вектора скорости. Направление и
интенсивность конвективного переноса энергии и
заряда определяют векторами EV и peV плотности
потока энергии и плотности электрического тока, где
£ и ре - объемные плотности соответственно
энергии и электрического заряда.
Диффузионный перенос физических
субстанций может происходить и при отсутствии
направленного движения среды (например, при помощи
хаотического молекулярного движения в жидкости, газе
или плазме и теплового движения ионов, атомов и
молекул в твердом теле). При неравномерном
пространственном распределении в среде объемной
плотности С некоторой физической субстанции
хаотическое движение микрочастиц среды постепенно
приводит к выравниванию этого распределения. В
изотропной среде, свойства которой одинаковы во
всех направлениях, диффузионный перенос
физической субстанции, вызванный неравномерным
пространственным распределением скалярной величины
С, происходит в направлении убывания объемной
плотности, т.е. в направлении, противоположном
направлению градиента VC скалярного поля,
задаваемого в пространстве в текущий момент времени
/ функцией С = С(/, М) , где V
—дифференциальный оператор Гамильтона.
При построении математических моделей
(ММ) микроуровня широко используют эмпирический
закон диффузионного переноса в виде
j(C) = _K(C)VC, (25.6.2)
.(С)
где у ' — вектор плотности потока физической
субстанции при диффузионном переносе, К^ ' —
эмпирический коэффициент диффузионного
переноса этой субстанции. Функцию С = С (/, М) обычно
предполагают непрерывно дифференцируемой
необходимое число раз по всем ее аргументам. Она
выполняет роль потенциала по отношению к
векторному полю плотности потока этой субстанции при ее
диффузионном переносе. Например, функция
С - С (/, М) может задавать распределение в среде
объемной плотности некоторого вещества (примеси в
жидкости или газе, ионов в плазме, легирующего
(С)
элемента в сплаве). В этом случае Кк ' называют
коэффициентом диффузии данного вещества в этой
среде, а (25.6.2) выражает известный в физике закон
Фика.
Интенсивность диффузионного переноса
физической субстанции не всегда связывают с
градиентом скалярного поля объемной плотности этой
субстанции. Так, в ММ процесса распространения в
среде теплоты как одной из форм энергии в качестве
потенциала вместо е используют функцию
Т - Т (t, М) распределения в пространстве в
текущий момент времени / температуры,
характеризующей при определенных условиях объемную
плотность тепловой энергии среды. Это приводит к закону
Фурье q = -XV Т , где q - вектор плотности
теплового потока, X - теплопроводность среды.
Линейную связь вектора плотности потока
физической субстанции с градиентом некоторого
потенциала используют и в тех случаях, когда перенос этой
ЛОКАЛЬНАЯ ФОРМА ЗАКОНОВ СОХРАНЕНИЯ ФИЗИЧЕСКИХ СУБСТАНЦИЙ 973
субстанции происходит путем движения микрочастиц
под действием внешнего поля. Так, под действием
электростатического поля, описываемого функцией
U - U (Л/) электрического напряжения, в
электропроводящей среде возникает электрический ток,
•(e)
вектор плотности которого равен jy ' - -aV U , где
О — электрическая проводимость среды. Если ввести
вектор Е ~ -VU напряженности электростатиче-
ского поля, то получим соотношение J = Oh ,
обобщающее закон Ома на случай сплошной среды.
При неравномерном распределении давления,
заданном функцией р = p(t, M) , через пористую
среду может просачиваться жидкость или газ. Тогда
вектор скорости частиц жидкости или газа
подчиняется закону Дарси в виде V - -xVp , где к —
коэффициент фильтрации. Потенциал в соотношении
вида (25.6.2) может зависеть от пространственных
распределений нескольких физических величин.
Например, для многокомпонентной смеси химически
реагирующих веществ диффузионный перенос
физических субстанций связан с выравниванием
неравномерного пространственного распределения так
называемого химического потенциала, который зависит от
концентрации этих веществ, температуры и давления.
Тогда вектор плотности потока конкретной
субстанции будет линейной комбинацией векторов, коллине-
арных градиентам соответственно концентрации,
температуры и давления. В этом случае говорят о
концентрационной диффузии субстанции, ее термо-
и бародиффузии. Если среда анизотропна, т.е. ее
свойства различны в различных направлениях, то
(С)
Кк ' в (25.6.2) следует заменить тензором второго
ранга коэффициентов диффузионного переноса.
25.6.3. Локальная форма законов
сохранения физических субстанций. Локальную форму
закона сохранения некоторой физической
субстанции с объемной плотностью С = С(/, Л/),
зависящей в общем случае от времени t и координат
точки М е 1R , можно представить в виде
ЭС
Э/
+ V (Cv) + Vy(C) = /,(Я, (25.6.3)
где V — оператор Гамильтона, и = и (/, Л/) —
функция, задающая векторное поле скорости
движете)
имя среды, J - вектор плотности потока данной
субстанции при диффузионном переносе (см. п.
(С)
25.6.2), 1у - объемная мощность источников (или
стоков) этой субстанции.
Например, если в многокомпонентной среде,
состоящей из N компонентов, каждый из которых
имеет плотность рк, к - 1, N , происходит
превращение веществ за счет химических реакций или
ионизации, то этот процесс можно описать объемной
мощностью / источников каждого из
компонентов, равной скорости изменения массы к -го
компонента в единице объема. Тогда из (25.6.3) при
С - рк получим
3E*. + V(ptt,) + y/<*> + /J*>, (25.6.4)
at
где у ' - рк (vk -v) - вектор плотности потока
к -го компонента при диффузионном переносе, а
Х)к - вектор скорости этого компонента. Из закона
сохранения массы следует
Р = Хр*' 27£°' Pv = l^Pkvk
к=1 к=1
N
I
к=\
N
или У j
Х/4)-о.
*=1
Суммируя (25.6.4) по к , получаем известное
уравнение неразрывности (или сплошности)
Эр/Э/ + V(pu) = 0, которое можно рассматривать
как локальную форму закона сохранения массы
сплошной среды. Для несжимаемой среды
(р = const) имеем dp/dt = dp/dt + vVp = 0 , так
что уравнение неразрывности принимает вид
В случае неподвижной среды (г; = 0) из
(25.6.3) при С = ЕТ следует локальная форма закона
сохранения тепловой энергии Эе^/Э/ + Vq = qy,
где £,j — объемная плотность этой энергии, q —
вектор плотности теплового потока и qv — объемная
мощность тепловыделения в среде. Если
использовать закон Фурье (см. п. 25.6.2) и принять
Т
ЕТ = f cdT, (25.6.5)
То
где С - удельная объемная теплоемкость среды, а
Tq ~ некоторое значение температуры, от которого
происходит отсчет величины е^ , то оно перейдет в
нелинейное (в общем случае) уравнение
нестационарной теплопроводности cdT/dt - V (A.V7j + qy ,
где X - теплопроводность среды, которое при
с,Х = const примет вид aT/dt = oW2T + qv/c , где
а - Х/с — температуропроводность среды, а V -
оператор Лапласа. Аналогично из (25.6.3) можно
получить локальную форму закона сохранения
электрического заряда.
Полагая в (25.6.3) С = pv, можно получить
974
Глава 25.6. МОДЕЛИ МИКРОУРОВНЯ
локальную форму закона сохранения количества
движения в виде
где Vj и bj - проекции векторов V скорости и Ъ
плотности объемных сил на ось 0Х,- декартовой
прямоугольной системы координат 0XjX2X3, е,- -
орт, задающий направление этой оси, (Ту/ —
компоненты тензора второго ранга, называемого тензором
напряжений. Отсюда следует уравнение движения
сплошной среды
dv
»—
dt
/ = 1 у=1 J
(25.6.6)
а при V = const - уравнение ее равновесия. При
отсутствии в среде моментов, распределенных по ее
объему, из закона сохранения момента количества
движения можно установить симметрию тензора
напряжений, т.е. (Т,у = 0\у, /, у = 1, 2, 3 . Однако в
общем случае может возникнуть необходимость
учитывать распределенные по объему и поверхности
моменты (в частности, при действии на среду
электромагнитного поля).
Если в (25.6.3) С заменить объемной
плотностью е энергии, включающей все виды энергии, то
согласно закону сохранения энергии после ряда
преобразований получим
Эе
з з
(О
bv,
i=i
»
г.<5)
где qy ' — вектор плотности потока энергии, л у
объемная мощность источников энергии. Отсюда,
представляя е как сумму объемных плотностей
pv /2 кинетической и ри внутренней энергий, где
и — внутренняя энергия единицы массы среды, при
условии симметрии тензора напряжений находим
о—-/(е)
■?«(£)+XX<v*,
i=l У=1
(
dV;
dVj}
dX; dX:
где ^jj - компоненты тензора скоростей деформации.
25.6.4. Модели простейших сред. В общем
случае количество неизвестных функций, входящих в
уравнения, полученные из законов сохранения
физических субстанций, превышает количество этих
уравнений. Поэтому таких уравнений обычно
недостаточно для построения математической модели (ММ)
рассматриваемого процесса. Так, для получения из
закона сохранения тепловой энергии уравнений
нестационарной теплопроводности, содержащих
единственную неизвестную функцию температуры среды,
пришлось использовать закон Фурье и зависимость
(25.6.5) объемной плотности тепловой энергии от
температуры, являющуюся характерным примером
уравнения состояния среды.
Чтобы использовать (25.6.6) для построения
ММ движущейся среды, считая заданным поле
вектора b плотности объемных сил, необходимо
установить связь между вектором V скорости среды и
тензором напряжений. Эта связь также может быть
выражена соответствующим уравнением состояния
среды, часто называемым ММ этой среды.
Рассмотрим некоторые из таких моделей.
К жидкости (или газу) относят такую среду,
для которой в любой точке в состоянии покоя
компоненты тензора напряжений Gy - -рЬц,
/, j = 1, 2, 3 , где р - давление, 5;у = 1 при i - j и
5,у = 0 при / Ф j . Идеальной (невязкой)
жидкостью (или идеальным газом) считают среду, для
которой указанное свойство сохраняется и при движении.
Тогда вместо (25.6.6) получим уравнение Эйлера
pdv/dt = b - Vp , где / - время.
При умеренных давлениях жидкость обычно
считают несжимаемой. Если несжимаемая жидкость
однородна, т.е. р = р = const, то при заданном
значении р уравнение Эйлера и уравнение
неразрывности в виде Wv - О образуют замкнутую
систему четырех уравнений относительно неизвестных
функций V и р. Несжимаемая жидкость может быть
неоднородной, т.е состоять из частиц, имеющих
различную плотность, но сохраняющих ее в процессе
движения неизменной (dp/dt = 0) . Тогда к
указанным уравнениям следует добавить уравнение
неразрывности в виде dp/dt + V (pv) = 0 . Оно позволяет
найти функцию р = р(/, М), М е Q.,
описывающую распределение плотности неоднородной
несжимаемой жидкости в области О. в различные моменты
времени / , если в момент времени t - 0 ,
принимаемый за начальный, задано начальное
распределение р0(М) = р(0,Л/).
Пусть при р = р" = const векторные поля
скорости однородной несжимаемой жидкости и
объемных сил являются потенциальными, т.е.
V xv = 0, 17 = Уф и b = WB , где ф и В -
действительные функции, зависящие в общем случае от
времени и пространственных координат. Тогда с
учетом равенства
dv dv , „ч dv 1 _ 2 /г, \
— = — + (vV)v = — + -Vv -vx(Vxv)
dt dt v ; dt 2
уравнение Эйлера можно записать в виде
ПРЕОБРАЗОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
975
"fW*i
0.
Отсюда следует интеграл Коши—Лагранжа
В
- + -(УФ) +_
= g(t), (25.6.7)
причем для нахождения функции g (/) достаточно
располагать зависимостью от t левой части (25.6.7)
в какой-либо одной точке области Q движения
жидкости. Из уравнения неразрывности получаем,
что при этом функция ф должна удовлетворять
уравнению Лапласа V ф = 0 , т.е. является
гармонической функцией. При установившемся движении
Эф/Э/ = 0 и (25.6.7) переходит в известный интеграл
Бернулли v2/2 + (р - #)/р = const.
Если среда сжимаема, но ее плотность можно
представить функцией только давления, то процесс в
такой среде называют баротропным. Например,
движение совершенного газа, подчиняющегося
уравнению Клапейрона-Менделеева, при известной
температуре или при отсутствии теплообмена является
баротропным процессом. В этом случае можно получить
соотношение, аналогичное интегралу Коши-
Лагранжа. Линеаризация этого соотношения
относительно состояния покоя или не возмущен но го
движения позволяет перейти к волновому уравнению.
В отличие от идеальной (невязкой) жидкости
при движении вязкой жидкости компоненты тензора
напряжений в выбранной прямоугольной системе
координат OXjX2x3 в общем случае могут принимать
произвольные значения. Рассмотрим наиболее
простую ММ изотропной вязкой жидкости,
связывающую компоненты тензора напряжений с
компонентами тензора скоростей деформаций \х: (см. п. 25.6.3)
линейными соотношениями
Gfj = -pbfj + k (Vv) by + 2л^у, I, j = I, 2,3,
(25.6.8)
где коэффициенты k и Т| характеризуют вязкое
сопротивление при движении среды. В этой модели
предполагают отсутствие проскальзывания частиц
жидкости на границе с твердым телом, т.е. векторы
скоростей жидкости и твердого тела в точках такой
границы совпадают (в точках неподвижной границы
скорость жидкости равна нулю). Если подставить
(25.6.8) в (25.6.6), то при &,Г| = const получим
уравнение Навье-Стокса pdv/dt - Ь — V/7 +
+ (k + r\)V(Wv) + r\V2v .
Для линейно упругого изотропного твердого
тела компоненты тензора напряжений связаны с
компонентами тензора деформации
—L +—L
2 \ dxj
дХ;
IJ = 12,3,
(25.6.9)
где ui - проекция вектора и перемещения точки
тела на координатную ось Ох,- , линейными
соотношениями:
Су = АВ5,у + 2р£у, 0 = е,, + е22 + е33 = Vn,
(25.6.10)
выражающими обобщенный закон Гука. Здесь 0 -
объемная деформация, а X и Д - константы Ламе,
характеризующие упругие свойства тела.
Коэффициент К = X + 2Д/3 называют модулем объемного
сжатия, а Д - модулем сдвига. В инженерных
задачах чаще используют коэффициенты
Е = Д (ЗА, + 2Ц)/(Х + (I), v = (\/2)/(\ + р) ,
называемые модулем упругости при растяжении и
коэффициентом Пуассона.
Подстановка (25.6.9) в (25.6.10) и затем в
(25.6.6) приводит при X, Д = const к уравнению
Ламе
p^ = b + (X + t±)V(Vu) + l±V2u.
(25.6.11)
В (25.6.9) компоненты тензора деформации
предполагают малыми по сравнению с единицей.
Поэтому изменение плотности р твердого тела
также мало, и при использовании (25.6.11) уравнение
неразрывности можно не рассматривать, положив
р « р° = const.
При малых деформациях перемещения,
скорости и ускорения частиц тела могут быть, вообще
говоря, значительными. Однако на практике часто
встречаются задачи, в которых малы и эти величины.
Тогда в (25.6.11) левую часть заменяют на р Э u/dt
и получают уравнение
Э2и Ь Х + Д „ ,„ ч Д „2
_ = — + £1 у (Vi#) + — Vzu
dt р° р" р
относительно единственной неизвестной функции
u = u(t,M), МеП.
Глава 25.7
АЛГОРИТМИЗАЦИЯ
МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
25.7.1. Преобразование математических
моделей. При проведении вычислительного
эксперимента исходная математическая модель (ММ)
рассматриваемого технического объекта (ТО)
претерпевает ряд преобразований, необходимых для того,
чтобы количественный анализ ММ был осуществлен
при помощи ЭВМ. Эти преобразования в конечном
счете должны привести к такому алгоритму, который
можно было бы реализовать на ЭВМ, т.е. составить
ЭВМ-программу в виде последовательности элемен-
976
Глава 25.7. АЛГОРИТМИЗАЦИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
тарных действий (арифметических и логических
операций), реализуемых командами ЭВМ.
Пути преобразования ММ непосредственно
связаны с теми математическими методами, которые
используют для количественного анализа этих
моделей. Проследим эти пути при помощи схемы,
представленной на рис. 25.7.1.
Для некоторых типов ММ без предварительных
преобразований могут быть непосредственно
составлены алгоритмы решения прямой задачи
вычислительной математики, реализуемые на ЭВМ. К ним
относятся, прежде всего, ММ метауровня в виде
разностных уравнений (РУ) и систем логических
соотношений (СЛС). Имитационная ММ (ИММ), являясь
алгоритмической моделью, также не нуждается в
предварительном преобразовании перед реализацией на
ЭВМ. Часто ИММ используют в сочетании с
методом статистических испытаний (МСИ), иногда
называемым методом Монте-Карло. При этом
неизвестные фазовые переменные ТО моделируют случайными
величинами, и затем результаты моделирования
обрабатывают статистическими методами. Такой подход
можно использовать и для анализа
детерминированной ММ макро- или микроуровня, если построить
эквивалентную ей вспомогательную стохастическую
модель. Известны стохастические ММ для
вычисления интегралов, решения интегральных уравнений,
систем линейных алгебраических уравнений (СЛАУ)
и дифференциальных уравнений с частными
производными (ДУЧП), для оценки собственных значений
линейных операторов.
Динамические {нестационарные) ММ,
допускающие аппроксимацию производных фазовых
переменных по времени при помощи явной конечно-
разностной схемы (Я К PC), также нетрудно привести к
алгоритмическому виду. В частности, для
обыкновенных дифференциальных,
дифференциально-функциональных и интегро-дифференциальных уравнений (ОДУ,
ДФУ и ИДУ) и их систем (СОДУ, СДФУ и СИДУ)
можно использовать методы Рунге — Кутты (МРК), а
для ДУЧП - явный метод конечных разностей
(ЯМКР).
Если ММ микроуровня в вариационной форме
(ВФ) содержит функционал, который на искомом
Уровни математических моделей
Микро- Макро- Мета-
ДУЧП
ze:
НКРС
ИФ |—|
и
ЯКРС
ЯМКР
МОП
мкэ|
мгэ
СОЛУ
ЯКРС
МН|Лииеар1
МЛВ ВМЛА
МЛВ
РУ
МРК
Алгоритмы
Арифметические и логические операции на ЭВМ
Рис. 25.7.1
решении достигает единственного экстремума
(минимума или максимума), то применение метода
локальных вариаций (МЛВ) фазовых переменных
позволяет построить достаточно простой алгоритм
поиска решения, который несложно осуществить при
помощи ЭВМ. Ясно, что МЛВ можно использовать
для поиска экстремума целевой функции в задачах
линейного или нелинейного программирования (ЗЛП
или ЗИП).
Наиболее удобными ММ с точки зрения
реализации на ЭВМ являются линейные модели в виде
СЛАУ Ах = Ь , где Ь — вектор размером TV ,
включающий N искомых фазовых переменных
рассматриваемого технического объекта (ТО), Ь и А —
вектор размером TV правой части СЛАУ и ее
квадратная матрица порядка N . Большинству
вычислительных методов линейной алгебры (ВМЛА) (см. рис.
25.7.1) отвечают хорошо изученные алгоритмы (в том
числе с параллельными вычислениями), на основе
которых созданы эффективные ЭВМ-программы,
составляющие достаточно полное математическое
обеспечение для решения СЛАУ. Поэтому многие
математические методы, связанные с
преобразованием ММ, ориентированы на последовательное
сведение исходной ММ к модели в виде СЛАУ
Так, например, система конечных нелинейных
уравнений (СКНУ) вида / (х) = Ь , где
/ = (A (*)-//i (x)-/n (*)) ~ заданная
дифференцируемая векторная функция векторного
аргумента X, включающая N координатных функций
/„(дс), l/i = l,7VJ, путем линеаризации
относительно некоторого известного приближенного
значения xk_j искомого вектора JC фазовых переменных
ТО может быть записана в форме
f(xk-\)+f(xk-l)(xk-xk-\) = b>
где f'(x) - матрица Якоби векторной функции
/(-*), а хк -следующее приближение к искомому
значению вектора X. Если обозначить
Ак=/'(хк-\) и h=b-f(xk_x)^f(xk_x)xk_x%
то для нахождения вектора хк необходимо решить
СЛАУ Акхк - Ьк . Далее описанную процедуру
повторяют для найденного приближения и т.д. Такое
преобразование исходной ММ в виде СКНУ к СЛАУ
отвечает методу Ньютона (МН) решения СКНУ
последовательными приближениями.
Ясно, что с многократным решением СЛАУ
связано рассмотрение ЗЛП, а также ЗНП в случае
линеаризации этой задачи. К СЛАУ методом
конечных разностей могут быть преобразованы линейные
динамические (нестационарные, эволюционные) ММ
микро- и макроуровня, если для аппроксимации
производных фазовых переменных ТО по времени
использовать неявные конечно-разностные схемы
(НКРС). Нелинейные ММ этих же типов сначала
приводят к СКНУ, а уже после линеаризации
СКНУ - к СЛАУ. Также в итоге к СЛАУ приводят
статические ММ микроуровня при конечно-
РАЦИОНАЛИЗАЦИЯ АЛГОРИТМОВ МАТРИЧНЫХ ОПЕРАЦИЙ
977
разностной аппроксимации производных фазовых
переменных по пространственным координатам.
Если при количественном анализе ММ
микроуровня в интегральной (ИФ) или вариационной (ВФ)
формах применить один из методов ортогональных
проекций (МОП), представив искомое решение
приближенно в виде линейной комбинации базисных
функций, то для вычисления коэффициентов этой
линейной комбинации также необходимо решать
СЛАУ. Для приближенного количественного анализа
таких ММ можно использовать дискретизацию
области конечными элементами и затем процедуру
метода конечных элементов (МКЭ). Это тоже
приведет к необходимости решать СЛАУ относительно
значений фазовых переменных в узлах конечных
элементов. Аналогичная ситуация возникает и при
использовании метода граничных элементов (МГЭ).
25.7.2. Рационализация алгоритмов
матричных операций. Из рассмотренных в п. 25.7.1
способов преобразования математических моделей
(ММ) следует, что часто алгоритмизация модели
связана с применением вычислительных методов
линейной алгебры. Используемые в этих методах
вычислительные операции достаточно просты, но
содержат в себе еще не всегда рационально
используемые возможности увеличения производительности
ЭВМ. Эти операции можно осуществить различными
способами, и в зависимости от структуры векторов и
матриц среди этих способов может быть найден
наиболее рациональный с точки зрения
производительности ЭВМ.
Пусть необходимо вычислить вектор z - Ах ,
равный произведению матрицы А размером ffix/l и
вектора х размером /1. Казалось бы, удобнее каждую
из строк этой матрицы с номером / = 1,171 скалярно
умножить на вектор х, и полученные скалярные
произведения записать в качестве координат вектора Z .
Для этого понадобится произвести тп умножений и
тп сложений (если каждой из координат Z\ вектора
Z сначала присвоено нулевое значение). Но можно
поступить иначе, если использовать операцию,
состоящую из умножения вектора на число и сложения
результата с другим вектором. Для этого при
начальных нулевых значениях Z; и каждом фиксированном
номере у = 1,/! столбца матрицы А следует во
внутреннем цикле по / = 1,/я координату х- вектора х
умножить на элемент А- этой матрицы, и результат
сложить со значением Zj , присвоив zx полученное
значение суммы. Несложно проверить, что при этом
количество умножений и сложений останется
прежним. Отличие состоит в том, что в первом случае
доступ к элементам матрицы идет по строкам при
фиксированных номерах / , а во втором - по
столбцам при фиксированных номерах j .
Операцию сложения или умножения двух
действительных чисел с плавающей точкой (или
запятой) принято называть флопом (сокращение
английских слов floating point operation). Таким образом,
каждая из рассмотренных выше процедур умножения
матрицы на вектор требует выполнения N = 2тп
флопов.
В случае умножения симметрической матрицы
А порядка п на вектор х размером /1 можно
уменьшить число N флопов. Ясно, что если не
использовать симметрию матрицы, то N = 2/1 . Можно
попытаться уменьшить N за счет уменьшения объема
памяти, требуемой для хранения симметрической
матрицы. Ее можно хранить в одном векторе а
размером я(/1 + 1)/2 как, например, нижнюю
треугольную матрицу, причем Ay - ai+(n-j/2)(j-\)*
i = 1,л, У = 1,1 . Тогда для каждого фиксированного
номера /' = 1,/1 строки следует выполнить два
внутренних цикла по номерам j столбцов: сначала при
У = / + 1,П вычислить Z; = Zj + aj+{n-i/2)(i-\)xj ' a
затем при _/ = !,/ вычислить Zj - Z\ +
+ai+(n-j/2)(j-\)xj ■ Но такой способ требует также
2/1 флопов.
Причиной неудачи является то, что алгоритм
обращается к элементам симметрической матрицы не
в порядке их расположения в массиве, в котором они
хранятся (т.е. не в порядке возрастания номера
координат вектора а). Расположим эти элементы в
векторе а в порядке следования их по диагоналям,
начиная с главной: при i' > j и к > О имеем
Ai+k,i = ai+nk-k(k-\)/2> ' = !,"• Если теперь для
каждою значения к = I, /1 - 1 при / = 1, /1 - к
сначала вычислить Zj - Zj + ai+/xi+k ' а затем
Zi+k = Zi+k + Ц+Я , где / = пк - к (к - 1 )/2 , то для
нахождения всех координат искомого вектора Z - Ах
потребуется 2/1 (/1 - 1) флоп. Таким образом,
экономия по числу операций составит 2/1 флоп.
Умножение матрицы А размером т х п на
матрицу В размером пхг должно в общем случае
потребовать Imnr флопов. Если учитывать
конкретную структуру матриц, то это число можно
существенно сократить.
Пусть необходимо перемножить две верхние
треугольные матрицы А и В порядка п. Несложно
убедиться, что в результате получим также верхнюю
треугольную матрицу С = А В того же порядка. Ее
элементами будут укороченные скалярные
произведения строк матрицы А на столбцы матрицы В с
учетом тою, что aikby =0 при к < / или j < к ,
i9jt к = 1, /1. Отсюда следует, что элементы
матрицы С
п j
j=i k=i
978
Глава 25.7. АЛГОРИТМИЗАЦИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
На вычисление элемента Cxj при / < J прихо- небрегая для больших значений Л слагаемыми
низших степеней, получаем
дится затратить 2(у - / + 1) флопов. В итоге, пре-
* = Х12(У-/ + 1)«221У = 2£
£(л-| + 1)(/!-/ + 2)
/=| ;=/
3 Ы п3
/ = 1 1 = 1 ^_^_
Итак, для умножения верхних треугольных (и
аналогично нижних треугольных) матриц порядка л
требуется примерно в 6 раз меньше арифметических
операций по сравнению с умножением произвольных
матриц того же порядка.
При вычислениях с матрицами больших
размеров наряду с экономией арифметических операций
актуальной становится и экономия памяти ЭВМ при
хранении исходных матриц и записи результатов
вычислений Это особенно важно, поскольку память
современных ЭВМ организована по иерархическому
принципу. Процессору, выполняющему
арифметические операции, требуется наименьшее время для
обращения к так называемой кэш-памяти (буферной
памяти между регистрами центрального процессора и
основной частью оперативной памяти). Несколько
большее время требуется для записи и считывания
данных в основной части оперативной памяти.
Доступ к большим объемам внешней памяти требует еще
больших затрат времени. Поэтому при разработке
алгоритмов матричных вычислений следует
стремиться к уменьшению обмена данными с внешней
памятью, а данные, попавшие в кэш-память,
целесообразно использовать максимальным образом.
Пусть требуется вычислить произведение
С — А В квадратных матриц А и В порядка л ,
причем в кэш-памяти можно разместить лишь М
чисел (3/1 ~ М <& п I с плавающей точкой.
Построим алгоритм вычислений так, чтобы каждый
столбец матрицы В попадал в кэш-память только 1
раз. Для этого при каждом фиксированном значении
j = \,п следует в кэш-памяти создать нулевой стол-
(
# = ]Г у2л + ]ГА:л
у=1 ^ *=1
: 2п1 + п= 2пг +
3^
М
Отсюда видна важность увеличения кэш-памяти.
Предположим, что число М таково, что в
кэшпамяти можно разместить по а столбцов матриц В и
С и один столбец матрицы А, т.е. М ~ (2а + 1) л.
Тогда описанный выше алгоритм можно
использовать для вычисления матрицы С по блокам, каждый
из которых состоит из а столбцов. При этом
количество чисел, проходящих в обоих направлениях по
каналу связи между кэш-памятью и основной
оперативной памятью, будет
п п
/V, = ]Г 2л/ + [л/af ]Г кп = 2п2 + л2 [я/a]*,
j=\ к=\
где [л/а] — наименьшее натуральное число, равное
или большее числа л/a. Если (л/а) е N , то
N{ = 2л2 + л3/а « 2л2 + 2пА/(М - л) . При л » 1
имеем /Vj = N/а , т.е. увеличение М в (2а+1)/3
раз должно дать экономию затрат времени в а раз.
В данном случае кэш-память даст больший
эффект, если при перемножении квадратных матриц
А и В порядка л использовать их блочное
представление, причем каждую из них представить состоящей
бец Cj матрицы С и загрузить в кэш-память столбец из (л/Р) блоков в виде квадратных подматриц
В: матрицы В, а затем для фиксированного значе- порядка (3 (полагаем, что (л/Р) е N ). Тогда со-
. '. . л п гласно правилу умножения блочных матриц блок
ния К = 1,Л загрузить столбец Ак матрицы Л Во
Сд/ y>J= I, /l/PJ матрицы Сбудет
внутреннем цикле по / = 1,Л проводим вычисление
элемента с,у = Су + а-^Ъщ. Эти циклы повторяем для
каждого значения к - 1, Л , так что в итоге получаем
в кэш-памяти столбец Су искомой матрицы С, ко- где А,К и BKJ -блоки матриц соответственно F и
торый следует переписать в основную оперативную в Если ддя фиксированных значений /,У = 1,л/Р
память и перейти к следующему значению номера
j . создать в кэш-памяти нулевой блок Сц и во внут-
Подсчитывая количество чисел с плавающей
точкой, проходящих при выполнении описанного рением цикле но К = 1, л/р, вызывая в кэш-память
алгоритма в обоих направлениях по каналу связи бжжи л и В ,|ровести матричные вычисления
между кэш-памятью и основной оперативной
памятью, ПОЛучаеМ Сц = Сц + АщВщ , ТО В ИТОГе ПОЛУЧИМ бЛОК С/у
ОПЕРАЦИИ С РАЗРЕЖЕННЫМИ МАТРИЦАМИ
979
искомой матрицы С, который затем следует
переписать в основную оперативную память. При
реализации такого алгоритма по каналу связи между
кэшпамятью и основной оперативной памятью в обоих
направлениях пройдет количество чисел
л/Ря/Р ( "1$ Л
/=1У=1 у к=\ ) Р
При сравнении /Vj с Nj следует учесть, что
кэш-память объемом А/~(2а+1)я позволит
выбрать Р из условия Л/ = 3(3 . Следовательно,
при п » 1 получим
Nx 2л12 + г?/а р УлТ/з я
W2 я2 + 2 я3/р 2а (Л/ - я)/я ~ ТзЛ/ '
Так, при /1 = 2 иА/=2 по затратам
времени ма пересылку чисел из основной
оперативной памяти в кэш-память и обратно последний
алгоритм экономнее предыдущего в 4,9 раза.
25.7.3. Операции с разреженными
матрицами. Преобразование многих математических
моделей (ММ) технических объектов приводит к матрицам
с большим количеством нулевых элементов. Такие
матрицы принято называть разреженными (или
слабою полненными) .
Строгое определение разреженной матрицы
отсутствует. Один из критериев разреженности связан с
ограничением числа ненулевых элементов в строке от
2 до 10. Другой критерий устанавливает для
квадратных матриц порядка П число ненулевых элементов
равным П Y , где у е (0,1) . Так, для матриц,
полученных преобразованием ММ электрических систем,
обычно у ~ 0, 2 . Однако на практике матрицу
считают разреженной, если имеет смысл извлекать
выгоду из того, что многие ее элементы равны нулю.
Поэтому свойство разреженности матрицы тесно
связывают со способами ее экономного хранения в
памяти ЭВМ и алгоритмами, позволяющими при
вычислениях с ней повысить производительность
ЭВМ.
Разреженная матрица является множеством
ненулевых элементов, нерегулярно расположенных
по строкам и столбцам. Поэтому ее ненулевые
элементы не удается хранить в памяти ЭВМ столь
простым способом, как элементы обычной матрицы.
Если ограничиться хранением значений ненулевых
элементов разреженной матрицы, то приходится
хранить и так называемую индексную информацию,
указывающую номера строки и столбца каждого
такою элемента. Такой способ часто не является
самым рациональным. Более рациональны способы
храпения разреженной матрицы, связанные с
запоминанием определенной доли пулевых элементов.
Способ, оставляющий при хранении меньшее число
нулевых элементов, обычно более сложен, а алгоритм
обработки матрицы в такой записи труднее
программировать.
Так как операции с матрицами можно свести к
операциям скалярного умножения векторов,
соответствующих столбцам и строкам матриц, и
покоординатного сложения векторов, то применительно к
разреженным матрицам достаточно рассмотреть
особенности хранения, сложения и умножения векторов
с большим количеством нулевых координат. Такие
векторы принято называть разреженными.
Один из вариантов хранения разреженного
вектора а размера п в памяти ЭВМ требует двух
массивов длиной па, соответствующей числу ненулевых
координат этого вектора. В массив AR в любой
последовательности записывают значения ненулевых
координат о,-, а соответствующие им номера
(индексы i ) хранят в массиве AN . В этом случае
число па е N необходимо хранить отдельно. В
другом варианте хранения массив AR остается
прежним, а в массиве AN длиной па + 1 в последней
позиции записывают 0 в качестве признака
окончания списка индексов. Этот вариант хранения
называют компактным неупорядоченным.
Рассмотрим операцию сложения двух
разреженных векторов а и Ь размером п на конкретном
примере. Пусть информация об этих векторах
записана в массивах AN - {10; 3; 7; 4} и AR -
= {0,2; 0,3;0,4; - 0,7} длиной пп = 4 и массивах
соответственно #/V={5;4;10} и BR = {0,6; 0,7; 0,5}
длиной Пь - 3 . Используя эту информацию, можно
было бы последовательно просматривать массивы
AN и BN и в конце каждого этапа просмотра
складывать соответствующие координаты векторов.
Так, чтобы найти первую координату q = flj + b\
вектора с = а + Ь необходимо, просмотрев эти
массивы, убедиться, что ни в одном из них нет числа
1, т.е. и Я|=0,и £|=0,и лишь после этого
вычислить Cj = 0 . Затем аналогичным образом
установить, что с2 = 0 . При третьем просмотре удастся
обнаружить, что в массиве AN есть число 3 и ему в
массиве AR соответствует Л3 =0,3, но в массиве
BN нет числа 3 и поэтому Ь$ — 0 , так что в итоге
с3 = а3 + ^3 = О'З • Следовательно, при вычислении
каждой из П координат вектора с приходится
просматривать массивы AN и BN . С учетом
выполнения операций сложения общее число
элементарных операций составит примерно п(па + Пь) , что
при достаточно большом значении П делает такой
алгоритм весьма неэффективным.
Более эффективным является алгоритм, в
котором выделены так называемые индексный и
вычислительный этапы, и они выполняются последовательно.
На индексном этапе объединяют массивы AN и BN
в одном массиве 1С длиной п и одновременно фор-
980 Глава 25.7. АЛГОРИТМИЗАЦИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
мируют массив CN индексов ненулевых координат
Cj вектора с. Эти координаты предстоит найти на
вычислительном этапе алгоритма, но предварительно
подробнее рассмотрим процедуру формирования
массивов 1С и CN .
Перед объединением массивов AN и BN в
массив 1С длиной л, называемый массивом
переключателей, засылают нули. Затем из двух массивов
AN и BN выбирают более длинный (при па = пь
выбор произволен), и в результате его просмотра
заменяют в массиве 1С нули на условленное число —
переключатель (например, на 1) в тех позициях,
номера которых соответствуют числам в выбранном
массиве. В данном случае па > пь , и поэтому после
выбора и просмотра массива AN переключатели в
массиве 1С займут позиции, представленные ниже:
Номер позиции в
массиве 1С
Переключатели
1
0
2
0
3
1
4
1
5
0
6
0
7
1
8
0
9
0
10
1
11
0
0
При просмотре второго массива (в данном случае
массива BN ) замена нуля на переключатель в массиве
1С происходит аналогично, но только в тех позициях, в
которых остались нули после просмотра первого массива.
Для рассматриваемого примера при просмотре массива
BN замена нуля на переключатель в массиве 1С
произойдет лишь в позиции 5, так как в позициях 4 и 10
такая замена произошла при просмотре массива AN . В
итоге массив 1С примет вид:
Номер позиции в
массиве 1С
Переключатели
1
0
2
0
3
1
4
1
5
1
6
0
7
1
8
0
9
0
10
1
11
0
0
Замена нуля на переключатель при просмотре
массива BN означает, что после сложения векторов
а и Ь вектор С наряду с па ненулевыми
координатами может иметь еще несколько ненулевых
координат. Поэтому после каждой такой замены номер
соответствующей позиции массива 1С следует
заносить в позиции, добавляемые к массиву AN при
формировании массива CN . В данном случае такая
замена произошла лишь 1 раз в позиции с номером 5
массива 1С . Поэтому к массиву AN следует
добавить лишь одну позицию, в которую нужно записать
этот номер, а массив индексов ненулевых элементов
искомого вектора с будет иметь пс - па + 1 позиций
и примет вид CN = {10,3,7,4,5}.
После формирования массива CN ,
определяющего пока лишь структуру вектора с - а + Ъ ,
вычислительный этап алгоритма сложения векторов
можно выполнить разными путями. На первый
взгляд, достаточно прост следующий путь. В первой
позиции этого массива стоит номер 10 индекса
ненулевого элемента с10 = л10 + biQ искомого вектора.
Для его вычисления необходимо путем просмотра
массивов AN и BN найти номера позиций,
которые в массивах AR и BR занимают значения
соответственно ^ю = 0, 2 и ^>10 = 0,5 , и только потом
сложить эти значения, а затем перейти ко второй
позиции массива CN и т.д. Такой путь связан с
выполнением большого количества операций
просмотра массивов и поэтому неэффективен.
Целесообразно поступить следующим образом.
Сначала при помощи массива CN формируют так
называемый массив UC указателей длиной п ,
начальные значения которых равны нулю. В
рассматриваемом примере в первой позиции массива CN
стоит число 10, т.е. CN (1) = 10 . Это означает, что в
первой позиции массива CR длиной пс - 5 ,
предназначенном для записи координат искомого вектора
с, будет после вычисления записана координата С10 .
Поэтому полагаем £/С(10) = 1. Так как CN{2) = 3,
то полагаем UC (3) = 2 и вообще при CN (&) = т
имеем UC (/я) = к . В итоге получим следующий
массив указателей:
Номер позиции в
массиве L/C
Указатели
1
0
2
0
3
2
4
4
5
5
6
0
7
3
8
0
9
0
10
1
11
0
0
Далее формируем массив CR длиной пс - 5
с нулевыми начальными значениями элементов.
Просматривая массивы AN и BN , при помощи
массива L/C определяем позиции массива CR , в
которых должна быть записана сумма
соответствующих координат векторов а и Ь . Например, в первой
позиции массива AN находим AN (\) - 10 . Этому
значению соответствуют указатель £/С(10)=1 и
значение у4/?(1) = 0, 2 координаты я10 .
Следовательно, можно записать CR (1) = 0 + AR (1) = 0, 2 .
ОПЕРАЦИИ С РАЗРЕЖЕННЫМИ МАТРИЦАМИ
981
Затем находим AN (2) = 3 , UC (3) = 2 , AR (2) =
= 0,3 и CR{2) = 0 + 0,3 = 0,3 . Ясно, что в итоге
просмотра массива AN получим массив CR =
= {0,2; 0,3; 0,4; - 0,7; 0} , отличающийся от
массива AR лишь одной дополнительной позицией с
нулевым значением. Поэтому в данном случае можно
было бы не проводить просмотра массива AN , a
сразу сформировать массив CR в указанном виде.
Теперь переходим к просмотру массива BN .
Так как BN(1) = 5 , то 6/С(5) = 5, BR(\) = 0,6
и CR(5) = CR(5) + BR(l) = 0 + 0,6 = 0,6. Затем
определяем BN (2) = 4 , £/С(4) = 4, ЯЛ (2) = 0,7
и CR(4) = CR(4)+BR(2) = -0,7 + 0,7 = 0.
Наконец, по iW(3) = 10 находим £/С(10) = 1,
ЯЛ (3) = 0,5 и СЛ(1) = СЛ(1) + АЛ(3) = 6,2 +
+0,5 = 0,7 . В итоге получаем массив CR =
= {0,7; 0, 3; 0,4; 0; 0, 6} . Отметим, что при
сложении один из ожидаемых ненулевых элементов
массива CR оказался равным нулю. Взаимное
уничтожение действительных чисел происходит достаточно
редко, и поэтому можно примириться с тем, что
некоторые из хранимых координат разреженного
вектора на самом деле являются нулями. Но при
сложении специальных матриц (например, матриц
инциденции в теории графов), имеющих большое
число элементов, равных ±1, такие случаи будут
частыми, что потребует модифицировать алгоритм
сложения векторов.
Описанная процедура вычислительного этапа
содержит число элементарных операций,
пропорциональное сумме па + пь . К этому числу следует
добавить п операций засылки нулей при формировании
массива переключателей. Отметим, что за один
индексный и один вычислительный этапы можно
сложить любое число разреженных векторов, а также
вычислить их линейную комбинацию. При этом
массив переключателей может объединить любое
число массивов с индексами ненулевых элементов
этих векторов. Этот же массив переключателей
можно использовать при сложении разреженных матриц,
когда приходится складывать несколько пар
векторов, соответствующих, например, столбцам этих
матриц. В этом случае в массиве переключателей
каждому столбцу искомой матрицы должен
соответствовать свой переключатель (например, номер этого
столбца).
Пусть теперь требуется вычислить скалярное
произведение двух разреженных векторов а и b
размером п при компактном неупорядоченном
варианте их хранения в массивах AR и BR длиной
соответственно па и пь. Прямолинейная попытка
вычисления скалярного произведения привела бы к
необходимости много раз просматривать массив BN
с индексами ненулевых координат Ь{ вектора b .
Убедимся в этом на примере умножения тех же
векторов, что и при сложении. Действительно, после
нахождения в первой позиции массива AR
ненулевой координаты д10 = 0,2 вектора а необходимо
найти значение сомножителя b[Q . Для этого
необходимо просмотреть весь массив BN и установить, что
этому индексу соответствует третья позиция этого
массива, а затем из третьей позиции массива BR
извлечь значение bl0 = 0,5 и, наконец, вычислить
а\0^10 = 0» 1 и запомнить это значение. Во второй
позиции массива AR записана координата
д3 = 0,3 . Снова приходится повторить процедуру
просмотра массива BN только для того, чтобы
убедиться, что Ь3 = 0 . В итоге число элементарных
операций при просмотре будет равно папь .
Более эффективен алгоритм скалярного
умножения, использующий массив индексов U
длиной п . Этот массив формируют за один
просмотр массива AN , и для рассматриваемого
примера его вид представлен ниже:
Номер позиции в
массиве U
Индексы
1
0
2
0
3
2
4
4
5
0
6
0
7
3
8
0
9
0
10
1
11
0
0
Значение я3 записано в позиции 2 массива
AR , значение а4 ~~ в позиции 4, а7 — в позиции 3
и д10 —в позиции 1 этого массива, а все остальные
координаты вектора а равны нулю.
Затем за один просмотр массива BN при
помощи массива U удается найти все сомножители,
которые дадут ненулевые произведения afy
координат векторов а и b , вычислить и просуммировать
эти произведения, получив искомый результат. В
самом деле, на первом шаге просмотра массива BN
устанавливаем, что BN (1) = 5 , но U (5) = 0 , т.е.
д5=0, так что произведение а$Ь$ =0 не даст
вклада в искомое скалярное произведение векторов.
На втором шаге находим BN (2) = 4 и
[/ (4) = 4 ф0 . Поэтому из массивов AR и BR
извлекаем значения соответственно AR{4) = a^ =
= 0,7 и BR(2) = b4 = -0,7 , находим a4b4 = -0,49
и записываем этот результат в ячейку h памяти,
выделенную для значения скалярного произведения.
Наконец, на последнем (третьем) шаге просмотра
массива BN , определяемом значением Пь = 3 ,
982
Глава 25.7. АЛГОРИТМИЗАЦИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
имеем Z?/V(3)=10 и U (10) = 1 Ф 0 , из массивов
AR и BR извлекаем значения соответственно
AR(i) = al0 =0,2 и BR(3) = £10 =0,5,
вычисляем ^ю^ю = 0,1 и получаем искомое значение
h = h + fl|o^io = -0,49 + 0,1 = -0,39 скалярного
произведения заданных векторов.
Описанный алгоритм особенно удобен в
случае, когда один и тот же вектор а нужно ска-
лярно умножить на несколько различных
векторов. В этом случае массив U формируется 1 раз и
многократно используется при однократном
просмотре массива индексов координат каждого из
сомножителей вектора а.
Наряду с хранением по столбцам или строкам
симметрическую разреженную матрицу может
оказаться рациональным хранить в виде так называемой
ленты. Квадратную матрицу называют ленточной,
если все ее ненулевые элементы заключены внутри
ленты, образованной побочными диагоналями. Для
симметрической ленточной матрицы А ее элементы
Оу = 0 при |/ - j\ > р е N и ак к_^ Ф 0 , либо
ak,k+Q * 0 хотя бы для одного значения к е N .
Значение р называют полушириной ленты, а
значение 2р + 1 - ее шириной. При р = 1 ленточную
матрицу называют трехдиагональной, при р = 2 -
пятидиагональной, а при р = 0 ленточная матрица
вырождается в диагональную.
Таким образом, в каждой строке
симметрической ленточной матрицы не более 2р + 1 ненулевых
элемента. Если это значение существенно меньше
порядка п такой матрицы, то ее рационально хранить
в виде верхней или нижней полуленты, т.е. части
ленты выше или ниже главной диагонали, включая
главную диагональ. При этом используют
диагональную схему хранения в виде прямоугольной матрицы
А размером п х (р + 1) , иллюстрируемую
следующим примером для матрицы А порядка /1 = 7 с
полушириной ленты Р = 2 :
[10 0 0 0 0 0]
0 2 8 9 0 0 0
0 8 3 0 0 0 0
0 9 0 4 8 0 0
10 0 8 5 9 8
10 0 0 9 6 0
10 0 0 8 0 7
, л =
(1 0 0Л
2 8 9
3 0 0
4 8 0
5 9 8
6 0-
7 - -j
В этом случае в матрице А размером 7x3
записана верхняя полулента, причем в первом столбце
хранятся элементы главной диагонали, а в следующих
столбцах - элементы более коротких верхних побочных
диагоналей. При этом в столбце матрицы А с
номером j\ будет не определено у* - 1 элементов. При
хранении нижней полуленты матрицы А главную
диагональ записывают в последний столбец матрицы А , а
нижние побочные диагонали - в остальные столбцы со
сдвигом на одну позицию вниз при каждом смещении
влево.
Диагональная схема хранения удобна с точки
зрения доступа к элементам матрицы А, поскольку
имеется простое однозначное соответствие между
положением каждого ненулевого элемента а^ в
матрице А и его положением в матрице А , где он
сохраняет номер / строки, а его номер столбца
принимает значение у - / при хранении верхней
полуленты и значение у - / + р + 1 при хранении
нижней полуленты.
Симметрические ленточные матрицы
возникают при преобразовании многих ММ к системе
линейных алгебраических уравнений (СЛАУ) с
применением методов конечных разностей или конечных
элементов. Существуют алгоритмы, позволяющие
одновременной перестановкой строк и столбцов,
сохраняя симметрию ленточной матрицы,
минимизировать полуширину ее ленты. При решении СЛАУ с
разреженной симметрической матрицей методом
Гаусса исключения неизвестных могут возникнуть
новые ненулевые элементы. Но при выборе главных
элементов на главной диагонали такие элементы
появляются только в пределах ленты, так что для них
уже зарезервировано место при диагональной схеме
хранения исходной матрицы.
Разреженную матрицу иногда удобно
представить в виде блочной. При этом часто удается более
простым способом решить проблемы экономного
хранения ненулевых элементов и построить более
эффективные алгоритмы вычислений с такими
матрицами.
СПИСОК ЛИТЕРАТУРЫ
1. Блехман И.И., Мышкис А.Д., Пановко Я.Г.
Прикладная математика: предмет, логика,
особенности подходов. Киев: Наукова думка, 1976. 270 с.
2. Краснощекое П.С, Петров А.А. Принципы
построения моделей. М.: Изд-во МГУ, 1983. 264 с.
3. Лебедев А.Н. Моделирование в научно-
технических исследованиях. М.: Радио и связь, 1989.
224 с.
4. Максимей И.В. Имитационное
моделирование на ЭВМ. М.: Радио и связь, 1988. 232 с.
5. Мышкис А.Д. Элементы теории
математических моделей. М.: Наука, 1994. 192 с.
6. Норенков И.П. Основы автоматизированного
проектирования. М.: Изд-во МГТУ им. Н.Э.
Баумана, 2000. 360 с. (Сер. Информатика в техническом
университете).
7. Самарский А.А., Михайлов А.П.
Математическое моделирование. М.: Наука, 1997. 320 с.
8. Тарасик В.П. Математическое
моделирование технических систем. Минск: Дизайн-ПРО, 1997.
640 с.
предметный указатель
Автономная система линейная 10 7 1
Аксиома Архимеда 2 2 4
- выбора 14 1 1
- индукции 2 2 4
- отделимости 2 3 1
-счетности 14 4 2
Алгебра 5 6 1, 8 4 4, 9 2 4, 14 2 1, 18 2 1
Алгоритм Демукрона 9 3 8
- Евклида 5 1 4
- Квайна — Мак-Клоски 9 4 6
- Флойда — Уоршелла — Клини 9 3 6
Альтернатива 10 4 1, 24.4 5, 25 1 2
Альтернирование 7 8 4
Антиградиент 21 1 1
Антисимметричность 9 1 3
Аппроксимация 23 9 3
Арность 5 6 1
Асимптота 2 3 4, 2 7 4
Ассоциативность 5 6 1
Атлас 8 3 1
Аттрактор 10 5 4
Базис 6 1,6 2.2, 7 1 3, 7.3.3, 7.8.1, 14.7.5
- Жегалкина 9 4 4
- Френе сопровождающий 8 1 5
-Хамеля 14 1.3
Банахово пространство (Я-пространство) 14.1 3
Белый шум 20 1 4, 20 3 4, 20 5 4
Бета-функция 2 11 4, 12 4.4
Биекция 2 1 6, 14 1 1
Бинормаль 8 1 5
Бифуркация 10 5.4
Броуновское движение 20 5 3
Булев куб 9 2 4
Валентность 7 8 3
Вариация меры полная 14.2 2
Вектор 2 1 4, 6 1, 6.2.1, 6.4.2, 7.1, 7.3, 7.8.1, 14.1.3, 24.6.1,
25.7.3
- Дарбу 8 1 9
- касательный 8.3 4
- нормальный 6 4 1,651
- собственный 7 5.2, 14.6 2
Вектор-функция 2 14 1
Векторная трубка 2 14.2
Вероятность 18.1, 18.2
- доверительная 19 5 1
- перехода 20 4 2
Вершина 1 2, 1 4, 6.6, 6 7, 9 3 1, 9.3.5
Вход (выход) сети 9 3 8
Выборка 19 1, 19.3.2
Выборочная траектория 20 1 1
Высказывание 2 1 1
Вычет 4 8 1,4.8 3,4 8.4
Вычитание2.2 1,5 1 2, 562
Галеркинские приближения 13.5 5, 13 5.6
Гамильтониан 22.1.1, 22 3 1, 22 5 1
Гамма-функция 2 11.4, 12 4 4, 19.2 1
Гармоническая четверка 6 9 4
Гильбертово пространство (//-пространство) 14 13
Гипербола 6 6.2
Гиперболоид 6.7 2
Гипотеза 18 2 8, 19 7 1
Гистограмма 19 1.2
Главное значение 1 6.3, 2.2 5, 2 10 5,4.3 4
Годограф 2.14.1
Гомеоморфизм 8 2 1
Гомоклиническая траектория 10 5 4
Гомология 6 9.4
Гомоморфизм 5 6 1,937
Горизонт планирования 24.6 1
Градиент 2 8.6, 2 144,21.1.1
Граница 2.2.2, 2.3.1, 4.1.4, 14.1.2, 24.4.2
Грань верхняя (нижняя) 9 1 5, 14.1.1
-точная 2.2.2, 9.1.5
Граф 9.3
График 1.6 1,2.1 5,9.1 1,14 6 1
Группа 5.6 2, 9 3 7
Действие по Гамильтону 25 5 3
Делители нуля 5 6.3
Дельта-функция 16.1 1
Дерево 9 3 3, 9 3.4
Дефект 7 4.1, 23.5 3
Диаграмма Хассе 9 1.5
Дивергенция 2 14.4
Дизъюнктивная нормальная форма (ДНФ) 9 4
Дизъюнкция 9 4
Динамическая система 10 5 1, 10.5 4
Директриса 6.6 3
Дисконтирование 24 6 2
Дискретное запаздывание 10.7.1
Дисперсия 18.3,19.1.3,20 1 3
Дистрибутивность 5 6 1
Диффеоморфизм 8.3.2
Дифференциал 2 5, 2.8, 4 4 1, 8.3.6, 14.9.1, 17.6.2
Дифференцирование 2 5 1, 2.12.3, 3.2.5, 8.4.2, 23.6, 23.8.7
Длина 2.10.7, 6.1, 8 1.2,9 3 1,9.4 6
Доверительный интервал 19 5 1
984
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Доминирование 9 1 5
Дополнение 2 1 3, 5 3.3, 7.2 2, 7 3 3, 9.2.4, 14.7.1
Доход ожидаемый 24 6
Евклидово пространство 7.3.1, 14 1.3
Единица 2 2.1, 5 6, 9 2 1
- полезности денег 24 7 1
- функции нижняя 9.4 7
Задача Больца 15 2.4
- вариационного исчисления 24.1 4
- выбора кратчайшего пути 24.5.4
- глобального анализа графов 9 3 5
- детерминированная 24.1.3
-Дирихле 13 4 4,23 9.1,23.10 2
- изопериметрическая 15 2.1
-Кошк 10 1 2,10 8 1, 13 2,23 8 2,23 10
-краевая 104, 13.1.3, 13.4.4,13 5.2,23 8 6,23.10 2
- Лагранжа 15.2 2
- Летова — Калмана 22.1 2, 22.3 2
-Майера 15 2.3
- многокритериальной оптимизации 24 1.4
-Неймана 13 4 4
- о назначениях 24.5.3
- оптимального управления 24.1.4
- предсказания 19 4 3
- принятия решений 24 1 3, 24 6, 24 7
-смешанная 13.2, 13.4
- стационарная 23 10 2
- стохастическая 24 1 3
- транспортная 24 3, 24 5 1
- Штурма — Лиувилля 10 4 3
Закон больших чисел 18 5 9
- инерции 7 7 1
Законы де Моргана 2.1 3, 9.2.4
Замыкание 2 3 1, 4 1 4, 9 4 4, 14 4 1, 14 6.1
- инволютивное 8.4.5
- рефлексивно-транзитивное 9 1.3
Значение собственное 7 5 2
- оптимальное 24 4 1
Идемпотентность 2 I 3
Измеримое пространство 14.2 I
Изоклины 10.1 5
Изоморфизм 5.6 1,7 4.1,93 7
Импликация 9 4
Инвариант 7 5 1,7 8 3,23.10.3
Инвариантная мера 10.5.2
Инвариантное подпространство 10 5.4
Инверсия 5 3 1,9.4 7
Индекс 8 4 1
Индуктивность 25 3.2
Интеграл Бернулли 25 6 4
- Бохнера 14 3.3
- вероятности 12.4 3
- Гильберта сингулярный 17 4 1
-Дирихле 15 5 1
- дифференциального уравнения 10 1.1
- Дюамеля 114 2
-контурный 4 5.1
-Коши 4 5 3,17.4.1
- Коши — Лагранжа 25.6.4
- кратный 2 12
- криволинейный 2.13 1
- Лапласа 11.41
-Лебега 14.3.4
-линейный 4 5.4
-Меллина 11 4.1
- неопределенный 2.9 1
- несобственный 2 10 5, 2.12.6
- определенный 2 10 1
- поверхностный 2 13.5
- повторный 2 112
-Пуассона 13.2.2
-Римана2 10.1
- эйлеров 2 11.4
-эллиптический 12 3.1
Интегралы Френеля 12 4.2
Интегральная кривая 8 4.3, 10 11
Интегрирование 2.9 2, 23 7
Интенсивность перехода 20 4.4
Интервал сходимости 3.3 2
Интерполяционный многочлен 23.5-23 8
Информация Фишера 19 3.1
Иррефлексивность 9 1 3
Итерация элемента 9 2 2
Карта 8 3
- Карно 9.4.6
Касательная 1 2 5, 2 5 1,8.1 3
Квазипорядок 9.1 3
Квантиль 18 3 1, 19 1 1
Квантор 2 1 1
Класс множеств монотонный 14 2 1
- Поста 9.4 7
-смежности 14 1 3
- эквивалентности 9.1 4
Клетка жорданова 7 5 4
Ковариация 18 4 3, 18 4 7
Ковектор 7 8.1
Коллинеация 6 9 4
Кольцо 5 1 2, 5 6 3
Коммутативность 5 6 I
Коммутатор векторных полей 8 4 4
Компакт 14.4 4
Композиция 2 1 5, 9 1 2
Компонента связности 9 3 1
Константа булева 9.4.1
Константы Фейгенбаума 10.5 4
Конституэнта 9 4 5
Контур 4 1.4, 9 3 I
Конус 1 4 4, 6 7 4, 9 1 5
Конъюктивная нормальная форма (КНФ) 9 4 5
Конъюнкция 9 4
Координаты вектора 6 1.6, 6 3, 6 8 1, 6 9 2, 7.1.3, 7 8 2, 8 2 I,
8.3
Корень 5.1 6,9.3.3
Корреляция 18 4 3. ! 8 4 7, 19.1 3
Кортеж 2.1 4
Косинус интегральный 12 4.1
Косинус-преобразование Фурье 11.2 3
Коэффициент 4.4.4, 6 7, 24 1.5, 24.6 2
Коэффициенты Тейлора 4.6 2
- Фурье 3 4 1,35
Кратность 4 7 1, 5 1 6, 7 5 2
Кривая 2 13 1,4.1.4,6.3 4,8 1,8 34
-Пирсона 19 2.1
-Стьюдента 19.2.2
-Фишера 19 2.3
Кривизна 8.1, 8.2
Критерий Гурвица 10 6.3, 24 7.2
-значимости 19 7.1
-Коши 2 3,2 10 6,3 I 2,3.2,4 2.1,4.6.1
-Лапласа 24.7 2
- минимаксный (максиминный) 24 7 2
- наиболее вероятного исхода 24 7 1
- ожидаемого значения 24 7 1
- оптимальности 24.1 1
- Поста 9.4 7
- предельного уровня 24 7 I
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
985
- Сильвестра 7 7 3
- скалярный 24 1 5
- согласия 19 7 1
- статистический 19 7 1
- Сэвиджа 24 7 2
- хи-квадрат (Пирсона) 19 7 3
- "ожидаемое значение — дисперсия" 24.7 1
Критическая область 19.7 1
Круг кривизны 8 1 4
- сходимости 3 3.1, 4 2.3
Кручение 8 1.8
Куст 9 3 3
Лебегово пространство 14 3 7
Лемма о конечном покрытии 2 3 1
-Фату 14 3 5
- Цорна 14 11
- Шварца 4 9 4
Лес 9 3
Линейная комбинация 5 2 6, 6 1 5, 7.1 2, 14 5.1
- оболочка 7 2 1,14 13
Линейное пространство 7 1, 14 1 3, 14 5.1
- топологическое пространство 14 4.6
Линия векторная 2 14.2
- равного потенциала 4 5 4
- регрессии 19 4 3
-тока 2 14 2,4 5 4
- уровня 2 14 2
Лист 9 3 3
Литерал 94 5
"Лицо, принимающее решения" 24.1.1
Логарифм интегральный 12 4 1
Локально выпуклое пространство 14 4 6
Мажоранта 2 2 2, 3 2.4,4 6 1,14 1 1
Максимум (минимум) 2.7, 2.8, 14.9.2
Математическое ожидание 18 3, 18 4, 20 1 3
Матрица 5 2-5 4, 7 4-7 7, 9 3 2, 23 2 3, 23 8-23.10, 25 7 3
- вполне неотрицательная 17 3 3
- вращения 23 3 5
-Гессе 2 8 3,21 1 I
- Гильберта 23 5 4
-Грама7 3 3, 14 1 3
- Гурвица 10.6 3
- достижимости 9 3 2
- дохода 24 1 3
-затрат24 7.2
- инциденций 9 3 2
- меток дуг 9 3 6
- осцилляционная 17 3 3
- перехода 7 I 5
- переходная 20 4 2
- переходных вероятностей 24.1 3, 24 6
- плана 19 4 1
- потерь 24 7 2
-регрессионная 19 4 I
- смежности вершин 9 3 2
- сожалений 24 7 2
- спектральная 20 3 2
- стоимости 24 5 3
-Якоби2 8 1,836,2335
Медиана 18 3 1
Мера 14 2, 14 3 6, 14 5 2
-Винера 14 3 9
-Лебега 14 2 2
- спектральная 14 8 3, 14 8 5
Метка пути 9 3 4, 9 3 6
Метод Адамса 23 8 4
- барьерных функций 213 1
- Бериулли 10 15
- Блейка 9 4 6
-вариации произвольных постоянных 10.1 5
- вариационный 13 5 3
- введения параметра 10 15
- ветвей и границ 214 2,2441
- возможных направлений 21 3.2
- вращения Якоби 23 4 1
-Галеркина 13.5.6
- гармоник Фурье 23 9 4
- Гаусса 5 3 4, 9 2 3
- Гаусса — Зейделя 21.22
- Годунова 23 10 3
-Гомори 21 4 2
- градиентного спуска 212 2
-деформируемого многогранника 21 2 1
- дихотомии 21.2 1, 23 3 2
- Дэвидона — Флетчера — Пауэлла 212 2
- Зейделя 23 2 4, 23 9 1
- Зойтендейка 213 2
- золотого сечения 212 1
- интегрируемых комбинаций 10 16
- исключения Гаусса 23 2 1
- итераций по стратегиям 24 6 2
- итерационный 23 2 4, 23 3 1
-квадратичной интерполяции 212 1
- комбинаторный 24 4.1
- компромиссов 24.1 5
- конечных разностей 23 8 7, 23 9.1
- - элементов 13 5 6
- конфигураций 21.21
- кубической интерполяции 212 2
- Лагранжа 7 7 I
- максимального правдоподобия 19 3 2
- малого параметра 10 3 2, 10 9 5
- Марквардта 212 3
- минимальной стоимости 24 5 5
-моментов 19 3 3
- Монте-Карло 19 6 1
- наилучшей пробы 21.21
- наименьших квадратов 7 3 6, 19 4 2, 23 5
- Нелдера — Мида 212 1
- неопределенных коэффициентов 5 I 8, 9 4 7, 10 3 1
-Ньютона 21 2 3,2334,2335
- округления 24 4 1
- оптимизации 23 3 I
- Остроградского 2 9 4
- отсечений 24 4 I
- парабол 23 3 4
- переменных направлений 23 10 1
- покоординатного спуска 21 2 2
- полного перебора 24 6 3
- последовательного дифференцирования 10 3 I
- последовательной безусловной минимизации 213 1
- последовательных приближений 10 3 1
- потенциалов 24 5 5
- прогонки 23 2 3, 23 8 7, 23 10 I
- проекции градиента 21 3.2
- простой итерации 23 2 4, 23 3, 23 9 I
- прямых 23 10 4
- Пуанкаре — Ляпунова 10 9 4
- равномерного поиска 212 1
- релаксации 23 2 4, 23 9 I
- Ритца 13 5 6
- Розеиброка 213 2
- Рунге — Кутта 23 3 4
- секущих (хорд) 23 3 4
- сечений 6 7 6
- симплексный 24 5 5
- случайного поиска 212 1
-сопряженных направлений 212 1
986
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
- статистических испытаний 19 6 1
- степенных рядов 10.3.1
-усреднения 10 9 7
-установления 23.10 2
- факторизации 17 5 3
- Фибоначчи 21.2 1
- Флетчера — Ривса 21.2.2
- Фробениуса 10 9 2
-Фурье 13 2 3, 13 3.5, 13.4.7,13.4 8
- характеристик 13 2 5, 23 10 5
- Хука — Дживса 212 1
- штрафных функций 213 1
-Эйлера 10.2 3,20.7 6, 23.8
- элементарных преобразований 5.3.5
Метрика 4 14,1412
Метрическое пространство 14.1.2
Минимакс (максимин) 24 1 4
Минор 5.3.3, 5 3 5,7 7.3, 17 2.2
Миноранта 2 2 2, 14 I 1
Многогранник выпуклый 1 4 3, 24 1 4
Многообразие 8 3 I
- интегральное 8 4 5
Многочлен 1 6.4, 5 1,634
- Тейлора 2 6 4
- характеристический 7 5.1
Множество 2 I 2, 14 II
- вполне ограниченное 14 4 5
--упорядоченное 9 1.5, 14 1 I
- выпуклое 2 3 1, 14 4 6
- замкнутое 2 3 1, 14 I 2, 14 4 I
- индуктивное 9 I 5
- компактное 14 4 4
- компромисса 24 1.5
- ограниченное 2 2 2, 2 3 I, 14.4.5
- открытое 2 3 1,14 12
- 11арето 24 I 5
- плотное 2 2 4, 10 5 2, 14 1.2, 14 4 2
- резольвентное 14 6 2
- связное 2 3 I
- счетное 2 1 8
-упорядоченное 9.1 5, 14 I I
- фрактальное 10 5 4
Множитель Лаграпжа 2 8 8
Модель 5 6 1,25 I 3
- линейная регрессионная 19 4 I
- математическая 25 I I, 25 2
-параметрическая 19 I I
- регулярная 19 3 1
- аатистическая 19.1 I
Модуль 2 2 5, 6 1,84 5
Момент 2 10 7, 18 3 4, 19 1 3
Мощность множества 2 I 8
Наблюдатель 22 I 3, 22 4 2
Направление главное 8 2 7
Направляющая 6 7
11аправляющие косинусы 6 I 7
11евязка 7 3 6
Необходимое условие Вейернлрасса 15 I 2, 15 4 I
Лежапдра 15 12,1541
Эйлера 15 12
Якоби 15 I 2
11еравепст ва Коши 4 6 2
Неравеис1во Песселя 3 4 I, 14 7 5
- I ельдера I I 5
Коши — Бумяковскою I I 5, 7 3 I, 14 I 3
- Рао — Крамера 19 3 1
- С|еклова - Пуанкаре 13 4 3
- ipeyi ольника I 2 2, 2 2 3, 7 3 2
- Чебышева 14 3 3, 18 5 I
Норма 14 1 3,7.3.2,7 3.5, 14.4 6
Нормаль 2.8 6, 2 13 5, 8.1 5
Нормальная система 10 11
Нормальное пространство 14 4 2
Нормированное пространство 7 3 2, 14 1 3
Носитель 5 6.1, 8.3 I, 16 1.3
Нуль 2.2.1, 5.6, 9 2 1
Нуль-вектор 6 1
Область 2 3 1,4 1 4
- адекватности 25 2 2
-доверительная 19 5 1
-замкнутая 2 3 1,414
-значений 2.1 5, 14.1 1
- интегрирования 2 12 3
- критическая 19 7 1
-определения 2.1.5, 3 2 1,8 3 1,9 1 I, 14 1 I
- сходимости ряда 3 2.2, 4 2 3, 4 6 3
- целостности 5.6.3
Обобщенная функция 14 3 7, 16 I 3, 16 2.2
Образ2 1.5,74.1,14.1 1
Образующая 6 7
Обратный элемент 5 6 2
Общий интеграл 10 11
- член ряда 3.1 1
Объединение 2 1 3,9 2.4, 18.2 I
Объем 2.10 7, 2 12 2
Ограничение 7.5.2, 9 I 2, 21 1 3, 24 2 1, 24 4 5
Окрестность 2 3 I, 8.3 1, 14 4
Окружность соприкасающаяся 8.1 4
Оператор 7 4 1,76,942, 134 I, 135 I, 14 I, 145 I, 146 I,
14.7, 17.1, 17.2, 17.4.4, 17.6.1
- в дивергентной форме 13 5 1
- Гамильтона (набла) 2 14 4
- Гаммерштейна 17 6.1
- Гильберта — Шмидта 14 7 5
- Лапласа 23 9 3
- потенциальный 13 5 6
- сжатия 17 6 3
- сжимающий 14 9 3
- Урысона 17 6 1
Операция I I 1, 5 2 2, 6 I 3, 9 2 4
- замены переменных 16 2.1
Определитель 5 3 2
- Вандермонда 5 3 4, 23 5 I
- Вронского 10 2 2
-Фредюльма 17 2 2
Оптимальное управление 22 1-22 4
Опускание индекса 7 8 4
Оригинал составной 114 3
Ориентация 6 2 2, 6 3 2
Ортогональная составляющая 7 3 4
Ортопроектор 14 7 4
Основной триэдр 8 1 5
Особая точка 10 5 3
OciaiOK3 I 2,3 2 2, 5 I 3
Остаточный член 2 6 4
Ось координат 6.3 I
- кривой второго порядка 6 6
- полярная 6 3 5
Отделение корня 23 3 I
Отделимое пространство 14 4 6
01юшк19 4 I
Отклоняющийся аргумент 10 7 1
О|ношение2 I 4, 5 6 1,9 1,9 3 1,9 3 7, 14 I I
- двойное 6 9 4
разностное 2 5 I
Отображение 2 I, 7 4 I, 8 3 2, 9 I 5, 10 5 4, 14 I I
- индуцированное 8 3 2
касательное 8 3 6
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
987
- конформное 4.4.4, 4.9 2
- перехода 8 3 1
-сжимающее 14.9 3
Отрицание 9 4
Оценка 18 4 3,20.8
- асимптотическая 2 3 6
-интервальная 19.5 1
-точечная 19 3 1
Очередь 9 3 4
Ошибка первого (второго) рода 19 7 1
- предсказания 19 4 3
Парабола 6 6 3
Параболоид 6.7 3, 6 7.6
- соприкасающийся 8 2.5
Параметр 1 6.1,6.6.3,8 1,25 2.1,25.3.1
Первообразная 2 9 1
Первый интеграл 8 4 5, 10.1.6
Переменное 2 1 5, 9 4, 24.4 I
-модели 24 2 1,24.5.1
Переменные канонические 6.6, 6 8.3, 7 7.1
-фазовые 25 2.1
Пересечение 2 13,7 2.2, 924,182.1
Перестановка 2.1.7, 5 3.1
Периодограмма 20 8 2
Период переходный 24 6 3
Пермутатор интегрального оператора 17 3 2
Петля 9 3 1
Пи-теорема 25 2 4
Плоскость касательная 2.8 6
- комплексная 2.2.5, 4.1.3
- координатная 6 3 1
- нормальная 8 1 5
- проективная 6 9 1
- соприкасающаяся 8 1.4
- спрямляющая 8 1 5
Плотность вероятности 18 3 12, 18 4 9
- переходная 20 4 1
- потока 25 6 2
- распределения 20 1 2
- спектральная 20 3 2
Площадь I 2 5, 1 3 3, 2 12 1
Поверхность 2 13 5, 6 3 4, 6.7, 6.8, 8.2
-уровня 2 14 2,21 I I
Погрешность 23 1 I
Подвижный трехгранник 8.1 5
Подграф 9 3 I
Поддерево 9 3.3
Подмногообразие 8 3 3
Подмножество 2 I 2
- замкнутое относительно операции 7 2 1
Поднятие индекса 7 8 4
Подпоследовательность 2 3 2
11одпрост ранство 721,75 2,1413,146 2,14.71
Подстановка 2 9 2, 5 3 1
- Эйлера 2 9 5
Подформула 9 4 4
Поиск в глубину (в ширину) 9.3 5
Показатель оптимизма 24 7 2
Покрытие 2 3 1, 14 4 4
Поле 5.6 3
- векторное 2 14, 4 5 4, 8 4 2, 8 4.5, 10 5 4
- направлений 10 15
- тензорное 8 4 I
- экстремалей 15 3 1
Поливектор 7 8 4
Полигон частот 19 1 2
Полипом Гурвица 10 6.3
- Жегалкина 9 4 7
- стандартный 10 6 3
- тригонометрический 3 4 1
Полиномы ортогональные 12 1.1, 12 5
Полуаддитивность 14.22
Полуалгебра множеств 14.2.1
Полукольцо 9 2
Полуокрестность 2 3 1
Полустепень вершины 9.3 1
Полюс 4.7.2, 6 3.5, 8 3 1
Порядок 9.1, 9.2.1, 9 4.1, 13 5.1
- касания поверхностей 8.2 5
- конечной группы 5 6 2
- алгебраической поверхности (кривой) 6 3 4
- роста 11.4.1
- уравнения (системы уравнений) 6 3 4, 10 1 1
Последовательность 2 1 5, 2.3 2, 3 2 1, 4.2 1, 14.1 2, 14 3.2,
14.4, 14.7.5
- асимптотическая 10 9.1
-весовая 20.2.1
-определяющая 14 3.3
Постоянная интегрирования 2 9 1
-Липшица 2.4 3
Потенциал 1 14.4, 4 5 4, 13.2 4, 13 3 4
Поток векторного поля 2 14.3, 8 4 3
Почти периодическое движение 10 5.2
Правило Бернулли — Лопиталя 2 6.3
- обобщенного поглощения 9.4 6
-Саррюса 5 3.2
- северо-западного угла 24 5.5
- суммирования по умолчанию 7 8 2
Предел 2.3, 3.2 3,4 2.1, 14.1 2, 14 2 1,14 4 7
- замечательный 2 3 6, 2.4 1
Предельный цикл 10.5 3
Предпорядок 9 1.3
Преобразование Абеля 3 1 9
- Вебера 112 6
- Ганкеля 11.25
- интегральное II 1, 20 2 4
- Кельвина 13 3 3
- Лапласа 16 2 5
-линейное 7.4 1, 20 2 1
- элементарное 5 2.6
- Меллина 112 7
- ортогональное 7.6, 7.7 2
- проективное 6 9 3
- тождественное 1 I 2, 2 1.6, 9 4 4
- эквивалентное 9.4 4
-Фурье 3.5, 11 2, 16 2 5
Признак Абеля 2 10 6,3.1 10
- Вейерштрасса 2 3 2, 3 2.4,4 6 1
- Даламбера 3 1.5
- Дини 3 4 3
-Дирихле 2 10 6,343,344
- Жордана 3 4 3
-КошиЗ 1 3,3.1 6
- Лейбница 3 1 7
- сравнения 2 10 6, 3 I 3
- сходимости необходимый 4 2.2
Пример Коши 3.3 2
Принцип аргумента 4 8.4
- вложенных отрезков 2 2 2
- Гамильтона 25 5 3
- двойственности 2 1 3, 9 I 5, 9 2 4
- декомпозиции 25 2 6
- дуальности 2 1 3
- компромисса 24 I 5
- Куранта минимаксный 13 4 5
-максимума 13 3 2,22.1.1,22 2 1,22 3 1,22 4 1
- наименьшего действия 13 4.4
- наложения решений 10 2 1
- недостаточного обоснования 24 7 2
988
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
- непрерывности 2 2.2
-Рэлея 13 4.4
- соответствия границ 4 9 3
- сохранения области 4 9.3
- Шаудера 17.6 3
Приращение 2.4.1, 2.8.2
Программирование математическое 21 4, 24.1.4, 24.2
- стохастическое 24.1.4
- целочисленное 21.4, 24.1.4, 24.4
Проекция 6.1.4, 6 2 2, 6 9, 7 3 4, 14.2.1, 14.7.4
Произведение 3 1 8, 5 1 2, 5 2.3, 5 6.3, 6 2, 7 3 1, 7.4.3, 7.8 4,
8.4.1,9.1.2, 14.1.3, 14.2.1, 14.5.1
-на число 3 1.2,5 2 2,6 1.3,7 1 1,7.4 3,7.8.4, 14.4 6,
14.5.1
-декартово 2.1 4, 14 2.1
-тензорное 8.4.1
Производная 2 5, 3 4 3, 4 4.1, 14.9.1
-Гато14 9 1
- обобщенная 3 4 3, 14 3.7
- по направлению 2 8 6, 2.14.4, 8.4 2
- Радона — Никодима 14.3 6
- смешанная 2.8 3
-Фреше 14 9 1
- функциональная 14 9 1
- частная 2 8
Промежуточный пункт 24 5 2
Прообраз 2 1.5, 14.1.1
Пространства Соболева 13 4 3
Пространство 14 1.1
- изображений 11 1
- обобщенных функций 16.1 3
- оригиналов 11 1
- основных функций 16 1.2
- проективное 6 9 1
- сопряженное 7 8 I
Процесс авторегрессии 20 3 4
- ветвления 24 4 2
- винеровский 20 5 3
- канонический 20.1 4
- Орнстейна — Уленбека 20 3 4
- ортогонализации Грама — Шмидта 7 3 3
- периодический 25 2.5
- пуассоновский 20 5 2
- рождения и гибели 20.4 5
- с независимыми приращениями 20 5.1
- с ортогональными приращениями 20 5 1
- с полосовым спектром 20.3.4
- с последствием 10.7 1
- с экспоненциально-гармонической ковариационной
функцией 20 3 4
- установившийся 25 2 5
Прямая проективная 6 9.1
- среднеквадратической регрессии 19.4 3
- Эйлера 1 2 6
Путь 8 3.4, 9 3 1
Равенство Парсеваля 3 4.1, 14 7.5
Радиус кривизны 8 1 4
- полярный 6 3 5
- сходимости 3 3, 4 2 3
- фокальный 6 6
Радиус-вектор 6 3 1
Разложение вектора в базисе 6 1 6, 7 1 3
- в ряд 3.3.2, 3 4 1,46 2
-единицы 14 8 2
- лорановское 4 7 2
- определителя 5.3.3
- по косинусам (синусам) кратных дуг 3 4.5
Размерность 7 1 4, 8 3.1,84 5
Размещение 2 1 7
Разность 2 1.3, 5.2.2, 6 1 3, 7 1 I, 14.1.3, 14 7.1
- симметрическая 2.1 3
Разрез 4 1.4
Разрыв функции 2 4.2
Ранг 5.3 5, 7.2 2, 7.4 1, 7.7 1, 7 8.3, 8.3.3, 9.3 5, 9 3 6, 24 1 5
Распределение 8 4 5, 16.1 3
-Бернулли 18.3.11
- биномиальное 18.3 11
-Вейбулла 18 3 14
-гамма 18 3 14
- геометрическое 18.3.11
- гипергеометрическое 18 3 11
-Коши 18 3.14,19.2.2
-Лапласа 18 3.14
- нормальное (гауссовское) 18 3.14, 18 4 18
- показательное (экспоненциальное) 18 3 14
-Пуассона 18.3 11
- равномерное 18 3
- регулярное 8 4.5
-Стыодента 19 2.2
-условное 18 4 10
-Фишера 19 2.3
-хи-квадрат 19 2 I
-Эрланга 18 3 14
Расстояние 1.2 2, 2 3 1, 8.2.8, 9 3 6
Рациональная дробь 5 1 8
Ребро 9 3.1,9 3 5
Регрессия линейная 19 4
Регуляризация 17 4 4
Регулярное пространство 14 4 2
Регулярность 13 5 7
Резольвента 14 6 2, 17 2
Рекуррентное движение 10 5 2
Реляционная система 5.6 1
Репер 6 3 1,8 1 5
Ресурс 24 2 1
Рефлексивное пространство 14 5 1
Рефлексивность 5 6 1, 9.1 3
Решение 1.1 4,5.4 1, 10 1.1
- допустимое 24 1
- классическое 13 4 4, 13 5 3
- невозмущенное 10 9 3
- обобщенное 13 4,135.2,16.2 3, 24 1 5
-общее 5 4 2, 10 1, 10.2
-оптимальное 24.1
-особое 10 1 5
- частное 5 4 1
- строго более предпочтительное 24.1.5
Ротор 2 14.4
РядЗ 1,3.2 2,3 4 1
- асимптотический 10 9 1
-вариационный 19 1 1
-Вольтерры 14 9 1
-Лорана 4 6 3,4 7 2
- Маклорена 3 3 2
-Неймана 17 2.2
- распределения 18 3 8
-статистический 19 1.2
- степенной 3 3.1, 3 3, 4 2 3, 10.9 2
- сходящийся 3 1, 3 2, 3 4 1, 4.2 2, 4.6 1
-Тейлора 3 3 2, 4 6 2, 10 9.2
- Фредгольма 17 2 2
-Фурье 3.4 1,3 5
Свертка 7 8.4, 8 4 1,11 3 2, 11 4 2, 18 4 17
Сепарабельное пространство 14 12
Сепаратриса 10 5 3
Сеть 9 3 8
Сигма-алгебра 14 2 1, 14 3.1
Сигнатура 5 6 1
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
989
Символ 2 1 1,2 3 6,7.8 3, 17 4.4
Симметрирование 7 8 4
Симметричность 5.6.1,9.1 3
Симплекс-метод 21.4 1
Синтез глобального скалярного критерия 24.1.5
Синус интегральный 12.4.1
Синус-преобразование Фурье 11.2.4
Система векторов линейно зависимая (независимая) 7.1.22
- ортогональная 7 3.3
- ортонормированная 3.4.1
- дискретная 25.2 6
- дифференциальных уравнений 10.1.1, 10.2
- жесткая 23 8.5
- континуальная 25 2 6
- координат 6.3, 6 6, 6.8 1, 8.3
-линейных алгебраических уравнений (СЛАУ) 5.4.1,
7.3.6, 24.2.2, 24.5.5
-Лоренца 10 5 4
- оптимальная 22
- плохо обусловленная 23 2
- тригонометрическая 3 4.1
Скачок функции 2 4 2
Слагаемое 2.2 1,561
След 7 5 1,13 4 3, 14.7.5
Сложение 2 2 1,5 6 3, 7 1 1, 7 4 3, 9 2 1, 9.4 2
Слой 23 10 1
Случайная величина 18 3, 18.4
- последовательность 20 1.1
-функция 20 1.1,20.2,20 4 4
Случайные события независимые 18.2.7
- - несовместные 18.2.1
Случайный вектор 18.4
- процесс 20.1
- - марковский 20 4.1, 24 6 3
- - стационарный 20.3.1
Собственная функция 10.4.3, 13.2 3, 13 4.4
Собственное значение 10.4.3, 13.2.3, 13.4.4, 14 7.5
Событие 18.2 1
Соответствие 9 1 1
Сопряженное пространство 14 5 1
Сортировка топологическая 9 3.8
Состояние равновесия 25.5 2
- установившееся 24.6.3
- цепи Маркова 20.4 2
Сочетание 2 1.7
Спектр 7 5.2, 14.6.2, 14.8 1
Сплайн (сплайн-функция) 23 5.3
Статистика 19.1 1, 19.5 2,19.7.1
Степень 1 6 4,5 1.1,6.3.4,9 3 1
Стоимость прохождения 9 3.6
Стохастическая эквивалентность 20.1.2
Стохастический дифференциал 20.6.3
- интеграл Ито 20.6
Стохастическое уравнение 20 7
Стратегия 24 6
Стрелка Пирса 9.4 2
Строки (столбцы) базисные 5.3 5
- - линейно зависимые (независимые) 5 2.6
Структура гладкая 8 3.1
- Пфаффа 8 4 5
Сумма 2 2 1,3.1 2,5 I 2,5 2,5 6.3,6.1.2,7 1.1,7.2.2,7.4.3,
7.8.4,8.4.1, 14.4.6, 14.5.1
- бесконечная 9.2.2
- интегральная 2.10 1, 2.12 1, 2.12 2
- ортогональная 14 7 1
-ряда 3.1.1, 3.2 2, 4 2.2
-частичная 3.1.1, 3.2 2,3.4.1
Суммы Дарбу 2.10.1
Суперпозиция 2.1.5, 9.4.4, 25.2.5
Сфера 1.4.4, 14.1 2
-Римана 4.1.3
Схема Бернулли 18.2 9
- Гаусса — Маркова 19.4 2
- Горнера 5 1 3
- из функциональных элементов 9 4.8
- классическая теории вероятностей 18 3.1
-Лакса23.9 4
-полиномиальная 18 2 10
- полунеявная 23.8 5
- расчетная 25 1.3
- эквивалентная 25 4.1
- явная (неявная) 23.8-23 10
Сходимость 3.1 1,3 1.7,3.2, 10.9 3, 14.3.2, 14.4.7, 18.5
Сюръекция 2 1 6, 14 1.1
- каноническая 9.1.4
Таблица Квайна 9.4 6
- критериальная 9.4 7
- транспортная 24.5.1
Тело 5.6 3
Тензор 7 8
- напряжений 25.6.3
- скоростей деформации 25.6.3
Теорема Абеля 3.3.1
- Банаха — Штейнгауза 14.6.1
-Безу5.1 3
-Бернулли 18 5.9
- Биркгофа — Хинчина 10.5 2
- Больцано — Вейерштрасса 2 3.1
-Бореля 18.5.10
- Вейерштрасса 3 4 1
- вложения для пространств Соболева 13.4 3
- Гельмгольца 2.14 5
- запаздывания 114 2
-Карлемана 18.3.5
- Колмогорова 18.5.10
-Коши26.2,3.1.8,452, 4.8.1,10.1.3
- Кронекера — Капелли 5 4.1
- Кэли — Гамильтона 7.5.1
- Лагранжа 2.6.2
-Лебега 14 3 5
- Линдеберга 18.5 11
- Лорана 4 6 3
-Ляпунова 18 5 11
- Мертенса 3 1.8
-Мореры 4.5.2
-Муавра — Лапласа 18.5.12
- о базисном миноре 5 3 5
- об интегрировании (дифференцировании)
изображения (оригинала) 11.4.2
-о мажорируемой последовательности 14.3.5
- о монотонной сходимости 14.3.5
- о неподвижной точке 9.1.5
-о непрерывности нелинейного оператора 13.5 1
-о плотности 13.4.3
- о скачке нормальной производной 13.2.4, 13.3 4
потенциала 13.2.4, 13.3.4
-оследах 13.4 3
- о собственных значениях 13.4 5
-о среднем 2 10.3,2 12 3, 13 3.2
- о существовании и единственности 13 4 7, 13.4 8
- основная алгебры 5 1.7
-Пеано 10.1.3
- Пифагора 1.2.6, 7.3.3
-Планшереля 11.3.1
- подобия 114 2
- Радона — Никодима 14.3 6
- разделения 22 2 3, 22.4 2
- Римана 3 1.7
-Рисса 14 5 2,14.7.1
990
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
- Ролля 2 6 1
- Руше 4 8 4
-смещения 11.4 2
- Сохоцкого 4 7 2
- Стеклова 10 4 3
-Стоуна 14.8 6
- Ферма 2 6 1
- Фредгольма 10 4 1
- Фробениуса 8 4 5
-Фубини 14.3.8
-Хана — Банаха 14 1 4
- Хаусдорфа 14 11
-Хинчина 18 5 9
- Цермело 14 11
- Чебышева 2 9 5, 18 5 9
- Четаева 10 6 6
- Эйлера 1 4 3
Теоремы Гульдина 2 10 7
-Ляпунова 10 6 5
- об устойчивости по Ляпунову 10 6
- об обобщенных решениях 13 4, 13 5
Тождество 1 1 2, 8 4 4, 9 2 4, 9 4
Толерантность 9 1 3
Топологическая эквивалентность полей 10.5 4
Топологическое пространство 14.4
Топология 14 4, 14 5
Точка внешняя 2 3 1,414
- внутренняя 1 2 3, 2 3 1, 14 4 1
- гиперболическая 8 2 5
- граничная 2 3 1, 14 1 2
- заострения 2 5 4
- изолированная 2 3 1
- критическая 2 7 1,287
- неподвижная 9.1.5, 14 9 3
- округления 8 2 7
- омбилическая 8 2 7
- особая 4 7 2
- параболическая 8.2 5
- перегиба 2 7 2
- покоя 10 5 3
- предельная 2 3 1, 10.5.2, 14.4.1
- прикосновения 14 4.1
- разрыва 2 4 2
- регулярная 8 1 1,8.2.1,14 6 2
- самопересечения 4 1 4
- стационарная 2 7 1, 2.8 7
- существенно особая 4 7 2
-угловая 4.1 4
- уплощения 8 2 5
- эллиптическая 8 2 5
Точки отделимые 8 3.1
Транзитивность 5 6 1, 9 1.3
Транспозиция 5 3 1
Транспонирование 5 2 3, 7.8 4
Тройка векторов левая (правая) 6 2.2
Удельная прибыль 24 2.1
Узел 9 3 1, 10 5 3,17 3.3,24 5 1
Умножение 2 2.1, 5.6 3, 7 1 1, 7.3.1, 7.4 3, 9.2.1
Универсум 2 1 3
Унитарное пространство 3 5
Уравнение алгебраическое 1 1 4, 6 3 4
- Беллмана 22.1 2, 22 2 2, 22 3 2, 22.4.2
- Бернулли 10 1 5
- Бесселя 12 2.1
- Винера — Хопфа 17 5 1, 20 8 3
- волновое 13 12
-Вольтерра 17.5 1
- в полных дифференциалах 10 15
-дифференциальное 10.1 5, 10.2, 10.7.1, 10.8.1, 23.9,
23.10
--канонического вида 10 11
--линейное 13 1 1, 13 4 1,13.5 5,23 2
- - обыкновенное 23 8 1, 23 10 5
- дифференциально-функциональное 10.7 1, 25 2 6
- Дункана — Мортенсена — Закаи 22 2 3
- Дюффинга 10 9 6
-интегральное 17 1
- интегро-дифференциальное 10 7 1, 25 2 6
- Клапейрона — Менделеева 25 3.6
-КлероЮ 1 5
- Колмогорова — Фоккера — Планка 20 7 5
- Колмогорова — Чепмена 20 4.4
-Лагранжа 10 1 5
-Лапласа 4 4 5, 12 1 1, 12 2 15, 13 1.2,23 9,23.10 2
- леволинейное (праволинейное) 9 2 3
-Матье 10.9 6
- метода моментов 20 7 4
- Мортенсена 22 2 3
- неразрывности 25 6 3
- однородное 6 7 7
- переноса 23 9 4
- полярное 6 6, 6 7
- Пуассона 13 1 2
- разностно-дифференциальное 10 7 1
-Риккати22 1.2, 22 2 3, 10 1 5
- связи 2 8.8
- состояния 25 2 4
- строго эллиптическое 13 4 4
-теплопроводности 13 1 2, 23 9, 23 10 1
- Фоккера — Планка — Колмогорова 22 2
- характеристическое 7 5 1
-Эйлера 15 4 1,25 5.3
- Эйлера — Остроградского 15 5 1
- Эйлера — Пуассона 15 13
- эллиптическое 13 5 3
-Якоби 15 I 2
Уравнения характеристик 10 8.1
-Эйлера 10.2 3
Уровень вершины 9 3 3, 9 3 8
- значимости 19 3 2, 19 7 1
- несклонности к риску 24 7 1
Условие Вейерштрасся — Эрдмана 15 15
- граничное 13 1 3, 13 4 7, 13 4 8, 22 I 2, 22 2 2, 22 3 2,
22.4.2, 22.5.2, 22.6.2
- интегрируемости 2 13.4
- Каратеодори 13 5 1
- коэрцитивности 13 5 3, 13 5 5
-краевое 10 4.1, 13 4 4, 15 4
-Липшица 2 4 3, 10 1 3, 17 6 3
- монотонности 13 5 4
- начальное 10.1 2, 13 1 3, 13 4 7, 13 4 8
- неопределенности 24 7
- отделимости 8 3 I
- риска 24 7
- согласования 10 7 1
-трансверсальности 15.1 4,22 1.1,22 3 I
- эллиптичности 13 5 3
- Якоби 15 12
Условия Дирихле 3 4 3, 11 2 1
- дополняющей нежесткости 2113
- Коши — Римана 4 4 2
- Неймана 13 5 2
- Рауса — Гурвица 10.6 3
- регулярности решения на бесконечности 13 3 3
- стационарности 21 1
Устойчивость 10 5 3,10 6 1,23.1 2,23 9,23 10 1
Уступка допустимая 24 1 5
Уточнение корня 23 3.1
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
991
Фазовая плоскость 10 5.3
-траектория 10 5
Фазовое пространство 10 5.1, 10.5 4
Фазовый поток 10.5.4
Фактор-множество 9.1 4
Фактор-пространство 14 1.3
Фильтр 20 7 3, 20 8, 22 2.3, 22 4 2
Фокус 6.6, 10.5 3
Форма билинейная 7 7.4
- жорданова каноническая 7 5 4
- квадратичная 7 7
- поверхности первая (вторая) 8 2.4
-линейная 7.8 1
- модели микроуровня вариационная 25 2.6
- полилинейная 7 8 2
Формула 9 4 4
- Байеса 18 2 8
- Бернулли 18 2 9
-Грина 2 14 6
- Даламбера 13 2 1
- Ито 20 6 3
- Кирхгофа 13.2 1
- конечных приращений (Лагранжа) 2.6.2, 14.9 1
-Коши4 5 3, 10.2.2
- Кош и — Адамара 4 2 4
- Лейбница 2 5 5
- Лиувилля — Остроградского 10 2 2
- Маклорена 2 6 4, 2 8 4
- Менье 8 2 6
- Муавра 2 2 5
-Ньютона —Лейбница 2.10.4
- Остроградского — Гаусса 2.14 6
- Остроградского — Лиувилля — Якоби 10 2.2
- Паункаре — Бертрана 17 4 3
- полного математического ожидания 18 4.12
- полной вероятности 18 2 8
- прямоугольников 23.7 1
- Пуассона 13 2 1
- Римана — Меллина 114 1
- Симпсона 23 7 1
- сложения вероятностей 18 2 4
- Стирлинга 2 114
- Стокса 2 14 6
-Тейлора 2.6 4, 2 8.4
-трапеций 23 7 I
- умножения вероятностей 18 2.6
- - плотностей вероятности 18 4 14
- Эйлера 2 2 5, 4 3 3
Формулы Виста 5 I 6
- Винера — Хинчина 20 3 2
- интегрирования 2 10 4
- Крамера 5.4 1
- приведения 1 3 I
- Френе 8 I 9
- Эйлера 3 4 2
Фундаментальная матрица 10.2.2
- система решений 5.4 2, 10 2 2
Фундаментальное решение 13.3 I
Функции Бесселя 12 2
- Макдональда 12 2
- Неймана, Вебера 12 2
- Ханкеля 12 2
- гиперболические I 6 4
- гипергеометрические 12 5 1
- интегральные 12 4 1
- Лежандра присоединенные 12.1.1, 12.5.3
- сферические (шаровые) 12.1 1
- тригонометрические 1 6 4, 4.3 3
- эллиптические 12.3
Функционал 7 8 1,14 1
Функция 2 1 5,4 3.1,8 II, 14 1 I
- аналитическая 3 3 2, 4.4 3
-антилинейная 14 1.4
- бесконечно малая (большая) 2 3 4, 2 3 6
- булева 9 4
- Вейерштрасса 15 3 2
- весовая 9.3 6, 16 2 4,2033
- влияния 13 4 2
- выпуклая вверх (вниз) 2 7 2
- гармоническая 13 3 2
- гладкая 8 3 2
- голоморфная 4.4 3
- голосования 9 4.2
-Грина 10.4 1, 13 3 1,16 2 4
- двойственная 9 4.7
-дифференцируемая 251,2 8, 33 2, 441,1491
- измеримая 14 3 1
- импульсная переходная 16 2 4
- инвариантная 24 1 5
- интегрируемая 2 10 1,2 12, 14 3.3
- ковариационная 20 1 3, 20 3 I
- комплекснозначная 2 1 5
- координатная 2 1 5, 8 3 2, 9 4 2
- корреляционная 20 1.3
- кусочно дифференцируемая 3 4 3
- монотонная 3 4 3,1121
-- непрерывная 2.4 3, 3.4 I, 11 2 I
- Лагранжа 2 8 8,21 13
-Лапласа 12 4.3
-Ляпунова 10.6 5
- мажоритарная 9 4 2
- мероморфная 4 7 2
- множества 14 2 2
- монотонная 1 6 2, 9 4 7
- непрерывная 2 4, 4 3 2, 14.1 2, 14 4 3
- непрерывно дифференцируемая 2 5 5, 2 8 3
- ограниченная 2 3 5, 4 3 2, 14 4.6
- ограниченной вариации 14 2 2
- однолистная 4 9 I
- оптимальная синтезирующая 22.1 3, 22 2 3
-ошибок 12 4 3
- Патрика 9.4 6
- перехода 8 3 I
- полезности дохода 24 7 I
- порядковая 9 3 8
- правдоподобия 19 3 2
- проектирующая 9.4 3
- производящая 18 3 9
- простая 14 3.1
- равномерно непрерывная 2 4.3, 4 3 2
- разметки 9 3.6
- распределения 18 3 1, 18 4 1,20 I 2
--выборочная 19 11
- рациональная 5 1 8
- регулярная 4 4 3
- самодвойственная 9 4 7
- сигма-интегрируемая 14 3 3
-сигма-конечная 14.2.2
- силовая 4 5.4
- собственная 17 2 2, 17.3 I
- с ограниченным изменением 3.4 3
-сопряженно-линейная 14 1 4
- сохраняющая константу 9.4 7
-спектральная II 3.1, 14 8 3, 14 8 5
- теоретической регрессии 19 4.1
-характеристическая 18.3 7, 18 4 16, 20 1.2
- Хевисайда 114 1
- целая 4 4 3,4 7 2
- целевая 21.1 I, 24.1 4
- элементарная I 6 4, 14 3 1
992
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Хаос детерминированный 10 5 4
Характеристика 10 8 1, 13 1.1
Характеристическое направление 13 1 1
-уравнение 10 2 3, 10 5 3, 10 7 1
Хаусдорфова размерность 10 5 4
Хаусдорфово пространство 14.4 2
Цена игры 22 6
Центр 10.5 3
Центральная предельная теорема 18 5 11
Центральное многообразие 10 5 4
Центр 3 3 1,4 62,6 6,8 I 4
Цепь 9 1 5,9 3 1,14 1 1
- Маркова 20.4
Цикл 9 3, 24 5 4
Циркуляция 2 14 3
Частное решение 5 4 2, 10 1 1
Частный интеграл 10 11
Частота случайного события 18 17
Частотная характеристика 20 3 3
Черный ящик 25 2 1
Число действительное (вещественное) 2 2
- кардинальное 2 1 8
- комплексное 2 2 5
- собственное 7 5 2
Шаблон 23.9, 23 10
Шар I 4.4, 14 1 2
Штрих Шеффера 9.4 2
Эквивалентность 2 1 1, 9 1 3, 9 4 2
Экстремаль 15 12
Экстремум 2 7, 2 8, 15 1,21 1-214,21 7 3
Эксцентриситет 6.6
Элемент 2 1 2,5 2.1,9 3 2
- максимальный (минимальный) 9 1 5, 14 1 1
- наибольший (наименьший) 2 2 2, 9 1.5
- объема (площади) 2 12.5
- разбиения 9 1 4
Элементы затрат постоянные 24.4 4
- ортогональные 3.4 1
-сравнимые (несравнимые) 9.1 5, 14 1.1
Эллипс 6.6 1
Эллипсоид 6 7 1
Энтропия 18 3, 18.4 19
Эргодическое свойство 20 4 4
Этап оценивания параметров 24 6 3
- улучшения стратегии 24 6 3
Ядро 9 4 6
-Дирихле 3.4.3
- интегрального оператора 17 1
- - преобразования 11 1
- итерированное 17.2 2
-Коши 10 2 2, 17 4 1
- неотрицательное 17 3
-оператора 7.4.1
- осцилляционное 17 3 3
- открытое 14 4 1
- Пуассона 13 3.2
- симметричное 17.2 3
-стохастическое 17.3 2
-Урысона 17 1
- фредгольмово 17 1, 17 2 2
-Шмидта 17 2 3
Якобиан 2 8 1
е-сеть 14 4 5
СПРАВОЧНОЕ ИЗДАНИЕ
Пирумов Ульян Гайкович, Зарубин Владимир Степанович,
Крищенко Александр Петрович и др.
МАШИНОСТРОЕНИЕ. ЭНЦИКЛОПЕДИЯ
Том 1-1
Математика
Лицензия ИД № 05672 от 22.08.01 г.
Редактор Т.С. Грачева
Оформление художника Т И. Погореловой
Художественный редактор Т.И Голицына
Корректор М Я Барская
Инженеры по компьютерному макетированию: ТВ Курохтина; О. В. Мочалина; Е.А. Плотникова; СИ. Целуйко
Сдано в набор 09 09.02. Подписано в печать 12.03.03 Формат 70 х 100 1/16. Бумага офсетная. Гарнитура
Тайме. Печать офсетная. Усл. печ. л. 80,6. Уч.-изд. л. 95. Тираж 2000 экз. Заказ 7706
ФГУП «Издательство «Машиностроение», 107076, Москва, Стромынский пер , 4
Оригинал-макет изготовлен в издательско-полиграфическом центре
Тамбовского государственного технического университета, 392032, г Тамбов, ул Мичуринская, 112, к. 201
Отпечатано в полном соответствии с качеством предоставленного оригинал-макета в
ГУП ППП «Типография «Наука» РАН, 121099, Москва, Шубинский пер , 6