/
Автор: Мантуров О.В.
Теги: анализ естественные науки теория вероятностей математическая физика высшая математика учебник для вузов
ISBN: 5-06-000758-8
Год: 1991
Текст
О.В.Мантуров
КУРС ВЫСШЕЙ МАТЕМАТИКИ
О.В.Мантуров
КУРС ВЫСШЕЙ МАТЕМАТИКИ
РЯДЫ • УРАВНЕНИЯ МАТЕМАТИЧЕСКОЙ ФИЗИКИ • ТЕОРИЯ ФУНКЦИЙ КОМПЛЕКСНОЙ ПЕРЕМЕННОЙ •
ЧИСЛЕННЫЕ МЕТОДЫ
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
Допущено Государственным комитетом СССР по народному образованию
МОСКВА «ВЫСШАЯ ШКОЛА» 1991 $
ББК 21.11
М 23
УДК 517
Рецензенты: кафедра геометрии Московского государственного педагогического института им. В. И. Ленина; д-р физ.-мат. наук проф. В. Ф. Бутузов
Мантуров О. В.
М23 Курс высшей математики: Ряды. Уравнения математической физики. Теория функций комплексной переменной. Численные методы. Теория вероятностей: Учеб, для вузов.— М.: Высш, шк., 1991.— 448 с.: ил.
ISBN 5-06-000758-8
Учебник представляет собой.третий том курса высшей математики и является продолжением книг Мантурова O-W-, Матвеева Н. М. «Курс высшей математики: Линейная алгебра. Аналитическая гЬрметрия. Дифференциальное исчисление функций одной переменной» (М., 1986) Зв Шестакова А. А., Малышевой И. А., Полозкова Д. П. «Курс высшей математики: Интегральное исчисление. Дифференциальные уравнения. Векторный анализ» ДМ., 1987). Он предназначен для студентов-заочников инженерно-технических социальностей вузов и написан в соответствии с программой для этих специальностей. Изложение ведется на двух уровнях — основном и повышенном. БольцЙе внимание уделено разбору примеров и задач.
ББК 22.11
517
1602010000—215
М -----—-т------- 77—91
001 (01)—91
ISBN 5-06-000758-8
© О. В. Мантуров, 1991
ОГЛАВЛЕНИЕ
Первый Второй уровень уровень
Предисловие ................................................. 6
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье 7 285
§ 1.1. Понятие числового ряда. Сходимость и сумма ряда. Необходимое условие сходимости. Действия с рядами ................. 7 285
§ 1.2. Ряды с положительными членами. Признаки сходимости ... 11 286
§ 1.3. Знакопеременные ряды. Абсолютная и условная сходимость.
Знакочередующиеся ряды. Признак Лейбница ............... 16 287
§ 1.4. Функциональные ряды. Понятие равномерной сходимости.
Признак Вейерштрасса ................................. 19 290
§ 1.5. Степенные ряды. Теорема Абеля. Круг сходимости. Свойства степенных рядов .............................................. 26 291
§ 1.6. Разложение функций в степенные ряды. Ряд Тейлора.
Применение степенных рядов к приближенным вычислениям.
Уравнение Бесселя ...................................... 30 292
§ 1.7. Понятие гильбертова пространства. Изоморфизм гильбертовых пространств ............................................ 46 293
§ 1.8. Ряды Фурье. Тригонометрическая система. Ортогональность.
Сходимость в среднем. Неравенство Бесселя. Норма ....... 51 297
§ 1.9. Полнота и замкнутость тригонометрической системы. Сходимость рядов Фурье. Комплексные ряды Фурье .................... 62 300
§ 1.10. Интеграл Фурье. Преобразование Фурье и его свойства. 72
Глава II. Уравнения математической физики ................... 80 303
§2.1. Понятие об уравнении в частных производных. Решение ли-
нейных уравнений первого порядка в устных производных ... 80 303
§ 2.2. Уравнение колебаний струны. Решение задачи Коши методом Даламбера ........................;....................... 82 308
§ 2.3. Уравнение теплопроводности. Решение задачи Коши мето-
дом Фурье .........................:.................... 90 314
§ 2.4. Уравнение Лапласа. Решение задачи Дирихле в круге методом Фурье .................................................... 96 322
Глава III. Теория функций комплексной переменной и операционное исчисление ................................................. 102 330
§3.1. Комплексные числа. Действия с комплексными числами.
Тригонометрическая форма комплексного числа. Формула Муавра ................................................ 102 330
4 Оглавление
§ 3.2. Элементарные функции комплексной переменной ........ 107 331
§ 3.3. Производная функции комплексной переменной. Условия Коши—Римана. Дифференцируемость элементарных функций ....................................................... 115 333
§ 3.4. Интегрирование по комплексному аргументу. Теорема Коши. Интегральная формула Коши. Ряд Тейлора .................... 117 339
§ 3.5. Изолированные особые точки функции комплексной переменной. Их классификация. Ряд Лорана ......................... 126 348
§ 3.6. Вычеты. Основная теорема о вычетах. Применение вычетов к вычислению интегралов ................................... 132 350
§ 3.7. Преобразование Лапласа. Основные теоремы об интегралах и изображениях. Формула обращения интеграла Лапласа. Свертка функций. Интеграл Дюамеля. Решение дифференциальных уравнений и систем операционным методом............. 137 351
Глава IV. Основные численные методы ....................... 152 364
§ 4.1. Приближение функции методом наименьших квадратов.... 152 364
§ 4.2. Интерполяция. Интерполяционный многочлен Лагранжа. Линейная интерполяция ....................................... 160 367
§ 4.3. Решение линейных систем методом Гаусса ............. 163 369
§ 4.4. Итерационные методы решения уравнений .............. 169 370
§ 4.5. Квадратурные формулы ............................... 176 376
§ 4.6. Численные методы решения задачи Коши для обыкновенных дифференциальных уравнений ................................ 180 381
§ 4.7. Понятие о методе сеток решения простейших задач математической физики ........................................... 184 384
Глава V. Теория вероятностей .............................. 190 388
§ 5.1. Случайные события, операции над событиями и отношения между ними. Пространство элементарных событий. Классическое определение вероятности. Теорема сложения вероятностей. Частота. Геометрическая вероятность ............... 190 388
§ 5.2. Условная вероятность. Независимость событий. Вероятность произведения событий. Теорема о полной вероятности. Формулы Байеса. Последовательность независимых испытаний (схема Бернулли). Предельные теоремы Муавра—Лапласа и
Пуассона ............................................. 203 392
§5.3. Случайная величина. Дискретные и непрерывные случайные величины. Интегральная и дифференциальная функции распределения. Биномиальное, пуассоновское, нормальное, равномерное и показательное распределения. Совместное распределение нескольких случайных величин. Независимость случайных величин ......................................... 216 397
§ 5.4. Математическое ожидание, дисперсия и другие моменты случайных величин, их свойства. Ковариация, коэффициент корреляции ................................................ 233 403
§ 5.5. Закон больших чисел. Неравенство Чебышева. Теорема Бернулли. Теорема Чебышева ................................... 244 412
Оглавление 5
§ 5.6. Предельные теоремы. Характеристические функции и их свойства. Центральная предельная теорема Ляпунова ........... 246 413
§ 5.7. Цепи Маркова. Теорема о предельных вероятностях. Вычисление предельных вероятностей. Стационарное распределение 251 416
§5.8. Элементы математической статистики. Выборка. Точечные оценки неизвестных параметров распределения по выборке. Понятие о доверительных интервалах и статистической проверке гипотез ................................................257 418
§5.9. Понятие о выборочной регрессии и методе наименьших квадратов ................................................... 268 424
§ 5.10. Понятие о случайном процессе. Процессы с независимыми приращениями. Пуассоновский процесс ......................... 274 427
Основные формулы ................................................. 435
Предметный указатель ............................................. 442
ПРЕДИСЛОВИЕ
Настоящая книга представляет собой третий том учебника по высшей математике для студентов инженерно-технических специальностей вузов, изучающих курс высшей математики по программе на 510 часов. Она является продолжением книг Мантурова О. В., Матвеева Н. М. «Курс высшей математики: Линейная алгебра. Аналитическая геометрия. Дифференциальное исчисление функций одной независимой переменной» (М., 1986) и Шестакова А. А., Малышевой И. А., Полозкова Д. П. «Курс высшей математики: Интегральное исчисление. Дифференциальные уравнения. Векторный анализ» (М., 1987). Содержание учебника отвечает указанной программе, причем названия глав и параграфов почти дословно повторяют соответствующие пункты программы.
Главная особенность учебника состоит в том, что изложение материала дано на двух уровнях. Первый уровень содержит формулировки основных понятий (часто — в не самой полной строгости и общности), комментарии к понятиям, определениям, свойствам и теоремам, а также достаточное количество примеров. Здесь же приводятся и доказательства, но только в том случае, когда они не связаны с трудными выкладками и содержат яркую и глубокую идею. Однако большая часть доказательств и уточнений приводится во втором уровне книги. Второй уровень отличается более глубокой точкой зрения на некоторые понятия, изложенные в первом уровне, и включает строгие формулировки, определения, доказательства.
Главы и параграфы первого и второго уровней имеют (за очень небольшими исключениями) одинаковые названия, причем нумерация глав и параграфов второго уровня отмечена звездочкой. В тех случаях, когда рассматриваемое понятие обсуждается на втором уровне в более глубоком смысле, а также когда строгое доказательство утверждения приведено только во втором уровне, используется крупная жирная цифра, указывающая на соответствующее место во втором уровне книги.
Такое построение учебника имеет, на взгляд автора, существенное преимущество перед традиционными способами изложения материала. Изучение материала первого уровня позволяет студенту быстрее дойти до сути дела, быстрее овладеть (в общих чертах) основными идеями и методами. После освоения материала в главных чертах (или даже по мере освоения) обращение ко второму уровню окажется более плодотворным. Такая форма изложения будет особенно полезна для студентов-заочников высших технических учебных заведений.
При написании книги автором был использован курс лекций, прочитанных по учебной программе Центрального телевидения в 1975—1981 гг.
Автор выражает искреннюю признательность сотрудникам кафедры геометрии МГПИ им. В. И. Ленина и проф .В. Ф. Бутузову за ценные замечания, сделанные при рецензировании рукописи.
Автор
Глава I
ЧИСЛОВЫЕ РЯДЫ. ФУНКЦИОНАЛЬНЫЕ РЯДЫ. РЯДЫ ФУРЬЕ
§ 1.1. Понятие числового ряда. Сходимость и сумма ряда. Необходимое условие сходимости. Действия с рядами
1°. Основные понятия. Определение 1. Числовым рядом называется выражение
аг + а2 + +... + ап-\-..., (1)
где at (z= 1, 2, ..., п, ...)— вещественные или комплексные числа.
Комментарии к определению 1. 1) Ясно, что ряд определяется заданием для каждого номера i= 1, 2, ..., и, ... соответствующего вещественного или комплексного числа а.; это число называется i-м членом ряда.
2) Понятие ряда отличается от понятия последовательности, хотя и то и другое однозначно определяются функцией, сопоставляющей каждому номеру i число at (в случае ряда оно означает z-й член ряда, а в случаях последовательности — z-й член последовательности). Конечно, по заданной последовательности
я2, ..., ... (2)
можно составить выражение вида (1) и получить ряд, соответствующий последовательности (2). Однако наличие знаков плюс в выражении (1) указывает на желание оперировать с «суммой» членов (i= 1, 2, ..., п, ...). Понятие суммы было определено лишь для конечного числа слагаемых, и распространение этого понятия на случай бесконечного количества слагаемых требует особого внимания и приводит к свойствам, не имеющим аналогий со свойствами конечной суммы. Впрочем, многие свойства конечных сумм при разумном определении суммы ряда остаются в силе.
Именно этот круг вопросов и будет изложен в настоящей главе.
3) Определение ряда, в котором используются термины фундаментальных понятий математики (более абстрактное, но не содержащее неточного термина «выражение»), дано в § 1*. 1, 1.
8
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Определение 2. Частичной суммой ряда (1) называется число п
Sn = a1+a2+ ... + а„= X (3)
i = 1
Комментарии к определению 2. 1) Если желают указать количество слагаемых в частичной сумме Sn, то говорят, что Sn есть п-я частичная сумма.
2) Частичные суммы образуют последовательность
*$4 “Ь ^2 ’ ^3 ^2 673 ’ •*’’ Sn ? ♦•• • (4)
i= 1
Эта последовательность играет важную роль при определении понятий суммы ряда и сходимости ряда.
Определение 3. Если существует предел последовательности частичных сумм ряда (1), то ряд называется сходящимся, а этот предел называется суммой ряда. При этом если 00
lim Sn = S, то используют обозначение £ ап — ^. Если же п-^со И=1
предел последовательности частичных сумм ряда не существует, то ряд называется расходящимся.
Комментарии к определению 3. 1) Ясно, что не всякий ряд сходится. Это значит, что «сумма бесконечного числа слагаемых» (1) не всегда определена (в отличие от случая конечного числа слагаемых).
2) Если в выражении (1) сделать перестановку членов (изменить порядок слагаемых), то получится новый ряд с другими частичными суммами. При этом из сходимости исходного ряда не вытекает сходимость нового ряда; соответствующие примеры будут приведены ниже. Таким образом, понятие суммы ряда существенно отличается от понятия суммы конечного числа слагаемых (например, от перестановки слагаемых at в ряде сумма может измениться).
Примеры. 1. Ряд 1 + 1 + ...+1 + ..., у которого <^=1 (i= 1, 2, ..., п, ...), расходится; его частичные суммы Sn = n не имеют предела, так как lim S = lim п=со.
«->00 ” «->00
2. Ряд
1+ # +4-1 + ..., (5)
где q—вещественное или комплексное число, сходится при |#|<1 и расходится при |#|>1; этот ряд, как известно, называется геометрической прогрессией.
Действительно, согласно известной формуле
при | q | < 1 имеем
§ 1.1. Сходимость и сумма ряда. Необх. усл. сходимости. Действия с рядами 9
lim Sn— lim -——= lim —1——-J— lim qn = —— + 0 = —.
«->00 «~>00 «->00 1-^«->00
В случае |#|>1 получим lim Sn= со. Ниже будет показано, п->сс что при |^|=1 ряд (5) также расходится.
3. Ряд
1 +-+-+... + -+ (6)
2 3 п
у которого ai = - (i= 1, 2, п), называется гармоническим,
п
Этот ряд расходится.
В самом деле, рассмотрим частичные суммы
S2n — 1 4~ | - ) +1 — + — ] + ... + ( —-+ —г 4-... + —|.
2 \2J уз 4J 2л~1 + 2 2лу
Каждое слагаемое, заключенное в скобки, больше или равно наименьшим слагаемым в каждой скобке является последнее, 2 - к
т. е. в t-и скобке — это число —, а количество слагаемых в z-и 2
скобке равно 21-1, так что сумма слагаемых в z-й скобке не меньше, чем 2*“1-^=Л Из этого рассуждения вытекает, что 52п^1+|и, т. е. 52« неограниченно возрастает при и-»со; таким
образом, предел lim Sn не существует. «->00
4. Ниже будет доказано, что ряд
где а — вещественное число, сходится при а>1 и расходится при а 1.
2°. Необходимое условие сходимости ряда. Теорема 1. Если
ряд (1) сходится, то lim ^ = 0.
«->00
Доказательство. Из определения сходимости ряда сле-
дует, что пределы lim Sn и lim 8п-г существуют и равны «—>00 «->00
между собой: lim 8п = lim Sn^1. Далее, имеем «->00 «->оо
lim ап = lim (Sn — Sn_t) = lim Sn— lim 5n_1 = 0. «->00 «—>00 n-*cc n—> co
10 Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Следствие. При |#|=1 ряд (5) расходится.
Действительно, lim qn не существует при #/1, а при q — 1
П~> 00
имеем ряд из примера 1 п. 1°.
Комментарий к теореме 1. Как утверждается в теореме, для сходимости ряда необходимо, чтобы lim яи = 0. Пример п-^со гармонического ряда показывает, что это условие не является достаточным: ряд (5) расходится, хотя при этом lim ап= lim -=0. «->00 «->00 п
Для сходимости ряда мало того, чтобы п-й член ряда стремился к нулю; нужно, чтобы он стремился к нулю достаточно быстро. Более точная формулировка последнего утверждения обсуждается в § 1.2.
3°. Действия с рядами. В дальнейшем мы будем рассматривать следующие операции (действия) над рядами:
1) сложение рядов, т. е. построение по двум заданным оо оо оо
рядам X ап и Y, Ъп третьего ряда X a„ + Z>„; п=1 я = 1 п= 1
2) умножение рядов, т. е. построение по двум заданным рядам X ап и Е ь« третьего ряда X си> г«е сп= Е akbn-k, п — 1 п = 1 п = 1 к = 1
3) умножение ряда на число, т. е. построение по заданному 00
раду Е ап и ЧИСЛУ с (вещественному или комплексному) п - 1 00
нового ряда £ сап.
п= 1
'Комментарии к действиям с рядами. 1) Определенные выше действия применимы к любым рядам (как сходящимся, так и расходящимся).
2) При рассмотрении указанных выше операций нас будут интересовать вопросы о сходимости построенных рядов, а также о том, какова связь между суммами исходных и построенных рядов.
00 СО
Теор ема 2. Пусть £ ап и £ Ьп—два ряда и с—некоторое п= 1 п= 1
оо оо
число. Тогда если ап = 8±. £ Ьп = $2’ гДе G R (С), то:
п=1 п= 1
1.2. Ряды с положительными членами Признаки сходимости
11
00 . 00 00
Е (ап + ^и)= X йи+ Е ^и = ^’1 + *5,2’ п=1 п =1 п=1
00 / И \ 00 00 00 00
Е ( Е akbn~kj= Е аЛ b„=S!S2, £ сап = с Е «„ = ^1- (8) п = 1 k = 1 / п = 1 п= 1 п= 1 п = 1
Доказательство легко вытекает из свойств пределов последовательностей частичных сумм и приведено в §1*.1, 2.
Комментарий к теореме 2. Теорема утверждает, что ряды, полученные с помощью операций сложения и умножения сходящихся рядов, а также умножения сходящегося ряда на число, также сходятся, а их сумма связана с суммами исходных рядов естественными формулами (8). Утверждения теоремы остаются справедливыми в случае, если один (и только один) 00 00
из пределов = У ап, S2 — Е равен бесконечности; в этом п= 1 п~ 1
случае справедливы формулы (8), в которых учтено, что
S1T-oo = оо; oo + S2 —°о; З^-оо^оо при оо 'S2 = оо при 52^0.
(9)
§ 1.2. Ряды с положительными членами. Признаки сходимости
Исследование ряда на сходимость сводится к вопросу о существовании предела последовательности частичных сумм. Для ряда с положительными членами последовательность частичных сумм является монотонно возрастающей. В силу известной теоремы существование предела такой последовательности эквивалентно ее ограниченности.
Использование этой эквивалентности лежит в основе следующего весьма часто применяемого приема доказательства сходимости ряда, так называемого принципа сравнения рядов с положительными членами.
оо
Теорема 1 (принцип сравнения). Пусть Е а„ п= 1 со
и £ Ьп—два ряда с положительными членами. Тогда если п= 1
оо п
ряд £ ап сходится и а^Ьг (i—l, 2, ..., п)9 то и ряд bt п= 1 /Я
сходится, причем
СО 00
Е Е ьп. (1)
п=1 п=1
12 Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
00
Доказательство. По условию, ряд ап сходится: п= 1
следовательно его частичные суммы ограничены; в силу неравенств а^Ьг (i= 1, 2, ..., п, ...) тем же числом ограничены п
и частичные суммы ряда bt. Из ограниченности воз-i=l п растающей последовательности частичных сумм ряда £ i= 1 вытекает существование предела этой последовательности И
и сходимость ряда £ bt. Неравенство (1) очевидно. i=l
Комментарии к теореме 1. 1) Легко установить, что теорема остается справедливой и для рядов с неотрицатель-
00 00
ными членами, т. е. таких рядов У которых
п=1 п=1
Ьп^0.
2) Нетрудно доказать аналогичное утверждение для рядов с отрицательными членами и для рядов с неположительными членами.
00 00
3) Если для двух рядов £ ап и £ Ьп с неотрицательными п=1 п=1
00
членами выполняется условие Ьп~^ап (п = 1, 2, ...), то ряд £ Ьп п= 1
00 /
называют мажорантой по отношению к ряду £ а„ (или что п = 1 \
оо оо \
ряд £ Ьп мажорирует ряд £ ап\. Утверждение теоремы П=1 И=1 /
о сходимости справедливо, если условие Ьп^ап выполняется не для всех натуральных л, а только для всех п, больших некоторого натурального N. При этом неравенство (1), вообще говоря, неверно.
4) Применение принципа сравнения рядов с положительными членами очень часто бывает связано со следующим
00 обстоятельством. Для исследуемого на сходимость ряда £ Ьп п=1 00
подбирают такой заведомо сходящийся ряд £ ап. который п = 1
удовлетворяет условию Ь„^ап (начиная с некоторого N, т. е.
1.2. Ряды с положительными членами. Признаки сходимости 13
00
при всех n>N). Для этого в качестве £ ап часто берут п = 1
геометрическую прогрессию со знаменателем q. по модулю меньшим единицы. На этом основаны доказательства признаков сходимости Даламбера и Коши; формулировки этих признаков приведены ниже.
5) Если для рядов с неотрицательными членами справедливы неравенства ап^Ьп (начиная с некоторого N, т. е. при
00
всех n>N), то расходимость ряда £ Ьп влечет расходимость п— 1
00
ряда £ Это утверждение является следствием теоремы 1 , п= 1
(см. § 1* 2, 1). С помощью этого утверждения можно доказать
00
расходимость ряда X а„, подобрав подходящий расходящийся п — 1
00
ряд £ Ьп, удовлетворяющий указанному выше условию. п= 1
Теорема 2 (признак сходимости Даламбера). Если для некоторого ряда £ ап с положительными членами суще-п = 1
ствует предел lim ^±А = /, то при /<1 ряд сходится, а при П^СО «и
l> 1 —расходится.
Теорема 3 (признак сходимости Коши). Если для
00
некоторого ряда £ ап с положительными членами существует п = 1
предел lim \fan == I, то при 1<1 ряд сходится, а при /> 1 — и->оо
расходится.
Доказательства этих признаков основаны, как было отмечено выше, на принципе сравнения рядов (точнее, на сравнении рядов с геометрической прогрессией) и приведены в § 1*.2, 2.
Комментарий к признакам Даламбера и Коши. Следует обратить внимание на то обстоятельство, что в случае /= 1 ряд может как сходиться, так и расходиться. Этот случай сложнее, чем случай />1 и /<1, и требует более тонких средств решения вопроса.
Теорема 4 (интегральный признак сходимости оо
Коши). Пусть для некоторого ряда £ ап с положительными п= 1
14
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
членами существует вещественная непрерывная функция /(х), определенная на [1, оо [, монотонно убывающая и такая, что f(n)~an для целых значений х — п. Тогда данный ряд сходится в том и толь-
ко в том случае, когда сходится несобственный интеграл J/(x)dx.
1
Доказательство. Известно, что несобственный интеграл от положительной функции сходится тогда и только тогда, н
когда числа f/(x)dx при У-»оо ограничены. Как показывает
рис. 1, а, эти числа ограничены площадью ступенчатой фигуры, причем эта площадь равна ап. Отсюда следует, что если ряд
п = 1
сходится, то сходится и несобственный интеграл. Из рис. 1, б
N N
видно, что числа j/(x)dx при любом N не меньше, чем £ ап.
1 и = 2
Отсюда следует, что если ряд расходится, то расходится и несобственный интеграл.
Примеры. 1. Ряд У —— расходится, поскольку lim = 1 п^1 77 + 1 п-^со п + 1
и, следовательно, не выполнено необходимое условие сходимости.
2. Ряд
1
1+-п 1
--->- И п п
1 co 1 +-
У ---- расходится. Действительно,
. п
п= 1
00 J гармонический ряд - расходится, то
мажоранта этого ряда
1+-
так как
расходится
£ 1.2. Ряды с положительными членами. Признаки сходимости
15
СО J
—— сходится. В самом деле, согласно
3. Ряд X ап
п = 1 п признаку Даламбера имеем
V «п+1 г ( 1 1 \ г 2п + п
lim -А_3= hm ——---------:----1= lim — --------
«—>оо ап « —> со у2и Ч-«+1 2n + nJ «—>оо 2п +«+1
= lim
«->со
1+2п
п+ 1
2 ч----
2й
1.
1
2
4. Ряд X ап = X (-+-) п=1 п= 1 \ /
зуя признак Коши, находим
сходится. Действительно, исполь-
СО 00
5. Ряд £ ап= £ -----— сходится, поскольку
п = 1 п = 1 ' *
lim lim ——— = lim 1=0<1.
«->00 an П-+СО «->00 n
Суммой этого ряда является число е^ 2,718.
00 00 1
6. Ряд £ ап= £ — при а<1 расходится. Действительно, п= 1 л= 1 п
.11
при а<1 имеем -< — и так как гармонический ряд расходится, « «“
co J
то расходится и его мажоранта , а<1.
п= 1 П
7. Используя признак Даламбера, попытаемся исследовать
00 00 1
на сходимость ряд ап= . Имеем и=1 л=1п
lim ^2.= lim ^+2^-= 1.
«->00 «и «->00 п
Как было отмечено выше, в случае 7=1 признак Даламбера не дает ответ на вопрос о сходимости. (В действительности ряд 00 1 л2
— сходится, а его сумма равна —; см. пример 2 п. 4° § 1.9.). _ d «2 6
16
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
п= 1
1
8. Вопрос о сходимости ряда £ и более общий вопрос п= 1 п
00 1
о сходимости рядов вида £ — легко решается с помощью
интегрального признака Коши.
Действительно, в качестве вещественной неотрицательной непрерывной монотонно убывающей функции на [1, со [ выберем функцию /(х)=А и исследуем на сходимость несобст-
венный интеграл J f (х) dx При ос /1 имеем
1
оо /V
Г f 1 Y-“+1 N 1
/(x)dx= lim — dx= lim ------------ = lim ------(N “+1 —1).
J 7V->oo J •x<z TV—>oo —j, TV->oo
1 1
Очевидно, что при oc> 1 интеграл сходится, а при ос<1 — расходится. Случай ос=1, т. е. гармонический ряд, был рассмотрен выше.
§ 1.3. Знакопеременные ряды. Абсолютная и условная сходимость. Знакочередующиеся ряды. Признак Лейбница
1°. Абсолютная и условная сходимость знакопеременного ряда. Свойства рядов с неотрицательными членами можно использовать при исследовании знакопеременных рядов, т. е. рядов с произвольными вещественными членами.
Пусть дан ряд
где a„6R. (1)
п= 1
Составим два знакопостоянных ряда—один из неотрицательных, а другой из отрицательных членов:
оо оо
(2)
и = 1 п = 1
Здесь а'п означает п-е по счету неотрицательное число 00
среди членов ряда £ ап, а а"—п-е по счету отрицательное п=1
00
число среди чдецрв ряда , £а„. Ряды (2) могут сходиться, * * ’' * < ' 1
а могут и расходиться. /Возможны четыре случая:
• И
1.3. Абсолютная и условная сходимости. Признак Лейбница
17
00 00 1) £>'=S'gR; £a" = S"eR;
п= 1 п=1 00 00
2) 3) 4) В 1Х = <ю; Ia" = S"eR; п= 1 п=1 00 00 Xa'n = S'’ Ya'n=-^ и=1 п=1 00 оо £Х=оо; £а"=-оо. п=1 п=1 случае 1 оба ряда сходятся, в случае 4—оба рас-
ходятся, в случаях 2 и 3 — один ряд сходится, а другой
расходится.
Легко видеть, что в случае 1 ряд (1) сходится, а его сумма равна S' + S"; случаи 2 и 3 приводят к расходимости ряда (1), причем в случае 2 частичные суммы ряда (1) неограниченно возрастают, а в случае 3 стремятся к — оо. Случай 4 является самым сложным. Здесь ряд (1) может сходиться, а может и расходиться.
Таким образом, ряд (1) сходится в случае 1 и расходится в случаях 2 и 3 и иногда в случае 4 (см. § 1*.3,3).
Определение 1. Ряд (1) называется абсолютно сходящимся. если сходится ряд, составленный из абсолютных величин его членов.
Определение 2. Ряд (1) называется условно сходящимся. если он сходится, но ряд £ |аи|, составленный из абсолютных п= 1 величин его членов, расходится.
Комментарии к определениям 1 и 2. 1) Легко видегь, что ряд (1) сходится абсолютно тогда и только тогда, когда оба ряда (2) сходятся (случай 1). В частности, это означает, что из сходимости рядов (2) вытекает сходимость ряда (1). Таким образом, абсолютно сходящийся ряд является сходящимся.
2) Легко также установить, что для условно сходящегося ряда имеет место случай 4.
3) Определения абсолютно и условно сходящихся рядов применимы и к рядам с комплексными числами (если под абсолютной величиной комплексного числа понимать его модуль).
Абсолютно сходящиеся ряды сохраняют многие свойства конечной суммы, в то врек рядов весьма непохожи на в свойствах абсолютно и из следующих теорем.
[я как свойста^^Ж^О^^ддащихся свойства 80 Йшичие
условаЖд^дащ^ся' рядов^видно
18
Глава I. Числовые* ряды. Функциональные ряды. Ряды Фурье
Теорема 1. Пусть £ ап — абсолютно сходящийся ряд с ве-п- 1 00
щественными членами, а ряд £ ап получен из него произвольной п= 1 со
перестановкой членов. Тогда ряд ап абсолютно сходится,
п = 1 00 00
причем ап= £ #и.
п= 1 п— 1 (0_
Доказательство приведено в § 1*.3,1.
00
Теорема 2. Если ряд £ ап с вещественными членами п = 1
сходится условно, а его сумма равна 50, то с помощью подходящей перестановки его членов можно получить ряд, сходящийся к произвольному наперед заданному числу S.
Доказательство приведено в § 1*.3, 2.
2°. Знакочередующиеся ряды. Признак Лейбница. Ряд с вещественными членами называется знакочередующимся, если всякая пара соседних членов в нем имеет разные знаки (т. е. одно из них положительно, а другое отрицательно).
Если первый член ах знакочередующегося ряда положителен, то такой ряд можно представить в виде
ai + ( — я2) + я3 + ( — я4) + ... + <я2и + 1 + ( — я2и + 2)+ ..., (3)
где аг, а2, ..., ап, ...— положительные числа.
Знакочередующийся ряд (3) часто записывают также следующим образом:
а1 ~ а2 “Ь ~ “1“ а2п+ 1 “ а2п + 2 + ~
оо
= £(-1)й+Ч> а, >0, z= 1, 2, .... (4)
п= 1
Для некоторых знакочередующихся рядов справедлив простой и удобный в применениях признак сходимости.
Теорема 3 (признак сходимости Лейбница). Если
00
члены знакочередующегося ряда £ ап удовлетворяют условиям п - 1
I ап I> I ап+11 2,...) и lim ап = 0, то ряд сходится. При
п—* 00 оо 00
этом если ^an = S, то | £ ak — 5|< | ап+х1. п=1 к = 1
Доказательство. Пусть для определенности аг>0 и ряд имеет вид (4). Из условий теоремы следует, что последовательность частичных сумм ряда. S2m + 1 1, 2,...) с нечетными
1.4. Функциональные ряды. Равномерная сходимость Признак ВейеръитрасСа 19
номерами 2т +1 убывает, а последовательность частичных сумм S2m (m = l, 2,...) с четными номерами 2т возрастает. Действительно,
$2т +1 $2т - 1 ^2т + &2т + 1 < $2т - 1 ?
^2т~ ^2т-2~^а2т-1 ~ С12т > $2т - 2?
поскольку — ^m + ^+iCO, а2т-1~а2т>Первая последова-тельность ограничена снизу, а вторая—сверху:
^2m+l (ш=1, 2, ...),
^2т ^2т — 1 &2т < $2т — 1 < •••)?
поэтому каждая из них имеет предел, т. е. lim S2m+1 = S1, lim S2tn = S2. Однако S1-S2 = lim S2m+1-S2m = lim a2w+1=0. Следовательно, S± = S2, т. e. существует lim Sn и данный ряд сходится.
Наконец, так как 52m+i>^ S2m<s> то a2m+i = $2т+1 -~~ $2т> S$m+1 ~S>0, ~^2т + 2~ $2т + 2~ $2т+$2т +2~~ $ < И> значит, |SW —5|<яи (л = 1, 2,...).
Пример. Знакочередующийся ряд
i-j+l4+-+(-1)n+1-+-2 3 4 7 п
сходится согласно признаку Лейбница, так как (— 1)и+1
и lim -—-—=0. Ниже будет показано, что сумма и—* 00 п
этого ряда равна 1п2.
§ 1.4. Функциональные ряды. Понятие равномерной сходимости. Признак Вейерштрасса
1°. Понятие функционального ряда. Область сходимости. Функциональным рядом называется выражение
00
£ wI.(x) = ^1(x) + w2(x)+... + ^w(x)+..., (1)
i=l
где щ(х) (z=l, 2, ..., п. ...) — функции действительной переменной х, каждая из которых определена на некотором подмножестве Q действительной оси (общем для всех функций щ(х)).
Рассматривают также ряды вида
М1(Р)+ц2(Р)+... + г/й(Р)+..., (2)
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
где w, (P)—функции точки Р, принадлежащей плоскости, трехмерному или «-мерному пространству. В этом случае пг(Р) можно рассматривать как функции нескольких переменных. Часто имеют дело с рядами
wJL(z)+w2(z)+... + «„(z)+..., (3)
члены которых являются функциями комплексной переменной z. Значения функций щ(Р), ut(z) (z=l, 2, ..., п. ...)
могут принадлежать R и С.
Сначала мы будем рассматривать ряды вида (1), т. е. ряды из вещественных функций вещественного аргумента.
Зафиксировав получим из (1) выражение
Ml(*o) + M2(Xo) + -" + Mn(*o) + -">
т. е. числовой ряд. Если этот ряд сходится, то х0 называется точкой сходимости. Множество всех точек сходимости ряда называется областью сходимости ряда.
В общем случае эта область может иметь довольно
00
сложную структуру. Например, ряд £ (tzsinjirax)" при задан-п= 1
ном натуральном т сходится для тех значений х, которые
। . 1 1
удовлетворяют условию |flsm7cmx|<l, т. е.------<8штсж <—.
И |я|
Область сходимости этого ряда при |я|>1 представляет собой объединение множества интервалов:
1 1
— arcsin — arcsm —
\—+km<x< k = 0, +1, +2, .... m-------------------m
Впрочем, заметим, что области сходимости тех рядов, с которыми мы будем иметь дело, окажутся сравнительно простыми.
Говорят, что ряд сходится на множестве М, если он сходится в каждой точке хеМ.
Сходимость ряда в каждой точке множества М называют поточечной сходимостью (в отличие от других видов сходимости, которые будут рассмотрены ниже).
Отметим, что теория функциональных рядов и теория функциональных последовательностей в значительной мере соответствуют друг другу: по каждому ряду можно построить последовательность его частичных сумм, по каждой функциональной последовательности
гДх), v2(x), V„(x), ...
(4)
можно построить ряд
£ 1.4. Функциональные ряды. Равномерная сходимость. Признак Вейерштрасса 21
Г1 + (у2 - V1) + (t>3 - r2)+ ... + (у„- vn_!) + ... , (5)
частичные суммы которого совпадают с членами последовательности (4). При этом сходимость ряда (5) и последовательности (4) означают одно и то же. Таким образом, все теоремы о рядах могут быть сформулированы в терминах последовательностей.
Пусть функциональный ряд
00
X Uk(x)=ul(x)+u2(x)+ ... + ип(х)+...
k = 1
сходится на множестве М. Тогда
00
X wft(x) = S(x), (6)
fc= 1
где S(x) при данном х есть сумма соответствующего числового ряда.
В теории функциональных рядов рассматривают в основном такие вопросы.
1. Как связаны свойства функций ик(х) со свойствами функции S (х), например в каких случаях из непрерывности или дифференцируемости функций ик(х) вытекает непрерывность или дифференцируемость функции 5(х)?
2. В какой мере свойства конечной суммы функций переносятся на случай «бесконечного количества слагаемых», например возможно ли почленное дифференцирование и интегрирование рядов?
3. Если функциональный ряд сходится к некоторой функции S(x), то его частичная сумма для достаточно большого номера мало отличается от S(x) и, заменяя 5(х) на частичную сумму ряда, благодаря малой погрешности получают значительный выигрыш, поскольку частичная сумма представляет собой, как правило, более «простую» функцию, чем S(x).
Возникают вопросы о возможности разложения заданной функции в ряд определенного вида, сходимости этого ряда и т. п.
Среди всевозможных функциональных рядов особое значение имеют степенные ряды (см § 1.5) и ряды Фурье (см. § 1.8).
Важное значение имеет приложение теории рядов к решению и исследованию дифференциальных уравнений. Иногда можно найти решение дифференциального уравнения, последовательно вычисляя члены разложения этого решения в степенной ряд или в ряд Фурье.
2°. Равномерная сходимость функционального ряда. Признак
СО
Вейерштрасса. Сходимость функционального ряда иЛх)
И= 1
на множестве М к функции S (х) означает, что в каждой
22
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
хеМ частичная сумма 7V
5jV=^i/w(x) при достаточно п= 1
большом N мало отличается от S(x). При этом в другой точке множества М для достижения такой же малой разности потребуется, возможно, большее количество слагаемых
в частичной сумме. Иными словами, сходимость может быть «неравномерной»: в одной точке ряд сходится «быстро», а в другой (или других) — «медленно». Разумеется, такое явление требует уточнений и четкого определения.
Определение. Функциональный ряд ип(х) называется п— 1
равномерно сходящимся на множестве М к функции S (х), если для всякого £>0 найдется такое число N, что для всех n>N и для всех хеМ справедливо неравенство
| ^мДх)-5(л)|<е. (7)
к=1
Комментарии к определению. 1) Следует обратить внимание на слова «для всех хеМ». Они означают, что для произвольного £>0 найдется такое N, которое годится для всех хеМ; если бы шла речь о поточечной сходимости, то число N зависело бы не только от заданного £>0, но и от точки х, и, возможно, не нашлось бы одного числа N. пригодного для всех хеМ.
2) Полезно иметь в виду следующую наглядную иллюстрацию понятия равномерной сходимости. Назовем г-коридором графика функции у = S (х) множество точек (х; у) плоскости, удовлетворяющих условию
S(x) — £<j<S'(a:) + £, хеМ. (8)
На рис. 2 изображен £-коридор графика функции = Согласно определению равномерной сходимости, для всякого £>0 найдется такое 2V>0, что при всех n>Nи хеМ выполняется условие (7). Геометрически это условие означает, что графики всех частичных сумм Sn при n>N принадлежат £-коридору.
3) Не всякий поточечно сходящийся ряд является равномерно сходящимся (хотя, разумеется, всякий равномерно сходящийся ряд сходится в каждой точке).
Приведем пример функционального ряда, сходящегося в каждой точке отрезка [0, 1], но не сходящегося на этом отрезке равномерно. Рассмотрим ряд
1.4. Функциональные ряды. Равномерная сходимость Признак Вейерштрасса
23
и-й член которого есть ип(х) = хп+1 — хп. Частичная сумма этого ряда с номером п. как легко видеть, равна 5и = хи+1. Пределом частичных сумм на отрезке [0, 1] является функция
Каждая из функций 5и = х"+1 непрерывна, при этом 5и(0) = 0, 5„(1)=1. Ясно, что ни одна из этих функций не имеет графика, целиком принадлежащего 8-коридору (например, при 8=1/2)- Это означает, что не для всякого 8>0 (например, для 8 = 1/2) найдется N такое, что условие (8) выполняется при всех n>N и хе [0, 1].
4) Понятие равномерной сходимости имеет смысл применительно только к функциональным рядам. Если рассматривать числовой ряд как частный случай функционального, т. е. считать, что все члены такого ряда являются функциями с постоянными значениями, то очевидно, что всякий сходящийся ряд сходится равномерно.
При равномерной сходимости рядов сохраняются многие свойства конечной суммы, что выражается следующими теоремами. 00
Теорема 1. Если члены ряда £ ип(х)—непрерывные фун-п= 1
кции и ряд на множестве М сходится равномерно, то оо
и S(x) = 52 иЛ*) является непрерывной функцией.
Доказательство. Непрерывность функции 5дх) означает, что для близких точек х1 и х модуль разности 1(х) — 5 (х) | является малым числом. Будем исходить из тождества 5'(х1)-5'(х)=(5’(х1)-5„(х1))+(5„(х1)-5в(х))+(5в(х)-5'(х)), (9)
следствием которого является неравенство
Пусть задано произвольное е>0. Согласно условию, каждое из чисел |5'(x1) — и 15„(x)—5(х)| для достаточно больших п меньше, чем е/3. Выбрав х настолько близким к х1} чтобы 1^и(х1)—8„(х)\<е/3 (это можно сделать в силу непрерывности функций Sn(x)), из неравенства (10) получим
что и означает непрерывность функции S(x).
24
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
00
Теорема 2. Если ряд £ сходится к 5(х) равномерно п= 1
и каждая из функций ип(х) (п=1, 2, ...) и S(x} интегрируема на отрезке [а, £], то
Доказательство. В сил^ равномерной сходимости ряда модуль разности |5(х) — £ w„(x)| при достаточно бо-п— 1
лыном N может быть сделан меньше любого наперед заданного числа 8>0 (при всех хе [а, /?] одновременно). Отсюда следует, что
ь ь
С N с
| 5(x)dx — \ип (х) дх | < 8 (Z? — а\ (11)
J п = 1 J
а а
т. е. последовательность частичных сумм Sn (х)=J ип (х) dx ряда
ь
оо р b
un(x)dx стремится к числу J5(x)dx.
г= 1 J а
а
а
оо
Теорема 3. Пусть ряд ип(х) сходится к некоторой
п = 1
функции 5*(х) на отрезке [а, д] и каждая из функций ип(х) (п—19 2, ...) непрерывно дифференцируема на отрезке [а, Ь]. Тогда если ряд
оо
Y и'п(Х)’
п=1
(12)
членами которого являются производные и„(х) от функций ип(х\ сходится равномерно, то функция S(x) дифференцируема и в каждой точке хе [a, справедливо равенство
00
Y н„(х) = 5"(х). (13)
п~ 1
Доказательство. Пусть сумма ряда (12) равна Т’(х). Согласно предыдущей теореме, имеем
1.4. Функциональные ряды. Равномерная сходимость. Признак Вейерштрасса
25
ИЛИ
X [М*)-м«(я)]=5(х)-5(а)= и= 1
T(x)dx.
(14)
о
Дифференцируя среднюю и правую части равенства (14), в силу теоремы Ньютона—Лейбница получаем = Т(х).
Комментарии к теоремам 1—3. 1) Условие равномерной сходимости в теореме 1 является существенным. Если ряд сходится не равномерно, а поточечно, то сумма ряда непрерывных функций может быть разрывной (см. пример на с. 23).
2) Если в условиях теоремы 2 функции ип(х) (п=1, 2, ...) являются непрерывными, то условие об интегрируемости функции S(x) оказывается лишним, оно вытекает из теоремы 1.
3) Отметим, что в теореме 3 равномерной сходимости
00
ряда £ ип(х) недостаточно для справедливости формулы (13). п = 1
На рис. 3 приведена наглядная иллюстрация причины этого явления. Частичные суммы ряда изображены на нем извилистыми линиями. Ясно, что в любой 8-коридор вокруг графика функции aS'(x) можно поместить сколь угодно круто осциллирующие кривые. Это означает, что возможна такая равномерная сходимость функционального ряда, которая не сопровождается равномерной сходимостью производных его членов. На рис. 4 видно, что почти во всех точках х наклон касательных к графику функций Sn (х) и S(x) резко отличается.
26
Глава I. Числовые ряды. Функциональные ряды Ряды Фурье
4) Теорему 2 называют теоремой о почленном интегрировании, а теорему 3 — о почленном дифференцировании ряда.
Полезно иметь удобный способ доказательства равномерной сходимости ряда. Таким является следующий признак.
Теорема 4 (признак равномерной сходимости
00
Вейерштрасса). Если для ряда X ип(х) на отрезке [a, /?] п= 1 00
существует сходящийся числовой ряд сп> удовлетворяющий п— 1
условию
|ц,(х)|«?„ (и=1, 2, ...), (15)
00
то ряд ип(х) сходится на отрезке \а. £>] равномерно.
п= 1
Доказательство. Из принципа сравнения рядов следует, что 00
в условиях теоремы ряд £ ип(х) в каждой точке хе [а, b ] сходится п= 1 . ,
абсолютно. Обозначим сумму этого ряда через S(x). Далее имеем
00 00 00
5(x)-5']V(x)= X иЛх)< X M*)l< X сп- (16) n = N+l n = N+l n = N+l
Здесь учтено условие (15) и известное свойство модуля суммы.
00
Поскольку ряд £ сп СХОДИТСЯ, ДЛЯ ВСЯКОГО 8>0 можно и= 1 оо
найти такой номер N, что сп<г. При том же самом
п = К + 1
значении N будет справедливо неравенство (16) (для всех х е [а, Ь] одновременно), что и доказывает равномерную схо-00
димость ряда £ ип(х).
п= 1
Примерами применений признака Вейерштрасса могут служить доказательства теорем § 1.5.
§ 1.5. Степенные ряды. Теорема Абеля. Круг сходимости. Свойства степенных рядов
1°. Понятие степенного ряда. Теорема Абеля. Определение.
Степенным рядом называется функциональный ряд вида
а0 + а1(х-хд+а2(х-хд2 + ... + ап(х-хдп+...= X ак(х-х<У-
$ 1.5. Степенные ряды и их свойства Теорема Абеля 27
Числа 6zz(z = 0, 1, 2, ...), принадлежащие полю R или С, называются коэффициентами ряда, переменная х считается принадлежащей полю R или С.
Комментарии к определению. 1) Степенные ряды замечательны прежде всего тем, что их члены ип(х) = ап(х — х0)" являются сравнительно простыми функциями; частичные суммы 5w(x) степенного ряда представляют собой многочлены от переменной х.
2) Относительная простота функций ип(х), Sn(x) служит причиной многих свойств, присущих степенным рядам, которыми не обладают, вообще говоря, другие функциональные ряды.
3) Если степенной ряд сходится к некоторой функции 5(х), то эта функция с большой степенью точности может быть приближена частичной суммой ряда Sn(x), т. е. многочленом. Изучение функции 5(х) с помощью исследования ее приближения— многочлена Sn(x) — является одним из самых важных методов дифференциального исчисления. Подробнее этот вопрос будет рассмотрен в § 1.6.
Теорема 1 (теорема Абеля). Для всякого степенного ряда ak[x — х0)к существует такое неотрицательное число
к = 0
R (возможен случай 7?=оо), что ряд сходится абсолютно при всех х, удовлетворяющих условию
|х-х0|<Я, (2)
и расходится при всех х, удовлетворяющих условию
|х — X0|>R. О)
Комментарии к теореме Абеля. 1) Согласно утверждению теоремы в случае А = 0 ряд расходится при всех х, за исключением х = х0. При R= оо ряд сходится при всех xgR(C).
2) Утверждение теоремы не относится к случаю, в котором |х—- x0| = jR; здесь может иметь место как сходимость, так и расходимость.
3) Множество точек х, удовлетворяющих условию (2), т. е. {х| |х — х0 |< R}, представляет собой внутренность круга радиуса Л с центром в точке х0 на комплексной плоскости; для вещественных степенных рядов это множество является интервалом ]х0 — R, х0-|-А[ с центром в точке х0. При этом указанный круг и интервал называется соответственно кругом сходимости и интервалом сходимости, а неотрицательное число R—радиусом сходимости.
Таким образом, рассматриваемое свойство степенных рядов состоит в относительной простоте их областей сходимости.
28 Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Доказательство теоремы Абеля. Пусть ряд 00
£ аи(х —х0)" абсолютно сходится в некоторой точке
и = 0
положим r = \xt— х0|. Покажем, что ряд абсолютно сходится и в каждой точке х2 такой, что |х2 —х0|<г. Действительно, оо
числовой ряд fan(x1— х0)"| является мажорантой для ряда н = 0
00
У, |«„(х2 — х0)"|, поэтому в силу принципа сравнения ряд п = 0 00
L ап(х2~~ло)п также абсолютно сходится. п = 0 00
Аналогично доказывается, что если ряд у дп(х1 —х0)" п = О 00
расходится, то расходится (абсолютно) и ряд У ап(х2 —х0)и, п = 0
где г = |х1-х0|<|х2-х0|.
Если ряд сходится в единственной точке х^х0, то теорема справедлива при 7? = 0. Если же ряд сходится во всех точках, то теорема верна при R=co.
Остается рассмотреть случай, когда ряд сходится в некоторой точке и расходится в некоторой точке х2.
Пусть К—множество неотрицательных чисел г таких, что ряд 00
£ ап(х—х0\п сходится при всех х, удовлетворяющих условию п — О
|х —х0|<г. Если ряд сходится в какой-либо точке х^х0, то множество К непусто и ограничено в силу доказанного выше.
Обозначим через R точную верхнюю грань непустого ограниченного сверху множества К. Убедимся в том, что ряд 00
£ ап(х—х0)п сходится при |х—х01<7? и расходится при к=о
|х —х0 |>Л.
Действительно, пусть х—число такое, что |х—x0|<jR. Между положительными числами |х—х0| и R существует число геК (если бы такого г не существовало, то R не могло бы быть точной верхней гранью множества К). Имеем оо
|х—х0|<г<7?. По определению множества К, ряд У ап(х—х0)п п = 0
абсолютно сходится при |х—х0|<г, а последнее неравенство имеет место в силу выбора числа г (между |х—х0| и Л).
Пусть теперь число х таково, что | х — х0 | = г > R. Ясно, 00
что в этой точке ряд £ яДх —х0)" (абсолютно) расходится и = 0
$ 1.5. Степенные ряды и их свойства. Теорема Абеля
29
(иначе число R не могло бы быть верхней гранью множества К). Итак, оба утверждения теоремы доказаны.
2°. Свойства степенных рядов. Теорема 2. Если степенной ряд
£ ^п(х~хо)п имеет радиус сходимости R, то в любом круге п = 0
комплексной плоскости (на любом отрезке вещественной оси) вида
|x-х0|<г, r<R, (4)
он сходится равномерно.
Доказательство. Для точек х, удовлетворяющих условию (4), имеем |х —х0|"<г" и 1ап(х—х0)|"<| я Jr"; следовательно,
00 00
£ |й„(х-х0)|"< X l«ZT « = 1, 2, .... (5)
и = 0 и = 0
По условию, числовой ряд в правой части неравенства сходится, а неравенства )ап(х—хо)"|<|яДг"(и = 0, 1, 2, ...) 00
означают, что числовой ряд £ l<Wnl является мажорантой п = О 00
для ряда Yj |а„(х—х0)и| на множестве {х||х—х0| <г}. Ут-
верждение теоремы теперь следует из признака Вейерштрасса.
00
Теорема 3. Если для степенного ряда ап(х—х^)п и = 0
существует предел I = lim , то этот предел равен радиусу
и—>оо ап+1
сходимости R данного ряда, т. е. l=R.
Доказательство. Используя признак Даламбера, ис-00
следуем ряд £ ап(х—х0)" на сходимость в точке х. Имеем и = 0
= |л—х0| • lim — и—>00 &
Согласно признаку Даламбера при
•Л'О -g
------ <1 ряд сходится,
а при
---2 >1—расходится. Таким образом, число I удов-
летворяет определению радиуса сходимости R. т. е. l=R.
Заметим, что предположение о существовании предела в условии теоремы излишне (см. § 1*.2, 2).
Следствие 1. На множестве {х||х—x0|<r}, r<R сумма степенного ряда является непрерывной функцией.
Это вытекает из теоремы 1 § 1.4.
30
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Следствие 2. Степенной ряд можно почленно интегрировать на множестве {х||х—x0|<r}, r<R, т. е. для любых а.
Ь из этого множества справедливо равенство ь ь оо Г оо b (* У а„ (x-x)ndx = У -J-(x-x0)n+1 = S(x)dx. п=0 J п=0П±1 а * а а
В частности, при я^х0, b = x имеем 00 Г 00 р У ап l(x-x0)"dx = У -^-(x-x0)n+1 = 5(x)dx, и=0 J n-0W+J XQ Х0 00
где 5(х)= £ ап(х— х0)и. Это вытекает из теоремы 2.
п~ О
Следствие 3. Степенной ряд можно почленно дифференцировать на множестве {х| |х—x0|<r}, r<R.
Действительно, ряд составленный из производных от членов
СО 00
ряда У ап(х-~хоУ’ т- е- РЯД У Пап(х~хо)п1’ имеет тот же п=О п —О
00
радиус сходимости, что и ряд £ ап(х—х0)п. Поскольку
п-0
lim
п—*00
(«+!)«„+ !
= lim
п—*00
lim lim
и—*00 | вп + 1 I и—*00
п
71+1
(предел в левой части равенства есть радиус сходимости ряда 00
£ пап(х — л0)и-1, а предел в правой части—радиус сходимости
п = 0 оо
исходного ряда £ ап)- В силу равномерной сходимости ряда
оо п = О
У па„(х—х0)" при |х—х0|<г и теоремы 3 § 1.4 ряд
п = 0
00
У ап(х—х0)" можно почленно дифференцировать.
п = 0
§ 1.6. Разложение функций в степенные ряды. Ряд Тейлора. Применение степенных рядов к приближенным вычислениям.
Уравнение Бесселя
00
1°. Ряд Тейлора. Пусть ряд £ an(x — xG)n сходится при п = О
|Х“Х0|<г, а его суммой является функция Дх), т. е.
1.6. Разложение функций в степенные ряды. Ряд Тейлора
31
£ a„(x-x0)n=/(x). (1)
п = О
В этом случае говорят, что функция /(х) разложена в степенной 00
ряд X ап(х — х0)и [или функция /(х) представлена рядом оо и = О
£ ап(х — х0)”] на множестве {х|х —х0|<г}. Это относится п = О как к вещественным, так и к комплексным рядам.
Представление функции /(х) в виде (1), если это возможно, бывает полезным при решении многих математических задач.
Вычислим коэффициенты ап в равенстве (1) предполагая, что оно справедливо при | х — х0 | < г. Имеем
/(х0)=«0;
/'(х) = аг + 2а2 (х — х0) + З«3 (х — х0)2 +...; /' (х0) = а±, /"(х)= 2й2 + 3 • 2й3 (х — х0) + 4 • 3«4(х —х0) 2 +f" (х0) = 2а2, /"'(х)= 3 • 2а3 + 4 • 3 -2«4(х —х0) + 5 - 4 • За5 (х —х0) 2+...;
/"'(х0)=3 -2л3,
/(п)(х) = и!аи + (и + 1)и(и— 1)...2а„+1 (х-х0) +
+ (и + 2)(и+ 1)и...3ав+2(х —х0)2 + ...; /(п)(х0) = и!ап. Это' означает, что
й л = 0, 1, 2, .... (2)
п\
Итак, если функция /(х) может быть разложена в степенной ряд, сходящийся в некоторой окрестности точки х0, то такой ряд однозначно определен коэффициентами (2).
Обратим внимание на тот факт, что при сделанном предположении (возможность разложения в ряд) функция /(х) должна быть бесконечное число раз дифференцируемой в точке х0: правая часть равенства (2) содержит производные всех порядков данной функции в точке х0.
Поставим теперь вопрос о том, когда заданную функцию/(х) можно разложить в степенной ряд. Как указано выше, необходимым условием для возможности такого разложения является бесконечная дифференцируемость функции f (х). В дальнейшем станет ясно, что это условие не является достаточным.
Для бесконечно дифференцируемой в точке х0 функции /(х) можно вычислить коэффициенты ап по формуле (2), а затем построить ряд
32
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
00 00 fin) (у. \
Z а„(х-хдп= Y f—^~ (х-х0)л, (3)
п = 0 и = 0
который называется рядом Тейлора функции f(x) в точке х0. Частным случаем ряда Тейлора является ряд Маклорена (при *0 = 0):
и = 0 п = О: П'
(4)
Ряд Тейлора функции /(*) может: 1) расходиться всюду, кроме точки х = х0; 2) сходиться, но не к исходной функции /(*), а к какой-нибудь другой; 3) сходиться к исходной функции /(*) (самый важный для приложений случай). Разумеется, важно знать, при каких дополнительных условиях ряд Тейлора функции /(*) сходится к самой функции /(*). Ответ на этот вопрос будет дан ниже с использованием термина «остаточный член ряда».
Пример. Функция
={е“1/%2при^0’
(О при х=0
бесконечно дифференцируема и все ее производные в точке хо = 0 равны нулю. Действительно, если х/0, то п-я производная имеет вид
где Рп—многочлен. Например, при и=1, 2, ... имеем /(1)(x) = e”1/fx2(x) = 2z3,
/(2)(х) = е“1^2^—-P2(z) = — 6z4 + 4z6
и при п>2 формула (**) может быть легко доказана методом математической индукции.
Далее, /(О)(0) = 0 по условию; если доказано, что /(Л)(0) = 0 для некоторого Л, то
- -о
х—*0
1
гА
= lim
1
е1/х2 г—*со ег2
£ 1.6. Разложение функций в степенные ряды. Ряд Тейлора 33
Здесь принято z=l/x и учтено, что многочлен стремится к бесконечности медленнее, чем экспонента (последнее легко следует из правила Лопиталя). Тем самым по индукции доказано, что все значения /(л)(0) равны нулю, со
Итак, ряд Тейлора функции /(х) имеет вид £ 0-х”;
и = О
этот ряд сходится к функции <р(х) = 0, а не к исходной функции f (х).
2°. Остаточный член ряда в форме Лагранжа. Пусть /(х) — заданная бесконечно дифференцируемая функция
со
и ап (х — х0)п—ее РЯД Тейлора. Функция
п = О
RAx)=f(x)~ Е аЛх~хо)к (5)
k=0
называется п-м остаточным членом данного ряда. Если для некоторого г>0 выполняется условие /?и(х)->0 при /woo и всех х таких, что |х —х0|<г, то ряд Тейлора функции /(х) сходится к самой функции /(х) на множестве {х||л-х0|<г}.
Выполнение условия Ли(х)->0 при п-^сс можно установить с помощью оценки остаточного члена Я„(х).
Если функция /(х) бесконечно дифференцируема в точке х0, то для каждого т существует окрестность ]х0 — rm, x0 + rw[ точки х0, в которой определены все производные функции /(х) от первой до т-й включительно. Положим т = п+1 и рассмотрим п-й остаточный член ряда Тейлора
к = О *
Докажем, что остаточный член можно представить в виде
(6)
где с—точка интервала ]х0, х[. Выражение в правой части последнего равенства легко оценить, что можно использовать при исследовании ряда Тейлора функции /(х) на сходимость.
Заметим, что
Rn(xo)=R'n(xo)=... = R^(xo) = 0. (7)
Для функции (7и(х) = (х —х0)и+1 имеем аналогичное равенство
Gw(xo)=G;(xo)=... = G^(xo) = 0. (8)
2 Мантуров О.В.
34
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Рассмотрим функцию
" f™(x )
(х-х0)” G„(x) Gn(х)-G„(х0) ‘
Согласно теореме Коши, дробь в правой части имеет вид
Gn(x)~ Gn(x0) Gnlx^
где jq е]х0, л:[,
Учитывая равенства (7), (8) Коши, получаем
и снова применяя теорему
Кп(х1)_#п(Хо)________ ^п(Х2)
Gn(Xl) &ЛХ1)~&ЛХо) Gn(x2)
где х2е]х0,х1[, п^1.
Следующий шаг дает
R(х2) _ R ; (х2) - R : (х0) _ Л - (х3)
Gf'(x2) G"(x2)—G'„(x0) G"'(x3)’
где х3е]х0, х2[,
п^2.
Аналогично получаем равенства
Rn}(xk)_Rn )(xfc+i) 5 п х elxxF
G«(xJ G<‘+1>(xt+1)’ ’ ’ ’ ’ k + 1 J °’ X*b
откуда окончательно имеем
7?„(x)_7?<"+1)(x„+1)
G„(x) G<» + 1’(x„+1) ’
t. e.
/(%)- f f^L(x-XQy
fe! _/fa+1|(xt+1)
(x-x0)”+1 (и+1)!
что эквивалентно равенству
к.-fM- i -y 7'.У (*-*»)•” <9>
fc=O
Последнее равенство лишь формально отличается от формулы (6) и становится тождественным ей, если число xw+1 обозначить через с. Напомним, что формула (6) верна во всяком интервале ]х0, х[, в котором определена и непрерывна (и+1)-я производная функции /(х).
Выражение (9) называется представлением остаточного члена ряда Тейлора в форме Лагранжа.
Следствием полученной формулы (6) является и такое утверждение о сходимости ряда Тейлора: если множество функций fn(x) (и=1, 2, ...) ограничено на отрезке [х0, х], т. е.
j>' 1.6. Разложение функций в степенные ряды. Ряд Тейлора
35
|/(w)(x)|<C для некоторого С, то ряд Тейлора функции f(x) сходится на отрезке [х0, х] к функции /(х).
Действительно, при сделанных предположениях |А„ (х) | <
С|х—x0|"+1 г |х—х0Г+1 п
<—— у—. Легко видеть, что lim —-—— = 0, так как при
переходит в выраже-
ние —г---^-т-
(и + 2)!
умножением на
переходе от п к «4-1 выражение
т. е. последующее получается из предыдущего
к—х0| |х—х0| 1
---—, и при — <- имеем п + 2 F п + 2 2
(х-х0)п+1+т (х-х0)и+1/1\ш
(п+1+т)! (я+1)! \2/ ’
откуда следует, что
r (x-x0)”+1 г |х-х0|м+1+пг |х-х0 |n + 1 г п
lim Ц——= lim Ц—-—— <—.—Ц— - lim - = 0.
и-*оо (л+1)! т— оо (п+1+т)! (п+1)! т-^оо \2J
3°. Остаточный член в форме Коши. Полезно обратить внимание на следующее свойство остаточного члена ряда Тейлора. Если функция /(х) имеет непрерывную («4-1)-ю производную, то
(4 =/(*)- Z ^рг(х-х<+ к = 0
является при х->х0 бесконечно малой не ниже («+1)-го порядка малости.
Действительно, в силу формулы (9) имеем
lim -—= lim -—. — = lim f(n+(с) =/("+Х) (х0).
/v V \и+1 /v Y \n+l J \ J J \ и/
х—X—х0 и- х0) х—>х0
Здесь учтено, что точка с является внутренней точкой интервала (х0? х) и при х-»х0 стремится к х0, а также непрерывность функции /(и+1)(х) в точке х0.
Таким образом,
f(x)= Е .^(-x-Xo^ + ofx-Xo)", (10)
к = 0
где через я(х —х0)п обозначена бесконечно малая величина более высокого порядка малости, чем (х —Xn)w, при х-»х0.
Формула (10) означает, что функция /(х) отличается от
” f(fc) (х )
многочлена *—-^(х —x0)fc (функции сравнительно простой)
к = 0
на бесконечно малую величину порядка большего, чем степень п многочлена.
2*
36
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Выражение (10) называется представлением остаточного члена ряда Тейлора в форме Коши.
4°. Разложение функций в ряд Тейлора (Маклорена). Ниже приводятся ряды Тейлора (Маклорена) для функций ех, cosx, sinx, In (1 +х), (1 +х)а, arctgx, arcsinx с указанием радиуса R сходимости:
у 2 ех= 1 +х+— 2! хп + ... Н-—~ + ... = п\ °° г« = У-, я = оо; п = 0 ' (Н)
1 I %4 cosx=l ——— . 2! 4! , (-О"*2", " (2л)! - II as а * и сч 8 fzs]? s II оо; (12)
х3 х5 smx = x ——+—— ... 3! 5! . (-1)"*2"+1 . _ “ (_1)^+1 Д (2«+П! ’ = со; (13)
(2л+1)! -
ln(l+x) = x-g+y (-1)"х"+1 п+ 1 = у и=о и+1 (14)
/?=1;
7 8 8 [XI И к II ... (а-и+1) nl aeR, R=l; (15)
X3 X5 arctgx=x—з“+у— ••• ! (-1)"*2"+1 | 2л+1 у (-l)"x2"+1 ~„ = 0 2«+* ’ 7?=1;
(16)
1 3 2и-1
х3 3 s 2 2 2 ? . 1
arcsmx = x+—+—хэ+ ... +------—х2и ... =
6 40 и!(2и+1)
= g 1-3-5 (2л 1) 2n + i Л=1 (17)
„ = 0 2"-„!(2и+1) 1 ’
Для доказательства справедливости формул (11) — (17) достаточно построить ряд Тейлора (Маклорена) указанных функций, вычислить радиус сходимости и установить сходимость полученных рядов к этим функциям внутри круга сходимости.
Разложение ех. Имеем (ех)(и) = ех, (ех)(и) | х=0 = 1, ап = ~. Ряд
00 хп
Тейлора (Маклорена) имеет вид У — Используя теорему
3 § 1.5, находим
£ 1.6. Разложение функций в степенные ряды. Ряд Тейлора
37
R= lim = lim^±-^= lim (/?+!)= ос. «и+1 п\
П—>00 п х и—>00 п—*00
Множество производных {/(и)(х)} (и=1, 2,...) функции f(x) = ex ограничено (это множество состоит всего из одной функции /(и)(х) = ех. В силу следствия из формулы (6) ряд 00 хп У — сходится к ех во всякой точке х.
~ и! п = О Разложения cosx и sinx. Легко проверить, что
(cosx)' = — sinx, cos"х = — cosx, (cos х)'" = sinx, (cosx)(4) = cosx, (cos x)(w + 4) = (cosx)(n);
(sin x)' = cosx, (sinx)" = — sinx, (sinx)"' = — cosx, (sinx)(4) = sinx, (sinx)(w + 4) = (sin x)".
Поэтому (cosx)' | x = 0 = 0, (cosx)" | x = 0 = — 1> (cosx)"' | x = o = 0, (cosx)(4)|x = o= 1, (cosx)(2m)|x=0 = (- 1)”, (cosx)(2w+1)|x = 0 = 0;
(sinx)'|x = o= h (sinx)"|x = o = 0, (sinx)"'| x=0 = (sinx)(4) | x=o = 0,
(sinx)(2w) | x = 0 = 0, (sin x)(2w+I x = о = (- 1)”.
Ряды Тейлора (Маклорена) функций cosx и sinx имеют соответственно вид
Y2n 00 2и+1
Радиусы сходимости этих рядов равны бесконечности, посколь-хп
ку ряд У — = ех является мажорантой для каждого из них п\
и имеет бесконечный радиус сходимости.
Для функции cosx множество производных {(cosx)(w)} является ограниченным: каждая из производных (cosx)(w) (и=1, 2, ...) при любом вещественном х по абсолютной величине не превосходит единицы. В силу следствия из формулы (6) 00 х2п
ряд Тейлора £ (“1)— функции cosx сходится к ней самой. „ п\
и = О
Аналогичное рассуждение доказывает сходимость ряда 0° Х2и+1
у (—1)”------ к sinx в каждой точке х.
„ = о (2«+1)1
Разложение 1п(1+х). Согласно формуле суммы членов геометрической прогрессии со знаменателем х, по модулю меньшим единицы, имеем
38
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
—— 1 — х4-х2 —х34- ... +(— 1)их”4- ... .
14-х х 7
Интегрируя левую и правую части равенства от нуля до х, при | х | < 1 получаем
1/1 \ х2 х?> ( — 1)"хи+1
1п(1+х) = х-—+ —- ... 4--— -----------+ ... .
' 7 2 3 «4-1
Если функция разложена в (сходящийся) степенной ряд, то он обязательно является рядом Тейлора этой функции (см. п. 1°). Таким образом, последнее равенство есть ряд Тейлора (Маклорена) функции In (14-х); в частности, члены ряда выражаются через значения производных от In (14-х) по формуле (2): (1п(1 4-х))(и) | х==0 = (— 1)(и+(л4-1)!
Разложение (14-х)а. Легко видеть, что
((14-х)а)'-ос(14-х)а“1, ((14-х)а)" —ос(ос—1)(1 4-х)а-2, ...,
((1+х)а)(л) —ос(ос—1) ... (ос —л4-1)(1 4-х)а-и, л-0, 1, 2,....
При этом
((1 4-х)а)(п) | х = 0 — ос(ос — 1) ... (а — л4-1), л —О, 1, 2,...
Следовательно, ряд Тейлора (Маклорена) функции (1+х)а имеет вид
а(а-1)... (ос-«4-1)^„ п\
и совпадает с правой частью формулы (15).
Согласно теореме 3 § 1.5, радиус сходимости этого ряда есть
I
R= lim
ос (а — 1) ... (ос —«4-1) ’(«4-1)!
ос (ос — 1) ... (ос — п)п\
— lim
п —* 00
«4-1
ос — п
= 1. (18)
Здесь принято, что а не является целым неотрицательным числом (в противном случае равенство (18) было бы неверным, так как оно получено сокращением на число ос (ос— 1) ... (ос — л 4-1), которое при целом неотрицательном а может быть равным нулю). Итак, при сделанном предположении радиус сходимости ряда (15) равен 1.
Если число ос является целым неотрицательным, то ряд (15) превращается в конечную сумму, т. е. в многочлен, . , . 11 ос(ос — 1) ... (ос — т+1)
поскольку при всех л? > л —ос 4-1 коэффициенты ---—------
т\ становятся равными нулю. В этом случае формула (15) совпадает с формулой бинома Ньютона
J 1.6. Разложение функций в степенные ряды. Ряд Тейлора
39
Конечно, в этом случае радиус сходимости ряда равен бесконечности.
Доказательство того факта, что ряд (15) при |х|<1 сходится именно к функции (1 +х)“ (а не к какой-нибудь другой), приведено в § 1*.6, 1.
Разложение arctg х. Используя формулу суммы геометрической прогрессии со знаменателем —Z2(|Z|<1), имеем
1 -/2 + /4-16+ ... +(-l)kt24 ... =^. (19)
Далее, интегрируя левую и правую части этого равенства по t от нуля до х (|х|<1), получаем
v-3 v5 V2H1
А* \ Ь «А»
*~Т+Т+ ... +(-1) ^4- ... -arcigx.
Последняя формула задает разложение функции arctg х в степенной ряд с радиусом сходимости 1 [совпадающим с радиусом сходимости ряда (19)]. Этот ряд является рядом Тейлора
(Маклорена) функции arctg х, причем (arctg x)(2/t)|x=o = 0.
(arctg х) i
(2*+1)! х=0 1 ’ 2*4-1’
Разложение arcsinx. Используя формулу (15) при а = — 1/2, имеем
это разложение справедливо при всех у таких, что |j/|<1. Полагая у= — t , получаем равенство
13 13 2и-1
(i_Z2)-i/2=1+iZ2+iaZ4+ . +m_2_t2n+....
v 7 2 2 п\
справедливое при |Г|<1. Интегрируя левую и правую части этого равенства от нуля до х(|х|<1), находим
df • । %3 । 3 5 . I
;= = arcsmx = x+—+—х + ... + 1-г2 6 40
J(l-/2)1/2dz = J о о
1-3-5...(2и-1) 2п + 1 = у 1-3-5... (2и-1) 2н + 1
2и-и!(2«+1) 2”-и!(2и+1)
40
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Поскольку arcsinx представлен сходящимся степенным рядом, последний ряд является его рядом Тейлора (Маклорена).
При этом (arcsinx)(2n)|x=o = 0, = 09 1, ... .
_1 -3-5 ... (2/7-1) х = 0 2й-77!(2/7+1) 5
(arcsin%)(2" + 1) (2т?+1)!
5°. Применение рядов к приближенным вычислениям значений функций. Если функция /(х) разложена в ряд Тейлора на интервале ]х0 — R, х0+7?[5 где R—радиус сходимости ряда 00
/(х) = £ ak(x—х0)\ то для всякого %е]хО“Л^о + ^[ имеем к = 0
п
f(x)= у ak(x-x0)k+Rn(x).
к —О
Так как /?„(%)-> О при и-юо, то значения многочлена
£ ак(х—x0)fc при больших п мало отличаются от значений к = О
/(х) (не больше, чем шах |7?„(х)|). На этом основано приближенное вычисление значений функции / (х) и оценка такого приближения.
Примеры. 1. Вычислить приближенно ^/ё = е1/5.
Решение. Имеем
е*=1+х+^ + ... +^+Яи(х), /?и(х) = ^— хп+\
Если п=\, то е1/5»1 +0,2; | ^/ё— 1,21 <е ;
о 1/5 1 1 п о । 0,04 I 5 Г 1 ооа । е 0,008
« и = 2, « е1/э^ 1+0,2 +—; | х/е—1,220... | <--;
2 v 6
а 1/5 1 , ап °’04 । °’008 |5 Г 1 ooiQi °’0016
« /7 = 3, « е1/э^1+0,2+—+------; К/е—1,2213 <е-----.
’ 5 2 6 1 v 1 24
Из этих выкладок видно, что ^/е= 1,22 + 0,002. Выбирая 77 достаточно большим, можно вычислить ^/ё с любой степенью точности.
2. Вычислить приближенно In 1,1.
Решение. Имеем
v2 3 /_An+l^n
ln(l+x)=x~—+—+ ... Д—/---------F/?„(x);
x 7 2 3 n x 7
j* 1.6. Разложение функций в степенные ряды. Ряд Тейлора 41
|7?„(х)| = --4т7---7 , |Л„(х)|<—.
1 ”v 71 (1+х)"+1(п+1) 1 71 п+1
При х=0,1 получим:
если и=1, то In 1,1 =0,1+ ^(0,1), |In 1,1-0,11 <2^=0,005;
« « = 2, « In 1,1 =0,1-^+Я2(0,1), | In 1,1 -0,0051
« и = 3, « In 1,1 =0,1 -^1+^+Л3(0,1),
|In 1,1 -0,09831 <2^21.
Таким образом, In 1,1 =0,0983 с точностью до четвертого знака после запятой.
3. Вычислить приближенно In 2.
Решение. Ряд (14) при 0 < х < 1 является знакочередующимся рядом, удовлетворяющим условиям признака сходимости Лейбница. Поэтому, в частности, при х<1 получим
|5„(х)-1п(1+х)| = 1*-у+у+ - +(-1)и+17-
-1п(1+х)|<^, откуда
|5„(1)-1п2| = 11-|+|+ - +(-1)и1-1п2| <4-.
х ' 23 п п+1
Так как |S„(l) — 1п21 ->0 при и-*оо, то ряд
- +(-1)"+1-+ ...
2 3 4 v 7 п
сходится к In 2.
Имеем 5,(1)=1, S2(l)=l, S3(l)-5, S4(l)-£
Каждое из приведенных значений 5П(1) является приближением к In 2. Как видно из вычислений, сходимость ряда к своей сумме In 2 довольно медленная.
4. Вычислить приближенно Je_%2dx.
о
Решение. Разложим подынтегральную функцию в ряд Тейлора (Маклорена). Для этого в разложении
е^1+у+^+ ... ...
2 п\
42
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
заменим у на — х2; тогда получим
о ’v4 6 „2п
е-^2=1-х2 + ---+ ... +(-l)w—+ ... .
2! 3! V 7 п\
Согласно теореме о почленном интегрировании степенного ряда, находим
1 Iе о
х2и+1 п\(2п+1)
1 оо 1
й!(2и+1)'
2 23
Частичные суммы ряда имеют вид ^ = 1, $2 = у 53 =—, 312
^4==420’ *“ * сходится к своему пределу довольно быстро: в силу признака Лейбница абсолютная величина разности между лг-й частичной суммой и суммой ряда не превосходит 1 л 1
---г-.----, что при п — 4 равно ---.
(п+1)!(2« + 1)’ F F 1080
Заметим, что функция y = ^e~f2dt не может быть выражена о
через элементарные функции; в то же время эта функция играет важную роль в теории вероятностей.
6°. Применение рядов к решению дифференциальных уравнений. Если решением дифференциального уравнения является функция /(х), разлагающаяся в степенной ряд, т. е.
/(х) = а0-\-а1х-Уа2х2-У ... + яихи + ..., (20)
то дифференциальное уравнение вида
Г(х, у, у’, у", /*>)=0, (21)
где F—многочлен от аргументов х, у, у, у", ..., у(к\ устанавливает связь между коэффициентами •••? выражаемую
обычно системой уравнений. Иногда бывает возможным найти решение дифференциального уравнения следующим образом. Предполагая, что искомое решение представляет собой разложение в степенной ряд (20) с неопределенными коэффициентами 6z0? 4Zi, а2, в левую часть уравнения (21) вместо у подставим выражение ]Гятхш, вместо у'—выражение вместо у" — выражение ^т(т — l)<2wxw~2, ..., вме-
сто ук) — выражение ^т(т — 1)...(т—&+ Y)amxm~k. После приведения подобных членов в левой части равенства получим ^Ьтхт, где bm = bm(aQ. а2. ...). Соотношение (21) дает
j> 1.6. Разложение функций в степенные ряды. Ряд Тейлора 43
условия, необходимые для того чтобы функция (20) была решением данного дифференциального уравнения:
Z>o(0O, 01, 02, ...) = 0,
/ц(яо, 01, 02, ...) = 0, Ьт (00, 01, 02, ...) = 05
Иногда эту систему уравнений удается разрешить и по найденным значениям 00, 01, 02 построить функцию /(х) вида (20), которая удовлетворяет дифференциальному уравнению (разумеется, если построенный ряд (20) сходится).
Пример. Рассмотрим дифференциальное уравнение
У'+ху = 0. (*)
Имеем у' = ^какхк~\ у" = (**)
Подставив в левую часть равенства (*) выражения (**), получаем
^к{к-1)хк~2ак + ^0kxk+1 = O,
или
£(A;+2)(A;+l)(flft+24-afc_1)xfc=0, £bmxm=0,
т. е.
Ьо = 2 • 102; Ьг = 3 -203 + 0О; Z>4=4 • 304 + 02 = О;
•••; Z’m = (rn + 2)(m+l)am+2 + aTO_1=0; ....
Приравнивая коэффициенты Ьг (f=0, 1, 2, ...) нулю, приходим к системе уравнений
Zjo = 202 = O; 61 = 603 + 0о = О, b2 — 1204 + 0t = 0;
Z>m = rn(m+l)am+2 + am_1 = 0; ....
Из этих равенств следует, что
02 = 0, 05 —0, ..., 03fc+2 — 0? •••> (к = ®-> 1? 2, ...) и
____ CIq _____ O-Q _ ^0 аз~~~б’ Яб-6-5-3-2’ " °3,£~...9-8-6-5-3-2’
<7'7“ + 7-6-4-3’ +1 ~... 10-9 • 7 • 6-4 • 3’
причем в качестве 0О и аА можно взять любые числа. Таким образом,
Д\ . ^0 3 4 । й0 6 । 7 ।
х) = 0„ + 0,л--л’--х +-Х +—X +...
44
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
При а0 = 1, = 0 имеем
при <2о — 0, аг = 1 имеем
Можно убедиться в том, что полученные ряды сходятся на всей числовой оси и их суммы действительно являются решениями уравнения (*). При небольших значениях х решения /1 (х) и /2 (X) можно заменить частичными суммами соответствующих рядов.
Более подробно решение дифференциального уравнения с помощью степенных рядов рассматривается в следующем пункте.
7°. Уравнение Бесселя. Бесселевы функции. Дифференциальное уравнение второго порядка
х2У'+хУ + (х2 —&2)у = 0, (22)
где к—произвольное число, называется уравнением Бесселя. Это уравнение часто встречается в задачах математической физики.
Будем искать решение этого уравнения в виде
у = Л0хшЧ-Л1х,и+1+Л2хш+2+ ... +Axn+w+ .... (23)
Подставляя выражение (23) и его производные у' и у” в левую часть уравнения (22) и приводя подобные члены, получаем
(т2 — к2) Лох™ + {(/л+1)2—к2} А1хт+1+ {[(т + 2)2 — &2] А2 + + А0}хт+2+ ... + {[(m + n)2-k2']An+An_2}xm+n+ ... = 0.
Легко видеть, что ряд (23) при условиях
-41=0, Л=-г--т2 .2А-2 (« = 2, 3, 4, ...),
т. е. ряд
( 1 1
т) — Л ) 1 ______ у-_______________________ -у. 4
У 0 V (™ + 2)2-fc2 [(т + 2)2-к2][(т+4)2-к2]
-----------------!_______________у 6 -L 1
[(m + 2)2—k2][(m + 4)2—k2][(m + t)2—k2J "J’
1.6. Разложение функций в степенные ряды Ряд Тейлора
45
удовлетворяет уравнению
х2у"+ху' + (x2—k2)y=(m2—k2)AoXm.
Следовательно, при т=к и Ло = 1 ряд
/г / 1 А 2 I 1 4
Л=Х (?“ Wi)* +4- 2!(t+l)(t+2)->: -
______________!__________
43-3 !(/с+1)(/с+2)(^+3) “J
удовлетворяет уравнению Бесселя, а при т= — к, Ао = 1 ряд
— к I л 1 2i 1 4
У2=Х +4-2.(l-t)(2-t)X
43 3! (1 —/с)(2—£)(3—/с)
также удовлетворяет уравнению Бесселя.
Если к^О, то решениями уравнения Бесселя являются функции
Ук^ ~¥к<У ” l!(fc+l)!\2/ + 2!(/с+2)!\2/ + "J
И
У-к(х) = (~1)кУкх.
Эти две функции линейно независимы, и общее решение уравнения Бесселя имеет вид
У=С1ук(х) +С2у-к(х),
где С15 С2—произвольные постоянные.
Если к=0, то в качестве двух линейно независимых решений уравнения Бесселя можно взять
1 /у\2 1 /у\4 1 /х\6
/ \ -« 1 / Л \ 1/Л\ J / л \
j0^=l-_+(2!р^2/ ~(3!р\2/ +’"
И
/ \ X (\ 1 / х\2 1 / лА4 1 / лА6 1
У1(х) = -<1------ Ч------ —---- - + ..Л
Z1V 7 2[ 1!2!\27 2!3!\2/ 3!4!\2/ J
Функции ук(х) называются функциями Бесселя. Они обладают рядом интересных свойств и, вообще говоря, не могут быть выражены через элементарные функции. Существует обширная специальная математическая литература, описывающая свойства и поведение бесселевых функций; значения функций табулированы (т. е. приведены в особых справочных таблицах).
46 Глава I. Числовые ряды. Функциональные ряды. Ряды Фуръе
§ 1.7. Понятие гильбертова пространства. Изоморфизм гильбертовых пространств
1°. Определение гильбертова пространства. Понятие гильбертова пространства является обобщением понятия конечномерного евклидова пространства на бесконечномерный случай. Как это часто имеет место, при переходе от конечного к бесконечному возникают качественно новые явления. Этим объясняется введение в аксиоматику гильбертова пространства свойства 6°, которое в случае конечномерного евклидова пространства выполняется автоматически.
Определение. Векторное пространство Н над полем вещественных или комплексных чисел называется гильбертовым, если задана функция, сопоставляющая всяким двум векторам х, уеН комплексное число (х, у), называемая скалярным произведением и обладающая следующими свойствами:
1°) (х, х) = 0 тогда и только тогда, когда х = 0;
2°) (х, х) — вещественное неотрицательное число Vxe/f;
3°) (х+у, z) = (x, z) + (у, z) Vx, у, zeH;
4°) (ах, у) = ос(х, у) Vx, yeH, VaeC(R);
5°) (х, у) = (у, X) \/х, уеН;
6°) для произвольной последовательности х1? х2, ..., хп,
... элементов из Н, удовлетворяющей условию lim (х„ — хт, т,п—> оо
хп — хт) = 0, существует такой элемент хеН, что lim (х — хп,
Л -> 00
х —хи) —0;
7°) векторное пространство Н бесконечномерно;
8°) существует последовательность векторов е15 е2, ..., еп, ..., удовлетворяющая следующему условию: для всякого вектора х е Н и произвольного числа а > 0 найдется линейная п
комбинация а= £ такая, что (а — х, а—х)<г.
Комментарии к определению. 1) Свойства 3°, 4° означают, что функция (х, у) линейна по первому аргументу при фиксированном втором аргументе.
2) Если гильбертово пространство рассматривается над полем R вещественных чисел, то из свойств 3°—5° вытекает
(х, y+z) = (x, у) + (х, z), (х, ау) = а(х, ^), Vx, уеН, VaeR, так что функция (х, j) оказывается линейной и по второму аргументу, т. е. билинейной функцией по обоим аргументам.
Если гильбертово пространство рассматривается над полем С комплексных чисел, то из свойств 2°—5° вытекает
§1.7. Понятие гильбертова пространства АП
(х, y+z)=(x, j) + (х, z), (х, ау) = бс(х, j>), Vx, уеН, VaeC.
Функция (x, у) при фиксированном х и переменном у является полулинейной по у. Название «полулинейная» функция употребляется для функций / на линейном (векторном) пространстве L над полем С таких, что
Дх+у)=/(х) +/(Л Дах)=а/(х) Vx, yeL, аеС.
В отличие от случая линейных функций числовой комплексный множитель ос выносится за знак функции, будучи подвергнут комплексному сопряжению. Функцию (х, у) как функцию двух векторных аргументов называют при этом «полуторалинейной» (впрочем, вместо термина полулинейная функция употребляется термин «антилинейная» функция).
3) Свойство 6° называют свойством полноты: гильбертово пространство полно. Это свойство является обобщением известного свойства числовой прямой, заключающегося в том, что всякая последовательность Коши имеет предел; более строгая формулировка этого свойства числовой прямой такова: всякая последовательность вещественных чисел хь х2, х„, ...,
удовлетворяющая свойству lim |xw — х„| = 0, имеет предел, и, m-> оо
т. е. существует точка х такая, что lim хп = х.
4) Свойство 8° называется свойством сепарабельности: гильбертово пространство сепарабельно. Смысл требования 8° состоит в том, что в понятие гильбертова пространства включаются лишь такие бесконечномерные евклидовы пространства, которые имеют, хотя и бесконечную, но (при этом условии) «минимально возможную» размерность. Дело в том, что «самым маломощным» бесконечным множеством является множество натуральных чисел (счетное множество; «столько» же членов имеет последовательность х1? х2, х„, ...). Суще-
ствуют и «более мощные» бесконечномерные множества—например, множество точек отрезка [0, 1]. Понятия, взятые выше в кавычки, в теории множеств строго определены. Если у (сепарабельного) гильбертова пространства «базис» состоит из счетного множества векторов, то пространство, удовлетворяющее свойствам 1°—7° (и не удовлетворяющее свойству 8°) имеет в качестве «базиса» более «мощное» множество векторов. Такие пространства иногда называют несепарабельными гильбертовыми пространствами. Несепарабельные гильбертовы пространства рассматриваются сравнительно редко, имеют меньше приложений. Мы будем рассматривать исключительно сепарабельные гильбертовы пространства.
48 Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
5) Иногда рассматривают пространства, удовлетворяющие свойствам 1°—5°, 7°, 8° (без свойства 6°). Такие пространства не обладают свойством полноты. Их называют предгильбертовыми пространствами. Существует стандартная конструкция пополнения, т. е. построения по неполному пространству с помощью присоединения к нему дополнительных («предельных») точек некоторого нового пространства, обладающего свойством полноты. Эта конструкция применима к любому метрическому пространству, частным случаем которого является предгильбертово пространство (см. § 1*.7, 1). В дальнейшем мы не будем иметь дела с предгильбертовыми пространствами.
2°. Примеры гильбертовых пространств
Пространство /2. Элементами (векторами) этого пространства являются числовые последовательности х = (х15 х2, •••> хп, ...), где x^gR (z= 1, 2, ...) и ряд, составленный из квадратов элементов xt (z=l, 2, ...), сходится, т. е.
00
£х?<00. (1)
i= 1
Скалярное произведение двух векторов х = (хъ х2, хП9 ...) и У = {У1, У2, Уз, — , Уп, •) по определению равно
00
(х> Л = £ (2)
i= 1
Можно доказать (см. § 1*.7, 2), что ряд (2) сходится для любых х, yel2, так что скалярное произведение (х, /) действительно определено для каждой пары х, /е/2. Свойства 1°—8° проверяются без особого труда (см. § 1*.7, 3).
Аналогично можно построить гильбертово пространство /2 над полем комплексных чисел: элементами такого пространства являются произвольные последовательности z=(z15 z2, ..., z„, ...) 00
комплексных чисел, удовлетворяющих условию £ zfzf<oo, где Zi означает, как обычно, число, комплексно сопряженное с zf. Скалярное произведение двух элементов и = (и19 и2, ип, ...) и г = (г15 г2, ..., ги, ...) определено формулой (и, v)=^UiVi.
Пространство L2. Особое значение в гармоническом анализе имеют гильбертовы пространства функций. Будем рассматривать функции на отрезке [я, Z?]. Естественным способом задания скалярного произведения функций /(х), g(x) на отрезке [а. является следующий:
ь
(f, g)=]f(x)g(x)dx. (3)
§1.7. Понятие гильбертова пространства
49
Для того чтобы построить гильбертово пространство функций на отрезке [а. b ], следует указать, какие из функций на этом отрезке принадлежат пространству, а какие не принадлежат. Потребуем, чтобы в конструируемое пространство входили все непрерывные функции. Оказывается, что множество С [а, b ] всех непрерывных функций на отрезке [я, b ] не является гильбертовым пространством, так как С [а. b ] не полно. Дело в том, что существуют последовательности непрерывных функций, предел которых представляет собой разрывную функцию и для таких последовательностей нарушается условие 6 . Однако можно проверить, что пространство С [я, b ] является предгильбертовым, его можно пополнить и пополнение окажется уже гильбертовым пространством. Это пополненное пространство обозначается через L2 и называется пространством функций с интегрируемым квадратом. В грубых чертах оно состоит из всех функций g(x) на отрезке [я, Z?], для которых существует интеграл
ъ jg2(x)dx. (4)
а
Это условие, само собой разумеющееся для непрерывных функций g(x), становится ограничительным для разрывных функций, например для неограниченных (в этом случае интеграл (4) понимается как несобственный). Так, для функции /(х)=1/\/х интеграл
существует (сходится), а
для функции g (х) = 1 jyfx интеграл
не существует (расходится).
Более строгое описание пространства L2 таково: пространству L2 принадлежат все функции, интегрируемые в квадрате, при этом всякие две функции /(х) и g(x), для ь
которых f(/— g)2dx = 0, задают один и тот же элемент а
пространства L2. (Строго говоря, элементами (векторами) гильбертова пространства L2 являются не сами функции, интегрируемые в квадрате, а их классы эквивалентности,
50 Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
определенные указанным выше условием.) Примерами функций, задающих один • и тот же элемент гильбертова пространства £2, являются функции /(х) = 0 и
, ч (0 при х=/х0, g(x)=<
(1 При Х = Х0, Xoe|/Z,
Заметим, что непрерывные функции можно считать принадлежащими пространству £2; дело в том, что среди всех функций /(х), определяющих тот же вектор у из £2, что и заданная непрерывная функция g(x), имеется единственная функция — сама g(x); все другие такие функции разрывны. Поэтому в таких случаях непрерывная функция g(x) является естественным представлением элемента у. Разумеется, пространство L2 определено не только множеством своих элементов, но и скалярным произведением (3).
Во избежание недоразумений отметим еще, что функции, интегрируемые в квадрате на отрезке [я, Z>], могут быть не определены в некоторых точках отрезка (например, обращаться в бесконечность).
3°. Изоморфизм гильбертовых пространств. Два гильбертовых пространства Н± и Н2 над полем С (или R) называются изоморфными, если существует биективное линейное отображение ср: Н1-^Н2 такое, что (х1? х2)1 = (ф(х1), ф(х2))2, где (х1? x2)j означает скалярное произведение векторов х± и х2 в Нъ а (ф(хх), ф(х2))2— скалярное произведение векторов ф(хх) и ф(х2) в Н2.
Ясно, что свойства изоморфных пространств Нг и Н2, выражаемые в терминах скалярных произведений (х1? х2)1 и (ф(хг), ф(х2)2, «соответствуют» друг другу; иначе говоря, пространства Пх и Н2 отличаются лишь «названием» векторов и скалярных произведений. Изоморфные гильбертовы пространства «одинаковы» в главном — в их свойствах, выражаемых в терминах скалярных произведений, и отличаются несущественным— конкретной реализацией своих элементов.
Теорема. Любые два гильбертова пространства над полем С (или над полем R) изоморфны между собой.
Доказательство приведено в § 1*.7, 4.
Комментарий к теореме. Смысл теоремы заключается в том, что существует только одно (с точностью до изоморфизма) гильбертово пространство—все остальные гильбертовы пространства ему изоморфны.
В частности, изоморфны между собой гильбертовы пространства /2 (состоящее из последовательностей) и L2 (состоящее из функций).
При этом пространство /2 является «непосредственным» обобщением евклидова и-мерного пространства, и к нему
1.8. Ряды Фурье. Тригонометрническая система. Неравенство Бесселя
51
применимы (обобщенные) конструкции линейной алгебры, а функции из пространства L2 могут быть исследованы с помощью математического анализа.
Изложенные два толкования одного и того же гильбертова пространства имеют многочисленные полезные следствия. Эта идея и лежит в основе теории рядов Фурье.
§ 1.8. Ряды Фурье. Тригонометрическая система. Ортогональность. Сходимость в среднем. Неравенство Бесселя. Норма
1°. Гармонические колебания. Если на материальную точку действует сила, пропорциональная отклонению точки от начала координат, то положение материальной точки на оси х в момент времени t задается функцией вида
х = A cos(coZ-bcp). (1)
Точнее говоря, функция х(/) удовлетворяет дифференциальному уравнению
х + со2х = 0. (2)
В этом уравнении ускорение х, пропорциональное согласно второму закону Ньютона силе, пропорционально координате х с (отрицательным) коэффициентом пропорциональности, равным — св2.
Закон движения, определяемый дифференциальными уравнением (2) или функцией (1), называется гармоническим колебанием с амплитудой А, частотой со и фазой ср.
Напомним, что всякая линейная комбинация функций sin со/ и cosco/ может быть представлена в виде (1). Действительно,
a cos со/ + b sin со/ = yj а1 + b 2
а Ь
- COS со/ + -------sin со/
/a2 + b2 Ja2 + b2
= у/а2 + b2 (cos со/ cos ср — sin со/ sin ср) = yj a2 + b2 cos (со/ + ср), (3)
где ср — угол такой, что
а yjc^ + b2
= cos ср,
b .......= SIH О
'а2 + Ъ2
(4)
(легко видеть, что такой угол существует при любых а и />). Функции вида (1) называются гармониками’, они являются периодическими с периодом Т = 2л/со.
2°. О разложении периодической функции в ряд по синусам и косинусам. Пусть f (/) — периодическая функция, описывающая некоторое колебательное движение. Естественно поставить
52
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
вопрос о представлении этой функции в виде суммы «простейших» колебаний, каковыми являются гармоники. При этом заранее ясно, что период функции /(/) должен быть целым кратным периоду любой гармоники, входящей в эту сумму. Пусть период функции f(t) равен 2л. Тогда гармоники, сумма которых должна быть равна функции f (t), имеют вид Лисо8{/^ + ср), и при этом
00
/(*)= Е Acos(«z+<p)-
п = 0
(5)
Как было отмечено выше, разложение (5) сводится к разложению вида 00
/(0==“7+ £ fl„cos72/+Z>nsinn/. (6)
2 п=1
(В правую часть формулы (6) включено слагаемое А0 = а0/2; удобство этого обозначения будет ясно из дальнейшего.)
Покажем, что если разложение (6) существует и ряд в правой части сходится равномерно, то коэффициенты ап, Ьп однозначно определяются формулами
- /(/)cosz2/ck (и = 0, 1, 2, ...);
(7)
п
bn=- I /(z)sinwzdz (и=1, 2, ...). (8)
7U J V ' — п
Для этого воспользуемся тождес i вами
fl-dz = 2Tt; (9)
— п
j cosmzdz = 0, J sinmZdZ = O; (10)
— п —п
п п
J COS2W7/ck = 7l, J sin2727/d/ = 7C; (11)
— л — П
п п
J cosmt cos nt At = 0, (m/н), J sinmz cosnt d/ = 0; (12)
— n —7C
7Г
J sinmtsinntd/ = 0 (m^n). — 7C
Доказательства этих тождеств приведены в § 1.8*, 1.
f 1.8. Ряды Фурье. Тригонометрническая система. Неравенство Бесселя 53
Умножая обе части равенства (6) на cos/л/ (т=1, 2,...) и интегрируя функции в левой и правой частях от —я до л, имеем
п Л Л 00
J f(t)cosmtdt = J — cosmzdz+ J £ ancosntcosmtdr+
— It —n — itn=l
It 00 Л
+ f bn sin nt cos mt dt = £ an j cosnZcosm/di+ (13) — It n—1 —n
It
+ bn J sin nt cos mt dt = nam.
~ Л
Здесь учтена возможность почленного интегрирования ряда, вытекающая из предположения о его равномерной сходимости, а также формулы (10)—(12). Аналогично, умножая обе части равенства (6) на sin;?/ и интегрируя от —л до л, получаем
J f (t) sin mt dt = nbm. (14)
— Л *
Наконец, интегрирование обеих частей равенства (6) от —л до л дает
y-2*=f f(t)dt. (15)
— л
Из равенств (13) — (15) непосредственно вытекают формулы (7) и (8). При этом равенство (15) и введенное обозначение а0/2 для одного из слагаемых правой части разложения (6) позволяет вычислять ат(т— 1, 2,...) и aQ по единой формуле (7). Коэффициенты ап(п = 0, 1, 2,...) и bm(m = 1, 2,...) называются коэффициентами Фурье функции /(х), а ряд в правой части равенства (6)—рядом Фурье функции /(х).
3°. Тригонометрическая система. Ортогональность. Решение задачи о разложении функции /(/) в ряд по синусам и косинусам, выражаемое формулами (6)—(8), основано (кроме предположения о равномерной сходимости ряда (6)) на свойствах системы функций
1, cosx, sinx, cos2x, sin2x,..., coswx, sinwx,..., (16)
описываемых равенствами (9)—(12). Система (16) называется тригонометрической системой. Свойства такой системы уместно и полезно рассматривать с точки зрения скалярного произведения функций.
Назовем скалярным произведением двух функций f(t) и g(Z) определенных на отрезке [—л, л], число, равное
(17)
— л
и обозначаемое через (/(Z), g(/)).
54
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Тогда с помощью введенного понятия равенства (9) — (12) можно описать следующим образом.
Скалярные произведения двух различных функций системы (16) равны нулю, а все скалярные квадраты функций системы (т. е. скалярное произведение каждой из функций системы на себя) равны п (за исключением функции 1, скалярный квадрат, который равен 2п). По аналогии со случаем конечномерного евклидового пространства можно говорить о том, что функции системы попарно ортогональны. Функции системы (16) можно пронормировать; тогда нормированные функции будут не только взаимно ортогональными, но и иметь скалярные квадраты, равные единице. Нормированная система функций имеет вид
sin х cos 2x sin 2% cos nx sin nx
(18)
1 cosx /—5 r~ '
y/'llZ yjn yjn yjlt yjn yjft yjn
Для любых двух функций gi(t\ gj(t) системы (18) выполняются равенства
(Мд,
О, zVj;
1, i=j-
(19)
Система функций (16) называется ортогональной (любые две различные функции этой системы взаимно ортогональны), а система функций (18) — ортонормированной (любые две различные функции системы взаимно ортогональны и скалярный квадрат каждой функции равен единице).
Функции системы (18) (а также (16)) линейно независимы. Это означает, что если при некоторых коэффициентах сх-00
линейная комбинация £ afgf(Z) обращается в нуль, т. е. ряд 1 = 1 00
S сходится к тождественному нулю, то все коэффици-i = 1
енты ocf равны нулю. Действительно, опуская некоторые подробности, упомянутую линейную независимость можно оо
доказать следующим образом. Из равенства £ (/) = () при
i = 1
любом натуральном к следует, что
00
Z ^(^(0^(0)=°’ (20)
i=l
откуда, учитывая равенства (19), получим
М&ОЬ &(0)=ал=0 (^=1> 2,...).
(21)
j> 1.8. Ряды Фурье. Тригонометрническая система. Неравенство Бесселя 55
Ортонормированную систему функций можно считать аналогом ортонормированного базиса в конечномерном евклидовом пространстве. Естественно, что линейное пространство, в котором ортонормированная система функций является ортонормированным базисом, состоит из линейных комбинаций функций ортонормированной системы, причем допускается и линейная комбинация, содержащая бесконечное число слагаемых. Линейная комбинация с бесконечным числом слагаемых представляет собой ряд. Истолкование ряда как функции связано с вопросами сходимости этого ряда.
Как было установлено в п. 2°, для всякой периодической функции /(х) по формулам (7) и (8) можно вычислить коэффициенты яи(я = 0, 1, 2,...) и 2,...) если, конечно,
существуют интегралы (7) и (8), и составить ряд
00
Z tfnCOS7?X + Z>wSin/7X.
п= 1
Этот ряд называют тригонометрическим рядом Фурье функции /(х). Иногда этот ряд сходится равномерно; тогда его сумма равна /(х) и в этом случае функция /(х) непрерывна. Иногда этот ряд сходится в каком-либо другом смысле; в этом случае функция f (х) удовлетворяет некоторым специальным условиям.
Среди различных видов сходимости рядов, кроме поточечной и равномерной сходимости, ниже будет рассмотрена так называемая сходимость в среднем.
Весьма важным вопросом рассматриваемой теории является вопрос такого рода: каким условиям должна удовлетворять функция f (х), чтобы ее тригонометрический ряд Фурье сходился к ней в том или ином смысле?
4°. Сходимость в среднем. С помощью понятия скалярного произведения функций, заданного формулой (17), можно определить особый вид сходимости функционального ряда—сходимость в среднем. Этот вид сходимости удобен тем, что задача о разложении функции в сходящийся ряд оказывается аналогичной задаче разложения вектора евклидова пространства по ортонормированному базису, причем эта аналогия особенно сильна в сравнении с другими видами сходимости.
Определение 1. Последовательность функций , /2,..., fn9 ..., определенных на отрезке [а. Ь\ вещественной оси, называется сходящейся к функции f(x) в среднем, если числовая последовательность /-/Д /-ЛХ •••> ... сходится к нулю. 00
Ряд функций £ (х) называется сходящимся к функции
i= 1
/(х) в среднем, если последовательность частичных сумм ряда
56 Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
п
S2, Sn,(и = 1, 2,...) сходится к функции 1=1 f(x) в среднем.
Комментарии к определению 1. 1) В определении содержатся скалярные произведения, заданные формулой (17). Предполагается, разумеется, что все такие скалярные произведения определены, т. е. соответствующие интегралы существуют.
2) Легко видеть, что если для каких-либо двух функций ср± (х), <р2 (х) существуют скалярные квадраты
ъ (<р;(х), ф,.(х)) = {ф?(х)<1л: 0=1, 2,...), а
то существуют и скалярные произведения ь
(Ф1(х), ф2(х))=|ф1(х)ф2(х)<Ь:. а
b
Функции <р(х), для которых существует Jcp2(x)dx, называются а
функциями с интегрируемым квадратом. Множество всех таких функций является линейным пространством. Следовательно, определение применимо к рядам и последовательностям функций с интегрируемым квадратом. При этом можно доказать, что функция S(x), к которой сходится последовательность или ряд, также является функцией с интегрируемым квадратом.
Примеры. 1. Доказать, что если последовательность функций /1? /2,..., fn>— сходится к функции /(х) равномерно, то эта же последовательность сходится к /(х) в среднем. ъ
Решение. Последовательность чисел j (/—Л ) 2 dx,
ь ь а
f (/—/2)2dx,..., J(/—/„)2dx,... сходится к нулю, так как а а
в случае равномерной сходимости для всякого 8 найдется такое 7V, что при всех натуральных n>N, для которых ь
\fn —/|<8„, выполняется неравенство f(/—fn)2 dx<E„(b — а), от-ь а
куда lim f 2 dx = 0. п~^ 00 а
2. Доказать, что существуют последовательности функций Л, А? •••> fn>которые сходятся к функции f в среднем, но не сходятся (в смысле поточечной сходимости) ни в одной точке.
1.8. Ряды Фурье. Тригонометрническая система. Неравенство Бесселя
57
Решение. Пусть
1 при х Е gki=^
О при Х~Ё
L
2*’ 2к ’
I /+1
2*’ '
/=О, 1, 2,..., 2к~'-
функции gki (х) определены на отрезке [0, 1 ]. Очевидно, что
о z
(*)
Если перенумеровать функции gkt так, чтобы для двух функций gkli1 и g^ при кг<к2 функция gkl предшествовала gk /, а при равных первых индексах к±=к2 = к функция gki предшествовала gki в случае 1±<12, то получим последовательность функций, сходящихся к нулю в среднем (в силу (*)). Эта последовательность функций не сходится ни в одной точке. Действительно, значения функций последовательности в каждой точке представляют собой последовательность из нулей и единиц, причем в каждой точке такая последовательность состоит из бесконечного множества нулей и бесконечного множества единиц.
3. Доказать, что существует последовательность функций с интегрируемым квадратом /15 /2,..., fn,..., определенных на отрезке [0, 1 ], которая сходится к функции f (х) во всех точках отрезка, кроме точки х = 0, но не сходится к /(х) в среднем.
Решение. Пусть
, \ ПРИ 1/лг, " % (0 при 1/п^х^1.
Последовательность /2,..., fn,... сходится к функции /(х) в каждой точке отрезка, за исключением х = 0; при этом
1 1/w г- 1
(Ш-Л4 f (T^)2dx=«--=i.
О о п
Таким образом, скалярное произведение {fn—f, fn—f) равно 1 при всех п и поэтому не стремится к нулю. Значит, последовательность /19 /2,..., fn,... не сходится к f в среднем.
5°. Неравенство Бесселя. Норма. Рассмотрим ортономирован-ную систему функций (18). Введем обозначения
58 Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
g1=-^=, g2k(x) = ^-cos,kx, А/2тГ yjn
( \ 1 • Т Г 1 9 (22)
g2k+i (х) = —smfcx, 2,....
Пусть теперь gdxl g2(xl-’ gn(x)’- (23)
— произвольная ортонормированная система функций, определенных на отрезке [а, b ] и f— функция с интегрируемым квадратом. Положим ъ
ck = \f{x)gAx)Ax^ (24)
а
коэффициенты ск будем называть коэффициентами Фурье функции f (х) по системе (23).
При указанных условиях справедливо неравенство
Ъ п
f/2(x)dx^ £ cl (л=1, 2, ...), (25)
a k = 1
которое называется неравенством Бесселя.
Для доказательства неравенства (25) рассмотрим неот-Ь п
рицательное число J(/— ckSk)2d* и преобразуем этот ин-а k = 1
теграл следующим образом:
b п b п b b п
°<f(/“ £ ckgk)2dx = \f2dx-2 Y CkSfgkdx+Sd ckgk)2dx = a k=1 a k=1 a a k=l
b n n b b n n
= f/2dx + 2 £ ck+ £ ckci$gkgidx = ]f2dx~2 Ё ck+ Ё = а к— 1 fc=l a a k=1 k= 1
1=1 b n
= ]f2dx- X cl. а к- 1
Тем самым неравенство Бесселя доказано.
В дальнейшем удобно будет пользоваться понятием нормы функции с интегрируемым квадратом.
Определение 2. Нормой функции /(х) с интегрируемым квадратом, определенной на отрезке [а, b ], называется число 1ь
hf2(x)dx-
V а
Норма функции f (х) обозначается через ||/||; согласно определению, ||/ || =
£ 1.8. Ряды Фурье. Тригонометрническая система. Неравенство Бесселя
59
Понятие нормы есть обобщение понятия длины вектора в евклидовом пространстве конечного числа измерений. Это вытекает из следующих свойств нормы, легко доказываемых
непосредственно на основании ее определения: 1°. ||/||^0, причем ||/||=0 только при /=0; 2°. Il/+gll< 11/11 +llgll;
3°. ||о/|| = |а|-||/||.
Здесь /, g—функции из пространства L2, а а — произвольное число из R (или С).
Свойство 1° следует понимать так: всякая функция/ с интегри-ь
руемым квадратом, у которой j/2(x)dx=0, эквивалентна функции
/=0 (Сама функция/(х), строго говоря, может быть отлична от нуля; подробнее об упомянутой эквивалентности см. § 1*.8, 2.) Свойство 2° представляет собой обобщение неравенства треугольника в конечномерном евклидовом пространстве.
6°. Примеры ортонормированных систем
1. На отрезке [—1, 1J рассмотрим множество функций
1, х, х2, х3,.... (26)
Известно, что всякую непрерывную функцию на отрезке [—1, 1] можно приблизить многочленами от х, т. е. линейными комбинациями функций (26). Напомним, что пространство £2 функций с интегрируемым квадратом образовано пополнением пространства всех непрерывных функций по норме ||/1|, определенной с помощью скалярного произведения:
(/ g)= f/Wg(x)dx, ll/ll = V(Z7). (27)
-1
Таким образом, каждая функция с интегрируемым квадратом может быть сколь угодно близко (в смысле указанной нормы) приближена многочленами; в этом смысле функции (26) составляют «базис» гильбертова пространства £2. Однако в отличие от тригонометрической системы функций (18) § 2 система (26) не является ни ортогональной, ни ортонор-мированной.
Можно построить новую систему многочленов goW> gi(*)> g2 (*)>•••> g„ (*)>•••
так, чтобы она была ортонормированной и чтобы gfc(x) был ортогонален функциям 1, х, ..., xfe“1. Это построение называют ортогонализацией системы функций (26).
Опуская подробности такого построения, укажем окончательный результат. Оказывается, что функции
60
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
( \ dn / 2
(28)
обладают указанным выше свойством.
Для значений А; = 0, 1, 2, 3,... многочлены gk (их называют многочленами Лежандра) имеют вид
-j 2х
#0=1> gl=-r’ g2 =
12х2-4х+ 1 120х3-72х
------Г---> g3 =------F---:
(29)
Можно говорить о коэффициентах Фурье произвольной функции f (х) с интегрируемым квадратом, о ряде Фурье, о разложении функции в ряд Фурье по системе gk(x) (k = 0, 1, 2, ...).
2. Рассмотрим систему функций, называемых многочленами Чебышева’.
Тп (х) = cos (п arccos х); (30)
в частности,
7\ = х, Т2 = 2х2-\, Т3 = 4х3-Зх. (31)
Если в пространстве функций на отрезке [—1, 1] ввести скалярное произведение по формуле
(/’ g)=
1
J л/1-*2
-1
(32)
(для тех функций /, g, для которых этот интеграл определен), то можно проверить, что относительно этого скалярного произведения система (30) является ортогональной. Говорят, что функции системы (30) ортогональны с весом 1/^/1 —х2. После нормировки, т. е. перехода от Тп к Тп1у/(Тп9 Тп), получается система ортонормированных функций. Многочлены Чебышева играют важную роль в задачах интерполяции.
3. Дифференциальное уравнение
x2g" + xj/ + (x2 — v2)y= 0,
где у — неизвестная функция переменной х, v — постоянная, называется уравнением Бесселя индекса v
Одно из решений этого уравнения, а именно то, которое (в случае целого v) имеет вид
у (-1)* Г
(33)
1.8. Ряды Фурье. Тригонометрническая система. Неравенство Бесселя 61
обозначается через Jv(x). Функции Jv(x) почти для всех v не являются элементарными, т. е. не выражаются через простейшие элементарные функции. Для многих функций Jv(x) составлены подробные таблицы.
График этой функции описывает затухающие колебания, бесконечное число раз пересекая ось х. Пусть v15 v2,vn, ...—нули функции Jv(x), т. е. значения аргумента, в которых функция Jv(x) обращается в нуль. Будем считать, что числа vk в указанной последовательности расположены в порядке возрастания. Эти числа вычислены с большой степенью точности.
Оказывается, что функции
Jv(vix)’ Jv(ykx),... (34)
ортогональны на отрезке [0, 1] с весом к. Это означает, что
(Jv(vkx), Jv(v,x))=0 (&//), (35)
где скалярное произведение функций f, g определено формулой
(/, g)=$xf(x)g(x)dx. (36)
О
Иначе говоря,
1
f Jv(ykx)Jv(ylx)xdx=O
О
при к^1.
После нормировки, т. е. перехода от функции Jv(ykx) (к=\. 2,...) к функциям Jv(ykx')l^/{Jv(ykx). Jv(ykx), получаем ортонор-мированную систему функций. При этом справедлива формула
Jv(vfcx))=l[Jv+1(vJ]2.
Можно говорить о коэффициентах Фурье, ряде Фурье, о разложении функции в ряд Фурье по системе функций (34). Этот ряд называется рядом Фурье—Бесселя.
Коэффициенты ряда Фурье — Бесселя в соответствии с общей схемой могут быть найдены по формуле
1
(£=1> 2>-)-
О
Многие задачи математической физики требуют разложения функций в ряд Фурье — Бесселя.
62
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
§ 1.9. Полнота и замкнутость тригонометрической системы. Сходимость рядов Фурье. Комплексные ряды Фурье.
1°. Сходимость рядов Фурье в среднем. Как известно, для каждой функции / с интегрируемым квадратом на отрезке [—л, л] можно вычислить коэффициенты Фурье и по ним составить ряд Фурье этой функции. Ниже мы докажем, что этот ряд сходится к /(х) в среднем (см. теорему 3).
Предварительно докажем два важных свойства ортонор-мированной тригонометрической системы функций—так называемые свойства замкнутости и полноты.
Определение 1. Ортонормированная система функций g1? _g2, •••, gn—> определенных на отрезке [a, 6], называется замкнутой, если для каждой функции f(x) с интегрируемым квадратом выполняется равенство
Ь оо
J/2dx= £ cl, (1)
a k— 1
где ъ
ck=]f{x)Sk(x)dx. (2)
а
Формула (1) называется равенством Парсеваля.
Теорема 1. Ортонормированная тригонометрическая система функций
cos х sin х cos lx sin 2x
cos nx sin nx
(3)
является замкнутой на отрезке [—л, л].
Доказательство приведено в § 1*.9, 1.
В доказательстве используются утверждения о возможности приближения любой непрерывной функции f функциями вида п
£ ckgk (тригонометрическими многочленами) и о возможности k= 1
приближения всякой функции /(х) с интегрируемым квадратом непрерывными функциями.
Первое из этих утверждений составляет содержание теоремы Вейерштрасса, а второе вытекает из построения пространства L2 с помощью пополнения пространства непрерывных функций.
Сформулированная теорема представляет собой частный случай теоремы Стеклова.
Определение 2. Ортонормированная система функций g19 g2,..., gn,... называется полной, если для всякой функции с интегрируемым квадратом, ортогональной ко всем функциям системы, выполняется равенство ||/||=0.
1.9. Полнота и замкнутость тригон, системы. Компл. ряды Фурье 63
Комментарий к определению 2. Напомним, что функция / для которой || f || = 0, эквивалентна нулевому вектору в гильбертовом пространстве.
Легко видеть, что исключив из какой-либо ортонормирован-ной системы одну из функций, получим неполную систему, так как исключенная функция ортогональна по всем функциям системы.
Теорема 2. Ортонормированная тригонометрическая система функций (3) является полной.
Доказательство. Пусть/(х)—функция с интегрируемым квадратом, ортогональная ко всем функциям gk (к=1, 2,...). Это означает, что
cJ/)= f fgk(x)dx = Q- (4)
— п
00
Отсюда следует ||/|| = £ с£ = 0. Таким образом, всякая ин-к=1
тегрируемая с квадратом функция /, ортогональная к каждой из функций gk ортонормированной тригонометрической системы (3), имеет норму, равную нулю.
Из теоремы 1 вытекает теорема о сходимости в среднем ряда Фурье тригонометрической системы.
Теорема 3. Пусть f(x)— функция с интегрируемым квадратом на отрезке [ — я, я] и
00
—+ £ akcoskx-ybks\x\ kx (5)
2 k = 1
ее ряд Фурье по системе функций
1, cos х, sin %, cos2x, sin2x, ..., cos их, sin их, .... (6)
Тогда ряд (5) сходится к f(x) в среднем.
Доказательство. Для ортонормированной тригонометрической системы функций (3) g19 g2..... gk.... и произвольной функции / с интегрируемым квадратом имеем
S (f- Е ckgk)2dx= i f1 2(x]dx- £ cl, — л k = 1 — л k= 1
где ck—коэффициенты Фурье функции /(x) относительно системы (3).
Так как ортонормированная тригонометрическая система замкнута, то
1 (/- Z (7)
— л k = 1
п
при и —> оо и ряд £ ckgk сходится к /(х) в среднем.
к=1
64
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Переходя от системы (3) к системе (6), на отрезке [—я, тт] получаем л 2п+1 п п
J (Я*)~ Е ckgk)2dx= f (/(х)-у+ X «fccos/oc + /vin/cx)2dx, — тс к=1 — л к=1
где, как и выше,
gx(x) = l, g2(x) = cosx, g3(x) = sinx, g4(x)=cos2x, g5(x) = sin2x,g2k(x)=coskx, g2ft+1(x)=smfcx,
Л Л
I z./ \COSkx 1 \Sinfcx 1 /7 1
Cik= /(*)—7=-dx, c2t+1= /(x)—-dx (fc=l, 2,..., n,
J v71 J v 71
— л —n
В равенствах (8) учтено, что
где
2,...),
л
/(х) cos кх dx,
а
а также, что
r2/c + ig2k+i=^sin/cx (к=1, 2,...),
где
bk=- f(x)sinkxdx, aQ=-71 I v ' 71
/(x)dx.
Условие (7) означает, что ряд Фурье функции f сходится к самой функции f в среднем.
Из доказанной теоремы вытекает, что на отрезке [—/, /] система функций
. пх . их 2tix . 2пх
1, cos~p smY’ cos-/“5 slnT’ *
(9)
является ортогональной, а система
j>' 1.9. Полнота и замкнутость тригон. системы. Компл. ряды Фурье
65
тех . тех 2тех . 2тех
cos-у sm — cos — sin-у
(Ю)
Ji’ Vi’ Ji ’ // ’"
— ортонормированной.
Можно вычислить коэффициенты Фурье интегрируемой с квадратом на [—/, /] функции /(х) относительно системы (9) и составить ряд Фурье.
Из теоремы 3 с помощью замены переменной л на у легко вывести, что для всякой интегрируемой с квадратом функции /(х) ряд Фурье этой функции относительно системы (9) сходится к / (х) в среднем. Это означает, что ряд
a ~ якх . Tikx
-+ X akcos—+ Z>fcsin—-
2 fc=l 1 1
где
i
ak = j J/(x)cos^--dx (k = 0, 1, 2,...), (11)
-i
i
= 2’ <12)
-i сходится к f в среднем.
Обратим внимание на следующее обстоятельство. Известно, что если функция F(x) четная, то
i i
J F(x)dx = 2 jF(x)dx, -i о
а если функция F(x) нечетная, то
i
f F(x)dx = 0.
-i
В том случае, когда ^функция f (х) является четной, все коэффициенты bk (или bk) равны нулю и ряд Фурье состоит из одних косинусов. В том же случае, когда функция /(х) является нечетной, все коэффициенты ак (или ак) равны нулю и ряд Фурье состоит из одних синусов.
Пусть функция /(х) определена (и интегрируема с квадратом) на отрезке [0, /]. Тогда ее можно продолжить на отрезок [—/, /] четным или нечетным образом, полагая для хе [— /, 0] в первом случае /(х)=/( —х), а во втором случае 3 Мантуров О.В.
66
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
f(x)~ —j (х). Продолженная функция, будучи четной (или нечетной), разлагается в ряд Фурье только по косинусам (или только по синусам). Коэффициенты разложения в первом
случае имеют вид
i i
Г г
1 \ nkx л 2 \ nkx
ak=~l /(x)cos —dx=y /(x)cos—,
-I 0
(13)
а во втором случае — вид
i i
J/(*)sin^<l*=| /(x)sin^dx. (14)
-I 0
В равенствах (13), (14) учтено, что функции /(x)cos^ и /(x)sin^^ являются четными.
Таким образом, интегрируемые с квадратом на отрезке [0, /] функции f(x) можно разлагать в ряд только по косинусам или только по синусам, при этом ряд будет сходиться к /(х) на отрезке [0, /] в среднем. Впрочем, всякая сходимость ряда Фурье на отрезке [ —/, /] четной (нечетной) функции /(х) обеспечивает такую же сходимость ряда по одним косинусам (по одним синусам) функции /(х) на отрезке [0, /].
2°. О различных типах сходимости рядов Фурье. Итак, для всякой интегрируемой с квадратом функции f (х) на отрезке [ — я, л] ее ряд Фурье по тригонометрической системе (16) сходится к /(х) в среднем. Примеры, приведенные в 4° § 1.8, показывают, что понятие сходимости в среднем существенно отличается от сходимости ряда Фурье в каждой точке и, тем более, от равномерной сходимости ряда Фурье.
Важное теоретическое и прикладное значение имеют вопросы о том, при каких условиях ряд Фурье функции сходится к ней в каждой точке или же сходится равномерно.
Ответы на эти вопросы дают следующие теоремы, которые мы приведем без доказательства.
Теорема 4. Ряд Фурье кусочно непрерывно-дифференцируемой на отрезке [ — л, л] функции сходится в любой точке интервала ]л, л [ к значению функции f в этой точке, а в точках /( —7l + O)+/(7C —0) х=—л и х —л—к значению —------------—----
2
Для периодической с периодом 2л непрерывной и кусочнодифференцируемой функции f (х) ряд Фурье этой функции сходится к ней равномерно.
$ 1.9. Полнота и замкнутость тригон. системы. Компл. ряды Фурье 67
Теорема 5. Если функция f (х) ограничена на некотором интервале, содержащемся в [ — л, л], имеет конечное число относительных максимумов и минимумов и точек разрыва первого рода, то на этом интервале ряд Фурье функции f (х) сходится в точке непрерывности х к f (х), а в точке х разрыва /(х —0)4-/(х + 0) первого рода — к значению --------------.
Комментарии к теоремам 4 и 5. 1) Если периодическая функция /(х) с периодом 2л непрерывно-дифференцируема в каждой точке, то ее ряд Фурье сходится к f (х) равномерно на всей числовой прямой. Для сравнения напомним, что существование всех производных недостаточно для разложения функции в ряд Тейлора.
Равномерная сходимость, как было отмечено выше, влечет за собой и сходимость в среднем.
2) Ряд Фурье для непрерывной функции f (х) может и не сходиться к функции f (х); помимо непрерывности, дополнительным условием сходимости является наличие конечного числа локальных минимумов и максимумов.
3) Для всякой непрерывной и периодической с периодом 2л функции f (х) существует последовательность тригонометрических многочленов, сходящаяся к f (х) равномерно. Пусть 5И(/)— частичная сумма ряда Фурье функции f (х), т. е.
п
Sn (/) = —+ akcoskx-y bksinkx. 2 k=i
Рассмотрим
. ._5.(/)+5,(/)+... + Ж.(/) 7 п
Ясно, что при любом п=1, 2,... аи(/) — тригонометрический многочлен.
Справедливо утверждение (теорема Фейера — Чезаро) о том, что аи(/) равномерно стремится к f (х).
Разумеется, сн(/) не являются частичными суммами ряда Фурье.
3°. Комплексные ряды Фурье. Ряду Фурье функции f (х) на отрезке [ — л, л] можно придать другой вид, если заменить функции cos их и sin их их выражениями через е1Иф по формулам Эйлера:
е1иФ_|_ e-in<P ei«<p_e“in<p
cos и ф =------, sin и ф =-------.
2 2z
3*
68
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Тогда получим
у+ X a„cos«(p + Z>„sin«<p=-^+ £ ап 2 1=1 2 i=l
_fo_|_ £ ^n~z^^efw<p I £ -
п=1 п= 1
,“»лф
-------ibn
2 п
+ Z^n) е - inq>
2
2
(15)
Положим а_п = ап, b_n=—bn, и=1, 2,..., я0 = 1, bQ = 0. В этих обозначениях правая часть равенства (15) примет вид
.,00 — 00
“+ X (an-ibn)^+ £ («_„-^_„)e+i"*₽= 2 fc=l п=-1
+ 00 + 00
Ц Z (an-ibn)e^= I спе^, 'п— ~ 00 п= — 00
где с„=^, п = 0, ±1, ±2,....
Если функция /(х) в том или ином смысле разлагается в ряд Фурье, то в том же смысле она представима в виде
+ 00
/(х)= X c„eiav. (16)
Из принятых обозначений следует, что л
сп=^~ J/(x)(coswx—zsin«x)dx (п = 0, ±1, +2,...), — п
ИЛИ
п
C„=^ lf(x)e-inxdx. (17)
— п
Ряд в правой части равенства (16) называется комплексным рядом Фурье функции /(х). Комплексная форма ряда Фурье обладает по сравнению с обыкновенным рядом Фурье преимуществом краткости и единообразия формул для коэффициентов. Кроме того, такая форма ряда Фурье позволяет перейти к конструкции интеграла Фурье (см. § 1.10).
4°. Примеры
1. Разложить в ряд Фурье периодическую функцию с периодом 2я, заданную в промежутке [—я, я] следующим образом:
ч f 1 при 0<х^л, / (х) л
[ — 1 при —жх^О.
1.9. Полнота и замкнутость тригон, системы. Компл. ряды Фурье
69
Решение. Для нахождения коэффициентов Фурье воспользуемся формулами (7) и (8) § 1.8. Имеем
п
ап = - J/(x)cosnxdx = 0 (и = 0, 1, 2,...),
— п
так как функция /(х) cos их—нечетная;
п п
b=- /(xlsinnxdx^- Lsinnxdx =
л J v 7 71J
О при четном и,
4
— при нечетном п.
пп
Следовательно, 4 4 4 4
f (x) = -sinxH—sin ЗхЧ—sin 5х+...+7-^-sin (2k+ l)x+...
J v 7 л Зл 5л (2£+1)л v 7
Согласно теоремам 4 и 5 этот ряд сходится к 1 при 0<х<1; к —1 при — 1<х<0; к 0 при х = 0 и к 0 при х= — л и х = л.
2. Разложить в ряд Фурье периодическую функцию с периодом 2л, заданную в промежутке [—л, л] следующим образом:
{-—х при х>0,
л
|+х при х<0.
Решение. Имеем
("=1, 2,...); О,-0.
70
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
Коэффициенты Ьп (и=1, 2,...) равны нулю, поскольку функция f (х) является четной.
Таким образом, ряд Фурье функции f(x) имеет вид
4
л
COSX +
COS Зх 9
cos 5х
25
Сумма этого ряда равна /(х) в каждой точке х из отрезка [—л, л]. В частности, при х = 0 получаем
откуда
9 25
Ь(2и+1)2 + --
4’(2й+1)2 + -
СО J
Можно вычислить и сумму ряда £ “г Для этого Рас“ п=1 п
смотрим ряд
Известно, что этот ряд сходится; обозначим его сумму через S. Легко видеть, что
1 / 1 1 \ 00
1+^+^+-)’ или 45= Е
\ / п= 1
Следовательно,
45-5=1Ч4+-+^+
8 ’
? 2 00 . 2 2
71 с я 1 л л к
откуда 3S=-, S-- т.е. Д =4- = -.
3. Разложить в ряд Фурье периодическую функцию /(х) с периодом 2/, заданную на отрезке [ —/, /] равенством /(х) = х.
Решение. Воспользуемся формулами (11) и (12). Имеем
an~~j J/(x)cos^dx = 0 (/7 = 0, 1, 2,...), -i
TtttX
поскольку функция f (x) cos---------
нечетная;
£ 1.9. Полнота и замкнутость тригон. системы. Компл. ряды Фурье
71
Г п Г n / —COS----
Г . ппх . 2 | . ипх . 2 / /
f (х sm — dx = - х sm — dx — - x------------
J 1 1J 1 1 \ ™
-i о l
1 =3!(-i)«+i.
0 ™
Ряд Фурье функции f (x) имеет вид
2/ / . пх 1 . 2лх 1 . 3tix (—1)” 1 . mix \
— sm——-sm — + -sm—— ... + -—-—sm—+ ... , л у I 2 I 3 I n I J
Согласно теоремам 4 и 5, этот ряд в каждой точке — 1<х<1 сходится к х, а в точках — I и I сходится к нулю.
~ Z
В частности, при х — ~ получаем
откуда следует, что
1
2&+1
3 5 7 V 7
4. Разложить функцию из примера 3 на отрезке [0, /] в ряд Фурье по косинусам.
Решение. Находим
Разложение в ряд Фурье по косинусам имеет вид
4/
1
tix 1 3tix
..... . . 5их
COS—+-COS— + — COS-------+ ... + ---—COS
тГ\ I 9 /25 I (2k+1)2
(2k + 1)я.х Г~
Сумма полученного ряда совпадает с суммой ряда из примера 3 на отрезке [О, Z] и отличается от нее знаком на отрезке [—Z, 0].
72 Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
5. Разложить в ряд Фурье периодическую функцию с периодом 2/, , заданную на отрезке [—/, I] следующим образом:
t ч — при хе Г — 8, 81,
/(*) = р Р L j О при Хб[ —8, 8].
Решение. Функция /(х)—четная, поэтому ряд Фурье будет содержать только косинусы. Имеем
8
I 1 Т1ПХ . —cos — dx =
J2е 1 о
«и
О
Т1ПХ sin----
1 I
1г Т1П
т
1 . Т1П Е х 1 П \
=—sin— (/?=!, 2,...); q Tine 1
/
ао ~
8 f±dx = -. ] 2б I о о
Соответствующий ряд Фурье имеет вид 7Ш8 \ 11-^ I Т1ПХ
= X -----------cos——.
' 7 21 ке _\ п I п — 1
Разложим функцию f(x) в комплексный ряд Фурье: innx innx
Tine , 7~ Tine
со sin—е +е +cosin -Ыпх
у(х)=1+1 V ------L----------=1+— У --------е 1 .
' 7 21 тсс п 2 21 2ле _ пе
п= 1 п=оо
п^О
§ 1.10. Интеграл Фурье.
Преобразование Фурье и его свойства
1°. Переход от ряда Фурье к интегралу Фурье. Пусть функция Дх), удовлетворяющая определенным условиям, разложена в ряд Фурье на отрезке [—Т, Т]:
00
/ \ CIq Т1ПХ j . Т1ПХ /1 \
/W = y+ L ancos —+bnsm—. (1)
n = 1
Если T увеличивается, то частоты nnlT (и=1, 2,...) образуют все более «густое» множество (расстояние между соседними частотами, равное л/Т, становится все меньше). При этом слагаемые в правой части уменьшаются и мы имеем сумму большого количества малых слагаемых. Поэтому сумму (1)
1.10. Интеграл Фурье. Преобразование Фурье и его свойства
13
можно истолковать как интегральную сумму некоторой функции и, перейдя к пределу при 7?->go, получить интеграл.
Используя равенство (1) и формулы т
an=j. f/(0cos^dz (и=0’ 2’-х
-Т (2)
т
J/(0sin^dz («=1, 2,...),
находим т т т
Л 00 1 /*
Лх)=27 /(0 dz + Z 7 J ДО cos ™cos At+
-т -т
т со /* Е1 \ . imt . Jinx .
- fiZJsm— sm — dt =
p I J \ / p p
-T T T
=~ [ ^Odz+ E 7 [/(Ocosy(z-*)dz- (3)
J n= 1 J
-T -T
Если в равенстве (3) перейти к пределу при Т->оо, то (при соблюдении некоторых дополнительных условий) первое слагаемое в (3) обратится в нуль, а второе слагаемое примет вид
+ 00 + 00
J /(z)cosX(z—x)dt
Действительно, рассмотрим функцию т
F(X) = - /(z) cos Z (t—x) dz
-T
(4)
и разобьем отрезок [—Г, Г], на котором изменяется переменная X, точками при этом АЛ = ХЛ+1—Интегральная
сумма этой функции по отрезку [— Г, Г] имеет вид т
WJ4=Z^7 p(z)cos^(/-x)dz, • (5)
-т
74
Глава I, Числовые ряды. Функциональные ряды. Ряды Фурье
что совпадает со вторым слагаемым в правой части равенства (3). Предел интегральной суммы (5) равен интегралу
(6)
Здесь использована четность функции cosX(/ — х) по X. Итак, равенство (3) в пределе при оо дает
(7)
Вводя обозначения
1
л
f(t) cos Х/d/,
(8)
из равенства (7) получаем
/ (*) = f (<4 cos sin (9)
о
Формулы (7), (9) являются аналогом разложения (1) для случая «непрерывных частот». Последнее следует понимать так: разложение (1) определяет перечень частот (Х=1, 2,..., п,...) (дискретное множество) с указанием амплитуд, соответствующих частотам: частоте — соответствует гармоника п
nkx , . nkx „ /—ч гу
<7fccos—-f-0fcsm— с амплитудой + Разложение (9)
содержит все частоты от 0 до оо, устанавливая для каждой частоты X гармонику (аг cos Хх + Ьг sin Хх) dX с амплитудой («бесконечно малой») dX.
Отношение амплитуды к длине отрезка (X, Х+АХ) называют плотностью амплитуды. Функция, сопоставляющая частоте
плотность амплитуды, называется спектром.
В дискретном случае (т. е. в случае рядов Фурье) спектром л к называют соответствие —
al + b%.
Формулы (7), (9) задают разложение функции f (х) в ин-те гр ал Фурье.
£ 1.10. Интеграл Фурье. Преобразование Фурье и его свойства
75
Интеграл Фурье можно записать в комплексной форме. Для этого следует учесть, что
откуда
+ оо
0= f /(z)sin^(z — x)dX,
— 00
/(/)sinX(^ —x)d^,
(Ю)
(И)
поскольку подынтегральная функция является нечетной по переменной к. Прибавляя к левой и правой части равенства (7) соответствующие части равенства (11), умноженные на i, получаем
2/(х)=
— zsinX(z — x)dX =
Следовательно,
о
dX /(/)e~a(t“x)dX.
(12)
Формулу (12) называют разложением функции f (х) в комплексный интеграл Фурье.
Разложить функцию в комплексный интеграл Фурье — это значит вычислить интеграл
фх(^) = 4-
Zu
/(/)е x)d/,
(13)
а затем записать равенство
+ 00
/(*)= f ФХ(Х)<1Х. (14)
— 00
2°. Преобразование Фурье. С разложением функций в интеграл Фурье тесно связано важное математическое понятие — преобразование Фурье.
Определение. Преобразованием Фурье функции /(х) называется функция
76
Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
+ 00
g(X)=2_ j (15)
— 00
Комментарий к определению. Понятие преобразования Фурье употребляется еще в несколько ином смысле, а именно как отображение, сопоставляющее каждой (допустимой) функции /(/) другую функцию (/y’)(X)=g(X), определенную формулой (15). Преобразование Фурье определено не для любой функции /(/), а только для допустимых функций, т. е. таких, для которых интеграл (15) существует.
Используя понятие преобразования Фурье, формулу (14) можно переписать в виде
+ 00
/(%)= f g(X)eiXxdX. (16)
— 00
Эта формула позволяет построить функцию /(х) по ее преобразованию Фурье g(X). Формула (16) является обращением формулы (15).
Пример. Пусть
{— при хе Г — 8, el,
2s L , J,
О при хе [ — в, е].
Найти преобразование Фурье этой функции и ее разложение в интеграл Фурье.
Решение. Имеем
+ оо +
Л(Х) = /7’=— I /(x)e-iXxdx=— I — e-lXxdx=— •-— =
’ ' 2л J ’ 2л J 2е 4ле — zX _g
— 00 —£
1 e-iex_eiEX_ | ei£X_e-iEX_ | sinXe
4леХ — i 2леХ 2i 2ле X
Разложение функции /(x) в комплексный интеграл Фурье имеет вид
+ 00
J[X’~ J 2ra ~T •
— 00
Спектром функции /(x) является функция
1.10. Интеграл Фурье. Преобразование Фурье и его свойства
77
ЭД=—
' ' 2к£
sin Хе X
Обратим внимание на следующее важное обстоятельство. При 8—>0 предел S(k) существует (и равен XI, однако предел \ 2л /
f(x) при е —> 0 не существует. Имея в виду это обстоятельство, говорят об «обобщенной» функции, которая является предельной для f(x) при е—>0. Ее называют б-функцией (функцией Дирака). Этой функции иногда можно придать физический смысл. Пусть, например, постоянная сила, величина которой равна единице, распределена равномерно на участке числовой оси [ —£, е]. Уменьшая е, мы получаем все большую плотность силы. Формально, если отрезок [—е, е] стянут в точку 0, то сила становится бесконечной. Однако можно представить себе силу, действующую на очень малом отрезке, физически не отличимом от точки. Тогда распределение силы в вышеуказанном смысле будет описываться 5-функцией.
Разложение функции в интеграл Фурье и преобразование Фурье играют большую роль в теоретических и прикладных вопросах (радиотехника, теория управления, теория вероятностей, дифференциальные уравнения и др.).
3°. Свойства преобразования Фурье. Использование преобразования Фурье в различных вопросах математики основано на следующих свойствах, которые мы приведем без доказательства.
1°. Если последовательность функцийсходится к функции f(x) в том смысле, что
+ 00
lim J |/„-/|dx = 0, (17)
- оо
то последовательность преобразований Фурье этих функций gr(x), g2(x),..., gn(x),... сходится к преобразованию Фурье g (х) функции равномерно для — оо < х < + оо.
2°. Преобразование Фурье g(X) функции f(x), удовлетворяющей условию
+ 00
J |/(x)|dx<oo, (18)
— 00
является ограниченной непрерывной функцией, которая стремится к нулю при |Х|—>оо.
3°. Если f(x) удовлетворяет условию
в
f|/(x)|dx<oo (19)
А
78 Глава I. Числовые ряды. Функциональные ряды. Ряды Фурье
при любых А, ВеШ, то справедливо равенство
£(/') = /!£(/). (20)
4°. Если k-я производная функции f существует,
причем
7l/(k)W|dx<o), (21)
00
то
<22>
т. е. из гладкости функции [существования к-й производной, удовлетворяющей условию (21)1 вытекает, что при |Х|—>оо преобразование Фурье функции/(х) убывает быстрее, чем 1/Х\
5°. Если f"(x) существует и удовлетворяет условию
+ 00
J (23)
— 00
то L(f) удовлетворяет тому же условию, т. е.
+ 00
J |g(X)|dX<со. (24)
— 00
6°. Если f(x) и xf(x) удовлетворяют условиям
J |/00|dx<co, f |x/(x)|dx< со, (25)
— оо — 00
то = дифференцируема, причем
g'(X)=F[zx/(x)]. (26)
Комментарии к свойствам преобразования Фурье. 1) Свойство 1° устанавливает особый род непрерывности преобразования Фурье: малым (в указанном смысле) изменениям функции /(х) соответствуют малые (в смысле равномерной сходимости) изменения ее преобразования Фурье g(X).
2) Свойство 2° характеризует (при указанном условии) поведение g (X) — ограниченность и стремление к нулю при |Х| -> оо.
3) Свойство 3° утверждает, что дифференцированию функции /(х) соответствует умножение ее преобразования Фурье на ik. Это свойство широко используется в применении операционного исчисления к решению дифференциальных уравнений. Операционное исчисление основано на свойствах преобразования Лапласа, переводящего функцию f (х), определенную на отрезке [0, оо [, в
$ 1.10. Интеграл Фурье. Преобразование Фурье и его свойства
79
Л (р) = £(/)=/ e-₽f/(r)dz. (27)
О
Легко видеть, что преобразование Фурье и преобразование Лапласа связаны соотношением
lA(a) = g(X), (28)
Z71
где g(X)— преобразование Фурье функции
\ (f(t) при /'=<? ’ (29)
[0 при Z<0.
Свойству 3° преобразования Фурье соответствует аналогичное свойство преобразования Лапласа:
L(f')=pL(p)—f (0). (30)
Если применить преобразование Лапласа к линейному дифференциальному уравнению (или к системе линейных дифференциальных уравнений) с постоянными коэффициентами, то дифференциальное уравнение (система дифференциальных уравнений) перейдет в алгебраическое (не дифференциальное) уравнение (систему алгебраических уравнений). Это обстоятельство сильно упрощает задачу.
Аналогичное явление имеет место при прохождении электрических сигналов через так называемую линейную систему. Речь идет о функции (t), характеризующей сигнал на входе, и о преобразованной функции /2 (/), характеризующей сигнал на выходе. Если вместо f± (t) и f2 (t) рассмотреть их преобразования Фурье g^/j), g2(/0 (или Лапласа), то связь между gi(j?) и g2(p) часто оказывается очень простой: g2(p) равно g1(jp), умноженной на некоторую функцию Ф(/>) (одну и ту же для всех Д (/)). Таким образом, работа прибора (линейной системы) описывается единственной функцией Ф(/>) («передаточной функцией»).
4) Свойства 4°—6° описывают свойства преобразования Фурье g(X) функции f(t) — сходимость интеграла (15), быстроту стремления к нулю, дифференцируемость.
Глава II
УРАВНЕНИЯ МАТЕМАТИЧЕСКОЙ ФИЗИКИ
§ 2.1. Понятие об уравнении в частных производных. Решение линейных уравнений первого порядка в частных производных
Многочисленные задачи, связанные с описанием физических явлений и процессов, приводят к дифференциальным уравнениям в частных производных. Среди таких уравнений наиболее простыми и в то же время наиболее важными являются так называемые линейные дифференциаль
ные уравнения первого и второго порядков в частных произ
водных.
Дифференциальным уравнением в частных производных называется соотношение
1’
•^2’
ди ди
W, ---? ---- 5
dxY дх2
ди д2и
9 дх9 дх2 ’
= 0,
(1)
X , п ’
где и = и(х±, х2, ..., хп) — искомая функция п независимых пе-ди ди ди v
ременных, —, —, ..., ——частные производные функции
дхг дх2 дхп
и по переменным х2, ..., хп. Левая часть уравнения (1) может содержать частные производные второго порядка
д2и д2и д2и д2и z. . . ~ ч
7=1> 2’ тРетьего порядка
дх 1 дх 2 дх п дх- дх-
и т. д. Наивысший порядок производной в левой части уравнения (1) называется порядком уравнения.
Определение. Уравнение
ди , ди , । ди । , л
а.—-\-аэ—— + Ьи — 0 (2)
1 дхх 2дх2 Пдхп
относительно неизвестной функции и переменных х19 х2, ..., хп, где а2, ..., ап, Ъ — заданные функции этих переменных, называется линейным дифференциальным уравнением первого порядка в частных производных. Предполагается, что по крайней мере одна из функций а19 а2, ..., ап тождественно не равна нулю.
§2.1. Линейные уравнения первого порядка в частных производных
81
Уравнение
" " а»
£ аа i~?T+ Ё bk ^~+си=() (3)
... •' дХ:дХ; дхк
относительно неизвестной функции и переменных х1? х2, ..., хп, где яу (z, j=l, 2, /г), ay=zty; Ьк (й=1, 2, и),
с—заданные функции этих переменных, называется линейным дифференциальным уравнением второго порядка в частных производных. Предполагается, что по крайней мере одна из функций atj 2, ..., л) тождественно не равна нулю.
Уравнения
iai^+bu+f(xi’ х2, -> л,)=о i=l *
и
п гп ги
-х")-°
называются линейными неоднородными уравнениями в частных производных [из-за дополнительного слагаемого /(х19 х2, хп)]; при этом уравнения (2) и (3) называют однородными.
Решением уравнения в частных производных называют всякую функцию и(х^ х2, ..., хп) переменных х15 х2, ..., х„, которая обращает равенство (1) в тождество.
Рассмотрим уравнение
а^+Ь-=0, (4)
дх ду
где и—неизвестная функция двух переменных х и j; а и Ь — заданные гладкие функции от х, у [частный случай уравнения (2)]. Оно допускает следующее геометрическое толкование. Пусть в каждой точке (х; у) области D на плоскости хОу задан вектор р с координатами а(х, у), Ь(х,у). Тогда условие (4) означает, что производная искомой функции и(х, у) в направлении векторного поля р равна нулю. В частности, линии уровня функции и в каждой точке касаются векторов р = (сг9 Ь).
Таким образом, геометрически уравнение (4) задает векторное поле, векторы которого касаются линий уровня искомой функции и(х, у).
Решение уравнения (4) сводится к решению системы обыкновенных дифференциальных уравнений, что вытекает из следующей теоремы.
Теорема. Если обыкновенное дифференциальное уравнение
dx dy
а(х, у) Ь(х, у)
82
Глава II. Уравнения математической физики
имеет общее решение
Ф(х,у)=С, (6)
то всякое решение уравнения (4) может быть записано в виде и =/(Ф(х, у)), (7)
"л где f—произвольная дифференцируемая функция одной переменной. Комментарии к теореме.
1) Эта теорема представляет собой вариант теоремы, описывающей решение линейного уравнения в частных производных (быть может, неоднородного) относительно функции и переменных х1? х2, хп (см. § 2*.1,1).
2) Уравнение (5) называется уравнением, соответствующим уравнению (4). В общем случае линейного уравнения (2) в частных производных относительно функции п переменных м(х19 х2, ..., хи) соотношения (5) представляет собой систему обыкновенных . . cUi dx2 dx„
дифференциальных уравнении —-=—-=... = —решение которой а1 а2 ап
позволяет описать множество решений уравнения (2). Доказательство теоремы приведено в § 2*.1,2.
Примере Опишем множество решений уравнения
ди , ди
—+х — дх дх
(*)
Обыкновенное дифференциальное уравнение, соответствующее уравнению (*), имеет вид
—= —, или xdx + j/dy=0, т. е. d(x2 + j>2)=0;
его общее решение есть x2 + j/2 = C. Таким образом, согласно теореме, всякое решение уравнения (*) записывается в виде м=/(Ф(х, j/)), где Ф(х, у) = х2-Уу2 и f—произвольная гладкая функция одной переменной. Линиями уровня функции и являются окружности с центром в начале координат (рис. 4); вектор ( — х;у) в каждой точке (х;у) касается линии уровня, т. е. окружности, проходящей через точку (х;у).
§ 2.2. Уравнение колебаний струны. Решение задачи Коши методом Даламбера
1°. Уравнение колебаний струны. Малые поперечные колебания струны можно характеризовать функцией и = и(х, t), где х(0^х</) — координата точки струны, t—время. Положение
2.2. Уравнение колебаний струны. Решение задачи Коши методом Даламбера
83
колеблющейся струны в момент времени t будем описывать графиком функции и = и(х, /) в плоскости хОи (рис. 5). При этом положение равновесия струны изображается отрезком и = 0, 0 х ; и(х, t) означает вертикальное (поперечное) смещение точки х струны в момент времени t.
Если предположить, что напряжения в струне подчиняются
Рис. 5 закону Гука и направлены
вдоль струны, то малые колебания струны можно описать функцией и(х, t), удовлетворяющей уравнению колебаний
струны:
д2и _ 2^2W
dt2 а дх2 9
(1)
где а2 — положительная постоянная, отражающая физические свойства материала, из которого изготовлена струна (плотность, модуль упругости). Вывод уравнения (1) из механических соображений изложен в § 2*.2, 1.
Пусть в момент t = tG известно положение струны, т. е. функция одной переменной
ф(х) = и(х, /0), (2)
и скорости точек струны
= 'о) (3)
(напомним, что при малых поперечных колебаниях струны абсциссы точек сохраняются). Пусть известны также функции w(0, /) = р.х(/), и(1, /) = ц2(/), (4)
описывающие движение концов струны х = 0 и х = 1.
Тогда положение струны в момент времени t определено однозначно и может быть найдено методом Даламбера, излагаемым ниже. Доказательство существования и единственности решения уравнения (1) при условиях (2) — (4) приведено в § 2*.2, 2. Задача, состоящая в нахождении решения уравнения (1) при условиях (2) и (3), называется задачей Коши.
2°. Метод Даламбера решения задачи Коши для неограниченной струны. Опишем решение задачи Коши уравнения (1) при условиях (2) и (3) методом Даламбера. Речь идет о нахождении функции w(x, Z), определенной для всех значений х, t и удовлетворяющей условиям (1)—(3). В такой постановке
84
Глава И. Уравнения математической физики
задачи не участвуют краевые (граничные) соотношения (4)—это означает, что рассматривается «бесконечная» струна (физический смысл решения данной задачи состоит в том, что оно определяет движение точек струны на участке, достаточно удаленном от концов).
Прежде всего отметим, что для произвольной пары функций /(х) и g(x) можно построить функции /(х, t)=f(x + at) и g(x, t)=g(x— at) двух переменных х, /, удовлетворяющие уравнению (1). Действительно, — =f'x(x + at), ^-^=f'^(x + at).
(J X (JX
^=g'x(x-af), ~=g"(x-at), ^=af'(x+at), ^=a2f"(x+at), dx dx dt dt ' 7
—ag'(x—at), ^~4=a2g"(x — at) и, следовательно,
dt 7 dt
^=n2^f =
dt2 dx2’ dt2 dx2'
С помощью функций вида /(x, t)=f(x+at). g(x, t)=g(x—at) можно построить такую функцию и(х, t \ которая будет удовлетворять как уравнению (1), так и условиям (2), (3). Положим w(x, /)=/(х, z)+g(x, /)=/(x+a/)+g(x— at\ (5)
Очевидно, что = Потребуем, чтобы для функции
w(x, t) были выполнены условия (2) и (3):
ф(х) = и(х, 0)=7(x)+g(x), (6)
\|/(x) = wj(x, 0)=a/'(x)-ag'(x). (7)
Интегрируя последнее равенство, имеем
f \|/ (х) dx = а [7(х) -/(х0)] - a [g (х) -g (х0)],
(8)
что вместе с (6) дает
(9)
где C=/(x0)-g(x0). Отсюда
(Ю)
2.2. Уравнение колебаний струны. Решение задачи Коши методом Даламбера
85
Подставляя выражение (10) в (5), получим
и(х, /)=|[<р(х+«/) + ф(х —
(11)
x — at
Построенная функция и(х, t) удовлетворяет уравнению (1) и условиям (2), (3), т. е. является решением задачи Коши для неограниченной струны.
Отметим следующие свойства функции и(х, t).
Если в начальный момент скорости движения точек струны были равны нулю, т. е. \\f(x) = ut(x. 0)^0, то
и(х, t) =|[ф(х+я/) + ф(х — а/)].
(12)
График функции u=X-ty(x+at) переменной х при фиксированном at есть кривая на плоскости хОи. полученная сдвигом графика функции и=|ф(х) на at единиц влево; аналогично, график функции и=^(х—at)—это кривая, полученная сдвигом графика функции и = |ф(х) на at единиц вправо.
Напомним, что и = ф (х ) — начальное положение струны, а г/=Лф(х)—«половина» начального отклонения струны. Таким образом, функция и(х, t) является результатом сложения двух функций ut=^(p(x — at) — «прямой волны» и
п2=|ф(х+Щ)— «обратной волны». «Прямая волна» представ-1 ляет собой движение графика функции <у=-ф(х) вправо со скоростью я, а «обратная волна»—движение того же графика влево со скоростью а. Поскольку функция и(х, t) отождествляется с положением струны в момент времени /, равенство (12) можно истолковать как перемещение вдоль по струне двух волн (прямой и обратной). Сказанное иллюстрирует рис. 6.
3°. Решение задачи Коши для полуограниченной струны с закрепленным концом. Рассмотрим уравнение (1) при условиях (2), (3) (причем х^О) и дополнительном условии
w(0, /) = 0. (13)
86
Глава II. Уравнения математической физики
Требуется найти и(х. t) при л? О и /^0. Эта задача легко сводится к предыдущей с помощью следующего соображения.
Если функции (риф при выполнении условий (2), (3) обладают свойствами ф( — х) = — ф(х) и ф(—х)=—ф(х), то определяемое ими по формуле (11) решение задачи Коши для неограниченной струны автоматически удовлетворяет условию (13).
Поэтому поставленную задачу для полуограниченной струны можно решить следующим образом. Заданные при х?0 функции и(х, 0) = (р(х) и ^(х, 0) = ф(х) продолжим на область ot
х<0, полагая <р(—х)= — (р(х) и ф( — х)=— ф(х). Затем решим задачу Коши для неограниченной струны по формуле (И); получим функцию w(x, /) при всех значениях хи/. Ограничение функции и(х, t) на область х?0 представляет собой решение задачи Коши для полуограниченной струны с закрепленным концом? Это означает, что полученная функция w(x, t) удовлетворяет условиям (1) — (3) и w(0, t) = 0.
Описанный способ решения задачи Коши для полуограниченной струны с закрепленным концом позволяет понять физическое явление отражения волны. Это явление состоит в следующем. Пусть для простоты начальные скорости точек струны равны нулю. Тогда изменение положения струны во времени целиком определяется начальным положением струны и(х, 0) = <р(х), х>0.
Предположим, что начальное положение отклоняется от положения /7 = 0 лишь на некотором участке от точки х = а до точки х—р. Это предположение позволяет с большей наглядностью проследить явление отражения волны. Продолжим функцию ф(х) нечетным образом; тогда продолженная функция будет отлична от нуля на отрезках [а, Р] и [—Р, —а].
2.2. Уравнение колебаний струны. Решение задачи Коши методом Даламбера
87
При этом график продолженной функции на отрезке [—Р, —а] представляет собой график функции и=— ср(х), т. е. кривую, симметричную кривой у = <р(х) на [ос, р] относительно начала координат. Выше было установлено, что решение и(х, t)9 построенное по начальному положению струны, характеризуемому функцией г/ = <р(х), есть сумма двух волн — прямой и обратной. При этом нас интересует та часть графика и = и(х, /), которая соответствует х^О.
Формула (11) показывает,. что до определенного момента времени справа от точки х = 0 функция и = (х, /) определяется сдвигом начального отклонения на отрезке [ос, р], а сдвиги начального отклонения продолженной функции на отрезке [ —Р, —а] не влияют на значения функции и(х, t) при х>0 (рис. 7, а). Однако в некоторый момент обратная волна, т. е. функция м = ср(х+я/), будет отлична от нуля при х^О. Тогда начнет сказываться влияние значений продолженной функции <р(х) на отрезке [ — р, —а] на значения функции и(х. t) в точке х = 0 (прямая волна с отрезка [ — Р, —а] дойдет до точки х = 0). После взаимодействия прямой и обратной волн в окрестности точки х = 0 (рис. 7,6) вправо распространятся две волны (рис. 7,в) — прямая волна, порожденная значениями функции на отрезке [а, р], и прямая волна, порожденная значениями продолженной функции на отрезке [—Р, —а] (обратная волна, порожденная значениями на отрезке [а, р], перейдет в область х^О и станет для нас неинтересной). Процесс замены обратной волны отрезка [а, Р] на прямую волну отрезка [—Р, —а] можно истолковать как отражение обратной волны в точке х = 0. 4°. Задача Коши для ограниченной струны с закрепленными концами. Рассмотрим задачу о нахождении функции и(х, /), удовлетворяющей уравнению (1), условиям (2), (3), и, кроме того, краевым условиям
88
Глава IL Уравнения математической физики
Рис. 8
и(0, z) = 0, u(l, t) = 0. (14)
Эта задача описывает движение струны длины /, концы которой, находящиеся в точках х = 0 и х = 1, остаются неподвижными во время движения.
Данную задачу также можно свести к задаче Коши для неограниченной струны, если функции ср (х) = и (х, 0) и ф(х) = ^(х, 0), определенные на отрезке [0,/], продолжить на отрезки [kl, (k+1)/] (где k= ± 1, ±2, ...) по формулам
, . J(p(x —А7) при
Фпр(Л) ф(_1)/) ПрИ
четном к, нечетном к;
(y\i(x — kl) при четном к,
( —\|/(—х+(^+1)/) при нечетном к.
(15а)
(156)
Указанное продолжение функций ф(х) и ф(х) иллюстрирует рис. 8.
Решение задачи Коши для неограниченной струны с условиями (14) обладает свойством u(kl, /) = 0 при всех t. Ограничение функции и(х, t) на отрезок [0,/] определяет решение задачи Коши для ограниченной струны с закрепленными концами.
При этом в случае ф(х) = () решение
ф, 0 = ^[фпр(* + ^) + Фпр(*-«0] (16)
[фпр означает продолженную функцию (15а)] можно описать с помощью многократного отражения прямой и обратной волн в точках х = 0 и х —/.
Однако такое описание решения задачи для ограниченной струны с закрепленными концами не является достаточно наглядным и удобным. В частности, в случае струны с закрепленными концами можно говорить о колебаниях (а не только о распространении прямой и обратной волны с возможными отражениями). Именно многократные отражения от концов порождают то, что называется колебаниями струны.
2.2. Уравнение колебаний струны. Решение задачи Коши методом Даламбера 89
Существует другой способ решения задачи Коши для ограниченной струны с закрепленными концами, который дает лучшее описание процесса колебаний струны—так называемый метод Фурье (см. § 2*.2, 3). Этот метод будет также использован в § 2.3 для решения уравнения теплопроводности.
5°. Задача Коши общего вида. Общее уравнение малых поперечных колебаний струны под действием силы упругости и внешних сил имеет вид
(функция /(х, /) учитывает влияние внешних сил).
Рассмотрим задачу о нахождении движения струны в зависимости от времени, т. е. о нахождении функции w(x, Z) при краевых условиях
w(0, ^) = pi1(^), w(/,7) = p2(0 (18)
и начальных условиях
и(х, О) = ср(х), u't(x, 0) = ф(х). (19)
Такая задача разрешима и притом единственным образом. Искомая функция и(х. /), как легко видеть, есть сумма и(х, t) = ur(x, t) + u2(x, /) + w3(x, 0 + w4(x, /), где функции и1(х. t), и2(х, 0, и3(х. t) удовлетворяют уравнению (1), а функция i/4(x, О—уравнению (17).
При этом функции и±. и2, и3. w4 удовлетворяют следующим начальным и краевым условиям:
^i(0, г) = 0, г/JO, z) = 0, иг(х. О) = ср(х), ^(х, 0) = ф(х); (20а) w2(0,/) = ц1(/), и2(1, /) = 0, и2(х, 0) = 0, 0) = 0; (206)
к3(0, /) = 0, г/3(/, ^) = Ц2(0’ и3(х, /) = 0, ^) = 0; (20в)
и4(0, /) = 0, w4(Z, Z) = O, и4(х, 0) = 0, 0) = 0. (20г)
Задача нахождения каждой из функций uf(x, t) является частным случаем общей задачи решения уравнения (17) при условиях (18) и (19). Выше был рассмотрен метод Даламбера нахождения функции и1(х. t), удовлетворяющей уравнению (1) при условиях (20а). Задача нахождения функций и2, w3, w4 рассматривается в § 2*.2, 4.
90
Глава fl. Уравнения математической физики
§ 2.3. Уравнение теплопроводности. Решение задачи Коши методом Фурье
1°. Уравнение теплопроводности. Изменение температуры нагретого тонкого материального стержня длины / можно описывать с помощью функции w(x, г): точки стержня отождествляются с точками отрезка 0<х^/ оси Ox; и(х, t) означает температуру точки х (стержня или отрезка) в момент времени t.
Изменение температуры стержня во времени происходит под действием физических законов распространения теплоты. Главный из этих законов заключается в том, что количество теплоты, протекающее за единицу времени из точки xt с температурой щ в точку х2 с температурой и2, пропорционально разности и2 — иг (коэффициент пропорциональности зависит от расстояния |х2 —xj, площади сечения стержня S и материала, из которого изготовлен стержень). Если подсчитать баланс количества теплоты на каждом участке [х, х+Ах] стержня за единицу времени и приравнять его мощности источника теплоты на этом участке, то получится соотношение
ди 2д 2и , + \
-=а -^+/(х, /), dt дх2 J v 7
(1)
которому должна удовлетворять функция г/(х, t), описывающая изменение температуры стержня во времени. Здесь а2 — постоянная, характеризующая свойства материала стержня, а /(х, t) — функция, описывающая влияние источников теплоты в точке х стержня в момент времени t. Уравнение (1) называется уравнением теплопроводности.
Если источники теплоты отсутствуют, то /(х, / ) = () и уравнение (1) становится однородным:
ди 2д2и
—=а —-. (2)
dt дх2
Строгий вывод уравнения (1) см. в § 2*.3, 1.
К уравнениям (1) и (2) приводит исследование некоторых физических процессов, в частности процесса диффузии. Существенное значение уравнения (1) и (2) имеют в некоторых задачах теории вероятностей.
Можно говорить об аналогах уравнений (1) и (2) в двумерном, трехмерном и л-мерном пространствах:
ди 2 (д2и д2и д2и
— = а I ———у+...+——г dt \дх2 дх 2 дх2
(3)
2.3. Уравнение теплопроводности. Решение задачи Коши методом Фурье 91
2°. Решение задачи Коши с краевыми условиями методом Фурье. Рассмотрим следующую задачу: найти функцию и(х, /), удовлетворяющую уравнению (1) или (2) и следующим условиям:
и(х, 0) = ф(х) (4)
(начальное условие) и
1/(0, /) = Ц!(/) и(1, /) = ц2(/) (5)
(краевые условия).
Такая задача называется задачей Коши с краевыми условиями (5). Эта задача разрешима, и ее решение единственно [для гладких функций ф(х), цД/), Ц2(0]- Существуют и другие постановки задачи об изменении температуры стержня во времени; см. § 2*.3, 2.
Приведем решение поставленной задачи методом Фурье {методом разделения переменных). Сначала рассмотрим вспомогательную задачу: найти функцию и(х. Z), удовлетворяющую уравнению (2) и условиям (4) и (5) при ц1 (t) = ц2(/) = 0. Пусть и(х, t) имеет вид
и(х, /) = Х(х)Т(/), (6)
где Х(х)— неизвестная функция переменной х, a T(t) — неизвестная функция переменной t. Для того чтобы функция w(x, t) удовлетворяла уравнению (2), необходимо и достаточно, чтобы T'(t)X(x)==a2T(t)X"(x), т. е.
ПО
a2T(t) Х(х) ’ V 7
Так как левая часть соотношения (7) является функцией от /, а правая часть — функцией от х, то в действительности левая и правая части этого соотношения равны постоянной. Полагая значение этой постоянной равным —X, получим
T'=-Xa2T, (8)
Х'^-ХХ. (9)
Равенства (8) и (9) представляют собой обыкновенные дифференциальные уравнения с постоянными коэффициентами. Общие решения этих уравнений имеют вид
Гх(0 = ^е’и2', (10)
Ar)(x) = JScos^/Xx-|-C sin^/Xx. (II)
Для того чтобы ненулевая функция и(х, t ) = удовле-
творяла условиям м(0, ?)=0, u(l, t)=0, необходимо, чтобы
92
Глава II. Уравнения математической физики
Л,{ \ • лпх
X(x) = Csin—.
(12)
Это означает, что X в равенствах (10) и (11) имеет вид
и В=0. Последовательность функций
/ \ к2п2
и„(х, /) = (sin-~je ‘2 (и = 1, 2, ...) (13)
удовлетворяет уравнению (2) и условиям
м„(0, z) = 0, un(l, z)=0; (14)
однако, вообще говоря, функции (13) не удовлетворяют условию (4).
Ясно, что линейная комбинация
ОО
и(х, /)= £ Ьпип(х, О (15)
п= 1
является решением уравнения (1) и удовлетворяет условиям (14) при любых Ьп (при естественном предположении, что сумма ряда есть непрерывная функций и ряд (15) можно почленно дифференцировать; вопрос о доказательстве этих свойств рассматривается в § 2*3,3). Оказывается, можно выбрать такие коэффициенты bn(n= 1, 2, что функция (15) будет удовлетворять не только уравнению (1) и условиям (14), но также и условию (4), и следовательно, являться решением поставленной задачи.
Покажем, что выбор коэффициентов Ьп таких, что и(х, /) обладает свойством (4), возможен, и укажем явные формулы, выражающие эти коэффициенты через заданную функцию ср(х). Из условий (4), (13) и (15) следует:
и(х, 0) = ф(х)= £ Z>„sin^L (16)
и=1 1
Из теории рядов Фурье известно, что всякая функция ф(х), определенная на отрезке [0, /] и удовлетворяющая некоторым условиям, может быть однозначно представлена в виде (16) (разложена в ряд Фурье по синусам, см. теорему 4 § 1.9).
Условия, о которых идет речь, являются весьма слабыми; им удовлетворяют практически всякая функция, описывающая реальное распределение температуры по стержню в начальный момент.
Известно, что в формуле (16) коэффициенты Ьп выражаются через функцию ф(х) следующим образом:
2.3. Уравнение теплопроводности Решение задачи Коши методом Фурье
93
1 2 / \ . 7С ИХ
= <p(x)sin — dx.
О
(17)
Таким образом, существует единственная функция w(x, /), удовлетворяющая уравнению
ди 9 д2и ~dt~a дх2
и условиям w(0, = /) = 0, п(х, 0) = <р(х). Такой функцией
является
оо -а2 —
w(x, z) = £ bwsin^e /2 , (18)
и=1 1
где коэффициенты Ьп определены формулами (17).
тт о ди 2 д2и
Пример. Решить уравнение теплопроводности —=сг— при
условиях w(0, t) = u(l. z) = 0 и и(х. 0) = х(/—х).
Решение. Согласно формуле (19), искомая функция и(х. t) имеет вид
и(х. t)= £ bwsin——е п=1 1
1 2 /у \ . twix -g
где bn = - х(/ — xjsm — dx.
о
Учитывая, что
I пп
XCOS —
. ппх . /
xsm — dx=-------------
Z Tin
0 T
I
— I2 COS7l«
Т1ПХ 2x sin ——
Ttnx x cos——
Tin
T
Tin
0
имеем
94
Глава II. Уравнения математической физики
Ьп=-^^-212 лп
cos ля 2 (cos ля — 1) j _ 4/2(сО8ЛЯ—1)
пп (ля)3 / (ля)3
Таким образом,
1
/ (2я?+1)3’
n2(2m+l)2a2t
Т2 . Л 2Я7+1)%
1 sm ——-—<—
8/2 £
£е
Я т = 0
3°. Решение задачи Коши общего вида. Общая задача описания изменения температуры нагретого стержня состоит в нахождении функции и\х. t\ удовлетворяющей уравнению (1) и условиям (4), (5). В п. 2° дано решение этой задачи для частного случая f (х, г) = 0 в (1), Мг 0) = М2 (0 = в СО-
Покажем, что общий случай может быть сведен к такой задаче: найти функцию п(х, z), удовлетворяющую уравнению (1) и условиям
z/(0, f) = 0, u(l. /) = 0, г/(х, 0) = ф(х). (19)
Действительно, положим
w(x, /) = и(х, /)+g(x, г), (20)
где г(х, — новая неизвестная функция, g(x, /) — функция, которая будет описана в дальнейшем. Подставляя и(х. /) из (20) в уравнение (1), получаем
= z), (21)
ИЛИ
dv 2 d2v , 7/ Л
—=а т-^+/(х, Л, dt дх2 J v 7
где
7(х, z)=/(x, z)-^+«2|^. (22)
Из условий (4), (5) вытекает, что г(0, = (z) —g(0, /), г(/, г) = ц2(О“#(^ О’ v(x> 0) = ф(х)—g(x, 0). Если взять
g(x, /) = Ц1 (O+y[H2(O“Hi (01 то г(0’ 0 = 0’ ^(А0 = °.
Таким образом, общая задача сводится к решению уравнения (1) при условиях (19).
§ 2.3. Уравнение теплопроводности. Решение задачи Коши методом Фурье 95
Пусть h(x, t) удовлетворяет уравнению (2) и условиям А (0, t) = h(l, t) = 0 и h(x, 0) = ср (х). Введем функцию w(x, t) с помощью равенства v(x, t)=w(x, t) + /i(x, t). Функция w(x, t) удовлетворяет уравнению
и условиям
w(0, t)= w(l, t)= 0, w(x, 0)=0. (24)
Итак, общая задача сведена к решению уравнения (23) при условиях (24).
Проведем решение этой задачи методом Фурье. При каждом фиксированном t функцию Дх, t) [правую часть равенства (21)] разложим в ряд Фурье по синусам на отрезке [0, I ]. Получим
00
7(х> 0= X/«(z)sin^r (25)
п — 1 1
(коэффициенты Фурье fn (z) функции f (х, z), естественно, зависят от Z).
Искомая функция w(x, z) также может быть представлена в аналогичном виде:
w(x, t)= X w„(z)sin^, (26)
и= 1 1
где w„(z)—неизвестные функции.
Подставляя w(x, t) из (26) в уравнение (23) и учитывая
условия (24), получаем ОО / 2 2 V"» / , / \ • ППХ о Л П / \ . Т L ( MJsm —+а —wn(t)sm- И= 1 \ г \ . кпх\ „ -/«(*) sin— 1 = 0, или СО 2 2 X sin- п=1L 1 ИЛИ w'„(t)+a2 пwn(t)-f„(0 = 0. 00 Условия (24) дают w(x, 0)= £ w„(O)sin-y-= но, и>„(0)=0. inx ~г~ — =0, I (27) = 0 и, следователь-
96
Глава II. Уравнения математической физики
Таким образом, нахождение функций определяющих искомое решение w(x. t) по формуле (26), сводится к решению обыкновенного дифференциального уравнения первого порядка (27) с на-решение
Рис. 9
Следовательно,
уравнения первого порядка (2 > чальным условием wn(0) = 0. Это имеет
ВИД
(28)
решение
о
задачи (23), (24) таково:
И7
\ J \ • ппх J /„(т) ат 1 sm — ах
(29)
о
Особый интерес представляет рассмотренная задача в случае, когда функция /(х, имеет вид
1 .
-, х-х0|<е;
2е
О, |х — Х0|>8
при малом е (рис. 9). Подробнее об этом см. § 2*.3, 4.
§ 2.4. Уравнение Лапласа. Решение задачи Дирихле в круге методом Фурье
1°. Уравнение Лапласа. Многие стационарные физические процессы приводят к дифференциальным уравнениям в частных производных, имеющим вид
д2и д2и
дх2 дх2 дх2
(1)
Например, если какой-либо физический процесс во времени описывается функцией и(х1? х2, х„, г), удовлетворяющей
уравнению (3) § 2.3 (изменение температуры, диффузия и т.д.), то решение этого уравнения, не зависящее от времени, есть функция и. являющаяся решением уравнения (1) (так называемое стационарное решение уравнения (3) § 2.3).
Пусть движение (несжимаемой) жидкости задано векторным „ . ди-?, ди-?, ди f z х
полем скоростей gradt/ = — z+— j+—к, где щх, у. z) — потенциал _^ду dz
векторного поля gradn, a T.j. к—единичные орты осей Ох. Оу. Oz.
£ 2.4. Уравнение Лапласа. Решение задачи Дирихле в круге методом Фурье 97
Условие несжимаемости имеет вид div gradw = 0. Как известно, дивергенция векторного поля Ё= РГ-Ь Qj+ Rk выража-ется формулой divF= — + —+ —. Поэтому в развернутом виде дх ду dz условие несжимаемости запишется так:
д2и д2и .д2и_ ~ дх2 ду2 dz2
что совпадает с уравнением (1) при п = 3.
Уравнение (1) называется уравнением Лапласа, а дифференциальный оператор
А+А+...+Д
дх2 дх2 дх2
(2)
И
переводящий функцию w(x15 х2, хп) в — оператором
i=l Sxi
Лапласа (или лапласианом)} его обозначают через А. Таким образом, уравнение (1) можно записать в виде
А и — 0.
Всякая функция и, имеющая непрерывные частные производные второго порядка, удовлетворяющая уравнению = 0 во всех внутренних точках области D и непрерывная на границе области D, называется гармонической в области D. Гармонические функции обладают рядом замечательных свойств (см. § 2*.4, 1).
Уравнение
&u=f, (4)
где и — u(xl9 х2, хп)— неизвестная функция, a f=f(x1, х2, ..., хи)—заданная функция, называется уравнением Пуассона.
Электростатическое поле с потенциалом^ ср (х, у, z) характеризуется соотношением Ё—— grad ср, где Ё—вектор напряженности поля. Известно, что
div Ё= — div grad <р = 4лр, (5)
где р(х, у, z)—плотность зарядов, порождающих поле, div IT— дивергенция поля Ё. Уравнение (5) в декартовых координатах х, у, z имеет вид
д2ср д2ср д\р л ( \ szx
a?+^+5?=~4’tp<w>' (6)
Таким образом, потенциал электростатического поля удовлетворяет уравнению Пуассона.
4 Мантуров О.В.
98
Глава IL Уравнения математической физики
Большое значение имеет следующая задача: найти функцию w(x1? х2, *п), удовлетворяющую уравнению (1) или (4) внутри
области D, непрерывную на границе области D и совпадающую с заданной функцией g на границе области D. (Речь идет об области евклидова и-мерного пространства, ограниченной гладкой поверхностью, которая гомеоморфна поверхности сферы размерности л—1; уточнение см. в § 2*.4, 2).
Эта задача называется задачей Дирихле.
Задача Дирихле разрешима и имеет единственное решение для всякой непрерывной функции g на границе области D (см. § 2*.4, 3). 2°. Решение задачи Дирихле для круга. Приведем решение следующей задачи Дирихле: найти функцию и{х, у), удовлетворяющую внутри круга х24-^2^/?2 уравнению
и совпадающую на границе круга x2+y2 = R2 с заданной функцией g.
Для решения задачи удобно воспользоваться полярными координатами р, ср (за полюс этой системы выберем центр круга). Так как x = pcos<p, у = р sin ср, р = х/х2+у2, cp = arctg(j//x) при х>0, <p = 7c + arctg(j7x) при х<0, <р = тт/2 при х = 0, у>0, Ф= — я/2 при х = 0, усб, то
и(х, ^) = w(pcoscp, psinф) = г(р, ф)
и
ди dv др dv дер dv х dv 1
дх др дх дер дх др дер у2
1Ч
_dv х dv —у
SP у/х^+у1 д<рх2+у2’ 82u__d2v х2 82v —ху dv у2
дх2 др2 х2+у2 дрдср (х2+у2)3/2 др (х2+у2)3/2~^~ d2v — ху d2v у2 dv 2ху дрдср (х2Ч~т2)3/2 дер2 (х2+у2)2 дер (х2+у2)2 ’
dv _dv др । dv дер dv у _^dv х
ду др ду дер ду др р дер р2 ’
d2v д2\ ду2
dv ( дер у
'V у2 d2v ху dv х2 d2v ху d2v х2
др2 р2 дрдср р3 др р3 дрдср р3 дер2 р4^~
2лт\_ д2и у2 d2v ху d2v х2 dv х2 dv 2ху
р4 J др2 р2 дрдср р3 дер2 р4 др р3 дф р4 5
£ 2.4. Уравнение Лапласа. Решение задачи Дирихле в круге методом Фурье
99
откуда
d2v х2 + у2 п d2v
= ——г~+2 тт-
др р дрдф
। dv %2 + у2_|_ dv 2ху—2ху__ d2\
др р3 дф
Итак, уравнение = 0 мает вид
d2v Iх2 + у2 \ р4 7
I) 1 dv 1 d2v р4 др2 р др р2 дф2 в полярных координатах прини-
— Xу + ху р3
d2v 1 dv 1 d2v _q др2 p dp p2 дф2
Функцию g на границе круга можно рассматривать как функцию полярного угла (р (точки окружности x2 + j2=l взаимно однозначно соответствуют полярным углам ср):
g(x, (9)
Для решения уравнения (8) при условии (9) применим метод Фурье. Пусть
г(р, ср)=Р(р)Ф(ф);
(8)
(Ю)
при этом
Р-(Р)Ф+1Р’(Р)Ф+^(Р)Ф-М^.
Равенство (11) есть результат подстановки v из (10) Из равенства (11) вытекает, что
1
Р
(П)
в (8).
р2
ф"
(12)
Так как левая часть равенства (12) зависит только от р, а правая часть — только от ср, то в действительности левая и правая части равны постоянной. Полагая значение этой постоянной равны X, получим
р" + 1р' = х4> (13)
р р
Ф" + АФ = 0. (14)
Общее решение уравнения (14) имеет вид
Ф = Л cos ^/Хф +Bsin ^/Хф (A, BeR). (15)
Так как Ф (ф) = Ф (ф + 2тс), то Дх— целое число и X„ = h2(hgN); значит,
Ф„ (ф) = А„ cos иф + В„ sin иф.
(16)
100
Глава II. Уравнения математической физики
Общее решение уравнения (13) имеет вид
РДр) = Спри + Д,р-и (Cw, AeR).
(17)
Функция р~" обращается в бесконечность в центре круга при лг>0. Покажем, что для всякой непрерывной в круге функции (17) коэффициент Dn = Q. Действительно, если бы то,
поскольку р“и в центре круга обращается в бесконечность, функция Рп (р) также обращалась бы в бесконечность, т. е. была бы разрывной. Следовательно, гл = Рл(р)Фл(ф) имеет вид
г„(р, ф) — p"(^„cos«cp4-jBwsinn(p). (18)
Функции г„(р, (р) при всяком п удовлетворяют уравнению (8), но не удовлетворяют, вообще говоря, краевому условию (9).
Сумма ряда
00
f (р, <р)=у+ Ё Мр, ф)
2 и = 0
(19)
также удовлетворяет уравнению (8) (при естественном условии, что ряд (19) можно дифференцировать почленно; о возможности почленного дифференцирования см. § 2*.4, 4).
Оказывается, коэффициенты Аь 1, 2, ...) можно вы-
брать так, что ряд (19) будет удовлетворять не только уравнению (8), но и краевому условию (9).
Действительно, при p = R получим
v(R, ф)= £ Rn(Ancosn(p + Bnsmn(f)). (20)
п = 0
Условие (9) дает
00
Y, R"(Ancosn(p + B„sinn<p)=j(<р). (21)
п = 0
Равенство (21) определяет разложение функции j (ср) в ряд Фурье:
7(ф)=у+ a„cosn<p + Z>„sin«<p.
п= 1
Коэффициенты этого разложения таковы: а0 = 2Л, an = RnA„, b„ = RnB„ (и = 1, 2, ...).
Известно, что коэффициенты Фурье разложения функции j (<р) выражаются через эту функцию следующим образом:
2.4. Уравнение Лапласа. Решение задачи Дирихле в круге методом Фуръе 101
л
j (<р) cos n<p dtp,
(22)
У(ф)<1ф=
— л
л
>, ап—— л
л
— п
Следовательно,
Ло = «о/2, An = an/R\ Bn = bn/Rn (л?=1, 2, ...). (23)
Итак, формула (19) при соотношениях (18), (22), (23) задает решение поставленной задачи.
Выражение (19) можно преобразовать к виду
п
l'<p’ Wd'1''
(24)
Соответствующие преобразования приведены в § 2*.4, 5-
Глава III
ТЕОРИЯ ФУНКЦИЙ КОМПЛЕКСНОЙ ПЕРЕМЕННОЙ И ОПЕРАЦИОННОЕ ИСЧИСЛЕНИЕ
§ 3.1. Комплексные числа. Действия с комплексными числами. Тригонометрическая форма комплексного числа.
Формула Муавра
1°. Определение и свойства комплексных чисел. Комплексным числом называется выражение вида x+jz, где х, у—действительные числа, a i—некоторый символ, «квадрат которого равен —1» (более точное объяснение соотношения i2= — 1 приведено ниже). Самым главным свойством комплексных чисел является возможность определить сложение, вычитание, умножение и деление этих чисел, удовлетворяющие естественным требованиям. При этом действительные числа можно истолковать как некоторое подмножество в множестве комплексных чисел. Если операции сложения, вычитания, умножения и деления для комплексных чисел рассматривать на подмножестве вещественных чисел, то они совпадут с аналогичными операциями для вещественных чисел.
Для комплексного числа z = x+yi вещественное число х называется вещественной частью и обозначается x = Rez, а вещественное число у—мнимой частью и обозначается y = Imz.
При отождествлении комплексных чисел вида x+0-z с вещественными числами х можно считать, что вещественные числа являются частным случаем комплексных чисел.
Уравнения вида z2 + tf2 = 0, где неразрешимые в области вещественных чисел, имеют решения z=±ai в области комплексных чисел. Более того, оказывается, что всякое уравнение вида
й50^” + ^1^и-1+ ... + —О (ло/0)
с комплексными коэффициентами я0, я19 а2, ап имеет в области комплексных чисел ровно п комплексных корней (с учетом их кратности) — в этом состоит основная теорема алгебры. Указанное свойство вместе с другими свойствами комплексных чисел делает применение комплексных чисел удобным при исследовании многих математических вопросов.
§3.1. Действия с комплексными числами. Тригон, форма. Формула Муавра 103
Введем операции сложения, вычитания, умножения комплексных чисел. Пусть z1=xr+yri, z2=x2+y2i. Тогда, по определению,
zi+z2 = (x1+x2)+(y1+y2)i, z1-z2=(x1-x2)+(y1-y2)i, (1)
2^2 = (*1*2 - У1У2)+(Х1У2+*2>’i) i- (2)
Комментарии к формулам (1), (2). 1) Формулы (1) «естественны». Они означают, что при сложении и вычитании комплексных чисел их действительные и мнимые части также складываются и вычитаются.
2) Формула (2) также «естественна». Согласно этой формуле умножение z1z2 = (x1+ylLi)(x2+y2i) осуществляется по правилам умножения суммы на сумму:
(x1+y1i)(x2+y2i)=x1x2+(x1y2+x2y1)i+y1y2-i2 с дополнительным соглашением i2= — 1.
Подробнее о свойствах операций сложения и умножения комплексных чисел см. § 3*.l, 1.
Отметим важное следствие формулы (2):
(x+yi)(x-yi)=x2+y2. (3)
Таким образом, произведение двух комплексных чисел x+yi и х—yi равно вещественному неотрицательному числу x2+jy2.
Комплексные числа x+yi и х—yi называют сопряженными и употребляют обозначения x+yi=x—yi, x—yi=x+yi (черта сверху означает сопряжение).
Используя формулу (3), введем операцию деления комплексных чисел z1=x1+y1i и z2 = x2+y2i (z2/0) следующим образом:
Z1 = Х^уД = (*1+Тр)(*2-Т20 = *1*2 +Т1Т2 + г ( - -Х1Т2 + *2,У1) =
Z2 x2+y2i (x2+y2i)(x2-y2i) *г+Т2
_*1*2+Т1Т2 . -*1Т2 + *2Т1 . /Д\
2.2 "Г" 2 . 2 L Vv
Х2~гу2 х2-уу2
Ясно, что формула (4) определяет однозначно результат z1fz2 деления комплексных чисел при z2^0.
Примеры. 1. (2 + 3z)(—3+4z)= —6 + 8z —9z—12= —18 —z.
2 2 + 3z _ (2+3z)(-3-4z) _-6-9z-8z+12_6-17z_ 6 _17*.
’ -3 + 4z“(-3 + 4z)(-3-4z) 25 25 25~~25
Комплексные числа удобно изображать точками плоскости. А именно, числу z = x+yi ставят в соответствие точку с координатами х, у {аффикс числа z). Таким образом, имеет место взаимно однозначное соответствие между множеством комплексных чисел и множеством точек плоскости.
104
Глава IIL Теория функций комплексной переменной и операционное исчисление
Рис. 10
Иногда комплексные числа изображают радиусом-вектором, соединяющим начало координат плоскости с аффиксом точки z. При таком толковании сумме комплексных чисел z1-\-z2 соответствует радиус-вектор, равный сумме радиусов-векторов, соответствующих слагаемым zt и z2 (рис. 10). Сложение радиусов-векторов производит-
ся по правилу параллелограмма.
Горизонтальная ось (ось х) изображает вещественные числа, а вертикальная ось (ось у}—комплексные числа вида yi,
называемые чисто мнимыми числами.
Всякое ненулевое комплексное число однозначно определяется длиной г своего радиуса-вектора и углом ср, который этот радиус-вектор образует с положительным направлением оси х. Для всякого комплексного числа z=x+yi длина радиуса-вектора равна у/х2-\-у2. а угол ср таков, что
coscp = ~, г
(5)
sin ср=—. г
Неотрицательное число \z\ = yjx2+y2 называется модулем комплексного числа z, а угол ср — аргументом комплексного числа z. Аргумент комплексного числа z обозначают через argz, когда имеют в виду угол, радианная мера которого изменяется в пределах от нуля до 2л. Множество чисел, задающих (в радианах) угол argz, обозначают через Argz, так что
Argz = argz+2An, keZ.
2°. Тригонометрическая форма комплексного числа. Всякое комплексное число z=x+yi можно представить в виде
Г~2 1 х , yi \ Iх . yi\ / . • • \
z=yjxl+y \ ....4- - ) = г -+— J = r(cos(p + zsm(p)
\л/х2+т2 \!х2-Уу2) V г /
(вещественные числа x/%/x2+j>2, >’/a/x2+j2 обладают тем свойством, что сумма их квадратов равна единице, поэтому первое из этих чисел можно считать косинусом, а второе— синусом некоторого однозначно определенного угла, который, как легко видеть, совпадает с аргументом комплексного числа).
Представление комплексного числа z=x+yi в виде
z = г (cos (р + i sin ср), (6)
§3.1. Действия с комплексными числами. Тригон, форма. Формула Муавра 105
где r = Vx2+-’?2L cos ср =х/г, sin ср =у/г, называется тригонометрической формой комплексного числа. При умножении и делении комплексных чисел удобно использовать их тригонометрическую форму.
Пусть Zj = (cos (pi 4- i sin (pi), z2 = r2 (cos <p2 +z sin Фз)- Тогда
ZiZ2 = rrr2 [cos (pi cos <p2 — sin (pj sin <p2 + z (sin <px cos <p2 +
+ sin <p2 cos cpx)] = rrr2 [cos (epi + <p2) + isin (cpt + <p2)]. (7)
Таким образом, при умножении комплексных чисел их модули перемножаются, а аргументы складываются.
Если z = г (cos (р + z sin ср), то сопряженное число имеет вид
z = г (cos ф — z sin ф) = г (cos (— ф) + z sin (— ф)), (8)
а обратное число — вид
-=- (cos ф — z sin ф)=- (cos (— ф) + z sin (— ф)). (9)
Из этих соотношений вытекает, что модуль частного двух комплексных чисел равен частному модулей этих чисел, а аргумент частного—разности аргументов чисел.
Числа вида и = со8ф + 8тф имеют модуль, равный единице.
Из формулы (7) следует
(со8ф + /8тф)п = со8Иф + /8тлф (п = 0, +1, +2, ...). (10)
Равенство (10) называется формулой Муавра.
Примеры. 1. Записать комплексное число z = 3 — 4i в тригонометрической форме.
Решение. Находим |z|=^/32+(—4)2 = 5, z=5^+^—^z^ =
с/ . • • \ 3 4 .4
= 5(cosф + zsinф), где со8ф = ~, 8Шф=—-, ф=—arcsm-.
2. Вычислить (1 + z)3 7.
Решение. Имеем
z = 1 + /= /2 (J-+-2- ) = ^/2 (cos 45°+ z sin 45°).
v \72 y/2/
Используя формулу (10), получим
z 3 7 = (^/2)3 7 (cos 45° + z sin 45°)3 7 =
= (a/2) 37 (cos 37 • 45° + z sin 37 • 45°) =
= (72)37 (cos 45° +z sin 45°)=218 Д?. (~^+ И) = 218 (1 + z).
106
Глава III. Теория функций комплексной переменной и операционное исчисление
3. Найти комплексное число z такое, что z5 = l.
Решение. Для комплексного числа l+0-z модуль равен единице, а аргумент равен нулю или целому кратному угла 360°, т. е. 360° п, пеТл. В силу формулы Муавра | z | = 1, а аргумент <р числа z, будучи умножен на 5, совпадает с аргументом числа 1. Таким образом, о
Ф1=У’
3-360° Ф4=
360° ф2=^-,
4 • 360‘
5 ’ ф5 =
2•360° Фз=-—,
5 , т. е. Ф1 = О°,
ф2 = 72°, <р3 = 144°, (р4 = 216°, ф5 = 288° или в радианах ср = уЛ;, где Л^ = 0, 1, 2, 3, 4; другие целые значения к определяют аргументы, совпадающие с перечисленными (рис. 11).
3°. Другие понятия, связанные с комплексными числами. В заключение параграфа рассмотрим некоторые понятия, связанные с плоскостью С комплексной переменной.
Легко видеть, что расстояние p(z1? z2) между двумя точками zr=x1+yrk z2=x2+j2* комплексной плоскости, т. е. число V(%1 - хг)2 + (У1 и)2, равно p(z15 z2) = |z1-z2|.
Множество точек круга с центром в точке z0 и радиусом а будем обозначать через CDa(z0); таким образом,
coa(z) = {zg С11 z-z01 < a}.
Всякое множество вида coa(z) будем называть ^-окрестностью точки z0.
Введем также понятие предела последовательности комплексных чисел: число z = x+yi называется пределом последовательности комплексных чисел zn = xn+ynk если lim хп = х и—►со
и lim уп=у.
Арифметические операции над комплексными числами позволяют рассматривать функции вида
w=a0 + a1z+a2z2 +... +anzn, а также, используя понятие предела (суммы ряда), функции вида w = a0 + a1z+a2z2 + ... +a„zn+ ... .
Эти функции обобщают понятие соответствующих функций вещественной переменной. Оказывается, что при изучении
3.2. Элементарные функции комплексной переменной 107
функций вещественной переменной бывает полезным рассмотрение соответствующих комплексных функций, так как более общий взгляд на предмет исследования часто дает дополнительную информацию и обнаруживает невидимые ранее свойства.
Иногда оказывается, что сформулированная в терминах вещественных чисел задача экономнее всего решается с использованием комплексных чисел и функций. Такие примеры будут приведены ниже.
Отметим, что упомянутое явление довольно интересно: ведь комплексные числа не выражают какого-либо количества и физические величины, как правило, не измеряются комплексными числами, однако к ответам на вопросы, поставленные в терминах вещественных величин, приводят вычисления и исследования, выполненные с помощью комплексных чисел. Все это, разумеется, объясняется свойствами комплексных чисел, упомянутыми в п. 1°.
§ 3.2. Элементарные функции комплексной переменной
Элементарными функциями комплексной переменной называются функции, которые получаются из элементарных функций вещественной переменной, определяемых разложением в степенной ряд, по следующему правилу. Если
у=/{х)-=а^ + агх+а2х2-\-... +апхп+ ... (1)
—элементарная функция вещественной переменной х, то
w=ffy = aQ + arz+a2z2-]-... +anzn+ ... (2)
—элементарная функция комплексной переменной z, соответствующая функции (1). Очевидно, что функция (2) определена только для тех значений комплексной переменной z, для которых ряд (2) сходится.
Среди элементарных функций вещественной переменной, порождающих соответствующие элементарные функции комплексной переменной, особое значение в дальнейшем будут иметь функции х", ех, ах9 Inx, sinx, cosx, arcsinx, arccosx, arctg x, chx, shx.
Приступим к описанию свойств элементарных функций комплексной переменной, соответствующих указанным функциям. Положим z=x+j^z; w = u + vi.
1°. Степенная функция. Эта функция имеет вид
w — z11 (п—целое положительное). (3)
Степенная функция определена для всех комплексных чисел; каждому комплексному числу z=x+yi она ставит
108 Глава III. Теория функций комплексной переменной и операционное исчисление
в соответствие z", т. е. произведение п множителей, каждый из которых равен z, причем произведение понимается в смысле формулы (2) § 3.1.
Рассматривают также степенную функцию w=zn при целом отрицательном п и при и = 0. По определению,
z-«=l (и=1, 2, ...); z° = l (4)
(функция z~n (п=1, 2, ...) определена для всех z^O).
Функция w=zn обладает рядом свойств, аналогичных свойствам функции вещественной переменной у = хп. Так, например, w(z1z2)=w(z1)w(z2), |w(z)| = |z|" (5)
И т. д.
Если
|z| = l, (6)
то
Hz)| = l. (7)
Множество комплексных чисел, модуль которых равен единице, на плоскости комплексной переменной изображается окружностью единичного радиуса с центром в начале координат. Из равенств (6) и (7) следует, что при движении z по этой окружности w(z) также движется по этой окружности, причем одному обороту z соответствует п оборотов w(z).
Пусть w = u + iv. При п = 2 получим соотношение
w = z2 = (х + iy )2 = х2 — у2 + 2ixy.
т. е. и = х2— у2, v = 2xy. Аналогично, при и = 3 находим w^z3 = (x + zy)3 = (x3 —3ху2) + (3х2у—y3)z,
т. е. и = х3 — Зху2, v = 3x2y—y3.
2°. Показательная функция. Эта функция имеет вид
w = ez. (8)
Для вещественного х имеем
е^1+%44+...+^+... . (9)
Полагая ez=l+z+^+...+^+..„ (10)
2 п!
т. е. распространяя ряд (9) на комплексные значения, получим, в частности, что для чисто мнимого аргумента справедливо равенство
3.2. Элементарные функции комплексной переменной 109
7 . 3 / 7 4. \
л 2 3! \ 2 4! у
• ( У3 У5 \ • /1 1 \
+ ZV _зТ+5!-’"/ = COSj + ZSlnb (-П-)
поскольку, как известно, ряды, заключенные в скобках, сходятся к cos;y и sinj\ Итак,
eIJ = cosy + z sinjp (12)
для всякого вещественного у.
Вещественная функция y = Qx удовлетворяет соотношению
exiex2 = ^xi+x29 х15 %2eR. (13)
Аналогичное соотношение
eziez2 = +z2? Z1, z2eC (14)
выполняется и для функции (8). Равенства (13) и (14) могут быть проверены (т. е. доказаны) как некоторые тождества, которым удовлетворяют ряды (9) и (10). При такой проверке достаточно использовать только свойства умножения аргументов (xeR или zeR), которые во многом совпадают (см. § 3*.2, 3). Используя формулу (14), получим
w=u+iv = ex+iy=ex(cosy+i sinjy), (15)
откуда z/ = excosj^, v = exsinj;.
Отметим, что функция w = ez в комплексной области является периодической с периодом 2тп:
ez+2m’ = ex(cos(j+27u) + z sin (j>+2ji)) = ez
В § 3*.2, 1 доказано, что ряд (10) сходится при всех комплексных z и, значит, функция w = ez определена для любого комплексного значения z.
3°. Логарифмическая функция. Эта функция имеет вид
w = Lnz. (16)
По определению, функция w = Lnz является функцией обратной к показательной: комплексное число w называется логарифмом комплексного числа z тогда и только тогда, когда ew = z. Полагая w = u + iv и z=x+iy, находим
ew = ew(cosr + z sinv) = z = x-\-yi=
= | z | (cos arg z+z sin arg z) (17)
(argz означает аргумент z).
Из соотношения (17) следует равенство модулей:
НО Глава III. Теория функций комплексной переменной и операционное исчисление
eM = |z| (18)
(ем—модуль eM(cosr + z sin г), a |z|—модуль z) и равенство аргументов:
r = argz4-2&7iz (/< = 0, + 1, ±2,...). (19)
Следовательно,
г/ = 1п | z|, v = argz+2&7tz (/с = 0, ±1, ±2, ...), откуда
w = Ln z = и + iv = In | z | + z (arg z+2k л) =
= In | z | + z Arg z, (20)
т. e. логарифм комплексного числа равен логарифму модуля этого числа плюс z, умноженное на аргумент комплексного числа.
Итак, в области комплексных чисел каждое число z/0 имеет логарифм (в области вещественных чисел логарифмы определены только для положительных чисел). Кроме того, логарифм комплексного числа определен неоднозначно (поскольку в комплексной области уравнение ew = z имеет бесконечное множество решений).
Пример. Вычислить Ln z.
Решение. Согласно формуле (20), находим
Ln z = In 1 + z Arg z = z^ + 2knj.
Нетрудно убедиться в том, что каждое из найденных решений удовлетворяет определению логарифма комплексного числа z. Действительно, по формуле (12) получим
е/(2+2Л7С)_:СО8/^_|_2Л:яХ) + / sinf-+2/ri?) = z. \2 / \2 /
4°. Тригонометрические и гиперболические функции. Формула (12), т. е. el>==cosy + z sin у, была получена в предположении, что у — вещественное число. Однако тождество (11), следствием которого является эта формула, справедливо для всякого у с «естественными» законами умножения при условии сходимости рядов в левой и* правой частях этого тождества. По определению, для комплексных z имеем
2 4 2п
<2Г)
sinz=z-----1—1)";--------------г—I-... . (22)
3! 5! v 7 (2и—1)! v
j>' 3.2. Элементарные функции комплексной переменной
111
Отсюда, в частности, следует, что cos(—z) = cosz, sin( — z) = = — sin z.
Для всякого комплексного (а не только вещественного) числа у предположения о законах умножения и сходимости рядов (21) и (22) оказываются выполненными, так что формула (12) имеет место для любого комплексного аргумента (подробнее см. § 3*.2, 2).
Итак,
efz = cosz+z sinz (zgC), (23)
откуда, заменяя z на — z, получим
e~lz = cosz—i sinz (zgC). (24)
Складывая равенства (23) и (24), находим eiz+e~iz
cos z=—-—. (25)
Аналогично, вычитая равенство (24) из (23), имеем
eIZ—е iz smz =-----------
2z
(26)
Формулы (25) и (26) позволяют выразить функции cosz и sinz через eiz.
Все свойства функций cos z, sin z могут быть получены из тождеств (25), (26) и свойств функции elz. В част-
ности,
• 2 । 2 / е “г с
sm z+cos z = (---------
e2iz + 2 + e-2iz e2iz _2 _|_e — 2iz
~4 4 —4
sin(z1+z2)
\ 2i J\ 2 J \ 2i 2 J
— sin z± cos z2 — sin z2 cos zt. (28)
Таким образом, более широкая точка зрения на функции cosz, sinz позволяет рассматривать известные свойства соответствующих вещественных функций как следствие свойств функции eiz, в основном—тождества (14).
Согласно формулам (25) и (26), функции w = cosz, w = sinz определены при всех комплексных значениях z, поскольку этим же свойством обладает функция w = elz.
112 Глава Ш. Теория функций комплексной переменной и операционное исчисление
Даже периодичность функций w —sinz, w —cosz можно рассматривать как следствие периодичности функции w = elz. Действительно,
е^+2я)_е-ф4-2к) e*_e-zz
sm (z+2л —------------------—---------— sm z,
v 7 2z 2i
/ \ е^+2к)+е/(г+2к) eZz + e~Zz
COS (z + 2 Л ) —------------—---------— COS Z.
Следует отметить, что в комплексной области функции cosz и sinz обладают рядом необычных с вещественной точки зрения свойств. Так, они могут принимать значения, по
е з -j- g з модулю большие, чем 1; например, cos3z ——-—>4.
Введем теперь функции tgz и ctgz. По определению,
sinz . COSZ
tgz------, ctgz- —
cos z sm z
(29)
Эти функции при действительных значениях аргумента совпадают с функциями tgx и ctgx.
Функции tgz и ctgz определены для всех zeC, за исключением соответственно точек z —и z=kn (k = 0, ±1, ±2, ...), в которых равны нулю cosz в правой части равенства tgz —sinz/cosz и sinz в правой части равенства ctgz — cosz/sinz (в других точках эти знаменатели в нуль не обращаются, как будет показано ниже).
Свойства функций w — tg z, w — ctg z вытекают из свойств функций sinz, cosz и формул (29), т. е. в конечном счете из свойств функции y = etz. В частности, как и в вещественном случае,
(30)
tgz =
, ~ sin2z 2sinzcosz 2 tgz
tg 2z ——------------------—------—
cos2z cos2 z — sin2 z 1— tg2 z
sinz
cosz
(31)
Здесь использованы известные свойства вещественных функций sinx, cosx, справедливые и для комплексного z: sin2z — 2sinz cosz, cos 2z — cos 2 z—sin 2 z, cos —z^ — sin z, sin |—z^ — cos z. Доказательство этих формул можно легко провести по аналогии с (27), (28).
3.2. Элементарные функции комплексной переменной
113
Рассматривают также функции
chz =
ez+e
shz =
ez—е z
2
(32)
которые называются соответственно гиперболическим косинусом и гиперболическим синусом.
Очевидна их связь с cosz и sinz:
ch zz = cos z, sh zz=z sin z. (33)
Функции chz, shz определены для всех значений комплексного аргумента z и обладают рядом свойств, вытекающих из формул (32) и свойств функции w = ez. При этом в силу равенств (33) некоторые свойства этих функций соответствуют известным свойствам w = cosz, w = smz, в частности,
ch2z —sh2z= 1, ch(z1+z2) = chz1 chz2 + shz1 shz2.
5°. Обратные тригонометрические и обратные гиперболические функции. По определению, функция w = Arccosz является функцией, обратной к cosz. Это означает, что комплексное число w является Arccosz тогда и только тогда, когда
cosw = z. (34)
Используя равенство (25), имеем
откуда, обозначая env через а, последовательно находим
1
ос Ч—
—y-^z, a2 —2za+1 =0, a^z + ^/z2— 1,
e^^z + ^/z2 — 1, zw = Ln(z + v/z2 —1 ), т. e.
Ln(z + v/z2 — 1). (35)
Таким образом,
w = Arccosz = -Ln(z±y]z2 — \). (36)
Функция w = Arccosz неоднозначна, поскольку уравнение (34) при произвольном комплексном фиксированном z имеет бесконечное множество решений. Это множество и описывает формула (36). Бесконечное множество значений w, соответствующих заданному комплексному числу z, содержится в формуле (36) потому, что функция Ln принимает бесконечное
114 Глава III. Теория функций комплексной переменной и операционное исчисление
множество значений; кроме того, выражение z + ^/z2 — 1 определяет два значения для каждого zeC.
Аналогично можно показать, что
w = Arcsin z = * Ln (z (z ± ^/z2 — 1)) (37)
(по определению, w = Arcsin z<=>sin w=z) и
w = Arctgz = - Ln (38)
i \—zi
(по определению, w = Arctg zoz-tgw).
Отметим, что формулы (36) — (38) связывают обратные тригонометрические функции с логарифмической функцией, а также с функциями z + ^/z2 — 1 и в области дейст-вительных чисел аналогов таких соотношений не имеется.
Для гиперболических функций w = chz, w = shz, w = thz также определены обратные функции Arcchz, Arcshz, Arcthz. Как и при выводе формул (36) — (38), легко показать, что
Arcchz = Ln(z + ^/z2 — 1), Arcshz = Ln(z±^/z2 +1), Arcthz = Ln 1^- . (39)
\ 1— z
Заметим, что функции In^+^/x^+T), ln|^ входят в формулы табличных интегралов («длинный» и «высокий» логарифмы). Основная причина этого в конечном счете состоит в формулах (39).
6°. Общая степенная функция. По аналогии с тождеством в области вещественных чисел
xa-ealnx (z, ocgR) (40)
определим функцию комплексной переменной для комплексных чисел z, ос:
za = eaLn*. (41)
Функция (41) определена для всех z/О; в отличие от вещественного случая (40) функция (41) многозначна (из-за многозначности функции Lnz). Для вещественного z и целого а все значения za, определяемые формулой (41), совпадают.
Действительно, в этом случае имеем
J>‘ 3.3. Производная функции комплексной переменной. Условия Коши—Римана
115
Г aln|z|+a-2Tufc ~a_paLn z__pa(ln|z|4-z Argz)_ ) с
z с j a In | z |+a (iti+2nik) z<0
откуда следует
Cealn|z| = za, z>0;
Z ~ ((—l)“eaIn|z| = |z|“(—1)“, z<0.
Если a—рациональное вещественное число, т. e. a^+plq, (p и q—целые), то часть значений функции совпадает между собой и среди этих значений имеется ровно q различных (при условии, что дробь p/q несократима); при этом zp^ = \fz^.
Корень д-й степени из числа zp может быть найден по формуле
zplq = tpIq cos / Р Arg z j i ( sin - Arg z V / \ q
(42)
вытекающей из формулы Муавра. При этом
-Argz=p<p+— (k=0. 1, 2, q— 1), cp^argz, 0^argz<2jc. q q
Таким образом, при u=p[q (p и q—взаимно простые целые) w = zp/q является «у-значной функцией; она имеет ровно q значений при всяком z^O.
§ 3.3. Производная функции комплексной переменной. Условия Коши—Римана.
Дифференцируемость элементарных функций
1°. Производная функции комплексной переменной. Функцией f комплексной переменной z, принимающей комплексные значения, называется закон, сопоставляющий каждому комплексному значению zeD из некоторого множества DczC определенное значение /(z), принадлежащее некоторому множеству#с С.
Множество D называется областью определения, а множество Е—множеством значений функции /.
В дальнейшем будем считать множество D открытой областью. Это означает, что для каждой точки zoeZ> найдется такая a-окрестность точки z0, т. е. такое множество wa(z0) = = {zgC, I z—z01 <a}, что wa(z0)c=Z>.
На функции комплексной переменной легко переносится понятие предела: комплексное число с называется пределом функции f комплексной переменной z при z->z0 (обозначение: lim /(z) = c), если значения функции /(z) неограниченно прибли-жаются к с. когда аргумент z стремится к z0 (это определение
116 Глава III. Теория функций комплексной переменной и операционное исчисление
не является вполне строгим; необходимые уточнения приведены в § 3*.2, 1).
Понятие дифференцируемости и понятие производной функции f комплексной переменной сильно отличаются от своих вещественных аналогов, несмотря на то, что формально соответствующие определения весьма сходны (см. § 3*.3, 1).
Опре де ление. Пусть /(z)— функция комплексной переменной, определенная в a-окрестности точки z0, и существует предел
lim Ж+А2)~Ж) Az->0 Az
Тогда этот предел называется производной функции f(z) в точке z0; при этом функция /(z) называется дифференцируемой в точке z0.
Если функция /(z) дифференцируема в каждой точке области Z>, то
r(z)=lim/(z+Az)~/(z) (1)
Az-*0
называется производной функцией от /(z) в области D.
Комментарий к определению. Приведенное определение дифференцируемой функции /(z) предполагает, что /(z) — однозначная функция или, по крайней мере, в малой окрестности точки z ее можно сделать однозначной благодаря выбору для каждой точки единственного значения функции /(z). Именно в таком смысле будет в дальнейшем пониматься дифференцируемость многозначных функций.
Из существования производной f'(z) функции /(z) комплексной переменной вытекает существование всех производных /(n)(z) порядков п = 2. 3, ..., а также разложимость функции /(z) в степенной ряд. Напомним, что из существования производной /'(х) вещественной функции /(х) не вытекает даже существования второй производной /"(х). В этом заключается большое различие между понятиями дифференцируемости в вещественном и комплексном случаях. Это объясняется более жесткими условиями, определяющими понятие предела в случае функции комплексной переменной (см. § 3*.3, 1).
2°. Теоремы о дифференцируемости функций комплексной переменной. Теорема 1 (условия Коши—Римана). Пусть w=f(z) — функция комплексной переменной, где z = x+yi. w = u-]-vi; вещественная и мнимая части значений функции f(z] являются (вещественными) функциями переменных х. у: и = и(х. у). v=v(x. у). Для того чтобы-функция f(z) была дифференцируемой в точке z = x+yi. необходимо и достаточно, чтобы в точке (х; у) функции и(х. у). v(x.y) были дифференцируемы и выполнялись условия
3.4. Теорема Коши. Интегральная формула Коши. Ряд Тейлора 117
ди _dv ди _ dv •
дх ду ’ ду дх
Равенства (2) называются условиями Коши—Римана (иногда их называют условиями Эйлера—Даламбера).
Доказательство теоремы 1 приведено в § 3*.3, 2.
Теорема 2 (дифференцируемость элементарных функций комплексной переменной). Функции w = zn (neN), w = ez, w = sinz, w = cosz, w = shz, w = chz дифференцируемы в любой точке zeC.
Функция w = tgz дифференцируема в любой точке zeC (zT^'K/2 + лк, keZ); функция w = thz дифференцируема в любой точке zeC (z^(n/2 + 2Tik)i, keZ).
Для функций w = Lnz, w = az, w=za (a, ocgC, tz/O) в окрестности каждой точки z^O можно выбрать однозначную ветвь, которая является дифференцируемой в точке z функцией.
Комментарий к теореме 2. Утверждению теоремы можно придать такую форму: все перечисленные в теореме функции дифференцируемы в каждой точке области определения, в окрестности которой можно выделить однозначную ветвь.
Доказательство теоремы приведено в § 3*.3, 3-
Теорема 3. Если функции f(z) и g(z) дифференцируемы в точке z, то функции f(z}+g(z), f(z]g(z) также дифференцируемы в точке z, а функция f(z)/g(z) дифференцируема в точке z при условии g(z)/0.
Если функция w=f(z} дифференцируема в точке z, а функция z=g(y) дифференцируема в точке v и f (z) определена в окрестности точки z=g\y}. то функция w=f(g(yp дифференцируема в точке v.
Доказательство приведено в § 3*.3.4-
Комментарий к теореме 3. Теорема утверждает, что всякая функция, полученная из дифференцируемых функций с помощью арифметических действий и операции построения сложной функции, является дифференцируемой. В частности, дифференцируема всякая функция, которую таким способом можно получить из функций, перечисленных в теореме 2. В настоящей главе речь будет идти в основном именно о таких функциях.
§ 3.4. Интегрирование по комплексному аргументу. Теорема Коши. Интегральная формула Коши. Ряд Тейлора
1°. Интегрирование по комплексному аргументу. Пусть в комплексной плоскости С задана кусочно-гладкая кривая L с начальной точкой а и конечной точкой b(a, be С); пусть в каждой
118
Глава Ш. Теория функций комплексной переменной и операционное исчисление
точке z кривой L определено значение /(z) функции f (рис. 12). По аналогии с определением интеграла функции вещественной переменной на отрезке, рассмотрим предел
lim £ f(ck)(zk-zk-k), (1) k = l
где Zq = 4z, z^, z2, ...,
zn=^b—точки кривой £,
a ck—точка, принадлежащая участку кривой с концами zk-± и zk (fc=l, 2, ..., п); предел (1) рассматривается при условии, что разбиение кривой L точками z0, z15 z2, ..., zn становится как угодно мелким, т. е. max|zk—zk_r |—>0.
Если предел (1) для функции f существует при любом способе стремления max|zfc — zk_r\ к нулю и любом выборе точек ск на участках zfc_1? zk кривой, то значение предела (1) называется интегралом функции /(z) по кривой L от ъ
точки а до точки b и обозначается (£)f/(z)dz. В дальнейшем
для краткости мы будем употреблять в одно из обозначений ь
j/(z)dz или J/(z)dz. Таким образом,
L а
b п
J/(z)dz = lim X /(с*)(^t-?*-!)• (2)
а к=1
Следовательно, при выполнении указанных условий функции /(z), определенной в точках кривой £, ставится в соответствие комплексное число, равное J/(z)dz.
L
Как и в случае вещественной функции и вещественного интеграла, справедливо следующее утверждение.
Теорема 1 (достаточный признак существования интеграла). Если функция f[z) непрерывна на кривой £, то J/(z)dz существует.
L
Интеграл J/(z)dz можно выразить через криволинейные интегралы от вещественной и мнимой части функции /(z). А именно, если f \z} = u(x, y) + iv(x, j^), где x+yi=z, то
j> 3.4. Теорема Коши. Интегральная формула Коши. Ряд Тейлора
119
№)<Н[ и(х. y) + zr(x, j,)](dx + zdy) = Jи(х. j>)dx—
L L ' L
— v(x, j^)dj? + z Jv(x. y)dx+u(x. jy)dj\ (3)
L
Здесь Ju(x. jy)dx — v(x. jr)dj? и Jv(x. y)dx+u(x. j)dj означают L L
криволинейные интегралы от вещественных подынтегральных выражений udx — vdy и vdx+udy. Вычисление этих интегралов вдоль кривой Д определяемой параметрически уравнениями x = x(z), y=y(t} (ос^^Р), на плоскости переменных х, у сводится к вычислению обычных определенных интегралов:
Р
f(i/(x(z), y(t))x’ j^(z)j'(z))dz =
a
= \udx — vdy. (4)
L
P
J(r(x(z),y(z))x'(z)+w(x(z), j;(z))/(z)dz= a
— Jrdx-hrzdj (5)
L
Доказательство теоремы вытекает из формулы (3), которая в свою очередь следует из определения (2) (см. § 3*.4, 1). 2°. Свойства криволинейного интеграла. Интеграл функции /(z) вдоль кривой L обладает рядом свойств, аналогичных свойствам криволинейного и определенного интеграла.
1°. Для любых а, РеС и любых двух функций f(z)9 g(z), непрерывных на кривой L, справедливо равенство
f(a/(z)+pg(z))dz=af/(z)dz+pfg(z)dz. (6)
L L
2°. Если кривая L между точками а и с разбита на два участка'. Ц от а до b и L2 от Ъ до с. то
f/(z)dz= J/(z)dz+ f /(z)dz. (7)
L L1 L2
3°. Пусть L—кривая с начальной точкой а и конечной точкой b. a L~—та же кривая, но ориентированная противоположно. т. е. с начальной точкой b и конечной точкой а. Тогда
f/(z)dz=-f/(z)dz. (8)
L L~
ft
120 Глава III. Теория функций комплексной переменной и операционное исчисление
4°. Пусть М—максимум модуля функции f(z] на кривой L от точки а до точки Ь. Тогда
\f(z)Az
L
^Ml,
(9)
где I—длина кривой L.
Доказательства свойств 1°—4° вытекают непосредственно из определения (2) и приведены в § 3*.4, 2.
3°. Теорема Коши и следствие из нее. Теорема 2 (теорема Коши). Если D—конечная односвязная область и f(z)—(однозначная) дифференцируемая в каждой точке zeD функция, то для любой замкнутой кусочно-гладкой кривой L, лежащей в области D, интеграл от f(z} вдоль L равен нулю*.
f/(z)dz = O. (10)
L
Комментарии к теореме 2. 1) Термин «область» означает связное открытое множество. При этом множество называется связным, если любые две его точки можно соединить непрерывной кривой, состоящей из точек, принадлежащих этому множеству; множество называется открытым, если -вместе с каждой своей точкой оно содержит некоторую окрестность этой точки.
2) Область D называется односвязной, если всякая замкнутая кривая в ней может быть непрерывным образом стянута в точку. Это равносильно тому, что область D не содержит «дыр». Например, области Dr и D2, изображенные на рис. 13, односвязны, а области D3 и /)4 неодносвязны.
3) Кусочная гладкость кривой L в теореме Коши означает, что кривую L можно разбить на конечное число участков, на каждом из которых в параметрические уравнения линии x = x(t), y=y(t), z(z) = x(/)+j;(z)z входят функции x(t), дф), производные.
4) Начальная и конечная точки кривой L совпадают. Теорема Коши остается справедливой, если в качестве начальной и конечной точек кривой L взять произвольную точку на L.
5) Для интегрирования функции f (z) вдоль кривой L достаточно знать значения f (z) на кривой. В условиях теоремы Коши предполагается, что функция /(z) определена во всех внутренних точках
имеющие непрерывные
Рис. 13
§ 3.4. Теорема Коши. Интегральная формула Коши. Ряд Тейлора 121
области, ограниченной замкнутой кривой L (и даже дифференцируема в этой области).
6) Доказательство теоремы можно провести, используя формулу (3), сводящую комплексный интеграл к двум вещественным криволинейным интегралам. Применяя к этим криволинейным интегралам формулу Грина и учитывая условия Коши — Римана, получаем, что оба интеграла равны нулю, как это и утверждается в теореме. Однако при таких рассуждениях используется непрерывность производной /' (z), в то время как условия теоремы предполагают лишь существование производной. В теории функций комплексной переменной существенную роль играет теорема Коши в приведенной выше формулировке (без дополнительного предположения о непрерывности производной в области D). В связи с этим доказательство теоремы Коши оказывается более трудным, чем то, которое в общих чертах описано выше. Подробное доказательство см. в § 3*. 4, 3.
Следствие (из теоремы Коши). Пусть Lx и L2 — две кусочно-гладкие кривые в односвязной области De С, соединяющие точки а и b;f(z)—дифференцируемая в D функция. Тогда
J/(z)dz = f/(z)dz. (И)
Li L2
Таким образом, J/(z)dz при указанных условиях зависит не от кривой, а только от начальной и конечной ее точек.
Доказательство. Согласно теореме Коши, имеем j /(z)dz = 0, откуда
Li + L2
f/(z)dz+f/(z)dz = 0, т. e. f/(z)dz= - f f (z)dz= f/(z)dz
L± Г2 L2 P2
(здесь были использованы свойства 2° и 3° интеграла).
Пусть F(z)—функция такая, что производная F' (z) совпадает с / (z) [функция F(z) называется первообразной по отношению к /(z)]. Тогда при описанных выше условиях имеет место формула
1/ (z)dz = F(b)— F(a), L
которая справедлива для любой кусочно-гладкой кривой L, соединяющей точки а и Ь.
Примеры. 1. Вычислим Jz2dz, где L—окружность единич-L
кого радиуса с центром в точке z —0. Имеем z = x + yi, z2 — u+vi, и = х2 — у2, v = 2xy. Используя формулу (3), находим
fz2dz= f (х2— j?2)dx — 2xydy + zf 2xydx + (x2 — y2)dy.
122 Глава III. Теория функций комплексной переменной и операционное исчисление
Параметрические уравнения окружности L имеют вид x = coscp, у = sin ср. Следовательно,
2л
f(х2 — j?2)dx — 2xydy = J [(cos2cp —sin2cp)( —sincp) — L о
— 2sin cp cos2 cp] dcp =
2л 2л _ 2л
= f ( —cos2cp sincp —sin2cpcoscp)dcp = — f sin3cpdcp = ——- =0,
о о 3 о
2л
j2xj? dx + (x2 — y2)dy = J [ — 2coscp sincp sincp + l о
+ (cos 2 cp — sin 2 cp) cos cp ] dcp =
2л 2л . ~ 2л
= f ( —sin2cp sin cp + cos2cp coscp)dcp= J cos3cpdcp =---- =0.
о о 3 о
Результат вычислений согласуется с теоремой Коши.
2. Вычислим J— вдоль той же окружности |z|= 1; выберем l z
направление обхода против часовой стрелки. Имеем z = x+yi,
1 X yi х у
-=^---w = —---------------, v= —......о. Полагая x = coscp,
z х2 + у2 х2 + у2 Х2+у2 Х2+у2
у = sin ср, получим
2л 2л
— cos ф sin ф + sin ф cos ф । . j sin2 ф + cos2 ф
СО82ф+8т2ф 1сО82ф+8Ш2ф
о о
(12)
Теорема Коши в данном примере неприменима, так как функция 1/z не дифференцируема в точке z = 0. Отметим, что если условия теоремы Коши для интеграла J/(z)dz не
L выполнены, то интеграл может быть либо равным нулю, либо отличным от нуля.
3. Рассмотрим fzkdz для произвольного целого (положи-L
тельного, нулевого или отрицательного к)ч где L—по-прежнему окружность | z | = 1.
На окружности | z | = 1 для любой точки z имеем z = cos cp + zsin ср = е1<₽; поэтому функция zk = eIfc<p, 0 < ср < 2л. Далее,
3.4. Теорема Коши. Интегральная формула Коши. Ряд Тейлора
123
находим dz = (— sin ф + i cos ф)скр = — z (cos ф + i cos ф)скр = /е’фс1ф. Следовательно,
f zkdz = J e'/t,,>ze“₽ckp= J ге‘№+1)фёф =
L О О
2л
= J z[cos(A:+ 1)ф + /8т(£+1) ф] дф = о
= /'sin(fc+l)2_ .соф+ДИ 2"
\ k+1 к+\ J 0 ь v 7
Г dz
Если А + 1 =0, т. е. к= — 1, то — = (см. пример 2).
J Z
Итак,
zkdz =
0 при —1,
2тп при к= — 1.
(И)
Заметим, что при к=— 2, —3, ... подынтегральная функция z~k не определена в точке z = 0 (и тем более не дифференцируема) и теорема Коши неприменима, но интеграл Jzkdz L равен нулю; при к= — 1 интеграл равен 2тп.
4°. Интегральная формула Коши. Пусть /(z)— (однозначная) функция дифференцируемая в односвязной области D, a L — кусочно-гладкая кривая, содержащаяся в области D вместе с областью Ь, которую эта кривая ограничивает (рис. 14).
Тогда для всякой точки zoeD справедлива интегральная формула Коши:
^-dz.
2тп z—Zq
L
(15)
Формула Коши (15) является одной из важнейших в теории функций комплексной переменной. Ее вывод приведен в § 3*.4, 4.
С помощью этой формулы значения дифференцируемой функции f внутри области D, ограниченной кривой £, выражаются через значения функции / на границе области, т. е. на кривой L.
Заметим, что значения вещественных дифференцируемых функций внутри области в принципе не могут быть определены по своим граничным значениям. Так, на рис. 15 изображены
124
Глава III. Теория функций комплексной переменной и операционное исчисление
Рис. 15
графики различных дифференцируемых кривых, граничные значения которых (в концах отрезка) совпадают.
Следствие 1. Для всякой дифференцируемой в точке z0 функции f (z) существуют производные всех порядков п=1, 2, 3, ... . При этом справедлива формула
/<и)(^)=^-.Г /(zLdz- <16)
2лг (z— zQ)
L
Доказательство приведено в § 3*.4, 5-
Следствие 2. В окрестности каждой точки z0, где существует производная f'(zQ), функция f (z) может быть представлена сходящимся рядом:
f (z)=f (zo)+/'(zo)(z-z0)+f-^-(z-z0)2 + ...+f-^-(z-z0)n+ ... .
Доказательство приведено в § 3*.4, 6-
Функция, которую в некоторой окрестности точки z0 можно представить в виде ряда (17), называется аналитической, а сам ряд (17)—рядом Тейлора функции f (z) в точке z0. Таким образом, ряд Тейлора дифференцируемой в точке z0 функции существует и сходится к самой функции / (z) в некоторой окрестности точки z0. Напомним, что из дифференцируемости вещественной функции не вытекает даже существование второй производной; даже если вещественная функция имеет все производные порядков п = 1, 2, ...,'то ряд Тейлора этой функции может оказаться расходящимся или сходящимся к другой функции.
f 3.4. Теорема Коши. Интегральная формула Коши Ряд Тейлора
125
Г ez
Примеры. 1. Вычислить -^dz,
L
где L—окружность с центром z = 0 и радиусом, равным: а) 1; б) 5 (рис. 16).
Решение, а) Если L—окру-ez жность радиуса 1, то функция —-2+3 дифференцируема в каждой точке круга | z\ < 1. В силу теоремы Коши
I cz имеем -----dz = 0.
J L
б) Если L— окружность радиуса
Рис. 16
5, то точка z=— 3 принад-
ez
лежит кругу | z | < 5; в этой точке функция ---- не определена
2+3
(и не дифференцируема). Таким образом, теорема Коши для вычисления
выражение имеет вид где функция f(z) = ez дифферен-2 Zq
цируема в каждой точке круга. Применяя формулу Коши (15), находим
интеграла неприменима. Однако подынтегральное
ez
----dz = 2^ze-3. z+3
2. Вычислить
COS Z j f
—— dz, где L—окружность с центром z = 0
и радиусом 1.
Решение. В
cos z дифференцируема внутри cosz)"=0=— —j-dz, откуда
' ' 2ni z*
силу формулы (16) при zo = 0, я = 2 (функция круга | z | < 1) находим
COS Z .
—— dz = — ти.
z*
5°. Разложения некоторых функций в ряд Тейлора. Однозначные дифференцируемые функции w = zn (n е N), w = ez, w = sin z, w = cos z, а также функции w=Ln (1 +z), j=(l +z)“ (cteR), для которых можно выделить однозначную ветвь в окрестности точки z=0, разлагаются в степенные ряды (ряды Тейлора в точке z = 0) следующим образом:
7 2 zn
e=l+z+z-+.
2! п\
(18)
„3 _5 _2Л—1
sinz=z——|—1)*7--------(19)
3! 5! ' 7 {2k—1)! v 7
126
Глава III. Теория функций комплексной переменной и операционное исчисление
72 74 72к
cosz=l..+(-l)'[Av+...; (20)
2! 4! v 7 (2А:)! v 7
_2 T3 7t + 1
ln(l+z)=2-L+L_ ... +(-1)*!^+ (21)
(l+z),= l+az+°‘!° ,fz2+ ... 2)-(?_j±!jz» + ... (22)
v 7 2! k\
Ряды (18) — (20) сходятся при всех значениях zgC, а ряды (21) и (22) — в области |z|<l.
Из всех возможных значений функции Ln(l-hz) однозначная ветвь, представленная рядом (21), выделена условием — n/2<arg(l +z)<ti/2. Такое же условие |z|<l выделяет однозначную ветвь функции w = (l+z)a.
Формулы (18) — (22) являются расширением известных формул разложения функций ех, sinx, cosx, ln(l+x), (l+x)a вещественной переменной х в степенной ряд на случай комплексной переменной z. 00
Кругом сходимости степенного ряда £ anzn называется п= 1
множество точек z таких, что | z | < р; число р называется радиусом сходимости. Можно показать (см. § 3*.4, 7), что внутри круга сходимости степенной ряд можно почленно интегрировать и дифференцировать.
§ 3.5. Изолированные особые точки функции комплексной переменной. Их классификация. Ряд Лорана
1°. Изолированные особые точки. Определение 1. Точка zoeC называется изолированной особой точкой (однозначной) функции /(z), если существует такая окрестность точки z0, что функция /(z) определена и дифференцируема во всех точках этой окрестности за исключением самой точки z0.
Поведение функции /(z) в окрестности особой точки z0 различают в зависимости от того, какой из нижеследующих случаев имеет место: 1) существует (конечный) предел lim/(z) =
= a; 2) lim/(z) = oo; 3) предел lim/(z) не существует (и не равен бесконечности).
В первом случае z0 называют устранимой особой точкой, поскольку, полагая
j> 3.5. Изолированные особые точки и их классификация Ряд Лорана
127
z . f 6Z при Z = Zq. f\Z) = \p(\ /
(f[z) при z/z0, мы получим функцию, непрерывную во всей окрестности точки z0. Более того, можно доказать, что эта функция дифференцируема в точке z0. Во втором случае точку z0 называют полюсом функции /(z), а в третьем — существенно особой точкой.
Пусть z0—полюс функции /(z) и существует не равный нулю конечный предел
lim(z-z0)kf(z)=c. (1)
z->z0
Тогда говорят, что z0 — полюс k-го порядка (или полюс кратности к) функции f(z). Если целое положительное число к, удовлетворяющее условию (1), существует, то оно определено однозначно. Можно показать, что если условие (1) не имеет места ни при каком целом положительном к, то z0 является существенно особой точкой.
Примеры. 1. Функция /(z)=^^ в точке z = 0 не определена (а потому и не дифференцируема). Однако z3 z2fc-1
.. sinz г г-з]+-+(-1Г(2ГЛ)!+-lim—=lim------------------------=
z-^-0 z z->0 z
Z2 Z4
т. e. существует lim/(z). Следовательно, zo = O—устранимая z->0
особая точка и функция
ПРИ z = 0’ < sinz при L z является непрерывной, более того—дифференцируемой, а значит, аналитической (при всех z).
2. Функция w = в точках z=±z не определена (и не дифференцируема). При этом
lim —(z—z) = lim —=—=#(), ^•z2 + lV 7 Z^iz+i
т. e. точка z=z есть полюс кратности 1; такие полюса называются простыми. Точка z=—i также является простым полюсом.
128 Глава III. Теория функций комплексной переменной и операционное исчисление
3. Функция f(z) =—!— дифференцируема всюду, где 1—cosz
1—cosz/О. Если же cosz—1=0, то z = 2kn (&=0, ±1, ±2, ...). Можно убедиться в том, что
z z2
lim------=оо, lim------= 2/0. (*)
z-^0 1—COSZ Z^Q 1—cosz
Следовательно, точка z = 0 представляет собой полюс второго порядка. Таковы же и остальные полюса z = 2kn (/<=±1, ±2, ...).
Для вычисления пределов (*) воспользуемся разложением
cosz = 1--Ч----... .
2! 4!
Тогда получим
lim —т = Пт 1 = со, г“*° 1 -1+-——+... +... 2! 4! 2! 4! hm 2 4 = 1пп 2 =2. 2! 4! 2! 4!
Определение 2. Пусть функция /(z) дифференцируема (и, следовательно, аналитична) в окрестности точки z—z0. Далее, пусть /(zo) = 0 и разложение функции /(z) в ряд Тейлора в точке z0 имеет вид
/(z) = ^(z-z0)'[+«t+1(z-z0)fc+1 + ... (tZfc/O).
Тогда точка z = z0 называется нулем k-го порядка функции f(z\ Справедливо следующее утверждение (связь между нулем и полюсом функции):
Если z = z0—нуль к-г о порядка функции f(z\ то z=z0 является полюсом k-го порядка функции l/f(z). Обратно, если z = z0—полюс k-го порядка функции f(z\ то z0 является нулем k-го порядка функции l/f(z).
Например, функция /(z) = sinz—z имеет в точке z=0 нуль z^ z^
третьего порядка, так как sinz—z= ——Ч—-Ч-... (ряд Тейлора этой функции начинается с третьей степени (z—О)3, а функция /(z)=—-— имеет в точке z = 0 полюс третьего порядка.
7 sinz—z
2°. Ряд Лорана. Определение 3. Пусть функция /(z) аналитична внутри кольца 5={z|r<|z—z0|<7?}, где 0<г<Я^оо
3.5. Изолированные особые точки и их классификация. Ряд Лорана
129
(рис. 17). Тогда существует и притом единственный ряд + ОО
X ak(z-z0)k, r<\z-z0\<R, k— — оо .
его сумма равна f\zy.
/(z)=... + tf_2(z-z0)~2 +
+ a_1(z-z0)~1 + «0 +
+ a1(z-z0)+a2(z-z0)2 + ...(2)
Ряд (2) называется рядом Лорана функции f(z} в кольце 5.
Доказательство существования и единственности ряда Лорана приведено в § 3*.5, 1
Ряд
<20 + «1 (z —z0) + tz2(z —z0)2+... (3)
называется правильной частью ряда Лорана, а ряд (z-z0)-1 + a_2(z-z0)“2 + ... (4)
— главной частью ряда Лорана.
В приложениях теории рядов Лорана часто рассматривают случай, когда г— 0 и кольцо 5 содержится в окрестности Q изолированной особой точки zG [если z0— неособая точка, т. е. в ней существует производная /'(z) функции /(z), то ряд Лорана совпадает с рядом Тейлора функции f(z)].
Пусть (2) является разложением функции/(z) в ряд Лорана и L — окружность |z — z0| = p, r<p<R. Умножив обе части равенства (2) на (z —z0)z (где /=0, ±1, ±2, ...) и проинтегрировав полученное произведение вдоль окружности L, имеем (предполагая возможность почленного интегрирования)
f/(z)(z-zo)'dz= £ ak f6-z0)k(z-z())ldz =
L k = — oo L
+ co
= E J(z-z0)/l+zdz. (5)
k = — oo L
Легко видеть, что
J(z —z0)k + zdz = J zk + zdz, (6)
L
где Li — окружность единичного радиуса с центром в начале координат. Интеграл в правой части равенства (6) был вычислен в § 3.4 [см. формулу (14)]; согласно этому результату, 5 Мантуров О.В.
130
Глава III. Теория функций комплексной переменной и операционное исчисление
f (z—z0)k+ldz= f zk+ldz = <
L Ц I2™'
Учитывая это, находим
k+l^= — lj k+l=-\.
\f(z)(z-z0)ldz=a-l_.l-2ni, (7)
L
поскольку среди слагаемых правой части равенства (5) имеется
единственное ненулевое, а именно ak f (z—z0)к+1 dz, получа-L
ющееся при к = — 1—1 и равное ак *2ти. Отсюда следует равенство (7), которое можно переписать в более удобной форме:
йш = 2^ A2)(Z-Z°) т 1(iz- (8)
L
Формула (8) дает выражение коэффициентов ряда Лорана функции f(z ) в окрестности особой точки z = z0 через значения этой функции на окружности L.
Пусть г = 0 и кольцо S целиком принадлежит окрестности fl особой точки z0, т. е. 5={z|0<|z—z0|<7?, zeQ}. Напомним, что в этом случае интеграл (8) не зависит от того, какую из окружностей (£х или L2) внутри кольца S взять в качестве £, лишь бы точка z0 находилась внутри окружности (рис. 18).
С помощью ряда Лорана удобно изучать поведение функции /(z) в окрестности изолированной особой точки.
Так, характер особой точки соответствует следующим свойствам ряда Лорана:
в окрестности устранимой особой точки главная часть ряда Лорана вырождается —все коэффициенты ак при к<0 в формуле (2) равны нулю;
в окрестности полюса ряд Лорана функции имеет конечную главную часть — все коэффициенты ак с номерами, меньшими некоторого — г<0, равны нулю и я_г^0, т. е. разложение (2) имеет вид
f(z) = a-r(z-z0) r+a_r+1(z-z0) r+1 + ...
СО
(z-z0)-1+ X ak(z-zo)k, k = 0
(9)
причем число г совпадает с порядком полюса;
в окрестности существенно особой точки ряд Лорана имеет бесконечную главную часть — в формуле (2) содержатся от
£ 3.5. Изолированные особые точки и их классификация Ряд Лорана
131
личные от нуля коэффициенты ak при отрицательных и сколь угодно больших по абсолютной величине значениях к.
При изучении свойств функции /(z) особое значение имеет коэффициент a-i ряда Лорана, называемый вычетом функции /(z) в изолированной особой точке z0 (подробно понятие вычета и его применение будет рассмотрено в § 3.6).
Примеры. 1. Функция /(z)=—z—
в кольце S = {z 11 < | z | < оо } разлагается в ряд по отрицательным степеням z
Рис. 18
следующим образом:
z _ 1
— 1 z
(*)
Ряд в правой части равенства (*) есть геометрическая прогрессия со знаменателем -, по модулю меньшим единицы. Так как этот Z
+ оо
ряд сходится к---и представляет собой ряд вида £ akz\ то
l~Z к=~оо
разложение (*) является рядом Лорана функции —— в кольце S.
2. Разложить в ряд Лорана функцию /(z)=^—в кольце: a)51 = {z| 0<|z|<l}; б) S2 = {z\ 1<|г|<2}; в)53 = {2| 2 < | z | < oo}.
11 1 „
Решение. Имеем ------------=--------. Воспользуемся
(z—l)(z—2) z-2 z-1
формулой
-----| И | < 1.
1 — и
а) В кольце Sr имеем |z|<l. Следовательно, f( x 1 1 1 1 . 1
2
(*)
1
2
5*
132
Глава Ш. Теория функций комплексной переменной и операционное исчисление
Ряд Лорана функции f[z) в кольце S, оказался рядом Тейлора, б) В кольце S2:
1
z— 1
1 1 1
2 z
1 — 2
1
z 1
1 —
z
в) В кольце S3:
2_zl+4_zl+8_zl+
71 3 1 4 1
Все разложения были получены без использования формулы (8); в данном примере оказалось достаточным воспользоваться элементарной формулой суммы сходящейся геометрической прогрессии.
§ 3.6. Вычеты. Основная теорема о вычетах. Применение вычетов к вычислению интегралов
Определение. Пусть z0— изолированная особая точка фун-+ оо
кции /(z) и f(z) = £ ak(z—zQ)k—разложение функции /(z) в ряд Лорана в окрестности точки z0. Коэффициент а_г в этом разложении называется вычетом функции f(z] в точке z0 и обозначается ResZo/(z).
Комментарии к определению. I) В соответствии с формулой (8) § 3.5,
ResZo/(z)=— /(z)dz,
L
где L—малая окружность, содержащая внутри себя точку z0.
j* 3.6. Вычеты. Основная теорема о вычетах 133
2) Если z0 — неособая или устранимая особая точка, то Res„o/(z) = 0 (в силу теоремы Коши).
3) Интеграл J/(z)dz по
замкнутой кривой L равен нулю, если функция /(z) аналитична внутри области Л, ограниченной кривой L. Если же функция в области
D в некоторых точках z1? z2, ..., zk не является аналитической (т. е. эти точки Рис- 19
являются изолированными особыми), то, как утверждается в нижеследующей теореме о вычетах, J/(z)dz выражается
через вычеты функции в этих точках.
Теорема 1 (основная теорема о вычетах). Пусть {однозначная) функция f{z) аналитична в области D за исключением изолированных особых точек, а замкнутый контур L принадлежит вместе со своей внутренностью области D, содержит внутри себя конечное число особых точек z1? z2, ..., zk и не проходит ни через одну из них. Тогда справедливо равенство
f/(z)dz = 2ra X Resz./(z).
(1)
Комментарии к теореме. 1) Контур L, упоминаемый в формулировке теоремы, может быть не связным, т. е. состоять из нескольких замкнутых кривых, расположенных на некотором расстоянии друг от друга.
2) Направление интегрирования вдоль контура L подразумевается таким, что область Л, которую контур ограничивает при движении, остается слева (на рис. 19 контур интегрирования L состоит из четырех кривых L1? Л2, £3, Л4, а стрелки указывают положительное направление).
3) В случае, когда особая точка z0 является полюсом /с-го порядка функции /(z), вычет можно вычислить по формуле
ResZo/(z)=lim !L-J(z)(z-z0)k
(2)
При к=Л, 2, 3 эта формула принимает соответственно вид
Reszo/(Z) = Нт f(z )(z-z0 ),
(3)
134 Глава III. Теория функций комплексной переменной и операционное исчисление
Res2o/(z)=| lim ~(/(^)(2-z0)2), (4)
ResZo/(z)=l lim jL(/(z)(z-z0)3).
Доказательство теоремы в грубых чертах основано на следующих соображениях.
Как видно из рис. 20, интеграл по контуру L равен сумме интег-
ралов по малым окружностям вокруг особых точек. Каждый такой интеграл равен сумме интегралов вида J(z—z0)kdz; согласно формуле (14) § 3.4, все эти интегралы равны нулю, за исключением интеграла а _ i J (z—z0) ”1 dz, который равен
a-t’lni. Так как a-r = ResZo/(zo), то J/(z)dz=2KZ Resz,/(z).
L i-i 1
Подробности изложения доказательства см. в § 3*.6, 1.
Примеры. 1. Вычислить
1 л
-—dz, где L—малая окружность sinz
вокруг точки z = 0.
Решение. Точка z —О
1 v 1
---, так как lim—z=l.
smz sinz
Res
откуда I - dz = 2л/ ° 1 = J sinz
является простым полюсом функции
Применяя формулу (3), находим
1 1
г = 0 ' " sinz
= 2ni.
= lim----z — 1,
smz
2. Вычислить
ez
—dz, где L — окружность | z — 1 | = 1
Решение. Точка z=l является полюсом второго порядка,
Qz
поскольку lim-;-Oz—1)2 = е/0. Согласно формуле (4), по-
z->l \z~ Ч
лучаем ez d
Resz=1?——=lim-(z-1)2 Z_1 dz
е
_1U
= lim ez = e,
и, значит,
----—dz = 2л/e.
J (г-0
L
j> 3.6. Вычеты. Основная теорема о вычетах
135
3. Вычислить i^dz, где L—окружность |z| = 2.
J z L
Решение. Внутри окружности L имеются три особые точки z = 0, z = ti/2, z=— п/2. Точка z = 0 есть полюс второго порядка, так как
lim -z2 = lim — = 1^0.
z-*0 z z-*Q z
Следовательно,
1
A < ----T~Z~l%Z
d tgz .. cos z л. z—smzcosz
= lim —— = lim------------= lim — ------=
z-+0dz z z-+0 z z->0 z cos z
/ z3 \Z z2 \ z3 z3
z- z-—+ ... 1——+ ... z-z+—+—+o(z3)
1- \ 3! Д 2 J v 2 3! v 7
= lim -------;--—----:----- = lim------;--------
z—>0 Точка z = n/2 скольку ^2(1-y + -) =lim —*—^2 =0. z^° l--+o(z2) 2! является простым полюсом функции по-
r tgz Z 11т -гр-х : z^-tc/2 z \ z/ !. COS и !. = — lim — * Im м->0 / . л \ ( w + — \ 2/ Поэтому Resz==n/2 - / л\ tg \ 2 / wctgw = hm -н—А и= — lim 7 —• = «-0 и+?Л \ 2/ \ 27 1 — 1 -^0 (здесь u=z—-). ^sinw (п\ \ / W :gz r tgz/ л \ 8 lim A- z-- = . 73 \ Э / ТГ3
136
Глава III. Теория функций комплексной переменной и операционное исчисление
Аналогично находим
Итак,
ts Z
Resz=_„/2-T= lim z z-^—k.12
и
•lim-----=
w->0 sinw
= — lim
w->0
= 0.
3. С помощью вычетов можно вычислять некоторые вещественные определенные интегралы. Вычислим, например, + 00
dx х4+1 ’
Очевидно, что этот интеграл равен
где
L—вещественная ось и направление интегрирования выбрано слева направо (рис. 21).
Рассмотрим
dz
где Lr является кусочно-гладкой кри-
~ „lr
вой, состоящей из и полуокружности
отрезка —R^x^R вещественной оси 5={z| |z\ = R, Imz>0}. Интегралы
отличаются между собой, поскольку
мало
значения подынтегральной фун-
1 кции —
малы по абсолютной
величине на полуокружности S и на вещественной оси вне отрезка [ — R, 7?] при больших R. Легко видеть, что
lim
А—>оо % lr
3.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
137
Интеграл J можно вычислить с помощью основной Lr
теоремы о вычетах. Внутри полукруга, ограниченного контуром
Lr, имеются две особые точки функции : Zi=cos-+z sin-, z4 +1 4 4
z2=cos ^+z sin^ (обе являются корнями уравнения z4+l=0 и их мнимые части положительны). Каждая из этих точек представляет собой простой полюс. Следовательно,
Resz —= lim Resz ~т—= lim т- е-
*1Z4+1 Z_Z1Z4+1’ ^Z4+l z^2Z4+1’
dz z4+1
= lim
lim
z4+l z^z4+l
(*)
Пределы в правой части равенства (*) вычислим с помощью правила Лопиталя:
dz z4+l
== 2тсг ( lim -Д-+ lim -Д_ ) = 2га( -Д+-^ \z^Z14z3 z^Z24z3/ \4zf 4zl
2ra z3+zz__ni z3 + z3__nz
4 z3Z2 2 (zjz2)3 2
Зя Зл \ / 9л 9л\ cos--hzsin— + cos----H’sin —
4 4 J \ 4 4 J
4 л 4 л \ 3
cos-1-ism—
4 4 J
Tii ~. . л . л a / 2 = ——-2z sm-^Tism-^^—л.
2 4 4 2
Итак,
§ 3.7. Преобразование Лапласа. Основные теоремы об интегралах и изображениях. Формула обращения интеграла Лапласа. Свертка функций. Интеграл Дюамеля.
Решение дифференциальных уравнений и систем операционным методом
1°. Преобразование Лапласа. Определение 1. Пусть /(/) —функция вещественной переменной Z, равная нулю при Z<0, а £(/?)—функция комплексной переменной /?, определенная равенством
138
Глава III. Теория функций комплексной переменной и операционное исчисление
g(p)=\e ptf(t)dt (1)
О
(предполагается, что интеграл (1) сходится). Соответствие называется преобразованием Лапласа [функция /(/) преобразуется по Лапласу в функцию g(/?)]. При этом функцию f[t) называют оригиналом, а функцию g(p}—изображением.
Комментарии к определению 1. 1) В формуле (1), определяющей изображение g(p\ используются значения функции /(/) только при г^О. Условие/(z) = 0 при г<0, оговоренное в определении, связано в тем, что в дальнейшем будут рассматриваться функции вида f(t — a), для которых это условие является существенным. При обозначении оригиналов будем придерживаться следующего правила. Всякая функция f(t\ для которой сходится интеграл (1), определяет оригинал /ор(£):
' 7 (О при /<0.
По традиции функция /ор(/) обозначается просто /(/) (а условие (2) подразумевается).
2) Для сходимости интеграла (1) достаточно, чтобы:
а) функция /(/) была непрерывной, за исключением, быть может, конечного числа точек разрыва первого рода на каждом интервале конечной длины.
б) существовали такие вещественные числа Л/>0 и 5^0, что для всех t было выполнено неравенство
|/(г)|<Ме“. (3)
Функция /(/), удовлетворяющая неравенству (3), называется функцией конечного роста. Нижняя грань 50 множества, состоящего из всех чисел s, удовлетворяющих условию (3) при некотором М, называется показателем роста функции При выполнении условий а) и б) интеграл (1) сходится для всехр таких, что Re/? > 5*0.
3) Если g(p)- изображение, соответствующее по Лапласу оригиналу f(t\ то пишут g (/?) = £/(/) или ./(/t)Mg(p).
Применение операционного исчисления связано главным образом со следующим свойством преобразования Лапласа. Оказывается, что если оригинал удовлетворяет дифференциальному уравнению, то соответствующее изображение подчиняется гораздо более простому (не содержащему производных) уравнению. Поэтому дифференциальные уравнения можно решать по такой схеме:
1. От дифференциального уравнения, которому удовлетворяет оригинал, с помощью преобразования Лапласа переходят к (конечному, т. е. не дифференциальному) уравнению относительно неизвестного оригинала.
j> 3.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях 139
2. Решая это уравнение, находят изображение неизвестного оригинала.
3. По найденному изображению вычисляют искомый оригинал (это достигается с помощью формулы обращения преобразования Лапласа).
Для осуществления описанной выше программы необходимо знание свойств преобразования Лапласа. К изучению этих свойств мы и переходим.
2°. Свойства преобразования Лапласа. Теорема 1 (об аналитичности изображения). Если f(t) — функция конечного роста с показателем роста s0. то преобразование Лапласа g(p} этой функции является аналитической функцией комплексной переменной р при всех р таких, что Rqp>sq.
Доказательство теоремы основано на непосредственном вычислении производной £'(/>) (см. § 3*. 7, 1).
Теорема 2 (основные свойства преобразования Лапласа)
1°. Свойство линейности. Если gr(p} и g2(p} — изображения. соответствующие оригиналам fAt} и fAt\ т. е.
Lf2(t)=g2(t), то
L(afr (?) + р/2 (t)) = agi (р)+pg2(р).
для любых комплексных чисел а, (3.
2°. Свойство подобия. Если Lf(t)=g(p). то Lf(at)='-g6\ а>0.
3°. Свойство запаздывания. Если Lf(t)=g(p), то Lf(t-b) = e^bg(p), b>0.
4°. Свойство смещения. Если Lf(t)=g(j)\ то
“еС-
5°. Дифференцирование оригинала. Еслиf(t)—функция конечного роста с показателем роста s0 и Lf\t)=g(p}, причем при 1>0 существует производная f'(t) (также имеющая конечный рост}, то
Lf'(t)=pg(p)-f(0), Rep>s0,
где /(0) = lim/(?); кроме того, если fM существуют
?—О
и имеют конечный рост, то
Lf"(t)=p2g(p)-pf(o)-f'(o);
Lf"’(t)=p3g(p)-p2f(0)-pf(0)-f"^, -;
Lfn (?) =p"g (p)-Pn~ У(о) -Pn-2f (o) -... -f(n~X) (o).
140
Глава III. Теория функций комплексной переменной и операционное исчисление
6°. Дифференцирование изображения. Если fit} — функция конечного роста с показателем роста 50 и Lf(t) =g(p), то £( — tf(t^)=gfдля р таких, что J^Qp>sQ.
Г. Интегрирование оригинала. Если f(f)— функция конечного роста с показателем роста s0 и Lflt)=g(p), то t ( \
Flt} — ^flu)du— также функция конечного роста и LF(t}=—. о &
8°. Интегрирование изображения. Если Lf(t)=g(p),
то 1 =
I r J
g(z)dz (при условии, что
е сходится).
р о
Доказательство этих свойств вытекает из определения преобразования Лапласа и приведено в § 3*.7, 2.
Рассмотрим примеры вычисления изображений g(/>) конкретных оригиналов с использованием указанных выше свойств преобразования Лапласа.
1. Пусть /(/) = sintzZ. Тогда q iat___________________£ - iat j
£sin at = L------= —
2i 2i
1 _ ! a
p — ai p + aij p2 + a2
Здесь учтено, что
Lebt= e~ptebtdt= e~(p-^d/ =
e-(p~bY
-(p-b)
Ч 1 ! 1
2\р—ia p + aiJ р2 + а2
Аналогично можно найти
T * т + е lat L cos at = L------------------------
2
2. Пусть
0 при t<Q, 1 при
0 при t> 1.
Тогда f(t) = u(t) — u(t— 1), где
0 при /<0, 1 при />0.
Отсюда, используя свойство запаздывания, получаем
3.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
141
поскольку
3. Так как Lcos(dt = —---
Р2+а2
то в силу свойства смещения
имеем
£(е cosco/)—----
v 7 (^ + а)2 + со2
4. Пусть /(/) = еаг. Тогда £/(/) = —^ и £/"(/) = £ot2ear = -^—
Согласно правилу дифференцирования оригинала, находим
Lf" {t)=р 2g (р ) -аДо) ~f (9)=р2-^-р-'1-а=
_p2—p(p — vty — u(p — vty_p2—p2+pu—pa+u2 _ а2 р—а р—а р—а’
что совпадает с вычисленным ранее.
5. Пусть , . J 1 при />0,
(О при /<0.
Тогда £/(/)=-. Согласно свойству дифференцирования изображения, имеем £( —= , т. е. £( — /)=— и Lt=~.
Применяя свойство дифференцирования изображения к функции = t и ее изображению g(p)=-^, получим ( — = или
t
2
Аналогично
6. Пусть
находим L^-^.
sin/ при />0, О при /<0.
Тогда в силу свойства интегрирования изображения имеем
00
I г ^dp’ где
. Далее находим
р
142 Глава III. Теория функций комплексной переменной и операционное исчисление
00
r sinz dp
£-г- b^-arctgp
= | — arctg p = arcctg p
00
(функция такова, что интеграл Rep>0 сходится,
о
как это требуется в формулировке свойства интегрирования изображения).
Важное теоретическое и прикладное значение имеют еще два свойства преобразования Лапласа—теорема умножения изображений (теорема о свертке) и формула Дюамеля. В их формулировке участвует понятие свертки.
Определение 2. Пусть и —кусочно-непрерывные
функции действительной переменной /, определенные на ] —оо, +оо[, и tz(/) = Z?(r) = O при z<0. Сверткой функций a(t) и b(t) называется функция с(/), определенная равенством
с(г) = т)/>(т)йт. (4)
о
Свертку функций a[t) и b(t} обозначают через a*b(t}. Операцию вычисления свертки называют свертыванием.
Комментарии к определению 2. 1) Полезно помнить, что аргумент t в левой части равенства (4) равен сумме аргументов t — т и т в правой части этого равенства.
2) С помощью замены переменных и = 1 — т можно легко убедиться в том, что a*b=^b*a.
3) Если функции a(t\ b(t} не равны нулю при z<0, то под сверткой a*b(t} понимают интеграл
J я(г-т)/>(т)дт (5)
при условии, что он сходится. В операционном исчислении рассматривают, как правило, свертки оригиналов, так что интеграл (5) принимает вид (4).
Примеры. 1. Пусть
= р при Z>0, при ?>0,
' ' |0 при t<0, ' ‘ 1 0 при /<0.
Тогда
a*b(t) = I (/ — т)т2бт = Гу—--
C__z4_z4
о
j* 3.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях 143
2. Пусть
п(Л = № ПРИ z>0’ = ирн Z>0’
' ‘ ^0 при t<0, ' ' ^0 при Z<0.
Тогда
a*b(t) = Jef-T* ldx= — ef”T|o = ^—1. о
Теорема 3 (об умножении изображений). Если f19 f2—функции конечного роста такие, что Lf1(t)=g1(p). Lf2(t) — =ёг{р\ т°
Lfi*f2(t)=gi(p)g2(p)-
Комментарий к теореме 3. Теорема утверждает, что свертке оригиналов соответствует произведение изображений.
Доказательство приведено в § 3*.7, 3.
Теорема 4 (интеграл Дюамеля). Пусть /Л/)—непрерывная. а /2(0—непрерывно дифференцируемая на ГО, оо[ функция конечного роста такие, что Л пРи
и Lf1(t)=g1(p). Lf2(t)=g2(p). Тогда справедливо равенство
l d л («)л (* -м)+fi )f2 (o))=pgi(p)g2 (p )• (6)
0
Доказательство приведено в § 3*.7, 4.
Формула (6) носит название интеграла Дюамеля. Она играет важную роль при расчете переходных процессов в электрических цепях (подробнее об этом см. § 3*.7, 5).
Правила операционного исчисления и таблица преобразований Лапласа некоторых важных для практики функций приведены в конце настоящего параграфа.
3°. Формула обращения преобразования Лапласа. Как было отмечено выше, применение преобразования Лапласа к решению дифференциальных уравнений основано на том, что дифференциальные уравнения, которым подчиняются оригиналы, переходят в более простые (не дифференциальные) уравнения, которым удовлетворяют изображения. После того как неизвестное изображение вычислено, остается найти соответствующий ему оригинал. Возникает задача нахождения оригинала по известному изображению, т. е. задача обращения преобразования Лапласа. Ее решение дает следующая теорема.
Теорема 5 (обращение преобразования Лапласа). Пусть f(t)—кусочно-гладкая на каждом интервале функция конечного роста такая, что f(t) = Q при t<0 и Lf(t)=g(p). Тогда в каждой точке, в которой функция f(t) дифференцируема. имеет место равенство
144 Глава III. Теория функций комплексной переменной и операционное исчисление
c + i<X)
/(z)=^ g(/?)eptdp, (7)
с —too
где интеграл берется вдоль любой прямой Rcp^c>s{).
Формула (7) называется формулой обращения.
Комментарии к теореме 5. 1) Интеграл вдоль прямых комплексной плоскости р. параллельных мнимой оси, при условии Re/?>s0, где 50— показатель роста функции /(/), не зависит от с.
2) Несобственный интеграл (7) понимается в смысле главного значения, т. е.
c + ioo c + iw
(* (*
g(j)}eptdp= lim g(p)epIdt. (8)
c — iw
C — lOO
Доказательство теоремы 5 приведено в § 3*.7, 6.
Теорема 6 (единственность обращения). Если два оригинала и /2(Н имеют одно и то же изображение g[p\ то функции fi\t) и /2(0 совпадают во всех точках /, где обе функции дифференцируемы.
Комментарий к теореме 6. Пусть и /2(/)
— функция, отличающаяся от Л(^) лишь в конечном множестве точек. Тогда формула (1), задающая преобразование Лапласа, определит одно и то же изображение g(/>) для двух различных оригиналов (интеграл не меняется, если значение подынтегральной функции изменить в конечном числе точек). Теорема утверждает, в частности, что при дополнительном предположении о дифференцируемости двум различным оригиналам соответствуют различные изображения.
Доказательство теоремы 6 приведено в § 3*.7, 7.
4 °. Оригиналы с рациональными изображениями. Дробно-рациональной (или просто рациональной) функцией называется функция вида g(p) = A (р)/В(р), где А(р) и В(р)—многочлены:
А(р) = аорт + а1рт-1 + ... + ат (ао^0); в(р)=ьорп+ь1рп~1+...+рп (г>0^о).
Числа т и п называются степенями многочленов Л(/>) и В[р}. Дробно-рациональная функция называется правильной, если т < п.
Теорема 7. Всякая правильная дробно-рациональная функция является изображением.
Комментарий к теореме 7. Теорема утверждает, что для каждой функции вида А(р}1 В(р\ где т<щ найдется такая функция /(/), что = А (р]/В(р).
3.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
145
Доказательство теоремы основано на том, что всякую правильную дробно-рациональную функцию можно разложить на сумму простейших дробей, и каждая простейшая дробь является изображением некоторого оригинала. Подробное доказательство см. в § 3*.7, 8.
Для нахождения оригинала, соответствующего дробно-рациональному изображению, удобно воспользоваться формулой (7)„ При этом интеграл в правой части формулы можно найти с помощью теоремы о вычетах. Как показано в § 3*.7, 9, справедливо следующее утверждение.
Теорема 8. Пусть А(р)/В(р) — правильная дробно-рациональная функция', р±, р2, ps—полюсы этой функции, имеющие кратности г2, rs. Тогда оригинал f(t\ соответствующий изображению g(p) = A(p)/В(р), имеет вид
В случае, если все полюсы рг, р2, ..., рп—простые, формула (9) принимает вид
/(z)=L-if4£rI= е 4^^- (ю)
Примеры. 1. Найти оригинал изображения g(p)=^ 2^^2.
Решение. Здесь g(/>)—правильная дробно-рациональная функция. Она имеет два полюса 2z и — 2z, кратности которых равны 2. Согласно формуле (9), получим
/(.)_ 1 lim А (р-202ер1 | 1 ц d (р + 2/) У' _
J 0 > (2-1)! ^2idp(p-2i)2(p+2i)2^(2-1)! l^-2idp(p-2i)2(p+2i)2
~2 f>Pl _|_ I -L
е +(/,+2/ре +
/4 pPt J pPt
= lim—------lim —-----------— = lim 7-----
p-—2id/?(/> +2z)2 p_^-2id/7(/?-2z)2 p—>2i (/>+2z)3
2 _i_ z ept I(p-2z)3 ' (p—2i)2 J 2e2" te2it 2e~2it
(402 (-4/)’ +
=—[ — 2zcos2/+2sin2/+4/( — cos 2/ — zsin 2/)] +
+ lim
p— ~2i
+ .Ze.9==—Г—2zcos2/+2sin2/+4/( — cos 2/ — zsin 2/)l +
(—4z)2 64L
+^[2zcos2r+2sin2/+4/( —cos2/+zsin2z)] =|sin2/—^/cos2z.
Можно заметить, что все равенства по ходу вычислений содержали два сопряженных друг другу комплексных слагаемых; так как для всякого комплексного числа и имеем и + й = 2В&и, то с самого начала вычислений можно было написать
146
Глава III. Теория функций комплексной переменной и операционное исчисление
f(t) = 2Re -Ду- lim —.
' ' (2—l)!p_2idp(p—2/)2(р+2г)2
2. Найти оригинал изображения g(p)
Решение. Здесь знаменатель р3 — р2 — 6р=р(р2 — р — 6) = =р(р—3)(р+2) имеет только простые корни: рх=®, р2 = 3, р3= — 2. Используя формулу (10), находим
।---ГЦ____ept J-
(р3-р2-6р)'
.3‘+Ae2t=-Д-
10 3 15
р = 0
----р2+2____ер* (р3-р2-6р)'
2 Qt 11
=—е° Н—
7 ~6 15
р- -2
р = 3
:3г4-|е-2г.
3. Оригинал, соответствующий дробно-рациональному изоб-
ражению, можно найти, разлагая изображение на сумму простейших дробей и пользуясь таблицей преобразований Лапласа. Пусть, например, g(p) = —^—. Разлагая эту функцию
Р ~Р на сумму простейших дробей, имеем
Р^-Р Р 2(р-1) 2(р+1)
Согласно таблице, получаем
1 з”
L1
является
1 , 1 -t
-е'+-е .
— pj 2 2
Этот метод оправдан, если изображение легко разлагается в сумму простейших дробей.
4. Найти оригинал, соответствующий изображению
g^) = (r+l)Cp2+4)’
Решение. Так как g(/>)=—, то данное изображение ' р+1 р2+4
произведением двух функций gi (/?)=—Д и g2(p)=
/?+1
для которых известны обратные преобразования
Р р2+4’
Лапласа:
об умножении изображений, L~l кций е
L 1<—— > = е ', L 1 > = cos2t. Согласно теореме
|p+ij k+4j
(gig2)=e_'*cos2/(свертка фун-и cos 2/). Следовательно,
3.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
147
г
L~'L____? J= fe—cos2TdT = e-5^±^
++l)(p2+4)J J 5
О
ef (cos 2^+2 sin 2/) 1 cos2/+2sin2/ e~z
5°. Решение дифференциальных уравнений и систем операционным методом. Как было отмечено, свойства оператора Лапласа дают возможность решать линейные дифференциальные уравнения по следующему плану. Преобразование Лапласа переводит линейное дифференциальное уравнение в алгебраическое уравнение относительно изображения. Из этого уравнения можно найти изображение искомого оригинала, а затем по изображению можно восстановить оригинал.
Примеры. 1. Найти решение дифференциального уравнения х'(/) + Зх(/) = е* при условии х(0)=1.
Решение. Обозначим изображение искомой функции х(/) через х(р). Применив преобразование Лапласа к левой и правой частям данного дифференциального уравнения, получим
рх(р)-1+Зх(р )=-+-. (*)
Здесь были использованы свойство линейности и правило дифференцирования оригинала: Lx' (/) = pLx (/) — х (0)=рх(р)-1. Далее, из равенства (*) находим
Для того чтобы восстановить оригинал х(/) по изображению х(р), воспользуемся разложением дробно-рациональной функции на сумму простейших дробей. Это всегда можно сделать с помощью метода неопределенных коэффициентов. В данном случае к цели приводят несложные вычисления:
-/ \ р _ А в (р+з)(/?-1) /?+з /?-1’ откуда
Ар — А + Вр + ЗВ=р. (**)
Приравнивая коэффициенты при одинаковых степенях р в левой и правой частях соотношения (**), получим Л+5=1, — Л+ 35=0. Эта система уравнений имеет решение А = 3/4, 5=1/4. Таким образом,
4(р+3) + 4(р-1)’
148
Глава III. Теория функций комплексной переменной и операционное исчисление
Отсюда по таблице преобразований Лапласа находим
x(/)=-e“3t + -e'.
V / 4 4
Легко непосредственно убедиться в том, что х(/) удовлетворяет уравнению х' + 3х = е* и начальному условию х(0)=1.
2. Решить операционным методом дифференциальное уравнение х" — х' — 6х = 4 при условиях х(0)=Л, х'(0) = 0.
Решение. Обозначим изображение неизвестной функции x(t) через х(р). Применив к левой и правой частям данного уравнения преобразование Лапласа, получим
Р2х(р) —рх(0) -х’(0) - (рх^р} -х(0)) -6x(/?)=J. (*)
Здесь было использовано правило дифференцирования оригинала: Lx' (t)=px(p) — х(0), Lx" (t)=p2x(p) — рх(0) — х'(0). Далее, подставив начальные условия в равенство (*), имеем
р2х(р) -р-рх(р) + 1 -6х(/>)=Д
откуда
х(р)(р2-р-6)=^ +Р-1
или
х(р) =
4 4 , 1
-+р-1 -+р — 1
р _ р
р2-р+4
р2-р-б (р—3)(/? + 2) р(р-з)(/?+2)’
Остается восстановить оригинал по изображению. Воспользуемся формулой (10), поскольку все полюсы функции х(р) — простые. Учитывая, что производная знаменателя есть (р2 —р2 — 6р\ = Зр2 — 2р — 6, получим
(р2-р+4)е^ (/>2—p+4)ept
Зр2 — 2р— 6 Р = о Зр2 — 2р — 6
(р2~ р+4)ерг Зр2 — 2р — 6
р—~2
+
2 Ю 10 —2t 2 2 3t —2/
- + —е3*+—е = —- + -e3t + e . з 15 ю зз
3. Решить операционным методом дифференциальное уравнение x" + 4x = sin/ при условиях х(0) = х'(0) = 0.
Решение. Пусть х(/?)—преобразование Лапласа неизвестной функции х(/). Тогда
/>2х(р) -рх(0) -х'(0) +4х(р)=р1-г
откуда при заданных начальных условиях имеем
3.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
149
-/ х 1 . 1 _ 1
р2+1 р2 + 4 р4 + 5/?2 + 4*
Функция х(р) имеет только простые полюсы, следовательно применима формула (10):
%(/) =—з-------
' 7 4/>3+10р
p = i 4р3+Юр
Р=
4р3+10р p = 2i
4р34-10р p=—2i
(выражение 4р3 + 10р есть производная от р4 + 5р2 + 4). Учитывая комплексную сопряженность слагаемых, получим
%(/) = 2Re
ept \ 4p3+10p/p=i
ept
4/?3+10р J p = 2ij
т. е.
x(/) = 2Re
ей
e2it
—4z+ 10z — 32z 4~ 20 z
(sin t sin 2t
~6~ -12
sinZ
T"
1 •
- sin It. 6
4. Решить операционным методом дифференциальное уравнение xIV+2xn+x=sin t при условиях х(0) = х'(0)=Х'(0) = =х"'(0) = 0.
Решение. Обозначим изображение искомой функции x(Z) через х(р). Применяя к данному уравнению преобразование Лапласа и учитывая начальные условия, получаем
р4х + 2п2х+х=^—,
д2+1
1 тт
откуда х=——Для вычислении _ (р +1)3
функция х(р) имеет два полюса z, из которых равна 3. Имеем
1 d2 (p — i)3ept
применим формулу (9); — г, кратность каждого
(3-1)! г™’ dp2 (/>-z)3(p+z)3
d2 (/?4-z)3ept
Гз’
4- 1 Нт -______________v;/' '7
или
= Re
/ Qpt
^P\(p + i)3 (-3)1
x(z)-2'2Redp2
(73)(-4)ePt+2Iz2LLept+ —у
(p+l) (p+l) (p+l)
t> 12 if 6t t
= Re г^е - г-хте1Г+ L(2z)5 (2z)4 (2z)3 _
12 • . 6Z . 1 2 • .
=— sin/— — cos/— - /sin/. 32 16 8
p = l
г2
1 -ppt
3 е
Р=1
150 Глава III. Теория функций комплексной переменной и операционное исчисление
5. Решить операционным методом систему дифференциальных уравнений
{х' — Z.
У — -x+y + z, z' = — 2x+j? + 2z при условиях х(0) = 0, у(0)—— 1, z(0) = 0.
Решение. Обозначим изображения неизвестных функций х(/), НО, z (О через У(р\ z(p)- Применяя к заданным уравнениям преобразование Лапласа и учитывая начальные условия, получаем
Г px(p)=z(p),
J ру(р) +1 = -х(р) +у(р) +?(р\
I Р?(р)= ~2х(р) +у(р) +2z(p),
ИЛИ
~рх(р) + z(p)=0,
- х(р)+(1-р)у(р)+ z(p)=l,
- 2х (р) + у (р) + (2 -р) Z (р) = 0.
Решая эту систему линейных уравнений (методом Гаусса или по правилу Крамера), имеем
По таблице преобразований Лапласа находим
Х=Ье*’ z(/) = Zef+уе‘.
Здесь использованы формулы
т t2 1 1 т, 1
L —=—г, Lt =—, Ll=-
2 р Р Р
и свойство запаздывания:
L
1 (Fo5,
Впрочем, х(р), у(р). z(p) в равенствах (*) уже разложены на сумму простейших дробей. Вследствие этого отпадает необходимость в применении формулы (9).
6°. Правила операционного исчисления. Таблица некоторых преобразований Лапласа
j* 3.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
151
Правила операционного исчисления
№ /(/) g(p)=]t-p'f(t)dt 0 Название
1. e + ioo eptg(p)dp 2тп J g(p) Теорема обращения
2. е —/со а>0 Й 1 Свойство подобия
3. g(p+a) Свойство смещения
4. b>0 e~ipg(p) Свойство запаздывания
5. Дифференцирование
6. f(t) I 00 изображения Интегрирование изобра-
7. p"g(p) -JP""1/(O) - жения Дифференцирование
8. t ^f(u)du g(p) оригинала Интегрирование ориги-
9. J/1 («)/г (t—u)du p gl (P)g2 (P) нала Теорема умножения
Та 0 блица некото pыx преобразов изображений аний Лапласа
№ f(t) g(p)=]e-*f(t)dt 0 Условие применимости
1. 1 1 Rep>0
2. n—целое p n! n+ 1 Re/?>0
3. e’fl‘ p 1 Re р > Re а
4. 5. 6. 7. 8. 9. sin at cos at sh at chat e~at cos co/ e~at sin art p+a a p2 + a2 P p2 + a2 a p2 — a2 P p2 — a2 p+a (p+a)2+a2 co (p+a)2+(n2 Re/?>| Imcz| Re/?>| Imcz| Rej?>| Recz| Re p > | Re a | Rep> — Re я Rep> —Refl
Глава IV
ОСНОВНЫЕ ЧИСЛЕННЫЕ МЕТОДЫ
§4.1. Приближение функции методом наименьших квадратов
1°. Метод наименьших квадратов. Пусть дана функция /(х), определенная на отрезке [а, Z>], и точки х0 = а, х1? х2, xn = b (xz<xf+1, z = 0, 1, п— 1), принадлежащие этому отрезку. Кроме того, пусть ср(х, С15 С2, Сж)— «/-параметрическое семейство функций, определенных на отрезке [а, 6].
При этих условиях часто рассматривают следующую задачу: найти набор параметров Cf, С2, С® так, чтобы определяемая ими функция ср(х, С°, С2, - С °) «наилучшим образом» приближала значения функции f в точках х0, х15 ..., хп. Последнее означает, что функция
R(Cr, С2, Ст) =
= £|Ж)-<Р(*Ь С2, Ст)\2 (1)
1 = 0
достигает минимума в точке (С°; С2; ...; С^).
Таким образом, за меру приближения функции f(x) функциями семейства <р(х, С1? С2, ..., Cw) выбрана сумма квадратов разностей (1).
Говорят, что решение поставленной задачи, т. е. функция ср(х, Ср, С2, ..., С °), получено методом наименьших квадратов.
Способ измерять отклонения заданной функции f от функции семейства (р(х, С1? С2, ..., Cw) по формуле (1) имеет серьезные преимущества перед другими способами; в некоторых случаях поставленная задача минимизации функции (1) допускает решение, описываемое простыми формулами.
Можно рассматривать аналогичную задачу о приближении функции /, заданной в области «-мерного пространства.
Основные причины, которые приводят к необходимости приближения функции методом наименьших квадратов, таковы:
£ 4.1. Приближение функции методом наименьших квадратов 153
функция /(х)— трудновычисляемая, ее свойства малообозримы, возможно, что /(х) не имеет аналитической формы задания; напротив, семейство функций ф(х, С19 С2, Ст) состоит из простых, легко поддающихся исследованию функций (например, многочленов невысокой степени, тригонометрических многочленов, экспонент и др.). Если приближение с помощью метода наименьших квадратов окажется достаточно точным, то можно заменить довольно сложную исследуемую функцию /(х) более простой функцией.
Простейшим вариантом задачи является тот, в котором функции семейства ф(х, С19 С2, Сш) зависят от параметров С19 С2, ..., Ст линейно, т. е.
ф(х, С1; С2, Ст)=С1ф1(х) + С2ф2(х) +...+Стфт(х), (2)
где ф15 <р2, ..., фт— заданные линейно независимые функции одной переменной. Тогда функция (1) принимает вид
^1(^1? ^2? ••• ? ^т) =
= X (/(xi) - С1«Р1 (*) - СгФ2 (*/) - - - Ст<рт(хд)2 (3) i=0
и является многочленом второй степени от переменных С19 С2, ..., Ст. Так как R(Cr, С2, Ст)^0 при любом наборе
вещественных чисел С19 С2, ..., Ст, то функция R достигает минимального значения (в крайнем случае — нулевого).
В случае минимума, как известно, все частные производные dR г
— должны быть равны нулю:
|^-=2X(/Gvi) -С1Ф1(хг) -С2ф2(х;) - ... -Стфт(хг))фДх;) = 0,
j=\, 2, ..., т. (4)
Уравнение (4) представляет собой систему т линейных уравнений с т неизвестными С19 С2, ..., Ст. Обозначая сумму
X <Pp(*i) Фв(*<) через apq, а сумму X Л*д <?р(хд через Ьр, получаем i=0 i=0
{^11^1 + ^12^2 + •••
^21^1 + ^22^2+ ••• + а2т^т== (5)
1 + б1т2С2 + ... Ьт.
В случае, когда система уравнений (5) имеет единственное решение (С°; С2; ...; С °), точка (Сх°; С2°; ...; С°) является единственным глобальным минимумом функции R. Этот случай является общим и представляет практический интерес.
154
Глава IV. Основные численные методы
Пусть b и с°—соответственно вектор-столбцы (Ь^, Ь2’> Ьт) и (СР, С2°, ..., С^); А—матрица системы (5), а Ф—матрица с элементами Фрд=фр(х(Г). Тогда получим Л = ФФ' и (ФФ' —
произведение матрицы Ф на транспонированную к Ф матрицу Ф').
Можно показать (см. § 4*.1, 1), что значение функции R, определяемой равенством (1), в точке (Ct°; С2°; С°) есть
=(у, у-Фс°)=£л?- XУ1 Ф/+)с? = ij
=X/2 (x0 - ЕЖ) Ф; (x0 cj°- (6)
i i,j
Таким образом, задача о наилучшем приближении методом наименьших квадратов сводится к решению системы т линейных уравнений с т неизвестными [для семейства ф(х15 С15 С2, CJ, имеющего вид (2)].
Приведем решение поставленной задачи для некоторых важных в практическом отношении частных случаев.
I. Пусть семейство функций <р(х, Съ С2) состоит из многочленов степени не выше первой, т. е.
<р(х, Сх, С2) = С1х+С2 = С1х+С21.
Функции ф1 (х) и ср2 (х) из соотношения (2) равны соответственно х и 1. Тогда система уравнений (5) примет вид
+ #i2C2 = Z?i , a2iC1A-a22C2 = b2, где = ai2=Xxi’1’ bi^RxdXi, а21=£1-хь
а22 = Х1 • l=«+l, b2 = '£j(xd'i-
Если определитель системы (5) не равен нулю, то система имеет единственное решение
bl «12 «11 Ь1
С. = bi а22 - =- й12 ^2
— «11 ^12 ? ^2 «ц <^12
^21 ^22 а21 ^22
Введем обозначения
х2=^П’ ЖЖь ХУ=^Т л+1 п+1 п+1 п+1
(черта сверху означает среднее арифметическое). Тогда получим 6ZX1 = (м4-1)х2, а12 = (л+1)х, ^22 = (Z7+1)j» bi = (n+V)xy.
62 = («+l)b a21 = (w+l)x, откуда
,£ 4.1. Приближение функции методом наименьших квадратов
155
Формулы (9) дают решение задачи о нахождении такой прямой на плоскости, для которой сумма квадратов отклонений (/(xJ-Qx.-Cj2 0 = 0, 1, п) минимальна (рис. 22).
Пример. Пусть функция f(x) — = 1/х задана на отрезке [2, 3 ] и х0 = 2, х1 = 2,1, х2 = 2, 2, х3 = = 2,3, х4 = 2,4, х5 = 2, 5, х6 = 2,6, х7 = 2,7, х8 = 2,8, х9 = 2,9, х10 = = 3. В классе функций <р(х15 С15 найти ту, которая наилучшим образом в смысле наименьших квадратов приближает / (х) в точках х-.
Решение. Составим таблицу
i X У x2 xy у2
0 2 0,5 4 1 0,25
1 2,1 0,476 4,41 1 0,227
2 2,2 0,454 4,86 1 0,206
3 2,3 0,435 5,29 1 0,189
4 2,4 0,417 5,76 1 0,174
5 2,5 0,400 6,25 1 0,160
6 2,6 0,385 6,76 1 0,148
7 2,7 0,370 7,29 1 0,137
8 2,8 0,357 7,84 1 0,127
9 2,9 0,345 8,41 1 0,119
10 3,0 0,333 9,00 1 0,111
2,5 0,406 6,35 1 0,168
В последней строке таблицы приведены средние арифметические по столбцам. Согласно формулам (9), находим
„ 1-1,015 -0,015 П1_ „ 2,578-2,5 0,078
1 6,35 — 6,25 0,1 2 6,35-6,25 0,1
Итак, наилучшим приближением является функция у= -0,15х+0,78.
II. В случае, когда семейство функций ср (х, С15 С2, ..., Ст) представляет собой множество многочленов степени не выше т— 1, т. е.
<р(х, С1; С2, .... Ст)=С1хт-* 1 + С2хт-2 + ... + Ст, (10)
числа apq в системе уравнений (5) таковы:
X £ xjm-p-q (p,q= 1, 2, m), (11)
i = 1 i = 1
156
Глава IV. Основные численные методы
поскольку функции <pt (х), <р2 (-х), Ф„,(х) равны соответственно
хт~*, хт~2, 1.
Матрица системы (5) принимает вид
Л = (и+1)
v2m — 2 Л ..2т — 3 Л •. .. х™-1 ? (12)
х2т~ 3 у2т — 4 .. хт 2
хт“1 vm~2 Л • .. х°
п где Xs означает £ х|/(и+1), т. е. среднее арифметическое значений xf (5 = 0, 1,2, ..., 2т — 2).
Вектор-столбец свободных членов b{bY; b2; Ьп) имеет п
компоненты bp= £ ~р (p^l, 2, ..., т). Обозначив i = 0 п
yi=f(Xi) И хт-Ру=-Г^ yiX^p, получим W+1 i = 0
F=(n+l)(xm-1y, хт~2у, у). (13)
Искомый вектор-столбец (’’(С0; С?; С°) удовлетворяет
матричному уравнению
Лс° = £; (14)
если матрица А невырождена (на практике это всегда так), то с() = А~1е. (15)
где Л-1 означает матрицу, обратную к (12).
III. Пусть семейство <р(х, а0, а2, ..., ат, Ь2, Ьт) состоит
из функций вида
<р(х, а0, аи а2, ат, Ьг, Ь2, Ьт) =
т
=—-1 + akcoskx + bksinkx. (16)
2 k=i
Задача о приближении функции f(x) на отрезке [0, 2я] с помощью функций (16) рассматривается в теории рядов Фурье.
2 л
Если функция /(х) такова, что существует J/2(x)dx, то, °
как нетрудно доказать (см. § 4*.1, 2), тригонометрический многочлен (16) с коэффициентами
§4.1. Приближение функции методом наименьших квадратов
157
2n
f (x)coskx dx,
о
«о = т- /(*)dx, ak=-ZTl I ТС
2 л i г t...
2к J’ О 2л
bk = - /(х) sin foe dx [k = 1, 2, ..., m) 7C I
О
«наилучшим образом» приближает функцию /(х) в том смысле, что функция
R(a0, аг, .... ат, Ьх, Ь2, .... Ьт) = 2 л Г/ \2
= 1/(х) —у— Y,akcoskx —bksinkx j dx о
(17)
(18)
достигает минимума в точке с координатами, определяемыми равенствами (17).
В этой задаче «наименьшие квадраты» понимают не как сумму квадратов отклонений в заданных точках xt (z=0, 1, и),
а как интеграл от квадрата отклонения — конечная сумма заменена на предел интегральных сумм.
В заключение заметим, что решение задачи о приближении функций методом наименьших квадратов значительно усложняется в том случае, когда семейство функций ср(х1? С1? С2, ..., Cw) зависит от С1? С2, ..., Ст нелинейно. В этом случае система уравнений С2, ..., Cm) = 0 (z= 1, 2, ..., т) оказывается не-
линейной, вследствие чего такая задача, как правило, не допускает явного аналитического решения.
2°. Ортонормированная система функций и задача о приближении. Задача о приближении функции тригонометрическим многочленом, рассмотренная в п. 1°, допускает естественное обобщение.
Пусть на отрезке [я, Ь} задана функция р(х)>0, называемая весом. С помощью этой функции можно определить скалярное произведение, а именно, для всякой пары функций /(х) и g(x) на отрезке [a, Z>] положим
ь
g)=fp(x)f(x)g(x)dx’ (I9)
а
где (/, g)— скалярное произведение. Пусть, далее, <pt (х), <р2 (х), ... ..., сри(х) — последовательность функций на [а, Ь] таких, что
(ф.(4фЛ^)) = 8(;={1 (20)
158 Глава IV. Основные численные методы
(ортонормированная относительно скалярного произведения (19) система функций).
Тогда при описанных предположениях можно поставить задачу о приближении функции /(х) линейными комбинациями вида
Ci Ф1Т С2 Ф2 ••• Н-(21)
Мерой приближения функции /(х) функциями (21) считается величина
ъ
/-SG9i)=jpM(/-£G<Pi)2dx- (22)
а
Решение этой задачи, т. е. числа С15 С2, С„, мини-
мизирующие выражение (22), можно найти по следующим формулам:
ь
Ci=(f, <Pi (%))=fp (*)/(*) <Pi (*)dx- (23)
a
Обратим внимание на то обстоятельство, что скалярное произведение (/, ф£) можно рассматривать как проекцию функции f на функцию ф,- (мы считаем функции элементами линейного пространства со скалярным произведением). Дей-п
ствительно, сумму 0 = £ (/, ф1-)ф/ можно рассматривать как i=l
проекцию функции f на линейное m-мерное подпространство $т с базисом ф19 ср2, ..., <pw, поскольку 0 принадлежит подпространству, a f—Q ортогональна подпространству Sm:
(/-6, Фк) = (/-Хс>Фг> Фк)=(/ <Pk)~Ck=(f, Ф*)-(/’ Фи)=°- (24) Такая точка зрения позволяет толковать решение задачи как проекцию функции f на подпространство Sm.
У рассмотренной задачи имеется простой конечномерный вариант: пусть в конечномерном евклидовом пространстве L задан вектор £ и линейное подпространство Lm; требуется найти такой вектор 0е£ш, для которого длина вектора £, — 0 минимальна. Решением этой задачи является вектор 0, равный проекции вектора £ на подпространство Lm.
Если последовательность функций ф15 ф2, ..., фт, ... обладает кроме свойства ортонормированности (20) еще и свойством полноты (см. § 4*.1, 3), то приближения (21) с ростом т становятся все более точными и
(т т \
/-ЕЛФН-О (25)
i=l i=l /
(мера отклонения стремится к нулю).
£ 4.1. Приближение функции методом наименьших квадратов 159
Задача о приближении функций тригонометрическими многочленами является частным случаем общей задачи о приближении функции линейными комбинациями ортонормированных функций <р1? ф2, ..., фш, ... . Действительно, функции
——, — sin£x, — coskx (к = 1, 2, ...) (26)
удовлетворяют условию ортонормированности и полноты на отрезке [0, 1 ] относительно скалярного произведения
2п
(/>#)= 1/(*)#(*)dx- (27)
о
Среди различных ортонормированных последовательностей функций особое значение имеют ортонормированные последовательности многочленов.
Ортонормированную последовательность многочленов можно построить исходя из последовательности
<Pi = l, <р2 = х, (р3 = х2, ..., <pm = xm-1, ... (28)
и используя метод ортогонализации (см. том 1, § 1*.2).
Для скалярного произведения (/, g) = f f(x)g(x)dx [вес р (х) = 1 ] последовательность ортонормированных многочленов, полученная из (28) с помощью процесса ортогонализации, такова:
Ро ~ Со Ро = С о • 1, р1 = С1Р1 — С1х,
-х2-1к р3 = С3Р3 = С3(-х3--х\,
^4 = С4Р4 = С4(^х4-Нх2 + |\ ... рк=СкРк, где
Ро=1, Рк = х, Рк+1 = ^хРк-^Рк_к, Ск=1^, к=1,2, ...
(29)
Можно доказать, что
Многочлены Рк называются многочленами Лежандра.
Другой известной ортонормированной последовательностью многочленов являются многочлены Чебышева:
(х) = cos (п arccos х). (30)
160
Глава IV. Основные численные методы
В частности,
Го=1, Тх = х, Т2 = 2х2-1, Т3 = 4х3 — Зх, Т4 = 8х4-8х+ 1, ...
Эти многочлены взаимно ортогональны с весом р(х) — = 1Д/1 -X2, т. е. !
ТкТ,--!--dx=0 при к^1. (31)
J
При ЭТОМ ~ 1
Ск = (Тк, Тк)= f T2-L=dx=^. (32)
J V1 х
-1
Последовательность многочленов Т11У/с^ Т21у/С2, ..., Тк1у/Ск, ..., является ортонормированной.
Многочлены Тк(х) наименее отклоняются от нуля на отрезке [—1, 1] в том смысле, что максимум абсолютного значения каждого из Тк на этом отрезке имеет наименьшее значение по сравнению с любым многочленом соответствующей степени с вещественными коэффициентами и коэффициентом 1 при старшем члене.
§ 4.2. Интерполяция. Интерполяционный многочлен Лагранжа. Линейная интерполяция
1°. Интерполяционный многочлен Лагранжа. Пусть на отрезке [я, b ] определены функция f (х) и семейство функций
' <р(х, Со, С1; С2, Cm), (1)
зависящее от т+1 параметров Со, С1? С2, Ст; пусть, кроме того, х0 = а, х15 х2, ..., xm_1,xm = b (xf<x£+1; z = 0, 1, 2, ..., m—1)—множество из m+1 точек отрезка [а, b ] (они называются узлами интерполяции).
Требуется найти такую функцию вида (1) (т. е. определить значения C0 = Cq, С1 = С?, С2 = С2, СШ=С°), чтобы
/(х;)=ф(хр С°о, С?, .... С°т), i = 0, 1, 2, ..., т. (2) Сформулированная задача называется задачей интерполяции функции /(х) в классе функций (1).
Определение. Формула, сопоставляющая функции f (х) функцию ср(х, Со, С?, ..., С°) вида (1) так, что выполняются условия (2), называется интерполяционной формулой.
Интерполяционной формулой Лагранжа называется формула, которая всякой функции f (х) сопоставляет многочлен
т
LM- X fM П Ft- <3)
£ 4.2. Интерполяционный многочлен Лагранжа Линейная интерполяция
161
Таким образом, речь идет об интерполяции функции f (х) в классе многочленов степени меньшей или равной т, т. е. функций вида
ф(х, С15 С2, Ст)—Сохт + С1хт~1 + ... + Ст. (4)
Произведение П^/(х-) в равенстве (3) при заданном 1 1 X; — X ;
I есть произведение множителей, соответствующих значениям 0, 1, 2, z— 1, z-F 1, m.
В частности, при т = 1 интерполяционная формула Лагранжа принимает вид
Л(х)=/(х0)£^-+/(х1)^-, (5)
Xq Aj Aj Xq
а при m = 2 — вид
Если функция / (x) имеет непрерывную производную порядка т+1, то остаточный член интерполяционной формулы Лагранжа, т. е. /(x) — LOT(x), можно представить в виде
f(x)~Lm(x) J— ® сот (х), (7)
\т + 1)!
где £ принадлежит отрезку [min(x0, х), rnax(xm, х)], т
а ®т(х)=Пх“х;-
1 = 0
Величина остаточного члена зависит, кроме значений функции /(ш+1)(£,), еще и от cow(x) и разбиения х0 — tz, х1? х2, ..., хт = Ь. Представляет интерес такой выбор узлов интерполяции, при котором sup|cow(x)| был бы наименьшим. Оказывается, что наилучшим в этом смысле выбором узлов интерполяции является набор хг = а9 х2 = xm_t = ^, связанный с корнями многочленов Чебышева.
Доказательство справедливости формулы (3) можно привести непосредственно проверкой равенства /(хг.) = £ш(х). Оценка остаточного члена (7) и подробности, связанные с формулой (3), см. в §4*, 2, 1.
Примеры. 1. Построить интерполяционный многочлен Лагранжа для функции /(х)=|х| на отрезке [ — 2,2], взяв в качестве узлов интерполяции точки х1=—2, х2= —1, х3 = О, х4=1, х5 = 2.
6 Мантуров О.В.
162
Глава IV. Основные численные методы
Решение. Используя формулу (3) при т = 4, получим
2(х+1)(х)(х—1)(х—2) 1 (х+2) (х) (%—1)(% — 2)
(—1) (—2) ( —3) (—4) + 1(_1)(_2)(-3)
1(х+2)(х+ 1)(х)(х-2) 2(x+2)(x+l)(.x)(x-l)_ 3-2*1 (-1) 4-3'2'1
=—(2х4—4х3 —2х* 2 + 4х—4х4+4х3+ 16х2— 16х— 4!х
— 4х4 —4х3+ 16х2 + 16х+2х4+4х3 —2х2 —4х) =
График функции L4(x) изображен на рис. 23.
2. Построить интерполяционный многочлен Лагранжа L2 для трех узлов xr — h, х1? x1-\-h.
Решение. Согласно формуле (6), имеем
у \V
, f(v \ (x-Xl+h)(X-Xl-h)
2 - J11'
z\ +/(X1+M^+/,Hx-^)=-Lx 7 A \ J v 1 ’ 2h-h 2h2
--г \j x x {(х-х1)2[/(х1-/г)-2/(%1) + \ +/(%! +A)] + (x-xt) h [-f{xt -
\ -h)+f(x1+h)'] + 2h2f(x1)}.
21 2°. Понятие о линейной интер-
Рис. 23 полиции. Если семейство функ-
£ 4.3. Решение линейных систем методом Гаусса 163 ций <р(х, Сх, С2, Ст), из которого требуется выбрать функцию, удовлетворяющую условию (2), имеет вид
<р(х, Сх, С2, Ст) = С1ф1(х)+С2ф2(х) + ... + Стфт(х), (6) т. е. линейно зависит от С1? С2, ..., Сш, то соответствующую задачу интерполяции называют задачей линейной интерполяции.
Условие (2) приводит к системе линейных уравнений с т неизвестными
</(Л1) = С1ф1(л1) + С2ф2(х1) + ... + Стфт(х1),
I /(^2) = С1ф1(х2)+С2ф2(х2) + ... + Стфт(х2), (7)
/ W ф! (хт)+С2 Ф2 (хт)+... + стфт (хш).
Очевидно, что семейство функций (4) имеет вид (6) при Ф^х"*-1, ф2 = хт~2, фт=1.
Таким образом, задача интерполяции, решением которой является многочлен Лагранжа, принадлежит к числу задач линейной интерполяции.
§ 4.3. Решение линейных систем методом Гаусса
О пре де ление 1. Система уравнений относительно неизвестных х15 х2, ..., хп. имеющая вид
" а11х1^а12х2 + ... + а1пхп = Ь1,
J a21xt + a22x2-]- ... + a2nxn = b2. (1)
Х1 ’“t" &т2Х2 4“ •” 4“ ^тпХп называется системой линейных уравнений.
Символами aih bt (7=1, 2, ..., т; 2, ..., и) обозначены заданные числа; если все (z= 1, 2, .... т) равны нулю, то система (1) называется однородной, в противном случае—неоднородной.
Теория систем линейных уравнений изложена в томе I (см. § 1.9).
В этом параграфе будет рассмотрен алгоритм решения системы (1), т. е. указаны точные предписания, следуя которым можно найти все решения системы (1) или установить ее несовместность. Этот алгоритм называется алгоритмом Гаусса (или методом Гаусса). Алгоритм Гаусса позволяет последовательными преобразованиями превратить исходную систему уравнений в эквивалентную ей систему уравнений вида 6*
164
Глава IV. Основные численные методы
+^12^2 “Ь ••• + ~Ь^1,г+ i*r+1 +... + ^i„xn — Ь1,
^22^2 + ••• + ^2г-^г + ^2,г+ 1Л-+ 1 + ••• + ^2п^п —^2?
аггхгИ-*+1 хг£ Я- ...-У агпхп Ьг. (2,) О =br+lt
о = Ьт.
где йц/О, я22^О, ..., drr^0.
Будем называть систему уравнений (2) ступенчатой системой. В ней неизвестные хп х2. .... хп представляют собой прежние неизвестные х1? х2, .... хп с измененной нумерацией, причем по ходу вычислений ясно, какая именно перенумерация имеет место.
В системе (2) коэффициенты аи (т. е. коэффициенты при Xj в i-м уравнении) равны нулю, если i>j и i>r. а коэффициенты аи (i= 1, 2, ..., г) отличны от нуля.
Системы уравнений (1) и (2) имеют решения тогда и только тогда, когда Ьг+1=Ьг+2 = ... = Ьт = 0. При этом последние т — г уравнений системы превращаются в тождество 0 — 0 и могут быть опущены. Это означает, что система (2) эквивалентна системе уравнений
du +512^2 ••• аихг + Й£,Г+1-Xr+1 +... + dinxn — Z?1?
^22^2 ++^2г^г + ^2,г+1Л+1+--- + ^2и^и = ^2’
а?у Ху I аГч у -j- £ Ху _|_ £ I ... I arnxn by.
где г—ранг системы и ац^О. а22^0. .... drr^0.
Итак, алгоритм Гаусса «перерабатывает» исходную систему уравнений (1) в систему (3), эквивалентную системе (1), или устанавливает по ходу вычислений несовместность системы (1).
Каждый шаг алгоритма Гаусса заключается в том, что одна система уравнений преобразуется в другую: после к-го шага система преобразуется в Sk; системой So является данная система (1). Коэффициенты системы Sk обозначим через а^ свободные члены—через Ь$к)9 неизвестные—через xjk)(j=l, 2. .... п). На каждом шаге вычислений неизвестные х(к) представляют собой исходные неизвестные хр перенумерованные особым образом; а^. Ь^ равны соответственно aij и bt. Коэффициенты bt в системе (3)—это коэффициенты а%\ bf} при некотором к.
4.3. Решение линейных систем методом Гаусса 165
Алгоритм Гаусса предусматривает выполнение на каждом шаге следующих операций:
1) исключение из системы уравнения вида 0 = 0;
2) прибавление к обеим частям одного из уравнений системы соответствующих частей другого уравнения, умноженных на подходящее число;
3) перенумерацию неизвестных.
Опишем правила, следуя которым можно от системы (1) перейти к системе
Е = 2’ (4)
j=i
для которой выполнено условие а набор х^, х{2\ х^1}
является перестановкой переменных х1? х2, хп (или, что то же самое, х?, х2, х°), либо установить, что система (1)
несовместна.
Если t/ц/0, то система (1) уже имеет вид (4). Если же ац=0, то рассмотрим коэффициенты аГ2, •••? ain- В том случае, когда все эти коэффициенты равны нулю и Z?x = 0, первое уравнение имеет вид 0 = 0 и исключается из числа уравнений. В случае, когда все коэффициенты я12, ..., а1п
равны нулю и Ь1^0, система (1) несовместна.
Пусть среди чисел я12, я13, •, ain имеются ненулевые и als—первое из них не равное нулю. Перенумеровав переменные x{i}^xs. х^1) = х1, x[l) = xf (z/1, z/^), получаем систему вида (4).
В результате описанных операций приходим к одному из трех случаев: либо к системе вида (4); либо к некоторой системе S', содержащей на одно уравнение меньше, чем система (1); либо к несовместной системе, содержащей уравнение 0 = Z)15 br т^О. В первом и третьем случаях мы достигли цели, а во втором случае снова применим к системе S' описанные выше операции. После конечного числа применений указанных выше операций получим одно из двух: либо систему вида (4), либо несовместную систему, содержащую уравнение 0 = 6, 6/0 (случай, когда все коэффициенты в системе
(4) равны нулю, мы исключили из рассмотрения).
Обозначая системы уравнений (Г) и (4) соответственно через So и 51? будем писать S1=F(S0), понимая под этим равенством тот факт, что система получена из системы So применением правил F
Описанные выше преобразования F переводят систему (1) в систему (4) (или устанавливают несовместность системы). Эти преобразования составляют первый шаг вычислений с помощью метода Гаусса.
166
Глава IV. Основные численные методы
В результате преобразований второго шага получим систему уравнений
$2 Л
М<42)+^^ V. JL 1 Л J. XX 1 J J А Г1 fl Л
42>х<2> + а<2>42> +... + а(2)х<2) = b <2>, XXX X О 0 X П /7 X
(2) (2) . (2) (2) , । (2) (2) __ l (2)
и32Л2 * U33A3 ’ ‘ иЗиЛи ~и3 ’
(5)
$2
(2) (2) । (2) (2) , , (2) (2)__/Л2)
ит22Л2 'ит23Л3 ит2пЛп ~~ U
где или установим, что система (1) несовместна.
Для преобразования системы (4) в систему вида (5) умножим обе части первого уравнения системы (4) на числа —cz2i/^ii9 “^31/^115 iMii и прибавим результаты к соответст-
вующим частям второго, третьего и т. д. уравнений. Итогом этих действий и является система уравнений вида (5), хотя, возможно, условие окажется невыполненным. Одна-
ко, применяя к системе S'2 преобразования F, получим систему 52, для которой выполнено условие я(222#0 (либо установим, что система S'2 несовместна, либо убедимся в том, что 5 2 состоит из уравнений 0 = 0, на чем исследование завершится).
Итак, в результате второго шага получится система 52, состоящая из уравнения s2 и системы S'2. Будем употреблять запись S'2 = G (St) и понимая под этим то обсто-
ятельство, что уравнение s2 и система 5"2 получены описанными выше правилами из системы St. Следовательно, G и g означают правила, переводящие систему в систему S2.
Третий шаг состоит в преобразованиях системы S'2 в систему, состоящую из уравнения ^з:=^(5’2) и системы уравнений S"3 = G(S"2). Правила преобразований те же, что и в случае перехода от к S2.
Таким образом, система уравнений S2 переходит в систему 53 вида
*3{*(2^ v хх х ха хг» х
г „(3) (3) . . (3) v(3) L (3)
5 У U33A3 ' и3плп и3 ">
<6>
^3 Л .. ........... .....
1<)343)+-+<)з^(3)=^г
причем 6z333/0.
J 4.3. Решение линейных систем методом Гаусса 167
Затем система 5"з преобразуется к уравнению ^4=g(5'3) и системе S\ = G{S'^\ и т. д. На некотором шаге система уравнений Sk+± = G(Sk) окажется пустой. Тогда система Sk примет, очевидно, вид (3):
(разумеется, так будет только в том случае, когда система (1) совместна; в противном случае на некотором шаге обнаружится уравнение 0 = Z?5°, гДе Известно (см. том I,
§ 1.9), что системы уравнений (1) и (3) эквивалентны.
Множество решений системы (3) [совпадающие с множеством решений системы (1)] можно описать следующим образом. Переменные хг+1, Л+2> •••? хп называются свободными; им можно придавать любые значения. При этом неизвестные х15 х2, ..., хг однозначно определяются системой уравнений (3). Таким образом, общее решение системы (1) зависит от п — г произвольных ПОСТОЯННЫХ Сг+1, Сг + 2? •••? сп — значений свободных переменных хг+1, хг+2, хп.
Заметим, что не всякий набор из п — г исходных неизвестных можно рассматривать как набор свободных переменных.
Примеры. 1. Решить методом Гаусса систему уравнений
*$о
xi + х2 + 2х3 + Зх4 = 2, х^ + х2 4“ Зх3 Н- 4х4 = 6, Xi + х2 4- 9х3 4- 4х4 = 6,
(а)
х3 + х4 = 4, х1+х24- х34-2х4=—2.
Решение. Первый шаг. В системе So коэффициент а±1 = 1^0. Система So без изменений на первом шаге становит-
ся системой Sr С1и)==а(н^ =
Л IJ IJ l I I I
Второй шаг. Умножая обе части первого уравнения на — 1, — 1, 0 и —1, а затем прибавляя результаты к соответствующим частям второго, третьего, четвертого и пятого уравнений, приходим к системе
х1+л2 + 2х3 + Зх4=2,
х3+ х4 = 4, х3+ х4 = 4, х3 + х4 = 4,
(б)
-х3- Х4=-
168
Глава IV. Основные численные методы
Второй шаг еще не закончен, поскольку коэффициент а^2 в последней системе равен нулю. Произведем перенумерацию переменных. Так как из коэффициентов a^l первым отличным от нуля является я(223}, то положим х(22) = х3, х(32) = х2, х(2) = х4, х^2) = х4. Тогда система (б) примет вид
+ 2х(22) + х 32) + Зх^2) = 2,
(2) I т(2) = 4
М х™ +^)-4 (В)
л2 । л4 —*+,
-Х</> _ х(2)= -4.
Третий шаг. Умножая второе уравнение системы (в) на — 1 и 1, а затем прибавляя результаты к третьему и четвертому уравнению, получаем
р<3) + 243)+43» + 3х^ = 2, х(23> + х^3) = 4,
0=0, 0=0
(г)
Последние два уравнения исключаем. После этого система (г) примет вид (3).
Решения системы (г), а значит, и данной системы (а), таковы:
г(3) I 7 (3) _ п _ (3)_ о (3) (3) _ А — г(3) .а- । х* >/v 2 — Д- *
Подставляя х(23) из второго равенства в первое, имеем
U3)- —6— Y<3>— Y<3> Y<3> —4— Y<3)
•Л/ 1 — “T Jv 3
где x(33) и х^3)принимают произвольные значения. Возвращаясь к исходной нумерации, получим
xt = —6 —х2 —х4, х2 = 4—х4.
2. Используя метод Гаусса, решить систему уравнений
xt + х2
+ 2х4—1,
So
Xi+ х2+ х3+ 5х4 = 3, 2хх + Зх2 + х3+ 8х4 = 7,
ч.4х1 + 5х2 + 2х3 + 15х4= 15.
Решение. Первый шаг. В системе So коэффициент ^11 = 1 т^О. Система So без изменений на первом шаге становится системой St: = b{^ = b{2\ х^1) = хФ) (z,j= 1, 2, 3, 4).
Второй шаг. Умножая обе части первого уравнения системы So на —1, —2 и —4, а затем прибавляя результаты
f 4.4. Итерационные методы решения уравнений
169
к соответствующим частям второго, третьего и четвертого уравнений, получаем
"х1+х2 + 2х4=1,
х3 + 3х4 = 2,
х2+х3 +4х4 = 5, х2 + 2х3 + 7х4= 11.
Второй шаг завершается перенумерацией переменных (для достижения условия хр = х1? х(22) = х3, ху = х2, х^2) = х4.
Таким образом, приходим к системе
<х(2) +х<32) + 2х^-1,
I х<22) + Зх™ = 2,
821 х(22) + х<32) + 4х^-5,
. 2х(22) + х(32Ч7х^ = 11.
Третий шаг. Умножая второе уравнение системы S2 на — 1 и —2, а затем прибавляя результаты к третьему и четвертому уравнениям системы 52, получаем систему
^х<3) + х<33) + 2х£* = 1,
х(22) + Зх^3) = 2,
4
3 х<33>+ х^3) = 3,
х<33) + х<^1.
Поскольку а(3^==1^=0, третий шаг закончен.
Четвертый шаг. Умножая третье уравнение системы S3 на —1 и прибавляя результат к четвертому уравнению, имеем
Гх(4) + х<34) + 2х^=1,
I х<р + 3x^ = 2,
4 | х<4)+ 44>=з,
0=2.
Эта система содержит уравнение 0 = 2, т. е. является несовместной.
§ 4.4. Итерационные методы решения уравнений
1°. Решение уравнений с помощью итераций. Для численного решения уравнения
/(х) = 0
(Г)
170
Глава IV. Основные численные методы
Рис. 24
применяют итерационные методы, сущность которых в общих чертах состоит в следующем.
Уравнение (1) преобразуют в уравнение вида
х=ф(х), (2)
равносильное исходному. Затем рассматривают последовательность чисел
х0, х1 = ф(х0),
х2 = ф(хх), х„+1 = ф(х„), ....(3)
При некоторых условиях последовательность (3) сходится к решению х уравнения (2).
Построение последовательности (3) связано с многократным вычислением значений функции ср. При этом результат предыдущего вычисления хп является значением аргумента функции Ф при вычислении последующего значения хп+1 = (р(хп), п = 0, 1, 2, .... Последовательность таких вычислений называется
последовательностью итераций функции ф.
Итерационный процесс удобно иллюстрировать графически. На рис. 24 изображена ломаная линия, построенная следующим образом. Она начинается в некоторой точке х0 оси абсцисс и направлена по вертикали до пересечения с графиком кривой ^ = ф(х) в точке А±; здесь начинается горизонтальный участок ломаной, который продолжается до пересечения с биссектрисой у = х в точке Вг ; далее следует вертикальный участок ломаной до пересечения в точке А2 с графиком у = ф(х), затем — горизонтальный участок до пересечения в точке В2 с биссектрисой у = х и т. д. Абсциссы точек В19 В2, ..., Вп, как
легко видеть, совпадают с числами х1? х2, ..., хп9 ... из последовательности итераций (3). На рис. 25 изображен случай, когда точки В19 В2. Вп, ... сходятся к точке В пересечения линий у — х и ^ = ф(х). Координаты х, у точки В являются решением уравнения (2).
Не следует считать, что последовательность (3) всегда сходится к решению уравнения. На рис. 25 изображен случай, когда точки х1? х2, ..., хп, ... последовательности (3) удаляются от точки х.
Укажем одно геометрическое условие, достаточное для сходимости последовательности (2) к решению х. На рис. 26 изображен квадрат с вершинами в точках (х —А; х—А), (х — h; х+А), (х + А; х —A), (х + А; х + А) и две прямые у — х = к1(х—х) и у — х = к2(х — х), проходящие через точку (х; х). Пусть
£ 4.4. Итерационные методы решения уравнений
171
Рис. 25
Рис. 26
\>к2>к1> — 1 и D—область точек с координатами х, у, удовлетворяющими условиям х^х^х + Л, х — h^y^x + h, к± (х — + к2 (х — х) + х или х—'Л^х^х, х — h^y^x + h, к2(х — x) + x^j?^fc1 (х — х) + х. Эта область на рис. 26 заштрихована. Пусть график функции ф(х), удовлетворяющей уравнению (2), принадлежит заштрихованной области. Наглядно очевидно, что ломаная, описывающая последовательность итераций, неограниченно приближается к точке (х; х), если начало ломаной находится в промежутке от х — h до х + Л.
Аналитические условия, достаточные для сходимости последовательности (2), связаны с принципом сжатых отображений (см. § 4*.4, 1).
Применительно к рассматриваемому случаю справедлив такой вариант этого принципа Пусть ф(х)—функция, отображающая отрезок [а, b ] в себя и такая, что для любых х1? х2 g [а, b ] выполнено неравенство
|<p(x1)-<p(x2)l<g< |
I —х2 I
(4)
Тогда для любого хое [а, b ] последовательность х0, х1 = ф(х0), х2 = ф(х1), ..., хл+1 = <р(хи), ... сходится к числу х, которое является единственным решением уравнения х=ф(х) на отрезке [a. b ].
* х3 7
Пример. Пусть дано уравнение —+х — -=0. Перепишем 6 . 6
его в виде
7
Х = —
6
(*)
172
Глава IV. Основные численные методы
7 х3
На отрезке [0,75; 1,25] функция ф(х) = -—- убывает, поскольку
ее производная ср' (х) = ——= — — отрицательна. Максимум модуля производной ф'(х) на этом отрезке достигается в точке 25 25
х = 1,25 и равен -----=—<1. Поэтому, используя теорему
16-2 32
Лагранжа, имеем
ф(х2)“ф(х1)=:/,(с)(xi— *2)5 0,75<с< 1,25
<p(*2)-<p(xl)
Х2— -Х1
1.
Так как функция ф(х) переводит отрезок [0,75; 1,25] в себя, то в силу сказанного последовательность (3) сходится к решению х уравнения (*) для любого хое [0,75; 1,25].
Пусть хо = 0,75; тогда х± = 1,097, х2 = 0,947, х3 = 1,006, х4 = 0,998, х5 = 1,001, х6 = 1,000, хп = 1,000. Вычисления проведены с точностью до третьего знака: х= 1,000. В действительности, как легко видеть, х= 1 является точным (а не приближенным) решением уравнения.
Для применения указанного метода необходимо, хотя бы в грубых чертах, предварительно провести исследование вопросов о существовании и расположении корней уравнения. Так, в рассмотренном примере вычисления начались после того, как были проверены достаточные условия применимости метода итераций на отрезке [0,75; 1,25].
Уравнение /(х) = 0 можно привести к уравнению вида х = ф(х), эквивалентному исходному, различными способами; в частности, уравнение /(х) = 0 эквивалентно уравнению х = ф(х), где ф(х) = х+/с/(х), 0—произвольное вещественное число (этот способ был применен при к = 1 в расмотренном выше примере).
Другим способом перехода от уравнения /(х) = 0 к уравнению х = ф(х) является выбор в качестве ф(х) функции
Дх) /'(х)
Тогда данное уравнение /(х) = 0 заменится равносиль
ным ему уравнением
/ \ /(х)
ф(х)-х-№)
При соблюдении некоторых условий, которым должна удовлетворять функция ф(х) на отрезке [я, b ], вычисление решения уравнений /(х) = 0 или х=ф(х) возможно с помощью схо-
4.4. Итерационные методы решения уравнений
173
дящейся последовательности итераций: х0 g [a. b ], %i = <р (х0),
х2 = <р 01),..., Х„ + 1 = ф (х„), ... Этот метод называется методом Ньютона и допускает наглядное геометрическое истолкование.
Пусть функция /(х) дважды дифференцируема на отрезке [а. b ], причем /(я) и f(b) имеют разные знаки, а /' (х) и f"(x) сохраняют знак на [а, b ]. Из двух значений f(a) и f(b\ имеющих различные знаки, выберем то, которое совпадает со знаком и обозначим через х0 аргумент или f(b) (т. е. х0 — если /(я)/"(х)>0, и х0 = (х)<0)- Построим последовательность х0, х1 = <р(х0), х2 = ф(х1),... . Как видно из рис. 27, значение xw+1 является абсциссой точки пересечения с осью х касательной, проведенной к графику функции y=f(x) в точке (хи;/(хп)) (это доказано в § 4. *4, 2). В силу сделанных предположений, значение xw+i лучше приближает искомое число х, чем х„,—это хорошо видно из чертежа. Проверка выполнения достаточных условий сходимости итерационной последовательности выполнена в § 4*.4, 3. По очевидным геометрическим причинам метод Ньютона называют также методом касательных.
При условии сходимости итерационной последовательности процесс вычисления корня уравнения f(x) = O можно ускорить, если совместить метод касательных с некоторыми дополнительными построениями. Такой комбинированный метод называется методом хорд и касательных.
Пусть для определенности /(а)<0,/(£)>(),/"(х)>0. Тогда последовательность х0, xt = (р (х0), х2 = ср (xt),..., где <р (х) = Дх)
= x—±^—L, построенная методом касательных, стремится к ис-f'(x)
комому значению справа (рис. 28).
Полезно также построить последовательность х0, х1?...,х„, ..., сходящуюся к х слева. Это можно сделать так. Положим х0 = а и определим х„+1 как абсциссу точки пересечения с осью х хорды, соединяющей точки и (хл;/(х„)). Несложный
расчет показывает, что
Рис. 27
второй производной /" (х), выбранного значения f(a) и хп = Ь, если
~ _ДЬ)хп-Дхп)Ь
B + 1
Вывод формулы (5) дан в § 4*.4. 4.
(5)
174
Глава IV. Основные численные методы
Пример. Методом хорд и касательных найти корень уравнения х3 — х +1 = 0.
Решение. Здесь /(х) — =х3—х+1. Положим ф(х) =
х3 — х+1 2л:3 — 1 Зх2 —1 ~Зх2-Г
ф(х)=х—
Функция
/(х) принимает значения разных знаков в точках — 2 и —1:/( —2)= —5,/(—1)=1. На отрезке [ — 2, — 1 ] производная /' (х) = Зх2 — 1 сохраняет знак: /'(х)>0, вторая производная /" = 6х также сохраняет знак: /"(х)<0.
Рассмотрим последовательность чисел х0=—2, х1 = ф(х0), х2 = ф(х1),... . В результате вычислений получим хх = — 1,545454; х2=-1,359615; х3 =-1,325801; х4= -1,324719; х5=-1,324718; х6=-1,324718.
Таким образом, искомое решение с точностью до шестого знака после запятой равно —1,324718.
2°. Решение систем уравнений с помощью итераций. Итерационные методы применяются также и для решения систем уравнений. Пусть дана система линейных уравнений, имеющая вид
' а11х1+а12х2+ ... +а1пхп=Ь1, «21X1 +«22^2 + ... +a2nxn = b2,
. «„ix1 + a„2x2+ - +annxn = bn.
Эта система, как известно, эквивалентна векторному уравнению
Ах = Ь. (7)
где x = (xt; х2; ...; хи) и b = (br\ b2; ...; Ьп) — вектор-столбцы, А — матрица системы (6).
Очевидно, что при любом вещественном к^О уравнение
(7) эквивалентно уравнению
х = х+к(Ах — Ь). (8)
Обозначив вектор х+к(Ах—Ь) через Фх, рассмотрим последовательность векторов
хо = 0, х± = Фх0, х2=Фх1,...,хп+1 = Фх„,... . (9)
$ 4.4. Итерационные методы решения уравнений
175
Можно доказать (см. § 4*.4, 5), что последовательность (9) при достаточно малых к сходится в случае, когда собственные значения матрицы А вещественны и имеют одинаковые знаки. При этом необязательно начинать последовательность (9) с хо = 0. Если каким-то образом известно грубое значение решения системы, то взяв в качестве х0 этот вектор, мы сократим количество вычислений до момента стабилизации членов последовательности (9).
Что касается выбора числа к в равенстве (8), то для сходимости последовательности достаточно того, чтобы собственные значения матрицы А были по абсолютной величине меньше чем l/|fc| и были противоположны но знаку числу к.
Пример. Решить итерационным методом систему уравнений
x+3j/ = 2, — 2х — 4у = 1.
(*)
Решение. При к = 0,5 имеем
Фх = (0,5 А + Е) х — 0,5 b =
0,5
-1
1,5 \ / 1 0\ — 2/+\0 1J
1,5
-1
1,5
-1
х —
1
0,5
Далее, находим
_ /-1\ / —3,25\ / —4,375\
Хп = | I Х1 = I Х9 = I Хо = | I
0 \oj, 1 \0,5/, \ 1 /, \ 1,75 J,
Х4 = / —4,9375\ _ _/-5,2787\ ^_/-5,3594\ ( 2,125 /, Х5-\ 2,3125/, \ 2,4062/,
х7 = / — 5,3969\ 5,4648\ _ _/-5,4824\ \ 2,4531/, 2,4766/, %9 \ 2,4883/,
Х1О“ | ( — 5,4927\ _/-5,4956\ _ _/-5,4978\ ( 2,4941/, 2,4971/, %12-( 2,4985/, /-5,4989\ _/-5,4994 \ _/-5,4997\
Х13 == | i 2,4993/, %14-( 2,4993 ), 2,4998/.
176
Глава IV. Основные численные методы
С точностью до третьего знака после запятой значения х14 и х15 совпадают. Таким образом, с точностью до третьего знака решение данной системы уравнений есть х — —5,5, у>=2,5. Легко проверить, что это точное (а не приближенное) решение.
Заметим, что итерационный метод, примененный выше для решения системы линейных уравнений, можно использовать и в значительно более общей ситуации (см. § 4*.4, 6).
§ 4.5. Квадратурные формулы
Задача вычисления определенных интегралов является весьма важной в практическом отношении. Как известно, далеко не всегда эту задачу можно решить с помощью формулы Ньютона — Лейбница
ь
$f(x)dx=F(b) — F(a), (1)
а
где функция f непрерывна на [а, b ] и F’ (х) = /(х). Дело в том, что не для всякой элементарной функции /(х) первообразная функция F(x) также является элементарной или по крайней мере табулированной.
Существуют многочисленные методы вычисления определен-ъ
ных интегралов f/(x)dx, позволяющие выразить искомый
а интеграл через значения функции /(х) в некоторых точках х15 х2,...,хи отрезка [а, b ]. Формулы вида
Ь п
f/(x)dx^ X CJ(xt), (2)
а к=0
задающие приближенное значение искомого интеграла, называются квадратурными формулами, точки х0, х1? х2, ...,хи—узлами квадратурной формулы, числа Со, С1? С2,..., Сп — коэффициентами квадратурной формулы.
ь
В общих чертах формула (2) тем точнее приближает J/(х) dx, чем больше узлов взято для квадратурной формулы; увеличение количества узлов, разумеется, усложняет вычисления.
Опишем две простейшие квадратурные формулы — формулу трапеций и формулу Симпсона.
1°. Формула трапеций. Разобьем отрезок интегрирования [а, b ] на п равных частей точками a — xQ, х15 х2, ...,хп = Ь (так что
|х£ — х/+1| = -—-=А) и обозначим /(xz). Можно считать, что п
4.5. Квадратурные формулы
177
f f(x)&x и ма-
X П \ 2 /
ло1 отличаются друг от друга (если п велико и график функции имеет «плавный» характер). Суммируя приближенные равенства
получаем
/(x)dx« — (^+У1+У2 + ••• +%-i+y\ П у 2 2 J
(4)
Эта формула называется формулой трапеций. Ее геометрический смысл состоит в следующем (рис. 29). Если /(х)^0 на [а, b ], то правая часть формулы (4) представляет собой площадь фигуры, ограниченной прямыми х^а, х = Ь, у=0 и ломаной линией, звенья которой соединяют точки (xt; yt) и (xi+1;yi+1) (i— 0, 1, 2,..., п— 1). Наглядно очевидно, что эта площадь приближенно равна площади криволинейной трапеции, т. е. фигуры, ограниченной прямыми х = а, x — b, О и графиком функции у —f{x).
Можно доказать, что для гладкой функции/(%) справедлива оценка
ь
(f(x)dx-b-^(^+y1+y2+ ... + уя_1+^=-£/"©, (5)
I п у 2 2 у 12
где £—внутренняя точка отрезка \а, b ] (см. § 4*.5, 1).
Как видно из равенства (5), формула (4) является точной для функций f таких, что /"(х) = 0, т. е. для многочленов первой степени.
2°. Формула Симпсона. Разделим отрезок [a, h ] на 2/7 равных частей точками х0, х2, х3, х4, ...,х2и и рассмотрим отрезок [х2Ь
x2i+2 ] длины 2/?. В точках x2l«, x2i+1, x2i + 2 этого отрезка функция /принимает значения y2i=f(x2i), y2itl =/(x2i+1), y2i+2 =f(x2i+2 ).
178
Глава IV. Основные численные методы
Рис. 30
Для приближенного вычис-x2i+2
ления интеграла f f(x)Ax
x2i
можно поступить следующим образом. Через три точки графика функции y=f(x), имеющие координаты (x2i; y2i), (X2i + 1? У21+ 1 )? (X2i+2> У21+2 )?
проведем параболу, уравнение которой есть у = ах2 -F Рх + у (рис. 30). Вычислив а, р, у, затем найдем
х3 х2
(ах2 + p% + y)dx = а у + р у+ух
Окончательный результат вычислений таков:
У 21+ 2
f(x)dxx — (y2i+4y2i+1+y2i + 2) (6)
I и
У21
(см. § 4*.5, 2). Суммируя приближенные равенства, получаем
ь
^f(x)dxx^(y0 + 4y1 + 2y2 + 4y3 + 2y4+ ... +4у2„_1 + у2п) = а
= ^-[Уо+У2П + 4(у1 + у3 + ... + у2п-1)+2(у2+у4+...+у2„^2)']. (7)
Формула (7) называется формулой Симпсона (или формулой парабол).
Можно показать, что для гладкой функции/(х) выполняется
оценка ь
~Г~ (Уо + 4у1 + 2у2+ ... + 2у2„_2 + 4у2п_1+у2„) on
h az
—пМ, 54
(8)
где М—есть максимальное значение модуля четвертой производной функции y=f(x) на отрезке [а, 6] (см. § 4*.5, 3). Как видно из неравенства (8), формула (7) является точной для
4.5. Квадратурные формулы
179
функций /(х), у которых /(4)(х) = 0, т. е. для многочленов третьей степени.
Формула (7) значительно точнее формулы (4): при одинаковых объемах вычислений точности формул (4) и (7) пропорциональны соответственно третьей и пятой степени малого отрезка Л = хг + 1 — xt.
1
Пример. Вычислить J ^/1 +sinxdx.
о
Решение. Разобьем отрезок [0, 1] на десять частей: хо = 0; xt = 0,l; х2 = 0,2; х3 = 0,3; х4 = 0,4; xs = 0,5; х6 = 0,6; х7 = 0,7; х8 = 0,8; х9 = 0,9; х10 = 1. Значения функции ^/14-sinx в точках хк находим с помощью таблицы:
X 0 0,i 0,2 0,3 0,4 0,5
1 + sin х 1 1 1,0998 1,0487 1,1987 1,0949 1,2955 1,1382 1,3894 1,1787 1,4794 1,2163
yj\ +sinx
X 0,6 0,7 0,8 0,9 1
1 + sin x 1,5646 1,2508 1,6442 1,2823 1,7174 1,3105 1,7833 1,3354 1,8415 1,3570
4-sinx
Далее, имеем
У2 + У4.+У в + У8 = 4,8359; yt +у3 + Уп + У9 = 6,0209;
У о +Ло = 2,3570;
|(^о+Ло) + (3?1+>’з+3;5+Л+)?9) + (>,2+3?4 + Уб+3;8)=12>0353;
Уо + Ую+4 (У1 + Уз+У5 + У-1 + У<д+2 (У2 + У 4-+Уб + л)=36Д110-1
Теперь по формуле трапеций находим J ^/1 + sinxdx = 1 0
= —•12,0353 = 1,2035, а по формуле Симпсона получаем
1 1
J У1 + sin х dx = - • 36,1110 = 1,2037.
о 30
Точное значение интеграла есть 1
Pl +sinxdx = fI sin^+cos- |dx = — 2( — cos- + sin^ I = о\ 2 2/ \ 2 2/о
о
п . 1 1
= 2 + sm—cos-.
2 2
180 Глава IV. Основные численные методы
С точностью до четвертого знака после запятой последнее число равно 1,2038.
На практике часто применяют квадратурную формулу Гаусса. Узлы этой формулы связаны с корнями многочленов Лежандра (и расположены неравномерно на отрезке [а, b ]), а коэффициенты С- формулы выражаются через значения производных многочленов Лежандра. Эта квадратурная формула очень точная и ее широко используют при вычислениях на ЭВМ (подробнее см. § 4*.5, 4).
§ 4.6. Численные методы решения задачи Коши для обыкновенных дифференциальных уравнений
1°. Метод ломаных Эйлера. Известно, что решение дифференциального уравнения вида
У'=1\х, У) (О
не всегда выражается в элементарных функциях даже для сравнительно простых функций f(x, j); это означает, что даже в простых случаях не существует решений уравнения (1), которые бы описывались формулой у=у(х), выражающей у через х с помощью простейших элементарных функций, их суперпозиций и арифметических действий над ними («явных формул»). Тем большее значение приобретает численное интегрирование дифференциального уравнения (1). Это означает вычисление значений неизвестной функции у=у(х\ удовлетворяющей уравнению (1) и начальному условию
у(хо)=Уо (2)
(х0, У о—заданные числа). В данном случае решение задачи Коши, т. е. задачи о нахождении функции, удовлетворяющей уравнению (1) при условии (2), существует и единственно, если выполняются некоторые (не очень жесткие) условия (см. § 4*.6, 1).
В этом параграфе будут изложены некоторые методы численного решения задачи Коши для уравнения (1) при начальном условии (2).
Примем следующие обозначения. Значения искомой функции вычисляются в точках xk = x-ykh, k=l, 2,..., п, h>Q (здесь h—малое положительное число, называемое шагом); при этом Ук=У(хк\ fk=f(xk, ук).
Решение задачи Коши состоит в последовательном вычислении значений у2, у3,..., уп, причем каждое последующее значение ук+1 особым образом выражается через предыдущие значения у19 у2,Л-n а также через х1? х2, ..., хк + 1, т. е.
Ук+1=г(ук’ л-i,-; л+1, л,-)• (3)
4.6. Численные методы решения задачи Коши для обыкн. диф. уравнений
181
Методы численного интегрирования, которые излагаются ниже, различаются между собой видом функции F в равенстве (3).
Простейшим методом численного решения задачи Коши уравнения (1) при условиях (2) является метод ломаных Эйлера. Этот метод определяется таким частным случаем формулы (3):
yk+i=yk+hf(xk, yk). (4)
Формула (4) позволяет при
Рис. 31
& = 0, 1, 2,..., п последовательно вычислять j15 у2,..., уп (напомним, что j;0, х0, х1?..., хк известны).
Так как y'k+i=f(xk, yk), то из равенства (4) следует, что
Л->0 h h
Геометрический смысл формулы (4) заключается в том, что переход от точки (xk; ук) к точке (хк+1; ук+±) совершается по направлению касательной к кривой, удовлетворяющей уравнению (1) и условию у(хк)=ук (рис. 31).
Погрешность вычислений связана с приближенным характером формулы (5). Она накапливается при многократном использовании этой формулы, что является существенным недостатком метода.
Пример. Используя метод ломаных Эйлера, решить дифференциальное уравнение у'=—ху на отрезке [0, 1] при начальном условии у (0) = 1.
Решение. Положим п =10, h = 0,1 и составим таблицу значений:
к X У j) у = е х2/2 / h h\ /( **+“> Ук+/к~ ) \ 2 2/ У
0 0 1,00 0,00 1,0000 -0,0500 1,0000
1 0,1 1,00 -0,1 0,9950 -0,1492 0,9950
2 0,2 0,99 -0,198 0,9802 -0,2475 0,9801
3 о,з 0,9702 -0,2911 0,9560 -0,3448 0,9559
4 0,4 0,9411 -0,3764 0,9231 -0,4410 0,9229
5 0,5 0,9035 -0,4518 0,8825 -0,5362 0,8822
6 0,6 0,8583 -0,5150 0,8353 -0,6305 0,8349
182
Глава IV. Основные численные методы
Продолжение
к X У у) у=е х2/2 /Л h\ f\Xk+-’ Ук+Л~ 1 У
7 0,8068 -0,5648 0,7827 -0,7278 0,7823
8 0,8 0,7503 -0,6002 0,7261 -0,8160 0,7257
9 0,9 0,6903 -0,7213 0,6670 -0,9072 0,6664
10 1,0 0,6182 0,6065 -0,9975 0,6060
Здесь вычисления проведены в следующем порядке: (х0; Уд^У2~^-^(х9; у9)^у10. В пятом столбце таблицы указаны значения точного решения у=е х /2 в точках хк = 0,1к (к=0, 1, 2,..., 10).
Более точным по сравнению с методом Эйлера является так называемый модифицированный метод Эйлера. Он задается формулой
(h h\
хк+у Ук+fk^jh- (6)
Геометрический смысл этой формулы состоит в том, что переход от точки (хк; ук) к точке (хЛ+1; л + i) производится по направлению касательной к кривой не в точке (хк; ук), а в точке, которая является серединой (&+1)-го звена ломаной Эйлера. Из рис. 32 видно, что модифицированный метод Эйлера точнее, чем метод ломаных: действительно, направление движения от (xfc; ук) к (хк+1; л+i) есть «среднее» направление участка кривой от хк до xk+i, в то время как метод ломаных рекомендует «крайнее» направление (совпадающее с направлением кривой в концевой точке хк отрезка [xk, xfc + 1]).
Последний столбец таблицы свидетельствует о сравнительной высокой точности модифицированного метода Эйлера: разность между точным и приближенным значением решения дифференциального уравнения не превосходит 0,0006.
Заслуживает внимания другая модификация метода Эйлера, задаваемая формулой
Ук + 1=Ук + -\_/к-\-
Рис. 32
+Л*7<+1, yk+fkh}]h. (7)
f 4.6. Численные методы решения задачи Коши для обыкн. диф. уравнений
183
2°. Методы Рунге — Кутта. В дополнение к сделанным ранее обозначениям будем пользоваться также следующими обозначениями:
kr=fkh, k2=f^xk+h-, yk+k-±yi, k3=f(xk+h, yk+2k2-kx)h. (8) Формула
Л+1=Л+|(^1+4^2 + ^з) (9)
с учетом обозначений (8) позволяет вычислять ук+1 по известным хк. ук в таком порядке: (хк; ук)-^к1-^к2-^к3->ук+1. Формула (9), в которой /q, к2, к3 выражены через хк и ук. является частным случаем формулы (3). Как оказывается, значения ук(к = 0. 1, 2,..., п) достаточно аппроксимируют истинные значения искомой функции у(х), удовлетворяющей уравнению (1) и условию (2). По крайней мере для функций /(х, у) = 1, х, х2, х3 формула (9) дает точный результат (см. § 4*. 6, 2). Поэтому ее называют формулой Рунге—Кутта третьего порядка, а описанный метод — методом Рунге — Кутта третьего порядка.
Пусть
£i=f(xk, yk)h=fk^ ^2=f\xk+h~, (10)
^4=/(^ + /г, yk+^3)h.
Рассмотрим формулу
Л+1 =Л+^(^1 + 2^2 + 2^з+^4)- (11)
С ее помощью можно вычислять^+„ по ук, действуя в таком порядке: (хк;
Оказывается, что значения ук(к=1, 2,..., п), получаемые таким способом по исходному значению yQ. весьма точно аппроксимируют истинные значения искомой функции у(х) в точках хк. Для функции /(х, ^)=1, х, х2, х3, х4 в правой части уравнения (1) имеет место равенство ук=у(хк) (к = 0, 1, 2,..., п) с точностью до h5.
Метод численного решения задачи Коши уравнения (1) при начальном условии (2) по формулам (10), (11) называют методом Рунге — Кутта четвертого порядка. Этот метод находит широкое практическое применение. Подробности см. в § 4*.6, 3.
184
Глава IV. Основные численные методы
Остановимся на вопросе о численном интегрировании обыкновенных дифференциальных уравнений высших порядков. Известно, что всякое обыкновенное дифференциальное уравнение y(n) = F(x. у, у'. .... при УСЛОВИЯХ У&о^Уо)
у’ (xo)=j'o, у(п~1} (х0)==у(в-1) эквивалентно следующей си-
стеме дифференциальных уравнений первого порядка относительно вектор-функции z = (z0. z15...-, z^-t), где z0=^, zt=y'. z2=y",..., zn-r=y(n~l)lxy.
Z () ^1, ^2’ ***’ Zfi — 2 Zn — 1 zl’ ••* ^n — 1 )•
Эту систему можно записать в виде
z’ = F(x, z),
где F—вектор-функция, описанная выше: F=(F0. Ft..... Fn-i), F0(x, z)=zt, F1(x, z)=z2,... F„-2(x, z)=zn_1, z)=F(x,
z)=F(x, z0, zt,z„-2). Дифференциальное уравнение z' = F(x, z) относительно неизвестной вектор-функции z(x) при начальном условии z\x =(у0. уо,..., jo-1)) можно численно интегрировать по формулам, аналогичным (4), (6), (7), (8), (9), (10), (И); эти формулы имеют смысл не только для скалярных, но и для векторных аргументов.
§ 4.7. Понятие о методе сеток решения простейших задач математической физики
Рассмотрим линейное дифференциальное уравнение второго порядка в частных производных относительно функции и(х. у) двух переменных:
+Fw+/=0, (1)
дх2 дхду ду2 дх ду
где А. В. С. D, Е. f—заданные функции переменных х. у.
Рис. 33
Как известно, такие уравнения описывают важные физические явления и процессы.
Будем рассматривать уравнение (1) в области D плоскости переменных х, у (рис. 33). Пусть [а, Ь] и [с, d\ — проекции области D на оси х и у;
h2— малые положительные числа и (xfc; jz)— множество точек области D. имеющее вид
xk = a + kh. yl=c + lh2
(к. 1 = 0. 1, 2,...). (2)
4.7. Понятие о методе сеток решения прост, задач мат, физики
185
Под численным решением уравнения (1) будем понимать нахождение чисел ukh приближенно равных значениям и(хк, yt) искомой функции и в точках (хк,
Согласно определению частных производных, имеем
ди дх
= jjm «(**+^1, У,)
х.у л,-о К ' ду
= lim
Хк, У, h2~^°
Л2
(3)
Для малых значений hr, h2 получим
ди uk + i,i~Uki ди
дх х, у ~ hl ’ 8У к' •'I
~Uk,l+l—Ukl
(4)
Аналогично, из определения вторых частных производных вытекают приближенные равенства
д2и дх2
Uk + l,l — ^Ukl + Ukyi-i
д2и дхду
uk+l,l+l~Uk,l + l~uk+l,l^~^k,l
hrh2
(5)
1 + l~2ukl + uk, 1-1
ду2 хк>у~ h*
(это доказано в § 4*.7, 1).
Допустив указанные приближения, можно считать, что числа uki удовлетворяют системе уравнений, которая получается при подстановке в уравнение (1) вместо и неизвестных икЬ вместо ди ди Uk +1 i — Щ.1 Щ, i + i — Щл ~
—, ——выражении — ------, —— ---, т. е. правых частей формул
дх ду hr h2
д2 и д2 и д2 и
(4), а вместо —, —-—правых частей формул (5). При этом дх дхду ду
функции А, В, С, D. Е. F,f следует рассматривать в точках (xfc; yt).
В конкретных задачах математической физики требуется найти решение уравнения (1) при выполнении некоторых условий, которым удовлетворяет искомая функция и(х, у) на границе области. Естественно считать, что значения uki=^u(xk, yt) для точек (хк; yt), принадлежащих границе области D, подчиняются этим краевым условиям.
Таким образом, численное интегрирование уравнения (1) с краевыми условиями сводится к решению некоторой системы уравнений относительно неизвестных ukt = u(xk, yt), причем
186
Глава IV. Основные численные методы
значения u1d в точках (хк; yt) границы области D подчинены краевым условиям. Описанный подход к численному интегрированию уравнения (1) при краевых условиях называется методом сеток.
Рассмотрим применение метода сеток к решению задачи Дирихле: найти функцию и(х, у), удовлетворяющую внутри области D уравнению Лапласа
и принимающую заданные значения f (х, у) на границе Г области D:
u\r=f(x,y), (х,у)еГ.
(7)
Будем считать, что область D есть прямоугольник: х, yeD, 0<х^а, О^у^р и значения и(х,у) на границе определены следующей формулой:
Мг=/(*, у)=х+у-
(8)
Как известно из курса уравнений математической физики, поставленная задача Дирихле имеет и притом единственное решение.
Пусть hr = h2 = h и множество точек (xfc; yt) имеет вид (xfc; yt) = (hk; hl), к = 0, 1, 2,..., т; 1=1, 2,..., п. Дифференциальному уравнению в частных производных (6) и краевому условию (8) соответствует следующая система линейных уравнений относительно неизвестных uki:
ик~1, l + uk, 1-1 + ик+1,г1~ик, / + 1 “4^ — 0 (к=1, 2,..., т-1; 1=1, 2,..., п-1);
u0l=f(p,hl) (1=1, 2,..., п-1);
ukn=f(kh, р) (к=1, 2,..., W-1);
wmZ=/(oc, /А) (7 = 0? 1, 2,..., п — 1);
ukQ—f(kh, 0) (к = 0, 1, 2,..., т— 1).
(9)
(Ю) (П) (12) (13)
Всего имеется (т +1) (п +1) уравнений (9) — (13) \(т — 1) (п — 1) уравнений (9) и 2(т + п) уравнений (10) — (13)]. В последних уравнениях указаны значения переменных ukt, где (хк; У/)еГ. Подставляя эти значения в (9), получаем систему из (т — 1)(п—1) неоднородных линейных уравнений с (т — 1)(п—1) неизвестными им (к=1, 2,..., т—1; 1=1, 2,..., п — 1).
Всякая система линейных уравнений эквивалентна векторному уравнению
Аи = Ь,
(14)
где и—неизвестный вектор-столбец, b — вектор-столбец свободных членов, А — матрица системы (компонентами искомого
4.7. Понятие о методе сеток решения прост, задач мат, физики
187
вектора и являются числа ukh соответствующие внутренним точкам, а компонентами вектора b—граничные значения mkt = u(xk,
(.xk; у^еГ).
Выпишем конкретную систему уравнений, соответствующих значениям т = 3, п = 3. В этом случае (рис. 34) внутренними точками яв-ляются (хх; у2), (х2; уД
(х2; у2) и система уравнений принимает вид
и11 — д(^01 + wio + и21 + ^12)?
^12—-(^02 + ^11 +^22 + ^13)?
^21 = (^11 + и20 + ^31 + и22 )?
(15)
^22 — 4(^12 + ^21+^32 + ^23)-
Здесь w11? п12, п21, и22— неизвестные; при этом w10, w20, w31, i/32, w23, wi3? ^02, woi совпадают с заданными значениями функции f на границе.
Запишем, как это принято, члены, содержащие неизвестные, в левой части равенства, а постоянные слагаемые перенесем в правую часть. Получим
^11+4^12+4^21 = “4(^01+^1о)>
1 4 ^11 — ^12 + т^22~ ~т(^02 + ^1з)?
1 4Ми 1 1 06) — ^21+4^22— — 4^20 + ^31)5
4^12+4^21 “ и22~~ “4^23 + ^32)-
Эта система в матрично-векторной форме имеет вид Аи = Ь, где матрица А — матрица системы (16), а b — вектор-столбец свободных членов, т. е.
-1, 1/+ 1/4, О,
1/4, 1/4,
-1, О,
О, -I, 1/4, 1/4,
— (^01 +wio)/4 ~(^02 + ^1з)/4 — (w2o + ^31)/4 “'(^2з + ^32)/4
О
188
Глава IV. Основные численные методы
Таков конкретный вид матрично-векторного уравнения (14) при т = п = 3.
Это уравнение [или эквивалентную ему систему уравнений (9) — (13)] можно решить методом итераций, изложенным в п. 2° § 4.4. Как показано в § 4*.7, 2, матрица системы уравнений (9) — (13) удовлетворяет достаточным условиям сходимости итерационного процесса.
Уравнение (14) эквивалентно уравнению
и = и + (А и — Ь] = [А + Ё] и — Ь = Ф (и). (17)
Последовательность векторов
wo = 0, ^ = 0(1/0), й2=Ф(и1),ми=Ф(ц,_1),(18) как показано в § 4*.7,2, является сходящейся, и ее предел представляет собой решение уравнения (14).
Каждая итерация, т. е. каждый переход от u(s} к u(s+1} в последовательности (18):
u(s}^ u(s+1} = Ф (^s)) - (А + Ё)и^} - (19)
является переходом от набора чисел (координат вектора u^s)) к набору чисел u(s+1} (координат вектора u(s+1}) по правилу (19), который в подробной записи имеет вид
— - (^к + 1,I + ukh + 1 + ик- 1,1 + ukh - 1)? (20)
к=\, 2,..., т— 1; /=1, 2,..., п — 1.
Здесь в правой части допускаются значения и соответствующие границе Г области 7), в то время как в левой части числа u$ = u(kh, lh) соответствуют внутренним точкам области D.
Согласно формуле (20), в результате каждой итерации значения s-yo приближения искомой функции в точке (khr\ lh2) заменяются на среднее арифметическое четырех чисел (соседних значений s-ro приближения) 4j+b
ик-1,Ь ик\-1
Пример. Решим полученную выше систему уравнений (16) при граничных значениях
^01“ 2, ^10“ 1? ^20“Оэ ^31 = 0, ^32=0, ^13~0, г/23“0.
Изображая каждый узел клеткой, поместим в клетки с номерами 01, 02, 10, 20, 31, 32, 13, 23 заданные числа, а внутренние клетки с номерами 11, 12, 21, 22 заполним нулями. Тогда получим вектор = W22) = (0,
0, 0, 0) (см. табл. 1а). Используя правило (20), построим вектор £Z(1) = (3/4, 0, 0, 0) (см. табл. 16); затем, применив то
4.7. Понятие о методе сеток решения прост, задач мат, физики 189
же правило к вектору й(1\—вектор z7(2) = (3/4, 3/16, 0, 3/16) (см. табл. 1в) и т. д.
т а б л в 0 ца L 0 а 1 Габли 0 ца 1( 0 5 1 ?аб л и 0 [ца 1] 0 в
0 0 0 0 0 0 0 0 0 3/16 0 0
2 0 0 0 2 3/4 0 0 2 3/4 3/16 0
1 0 1 0 1 0
После 10-й итерации получим вектор и(10) = (0,8741; 0,2496; 0,1241; 0,2496), а после 14-й —вектор £Z(14) = (0,8750; 0,2500; 0,1250; 0,2500) и далее £Z<14) = 5) с точностью до четвертого
знака после запятой. Это значит, что числа таблицы
0 0
0 0,250 0,125 0
2 0,875 0,250 0
1 0
удовлетворяют системе уравнений (16) [и (15)] с точностью до четвертого знака (на самом деле эти числа дают точное, а не приближенное решение).
Если числа hr и h2 достаточно малы, то решение и системы уравнений (9) — (13), т. е. компоненты икг вектора и. мало отличаются от значений искомой функции и в точках (xk; yt).
Рассмотренный выше пример иллюстрирует численное решение системы (15), являющееся частным случаем системы уравнений (9) — (13) при т = п = 3. Для практического решения задачи Дирихле (6), (7) следует, конечно, решить систему (9) — (13) для больших значений т и п. Такие вычисления требуют привлечения ЭВМ.
В заключение заметим, что метод сеток в принципе может быть применен к любому уравнению второго порядка с частными производными. Решение задачи сводится к системе линейных уравнений относительно чисел uki— значений неизвестной функции и в узлах (хк, Чем точнее требуется получить искомые значения, тем больше узлов следует взять, тем сложнее возникающая система линейных уравнений.
Глава V
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
§ 5.1. Случайные события, операции над событиями и отношения между ними.
Пространство элементарных событий. Классическое определение вероятности. Теорема сложения вероятностей. Частота. Геометрическая вероятность
1°. О понятиях случайного события и вероятности. Каждая математическая дисциплина, в том числе и теория вероятностей, отражает свойства реального мира. В каждой математической дисциплине есть свои основные понятия, связанные с предметом изучения. Эти понятия происходят из явлений и фактов окружающей нас действительности.
Начнем с описания тех явлений и фактов, которые лежат в основе понятий «случайное событие» и «вероятность Случайного события». Это описание еще не является математическим определением, однако оно заключает в себе некоторые свойства реального мира, изучение которых математическими методами и является содержанием теории вероятностей.
При неоднократном воспроизведении одного и того же опыта результаты его могут изменяться от случая к случаю.
Так, в результате подбрасывания монеты может оказаться, что она упадет либо гербом вверх («герб»), либо гербом вниз («решетка», или «цифра»).
При бросании игральной кости на верхней ее грани может появиться одно из чисел 1, 2, 3, 4, 5, 6.
Если из большого количества произведенных изделий выбрать наудачу одно, то такое изделие может оказаться либо стандартным, либо бракованным.
Всякой электролампе можно поставить в соответствие некоторое число—количество часов работы до момента перегорания.
В каждом из перечисленных выше примеров рассмотрено некоторое испытание, исход которого заранее предвидеть невозможно. Обычно событие называют случайным, если в результате испытания оно может появиться или не появиться.
Примеры. Следующие события являются случайными:
1. Событие, состоящее в том, что при бросании монеты выпадет герб (решетка).
§5.1. Классическое определение вероятности. Теорема сложения вероятностей 191
2. Событие, состоящее в том, что при бросании игральной кости выпадет четное число очков.
3. Событие, состоящее в том, что наудачу выбранное изделие окажется бракованным.
4. Событие, состоящее в том, что электролампа будет гореть не менее трех часов.
Можно говорить о таких случайных событиях, как поражение мишени, выигрыш в лотерею, наличие сильных помех при радиоприеме и др.
Понятие случайного события в обиходе связано с понятием вероятности. Говорят, что одно событие более вероятно, а другое менее вероятно; о некоторых случайных событиях говорят, что они равновероятны. При этом руководствуются соображениями здравого смысла.
Например, случайное событие, состоящее в том, что в результате бросания игральной кости выпадает четное число очков, более вероятно, чем событие, состоящее в том, что в результате бросания игральной кости выпадет шестерка.
Событие из примера 3 маловероятно при хорошей организации производства. Наоборот, событие из примера 4 весьма вероятно; это утверждение выражает уверенность в том, что рассматриваемое событие почти наверняка произойдет.
Известно, что выигрыш в лотерею, как правило, событие редкое, маловероятное (это утверждение отражает тот факт, что «счастливые» билеты составляют меньшинство и что в лотерею выигрывают редко).
События «герб» и «решетка» из примера 1 равновероятны (по соображениям симметрии монеты). По тем же соображениям равновероятны выпадения любого количества очков от единицы до шести при бросании игральной кости.
Есть события очень вероятные, которые почти наверняка наступают в результате опыта; существуют события крайне маловероятные, они редко наступают в результате опыта. Их «предельным случаем» являются достоверные и невозможные события: первые непременно наступают, а вторые никогда не наступают.
Для математического изучения случайных событий необходима количественная мера «степени вероятности» случайного события: каждому случайному событию должно соответствовать число, причем равновероятным событиям — равные числа, более вероятному событию — большее число, невозможному событию—нуль, достоверному событию—единица (так что произвольному случайному событию А ставится в соответствие число, обозначаемое Р(Л), причем 0^Р(^4)^1).
Строгие математические понятия «случайное событие» и «вероятность случайного события» должны обобщать
192
Глава V. Теория вероятностей
соответствующие обиходные понятия, т. е. отражать их существенные черты и в то же время быть безупречно точными.
Введение основных понятий теории вероятностей связано с простой, но очень плодотворной идеей — идеей пространства элементарных событий.
2°. Пространство элементарных событий. Рассмотрим следующий опыт. Пусть дано конечное множество Р*, содержащее п элементов (например, можно считать, что оно состоит из п точек Р*15 Р2, Р*п на плоскости). Опыт заключается в том, что из этого множества наудачу выбирают один (и только один) элемент. При этом предполагается, что событие Рь состоящее в том, что будет выбран элемент Р •, равновероятно любому из событий Р7, где z, j= 1, 2, ..., п (попросту говоря, что все события Pf равновероятны).
События Pi (z= 1, 2, ..., п) будем называть элементарными.
Заметим, что в данном опыте можно говорить и о других (неэлементарных) событиях. А именно, рассмотрим подмножество А * множества Р*. Это подмножество задает случайное событие А, состоящее в том, что в результате опыта будет выбран элемент Р*-, принадлежащий подмножеству А *. Таким образом, каждое подмножество А * задает некоторое случайное событие А. Обратно, всякое случайное событие, связанное с рассматриваемым опытом, задается некоторым подмножеством Л * с: Р*: Л * состоит из тех точек Р •, выбор которых означает наступление данного события (элементарные события, благоприятствующие событию Л).
При изучении случайных событий в рассматриваемом опыте полезна следующая наглядная иллюстрация [диаграмма Эйлера): будем изображать элементы P*gP* (z = 1, 2, ..., п) точками некоторого прямоугольника. Как было отмечено выше, всякое случайное событие задается некоторым подмножеством в Р*. На рис. 35 указаны подмножества Л* и Р*, задающие случайные события Л и Р,— событие Л (событие Р) наступает тогда и только тогда, когда в результате опыта будет выбрана одна из точек подмножества Л * (соответственно подмножества Р*). Невозможному событию соответствует пустое множество, достоверному событию—множество Р *.
Опыт, связанный с пространством элементарных событий, позволяет каждому событию Л сопоставить число Р(Л ), где 0<Р(Л)^1, измеряющее «степень вероятности» наступления события Л, причем для соответствия Л->Р(Л) выполняются все требования здравого смысла, перечисленные выше.
Такое соответствие строится следующим образом. Пусть дано событие Л;
j>' 5.1. Классическое определение вероятности Теорема сложения вероятностей
193
это значит, что заданы все элементарные события, благоприятствующие событию А. Общее количество таких элементарных событий обозначим через т. Положим
Р(А) = т/п. (1)
Формула (1) сопоставляет каждому событию А в рассматриваемом испытании число Р(Л), называемое вероятностью события А.
Согласно формуле (1), вероятность события А равна отношению количества т элементарных событий, благоприятствующих событию Л, к общему количеству п элементарных событий в пространстве элементарных событий.
Легко убедиться в том, что более вероятным событиям формула (1) сопоставляет большие вероятности, равновероятным событиям — равные вероятности, невозможному событию— нуль, достоверному событию — единицу (см. § 5*.1, 1). В частности, вероятность каждого элементарного события Pi равна 1 In (/=1, 2, ..., п).
Формула (1) задает так называемое «классическое определение» вероятности события.
Оказывается, что рассмотренный выше опыт, связанный с пространством элементарных событий, носит довольно общий характер: многие задачи теории вероятностей (в том числе далеко не простые) представляют собой частный случай этой общей схемы.
Отметим, однако, что пространство элементарных событий может быть бесконечным, этот случай рассмотрен в п. 7°.
Примеры. 1. В испытании, заключающемся в однократном бросании монеты, пространство элементарных событий состоит из двух элементов: Рг — «герб», Р2 — «решетка», «цифра».
2. В испытании, связанном с бросанием игральной кости, пространство элементарных событий состоит из шести элементов: 1, 2, 3, 4, 5, 6. Вероятность того, что в результате опыта выпадет количество очков, большее двух, равна 4/6 четыре благоприятствующих элементарных события: 3, 4, 5, 6 (т — 4) и общее количество п = 6.
3. При игре в спортлото элементарным событием является выбор шести различных чисел (шести нумерованных шаров) из множества 1, 2, 3, ..., 43, 44, 45. Так как шары, на которых обозначены цифры, одинаковы по физическим параметрам, то естественно считать, что все шестерки шаров равновероятны (и, значит, требование, предъявляемое к пространству элементарных событий, выполнено). Общее количество таких различных шестерок равно 8145060 (см. ниже пример в п. 5°). Вероятность того, что в результате опыта появится заранее заданная шестерка чисел (т. е. вероятность угадать все шесть чисел), равна 0,000000123.
7 Мантуров О.В.
194
Глава V. Теория вероятностей
Вероятности событий Л, связанных с рассматриваемым испытанием, можно вычислить по формуле Р(Л) = /я/Х где т—количество элементарных событий, благоприятствующих событию Л, т. е. количеству шестерок, означающих наступление события Л. Вопрос о том, как вычислить число т, требует иногда преодоления некоторых математических трудностей.
4. Для проверки качества изделий отбирают из партии, содержащей N изделий, небольшое количество (к штук). Обычно предполагают, что выбор случаен, т. е. каждое из N изделий имеет равные шансы быть выбранным. В этом случае каждое элементарное событие представляет собой подмножество из к изделий.
Можно доказать, что количество элементов в пространстве элементарных событий равно числу сочетаний из N элементов по к. т. е.
к _ N~
7V(7V-1) ... (TV-кг 1) 1 -2 ... к
(2)
(вывод этой формулы приведен в § 5*.1, 2).
3°. Операций над событиями. В п. 2° было отмечено взаимно однозначное соответствие между событиями и подмножествами в пространстве Р* элементарных событий. Для любых двух подмножеств Л*, Р* пространства Р* определены подмножества Л*иР* (объединение Л* и Р*) и Л*Р|Р* (пересечение Л* и Р*):Л*иР* состоит из тех элементов, которые принадлежат подмножеству Л * или подмножеству В *, или обоим подмножествам вместе; Л*Р)Р* состоит из тех элементов, которые принадлежат и множеству Л *, и множеству В * (рис. 36).
Рассматривают также дополнение подмножества Л * в Р *, обозначаемое Л *: дополнение Л состоит из тех точек, которые не принадлежат множеству Л *.
Операциям (J и Q соответствуют операции над событиями—сумма и произведение событий.
Определение 1. Суммой событий А и В называется событие, обозначаемое А-У В и состоящее в том, что в результате опыта наступит или событие Л, или событие Р, или оба вместе.
Определение 2. Произведением двух событий А и В называется событие, обозначаемое АВ и со-
£ 5.7. Классическое определение вероятности. Теорема сложения вероятностей
195
стоящее в том, что в результате опыта наступит и событие А, и событие В.
Операции дополнения множества А * соответствует операция перехода от заданного события к противоположному.
Определение 3. Событием, противоположным событию Л, называется событие, обозначаемое А и состоящее в том, что в результате опыта событие А не наступит.
Комментарии к определениям 1 — 3. 1) Определения 1 — 3 описывают подмножества элементарных событий, благоприятствующих сумме событий А и В’, произведению событий А и В; событию, противоположному к А\ если событиям А и В соответствуют подмножества Л* и В* благоприятствующих событий, то событию А Л- В соответствует подмножество Л*и^*, событию АВ—подмножество Л*Р)2?*, событию Л — подмножество Л *.
2) Операции суммы событий, произведения событий и дополнения обладают такими свойствами, как Л+ В — = В+А, АВ=ВА, А(В+С) = АВ+АС, (А + В)+С = А + (В+С), (АВ)С=А(ВС) и т. д. Подробнее см. § 5*.1, 3.
Говорят, что множество событий вместе с операциями суммы, произведения событий и перехода к противоположному событию составляют алгебру событий.
3) Рассматривают сумму трех и более событий Л1? Л2, Л„, ... (быть может, бесконечного числа), которую обо-
00
значают Л1 + Л2 + + ЛП + ••• = X Событие ХЛ/ состоит
i = 1
в том, что в результате опыта наступит хотя бы одно из событий Л15 Л2, Л„, ... .
Аналогично, произведение трех и более событий (быть может, бесконечного числа) Л1? Л2, ..., Л„, ... обозначается Л1 • Л2 ... Ап==ПА[. Событие ПЛ/ состоит в том, что в результате опыта наступит каждое из событий А19 Л2, ..., Л„, ....
Примеры. 1. Пусть при бросании игральной кости событие Л означает, что выпадет четное число очков, а событие В—что количество очков не превзойдет четырех. Ясно, что Л *= {2, 4, 6}; В* = {1, 2, 3, 4}; (Л + В)*= {1, 2, 3, 4, 6}; (АВ)* = {2, 4}. Иными словами, событие Л + В наступает при выпадении чисел 1, 2, 3, 4, 6, а событие АВ—при выпадении чисел 2, 4.
Для событий Л, В, А + В, АВ, противоположным соответственно к событиям Л, В, А Л- В, АВ, получим Л* = {1, 3, 5}; В* = {5, 6}; (Л+ /?)* = {5}; (АВ)* = {1, 3, 5, 6}.
2. Пусть при игре в спортлото события А, В, С заключаются в том, что выбранная в результате опыта шестерка чисел содержит соответственно число 7, 12, 20. Результатом испытания оказалась шестерка чисел 7, 8, 9, 20, 21, 42. Какие
7*
196
Глава V. Теория вероятностей
из следующих событий наступили при этом: Л, В, С, Л, Д ABC. А + В, А + С. А + С?
Решение. Обозначим множество {7, 8, 9, 20, 21, 42} через М. Тогда получим, что из перечисленных в условии событий наступили следующие: Л, поскольку 7е7И; С, так как 20бМ; Д поскольку 126М; А + В. так как 7еМ; А + С. поскольку 1еМ и 20 еМ. Остальные из перечисленных событий не наступили.
В алгебре событий справедливы формулы
Л1ТЛ2Т ... + Ап = А± • Л2 ... Ап. (3)
А± • Л2 ... Ап — Ai + Л2 + ... +ЛИ. (4)
Строгий вывод этих формул приведен в § 5*.1, 4. Здесь мы ограничимся лишь некоторым пояснением к ним. Левая часть формулы (3) есть событие, противоположное к Л1+Л2+ ... + Л„. Последнее событие наступает тогда и только тогда, когда наступает хотя бы одно из Л£ (z= 1, 2, ..., и). Событием, противоположным тому, что наступит хотя бы одно из Ль является событие, состоящее в том, что не наступит ни одно из Ль т. е. наступит каждое из At; это означает, что наступит событие ЛХ’Л2... Лл.
Левая часть формулы (4) есть событие, противоположное событию Ai'A2 ... Ап. Последнее событие состоит в том, что наступит каждое из событий Л1? Л2, ..., Ап. Событием, противоположным тому, что наступит каждое из At (i= 1, 2, .... п). является событие, состоящее в том, что не наступит хотя бы одно из Ai. Л2, ..., Ап. т. е. что наступит хотя бы одно из Л19 Л2, ..., Л„; это означает, что наступит событие At+A2 + ... + Ап.
Пример 3. Каждый из стрелков делает по одному выстрелу в мишень.
а) Какое событие является противоположным к событию А: «хотя бы один стрелок попал в цель»?
б) Какое событие противоположно событию «каждый из стрелков попал в цель?»
Решение, а) Таким событием является «каждый из стрелков промахнулся» или, что то же самое, «ни один не попал в цель». Справедливость ответа вытекает из того, что событие А означает поражение мишени, а событие А — не-поражение мишени. Этот пример иллюстрирует формулу (3).
б) Таким событием является «хотя бы один из стрелков промахнулся». Этот пример иллюстрирует формулу (4).
4°. Теорема сложения вероятностей. Определение 4. Два события А и В называются несовместными, если не существует элементарного события, благоприятствующего одновременно обоим событиям.
§5.1. Классическое определение вероятности. Теорема сложения вероятностей 197
Комментарий к определению 4. Из этого определения вытекает, что появление события А в результате испытания исключает появление события В. Несовместные события не могут появиться в результате одного опыта.
Можно говорить о нескольких несовместных событиях А19 А2. Ап\ в этом случае имеют в виду, что события Л1? А2, ..., Ап не могут наступить все сразу в результате одного испытания. Если в множестве А19 Л2, ..., Ап событий каждые два несовместны, то говорят, что эти события попарно несовместны.
Например, при бросании игральной кости события А «выпадет количество очков, равное 1 или 2» и В «выпадет количество очков, равное 4 или 5» несовместны. Несовместным событиям соответствуют непересекающиеся множества на диаграмме Эйлера.
Теорема (теорема сложения вероятностей). Вероятность суммы двух несовместных событий равна сумме вероятностей этих событий.
Доказательство. Пусть событию А благоприятствуют к элементарных событий, а событию В—I элементарных событий. Так как А и В несовместны, то событию А + В благоприятствуют к+1 элементарных событий. Следовательно, Р(Л) = £/и, P(7?) = Z/rz, Р(Л + Я) = (£+/)/и, т. е.
Р(Л + В) = Р(Л) + Р(В). (5)
Комментарий к теореме. Теорема легко обобщается на случай т попарно несовместных случайных событий Л2, ...,
р(л1+л2+...+л)=р(а)+р(л2)+...+р(>1и). (6)
5°. Примеры вычисления вероятностей по формуле (1)
1. В урне находятся 5 шаров, из которых 3 черных и 2 белых. Наудачу извлекают один шар. Какова вероятность, что он окажется белым?
Решение. В условии подразумевается («наудачу извлекают»), что пространство элементарных событий состоит из пяти элементов; два из них благоприятствуют рассматриваемому событию. Его вероятность равна 2/5.
2. При тех же условиях из урны последовательно извлекают два шара (первый шар возвращают в урну). Какова вероятность, что оба шара окажутся белыми?
Решение. Здесь пространство элементарных событий состоит из всевозможных упорядоченных пар чисел:
(1, 1); (1, 2); (1, 3); (1, 4); (1, 5);
(2, 1); (2, 2); (2, 3); (2, 4); (2, 5);
(3, 1); (3, 2); (3, 3); (3, 4); (3, 5);
(4, 1); (4, 2); (4, 3); (4, 4); (4, 5);
(5, 1); (5, 2); (5, 3); (5, 4); (5, 5),
198
Глава V. Теория вероятностей
где пара чисел (z,j) означает элементарное событие, состоящее в том, что первым был взят шар с номером z, а затем шар с номером /; возможно, что /=/, т. е. шар с номером z был (после возвращения в урну) извлечен вторично. Таким образом, пространство элементарных событий состоит из 5x5 = 25 элементов. Требованию задачи удовлетворяют четыре элемента, а именно (1, 1); (1, 2); (2, 1) и (2, 2) (шары занумерованы так, что белыми являются первый и второй; ясно, что и при всякой другой нумерации рассматриваемому событию благоприятствуют ровно четыре элементарных исхода. Итак, искомая вероятность равна 4/25.
3. Пусть из той же урны наудачу извлекают два шара, но первый шар обратно в урну не возвращают. Какова вероятность того, что два извлеченных шара будут белыми?
Решение. Из условия следует, что пространство элементарных событий таково:
(1,2); (1,3); (1,4); (1,5);
(2, 1); (2, 3); (2, 4); (2, 5);
(3, 1); (3, 2); (3, 4); (3, 5);
(4, 1); (4, 2); (4, 3); (4, 5);
(5, 1); (5, 2); (5, 3); (5, 4).
В отличие от предыдущего примера оно состоит из 20 элементов и не содержит элементов (1,1); (2,2); (3,3); (4, 4); (5, 5); рассматриваемому событию благоприятствуют два исхода: (1,2) и (2, 1). Значит, искомая вероятность равна 2/20= 1/10.
4. Пусть в урне находится п шаров, из которых к белых, а остальные черные. Предполагается, что шары занумерованы числами 1, 2, ..., п и первые к шаров— белые. Наудачу извлекают / шаров (без возвращения). Какова вероятность того, что все шары окажутся белыми?
Решение. Здесь элементарное событие представляет собой неупорядоченный набор из / чисел множества {1, 2, 3, ..., п] (числа этого набора означают номера выбранных шаров). Количество таких наборов равно количеству сочетаний из п элементов по /, т. е.
z _п(гг— 1)(лг—2)...(?г—/4-1)
[см. формулу (2)].
Элементарные события, благоприятствующие появлению I белых шаров, характеризуются неупорядоченным набором из / чисел множества {1,2, ..., к}. Количество таких наборов составляет
к> к 1 . П 7 ’
§5.1. Классическое определение вероятности. Теорема сложения вероятностей 199
Следовательно, вероятность рассматриваемого события такова: __k(k-l)...(k-l+})
& п (п—!)...(« — /+1)
Например, при п = 10, /< = 4, / = 3 имеем
4-3-2 24 1
г 10-9-8 720 30
5. В условиях предыдущего примера определить вероятность того, что из I выбранных шаров 1Х окажутся белыми, а /2 черными (где lr + l2 —
Решение. Пространством элементарных событий является множество неупорядоченных наборов из I чисел множества {1, 2, ... п}, состоящее из С1п элементов. Количество элементарных исходов, благоприятствующих рассматриваемому, можно вычислить следующим образом. Неупорядоченный набор из I чисел, описывающий выбранную комбинацию из белых и /2 черных шаров, состоит из набора чисел множества {1, 2, ..., 1} (белые шары) и из набора 12 чисел множества {/+1, Z+2, ..., п} (черные шары). Количество всех наборов белых шаров равно С*1, количество всех наборов черных шаров равно C„2_fc. Так как для получения набора из I шаров, содержащего 1Г белых и /2 черных шаров, можно соединить любой набор белых шаров с любым набором черных шаров, то количество элементарных событий, благоприятствующих рассматриваемому событию, равно С1кг’С1п2-к. Поэтому искомая вероятность составляет
(7)
6. Найти вероятность того, что при игре в спортлото будут угаданы s чисел (5 = 0, 1, 2, 3, 4, 5, 6).
Решение. Пространство элементарных исходов представляет собой множество неупорядоченных наборов из шести чисел, выбранных (без повторений) из множества {1, 2, ..., 45}. Это пространство содержит С%5 элементов.
Количество благоприятных исходов можно найти с помощью формулы (7). Действительно, множество из 45 чисел делится на два множества: 6 номеров «счастливых» и 39 «несчастливых» номеров. Пусть событие As состоит в том, что играющий выбрал s «счастливых» и 6-5 несчастливых номеров. Полагая в равенстве (7) и = 45, к = 6, = получаем
<-45
Отсюда при 5 = 0, 1, 2, 3, 4, 5, 6 соответственно находим:
200
Глава V. Теория вероятностей
39 ’ 38 • 37 • 36 • 35 • 34 1 .
z^O z~»6 Р(Л)=^= С45 1 - 2-3-4-5-6 39-38-37-36-35-34 Л .ппг = — — U,4006; 45.44.43.42.4i -40 45-44-43-42-41 -40 1-2-3-4-5-6
6 39 • 38 • 37 • 36 • 35
р(^1)=4?ь= с45 _ 1 1-2-3-4-5 _39-38-37-36-35-6-6_0424р 45-44-43-42-41-40 45-44-43-42-41-40 ’ 1-2-3-4-5-6
6-5 39-38-37-36
р(л)=4Э= с45 1-2 1-2-3-4 _ 39 • 38 • 37 • 36 • 6 • 5 • 6 • 5 _q 15|5. ~45-44-43-42-41-40 45-44-43-42-41-40•1•2 ’ 1-2-3-4-5-6
6-5-4 39-38-37
Л*3 г3 Р(А)=^= с45 1-2-3 1-2-3 _ 39 • 38 • 37-6 • 5-4 • 6 • 5-4 __qq224- “45-44-43-42-41-40 45-44-43-42-41-401-2-3 ’ 1-2-3-4-5-6
6-5-4-3 39-38
р(л)=4^= с 45 1-2-3-4 1-2 _ 39 • 38 - 6 - 5-4 • 3 • 6 • 5 _ "45-44-43-42-41-40 45-44-43-42-41 -40 • 1 -2 1-2-3-4-5-6
6-5-4-3-2 39
р(л)=4^= ^45 1-2-3-4-5 1 _ 396•5-4•3-2•6 “45.44.43-42-41-40 45-44-43-42-41 -40 1-2-3-4-5-6
= 0,0000 (0,0000287);
Z'<o 1 . Э . Q . Л . S • 6
р U )=к£±2£=—0,0000 (0,000000123).
V 67 С%5 45-44-43-42-41-40 v 7
Сведем результаты вычислений в следующую таблицу:
5 0 1 2 3 4 5 6
р(А) 0,4006 0,4241 0,1515 0,0224 0,0014 0,0000287 0,000000123
6°. Статистический подход к понятию вероятности. Существует еще один подход к понятию вероятности, не связанный с пространством элементарных событий. В основе этого
j>’ 5.1. Классическое определение вероятности. Теорема сложения вероятностей 201
подхода лежит явление устойчивости частоты наступления события при многократном повторении испытаний. Пусть в результате некоторого опыта возможно появление события А. Повторим опыт п раз и подсчитаем количество т наступлений событий А. Будем предполагать, что в данной серии опытов результаты предшествующих испытаний не влияют на последующие. Как известно из практики, отношение mln мало изменяется при больших п несмотря на то, что событие А случайное и величина т также зависит от случая. В частности, если монету подбрасывать многократно, то отношение количества выпавших гербов к общему числу бросаний монеты приближенно будет равно 1/2.
Отношение mfn называется частотой появления события А в п испытаниях.
При условии устойчивости частоты появления события А число т/п удовлетворяет требованиям, предъявляемым к вероятности как к характеристике того, насколько вероятно изучаемое событие с точки зрения практики и здравого смысла. Действительно, число т!п удовлетворяет неравенству более вероятным
с точки зрения здравого смысла событиям соответствует большее значение mfn, для невозможных событий mfn^(\ для достоверных т/н=1; если событие А является суммой двух несовместных событий В и С, т. е. А=В+С, то тА1п=тв1п-}-тс1п, где тА. тв, тс — количество наступлений событий в п опытах. В силу сказанного (и при том условии, что возможно многократное повторение опыта с устойчивостью частоты) отношение mjn называют статистической вероятностью события А.
В дальнейшем будет доказано (закон больших чисел Бернулли), что если для события А определена его классическая вероятность р, то частное mjn. тд$ тп— случайная величина, выражающая количество наступлений события А в п независимых друг от друга испытаниях, при больших п «почти всегда» мало отличается от р. Таким образом, известное из практики явление оказывается строго доказанным математическим утверждением.
Следует заметить, что статистическое определение вероятности в некоторых случаях единственно доступно для измерения и исследования: действительно, далеко не всегда можно изучать случайные события с помощью пространства элементарных событий. Например, при изучении стрельбы по мишени невозможно указать разумную модель пространства элементарных событий, отражающую существенные стороны исследуемых испытаний.
7°. Геометрические вероятности. Рассмотрим, наконец, вопрос о том, что называется вероятностью события в строго математическом смысле. Строгое определение понятия вероятности развивает идею конечного пространства элементарных
202
Глава К Теория вероятностей
событий и дано в § 5*.1, 5. Здесь будут указаны лишь главные черты такого определения.
Пусть дано некоторое множество X (аналог конечного пространства элементарных событий, описанного в п. 2°). Изучаемые события представляют собой подмножества в X. Задана также функция /, которая подмножествам в X сопоставляет число из числового отрезка [0, 1]. Требуется, чтобы эта функция обладала свойством аддитивности, т. е. чтобы для всяких двух непересекающихся подмножеств Л, В с X. для которых / определена, было справедливо равенство
/(Ли5)=/(Л)+/(В); (8)
кроме того,/(0) = О,/(Х)= 1. Значение функции f на множестве А называется вероятностью события А.
Следует отметить, что множество X в отличие от п. 2° может быть бесконечным; например, X—отрезок числовой прямой, вся прямая, квадрат на плоскости, вся плоскость и т. п.
Часто функцию / бывает невозможно определить для всех подмножеств множества X, в этом случае ее определяют только для некоторых (так называемых измеримых) подмножеств (подробнее см. § 5*.1, 6).
Наглядным примером вероятностной модели может служить геометрическая вероятность.
Пусть X—множество точек квадрата на плоскости х, у, т. е. а^х^Ь, а^у^Ь. Для подмножества А<^Х определим значение f равенством
' 7 (Ь—а)
(9)
где 5(Л)— площадь фигуры А. Ясно, что /(х)=1. Свойство (8) для функции (9) выполняется, поскольку площадь объединения двух непересекающихся фигур равна сумме площадей этих фигур.
Пример. Два приятеля договорились встретиться в установ-
ленном месте в промежутке времени от 6 до 7 ч. По взаимному
соглашению каждый приходит на место встречи в случайный наугад выбранный момент и ждет другого ровно 10 мин. Какова вероятность того, что приятели встретятся?
Решение. Пусть х и у означают моменты прихода на место встречи первого и второго приятеля соответственно. Такое событие удобно отметить точкой квадрата (рис. 37). Условие встречи заключается в том,
Рис. 37 что
5.2. Формулы Байеса. Схема Бернулли. Теоремы Муавра—Лапласа и Пуассона 203 |x-j>|<1/6 (*)
(сторона квадрата соответствует часу времени, 10 мин составляет 1/6 ч). Множество точек, удовлетворяющих условию (*), отмечено на рисунке штриховкой. Площадь этого множества равна 11/36. Согласно формуле (9), вероятность встречи _ 11/36 __н
^~(7-6)2""Зб’
Здесь применение формулы (9) обосновано следующими соображениями. По условию каждый из приятелей приходит на место встречи, выбирая момент прихода наугад; подразумевается, что моменты прихода «распределены равномерно».
§ 5.2. Условная вероятность. Независимость событий. Вероятность произведения событий.
Теорема о полной вероятности.
Формулы Байеса. Последовательность независимых испытаний (схема Бернулли). Предельные теоремы Муавра—Лапласа и Пуассона
1°. Теорема умножения вероятностей. Определение 1. Событие А называется независимым от события В, если вероятность события А не зависит от того, наступило событие В или нет. В противном случае событие А называется зависимым от события В.
Комментарий к определению 1. В дальнейшем будет доказано, что если случайное событие А не зависит от В, то и В не зависит от А.
Примеры. 1. Монету подбрасывают два раза. Событие А состоит в том, что в первый раз выпадет герб, а событие В—в том, что во второй раз выпадет решка. Эти события, очевидно, независимы, поскольку второе бросание никак не может повлиять на первое.
2. Из деревьев леса наудачу выбирают одно. Событие А состоит в том, что дерево высокое (выше некоторого уровня, равного, например, 15 м), а событие В—в том, что дерево толстое (скажем, диаметр ствола больше 1 м). Эти события зависимы, поскольку вероятность выбрать высокое дерево увеличивается, если выбирать его среди толстых деревьев.
Определение 2. Вероятность наступления события А при условии, что событие В наступило, называется условной вероятностью и обозначается Рв(^)-
Теорема 1 (теорема умножения вероятностей). Вероятность произведения событий А и В равна произведению вероятности события А на условную вероятность события В при условии, что А произошло, т. е.
204
Глава V. Теория вероятностей
Р(Л^)=Р(Л)Рл(В). (1)
Для независимых событий А и В справедливо равенство
Р(ЛВ) = Р(Л)Р(В). (2)
Доказательство. Убедимся в справедливости теоремы для случая конечного пространства элементарных
исходов.
Пусть событиям А и В соответствуют множества Л* и В*. изображенные на рис. 38. Далее, пусть область Л* содержит к точек, область В*—/ точек и в пересечении Л*Р|2?*
содержится т точек; всего же в пространстве элементарных исходов имеется п точек. По определению, Р(Л) = /с/и, Р(Л2?) = т!п (произведение АВ изображается множеством Л*Р|2?*). Заметим, что условная вероятность Рд(^) равна отношению т!к\ действительно, событию В при условии, что Л произошло, благоприятствуют т элементарных исходов, а наступление события Л означает наступление одного из к элементарных „ т к т
исходов. Так как - = -* — , то п п к
р(^)=р(л)рл(4
т. е. имеет место равенство (1).
В случае, когда событие В не зависит от события Л, имеем Р(В) = РЛ(/?) и равенство (1) примет вид Р(Л2?) = Р(Л)Р(В).
Следствие. Если случайное событие В не зависит от Л, то и А не зависит от В.
Действительно, по условию Р(Л2?) = Р(Л)Р(2?) = Р(1?)Р(Л); кроме того, по теореме умножения вероятностей Р(Л1?) = Р(2?)РВ(Л). Поэтому в случае Р(7?Ы0 имеем Р(Л) = = РВ(Л), т. е. событие Л не зависит от В.
Примеры. 1. В урне находятся 3 черных и 2 белых шара. Из урны извлекают последовательно (без возвращения) два шара. Событие Л состоит в том, что первым будет взят белый шар, а событие В—в том, что второй шар окажется черным. Найти вероятность произведения (т. е. совместного наступления) событий Л и В.
Решение. В силу теоремы умножения вероятностей имеем Р(Л/?) = Р(Л)Рл(В). Очевидно, что Р(Л) = 2/5. Так как после извлечения белого шара в урне осталось 4 шара—1 белый и 3 черных, то при этих условиях вероятность извлечения черного шара Рл(1?) = 3/4. Итак, Р (Л/?) = (2/5)-(3/4) = 6/20 = 3/10.
2. Какова вероятность выпадения двух гербов при двукратном бросании монеты?
5.2. Формулы Байеса. Схема Бернулли. Теоремы Муавра—Лапласа и Пуассона 205
Решение. Пусть А — выпадение герба при первом бросании, а В—выпадение герба при втором бросании; тогда Р(Л2?) = = Р(Л)Р(Б) = (1/2)-(1/2)= 1/4.
Аналогично, применяя теорему умножения несколько раз, получаем: вероятность того, что при п бросаниях монеты герб выпадет п раз, равна (1/2)и.
2°. Формула полной вероятности. Теорема 2 (теорема о полной вероятности). Пусть Вг,. В2, ..., Вк— попарно несовместные события, имеющие соответственно вероятности Р(Л), Р(Л2),Р(^). Пусть событие А может наступить только вместе с одним из событий Въ В2, .... Вк и Р^(Л), Рв2(Л), .... р«,(4 —условные вероятности события А при условии, что В19 В2, ..., Вк наступили. Тогда вероятность Р(Л) события А равна сумме произведений вероятностей событий Вк на условные вероятности Рвк(Л):
Р (Л) = Р (БО Р^ (А) + Р (Б2) Ря2 (А) + ... + Р (Л) РВк (Л). (3)
Доказательство. По условию, Л (^1 + ^2+... +В^ = А и АВ1-уАВ2А-... + АВк = А. Применяя сначала теорему сложения, а затем теорему умножения вероятностей, получим
Р(Л>Р(Л^) + Р(Л2?2) +... +Р(ЛВ*) =
^Р(В1)Р^1(Л) + Р(Б2)Р^2(Л)+...+Р(^)Р^(Л).
Формула (3) называется формулой полной вероятности.
Пример. Производится серия из четырех выстрелов по некоторому объекту. Вероятности попадания в цель одного, двух, трех и четырех снарядов заданы таблицей
1 2 3 4
0,4 0,26 0,22 0,03
Вероятности разрушения объекта при условии попадания одного, двух, трех и четырех снарядов даны в таблице
1 2 3 4
0,5 0,7 0,8 0,99
Найти вероятность разрушения объекта.
Решение. Первая таблица задает вероятности Р^), Р(^2), Р(2?з), Р(Т?4), а вторая —вероятности Р^ (Л), Рв2(Л), Р» (Л), Рв4(Л) (событие Bi состоит в попадании в цель i (i= 1, 2, 3, 4) снарядов, событие Л—разрушение мишени). По формуле (3) находим
Р (л) = 0,4 • 0,5 + 0,26 • 0,7 + 0,22 • 0,8 + 0,03 0,99 - 0,5877.
206 Глава V. Теория вероятностей
3°. Формулы Байеса. Теорема 3 (теорема Байеса). Пусть события Вг, В2, Вк попарно несовместны и пусть событие А может наступить только вместе с одним из событий Вг, В2, Вк. Известны вероятности Р(^), P(J?2), •••> Р(Д0 событий В{, В2, .... Вк и условные вероятности РВ\А), P^2(J), ..., Р^(Л) события А при условиях Вг, В2, Вк. Известно также, что событие А наступило. Тогда вероятности событий Bt, В2, .... Вк при условии, что событие А наступило, находятся по формулам
? ----- ----- z= 1, 2, к. (4)
V 17 Р(В1)Рй1(Л)+Р(Д2)Рв2(Я)+... + Р(А)РЯ1(Л)’
Комментарии к теореме 3. 1) Вероятности РЛ(Д) называются послеопытными (апостериорными) вероятностями событий Bi, а вероятности Р(Д)—доопытными (априорными) вероятностями событий В^ Эти вероятности различаются, как будет видно из примеров.
2) Знаменатель в правой части формулы (4) совпадает с правой частью формулы (3) и равен P(j).
3) События Вг, В2, ..., Вк называются часто гипотезами и формула (4) дает вероятности гипотезы Bt. при которой наступило событие А.
Доказательство. Согласно теореме умножения вероятностей, имеем
Р (A ,В{) = РА (Д) Р (А) = Р (Д) РЛ (А).
Отсюда
(5)
Подставляя в знаменатель правой части равенства (5) вместо Р(т4) правую часть формулы (3), получаем соотношение (4).
Формулы (4) называются формулами Байеса (или формулами гипотез).
Пример. Поломка прибора (событие А) может быть вызвана одной из трех причин В19 В2, В3, вероятности которых Р (Bj = 0,7, P(jB2) = 0,2, P(B3) = OJ. При наличии этих причин поломка прибора происходит с вероятностями Р^ (Л) = 0,1, P#2(J) = 0,2, Р#з (Л) = 0,99. Известно, что прибор вышел из строя. Найти вероятности Рл(2?1), Ра(^з)-
Решение. Используя формулы (4), получим
Рл(^) =_______=
7 0,7-0,1 + 0,2’0,2 + 0,1 -0,2 0,13 13
5.2. Формулы Байеса. Схема Бернулли. Теоремы Муавра—Лапласа и Пуассона 207
р (Д)- °-2'0-2 _0,04_ 4 .
2' 0,7-0,1+0,2-0,2 + 0,1-0,2 0,13 13 ’
Рл(в3)=--------------------=о^^^;
37 0,7-0,1+0,2-0,2 + 0,1-0,2 0,13 13
Из результатов вычислений видно, что апостериорные вероятности отличаются от априорных.
4°. Последовательность независимых испытаний (схема Бернулли). Пусть производится серия из п испытаний, в каждом из которых событие А может наступить, а может и не наступить. Пусть при этом выполнено следующее условие: вероятность р наступления события А в каждом испытании постоянна, т. е. не зависит ни от номера испытания, ни от результатов предыдущих испытаний.
Это условие означает, что последовательность испытаний независима (вероятность р не зависит от результатов предыдущих испытаний).
Последовательность испытаний, удовлетворяющих указанному условию, называется последовательностью независимых испытаний (или схемой Бернулли). Схема Бернулли полностью определяется двумя числами—натуральным числом п. означающим количество испытаний, и числом р (0</?<1), означающим вероятность наступления события А в одном испытании (безразлично, в каком по счету).
Примеры. Следующие серии опытов представляют собой конкретные модели схемы Бернулли:
1. Монету подбрасывают п раз; вероятность появления герба в одном испытании есть р = 1 /2.
2. Производят п выстрелов по мишени. Предполагается, что вероятность попадания в мишень при каждом выстреле постоянна и равна р.
Отметим, однако, что если в процессе стрельбы стрелок пристрелялся и стал лучше поражать мишень, то такая последовательность испытаний не является схемой Бернулли.
3. Из кучи зерна отбирают п зерен для проверки их на всхожесть. Вероятность того, что каждое зерно при проверке дает положительный результат, постоянна (так будет, например, в том случае, когда куча зерна большая, а зерна отбирают наугад после перемешивания).
В связи со схемой Бернулли рассматривают такие задачи:
1. Найти вероятность Ри (fc) того, что в серии из п испытаний событие А наступит ровно к раз. Решение этой задачи дает формула Бернулли (см. ниже, п. 5°).
2. Найти вероятность P„(/q, к^ того, что в серии из п испытаний количество к наступлений события А будет находиться в пределах кг^к^к2.
208
Глава V. Теория вероятностей
3. Решить задачу 1 для больших чисел пик (формула Бернулли, дающая решение задачи 1, неудобна для вычислений при больших пик). Задача 3 решается с помощью локальной теоремы Муавра — Лапласа (см. ниже, п. 6°).
4. Решить задачу 2 для больших чисел л, к2 (формула Бернулли мало пригодна для вычислений Ри(&19 к^ при больших п. кх, к2). Задача решается с помощью интегральной теоремы Муавра—Лапласа (см. ниже, п. 7°).
5°. Формула Бернулли. Вероятность P„(&) того, что в последовательности из п испытаний в схеме Бернулли событие А наступит ровно к раз, выражается формулой
Pn(k) = Cknpkqn-k
(6)
п(п— 1)(и — 2)—к+ 1)
где С„=—----------—------L—число сочетании из п элементов
1 • 2... Аг
по к. р — вероятность наступления события А в одном испытании; q=\ —р — вероятность ненаступления события А в одном испытании.
Вывод формулы Бернулли приведен в § 5*.2, 1.
Примеры. 1. Найти вероятность того, что при 10-кратном бросании монеты выпадет ровно 3 герба.
Решение. Здесь /7=10, к = 3. p = q=\!2. Согласно формуле Бернулли, получим
/Д3 /Д'7
Рю(3) = С?о(у
10-9-8 / 1V°_ 120 1-2-3 \2/ ”Т024‘
2. Пусть вероятность поражения мишени при одном выстреле равна 1/3. Найти вероятность того, что из 6 выстрелов три поразят мишень.
Решение. Используя формулу Бернулли при /7 = 6, к=3, р=А/3, q = 2/3, находим
Р6(3) = С1
лу лу узу узу
6-5-4 8 _160
1 -2-3 729”"729*
3. Пусть вероятность того, что взятое наудачу из кучи зерно окажется всхожим, равна 0,9. Какова вероятность того, что из 7 отобранных зерен ровно 5 окажутся всхожими?
Решение. Имеем
р7(5) = С70,94 5 • 0,12 = 7'6'5,4'3 = 21 • 0,0059049 = 0,124. 'v 7 7 ’ 1 -2-3-4-5
4. В схеме Бернулли, связанной с бросанием монеты,
вычислить вероятности Р10(£), где /< = 0, 1, 2, ..., 10 (т. е. веро-
ятности того, что в 10 испытаниях герб выпадет ровно к раз).
5.2. Формулы Байеса. Схема Бернулли. Теоремы Муавра—Лапласа и Пуассона 209
Решение. Используя формулу Бернулли при /?=д=1/2, к = 0, 1, 2, 10, получим Р1О(0)= 1/1024, Р10(1)= 10/1024, Р10(2)= 45/1024, Р10(3)= 120/1024, Р10(4)= 210/1024, Р10(5) = = 252/1024, Р10(6) = 210/1024, Р10(7)= 120/1024, Р1О(8) = 45/1024, Р10(9)= 10/1024, Р10(10)= 1/1024.
Результаты вычислений иллюстрирует рис. 39. Как видно из рисунка, наибольшей из вероятностей Р10(£) является Pt0(5)« «0,25. Сравнительно велики и значения Р10(4) и Р10 (6) («,0,21); в то же время «крайние» значения к дают Р10(0) = Р10(10)^0,001.
Обратим внимание на характерный вид изображенной на рисунке ломаной, имеющей пик в точке к=5. В дальнейшем нам часто придется иметь дело с кривой у = —— е~х /2 (рис. 40). Она называется гауссовой кривой (или кривой нормального распределения) и играет исключительно важную роль в теории вероятностей.
Тот факт, что ломаная на рис. 39 и кривая на рис. 40 имеют значительное сходство, не случаен. Причины этого явления раскрываются локальной теоремой Муавра — Лапласа.
Для вычисления вероятностей Pw(A?i, /<2) того, что в схеме Бернулли из п испытаний количество т наступлений события А будет находиться в пределах k1^m<k2, можно использовать формулу
Ри(/с1,Л2)=Р„(А:1)+Ри(^1+1)+...+Р„(Л2-1). (7)
[Событие, о котором идет речь, является суммой попарно несовместных событий Bt (i=k1, k-y 1, ..., k2 — 1), состоящих в том, что в п испытаниях событие А наступит ровно i раз; затем, используя теорему сложения вероятностей, получаем формулу (7).]
Пример 5. Найти вероятность того, что при десяти бросаниях монеты количество т гербов окажется в пределах 2^т<8.
Решение. Используя формулу (7) и значения Р10(&) из примера 4, получим
210
Глава V. Теория вероятностей
та /о о\ 45+120 + 210 + 252 + 210+120 957
р10(2, 8) =----------—-------------= ^0,95.
1024
Тот факт, что вычисленная вероятность оказалась близка к единице, означает, что рассматриваемое событие весьма вероятно.
6°. Локальная теорема Муавра—Лапласа. Формула Бернулли (6), выражающая Ри(&) через п и р в схеме Бернулли, становится неудобной при больших п\ в этом случае затруднение вызывает вычисление Скп.
Существует удобный в практическом отношении способ вычисления вероятностей Р„(&) — приближенный, но достаточно точный при больших п. Его описание дано в следующей теореме.
Теорема 4 (локальная теорема с а). При больших значениях п в схеме приближенное равенство
Муавра — Лапла-Бернулли справедливо
Р„Д)«-к=
(8)
где х = -—— , а <р(х) = —!—е х^2.
yjnpq
Комментарий к теореме 4. 1)
Локальная теорема Муавра—Лапласа является глубоким математическим фактом, ее доказательство связано с использованием нетривиальных и тонких построений.
2) Функция ср(х), упоминаемая в теореме, табулирована: таблицы значений этой функции приведены в каждом учебнике по теории вероятностей. Эта функция четная; ее график называется нормальной или гауссовой кривой и изображен на рис. 41.
3) Заметим, Наибольшая из [к— ближайшее
что Р„(&) стремится к нулю при и->оо. вероятностей Р„(А?) достигается при кжпр к пр целое число). В этом случае
р« (/с)=-4- ф W = •
v npq у/2п '/npq
Пример. Вычислить вероятность того, что при 100-кратном бросании монеты герб выпадет: а) ровно 50 раз; б) ровно 60 раз.
Решение, а) Здесь и =100, к =50, /7=0,5, # = 0,5. Используя формулу (8), получим Р1ОО(50) = - 1 - - <р (х) = | <р (х), где
^/100-0,5-0,5 5
j>~ 5.2. Формулы Байеса. Схема Бернулли. Теоремы Муавра—Лапласа и Пуассона 211
50-0,5-100 л
х= = 0. Следователь-
^/100-0,5-0,5
но, Р100 (50)=| ф (0)=| 0,3989 = = 0,079 (значение ср (0) найдено по таблице).
б) Аналогично находим Рюо(60) = ^ф(х), где х=
60-0,5 100 10 . „
=------------= — = 2. Таким
5
Рис. 41
образом, Р100 (60)=- ср (2) =
У’100-0,5-0,5 =| 0,0540 = 0,0108.
Из формулы (8) вытекает, приближенно совпадает с графиком функции /(х)=-^1
что график функции Рн(/<) , где y/npq
пР к—целое число. Это означает, что график функции yjnpq
Р#) приближенно совпадает с гауссовой кривой у = = ср6с)=—5=е-х/22, сдвинутой вправо на пр и сжатой по V2k
вертикали в x/npq раз. При этом график Р„(/с) обладает характерной чертой — наличием пика в точке к^пр (рис. 41). Более строгая формулировка локальной теоремы Муавра —
Лапласа приведена в § 5*.2, 2,
7°. Интегральная теорема Муавра — Лапласа. Вычисление вероятностей Pn(Zq, к2) в схеме Бернулли по формуле (6) при больших п является еще более затруднительным, чем использование формулы Бернулли для вычисления Р„(/<). Заметим, что в практическом отношении вероятности P„(/q, /с2) имеют большее значение, чем Р„(£). Действительно, при больших п часто бывает не столь существенным знать то обстоятельство, что событие А произойдет ровно к раз, но важно знать, что количество наступлений этого события будет находиться в заданных пределах. Так, при проверке семян на всхожесть не столь важно знать, что из выбранных 1000 семян ровно 907 окажутся всхожими, но важно знать, что всхожесть семян находится в пределах от 900 до 950.
Как отмечалось выше, вероятности Ри(£) при больших п малы. Вероятности Р„(/с1? /<2) могут быть сколь угодно близки к единице.
Удобный приближенный способ вычисления вероятностей Pn(Zq, в схеме Бернулли дает следующая теорема.
212
Глава V. Теория вероятностей
Теорема 5 (интегральная теорема Муавра — Лапласа). При больших значениях п в схеме Бернулли имеет место приближенное равенство
Р„(/С1, /с2)»ф(^)-ф(/с[),
(9)
ч , . кл—пр . , кэ — пр где к[= ——к2 = ~—-
*Jnpq у/пр<1
ф(х)= — е %2//2dx.
о
Комментарий к теореме 5. 1) Функция ф(х) называется функцией Лапласа] она табулирована. Таблицы функции ф(%) даны в каждом учебнике по теории вероятностей. Эта функция нечетная, ее график изображен на рис. 42.
2) Отметим, что Ф(0) = 0, Ф(1) = 0,3413, Ф (2) = 0,4772, ф(3) = = 0,4986, ф(оо) = 0,5. Таким образом, если в формуле (9) положить к2 = 3, к[ = — 3, то получим Ри(Ад, &2) = 0,9973.
Более строгая формулировка интегральной теоремы Муавра— Лапласа приведена в § 5*.2, 3.
Пример. Вычислить вероятность того, что при 100-кратном бросании монеты количество гербов будет находиться в следующих пределах: а) ]45, 55[; б) ]40, 60[; в) ]35, 65[.
Решение: Здесь Ад =45, к2 = 55, /? = 0,5, # = 0,5, п= 100.
Дnpq = Д100-0,5-0,5 = 5.
а)^=^22=-1, fc = 22_22=l; Р1ОО(45, 55)«Ф(1)-
— ф(—1) = 2ф(1) = 0,6826.
б) А: = 22122=-2, £ = £2122=2; Р1ОО(40, 60)«Ф(2)-
-Ф(- 2) =2Ф(2)= 0,9545.
в) £ = 22122=-3, £ = 22122=3; Р1ОО(35, 65>ф(3)~
— ф(—3)=2ф(3) = 0,9973.
Из результатов вычислений видно, что вероятности рассматриваемых событий достаточно велики, в особенности последняя вероятность, равная 0,9973.
События, имеющие большую вероятность, называются практически достоверными. В этом случае считается, что в результате опыта событие
J 5.2. Формулы Байеса. Схема Бернулли. Теоремы Муавра — Лапласа и Пуассона 213 обязательно наступит. Насколько должна быть велика вероятность, чтобы событие считать практически достоверным? Это зависит от характера задачи: во всякой задаче замена случайного события практически достоверным содержит «элемент риска». Ясно, что в различных условиях допустимый риск различен. Все же часто останавливаются на вероятности 0,9973. Мы также примем за определение практически достоверного события такое случайное событие, вероятность которого не меньше, чем 2ф(3) = 0,9973.
8°. Правило «трех сигм» в схеме Бернулли. Рассмотрим схему Бернулли с большим количеством п испытаний; обозначим через а число y/npq. Из интегральной теоремы Муавра — Лапласа вытекает, что
Vn(np— За, пр+ = 0,9973. (10)
Действительно, при к1 — пр— За, к2 — пр+За имеем к[= — 3, к'2 = 3 и РДАд, £2>Ф(3)-Ф(-3) = 2Ф(3) = 0,9973.
Формула (10) позволяет для каждой схемы Бернулли указать интервал (Ад, к2) такой, что количество ненаступлений события А принадлежит этому интервалу с вероятностью 0,9973; иными словами, событие к±^т<к2 практически достоверно. Формула (10) называется правилом «трех сигм», а интервал ]к1У к2[, где кг = пр—3 у] прц, к2 — пр-\-3 ^Jnpq,— трехсигмовым интервалом.
Заметим, что трехсигмовый интервал оказывается удивительно узким. Если любому здравомыслящему человеку, не знакомому с теорией вероятностей, предложить угадать интервал, в который с практической достоверностью попадет количество наступлений событий при последовательных испытаниях, то, как правило, в ответе будет дан гораздо более широкий интервал.
Пример. Некоторая система состоит из 10 000 (независимых) элементов. Вероятность выхода из строя одного элемента равна 0,5. Пусть т — количество вышедших из строя элементов системы. Найти трехсигмовый интервал.
Решение. Имеем п= 10000, /> = 0,5, # = 0,5,
<5 = ^/10000-0,5 • 0,5 = 50, /q = л/> —3<5= 5000— 150, к2 = 5000+ 150. Итак, с вероятностью 0,9973 можно утверждать, что количество вышедших из строя элементов находится в пределах 5000 + 150 (событие практически достоверное).
В частности, если взять запас в 5000 элементов для замены вышедших из строя, то в 50% случаев этого запаса не хватит. Если же увеличить этот запас всего на 3%, т. е. взять 5150 элементов, то его хватит наверняка (т. е. с вероятностью
214
Глава V. Теория вероятностей
большей, чем 0,9973). Оценка трехсигмового интервала этого примера «на глаз», «по здравому смыслу» приводит, как правило, к большому преувеличению истинного значения.
С помощью интегральной теоремы Муавра—Лапласа можно пояснить, почему и в каком смысле вероятность р события А в одном испытании совпадает (приближенно) с частотой mln наступления события А в п испытаниях. Действительно, с____вероятностью _0,9973 выполняется неравенство
np-3y/njpq^m<np-]-3y/npq, откуда после деления всех его частей на п получим
р-3 1™^<р + 3 Я Л] п п \ п
Так как 3 ^/pqln-^Q при и-»оо, то частота т/п с практической достоверностью при больших п так угодно мало отличается от р.
Более строгая формулировка утверждения о близости частоты и вероятности дана в теореме Бернулли (один из вариантов закона больших чисел).
9°. Теорема Пуассона. Представляет интерес схема Бернулли с малой вероятностью р появления события А в одном испытании и с большим количеством п испытаний. Пусть при большом п малая вероятность р такова, что рп = а, где а—некоторое число. Вероятность Р„(&) в такой схеме Бернулли описывается следующей теоремой.
Теорема 6 (теорема Пуассона). Пусть и-»оо, я>0 постоянно и p = afn. Тогда в схеме Бернулли из п независимых испытаний, в каждом из которых вероятность наступления события А равна р, имеет место приближенное равенство
Pn(k) = P(k^e-“a^.
(Н)
Комментарий к теореме 6. Обратим внимание на следующее обстоятельство: вероятность наступления события А ровно к раз не зависит от п, что выглядит неправдоподобно. Это можно объяснить так. Пусть п велико; увеличивая п в ц раз и уменьшая р во столько же раз (так что рп не изменяется), мы в самом деле имеем Р„(/с, р)^Рии(£, р/ц). Таким образом, независимость вероятности рассматриваемого события от п объясняется тем, что она вычислена в разных схемах Бернулли.
Доказательство теоремы 6 приведено в § 5*.2, 4,
Пример. Телефонная станция получает в среднем за час s вызовов. Какова вероятность, что в данную минуту она получит ровно к вызовов?
5.2. Формулы Байеса. Схема Бернулли. Теоремы Муавра—Лапласа и Пуассона 215
Решение. Если разбить изучаемый интервал времени (1 мин) на п равных интервалов Az, то работу телефонной станции в эту минуту можно рассматривать как последовательность испытаний (в каждом малом интервале происходит испытание — будет или не будет получен вызов). Задача состоит в вычислении вероятности того, что
в этой последовательности из п испытаний событие А (вызов) наступит ровно т раз. Если данная последовательность испытаний является схемой Бернулли, то искомая вероятность есть Ри(т), где р— вероятность вызова в интервале Az (одинаковая при всех z).
Можно указать условия, при соблюдении которых построенная последовательность испытаний окажется схемой Бернулли (см. § 5*.2, 5). Реальные телефонные станции в главных чертах этим условиям удовлетворяют.
При упомянутых условиях вероятность р (вызов в интервале времени Az) равна ^/(бОлг). Тогда произведение a=pn = slf& и согласно формуле (11) находим
к\
Если нас интересует вероятность Р(&, /) того, что за t минут произойдет ровно k вызовов, то, рассуждая аналогично, получаем
e-*/6O(5Z/60)fc к\ "
или, полагая Х, = 5/60,
Графики функций Р(0, /), Р(1, /), Р(2, /) изображены на рис. 43.
Функции Р(&, г) играют большую роль в теории массового обслуживания (так называется раздел теории вероятностей, изучающий математические аспекты случайного
216
Глава V. Теория вероятностей
потока требований или заявок на обслуживание и методы оптимального распределения этих заявок по обслуживающим центрам). Теория массового обслуживания в настоящее время широко применяется на практике при проектировании предприятий, предназначенных для обслуживания заявок,— телефонных станций, магазинов, аэропортов и т. п.
§ 5.3. Случайная величина. Дискретные и непрерывные случайные величины. Интегральная и дифференциальная функции распределения. Биномиальное, пуассоновское, нормальное, равномерное и показательное распределения.
Совместное распределение нескольких случайных величин. Независимость случайных величин
1°. Случайная величина. Понятие случайной величины является одним из основных понятий теории вероятностей. Случайной величиной называется величина, которая в результате испытания принимает то или иное значение. При этом заранее неизвестно, какое именно значение случайная величина примет в результате опыта.
Изучая случайную величину, прежде всего интересуются множеством ее возможных значений. Это может быть конечное множество чисел или счетное множество чисел, не имеющее предельной точки (например, множество Z целых чисел). Такие случайные величины называются дискретными.
Возможно, что множество значений случайной величины содержит целый отрезок числовой оси. Такие случайные величины называются непрерывными.
Примеры случайных величин:
1. Количество очков, выпавшее при бросании игральной кости; множество значений {1, 2, 3, 4, 5, 6}.
2. Количество наступлений события А в схеме Бернулли; множество значений {0, 1, 2, ..., п}.
3. Количество элементов, вышедших из строя в системе из п элементов; множество значений {0, 1, 2, ..., п}.
4. Время безотказной работы электролампы; множество значений [О, Т], где Т—максимальное время безотказной работы.
5. Расстояние между центром мишени и точкой попадания; множество значений [0, £], где L — максимальное отклонение точки попадания от центра мишени.
6. Угол между начальным направлением и направлением остановившейся стрелки рулетки; множество значений [0, 2 л].
Случайные величины в примерах 1—3 являются дискретными, а в примерах 4—6 — непрерывными.
Определение 1. Распределением дискретной случайной величины называется функция, сопоставляющая каждому воз-
£ 5.3. Интегр. и дифференц. функции распределения. Совместное распределение
217
можному значению хк случайной величины ее
рк причем Ха=1-
Распределение дискретной случайной величины числом п возможных значений удобно задавать
вероятность
с конечным таблицей
Pi
Так, для случайной величины из примера 1 таблица
распределения имеет вид
1/6
1/6
Для случайной величины из примера 2 при п—10, р—^-12 таблица распределения такова (см. пример 4 п. 2° § 5.2):
0 1 2 3 4 5 6 7 8 9 10
1/1024 10/1024 45/1024 120/1024 210/1024 252/1024 210/1024 45/1024 10/1024 1/1024
Распределение полностью характеризует случайную величину, указывая возможные значения и вероятности, с которыми эти значения появляются в результате испытаний. Для первого из рассмотренных распределений все значения равновероятны, а для второго значения резко различаются по своим вероятностям: значение 10 имеет вероятность, в 252 раза меньшую, чем значение 5. Это, в частности, означает, что случайная величина принимает значение 5 в 252 раза чаще, чем 10.
Перейдем к обсуждению понятия распределения непрерывной случайной величины. Рассматривают два вида распределений непрерывной случайной величины: интегральное и дифференциальное; их называют также интегральной и дифференциальной функциями распределения, интегральным и дифференциальным законами распределения.
Определение 2. Интегральной функцией распределения непрерывной случайной величины X называется функция переменной /, выражающая вероятность того, что X в результате испытания примет значение, меньшее, чем число t.
Комментарии к определению 2. 1) Если вероятность того, что случайная величина X примет значение, меньшее чем t, обозначить через PLVcz), то интегральная функция распределения есть функция F(t) переменной /, определенная равенством
218
Глава К Теория вероятностей
F(t)=T>(X<i). (1)
2) Для непрерывной случайной величины X невозможно задать распределение по аналогии с дискретной случайной величиной. Действительно, для каждой непрерывной случайной величины X вероятность того, что X примет заданное значение х, как правило, равна нулю. Это видно из следующих рассуждений. Пусть все значения случайной величины принадлежат отрезку [а, &]. Разобьем этот отрезок на п равных частей Az (i= 1, 2, ..., л, п — велико) и обозначим через Pi вероятность того, что случайная величина X примет значение в интервале Az. Будем предполагать, что близкие значения величины X имеют близкие вероятности. При этом предположении каждое значение, принадлежащее интервалу Az (z = l, 2, ..., л), имеет вероятность, равную нулю. Действительно, разделим интервал Az на N частей А< (7=1, 2, ..., N); тогда вероятность того, что случайная величина X примет значение из А'-, равна (приближенно) PifN, а вероятность Р(х) того, что случайная величина X примет значение, равное х, меньше чем pjfN при любом N. Отсюда следует, что Р(х) = 0.
Бессодержательно говорить о вероятности появления данного конкретного значения случайной величины (такие вероятности для всех непрерывных случайных величин, как правило, равны нулю и поэтому не дают никакой информации о случайной величине).
Имеет смысл рассматривать и изучать вероятности Р (а^х<Р) того, что значение непрерывной случайной величины X попадет в заданный интервал [ос, р[. Такие вероятности, как правило, не равны нулю и содержат нужную информацию о случайной величине. Функция F(t) выражает вероятность того, что случайная величина X примет значение на множестве 1 —оо, Отсюда легко получить вероятности вида Р(ос^Х<р).
Свойства интегральной функции распределения 1 °. Справедливы равенства
F(-oo) = 0, F(+oo) = l. (2)
В самом деле, событие Х< — оо невозможно, его вероятность F / — оо) = 0; событие Х< + со достоверно, его вероятность /Д+ ос)= 1.
2°. Функция F(t)—монотонно неубывающая, т. е. F(t^^ ^F(t2) при Zi</2-
3°. Вероятность P(tr^X<t^ того, что случайная величина X примет значение в полуинтервале [/15 /2[, равна F(t2] — F(t), т.е.
P(t1^X<t2)=F(t2)-F(t1). (3)
5.3. Интегр. u дифференц. функции распределения. Совместное распределение
219
Действительно, очевидно, что ]-оо, /1] и ирь = С>] (рис.
44). Согласно теореме сложения вероятностей, имеем
F^t^P^Xct^F^ (4)
где F(t^ и F(z2) по определению равны вероятностям того, что X примет значение соответственно непосредственно вытекает
Рис. 44
в ] — оо, zj и ] — оо, Z2]. Отсюда равенство (3).
Определение 3. Пусть X—непрерывная случайная величина и F(z)—ее интегральная функция распределения; пусть, кроме того, F(z) дифференцируема всюду, за исключением, быть может, конечного числа точек.
Производная F'(z) интегральной функции распределения называется дифференциальной функцией распределения (дифференциальным законом распределения) непрерывной случайной
величины X.
Комментарии к определению 3. 1) Значения функции /(z)^F'(z) называются плотностью вероятности случайной величины X. Такое название объясняется следующими обсто
ятельствами.
По определению производной,
/(/)= lim F(f+A^ F(f). (5)
At—►О AZ
Выражение F(z+Az)—F(z) в силу (3) равно вероятности того, что X примет значение в интервале [z, Z + Az[; отношение —— — есть «средняя вероятность», т. е. вероятность P(z^Jf<Z + Az), отнесенная к единице длины. Предел этого отношения естественно назвать плотностью вероятности.
2) Из формулы (5) вытекает, что
F(z+Az)-F(z)^/(z)Az (6)
[если в равенстве (5) опустить знак предела, то при малом At оно из точного станет приближенным и в качестве следствия даст (6)].
Равенство (6) означает, что выражение /(z) A t приближенно равно вероятности P(z^X<Z + Az) того, что случайная величина X примет значение в (малом) интервале [z, Z+Az[, т. е.
220
Глава V. Теория вероятностей
(7)
3) Полезно иметь в виду прием, позволяющий преобразовать непрерывную случайную величину X в дискретную случайную величину X с помощью малого изменения.
Разобьем числовую ось на равные малые отрезки точками h (z = 0, ±1, ±2, ...); пусть = — tt. По данной непрерывной
случайной величине X построим дискретную случайную величину X следующим образом. В качестве значений случайной величины X возьмем числа t, (z = 0, ±1, ±2,...); вероятность значения хг положим равной вероятности того, что непрерывная случайная величина X примет значение в интервале [r£, ti+1 [, т. е.
Р (tt X < ti+х)=Р (/г < Х< ti + А/) =/(/г) А/. (8)
Таким образом, таблица распределения дискретной случайной величины X в первой строке содержит числа а во второй—соответствующие им вероятности /(A t.
Очевидно, что соответствующие значения случайных величин X и X мало отличаются. Также мало отличаются и вероятности вида Р(а^Х<|3) и Р(а^У<Р).
Свойства дифференциальной функции распределения
1 °. /(z>0 в точках t. где существует
В самом деле, так как F(t\ является неубывающей функцией, то /(/)=F'(/>0.
2°. Справедливо равенство
Р
P(a^<p) = J/(/)dZ. (9)
а
Действительно, если /(/) непрерывна на [ос, Р[, то, вычисляя определенный интеграл по формуле Ньютона—Лейбница, получим
Р
f/(Od/=F(z)|₽ = F(p)-F(a) = P(a^X<₽). (10)
а
Здесь учтено, что F(t)—первообразная функция для а также равенство (3).
3°. Справедливо равенство
+ оо
f /(0^=1- (Н)
— 00
Оно вытекает из соотношений (9) и (2).
Геометрический смысл дифференциальной функции распределения иллюстрирует рис. 45: вероятность Р(сх^Х<р) чис-
5.3. Интегр. и дифференц. функции распределения. Совместное распределение
221
ленно равна площади заштрихованной криволинейной трапеции.
2°. Биномиальное, пуассоновское, нормальное, равномерное и показательное распределения. Определение 4. Распределение случайной величины т, равной количеству наступлений события А в схеме Бер-
нулли из п испытаний, называется биномиальным распределением.
В этом распределении значению £g{0, 1, 2, п} случайной величины т соответствует вероятность Рл(/с)^ Ckpkqn~\ trq р—вероятность наступления события А в одном испытании, a q=\-p.
Комментарий к определению 4. Биномиальное распределение дискретно (т. е. является распределением дискретной случайной величины т).
Примером биномиального распределения служит таблица на с. 217. Здесь и=10, р=1/2.
Определение 5. Распределение случайной величины
ак принимающей значения &е{0, 1, 2, ...} с вероятностями — е а,
где «>0 — некоторый параметр, называется пуассоновским распределением (или распределением Пуассона}.
Комментарий к определению 5. Пуассоновское распределение дискретно (т. е. является распределением дискретной случайной величины).
Модель пуассоновского распределения была рассмотрена в примере, описывающем работу телефонной станции (см. пример из п. 9° § 5.2).
Определение 6. Распределение непрерывной случайной величины У, заданное дифференциальной функцией распре-
деления
Л0=~т==е СУ^/271
— (Г —а)2/(2а2)
7
(12)
называется нормальным распределением, здесь agR и о О— некоторые параметры.
Комментарии к определению 6. 1) График функции (12) изображен на рис. 46. Его можно получить из «стандартного графика» нормального распределения f(t\= —е ~*212 х/2л
222
Глава V. Теория вероятностей
Рис. 46
(<7 = 0, СУ=1) СДВИГОМ
на а единиц вправо, последующим растяжением по горизонтали относительно оси симметрии в а раз. Напомним, что функция у=—L-e“x2/2 табули-рована. Эта функция упоминается в формулировке локальной теоремы Муавра—Ла
пласа.
Кривая
ж=
= ——=е (f °)2/<2ог2) симметрична относительно прямой х = а. а
Зависимость графика /(/) от параметров а и ст такова: а является абсциссой максимума функции; малым с соответ-
ствует крутой горб кривой, большим О’—пологий горб. Точки с абсциссами а — <з и я + <у являются" точками перегиба.
2) Интегральный закон распределения, соответствующий
дифференциальному закону f(t) =—j=e f2/(2<y2), имеет вид ах/2л
<5
(13)
Последний интеграл нельзя вычислить по формуле Ньютона — Лейбница, поскольку первообразная функция для —1 е-(х-«)2/2о2 не ВЫраЖаеТся через элементарные функции.
Однако удобно выразить F(t) через (табулированную) функцию
Лапласа Ф(/)= j —L=e“f2/2d/. Именно,
О
(14)
График функции (13) изображен на рис. 47.
3) Вероятность того, что случайная величина
X примет значение в интервале [а, р[, выражается через
$ 5.3. Интегр. и дифференц. функции распределения. Совместное распределение
223
интегральную F(t) и дифференциальную f(t) функции распределения следующим образом:
P(a<y<p)=F(p)-F(a),
(15)
₽ P(a<X<P) = f/Wd'
a
(16)
[ср. с формулами (9) и (10)].
Правые части равенств (15) и (16) можно выразить через
(табулированные) функции <р(^) =—-—е“*2/2 и Ф(/) =
а^/2л г
= —!—е“‘2/2<1г. Тогда получим
J <у^2п о
P(a^Jf<p) =
1 e-(t-a)2/(2o2)dz =
(p-a)/o
p
—-—e ~u2/2du =
J
(a- a) /<y
(17)
W~a)lcs
= J <p(/)dz.
(a-a)/о
Пример. Величина X распределена нормально с параметрами 67=5, сг=1. Найти вероятность того, что X примет значение в интервале [4, 7[.
Решение. Согласно формуле (17), получим
Р(4^Аг<7) = Ф^^^-Ф^^) = Ф(2)-Ф(-1)=
= Ф(2) + Ф(1)= 0,4772 +0,3413 = 0,8185
[напомним, что функция Лапласа Ф(/) нечетная, т. е. Ф(—1) =
= -фО)].
4) Функция y=f(t) быстро убывает при /--> + оо. Площадь под всей кривой равна 1 [это вытекает из соотношения (11)]. Площади криволинейных трапеций над интервалами [а — и, «+ a[, [a — 2<j, « + 2а[, [а— Зсу, tz+3(y[ равны соответственно 0,6827; 0,9545; 0,9973. Таким образом, почти вся площадь
224
Глава V. Теория вероятностей
под кривой сосредоточена над интервалом [а— За, я + 3а[. Поскольку площадь криволинейной трапеции численно равна вероятности того, что случайная величина примет значение в соответствующем интервале, имеем
Р(я —За^Х<я+За) = 0,9973. (19)
Это утверждение составляет содержание правила «трех сигм» для нормального распределения: практически достоверно, что нормальная случайная величина (т. е. случайная величина, имеющая нормальное распределение) с параметрами а. а принимает значения в интервале [а —За, & + За[. Слова «практически достоверно» означают—с вероятностью 0,9973.
5) Нормальное распределение (нормальная случайная величина) играет исключительно важную роль в теории вероятностей и в приложениях теории вероятностей к практическим задачам.
Эта роль объясняется тем, что нормальное распределение часто возникает следующим образом. Пусть некоторая случайная величина X складывается из большого количества «мелких» случайных величин. При выполнении некоторых (не очень ограничительных условий) вне зависимости от того, как распределены слагаемые, их сумма, т. е. величина X, оказывается нормально распределенной. Главным условием этого, как уже было отмечено, является то обстоятельство, что X есть сумма большого количества «мелких» случайных величин. Соответствующее строгое математическое утверждение носит название центральной предельной теоремы (см. § 5.6).
Если известно, что изучаемая случайная величина складывается из большого количества случайных слагаемых, каждое из которых оказывает лишь небольшое влияние на всю сумму, то можно считать, что X распределена нормально.
Например, ошибка, допускаемая при изменении какой-либо физической величины, складывается, по-видимому, из большого числа ошибок, вызванных многочисленными причинами. Поэтому, как правило, случайная ошибка измерения имеет нормальное распределение.
6) Вероятностный смысл параметров а и а будет установлен в § 5.4.
Определение 7. Распределение непрерывной случайной величины, заданное дифференциальной функцией распределения
{1 ^7
--- при a^t^b.
Ь-а
0 при t<a или t>b.
(20)
называется равномерным распределением на отрезке [а, й].
5.3. Интегр. и дифференц. функции распределения Совместное распределение
225
Комментарии к определению. 7. 1) График функции (20) изображен на рис. 48. Равномерно распределенная на отрезке [я, Z?] случайная величина (20) принимает значения только в отрезке [а, Ь].
2) Интегральный закон равномерного распределения имеет следующий вид:
'о
при t < а.
при a<t<b. (21)
при t>b.
График функции (21) изображен на рис. 49.
3) Вероятность Р(ос^У<Р) того, что равномерная случайная величина (т. е. случайная величина, имеющая равномерное распределение) примет значение в интервале [а, р[, принадлежащем [а, £], выражается формулой
р(а<у<р)=|л
(22)
Рис. 49
Таким образом, вероятность попадания значений равномерной случайной величины в интервал [ос, Р[с:[а, 6] зависит только от длины интервала [ос, Р[ и не зависит от положения этого интервала внутри [а, £].
4) В случае tz<oc<P<Z? вероятность Р(ос^Х<Р) численно равна площади области, заштрихованной на рис. 50, а.
В случаях ос^я<Р<& и жос<6<Р вероятности Р(ос^Х<р)
В — a h — CL
соответственно равны ----- и -----
Ь — а Ь — а
(рис. 50,6 и в).
Рис. 50
8 Мантуров О.В.
226
Глава V. Теория вероятностей
Если а = а, р = Ь, то
Р(я^Х<6)=1.
5) Моделью равномерного распределения может служить распределение из примера 6 п. 1°.
о" *£ Определение 8. Распреде-
ление непрерывной случайной ве-Рис- 51 личины X, заданное дифферен-
циальной функцией распределения
J^e at при />0, ( 0 при /<0,
(23)
называется показательным (экспоненциальным) распределением, здесь я>0 — некоторый параметр.
Комментарии к определению 8. 1) График функции (23) изображен на рис. 51; функция у=/(/) быстро убывает при /->оо. Величина X принимает только неотрицательные значения.
2) Интегральная функция распределения F(z) показательной случайной величины X имеет вид
1-e~at
при при
/>0, /<0.
(24)
Действительно,
/>0.
3) Если ос>О, (3>0, то вероятность того, что случайная величина X примет значение в интервале [ос, 0[, такова:
₽ Р
P(a^X<P)=f/(/)d/=F(z) =
« «
=Е(Р)—/г(а) = е-й“—е-о₽. (25)
Если же а<0, Р>0, то
Р(а^2Г<Р) = Р(0^Х<р) = 1- ей₽. (26)
Наконец, если а<0, Р<0, то Р (а<А'<р)=О. ч
4) В случае ос>О, (3>0 вероятность Р(ос^Т<0) численно равна площади области, заштрихованной на рис. 52, а, а в случае ос<О, (3>0 — площади области, заштрихованной на рис. 52,6.
f 5.3. Интегр. u дифференц. функции распределения. Совместное распределение
227
5) Показательное распределение возникает при описании работы телефонной станции (см. пример из п. 9° § 5.2). А именно, функция Р(/г, t)==e~lt ПРИ к = 0> т.е. е-х*, означает вероятность того, что за время t на телефонную станцию не поступит ни одного вызова. Противоположное событие, состоящее в том, что за время t на телефонную станцию поступит хотя бы один вызов, имеет вероятность 1—е“Хг, что совпадает с (24). Таким образом, случайная величина, значения которой равны моменту первого вызова, имеет показательное распределение.
6) Вероятностный смысл параметра X будет установлен в § 5.4.
3°. Совместное распределение нескольких случайных величин. Пусть в результате некоторого испытания случайные величины X и Y принимают значения х и у. Эта пара чисел задает точку на плоскости. По аналогии с интегральной функцией распределения одной случайной величины можно рассматривать функцию F(t±, t2), равную вероятности Р(Х</15 Y<t2) того, что в результате испытания величина X примет значение, меньшее чем z1? а величина Y—значение, меньшее чем t2. Функция
F(t1,t2)=P(X<t1, Y<t2) (27)
называется интегральной функцией совместного распределения двух случайных величин X и Y.
Аналогично, интегральная функция F^t^ t2, ..., tk) совместного распределения к случайных величин Х2, ..., Хк есть по определению функция
F(z1? z2> 4)-P(X1</1?X2<z2? Xk<tk\ (28)
Как видно из рис. 53, функция F(tx, /2) выражает вероятность попадания точки (х; у) в заштрихованную область. 8*
228
Глава V. Теория вероятностей
С помощью интегральной функции распределения F(z1? /2) можно вычислить вероятность Р(а^Х<Ь, c^Y<d) того, что пара значений величин У, Y будет удовлетворять неравенствам a^Xcb, c^Y<d, т. е. принадлежать прямоугольнику, изображенному на рис. 54, а именно, P(a^X<b, с^ Y<d) = F(b, d)-
-F(b, c)-F(a4 d]+F(a, c). (29)
Рис- 53 Аналогом дифференциальной функции распределения случайной величины для пары случайных величин является функция
<30) (JI1 С/12
d2F где ---- означает частную производную второго порядка от
dtrdt2
функции F по переменным /1? 12.
Можно доказать (см. § 5*.3, 1), что вероятность t2^Y<t2 + kt2) попадания значений пары случайных величин X и Y в малый прямоугольник с вершинами ^2 + ^2)? (/i + AZi; Af2), (ft +A/j; Z2 + A/2) равна /1(^1 ? с точностью до бесконечно малых более
высокого порядка малости, чем А/1? Az2 (в предположении, d2F
что частная производная ------ непрерывна). Таким образом,
8t2
P(/i Х< ti + A^i, t2У< t2 + A/2, ^2)А^|А/2» (31)
Функция /(/, r2) называется плотностью вероятности.
Формула (31) оправдывает такое название функции f \J\h, *2) есть вероятность, отнесенная к единице площади].
Пусть D— область на плоскости
переменных х, у и требуется найти вероятность Р((Х Y^eD) того, что значения пары случайных величин X, Y определят координаты некоторой точки из D.
Разобьем область D на малые прямоугольники со сторонами, параллельными осям координат (рис. 55). Тогда искомая вероятность будет приближен-
но равна сумме t2))/^t1At2, где
координаты «левой нижней»
£ 5.3. Интегр. и дифференц. функции распределения Совместное распределение
229
вершины малого прямоугольника с номером к. Предел этой суммы (если он существует) по определению равен двойному
интегралу ^2)^1 d/2-
D
Следовательно,
P((X r)eZ») =
=Шл)<М2. (32) D
Формула (32) является двумерным аналогом формулы (9).
Из формулы (32) следует,
Рис. 55
ЧТО
f f /(r1,z2)dr1dz2=l, (33)
поскольку в этом случае двойной интеграл означает вероятность достоверного события Р(— оо <Х< + оо, — оо<У< + оо).
В случае совместного распределения к случайных величин плотностью вероятности является функция
/(^1? ^2?
dkF
dt\ dt2 ••• Stk
(34)
где F определена равенством (28). Справедливы следующие аналоги формул (32), (33):
Р((Х, Х2, .... Xt)eD)=ff...f/(/1, t2, (35)
D
+ оо
ff /2>^)dz1dz2...dzk= 1. (36)
— 00
Можно говорить о совместном распределении двух дискретных случайных величин. Пусть xt и у^—значения случайных величин X и У, а и qj—соответствующие им вероятности; пусть pij означает вероятность совместного наступления событий x = Xi, Y=yj. Соответствие (xf, yi)-^Pij (событию x = xh Y—yj соответствует вероятность его наступления) называется совместным распределением пары дискретных случайных величин.
В частности, для независимых случайных величин X и У имеем
230
Глава V. Теория вероятностей
Определение 9. Пусть X и Y—две случайные величины, дифференциальные функции распределения которых соответственно равны g(t} и h(t}. Случайные величины X и Y называются независимыми, если плотность их совместного распределения — функция /(z1? /2) имеет вид
fib, t2)=g(ti)h(t2). (37)
Комментарий к определению 9. Покажем, что понятие независимости случайных величин, определенное формулой (37), тесно связано с известным понятием независимости случайных событий. Действительно, как следует из теоремы умножения вероятностей, для независимых случайных событий вероятность произведения событий равна произведению вероятностей этих событий, и обратно. При этом формула (37) имеет следующий вероятностный смысл. Так как /(z1? /2)А^Аг2 есть вероятность ^X<tA +Аг1? z2< У<г, + Аг2), g(/i)A/j — вероятность Р (/i < X< tr + \tr), a h (z2) Az2 — вероятность Р (г2 < Y< t2 + Az2 ), то соотношение
f(ti, t2)At1At2=g(t1)Atl-h(t2)At2 (38)
[следствие из (37)] устанавливает, что вероятность совместного наступления (произведения) событий А < X< + А^) и B(t2< К</2 + А/2) [левая часть (38)] равна произведению вероятностей этих событий. Следовательно, события А и В независимы (при любых tr и t2 и достаточно малых А/1? А/2).
В приведенном рассуждении подразумевается, что все равенства выполнены с точностью до бесконечно малых высшего порядка малости, чем рассматриваемый.
Можно говорить о независимой совокупности из к случайных величин Хг. Х2. .... Хк.
Для дискретных случайных величин X и Y независимость означает выполнение условия
K=j,1) = P(Jf=x1)-P(y=j1), (39)
т. е. в этом случае вероятность совместного наступления событий X=xY и Yравна произведению вероятностей событий Х=х± и Y=y1.
Если случайные величины X и Y зависимы, то дифференциальная функция их совместного распределения сложнее, чем (37). Величина X при фиксированном значении величины Y является случайной, ее распределение называется условным распределением X при заданном значении Y=y. Подробнее об этом см. § 5*.3, 2.
Для независимых случайных величин условное распределение X (при Y=y) совпадает с безусловным распределением X при любом у.
5.3. Интегр. u дифференц. функции распределения. Совместное распределение 231
4°. Функции случайных величин. Общепринятым и удобным является следующее определение функций одной и нескольких случайных переменных.
Определение 10. Пусть X—случайная величина и g(X) — функция, область определения которой содержит множество значений случайной величины X.
Функцией случайной величины X называется случайная величина g(X), которая в каждом испытании принимает значение g(x), где х—значение случайной величины X в том же испытании.
Пусть Х19 Х2, ..., Хк — случайные величины, a g(X1? Х2, Хк) функция к переменных, область определения которой содержит множество значений совместно распределенных величин Х19 Х2, ..., Хк.
Функцией случайных величин Х19 Х2, Хк называется случайная величина g(X15 Х2, —> которая в каждом испытании
принимает значение g(x15 х2, ..., хк), где х}, х2, ..., хк—значения случайных величин л15 Х2, ..., Хк в том же испытании.
Главным вопросом, связанным с изучением функций случайных величин, является вопрос о законах распределения этих функций.
Для функции одной случайной переменной решение этого вопроса дает следующее утверждение, вытекающее непосредственно из определения функции случайной величины.
Пусть X—дискретная случайная величина, g(X) - функция случайной величины X. Тогда случайная величина g(X) принимает значение g(xk) с той же вероятностью, что и случайная величина X значение хк (предполагается, что значения g(xk) (к= 1, 2, ...,) не совпадают между собой).
Имеет место аналогичное утверждение, описывающее распределение функции непрерывной случайной величины. Его описание связано с преобразованием случайной величины в дискретную (см. п. 1° § 5.3).
Действительно, пусть непрерывная случайная величина X задана дифференциальной функцией распределения /(z). Это означает, что значение tk случайная величина X принимает с вероятностью При этом случайная величина g(X)
принимает значение g(^) с той же вероятностью
Более строгое утверждение приведено в § 5*.3, 3- Там же описано распределение функции нескольких случайных переменных.
5°. Распределение суммы двух случайных величин. Рассмотрим важный частный случай—распределение суммы двух дискретных случайных величин, принимающих целые значения.
Теорема 1 (о распределении суммы дискретных случайных величин). Пусть X и Y—дискретные случайные
232
Глава V. Теория вероятностей
величины, принимающие всевозможные целые значения', величина X принимает каждое целое значение к с вероятностью рк, а величина Y принимает каждое целое значение I с вероятностью qi (к, 1=0, +1, ±2, ...). Тогда вероятность того, что случайная величина X+Y примет (целочисленное} значение т, выражается формулой
р(Х+у=^)= £ Р(Х=к, Y=l), (40)
к + 1 = т
где Р(Х=к, Y=l) означает вероятность совместного наступ-
ления двух событий Х=к, Y=l, а означает, что
к + 1 = т
суммируются все слагаемые Р(Х=к, Y=l), у которых к-\-1=т.
Если случайные величины X и Y независимы, то вероятность того, что случайная величина ХУ-Y примет значение т, находится по формуле
Р(У+У=щ) = £ pkqt. (41)
к + 1 = т
Доказательство. Событие X+Y=m является суммой несовместных событий Ак, состоящих в том, что Х=к, Y=m—k; вероятность каждого события Ак равна Р(Х=к, Y=m-k). Отсюда Р(Х+У=щ)=£Р(А)= £ Р(Х=к, Y=l), к + 1 = т
что совпадает с (40). Формула (41) является непосредственным следствием (40) при условии, что X и Y независимы; в этом случае Р(Х=к, Y=m — k)=pkym-k=pkyi, к-]-1=т.
Комментарий к теореме 1. Вероятности рк = Р(Х=к) и qt = P(Y=l) задают распределение случайных величин X и Y, а вероятности (40), (41) — распределение случайной величины У+К
Представляет интерес распределение суммы трех и более случайных слагаемых.
Для случая большого числа «небольших» случайных величин распределение суммы, как утверждается в центральной предельной теореме (см. § 5.6), близок к нормальному распределению (и фактически не зависит от распределения самих слагаемых).
Пример. Найти распределение суммы очков, выпавших на двух игральных костях.
Решение. Имеем Р1=Р2=Рз=РАг=Р5=Рв = ^1^ qi=qz = ==q3 = q4. = q5 = q6=z (случайные величины X и Y соответ-
ственно означают количество очков на первой и второй игральной кости). Так как величины X и Y независимы, то
j> 5.4. Мат, ожидание и дисперсия случ. величин. Ковариация, корреляция 233
1 2 3
P2=Pl<h=~, Рз=Р1Я2+Р2Я1=^, P4=P3<h+P2<h+Pl<13 = ~, Зо Зо Зо
4
Л =Р441 +Рз 02 +Р2 4з +Р1 04 = ТТ , Зо
Рб =Р5 41 +Ра42 +Рз 4з +Р2 4i +Р1 45 = , Зо
Р-1 =Р1 4 6 +Р205 +РЗ44 +Ра4з +Р5 42 +Рб41 = , Зо
р* =Рб 42 +Р5 4з +Р444 +Рз 45 +Р2 4б=^, Зо
4 3
P9 = P6q3 +Р544+Р445 +р544=Т-., Р10 =Рб44+Р545 +Р44в=-., Зо Зо
2 1
Рц — Рб<7з+.Р5<7б = 77? Р 12=РбЯб==^7‘ Зо Зо
Как видно из приведенных вычислений, наибольшая из полученных вероятностей является вероятность Р7 (появление семи очков на двух игральных костях).
Теорема 2 (о распределении суммы непрерывных случайных величин). Пусть X и Y—независимые случайные величины, a и g(t) — дифференциальные функции их распределений. Тогда дифференциальная функция распределе-+ 00
ния случайной величины X+Y имеет вид J /(z—s)g(s)cLs. — со
Доказательство приведено в § 5*.3, 4. + оо
Комментарий к теореме 2. Функция j /(z—s)g(.y)ds
— оо называется сверткой функций f(t) и g(z).
§ 5.4. Математическое ожидание, дисперсия и другие моменты случайных величин, их свойства.
Ковариация, коэффициент корреляции
1°. Математическое ожидание и дисперсия случайной величины.
Определение 1. Пусть X—дискретная случайная величина, закон распределения которой имеет вид
(1)
Pl Р2 - Рп
234 Глава V. Теория вероятностей
(Xi — значения величины X, а рг— соответствующие вероятности; z=l, 2, ..., п). Математическим ожиданием дискретной случайной величины X называется число 4
МХ= Y xkpk = XiP± + х2р2 + ... + х„рп. (2)
Определение 2. Пусть X—непрерывная случайная величина и /(/)—ее дифференциальная функция распределения. Математическим ожиданием непрерывной случайной величины X называется число
+ 00
МА = f (3)
— 00
(если этот интеграл сходится).
Математическое ожидание (дискретной или непрерывной случайной величины X) имеет следующий вероятностный смысл.
Пусть проведено N испытаний случайной величины X. в результате чего получены значения х1? х2, • Среднее арифметическое этих чисел
Х1+Х2+ ... +XjV z
~N '
при больших п близко к MI. Строгая формулировка и доказательство этого утверждения приведены в § 5.5.
Здесь мы приведем нестрогое рассуждение, поясняющее причины такого явления. Если величина X дискретна и ее распределение имеет вид (1), то в результате N испытаний мы получим prN раз значение х1? p2N раз — значение х2, —> pnN раз—значение х„; действительно, если вероятность события А равна р, то в N испытаниях событие А наступит примерно Np раз (согласно статистическому определению вероятности; см. п. 6° § 5.1). После N испытаний сумма значений будет приближенно равна XiprN+x2p2N+... +xnpnN. Среднее арифметическое полученных в результате испытаний значений равно
xlplNrx2p2N-\-... + xnpnN --------------------=L xkPk,
что совпадает с (2).
В связи с этим математическое ожидание называют также средним значением случайной величины.
Отметим еще раз, что математическое ожидание является (постоянным, не зависящим от опыта) числом, характеризующим определенное свойство случайной величины, а именно — устойчивость среднего арифметического полученных в результате испытаний значений.
Эта характеристика является важной, но далеко не полной.
5.4. Мат, ожидание и дисперсия случ. величин. Ковариация, корреляция 235
Следующее понятие также сопоставляет случайной величине некоторое число, характеризующее определенное свойство этой величины.
Определение 3. Пусть X — дискретная случайная величина с распределением (1). Дисперсией дискретной случайной величины X называется число
п
DX= £ (xk-MX)2pk, (5)
k=l
где MX—математическое ожидание случайной величины X.
Определение 4. Пусть X—непрерывная случайная величина и /(/)—ее дифференциальная функция распределения. Дисперсией непрерывной случайной величины X называется число
ВУ= f (z-MX)2/(Odz (6)
— 00
(если интеграл сходится); MX означает математическое ожидание случайной величины X.
Комментарии к определениям 3 и 4. 1) Данные выше определения можно объединить следующим образом: дисперсия случайной величины X есть математическое ожидание случайной величины (I-MX)2.
Действительно, для дискретной случайной величины X с распределением (1) случайная величина (Х-МХ)2 принимает значения (Xt — MX)2, (Х2 —MX)2, ..., (Х„ —MX)2 с вероятностями р19 р2, рп. Таким образом, правая часть равенства (5) представляет собой математическое ожидание величины (X—MX)2. Аналогично (используя преобразования, описанные в п. 2° § 5.3) можно убедиться в том, что правая часть равенства (6) есть М(Х—MX)2.
2) Истолкование дисперсии случайной величины как математического ожидания квадрата отклонения X от MX позволяет описать вероятностный смысл дисперсий следующим образом.
Дисперсия характеризует среднее значение квадрата отклонения значений X от ее математического ожидания. Чем больше эти отклонения по абсолютной величине, тем больше дисперсия, и обратно. Дисперсия измеряет меру рассеяния значений случайной величины относительно математического ожидания X.
3) Справедливы следующие формулы, упрощающие вычисление дисперсии:
ПУ=^х^а-(Х^а)2, (7)
+ оо / + оо \
DX= J /7(z)dZ- f (8)
236 Глава V. Теория вероятностей
В формуле (7) X—дискретная случайная величина с распределением (1), в формуле (8) X—непрерывная случайная величина и /(z)—ее дифференциальная функция распределения.
Вывод формул (7) и (8) приведен в § 5 *.4, 1 и 2.
4) Квадратный корень из дисперсии называется среднеквадратическим отклонением и обозначается оХ; таким образом, Среднеквадратическое отклонение, как и дисперсия, является мерой рассеяния значений случайной величины относительно математического ожидания. Среднеквадратическое отклонение измеряется в тех же единицах, что и X в то время как дисперсия имеет измерение X2. Поэтому иногда предпочтительнее иметь дело с аХ, а не с DX.
Примеры. 1. Пусть т—количество очков при бросании игральной кости. Распределение этой величины имеет вид
1/6 1/6 1/6 1/6 1/6 1/6
Математическое ожидание величины т найдем по формуле (2):
м™=1 4+24+з4+44+54+64=?-6 6 6 6 6 6 2
Дисперсию величины т вычислим по формуле (7):
Dw=l 1+4 1+9 •-+16--+25--+36 (Mm)2 =
все в в в ' ’
6 6 6 6 6 6
91 /7\2 182-147 35
91
~6
7
2
12 12
2. Пусть I—количество угаданных цифр при игре в спортлото. Распределение этой величины таково:
где вероятности р0. р19 р2, Рз, Рд., р5, р6 вычислены в примере
6 п. 5Ъ § 5.1.
Согласно формуле (2), математическое ожидание величины I составляет
М/=0,4006 • 0 + 0,4241-1+0,1515-2 + 0,0224 • 3 + 0,0014-4+
+ 0,00003 • 5 + 0,00000 • 6 = 0,7999.
Используя формулу (7), вычислим дисперсию величины /:
5.4. Мат, ожидание и дисперсия случ. величин. Ковариация, корреляция
237
D/=0,4006 • 0 + 0,4241-1+0,1515-4 + 0,0224 • 9 + 0,0014-16 + + 0,00003 -25-0,79992 = 0,6143.
2°. Математические ожидания и дисперсии биномиального, пуассоновского, нормального, равномерного и показательного распределений
1. Биномиальное распределение (см. с. 221); к—количество наступлений события А в схеме Бернулли из п испытаний, р —вероятность наступления события А в одном испытании, q = 1 — р.
Справедливы формулы
ЪАк = пр, Dk = npq, <зк = у/npq. (9)
Их вывод приведен в п. 3°, а также в § 5*.4, 5.
2. Пуассоновское распределение (см. с. 221); значение se {0, 1, 2, ...} принимается с вероятностью Р(5) = е~й^.
Можно доказать (см. § 5 *.4, 6), что
Ms= f se(10)
s = O
Ds= £ s2e~a—'—(JVLy)2 <ss = yfa. (11)
s = O
Таким образом, параметр а пуассоновского распределения равен математическому ожиданию и дисперсии пуассоновской случайной величины.
3. Нормалъное распределение (см. с. 221—224); дифференциальная функция нормального распределения случайной величины X имеет вид f(t) =—L_е-G-«)2/(2^2)
Можно доказать (см. § 5*.4, 7), что
+ 00
МХ= f t—l— e~(‘-a)2/(2a2)dt = a, (12)
J ах/2тс
— оо
+ 00
DX= I z2—+ e^(^a)2/(2a2)ck = CT2, cX=o. (13) J су-УТти
Таким образом, вероятностный смысл параметров нормального распределения состоит в следующем: а есть математическое ожидание нормальной случайной величины; су2—дисперсия; су—среднеквадратическое отклонение.
238
Глава К Теория вероятностей
4. Равномерное распределение (см. с. 224—226); дифференциальная функция распределения равномерной случайной величины X имеет вид
' 0 при t<a,
/(')=" 1 Ь—а при a<t<b,
0 при t>b.
В этом случае справедливы формулы
MX-
z/(z)d/=^
(14)
+ 00 + 00
/Г \ % 2
DJT= t2f(t)dt-( zr(/)dz) (15)
J \ J / 2^/3
— 00 — 00
Их вывод приведен в § 5 *.4, 8.
5. Показательное распределение (см. с. 226, 227); дифференциальная функция распределения показательной случайной величины X имеет вид
О при t < О, А,е-1' при />0.
Можно показать (см. § 5*.4, 9), что
МХ=
+ 00 ОО
| z/(z)dz= I zXe~XtdZ=-, J
— оо О
(16)
4-оо оо
DJf= f Z2/(z)dZ-l= fx/2e-Xld/-l=l; ojr=i (17)
I Л I Л Л Л
- оо 0
Формулы (16) и (17) устанавливают вероятностный смысл параметра X: 1/Х есть математическое ожидание показательной случайной величины; 1/Х2—дисперсия; 1/Х—среднеквадратическое отклонение.
3°. Свойства математического ожидания, дисперсии и среднеквадратического отклонения
j1 5.4. Мат, ожидание и дисперсия случ. величин. Ковариация, корреляция 239
Свойства математического ожидания
1°. М(Х+У)=М1+МУ для произвольных случайных величин X, Y (зависимых или независимых).
2°. М(ХХ) = ХМХ для любой случайной величины X и произвольного числа X.
3 °. М (XY) = MX • М Y для независимых случайных величин X и Y.
Доказательство этих свойств приведено в § 5*.4, 3-
Свойства дисперсии
1°. DC-0, т. е. дисперсия постоянной равна нулю (постоянное число формально можно рассматривать как случайную величину, принимающую единственное значение С с вероятностью единица).
2°. D(AX) = X2DX для любой случайной величины X и произвольного числа X.
3°. D(X+r)-DX+Dr для независимых случайных величин X и Y.
Доказательство этих свойств приведено в § 5*.4, 4-
Свойства среднеквадратического отклонения 1°. аС=0, т. е. среднеквадратическое отклонение постоянной равно нулю.
2 . сг(ХХ) = | Х| суХ для любой случайной величины X и произвольного числа X
3°. су (Х+ У) = ^/(суХ)2 + (суУ)2 для независимых случайных величин X и Y.
Эти свойства непосредственно вытекают из свойств дисперсии и определения среднеквадратического отклонения.
Комментарий к свойствам MX, DX, суХ 1) Свойство 10 математического ожидания является на первый взгляд удивительным. Это свойство справедливо для произвольной пары случайных величин X, Y (безразлично, зависимых или независимых). Как известно, в случае зависимых величин совместное распределение пары не определяется распределением слагаемых. Формула М(Х+У) = М(Х)+М(У) определяет М(Х+У) без использования закона распределения Х+ Y (он в принципе неизвестен). Оказывается, что для вычисления М(Х+У) достаточно иметь (неполную) информацию о распределении Х+У, которую дают распределения X и У.
2) Свойство 3° математического ожидания справедливо лишь для независимых случайных величин. Естественно измерять «степень зависимости» между X и У разностью М(ХУ)— — MX-МУ (которая равна нулю в том случае, когда величины независимы). На этой идее основаны понятия ковариации и коэффициента корреляции (см. ниже п. 4°).
3) Свойства MX, DX, суХ позволяют легко вычислить среднее значение, дисперсию и среднеквадратическое отклонение биномиальной случайной величины.
240
Глава V. Теория вероятностей
Пусть к{п}—количество наступлений события А в серии из п независимых испытаний схемы Бернулли. Очевидно, что
^(и):=^(1) + ^(2)+ ••• +^(п)?
где %(i)—количество наступлений события А в /-м испытании (/=1, 2, и). Так как в каждом испытании событие А наступа-
ет с вероятностью р и не наступает с вероятностью q. то распределение случайной величины k{i} имеет вид
0 1
q р
(одно наступление события А—с вероятностью и ноль наступлений события А—с вероятностью q).
Согласно формулам (2) и (7), получаем
МЛ(0 = 0 • q +1 -р =р, D/c(i) = (0 • q + 12р)-р2 =р-р2 =р(1 -p)=pq.
(18)
Далее, используя свойство 1° математического ожидания, имеем
М£(Л) = М{/с(1)-|-Ад2)+ ••• +^(n)) —+ ••• + Mfc(w) =
(19)
= р+р+ ... +р = пр
Наконец, используя ’ свойство 3° дисперсии, находим
D&(W) = D(£(1)4-£(2)+ ... +^(„)) = D^(1) + D^(2)+ ••• +1ЭА;(И) = (20) =pq+pq+ - pq=rpq,
откуда
^k{n}==y/npq. (21)
Формулы (19) — (21) совпадают с (9).
4) Из свойства математического ожидания и дисперсии в качестве следствия вытекает важный теоретико-вероятностный факт, лежащий в основе законов больших чисел (см. ниже, § 5.5, теорема Чебышева).
Пусть Х2, ..., Хп—независимые случайные величины с одинаковыми математическими ожиданиями МХр=а и среднеквадратическим отклонением = т. е. DX^g2. Тогда
5.4. Мат, ожидание и дисперсия случ. величин. Ковариация, корреляция
241
для случайной величины Х=-(Аг1+Х2+ ... + ХИ) справедливы равенства
Ш=а, Dy=D|l(X1+X2+ ... +Х„) )=1УВХ- = ^=—,
\тУ 7 / п п п
Таким образом, дисперсия случайной величины X уменьшается с ростом п. рассеяние значений X относительно MX уменьшается, сама величина X теряет случайный характер.
4°. Ковариация и коэффициент корреляции. Как уже было отмечено, с помощью числа
к(Х, У) = М(ХУ)-МХ*МУ (22)
можно измерять степень зависимости случайных величин X и У. Свойство 3° математического ожидания означает, что к(Х, У) — = 0 для независимых случайных величин. Естественно считать, что чем больше к{Х. У) по абсолютной величине, тем больше степень зависимости. Так как к{Х. У) имеет размерность ХУ, то при изменении единицы масштаба его значение будет подвержено изменению. Чтобы избежать этого, введем коэффициент
ИХ у)-^х Г)_М(ХУ)-М^-МУ
' ’ 7 аУ-аУ oX-vY ’ ' 7
где стХ, о» У—среднеквадратические отклонения случайных величин X, У.
Коэффициент г(Х, У) является безразмерным: он не зависит от единиц измерения величин X и У.
Определение 5. Пусть X, У—случайные величины, ХУ—их произведение, MX, МУ, М(ХУ)—математические ожидания этих величин, суХ, су У—среднеквадратические отклонения величин X и У. Коэффициент к(Х. У), определенный формулой (22), называется коэффициентом ковариации, а коэффициент г(Х, У), определенный формулой (23),—коэффициентом корреляции.
Для теории вероятностей и ее приложений большее значение имеет коэффициент корреляции (основная причина этого — его безразмерность).
Свойства коэффициента корреляции
1°. г(Х, У) = 0 для независимых случайных величин X и У.
2°. — 1 ^г(Х, У)^ 1 для любых двух случайных величин X и Y.
242
Глава V. Теория вероятностей
3°. Если |г(Х, У) | = 1, то случайные величины X и Y связаны соотношением
Y=aX+b, (24)
где а и b—некоторые постоянные.
Обратно, если X и Y связаны условием (24), то |г(Х, У)| = 1, (r(X, Y)= — 1 при а<0-и r(X, Y}= 1 при а>Ь).
Доказательства свойств коэффициента корреляции приведены в § 5*.4, 10.
Комментарий к свойствам коэффициента корреляции. Свойства 1° — 3° означают, что коэффициент корреляции измеряет степень зависимости случайных величин X, Y в следующем смысле. Для независимых величин X и Y коэффициент корреляции г(Х У) равен нулю, а крайние возможные значения г(Х, У), равные 1 и —1, соответствуют функциональной зависимости между X и У, имеющей вид Y=aX+b', функциональная зависимость между X и У—самый тесный вид зависимости. В общем случае независимость величин X и Y означает, что условное распределение величины У при заданном значении Х=Х0 совпадает с безусловным распределением У; если же У является функцией от X. то при Х=Х§ она принимает вполне определенное значение, так что при условии Х=Х0 величина У даже не является случайной.
Зависимостям, близким к зависимости вида Y=-aX-yb, соответствуют значения г(Х, У), близкие к 1 или —1 (при а > 0 или б/<0 соответственно). Если величины X и У слабо зависимы, то значения г(Х, У) близки к нулю.
Следует иметь в виду, что существуют зависимые величины X и У, коэффициент корреляции которых равен нулю; их называют некоррелированными.
Если величины X и У связаны нелинейной функциональной зависимостью, то г(Х, У) может отличаться от 1 и —1.
Итак, коэффициент корреляции измеряет степень линейной зависимости между случайными величинами X и У.
Для дискретных случайных величин коэффициенты к(Х. У) и г(Х У) можно вычислить по формулам
г(Х У)-
(25)
(26)
Здесь Xi и yj—значения случайных величин X и У, Pi и qj—соответствующие им вероятности, —вероятность совместного появления событий X=xh Y=yj.
5.4. Мат, ожидание и дисперсия случ. величин. Ковариация, корреляция 243
Суммы, входящие в правые части равенств (25) и (26), можно выразить через математическое ожидание и среднеквадратическое отклонение:
^XiyjPi^M(X, У), = 1^ = МУ, (27)
л/Ех^~(Ех*А-)Е 2 * * * * =
____________ (28)
Формулы (27) вытекают из (2) и определения величины XY; Формулы (28) следуют из (7).
Полезно также использовать равенства
У)=£(х,-МУ)(у7-МУ)Ру, (29)
г(х, (30)
1 ’ аГаУ v 7
Согласно формуле (29), коэффициент ковариации равен математическому ожиданию произведения случайных величин У-МУ и У-МУ.
Вывод формул (29), (30) приведен в § 5*.4, 11.
Справедливы формулы, дающие выражение коэффициентов ковариации и корреляции через функции распределения непрерывных случайных величин X, Y и через функцию их совместного распределения. Эти формулы аналогичны (29), (30) и приведены в § 5*.5, 12.
5°. Моменты случайных величин. Пусть X—случайная величина (для определенности—дискретная); —ее значения;
Pi — соответствующие им вероятности (z=l, 2, ..., п); МУ—математическое ожидание X; а — произвольное число.
Рассмотрим следующие суммы:
Е xkipt, m'k = £ (xi-a)kpi, mk = £ (xt-MX^pp, (31)
i=l i=l 1=1
mk называют начальным моментом k-го порядка, mk—от-
носительным моментом k-го порядка (относительно числа о).
тк—центральным моментом. Заметим, что важнейшие характеристики случайной величины X—математическое ожидание и дисперсия—представляют собой моменты этой величины, а именно, DT=w.2.
Существуют и другие характеристики случайной величины, описывающие ее различные свойства; эти характеристики, так же как МУ и ВУ, сравнительно просто выражаются через начальные и центральные моменты.
Вычисление центральных моментов несколько облегчается, если сначала найти относительные (относительно некоторого
244
Глава V. Теория вероятностей
подходящего числа) моменты, а затем преобразовать их в центральные по формулам, приведенным в § 5*.4, 13.
Для пары дискретных случайных величин X, Y рассмотрим следующие суммы:
тм=X x^yljPij, m'u=Y(xi-a)k(yj-b)lpih
(32) т^ = £(^-МХ)*(у7.-МГ)(ру (к, 1=0, 1, 2, ...)
Они имеют следующие названия: mki— начальный момент порядка к, I; тк4— относительный момент порядка Л, I (относительно чисел а и /?), ткл — центральный момент порядка к, I.
При к = 0 или 1=6 моменты пары превращаются в моменты случайных величин.
Коэффициент ковариации, как видно из сравнения формул (32) и (29), совпадает с т'^р, математическое ожидание произведения XY равно т{{.
Моменты пары (X, К) можно истолковать как математические ожидания некоторых функций от случайных величин X У, а именно:
mkl = M(XkYl\ m'kl = M{x-ay{Y-b)\
mh = M(X-MX)k(Y-MYy (к, 1=0, 1, 2, ...)
Эти формулы определяют моменты не только для дискретных, но и для непрерывных величин.
Формулы, дающие явное выражение моментов через функции совместного распределения пары случайных величин, приведены в § 5*.4, 14-
Многие важные характеристики пары случайных величин X и Y достаточно просто выражаются через моменты этой пары величины.
§ 5.5. Закон больших чисел. Неравенство Чебышева. Теорема Бернулли. Теорема Чебышева
Из повседневного опыта известно, что массовые случайные явления обладают свойствами устойчивости средних. Это означает, что при независимых испытаниях случайной величины X среднее арифметическое (xi+x2+ ... +х„)/и полученных значений при больших п стабилизируется. Случайные колебания значений каждого испытания взаимно компенсируются и случайная величина (х1+х2+ ••• + х„)/н, где Xt есть z-e испытание величины X (z = 1, 2, ...., п), при больших п теряет свой случайный характер. Теоремы, описывающие такие ситуации, называются законами больших чисел.
Мы строго сформулируем и докажем два варианта закона больших чисел—теоремы Бернулли и Чебышева.
f 5.5. Неравенство Чебышева. Теорема Бернулли. Теорема Чебышева
245
В основе доказательства этих теорем лежит неравенство Чебышева, составляющего содержание следующей леммы.
Лемма (неравенство Чебышева). Пусть X—произвольная случайная величина; MX и DX—соответственно ее математическое ожидание и дисперсия, 8>0— произвольное число. Тогда справедливо неравенство
Р{|Х-МХ|<8}>1-^> (1)
где Р{|Х—МХ| <8} означает вероятность того, что отклонение случайной величины X от своего математического ожидания меньше, чем 8.
Доказательство приведено в § 5*.5, 1-
Комментарий к лемме. Неравенство (I) и теорема об устойчивости среднего арифметического (см. ниже) доказаны русским математиком П. Л. Чебышевым.
Теорема 1 (теорема Бернулли). Пусть k—количество наступлений события А в серии из п испытаний схемы Бернулли, р—вероятность наступления события А в одном испытании. Тогда
lim Р(|-—р\ <е)=1. п
(2)
Комментарий к теореме 1. Теорема Бернулли утверждает, что вероятность малого (меньшего, чем 8) отклонения вероятности р от частоты kin велика (при большом п). Иными словами, почти всегда будет наблюдаться малое отклонение частоты наступления события А в п испытаниях от вероятности наступления А в одном испытании.
В частности, теорема объясняет, почему при многократном бросании монеты количество гербов составляет примерно половину от числа бросаний.
Теорема Бернулли была исторически первым строго доказанным математическим фактом из числа тех утверждений, которые носят название закона больших чисел. Доказательство дано швейцарским математиком Я. Бернулли.
Доказательство теоремы 1. Согласно формулам (9)
§5.4, имеем Мк = пр, Dk=npq; поэтому М(-) = />, D( —) = \п J \пJ
= Л ’ пР<1= — (здесь использованы свойства математического п п
ожидания и дисперсии: М(ХХ) = ХМХ, D(XX)==X2DX).
Запишем неравенство Чебышева для Х=!фт.
PQ
«£2
(3)
246
Глава V. Теория вероятностей
оо стремится к единице, н-
ебышева). Пусть Xt (z— 1, 2, и)
Правая часть неравенства (3) при п
(k
—J п
Теорема 2 (теоре
—попарно независимые случайные величины, имеющие одинаковые распределения: XIX{ = а. Т)Хр=<з2. Тогда имеет место соотношение
lim Р
A^j+A^-b ... +A"n
п
1.
(4)
Комментарий к теореме 2. Можно считать, что дана одна случайная величина X, которая (независимо) испытывается п раз; случайное значение z-ro испытания определяет случайную величину Хь Теорема Чебышева утверждает, что малое (меньшее, чем е) отклонение среднего арифметического
+ ••• + Хп)/п от математического ожидания а весьма
вероятно. Иными словами, почти всегда будет наблюдаться малое отклонение (при больших п).
Доказательство теоремы 2. Имеем
м1(У! + У2+ ... +X„)=-(MX1 + MJr2+ ... + МХп) = -па — а, 7 п' 7 п
о1(Х1+У2+ ... +Xn)=±foX1+DX2 + ... +DX„)=1q2«=^ пv 7 п х 7 п п
(здесь использованы формулы М(ХХ')=ХМХ, D(XJf) = X2DJf).
Неравенство Чебышева для Х=-(Х1+Х2+ ... +Х„) дает пх 7
Правая часть неравенства (5) при п-*сг стремится к единице; отсюда и следует утверждение (4).
Теорему Бернулли можно рассматривать как частный случай теоремы Чебышева, если считать, что Xi—k^ (z=l, 2, ..., п\ где k(i}—количество наступлений события А в z-м испытании схемы у а^- 1
Бернулли. Тогда частота наступления события А есть = +
к П п
+^<2)+ ... +к(п))=- и а^р. ъ2=пр согласно формулам (18) § 5.4.
§ 5.6. Предельные теоремы. Характеристические функции и их свойства. Центральная предельная теорема Ляпунова
Кроме законов больших чисел, описывающих устойчивость средних значений и изложенных в § 5.5, в теории вероятностей имеет место еще одно замечательное явление. Как и законы
§ 5.6. Характеристические функции. Центр, предельная теорема Ляпунова 247
больших чисел, это явление заключается в том, что при большом количестве случайных слагаемых, каждое из которых вносит лишь небольшой вклад в общую сумму, распределение каждого из слагаемых не влияет на суммарный результат. Точнее, при указанных условиях вид распределения суммы не зависит от распределения слагаемых.
Более строгое утверждение сформулировано в следующей теореме.
Теорема (центральная предельная теорема Ляпунова). Пусть Х2, ..., Х„, ...— одинаково распределенные независимые случайные величины с математическим ожиданием МХ=а и дисперсией = Тогда при большом п распределение суммы Y=X1+X2+ ... +Хп близко к нормальному распределению.
Комментарии к теореме. 1) Когда говорят, что последовательность распределений Z1? Z2, ..., Zn стремится к некоторому распределению Z, имеют в виду, что (дифференциальные) функции fi (z) распределений Zf стремятся к функции /(z) распределения Z.
2) Так как и = , то величины
MX 2 MX - D V
а=—, (У —— малы при больших п. Величины Х{ вносят
п п
в общую сумму «равномерно малый вклад», о чем шла речь выше.
3) Утверждение о нормальном законе распределения суммы Xi+X2+ ... +Хп справедливо при менее ограничительных условиях, чем те, которые фигурируют в условии теоремы. В частности, справедлив более сильный вариант теоремы Ляпунова, устанавливающий, что сумма Х1+Х2+ ... Х-Хп имеет нормальное распределение при весьма общих предположениях относительно величин Х29...9Хп. Подробнее об этом см. § 5*.6, 2
Доказательство центральной предельной теоремы приведено в § 5*.6, 1. Оно использует аппарат характеристических функций и в общих чертах следует такой схеме. Каждой случайной величине соответствует характеристическая функция, сумме случайных величин соответствует произведение характеристических функций. Это произведение при неограниченном увеличении числа п слагаемых стремится к некоторой функции, которая оказывается характеристической функцией нормального распределения. Отсюда и следует утверждение центральной предельной теоремы. (Впрочем, важным обстоятельством, пропущенным в вышеуказанных рассуждениях, является тот факт, что если последовательность характеристических функций (Z) сходится к функции /(Z), то последовательность распределений,
248
Глава V. Теория вероятностей
соответствующих функциям J\(t\ сходится к распределению, соответствующему функции /(/). В действительности именно доказательство этого факта является самым трудным местом в доказательстве предельной теоремы.)
Понятие характеристической функции распределения, играющее столь важную роль в доказательстве центральной предельной теоремы, имеет и самостоятельное значение. Оно связано с важным общематематическим понятием преобразования Фурье.
Определение. Характеристической функцией случайной величины X называется математическое ожидание случайной величины eltX.
Комментарии к определению. 1) Напомним, что el7X==cos/x+fsin tx; функция eltx принимает комплексные значения.
2) Случайная величина eltX принимает значение епх, если случайная величина X принимает значение х.
3) Для дискретных случайных величин X с распределением
Pi р2 - Рк
(1)
(хк — значения случайной величины X, а рк — соответствующие им вероятности), характеристическая функция g(t) имеет вид
к g(0 = X e‘txsps. s = 1
(2)
Для непрерывных случайных величин X с дифференциальным законом распределения f(t) характеристическая функция g(t) имеет вид
4) Функция
+ оо
g(0 = f ei,xf(x)dx.
— оо
+ 00
F(t) = -- e~ltxf(x)dx
2л
(3)
(4)
называется преобразованием Фурье функции fix).
Из сравнения формул (3) и (4) вытекает, что F(t)=f-gf-tf 2л
Преобразование Фурье широко применяется в теории дифференциальных уравнений, функциональном анализе, гармони
5.6. Характеристические функции. Центр, предельная теорема Ляпунова 249
ческом анализе и многих прикладных вопросах математики. Основная причина этого заключается в том, что преобразование + оо
Фурье свертки J (/—s\f2 (5)ds двух функций и /2 равно
произведению преобразований Фурье функций и /2.
Среди свойств характеристической функции имеется свойство, аналогичное описанному свойству преобразованию Фурье: характеристическая функция суммы независимых случайных величин равна произведению характеристических функций этих величин (распределение суммы двух независимых случайных величин X. Y задается сверткой дифференциальных функций /1, /2 распределений величин X. Y, а свертке функций соответствует (по Фурье) произведение преобразований Фурье этих функций).
Свойства характеристических функций
1°. Пусть X, Y—случайные величины такие, что Y=aX. где а—постоянная. Тогда gY(t)=gx(at), где gx(t) и gy^)— характеристические функции случайных величин X и Y,
2°. Характеристическая функция gx + Y суммы независимых случайных величин равна произведению их характеристических функций gx(t) и gY(t).
Доказательство. + оо 4-оо
1°- gy(O= f e',ox/(x)dx= J eiuxf(x)dx=gx(u)=gx(at);
— 00 — 00
здесь u = at,
2°. gx + Y(t) = Meit(x + y) = M(eitx -eity) = Meitx • Meity = =gx(t)gY(t); здесь учтено соотношение eit(x+y) = Qitx .Qity и свойство M(XY) = MI-MY для независимых случайных величин X, Y.
Примеры. 1. Характеристическая функция случайной величины ка )5 принимающей значения 0 и 1 с вероятностями q и р (где p + q=Vy имеет вид
gk{i}(t) = Qit Q •q + eitp = q + eitp= l+(etf-1)/?. (5)
Характеристическая функция биномиальной случайной величины кп = к(1)-Ук(2)-\- ... +^(и) в силу свойства 2° имеет вид
(6)
2. Характеристическая функция равномерной случайной величины на отрезке [а. b ] такова:
g(0 =
4-оо b
е " ихДх ) dx = е "i,x — dx =---------------- (е “itb - е "ita). (7)
b — a —it(b—a)
— 00
250
Глава V. Теория вероятностей
Если а=—Ь, то
1 р. itb_р -itb 1
g(/) = ^^-^-=^sinzZ>. (8)
tb 2i tb
3. Характеристическая функция нормальной случайной величины X с математическим ожиданием а = 0 и дисперсией о»2 = 1 есть
+ 00
gx(Z) = | eitx -2=e~x2/2dx=e~t2/2
J у/2п
— 00
(9)
(доказательство справедливости последнего равенства приведено в § 5*.6, 1).
4. Равномерное распределение на отрезке [ — ^/ЗД/й,
yfily/n ] имеет нулевое математическое ожидание и дисперсию,
1 /2 /3\2 1
равную — —=- (см. формулы (14) и (15) § 5.4).
12 \ /я / п
Пусть Х2,...,Хп— независимые случайные величины, равномерно распределенные на отрезке [ у/^/у/п].
Найдем характеристическую функцию g(t) суммы Х1 + Х2+ ... +Хп. Учитывая свойство 2° и формулу (8), имеем
(Ю)
Вычислим lim gn(t}. Для этого рассмотрим lngw(/): и—>-00
Итак, lim gn (t) = е t2/2. Значит, характеристическая функция gn (t) суммы случайных величин Х1+Х2 + ... +ХИ (точнее, ее предел) совпадает с характеристической функцией нормального распределения. Это является следствием того, что распределение суммы Х1+Х2+...+Хп стремится к нормальному распределению.
Приведенные вычисления в общих чертах повторяют основные шаги доказательства центральной предельной теоремы.
j* 5.7. Цепи Маркова. Теорема о предельных вероятностях. Стац. распределение 251
. § 5.7. Цепи Маркова. Теорема о предельных вероятностях. Вычисление предельных вероятностей.
Стационарное распределение
1°. Цепь Маркова. Примеры марковских цепей. Пусть изучаемый объект (система) может находиться в одном из состояний А1Ь А2,...,Ак. Множество состояний может быть как конечным, так и бесконечным. Производится серия из п испытаний. В результате одного испытания со случайным исходом состояние объекта изменяется; пусть ри означает вероятность перехода системы из состояния At в состояние Aj 2,...).
Относительно условий испытания предполагается, что вероятности Pij зависят только от номеров i и j (и не зависят, например, от результатов испытаний, предшествующих опыту, в результате которого система перешла в состояние А^ или от номера испытания).
Определение 1. Последовательность испытаний объекта с конечным или бесконечным множеством состояний А29...9Ак и вероятностями перехода pz/- из состояния At в состояние Ар зависящими только от номеров i и у, называется цепью Маркова.
Рассмотрим примеры цепей Маркова. Случайное блуждание на прямой. Пусть движущаяся точка Р в каждой из рассматриваемых моментов времени / = 0, 1, 2,... может находиться в одной из точек числовой прямой, имеющей целочисленную координату; множеством состояний системы является множество всех целых чисел Z. При каждом испытании точка Р с вероятностью р переходит из точки с координатой х в точку с координатой х+1 и с вероятностью q в точку с координатой х—1 (p + q=l). Это означает, что Pt.i+i=P, Pi,i-i=4 0’=0, ±1, ±2,...), Л(==0, |&—/|>1. Если в начальный момент t = Q точка р имела координату х0, то в момент /=1 координата точки Р будет принадлежать множеству В1 = {х0 — 1, л:0 + 1}, в момент времени t = 2 — множеству 2?2 = {х0 —2, х0, х0 + 2},..., в момент времени t = n — множеству Вп = {х0 — л, х0 — (п — 2),..., xQ+n}. Разумеется, вероятность Ри того, что после п испытаний точка Р из состояния xQ перейдет в хпеВп. будет зависеть от точки хп. Можно изучать случайную величину Хп9 множество значений которой есть Вп9 а вероятность значения хеВп равна Р^. Некоторые прикладные задачи теории вероятностей сводятся к исследованию случайной величины Хп.
Рассматривают также задачу о блуждании по целочисленным точкам плоскости или пространства. Явление броуновского движения, т. е. хаотического случайного движения частицы малой массы под действием столкновений с молекулами
252
Глава V. Теория вероятностей
окружающего вещества, достаточно точно может быть описано схемой случайного блуждания.
Модель процесса диффузии. Пусть имеются две урны, содержащие п одинаковых шаров. Состоянием изучаемой системы будем считать распределение шаров по урнам; состояние Ак означает, что в первой урне находится к шаров, а во второй урне п—к шаров (А;=0, 1, 2,..., и). Испытание состоит в том, что из п шаров выбирают один шар (по
условию вероятность взять шар из первой урны равна -, а из
второй —Выбранный шар перекладывают в другую урну
(из первой во вторую, а из второй— в первую). Таким образом, вероятности перехода из состояния i в состояние
j имеют вид pii_1=~, pi i+1 = l-L (z = 0, 1, 2, ...,п). При п п
большом п имеем цепь Маркова, описывающую диффузию: две урны моделируют два сообщающихся сосуда с диффундирующим веществом, а шары в урнах моделируют молекулы вещества в сосудах.
2°. Предельные вероятности. Определение 2. Пусть дана цепь Маркова с п состояниями Л15 А2,...9Ап и вероятностями ptj перехода из состояния Аг в состояние Аг Тогда матрица
называется матрицей вероятностей перехода.
Теорема 1. Пусть дана цепь Маркова с состояниями А19 А29 ...9Ап и матрицей Р вероятностей перехода. Тогда вероятности р^р того, что система после N испытаний перейдет из состояния At в состояние А^ образуют матрицу, равную N-й степени матрицы Р, т. е.
Эта теорема, в частности, утверждает следующее. Если матрица вероятностей перехода имеет вид
5.7. Цепи Маркова. Теорема о предельных вероятностях. Стац. распределение 253
/ р q \
Р=( ), где р+^=1,
PJ
то матрица, составленная из вероятностей р\2> того, что после двух испытаний система перейдет из состояния i в состояние j, равна Р2, т. е.
Р2 = (Р q\ (Р q\(P2+q2 2Pq \Q PJ \<1 PJ \ p2 + q2
где p(il=p2+q2, pty = 2pq, p$=2pq, p(^=p2 + q2. Вероятности p[3) образуют матрицу Р3, т. е.
+ 2М <l\(p3 + 3pq2 q3 + 3p2q \ 2pq p2+q2J\q pJ \q3 + 3p2q p3 + 3pq2
Доказательство теоремы 1. Для того чтобы попасть из состояния А* в состояние Aj за два испытания, необходимо и достаточно, чтобы имело место одно из следующих п попарно несовместных событий:
Bt -.Ai^A^Aj, B2:Ai-+A1^Aj,...,Bn-.Ai-*An-+Aj, (3)
где событие Bk означает, что при первом испытании система переходит из состояния i в состояние /с, а при втором испытании — из состояния к в состояние j. Вероятность перехода i^>k равна pik. а вероятность перехода k^j равна pkj. Вероятность совместного наступления этих событий (/-►£) и (k-^j) вследствие их независимости равна произведению Pikpkj (по теореме умножения вероятностей); итак, вероятность события Вк есть Р{Bk)=pikpkj. Вероятность р№ равна сумме вероятностей событий Вк, т. е.
Рi2) = Хр (Вк) = Z PikPkj- (4)
k=l
Это следует из теоремы сложения вероятностей, поскольку событие Cij9 состоящее в том, что система после двух испытаний перейдет из состояния i в состояние у, наступает тогда и только п
тогда, когда наступает одно из событий Вк (Сц= £ Вк), Х-n k=i
Число, равное \PikPkp по определению умножения матриц совпадает с элементом ij матрицы Р2, где Р имеет вид (1). Поэтому числа Pij = ^J>ikPkj образуют матрицу Р2. Теорема доказана при А=2. Аналогично можно убедиться в справедливости теоремы в общем случае. Подробное доказательство см. в § 5*.7, 1.
254
Глава V. Теория вероятностей
Комментарий к теореме 1. Утверждению теоремы можно придать такой вид: матрица P(N) вероятностей перехода за N испытаний совпадает с TV-й степенью PN матрицы Р вероятностей перехода за одно испытание. При этом p(Ni)p(N2) = p<Ni+N2)? поскольку для степеней матрицы Р справедливо равенство PNi PN2 = pNi+N2,
Матрица Р=(р^) вероятностей перехода обладает следующими свойствами:
Yptj=l (z=1, 2,..., п).
J=1
(5)
Матрицы Р, удовлетворяющие условиям (5), называются стохастическими. Из теоремы 1 вытекает, что если Р— стохастическая матрица, то и PN при любом N является стохастической матрицей.
Важнейшим фактом теории цепей Маркова является теорема о том, что (при выполнении некоторых не очень ограничительных условий) существует предел Рп при и-»оо, где Р—матрица вероятностей перехода; при этом предельная матрица Р(оо)= lim Р" состоит из одинаковых строк: п—>00
/ U^ U.2 • •• Un
(6)
ZZ -£ 1^2 • • • Нп
Это означает, что распределение вероятностей состояний, достигаемых из состояния z в результате большого количества N испытаний, не зависит ни от N, ни от z.
Для формулировки строгого утверждения, описывающего вышеуказанное явление, необходимо ввести пбнятие регулярной цепи Маркова. Матрицу Р вероятностей перехода будем называть регулярной, если при некотором N все элементы матрицы PN отличны от нуля. Регулярные матрицы перехода вероятностей задают цепь Маркова, обладающую тем свойством, что каждое состояние Aj системы может быть достигнуто через N шагов из любого состояния Такие цепи Маркова также называются регулярными.
Теорема 2 (о предельных вероятностях регулярной цепи Маркова). Пусть дана регулярная цепь Маркова с п состояниями и Р—ее матрица вероятностей перехода. Тогда существует предел lim Рп = Р^ и матрица Р^ имеет вид (6).
5.7. Цепи Маркова. Теорема о предельных вероятностях. Стац. распределение 255
Комментарий к теореме 2. 1) Числа и19 и2, ...,ип называются предельными вероятностями^ и- (j = 1, 2,..., п) означает вероятность того, что система после большого количества испытаний перейдет в состояние Aj (эта вероятность не зависит от исходного состояния).
(wi \
является собственным вектором ип '
матрицы Р' (транспонированной по отношению к Р), принадлежащим собственному значению 1, т. е.
Р' и = и. (7)
При выполнении условий теоремы 2 такой вектор существует, причем уравнение (7) вместе с условием £wf=l определяют его однозначно. Вектор и можно найти из соотношения (7), для чего нужно решить систему линейных уравнений.
Доказательство теоремы 2 приведено в § 5*.7, 2.
Примеры. 1. Пусть
(матрица Р регулярная, поскольку Р1 не содержит нулевых элементов). Транспонированная по отношению к Р матрица Р' совпадает с Р. Найдем вектор и—собственный вектор матрицы Р' = Р9 принадлежащий собственному значению 1. Имеем Ри = щ или
Jри± + qu2 = и^ J(Р ~ Ь) wi + Qu2 “
\qu1+pu2 = u2, или \qur +(р— 1)и2 = 0, т. е.
(- ?(«i - w2)=o,
( ^(w1-w2) = 0.
Учитывая, что и± + и2 = 1, получаем
( А /1/2 1/2 \ р(оо)_[ 1 < I
\1/2 1/2/
Предельные вероятности их = 1/2, tz2 = l/2.
2. Матрица вероятностей перехода для цепи Маркова, описывающей модель диффузии, имеет вид
256
Глава V. Теория вероятностей
0 10 ... о
о
о
1
о
Можно показать, что эта матрица является регулярной. Вычислим предельные вероятности. Для этого найдем собственный вектор матрицы Р' (транспонированной по отношению к Р), принадлежащий собственному значению 1.
Из системы уравнений Р'и — и = 0, или
— + =0,
1 । Л Л л
-иа — Ui+l 1—- \и9 —О,
п и \ ”/
2 ( 1\
-щ—и2 + \ 1—- НЛ = 0,
п \ п J
п л
-о,
п
используя условие ^^=1, находим
ик — С„2~п (£ = 0, 1, 2,
Следовательно, вероятность того, что в первом сосуде в результате большого количества N испытаний окажется ровно к молекул, равна Ск2~п, т. е. она совпадает с вероятностью появления к гербов после ^-кратного бросания монеты (схема Бернулли при /7=1/2). Эту ситуацию можно истолковать таким образом: после многократных испытаний каждая молекула с равной вероятностью может находиться как в первом, так и во втором сосуде. Независимость распределения молекул по сосудам приводит к схеме Бернулли при р=1/2, и, как следствие, к вероятности ик^=Ск2~п (к—0, 1, 2,
j> 5.8. Точечные оценки неизв. параметров. Статистическая проверка гипотез
257
Напомним, что предельные вероятности ик не зависят от начального состояния, т. е. от количества молекул в первом сосуде в начальный момент. В соответствии с правилом трех сигм для схемы Бернулли количество молекул в первом сосуде будет заключено в пределах np±3y/npq, т. е. при p = q — ^
п 3
в пределах -+-
у/п с вероятностью 0,9973. Результаты вычис
лений хорошо согласуются с опытом.
§ 5,8. Элементы математической статистики. Выборка.
Точечные оценки неизвестных параметров распределения по выборке. Понятие о доверительных интервалах и статистической проверке гипотез
1°. О задачах математической статистики. Практическое изучение какой-либо случайной величины часто происходит в следующих обстоятельствах: закон распределения и характеристики случайной величины (или системы случайных величин) неизвестны, однако известны результаты некоторого количества испытаний этой случайной величины.
Представляют интерес задачи нахождения функции распределения случайной величины (или системы случайных величин) и характеристик распределения (математического ожидания, дисперсии, моментов) по опытным данным. Этими задачами и занимается математическая статистика.
Нахождение функции распределения по опытным данным требует большого объема статистического материала, часто столь большого, что имеющегося в распоряжении исследователя статистического материала оказывается недостаточно.
В таких случаях задачу нахождения функции распределения упрощают и пытаются дать ответ на вопрос — верно ли, что исследуемая случайная величина распределена по тому или иному конкретному закону распределения (например, нормальному, равномерному или показательному).
Разумеется, нельзя рассчитывать на категорический ответ: речь идет о том, насколько опытные данные согласуются или находятся в противоречии с гипотезой о распределении. Это также требует значительного объема статистического материала. Однако известны многие прикладные задачи, в которых на основе имеющихся опытных данных можно получить ответ на поставленный вопрос. Такие постановки задач носят название «статистическая проверка гипотез».
Существуют задачи, в которых вид функции распределения исследуемой случайной величины известен, а неизвестными 9 Мантуров О.В.
258
Глава V. Теория вероятностей
являются только параметры распределения. Например, из общих соображений иногда бывает ясно, что изучаемая случайная величина имеет нормальное распределение; в этом случае для полного описания закона распределения нужно вычислить (точнее — оценить) математическое ожидание и дисперсию.
Наконец, сравнительно простыми и в то же время важными в практическом отношении являются задачи оценки характеристик распределения—в основном математического ожидания и дисперсии (безотносительно к закону распределения). Рассматривают оценки характеристик распределения двух видов: точечную и интервальную. Точечная оценка является довольно грубой — ее смысл заключается в том, что исследуемая характеристика приближенно равна вычисленному значению. Интервальная оценка содержит больше информации; ее смысл состоит в том, что исследуемая характеристика принадлежит найденному интервалу с определенной (т. е. вычисленной в результате исследования) вероятностью.
2°. Оценки математического ожидания. Найдем сначала точечную оценку математического ожидания. Пусть исследуется некоторая случайная величина X; в результате испытаний получены значения этой величины х1? х2, Рассмотрим попарно независимые случайные величины Х15 Х2, ...,Х„, распределения которых совпадают с распределением X и каждая Xk (к=\, 2,...,п) определена теми значениями, которые получаются в результате £-го по счету испытания величины X (иначе говоря, величины Х1? Х2,...,Хп представляют собой «п экземпляров» случайной величины X). По условию,
... = =
DX1=DX2 = ... = DXn = DX=c2.
В силу теоремы Чебышева всякое значение случайной величины - (Х±+Х2 + ... + Хп) с большой вероятностью близко к математическому ожиданию величины У, т. е. к искомому математическому ожиданию. Отсюда
М^*1+*2+-+*". (1)
п
Число +х2+ ... +хп)[п называется средней статистической.
Оценка (1) является точечной, она тем точнее, чем больше п. Однако какой-либо информации о количественной мере точности и о том, как эта мера зависит от п, формула (1) не дает.
j 5.8. Точечные оценки неизв. параметров. Статистическая проверка гипотез 259
Более глубокий подход к оценке математического ожидания состоит в следующем. В силу центральной предельной теоремы
случайная величина Ar=-(X1 + Х2 + ... + Х„) при больших п имеет нормальное распределение с параметрами
МХ=МХ{ = а, ПХ=-ВХ{ = — (2)
п п
(см. § 5.5).
Можно доказать, что если X распределена нормально, то для случайной величины X справедливо соотношение
Р(|Т-«|<8) = 2o(-L=) (3)
\jvxj
(см. § 5*.8, 3). Отсюда с учетом второго из равенств (2) получим
Р(|Т- а |<8) = 2ф(8 у/п!о). (4)
Вероятность того, что значение случайной величины
Х=-(Х1 + Х2+ ... + Х„), Т. е. -(х1 + х2+ ... +хп), отличается от п п
искомого среднего значения меньше, чем на 5, равна
2Ф(/)« Обозначив число Ъу/п!<з через /, имеем
b=<5tly/n (5)
и, следовательно, равенство (4) примет вид
Р(|Г-а|<аГ/ч7«) = 2ФО). (6)
Если параметр а известен, то равенство (6) определяет интервал (х — at/y/n, х+ ut/y/n), в котором с вероятностью р=2Ф(/) заключено подлежащее оценке математическое ожидание МХ=а величины X. Здесь, как и выше, х означает среднее арифметическое значений х15 х2, ...,хи, т. е.
х = -(х1 + х2+ ... +хи). В этом смысле говорят об интервальной п
оценке математического ожидания; интервал ]х —8, х+8[, т. е. ]х — Gtljn , X + aZ/V п [, называют доверительным интервалом (здесь 8 — произвольное число), а вероятность р=2Ф(/) — доверительной вероятностью, соответствующей доверительному интервалу.
Разумеется, чем больше взят (доверительный) интервал, тем больше (доверительная) вероятность р=2Ф(/) того, что оцениваемое математическое ожидание будет заключено именно 9 *
260
Глава V. Теория вероятностей
в этом интервале. Иногда формула (6) определяет сравнительно высокую доверительную вероятность для сравнительно узкого доверительного интервала. Такой результат, конечно, особенно ценен в практическом отношении. Увеличивая число п испытаний, можно увеличить доверительную вероятность /> = 2Ф(/), приблизив ее как угодно близко к единице для любого (даже очень малого) интервала ]^ + 5, х — 5[.
Пример. Случайная величина X со среднеквадратическим отклонением суХ=су = 2 испытывается 20 раз; результаты испытаний таковы: 102; 101; 100; 103; 97; 94; 102; 100; 99; 97; 96; 95; 100; 98; 97; 96; 101; 105; 101; 100.
Вычислим точечную оценку математического ожидания этой случайной величины. Согласно формуле (1), получим
x=Z^=99,2.
20
Найдем теперь вероятность того, что математическое ожидание а будет находиться в пределах 99,2 +1.
Имеем % = 99,2, 6=1, п = 20, су = 2. Согласно формуле (5), получим 1=2откуда / = ^/20/2 = ^/5 = 2,24. Используя таблицу значений функции Лапласа, находим 2Ф(/) = 0,9750. Итак, с высокой вероятностью математическое ожидание а находится в пределах 99,2 +1.
Ответим еще на такой вопрос: каков должен быть интервал 99,2 + 5, чтобы искомое математическое ожидание находилось в нем с вероятностью 0,99?
Сначала из равенства 0,99 = 2Ф(/) по таблице значений функции Лапласа найдем / = 2,58. Далее, имеем 5 = су//л/й=2//^/20. Отсюда 5=1,15, что и определяет доверительный интервал 99,2+1,15, отвечающий заданной вероятности 0,99.
Из соотношений
Р(|Г-й|<8)=/7 = 2Ф(/),
можно вычислить п по заданным ст, 5, р. т. е. решить задачу о нахождении такого числа испытаний, чтобы данному доверительному интервалу х + 5 соответствовала данная доверительная вероятность р (при заданном а).
Мы рассмотрели примеры интервальной оценки математического ожидания в предположении, что среднеквадратическое отклонение о величины X известно. Случай, когда су неизвестно, рассматривается ниже (см. формулы (9) и (10), а также § 5*.8, 4).
3°. Оценки дисперсии. Для нахождения точечной оценки дисперсии можно вычислить среднее арифметическое квадратов отклонений (xt—x)2 (значений xt от среднего статистического):
5.8. Точечные оценки неизв. параметров. Статистическая проверка гипотез 261
в=^_Z. (7)
п
На первый взгляд при больших п это число должно быть хорошим приближением неизвестной дисперсии величины X, Оказывается, что такая точка зрения требует некоторого уточнения, а именно, что число
Р = ^-(х'—(8) п— 1
дает лучшее приближение неизвестной дисперсии (хотя при больших п числа (7) и (8) мало отличаются).
Можно доказать (это сделано в § 5*.8, 2), что математическое ожидание случайной величины —Равно DX (в предположении, что величины Хк независимы и одинаково распределены). Если же вычислить математическое ожидание случайной величины -£(JQ—-Xfe)2, то получится п — 1 ---DX. Указанные факты и являются основными аргумента-п
ми в пользу того, что считать точечной оценкой дисперсии число (8).
Рассматривают также интервальную оценку дисперсии, указывая для каждого интервала D + 8 вероятность Р(8), с которой искомая дисперсия принадлежи! этому интервалу.
Заметим, что в задаче об интервальной оценке математического ожидания в случае неизвестной величины о допустимо взять в качестве с число ^/В, где D—точечная оценка дисперсии, выражаемая формулой (8). Тогда
Р(|Т-й|<8) = 2Ф(8/ч/б) (9)
и доверительному интервалу ]х —8, х + 8[ соответствует доверительная вероятность /? = 2Ф(/), где 8 и t связаны соотношением
8 = ^1/^. (10)
Рассмотрим кратко общий вопрос об оценке параметров статистического распределения. Оценкой какого-либо параметра распределения по опытным данным является значение некоторой функции ср(А\, Х2. ..., Х„) от результатов испытаний х15 х2, ..., хп. Можно рассмотреть функцию ср(А\, Х2, ..., Х„) случайных величин Х19 Х2, ..., Хп. В § 5*.8, 1 обсуждаются те свойства функции ср (Xl9 Х2, ..., Хп), которыми она должна обладать для того, чтобы давать разумную оценку
262
Глава V. Теория вероятностей
исследуемого параметра. Эти свойства называются эффективностью. состоятельностью и несмещенностью.
4°. Генеральная совокупность и выборка. Рассмотренные выше задачи об оценке параметров иногда ставят и разрешают другим образом.
Пусть дано большое количество N элементов, каждый из которых характеризуется некоторым числом xk (k=l9 2, ..., N). Такое множество будем называть генеральной совокупностью. a N—объемом генеральной совокупности. Число
= С11)
называется средней генеральной, а число
Рг = Х(^-Хг)2 (12)
—генеральной дисперсией.
Фактическое вычисление хГ и Dr часто оказывается невозможным вследствие того, что объем генеральной совокупности очень велик. Тогда из генеральной совокупности случайным образом отбирают сравнительно небольшую по объему совокупность, называемую выборкой. Слова «случайным образом» означают, что для каждого элемента генеральной совокупности вероятность попасть в выборку равна 1/7V, так что все элементы имеют равные вероятности и последовательность испытаний независима.
Таким образом, возникает задача об оценке параметров хг и Dr по выборочным данным. Она является частным случаем описанной выше задачи об оценке параметров распределения по результатам испытаний: достаточно рассматривать испытание как выбор одного элемента из генеральной совокупности; при этом выборка будет совпадать с множеством значений случайной величины, полученным в результате проведенной последовательности испытаний. Обозначим элементы выборки через {х®, х^, х?}. При этом точечная оценка
средней генеральной (математическое ожидание случайной величины X. определяемой генеральной совокупностью) в соответствии с формулой (1) имеет вид
Число -Ух? называется средней выборочной', оно обозначается п
через хв. Следовательно,
хг«хв. (14)
f 5.8. Точечные оценки неизв. параметров. Статистическая проверка гипотез 263
Решение задачи об интервальной оценке математического ожидания также можно сформулировать, используя понятия генеральной совокупности и выборки. А именно,
Р(|хв-хГ |<5) = 2Ф(^), (15)
где 8 определяет доверительный интервал ]хв —8, хв + 8[, в котором с вероятностью р = 2Ф(/) = 8х/Тг/су) находится средняя генеральная.
Точечная оценка генеральной дисперсии по выборочным данным имеет вид
D (16)
п — 1
Правая часть соотношения (16) называется выборочной дисперсией.
5°. Выборочные моменты. При вычислениях, связанных с множеством значений величины X, полученных в результате п испытаний, или с выборочной совокупностью х2, •••? Рас” сматривают выражения вида
m (k=\, 2, ...). (17)
п п п ' 7
Эти выражения называются статистическими (выборочными) моментами к-то порядка — соответственно—начальными, относительными (относительно числа а) и центральными.
Легко видеть, что xB = m15 DB=—— т". Определенный ста-п— 1
тистический смысл имеют и другие моменты, в особенности центральные. Введение относительных моментов объясняется тем, что при вычислении центральных моментов легче сначала вычислить относительные моменты (относительно подходящим образом подобранного числа а) и затем найти центральные моменты (см. § 5*.8, 5).
При испытании пары случайных величин имеем совокупность пар полученных значений (xj j^), (х2; у2), •••, (*„; л)-Для такой совокупности рассматривают смешанные моменты:
тк-------•> тк1~------------>
п п
(18)
к, 1=0, 1, 2, ... п
(начальные, относительные и центральные). Они понадобятся нам в § 5.9 при обсуждении понятий выборочной регрессии и корреляции.
264
Глава V. Теория вероятностей
Для сокращения записи удобны следующие обозначения: пусть результатом испытаний величины Z является множество значений z1? z2, ..., zw; тогда среднее значение -(z1+z2 + ... + zw) обозначается через z. В частности,
ти=хку1, т'к1=(х-а)к(у-Ь)1, тк1=(х-х)к(у-у)1.
6°. О статистической проверке гипотез. Пусть задана случайная величина X и проведено п независимых испытаний этой величины, в результате чего получены значения х2, ..., хп. Такое множество называют статистической совокупностью.
Положим <2 = minxfc, £ = maxxk и разделим интервал [а, Ь] на т равных частей Д19 Д2, ..., Дш; пусть /с15 к2, ..., кт означает количество элементов множества {х1? х2, ..., хп}, принадлежащих соответственно интервалам Д1? Д2, ..., Дт.
Поставим следующий вопрос: насколько вероятно предположение о том, что данная случайная величина распределена по данному дифференциальному закону /(z)? Этот вопрос будем понимать в таком смысле. Пусть случайная величина X распределена по закону /(z); тогда событие, состоящее в том, что результаты п испытаний окажутся распределенными по интервалам Д1? Д2, ..., Дш с помощью чисел к19 к2, ..., кт, имеет некоторую вероятность у, зависящую, разумеется, главным образом от гипотетического распределения /(z). Если эта вероятность окажется малой, то высказанную гипотезу [о распределении случайной величины X по закону /(z)] следует отвергнуть. Если же вероятность у окажется близкой к единице, то отвергать гипотезу нет оснований.
Наряду с понятием статистической совокупности используют понятие статистического ряда. Если расположить интервалы Д£ в порядке возрастания их центров хг и для каждого интервала Д£ указать количество значений случайной величины X. принадлежащих этому интервалу, то получится статистический ряд. Статистический ряд гораздо более удобен для исследований, чем статистическая совокупность.
Уточнение поставленной задачи заключается в следующем. Каждому интервалу As соответствуют вероятность ps того, что случайная величина X примет значение в этом интервале (теоретическая вероятность, которая равна j/(z)dz), а также
As частота наступления этого события в серии из п испытаний, равная kjn—pl (эмпирическая вероятность того, что случайная величина X примет значение в интервале Д5). Если сделанная гипотеза справедлива, то в силу закона больших чисел отклонения ps—p*s малы при большом количестве п испытаний.
5.8. Точечные оценки неизв. параметров. Статистическая проверка гипотез
265
Для выполнения списанной в общих чертах программы проверки гипотезы необходимо уметь вычислять вероятности того или иного отклонения набора теоретических частот р19 р2, рт от набора эмпирических частот р\, р*2. .... р*т.
Оказывается, что существуют такие функции от случайных величин pi, р2. Рт, распределение которых не зависит ни от гипотетического распределения /(/), ни от количества п испытаний, если только п велико. Среди таких функций чаще других рассматривают
т
x2=Z 1 = 1
(р*~Р;)2 _ у (fcj-wpi)2 Pi ,-=i nPi
(19)
Как установлено американским математиком К. Пирсоном, случайная величина %* при больших п распределена по (дифференциальному) закону
kr(t)=
при />0,
при /<0.
(20)
Здесь Г(г)= J /r-1e“tdZ (гамма-функция; см. § 5*.8, 6). о
Функции kr(t), т. е. ki(t). k2(t). .... табулированы.
Тот факт, что величина %2 распределена по закону (20), позволяет вычислить вероятности того, что случайная величина %2 принадлежит тому или иному интервалу.
Интерес представляют интервалы вида [0, h ] и [h. оо ]. В случае хорошего совпадения теоретических и эмпирических частот величина %2 не будет принимать слишком больших значений. Поэтому вероятности Р(%2>А) в случае справедливости гипотезы должны быть малы при больших h.
Можно задать некоторую малую вероятность 8 и найти Ле такое, что Р(%2 >Ле) = 8. При этом естественно считать, что в случае, когда полученное из опыта значение %2 будет больше, чем Л£, гипотезу следует признать противоречащей опытным данным, в противном случае — непротиворечащей им. В первом случае говорят, что гипотеза несостоятельна на уровне значимости 8.
Иногда поступают так. Вычисляют значение %2 по формуле (19), а затем по таблицам находят вероятность того, что случайная величина %2 превзойдет значение %2. Если вероятность такого события мала (это значит, что %2 неправдоподобно велико), то гипотеза опровергается.
266
Глава V. Теория вероятностей
Прежде чем перейти к примерам, укажем смысл параметра г в формуле (20). Параметр г есть разность m—s, где т—количество интервалов А1? А2, Aw, a s—количество связей, налагаемых на эмпирические частоты р*. Чаще всего рассматривают единственную связь
1^=1; (21)
в этом случае г = т = \. В некоторых постановках задач частоты р* должны удовлетворять, кроме связи (21), еще и равенству
= (22)
где —центр интервала Az (z= 1, 2, ..., m), т. е. требуется, чтобы статистическое среднее совпадало с математическим ожиданием; в этом случае s=2 и г=т—2. Иногда требуется, чтобы частоты /7- удовлетворяли условиям (21), (22), а также соотношению
^Xi-^XiP^p^DX (23)
(статистическая дисперсия совпадает с дисперсией случайной величины X). В этом случае 5 = 3 и г = т — 3. Рассматривают и другие соотношения, налагаемые на /7*.
Распределение Лг(/) называют ^-распределением с г степенями свободы, а изложенный способ проверки гипотезы — X 2-критерием Пирсона.
Примеры. 1. Пусть результаты 100 испытаний дали следующее распределение значений величины X по интервалам Af = [2z —2, 2i\ (z=l, 2, ..., 10):
At- Ai А2 A3 Л4 As А6 Av Ав а9 Аю
8 11 9 15 7 10 9 11 8 12
Проверить гипотезу о равномерном распределении случайной величины на отрезке [0, 20].
Решение. Имеем /71 = 0,08, /71 = 0,11, /71 = 0,09, /4 = 0,15, /7*5 = 0,07, /7*6 = 0,1, /7*7 = 0,09, /7*8 = 0,11, /7*9 = 0,08, /7*1о = 0,12. Теоретические вероятности pt попадания значений х в интервал Af равны отношению длины Af к длине отрезка \а, 6]; в данном случае рг = 0,1 (z= 1, 2, ..., 10).
Используя формулу (19), находим
-2= у (p*-Pi)2_ у (^-Ю0а)2_ у (£,-10)2_ i = i A 100А 10
=—(44-14-14-25 4-94-04-14-1+44-4) = 5.
Параметр г равен т—s при т =10, л = 1, т. е. г = 9 [эмпирические вероятности удовлетворяют единственному условию (21)]. По
5.8. Точечные оценки неизв. параметров. Статистическая проверка гипотез 267
таблице значений функции k9(t) находим, что для /2 = 4,17 вероятность /7 = 0,9, а для %2 = 5,38 вероятность /? = 0,8. Это означает, что с вероятностью 0,9 случайная величина %2 превзойдет число 4,17 и с вероятностью 0,8 она превзойдет число 5,38. Вычисленное значение %2 = 5 случайная величина X превзойдет с вероятностью р такой, что 0,8 </><0,9.
Следовательно, гипотеза не противоречит опытным данным.
2. Результаты 100 испытаний величины X дали следующие распределения по интервалам A=[2z—12, 2i—10] (z=l, 2, ..., 10):
Al Аг Аз д4 А5 Ав А7 Ав а9 Aw
kt 0 1 5 16 28 26 18 2 3 1
Проверить гипотезу о том, что случайная величина X распределена по нормальному закону.
Решение. Рассмотрим нормальную случайную величину, среднее значение и дисперсия которой совпадают со средним статистическим х и статистической дисперсией D заданной совокупности. Пусть ъ — центр интервала Af. Имеем
х = (_9.0-7 1-5-5-3 16-
1Г’ 100 100'
-1-28 + 1 -26 + 3-18 + 5-2 + 7-3 + 9-1) = ^-12 = 0,12.
Найдем статистическую дисперсию заданной совокупности:
О = £хЩ-(ЕЛй)2=^(81-0 + 49 + 25-5 + 9-16 +
+ 1 - 28+1 - 26 + 9’ 18 + 25-2 + 49- 3 + 81 • 1) — 0,122 =
= 8,12-(0,12)2^8Д 1.
Для нормальной случайной величины X с математическим ожиданием « = 0,12 и дисперсией 8,11 теоретические вероятности Pi того, что величина примет значение в интервале А£, можно вычислить по формуле
где и —границы интервала Af. В результате вычислений получим следующую таблицу:
Аг Ai Аг Аз А4 а5 Аб А7 Ав а9 Aio
Pi 0,002 0,014 0,058 0,153 0,253 0,262 0,170 0,068 0,017 0,003
268
Глава V. Теория вероятностей
Вычислим %2; имеем
-2 = у (а~р?)2_ у (100/>.-М2_ 6 82
Л Pi 100/Л
В рассматриваемом случае частоты р* связаны тремя соотношениями вида (21) — (23); число степеней свободы распределения %2 равно г = 10—3 = 7. По таблице значений функции ky(t) при £ = 0,05 находим /^рит = 14,1. Так как Х2<%кРит> то нет оснований отвергать гипотезу о нормальном распределении.
§ 5.9. Понятие о выборочной регрессии и методе наименьших квадратов
1°. Простейшая задача регрессии. Пусть в результате п испытаний получены пары значений случайных величин X и Y:
Оч; я)> (%2; у2), (х„; у„). (1)
Эти данные удобно проиллюстрировать чертежом (рис. 56): каждая пара (хк\ j;fc) изображается точкой на плоскости с координатами хк, ук.
Допустим, что случайная величина Y имеет вид Y— Уо + К где Yq — случайная величина, связанная с X линейной функциональной зависимостью Уо = кХ+b [к и b—некоторые неизвестные постоянные), а V—случайная величина, являющаяся ошибкой измерения Уо или отражающая влияние на Уо неизвестных нам случайных факторов.
Если бы У=0, то точки на плоскости, изображающие результаты испытаний (1), принадлежали бы прямой у = кх + Ь. Фактические данные (1) задают множество точек, не лежащее ни на какой прямой, хотя при малых V точки (1) расположены неподалеку от некоторой прямой: образно говоря, влияние величин V оказалось небольшим.
Возникает важная в практическом отношении задача: по опытным данным (1) восстановить прямую, выражающую
линейную зависимость Y^kX-Vb.
При решении этой задачи будем придерживаться такой точки зрения. Пусть у = кх + b — некоторая прямая на плоскости. Разность
bi=\yi-kxi-b\ (2)
равна длине отрезка АВ (рис. 57). Чем больше раз
j> 5.9. Выборочная регрессия и метод наименьших квадратов
269
ности (/= 1, 2, п) в совокупности, тем дальше «отстоит» прямая y = kx-\-b от множества точек (1), тем хуже она приближает искомую зависимость. Будем считать, что «расстояние» от прямой y = kx+b до системы точек (1) выражается равенством
b) = Y^i=Y\yi-kxi~b\2- (3)
Это «расстояние» удовлетворяет естественному требованию задачи: чем больше «расстояние», тем «дальше» отстоит прямая от множества точек, тем хуже она приближает искомую зависимость; при jR = 0 прямая проходит через каждую точку множества (1).
Наилучшей прямой, т. е. прямой с наилучшим «расстоянием» (2) до множества точек (1), является такая прямая y = kx + b, параметры к и b которой определяют минимум функции R (к, Ь). Вычисления показывают, что минимум функции R{k. b) достигается в точке с координатами
(доказательство см. в § 5*.9, 2).
Прямая у = кх + Ь, для которой сумма квадратов — кхг — b)2 достигает наименьшего значения, называется прямой выборочной регрессии.
Обозначая с помощью черты сверху среднее значение соответствующей величины, можно записать формулы (4) в виде
к=^ ху-, Ь=у — кх, х2-(х)2
(5)
а уравнение искомой прямой—в виде у-у=к(х-х). (6)
Из последней формулы видно, что эта прямая проходит через точку (х; у).
Заметим также, что числа к и b выражаются через статистические моменты (см. § 5.8) следующим образом:
i ^11 ^10^01 1 1 С~1\
к =----7—гу-, Ь = т01-кт10. (7)
Число А2, равное значению функции R(к. Ь\ где к и b определяются равенствами (7), называется остаточной дисперсией.
270 Глава V. Теория вероятностей Оно показывает, насколько хорошо прямая у = кх+Ь приближает множество точек (1). Можно доказать, что А2 = п(а2У—fc2a2X) (см. § 5*.9, 3).
Разумеется, «расстояние» от прямой до множества точек можно измерять многими различными (и разумными) способами. Каждый раз ставится задача о вычислении минимума функции, решение которой определяет прямую, приближающую искомую зависимость между X и Уо. Выбор функции R(k, b) вида (3) для решения поставленной задачи обусловлен следующими вероятностными соображениями. Величины 8р представляют собой результат испытаний случайной величины V2. Если V распределена по нормальному закону, то среди всех возможных наборов б2, 82, 8 2 при независимых
испытаниях наибольшую плотность вероятности имеет такой, для которого ^82 минимальна (принцип максимального правдоподобия). Подробнее об этом см. § 5*.9, 1.
Изложенный выше метод нахождения прямой выборочной регрессии связан с довольно простыми вычислениями и широко применяется на практике. Этот метод называется методом наименьших квадратов.
Пример 1. Пусть в результате испытаний получены следующие пары значений случайных величин X и Y: (1; 1), (2; 3), (2; 4), (3; 6), (4; 5), (6; 3), (7; 5), (8; 4), (9; 12), (10; 10). Найти уравнение прямой выборочной регрессии.
Решение. Для вычисления параметров к и b удобно составить таблицу:
В нижней^ строке таблицы записаны средние значения х, у, х2, ху, у2. Согласно первой из формул (5), получаем
7 34,6-27,56 _ 7,04 _п __о К---------------------U. /j 2.
36,4-27,04 9,36
j* 5.9. Выборочная регрессия и метод наименьших квадратов
271
Итак, уравнение линии регрессии имеет вид у — 5,3 = = 0,752 (х—5,2). Решение иллюстрирует рис. 57.
Как известно (см. § 5.4), степень линейной зависимости между случайными величинами X и Y измеряется коэффициентом ковариации kXY и коэффициентом корреляции rXY:
kXY = M(XY)-MX-MY= =М[(1-МХ)(У-МГ)], (7)
где MX, МУ, М(ХУ) и М[(Х-МХ)(У-МУ)] означают соответственно математическое ожидание величин X, У, ХУ и произведения (X—МХ)(У—МУ), а оХ, о У—среднеквадратические отклонения величин X и У.
Статистической оценкой параметров kx,Y, rXY распределения пары (X, У) являются соответственно выборочный коэффициент ковариации kXY и выборочный коэффициент корреляции rXY:
kXY = xy-xy.
(9)
(10)
Здесь
Выборочный коэффициент корреляции rXY. как и коэффициент корреляции гху, удовлетворяет неравенству
(12)
Крайние значения — 1 и 1 выборочный коэффициент корреляции принимает в том и только в том случае, когда точки множества (1) расположены на прямой y = kx-yb (fc/0).
Для независимых случайных величин X и У выборочные коэффициенты ковариации и корреляции близки к нулю, поскольку они являются оценками нулевых значений kXY и rXY,
272
Глава V. Теория вероятностей
Таким образом, вычислив Гху Для множества (1), можно судить о степени линейной зависимости между случайными величинами X и Y: если значения г^у близки к ±1, то зависимость между X и Y близка к линейной (случай соответствует прямой у — кх+Ь при А;>0, а случай —1— прямой у = кх+Ь при А:<0); если же значения г*ху близки к нулю, то нет оснований говорить о линейной зависимости между X и Y.
Пример 2. Найти выборочный коэффициент корреляции для совокупности (хк; ук) из примера!.
Решение. Воспользуемся таблицей на с. 270, в нижней строке которой записаны значения х, у, х2, ху, у2._Сначала
найдем кху = ху — ху = 34,6^- 27,56 — 7,04, (ст® )2 = х2—(х)2 = -36,4-27,04-9,36 и.(<у|)2-;у2 — (^)2 —38,1-28,09 —10,01. Затем, используя формулу (10), получим
гв _ __ 7,04 _ 7,04 _7,04_ 97>
XY ^/936^/10,01 3,06-3,16 9,67
Этот результат показывает, что степень линейной зависимости между X и Y довольно высока.
2°. Обобщение задачи о регрессии. Рассмотренная в п. 1° задача допускает такие обобщения.
Пусть задана совокупность (1) результатов испытания пары случайных величин и множество L функций вида
y=f(x, Ск, С2, Ск), (13)
где х—аргумент, a С15 С2, Ск — параметры. Требуется в множестве L найти такую функцию f(x, Ск, С2, Ск), которая обращает в минимум функцию
R(Ct, С2, ..., Cft) = S(yt-f(x, Ск, С2, Ск))2. (14)
График искомой функции f(x, С°, С2, С°) наилучшим об-
разом приближает множество точек (1) на плоскости.
Такая задача возникает, например, при следующих обстоятельствах. Предположим, что случайная величина Y является функцией случайной величины X и эта функция принадлежит классу L. Из-за ошибок измерения или случайных помех фактические данные испытаний (1) не подчиняются ни одной из зависимостей вида y=f(xk, С\, С2, ..., Q). Тогда естественно определить ту функцию из L, которая «отклоняется» от опытных данных меньше всего в смысле (14).
Часто рассматривают класс L, состоящий из функций вида
y = Clxk~1 + C2xk-i + ... + Ck (Сх, С2, ..., CkeR) (15)
5.9. Выборочная регрессия и метод наименьших квадратов 273
В этом случае задача сводится к нахождению многочлена (к— 1)-й степени, обращающего в минимум функцию (14). Ее решение приведено в § 5*.9, 5.
Разумеется, чем шире класс £, тем меньшего значения функции R можно достигнуть. Однако следует заметить, что при к^п — 1 можно выбрать многочлен (15) так, что функция (14) обратится в нуль, т. е. график многочлена пройдет через все точки (хк; ук) заданной совокупности. В этом случае найденный многочлен, как правило, не выражает каких-либо существенных черт зависимости между X и Y. Это обстоятельство нужно иметь в виду, устанавливая класс L функций, из которых затем будет выбрана наилучшая. Иными словами, при желании можно взять класс L столь широкий, что функция R достигнет своего абсолютно минимального значения (нулевого), и это будет сделано не благодаря выявлению скрытой зависимости между X и У, а вследствие неправомерного расширения множества L. Такой выбор множества L является неразумным.
Опишем следующую задачу, часто возникающую при изучении зависимости случайных величин по опытным данным.
Пусть даны к+\ случайных величин Х19 Х2, ...,Хк9 У, из которых Х19 Х2, ..., Хк попарно независимы. В результате серии из п испытаний получены значения совместного распределения величин Х1? Х2, ..., Xk9 Y:
(х\, х12, хк, у1), i=l,2,...,n (16)
(результат каждого испытания соответствует точке (А:+1)-мерного пространства Rfc+1).
Требуется найти уравнение
у=А1Х1+А2х2 + ... + Акхк (17)
такое, что функция
Л2, ... Ak) = Y(yi1-A1xi1-A2xi2-...-Akxlk)2 (18)
достигает в точке (А ?, А 2, .... Ак) максимального значения.
Такая задача возникает в обстоятельствах, аналогичных тем, которые были описаны в начале параграфа с той только разницей, что случайная величина У считается линейной функцией не одной, а нескольких (независимых) случайных величин Х15 Х2, ..., Хк. Решение этой задачи приведено в § 5*.9, 4.
Название «метод наименьших квадратов» относится к постановкам и способам решения описанных выше задач. Отметим, что идеи метода наименьших квадратов применяются в исследовании некоторых вопросов, вовсе не связанных с теорией вероятностей (см. § 4.1).
Глава V. Теория вероятностей
274
§ 5.10. Понятие о случайном процессе. Процессы с независимыми приращениями. Пуассоновский процесс
1°. Понятие о случайном процессе. Практические задачи часто бывают связаны с изучением случайных величин, изменяющихся во времени. Например, помехи радиоприема случайны и зависят от времени, этим же свойством обладают отклонения управляемого объекта от расчетной траектории.
Математической абстракцией подобных процессов является понятие случайного процесса или случайной функции X(t\
Существенные черты случайного процесса X(t) заключаются в следующем:
1. При каждом значении времени t=t0 определена случайная величина X(tQ) со своим законом распределения/(х). Случайная величина X(t0) называется сечением случайного процесса А"(/) в точке t0,
2. Случайные величины и X(t2), как правило, зависимы, в особенности, если tr и t2 близки.
Пусть tA и t2 — два близких момента времени и пусть в момент tr случайная величина Х(^) приняла значение хг Тогда случайная величина X(t2} примет значение, близкое к (в силу непрерывного изменения значений исследуемой случайной величины от времени). Это и означает, что событие Х(/1) = х1 влияет на распределение X(t2\ т. е. и Х(/2) зависимы (по крайней мере при ма-
лых I — t2 I ).
Если рассмотреть последовательность моментов времени
?i> t2, | = Д (1)
и соответствующие им случайные величины
X(ty X(t2), .... X(tn) (2)
[сечения процесса X(f)], то можно говорить о совместном распределении этих случайных величин. Конечно, функция совместного распределения случайных величин (2) содержит полную информацию об этих величинах. Однако случайные величины хорошо описывают случайную функцию X(t) только при большом п и малом А. Правда, и в этом случае совместная функция распределения величин X(t^ является очень сложной (из-за большого п).
Все же в некоторых случаях бывает полезным рассматривать совместное распределение величин (2).
Функции
Fn0i, ^2’ •••’ и? -^1? -^2’ •••’ *И)
— Р {Х± (/i)< х1? Х2 (t2)< х2, •••, Хп (/и)< хи} (3)
5.10. Случ. процессы. Процессы с незав. приращениями. Пуассоновский процесс 275 называются л-ми конечномерными функциями распределения случайного процесса (п=Х. 2, ...). Эти функции определяют условные распределения вероятностей
Р(^1> ^2? *^1’ I $т + 1? •••’ ^т+1’ •••» ^п)
= *2’ *п).; т = 0, 1, п-1. (4)
Функции P/{(z1? t2. ..., tk; xr, x2. .... xk) называются /с-ми дифференциальными конечномерными функциями распределения случайного процесса. Аналогично формуле (30) §5.3, справедливы формулы
<2. V : %*.... < (5)
Функция условного распределения Р(/15 х1? хт | /т+1, хт+1, хп) для каждого набора аргумен-
тов задает вероятность (в случае дискретных величин) или плотность вероятности (в случае непрерывных величин) события Х(/1) = х1, X\t2} = x2. .... X(t ) = хт при условии, что наступило событие X(zm+1)=xm+1, X(tm+2) = xm+2...X(tn} = xn.
Изложенная точка зрения на случайную функцию показывает, что это понятие является весьма сложным.
Следующее описание случайного процесса представляет собой другую точку зрения, довольно наглядную, однако и здесь попытка точной количественной оценки вероятностей событий обнаруживает большую сложность проблемы.
Будем рассматривать X(t} как опыт, результатом которого является функция ср(?) из некоторого заданного класса L (в большинстве прикладных задач L состоит из непрерывных функций или функций, обладающих той или иной степенью гладкости). Для количественного описания случайного процесса Х(й) нужно уметь вычислять вероятности Р(П) того, что заданная функция ср (/)—результат испытания, проведенного над Х(/),— принадлежит тому или иному подмножеству Q множества L. При этом должны быть выполнены следующие условия: 1) 0(£1)^1; 2) P(Q1|JQ2) = P(Q1) + P(£12) Для любых двух непересекающихся подмножеств и П2. Описание функций Р, сопоставляющих подмножествам из L числа на отрезке [0, 1 ] и обладающих указанными выше свойствами (такие функции называются мерами в £), является весьма сложным делом. Приемлемым в практическом отношении такое описание получается лишь при дополнительных и очень ограничительных условиях на случайный процесс.
Функция ср (/), полученная в результате испытания, называется реализацией (или траекторией) случайного процесса
276 Глава V. Теория вероятностей
(случайной функции) Сама функция <р(/) является неслучайной.
Определение 1. Математическим ожиданием случайного процесса (случайной функции) X(t) называется (неслучайная) функция М1(/), значение которой в каждой точке /0 равно математическому ожиданию случайной величины X(z0)—сечения случайного процесса X(z).
Определение 2. Дисперсией случайного процесса X(t) называется (неслучайная) функция значение которой
в каждой точке /0 равно дисперсии случайной величины — сечения случайного процесса X(t).
По определению, среднеквадратическое отклонение cl(/) случайного процесса X(t) равно квадратному корню из его дисперсии, т. е. oX(/) = A/D(z).
Определение 3. Ковариационной функцией случайного процесса Х(/) называется (неслучайная) функция cov(5, /), значение которой в точке (s0; Zo) равно ковариации случайных величин У(50)и X(Iq)—сечений случайного процесса X(t} в точках яоиго.
Нормированной ковариационной функцией случайного процесса У(/) называется (неслучайная) функция rx(s, t), значение которой в каждой точке (s0; /0) равно коэффициенту корреляции случайных величин У(л0) и X(t0) — сечений случайного процесса X{t) в точках /0 и 50.
Согласно формуле (29) § 5.4, имеем
г И A- COVM _m[(x(.)-m^))(x(z)-mz(z))] ' <jX(s) oX(t) cyX(s) <5X(t)
Рассматривают также ковариационную функцию covxy(s, t) и нормированную ковариационную функцию р*у(.у, t) пары случайных процессов X, Y. По определению,
covxy(s, /) = М[^) У(?)]-МДу)МУ(/), (7)
/ д covk t)
Руу(^ )
При этом справедливы соотношения п Д_М[(4)-МТ(5))(Г(/)-МГ(0)] Рх1У’ --------------------аУ0сУ(г) ’ W
— 1^рХУ^1, DX(s) = covXx(5, 5), Dy(/) = covyy(z, /), где DX, ОУ—дисперсии случайных процессов Х(^) и У(/).
Значения функций covxy(s, /) и рху(5, z) измеряют степень линейной зависимости сечений X(.sj и У(/).
В связи с этим ковариационную и нормированную ковариационную функцию случайного процесса X(z) иногда называют
5.10. Случ. процессы. Процессы с незав. приращениями. Пуассоновский процесс 277 соответственно автоковариационной и нормированной автоко-вариационной функцией.
В приложениях теории вероятностей часто встречаются так называемые стационарные случайные процессы.
Определение 4. Случайный процесс называется стационарным, если для всех его п конечномерных функций распределения при любом t0 справедливо равенство
^2’ •••’ -^2? •••> ^и)
+ ^2 + ^0? •••’ ~Ь ^0? •••’ Хл) (1Q)
Комментарий к определению 4, Свойство стационарного процесса, выраженное формулой (10), означает инвариантность, т. е. независимость конечномерных распределений относительно сдвига по времени на величину /0. В частности, это означает, что все сечения случайного процесса X(z) одинаково распределены и ковариационная функция cov(5, /) обладает следующим свойством: для любых 51? s2, /15 t2 таких, что t1—s1 = t2—s2, справедливо равенство cov(s1? ^) = = cov(tv2, Z2).
Из последнего условия следует, что функция cov(5, /), будучи функцией двух переменных s и /, фактически зависит только от разности s—t, т. е. существует функция х(т) одной переменной т, обладающая свойством cov(s, t) = x(s—t), T = s—t. Иногда вместо х(т) пишут
Если а(/)—случайный процесс, описывающий отклонение управляемого объекта от расчетной траектории, то этот процесс является стационарным тогда, когда факторы, вызывающие отклонения, не меняются со временем (установившийся режим полета); в частности, отклонение х(Н в момент t должно сказываться на случайном отклонении х(л) в моменз s так же, как х(/-Н0) на х(5+/0).
Определение 5. Функция /) = M((X(s) Х(/)), где
— математическое ожидание произведения случайных величин X(s) и называется корреляционной функцией случайного процесса Xyt).
Рассматривают также корреляционную функцию RXy(s, t) пары случайных процессов X(t) и У(/). По определению,
Rxy(s, t)=M(X(s) Y(t)\ (11)
Комментарий к определению 5. 1) Корреляционная и ковариационная функции связаны соотношением
covxr(s, t) = RXY(s, /)-М(2Г(/))-М(У(л)).
2) Если X=Y, то равенство (11) примет вид Rxx(t, t)= =М(Х(Г))2.
278
Глава V. Теория вероятностей
3) Для стационарного случайного процесса корреляционная функция Rx(s, t} = Rxx(s, является функцией одной переменной T = t—s. Употребляют обозначение Лу(т) = ^хх(т) = М(х(г) х xjc(Ht)). При этом jRx(0) = 1?xx(0) = M(x(/))25 где —
математическое ожидание случайной величины X2(t\ не зависящее от т.
Среди всевозможных случайных процессов естественно выделить те, для которых и-е конечномерные функции распределений имеют простой вид. Иногда все /я-е конечномерные функции распределений полностью определяются и-ми функциями (т>п). Говорят, что случайный процесс имеет порядок л, если все его конечномерные функции распределения выражаются через л-мерные функции, но не выражаются через (п — 1)-мерные функции распределения.
Рассмотрим, например, процесс, который определен семейством попарно независимых случайных величин X[t)*9 он называется чисто случайным процессом. Первая дифференциальная конечномерная функция распределения со-
впадает с функцией распределения сечения Ад/J; вторая конечномерная дифференциальная функция распределения Г(2)(/1? t2; АД, х2) является произведением функций xj
и Г(1)(/2; х2); аналогичное утверждение справедливо и для п-й дифференциальной конечномерной функции распределения:
F„(/i, t2, t„; xt, x2, x„)=F(1)(t1; x^F^fa; x2)...F(1)(l„; x„).
Таким образом, чисто случайный процесс является процессом первого порядка.
Заметим, что реализации (траектории) такого процесса не могут быть непрерывными функциями по причинам, описанным в начале данного параграфа. Поэтому для всякого чисто случайного процесса, характеризующего какое-либо физическое явление, случайные величины X(t) должны быть дискретными. 2°. Марковские случайные процессы. Марковские случайные процессы характеризуются следующим свойством их условных конечномерных функций распределения (10):
I /j_, /2, “^2’ •••’ ^п— 1? Хп— 1) Хп I tn— 15 Хп— 1), (12)
т. е. условное распределение X(tn) при условиях
Ar(/1) = x1, Аг(/2) = х2, ..., Aj/n_ J = xn_ (13)
зависит только от условия Аг(/П_1) = хи_1 и не зависит от остальных условий (13) при любых /1? t2,..., tn_2.
Марковский процесс вполне определяется своей второй конечномерной функцией распределения вероятностей Г(/15 /2; х15 х2) или первой конечномерной функцией распределения
5.10. Случ. процессы. Процессы с незав. приращениями. Пуассоновский процесс 279
F(/1? совместно с «вероятностями перехода»: P(f2, х2 | xj, Марковский случайный процесс является процессом второго порядка.
3°. Процесс Пуассона. Важным частным случаем марковского процесса является процесс Пуассона. Типичным примером процесса Пуассона служит процесс, описывающий работу телефонной станции; реализация (траектория) такого процесса есть функция k(t)9 равная количеству вызовов, поступивших на станцию за время t.
Общий случай, так же как и приведенный пример, характеризуется тем, что сечения процесса представляют собой дискретные величины, а реализации процесса—неубывающие функции.
Кроме условий, которые определяют марковский процесс, для пуассоновского процесса предполагается выполнение дополнительных условий. А именно, вторая конечномерная функция распределения должна обладать следующими свойствами:
при
Х2 I Ч’ *1)=<
1—аД/+о(Д/) при аД/+о(Д/) при
О при
х2<х1? х2 = х1?
Х2 = Х1Ч_ 1, х2>х1+ 1.
(14)
Здесь а—некоторая положительная постоянная (параметр распределения Пуассона), о(Д/) — бесконечно малая более высокого . .. о (Az) Л
порядка малости, чем Д/ = /2 —т. е. lim -А—-=0. AZ—>0
Вероятности Р(^2, Х2 I ^1? Х1) МОЖНО вычислить в явном виде. А именно, оказывается, что функция Р(/2, х2 |xj зависит только от х2—х1 и t2 — Г1? т. е. имеет вид
p(z2, х2 I ?1, л1) = <р(А:, t), k=x2—x1, t=t2-tv
При этом
<p(M) = e~at^2 k=0, 1, 2, .... (15)
Вывод формул (15) приведен в § 5*.10, 1.
4°. Случайные процессы с независимыми приращениями. Пусть дано однопараметрическое семейство X(t) случайных величин такое, что для любого конечного множества вещественных чисел tl<t2<...<tn приращения X(tk+1^—X{t^ попарно независимы. Это свойство определяет случайный процесс, который называется случайным процессом с независимыми приращениями.
280
Глава V. Теория вероятностей
Примером такого процесса является описанный выше пуассоновский процесс.
Случайный процесс с независимыми приращениями называется процессом со стационарными приращениями, если распределение X(t+s) — X(t) зависит только от $ и не зависит от t.
Стационарные случайные процессы с независимыми приращениями обладают рядом интересных свойств и описывают важные в практическом отношении реальные случайные процессы. Дополнительные сведения о них приведены в § 5*. 10, 2.
Случайные процессы X(t) с постоянным распределением сечений и ковариационной функцией k(s, t), зависящей только от t — s [т. е. &(*$,/)= ср (/ — s)], называются стационарными процессами в широком смысле.
5°. Случайные процессы, определяемые случайными параметрами. Пусть x — x{t, ^2, ..., £т) есть ^-параметрическое семейство функций; ^2, ..., — случайные величины с известной фун-
кцией совместного распределения. При этих условиях возникает случайный процесс, траекториями которого являются функции х = х(1г, ^2, £m), где ^2, —значения случайных
величин, полученные в результате испытания.
Заметим, что на случайные процессы переносятся все операции, которые могут быть определены на функциях (реализациях, траекториях случайных процессов). Правило такого переноса является естественным и заключается в следующем. Пусть каждому набору функций x1(z), х2(/), ..., xn(t) [реализаций процессов X1(t), X2(t), Хи(/)] заданная операция сопоставляет
функцию j;(z). Тогда определен случайный процесс У(/), реализациями которого являются функции Точнее, каждая функция y(t) представляет собой реализацию случайного процесса Y(t) в том самом испытании, в котором реализациями процессов
(г), Х2 (/), ..., Xn(t) служат функции (г), х2 (t), xn(t\
В этом смысле понимают такие выражения, как X(z) + Y(t), аХ2+рАТ, ^(Z+Zo), X'(t), jx(t)dt и др.
to
6°. Спектр стационарного случайного процесса. Важным понятием теории случайных процессов является спектр (спектральная плотность).
Определение 6. Спектром Ф(ш) (или спектральной плотностью) стационарного случайного процесса X(t} называется преобразование Фурье его корреляционной функции Rx(t), т. е.
+ оо
= i f (16)
— 00
£ 5.10. Случ. процессы. Процессы с незав. приращениями. Пуассоновский процесс 281
Комментарии к определению 6. 1) Если функция Х(г) является действительной, то и Ф(со)—действительная функция.
2) Формула (15) допускает обращение (при выполнении соответствующих условий сходимости):
+ 00
Ях(т)= 1 Фх(®)е1оиаю. (17)
— оо
Для действительных процессов формула (17) принимает вид
00
Лх(т) = 2 J Фх(ю) coscordco. о
При этом Rx (т)=М(Х(0)Х(т)), 7?x(0) = M(Jf2(0)).
3) Формулу (17) при т = 0 можно истолковать как разложение «средней мощности» по частотам со:
АХ(О)=М | X|2 = 2 J Фх(со)асо. (18)
При этом функция рассматривается как электрический сигнал (напряжение или сила тока в зависимости от времени /). Этот сигнал разлагается в ряд (или интеграл) Фурье, т. е. представляется в виде конечной или интегральной суммы гармоник. Средняя мощность пропорциональна сумме квадратов амплитуд (или интегральной сумме квадратов амплитуд гармоник). Формула (17) и дает разложение средней мощности сигнала в интегральную сумму 2E(cofc)Afc, предел которой есть 2 J Фх(со)с1а) (^-слагаемое суммы 2L®(cofc)Afc соответствует о частоте cofc).
Описанная точка зрения определяет физический смысл спектральной функции и объясняет ее название.
4) Сходимость интеграла в правой части равенства (16) имеет место в том случае, когда существует М(Х(г))2 и функция 7?х(т) быстро стремится к нулю.
Отметим, что с помощью спектральных функций можно задавать корреляционные функции стационарных случайных процессов; это позволяет сделать формула (17).
В частности, если Фу(о>) постоянна на большом интервале, т. е.
Фо О
при при
0<ю<Г, ш> Т,
то корреляционная функция /?х(т) имеет вид
282
Глава V. Теория вероятностей
W1.
о sin сот
= 2Ф0------
т
<I>x(a))cosa)Tda) =
= 2 Фо cos cord® =
Т 2 .
= - sin Тт.
о т
(19)
Г рафик функции Rx (т) изображен на рис. 58.
Если т/0, то lim Яу(т)=0; если
T-^CD
Для больших Т график функции функции
же т = 0, то lim Rx(T]-+cq.
Т->оо
Rx (т) близок к графику
при
при
|Т|>Е, |Т|<8.
Таким образом если спектральная плотность задана функцией Фу (со), то корреляционная функция близка к 8е(т). Случайный процесс, который характеризуется этими функциями, называется белым шумом. Необходимые уточнения см. в § 5*. 10, 3.
7°. Некоторые сведения о приложениях теории случайных процессов. Многие прикладные задачи теории вероятностей связаны с общематематическим понятием оператора. Оператором называется закон £, который каждой функции' x(t} (из некоторого множества функций) сопоставляет некоторую функцию f(t). При этом используют обозначение Lx=f.
Понятие оператора с успехом применяется в теории электрических цепей. Здесь исходная функция х(/) описывает изменение силы тока или напряжения от времени на входе, а функция f(t) задает зависимость силы тока или напряжения от времени на выходе цепи; x(t) называется входным сигналом, a f (t)—выходным сигналом.
Различные элементы цепи, будучи расположены и соединены подходящим образом, могут реализовывать разнообразные законы преобразования входного сигнала в выходной. Среди прочих электрических цепей выделяют так называемые линейные системы и линейные системы, инвариантные во времени
5.10. Случ. процессы. Процессы с незав. приращениями. Пуассоновский процесс 283 (реально встречающиеся в технике электрические цепи частот принадлежат упомянутым типам).
На практике входной сигнал, как правило, является траекторией некоторого случайного процесса, поэтому выходной сигнал также представляет собой реализацию некоторого случайного процесса.
Задача изучения зависимости между вероятностными характеристиками случайных функций на входе и выходе является одной из центральных задач теории случайных процессов.
Оказывается, что связь корреляционных функций сигнала на входе и выходе может быть просто и красиво описана с помощью понятия спектральной плотности.
А именно, если сигнал на входе реализует стационарный случайный процесс и линейная система, через которую проходит сигнал, инвариантна во времени, то сигнал на выходе является траекторией стационарной случайной функции, причем
Ф/(со) = Фх(со)|Я0®)|2, (20)
где Фх и Фу—спектральные плотности сигналов на входе и выходе, а Н—так называемая передаточная функция системы. Все вышесказанное применимо к операторам Z, переводящим входной сигнал х(7) в выходной /(/) по правилу
+ оо
f (?) = L(х(/)) = J со(/, X) х(Х) dX. — 00
Здесь со (г, X)—некоторая гладкая функция двух переменных, быстро убывающая к нулю при Х-*оо, а именно, со(/, lim т-е- является выходным сигналом
£—>0
при условии, что на вход подана функция {О, | t — 8 | > 8,
предполагается, что св(/, X) инвариантна во времени—это означает, что со(£, Х1) = ш(/2, Х2) при tl — rkl = t2 — rk2 и существует функция h такая, что со(/, ty = h(t—2i).
Тогда если в этих условиях //(zcn) означает спектральную плотность функции А, то справедлива формула (20).
Еще один важный в практическом отношении круг задач заключается в описании вероятностных характеристик случайного процесса по измерениям его реализаций. При изучении стационарных случайных процессов выделяют те, которые обладают так называемым свойством эргодичности: для любой
284 Глава V. Теория вероятностей
функции /(х^), х(/2), х(/„)) с вероятностью! среднее по
времени совпадает со средним по множеству наблюдений. Для таких случайных процессов можно по одной реализации х(/) определить математическое ожидание т
MI= lim — x(/)dz,
7^ 27 J U — т дисперсию т
DX(/)= lim — (х(/)-МУ)2с1/,
Т-^оо 2Г J -Т
корреляционную функцию т
/?хх(т)= lim 2- x(z)x(r+T)dz
Т-юо J
-Т
и другие характеристики.
Глава /*
ЧИСЛОВЫЕ РЯДЫ. ФУНКЦИОНАЛЬНЫЕ РЯДЫ. РЯДЫ ФУРЬЕ
§ 1*.1. Понятие числового ряда. Сходимость и сумма ряда. Необходимое условие сходимости. Действия с рядами
1 Опр еделение Числовым рядом называется последовательность аг, а2, ..., ап... вместе с последовательностью 51? S2, •••> Sn, где Sk = ar + д2+ ... + ак .(к=1, 2, ...).
Ряд обозначается Yan или а1-^а2 +... + ап+.... Ряд называется сходящимся, если существует предел lim Sn. Этот предел называется суммой ряда; при «->оо этом употребляется обозначение со
X а„ = аг + а2 + ... + ап + ...= lim Sn. „=i
Теорема 1. Если ряд Ъап сходится, то lim ап = 0.
И->00
Доказательство дано в § 1.1.
СО 00
Теорема 2. Пусть X ап и X Ъп— &ea Ря^а и с—некоторое число. п=1 и= 1
00 00
Тогда если £ an = S1, X ^n = S2, Sv S2 gR(C), то: n = 1 n — 1
00 00 00
1) X («.+*„)= X *„+ Z bn=S1+S2; n= 1 и= 1 n= 1
00 n — 1 00 00
2) Z Z akbn_,= £ и = 1 k = 1 n= 1 n=1
00 00
з) Z can=c Z an=c^i-n = 1 n = 1
n n
2 Доказательство. Пусть 5W= £ ak, S'n= X k=l k=l
1) Имеем X lim (S„ + Sj= lim 5„+ lim S'n = Sr + S2= £ ak +
, «->00 «^00 «->00
n = 1 n — 1
00
+ X
n= 1
286
Глава I*. Числовые ряды. Функциональные ряды. Ряды Фурье
п т - 1
2) Обозначая S"= £ X am_kbk, 1пп5" = 53, получим
т = 2 k = 1
п п
S„'S'=Y Y%b = S apbq+ Y %b=S"+YY %bq q—1 p=l p + q^n p + q>n p+q>n
Отсюда
|5„-5;-5„'l = l Y apbq\<\ YY aPbq\ + \ YY apbq\ + \Y Y %bq\ p+q>n p<nq>n p>nq<n p>nq>n
p+q>n p+q>n
Если £>0 — любое наперед заданное число, то начиная с некоторого номера п имеем ди<£, Ьп<г и, следовательно,
S„S'n-S;<z Y S+e Y Z>,+82<8(51 + S2) + e2. p-1 q=l
Таким образом, ПтВД-lim5"^0, т. e. S1S2 = S3. n n n n
3) Имеем £ cak = c ak> откуда lim £ cak = c lim ak = cS1.
k=i k=i n^k^i n^k=i
§ 1*.2. Ряды с положительными членами. Признаки сходимости
Для рядов с неотрицательными членами имеет место принцип сравнения. Пусть £ап, — два ряда с неотрицательными членами и a^bi (z=l,2, ...). Тогда если ряд ^ап сходится, то сходится и ряд Если же ряд расходится, то расходится и ряд ^а„.
Доказательство первого утверждения было дано в § 1.1. Докажем теперь второе утверждение.
1 Действительно, частичные суммы расходящегося ряда неограничены, а в силу условия ап^Ьп (п=1, 2, ...) неограниченной является и последовательность частичных сумм ряда ^ап. Отсюда следует расходимость ряда ^ап.
Для рядов £ ап с положительными членами справедливы следующие признаки сходимости:
ап+ 1
1) если существует предел lim-=/, то при /<1 ряд сходится, а при
ап
/>1—расходится (признак Даламбера);
2) если существует предел lim \/"ап — Z, то при /<1 ряд сходится, а при l> 1 — расходится (признак Коши).
Ли + 1
Доказательство. 1) Если lim-------= /<1, то начиная с некоторого
ап
ап + 1
номера п имеем ----<#<1; при этом ап + т< anqm. Ряд где bn + m = anqni,
ап
является геометрической прогрессией со знаменателем q<\, причем Ьп + т>ап + т (ш=1, 2, ...), т. е. сходящийся ряд Ybp мажорирует ряд Ъар (начиная с номера р — п). В силу принципа сравнения ряд сходится
$ 1*.3. Абсолютная и условная сходимость Признак Лейбница
287
-j. । ап +1
Если же lim-----= />1, то начиная с некоторого номера п имеем ------->1,
а а
п п
откуда лп4.1>й!и. Таким образом, необходимое условие сходимости ряда
( lim яи = 0) не выполняется и ряд Ъап расходится. \и->оо /
2) Если lim ^/ап = l< 1, то начиная с некоторого номера п имеем \fan < q < 1, т. е. an<qn. Ряд ИЬт, где bm = qm, является геометрической прогрессией со знаменателем #< 1, причем bm+n>am + n (т= 1, 2, ...), т. е. сходящийся ряд ХЬР мажорирует ряд Yap (начиная с номера р = п). В силу принципа сравнения ряд Yan сходится.
Если же limt{/an = I> 1, то начиная с некоторого номера п имеем ^/a^>l, т. е. ап>1. Следовательно, необходимое условие сходимости не выполняется и ряд Хап расходится.
Отметим, что в доказательстве признаков Даламбера и Коши сущест-ап+ 1 !---
вование пределов lim ------- и lim \J| ап | было использовано лишь для
«->00 а n->CO v
и
доказательства существования номера N, начиная с которого выполняются условия an+1<qan и an<qn для некоторого положительного числа q, меньшего единицы. Поэтому указанные условия влекут за собой сходимость ряда (даже
4- j /—
в том случае, когда пределы lim -------, lim *Uan не существуют).
«->оо ап п-+со v
Интегральный признак сходимости Коши. Пусть для некоторого ряда 1ап с положительными членами существует непрерывная функция f(x), определенная на [1, со [, монотонно убывающая и такая, что f(n) = an для целых значений х = п. Тогда данный ряд сходится в том и только в том случае, когда сходится несобственный интеграл j f (х) dx. i
Доказательство дано в § 1.2.
§ 1*.3. Знакопеременные ряды. Абсолютная и условная сходимость. Знакочередующиеся ряды. Признак Лейбница
00
О пр еделение 1. Ряд ап называется абсолютно сходящимся, если сходится ряд X I I-со 00
Опр еделение 2. Ряд X ап называется условно сходящимся, если он 00 п - 1
сходится, но ряд X | ап | расходится. п= 1 оо
Опр еделение 3. Ряд с вещественными членами X ап называется знакочередующимся, если йий„4.1<0 (и=1,2, ...). 00 00
Теорема 1. Пусть X ап — абсолютно сходящийся ряд, а ряд X п= 1 п= 1
00
получен из него произвольной перестановкой членов. Тогда ряд ап абсолютно п=1 00 00
сходится, причем X ап= X ^и-п = 1 п = 1
288
Глава /*. Числовые ряды. Функциональные ряды. Ряды Фурье
00
1 Доказательство. Покажем сначала, что если ряд Ъп получен из Л — 1
00
сходящегося ряда £ Ьп с неотрицательными членами произвольной перестанов-п= 1 со
кой членов, то ряд £ Ьп сходится, причем
л = 1
со со
X ьп= X ь„.
п=1 п=1
(1)
Действительно, для каждой частичной суммы §р ряда £ Ьп найдется п = 1
частичная сумма Sq ряда £ такая, что Sp^Sq. Для нахождения такой п= 1
частичной суммы надо взять q столь большим, чтобы в частичную сумму Sq входили все члены частичной суммы §р. Верно и обратное, т. е. для всякой частичной суммы Sk ряда bk найдется такая частичная сумма Se п=1
ряда X ък, что л = 1 ~
В силу указанного свойства с одной стороны, lim S lim S ' с другой р—>оо р q—>ao
стороны, lim Sk < lim Se, откуда следует, что lim Sk = lim Se, т. e. справедливо к—>оо /—>оо k—>оо I—>oo
равенство (1).
00
Рассмотрим теперь произвольный абсолютно сходящийся ряд £ ап и ряд
Л=1 00 00
£ полученный из £ с помощью перестановки членов. Составим ряды
£ а'п и £ я" , соответственно из неотрицательных и отрицательных членов
Л=1 Л=1
со
ряда £ расположив эти члены в том порядке, в каком они находились л = 1 00 00
в ряде £ ап. Перестановка членов в ряде £ ап определит перестановку л=1 Л= 1
членов в рядах £ а'п и £ а"г . Очевидно, что после этой перестановки ряды л=1 л=1
00 00 00 00
£ а’п , £ а'п перейдут соответственно в X а'п , X а„ , т. е. в ряды, полученные л = 1 п — 1 л= 1 п— 1
00
из X разделением членов этого ряда на неотрицательные и отрицательные. п- 1
Согласно доказанному свойству рядов с неотрицательными членами, ряды 00 00
£ а'п и £ — а'п сходятся, причем И—1 Л=1
00 00 00 00
£(-<')=£(-«")> (2)
л = 1 л = 1 л = 1 л = 1
1*3. Абсолютная и условная сходимость. Признак Лейбница 289
откуда следует, что 00 00 00 00 00 сю
X «„ = Z а'п+ Е а»= X a'n+ Z a"n= Z а„. л=1 п= 1 п—1 п= 1 п=1 И=1
что и требовалось установить.
00
Теорема 2. Если ряд ап с вещественными членами сходится условно, п — 1
а его сумма равна $0, то с помощью подходящей перестановки его членов можно получить ряд, сходящийся к произвольному наперед заданному числу S.
2 До казательство. Составим два ряда ^а'п и ^а’„, где а'п означает 00
и-й по счету неотрицательный член ряда £ ап, а а„ — п-й по счету п = 1 00
отрицательный член ряда £ ап (п=1, 2,...). Как известно, в случае условной п= 1 00 00 00 00
сходимости ряда £ ап оба ряда £ а'п и X а"п расходятся, причем £ я„=оо, п = 1 п = 1 п = 1 п = 1
00 сю
£ а" =—оо. Частичные суммы ряда £ а'п стремятся к бесконечности, п=1 п= 1
00
а частичные суммы ряда £ «" — к минус бесконечности п= 1 со
Укажем перестановку членов ряда £ ап, о которой идет речь в условии п= 1 00
теоремы, для чего упорядочим множество членов ряда £ ап следующим п = 1
образом. Пусть для определенности число 5 положительно. Последовательности натуральных чисел
ko = 0<k1, k2,km,... (ki<ki+i) (3)
И
Zo = 0</1> l2,..„ (lt<ll+1) (4)
00 00
разбивают множество членов рядов £ а'„ и £ я" на конечные упорядоченные и=1 п= 1
подмножества—отрезки Ai, А'2,..., А^,... и А], А2,..., А",..., где {А)=а£.+ 1, я£.+ 2,..., a'kj+l}, {Aj = aij+1, а'{.+ 2, •••> aij+1}^ 1’ 2,.... Положим
\^j\ = akj+l+akj+2 + --‘ + akj+1^ (5)
\^\=a/;j+l+af;j+2 + ...+af;j+i, (6)
00
Рассмотрим последовательность членов ряда £ ап, построенную согласно схеме ”=1
Ai, Ai, А'2, Ai, ... (7)
(в этой последовательности сначала расположены члены отрезка Ai, затем А], затем А2 и т. д.). Покажем, что при подходящих числах k0, k19 k24 ... и 4» 4» •••» образующих последовательности (3) и (4), ряд
IAii+|Aii+|A'2|+|A'^+.-. (8)
10 Мантуров О.В.
290 Глава I*. Числовые ряды. Функциональные ряды. Ряды Фурье
сходится, а его сумма равна заданному числу S. Определим сначала kr как наименьшее натуральное число, для которого |Ai|>5, затем 1Г—как наименьшее натуральное число, для которого |А1| + |А'{|<5, затем k2—как наименьшее натуральное число, для которого | A11-I-1А|-I-|A^ I > «S', и т. д.
Если ki9 k2,..., km, /1?..., 1т уже определены, то в качестве кт+1 выберем наименьшее натуральное число, для которого |А'1| + |А'{| + ... + |А;и| + |А"|-|--I-1 AJn+! | > S, и в качестве 1т+1—наименьшее натуральное число, для которого |А'1| + |А'(| + ... + |А^| + |А"| + |А^+1| + |А"+1|<5. Тем самым по индукции определены все числа (3), (4).
Частичные суммы S2m(S2m + l) построенного ряда (8) отличаются от 5 по абсолютной величине не более, чем на абсолютную величину последнего слагаемого в А^(А"), т. е. не более, чем на а'кт( —а'О' ^ак как ИСХ°ДНЬ™ 00
ряд £ ап сходится, то при т->оо имеем а'к->0, и, значит, ряд (8)
И=1
сходится к числу S.
По ряду (8) построим ряд, членами которого служат числа ат (члены 00
ряда £ ап), для чего в (8) достаточно написать вместо А'- и А'' (j=l, 2,...) п= 1
правые части равенств (5) и (6):
+й2 + ... + <Зто+... . (9)
Из условий (3) и (4) выбора чисел kj и /7- вытекает, что частичные суммы ряда (9) отличаются от S не более, чем соответствующие частичные суммы ряда (8); поэтому ряд (9) сходится к S.
Так как множество членов ряда (8) совпадает с множеством членов ряда (9), то последний получается из первого некоторой перестановкой, чем и завершается доказательство.
3 Если ряд ^ап сходится условно, т. е. ряд сходится, а ряд У |аи| расходится, то ряд ^ап (составленный из неотрицательных членов ряда 2^ап) и ряд (составленный из отрицательных членов ряда ^ап) расходятся.
Действительно, как было отмечено на с. 17, в случае сходимости обоих рядов ^а'п, Ряд Иап сходится абсолютно (т. е. сходится ряд £|<яи|), в случае же сходимости одного из рядов (и расходимости другого),
ряд является расходящимся. Таким образом, единственная возможность условной сходимости ряда заключается в том, что оба ряда ^а'п, расходятся.
Теорема 3 (признак сходимости Лейбница). Если члены знакочередующегося ряда ^ап удовлетворяют условиям |аи|>|аи+1|, л=1, 2,...
со п
и 1ш1яи = 0, то ряд сходится. При этом если S= £ то I £ ак~^1<1лл+11-
Доказательство дано в § 1.3.
§ 1*.4. Функциональные ряды. Понятие равномерной сходимости. Признак Вейерштрасса
со
Функциональным рядом называется выражение £ ип(Р), где ип(Р) (п=1, п= 1
2,...) — функции, определенные в некоторой области Q действительного или комплексного ^-мерного пространства.
J*.5. Степенные ряды и их свойства. Теорема Абеля
291
Говорят, что ряд £и„(Р) сходится в точке PogQ, если числовой ряд £w„(P0) сходится.
Говорят, что ряд ^ип(Р) сходится на множестве M^Q, если он сходится в каждой точке РеМ. Сходимость ряда в каждой точке множества М называют поточечной сходимостью.
О пр еде ление. Функциональный ряд ^ип(Р) называется равномерно сходящимся на множестве М к функции 5(Р), если для всякого о 0 найдется такое п, что для всех n>N и для всех РеМ справедливо неравенство k=l
Теорема 1. Если члены ряда ^ип(Р)— непрерывные функции и ряд на множестве М сходится равномерно, то и S(P) — ^un(P) является непрерывной функцией.
Теорема!. Если ряд ^ип(х) сходится к S(x) равномерно и каждая из функций ип(х) (л2=1, 2,...) и S(x) интегрируема на отрезке [а, Ь}, то fun(x)dx = $S(x)dx. п= 1 а а
Теорема 3. Пусть ряд ^ип(х) сходится к некоторой функции S(x) на отрезке [а, /?] и каждая из функций ип(х) (п=1, 2,...) непрерывно дифферента цируема на отрезке [а, b ]. Тогда если ряд и'п (х), членами которого п = 1 являются производные и'п(х) от функций ип(х), сходится равномерно, то функция S(х) дифференцируема и в каждой точке хе [а, b ] справедливо равенство u'n(x) — S'(x). п = 1
Теорема4 (признак равномерной сходимости Вейерштрас-00
с а). Если для ряда £ ип(х) на отрезке [а, /?] существует сходящийся п= 1
числовой ряд, удовлетворяющий условию |w„(x)|<c„ (п=1, 2,...), то ряд ^ип(х) сходится на отрезке [а, Ь] равномерно.
Теоремы 1—4 были доказаны в § 1.4.
§ 1*.5. Степенные ряды. Теорема Абеля
Определение. Степенным рядом называется функциональный ряд вида
aQ + ar(x—х0) + «2(х—х0)2 + ... + яи(х—x0)” + ...= £ ak(x—х0)\ /<=о
Теорема 1 (теорема Абеля). Для всякого степенного ряда 00
£ ак(х—х0)к существует такое неотрицательное число R (возможен случай к = 0
R—co), называемое радиусом сходимости, что ряд сходится абсолютно при всех х, удовлетворяющих условию |х—х0|<Р, и расходится при всех х, удовлетворяющих условию | х — х01 > R. со
Теорема!. Если степенной ряд £ ^л(х—Ло)" имеет радиус сходимости п = 0
R, то в любом круге S комплексной плоскости (на любом отрезке вещественной оси) вида {хе5|х—x0|<r}, r<R он сходится равномерно.
10*
292 Глава I*. Числовые ряды. Функциональные ряды. Ряды Фуръе
00
Теорема 3. Если для степенного ряда £ ап(х—х0)" существует предел п = 0
I = lim ——, то этот предел равен радиусу сходимости R данного ряда, п—► 00 + 1
т. е. 1—R.
Теоремы 1—3 были доказаны в § 1.5. Из этих теорем вытекает следствие о возможности почленного интегрирования и дифференцирования степенного ряда внутри круга сходимости.
§ 1*.6. Разложение функций в степенные ряды. Ряд Тейлора
Если функция f(x) бесконечно дифференцируема в точке х0, то степенной
ряд У/----— (х—х0)" называется рядом Тейлора функции /(х) в точке х = х0
п\
(при хо = 0 он называется рядом Маклорена).
Остаточным членом (с номером п) ряда Тейлора называется функция
Л(х)=/(х)-Х7-^ (х-х0)". (1)
k=l К-
Как показано в § 1.6, остаточный член Rn(x) может быть представлен в виде
Г(и+1)(с)
*"м=^1р*-хо)"+1> (2)
где се [х0, х] (остаточный член в форме Лагранжа), а также в виде
Rn(x)=o(x-x0)", (3)
где через о(х—х0)" обозначена бесконечно малая величина более высокого порядка малости, чем (х —х0)" при х->х0 (остаточный член в форме Коши).
Используя опенки остаточных членов рядов Тейлора функций ех, cosx, sinx, In (1 +х), arctgx, arcsinx, приведенные в § 1.6, можно записать разложения этих функций в ряд Маклорена:
v2 3 •A, •A,
ex=l+x+—(1) 2! 3! n\
v2 v4 r2k
уЗ у. 5 y.2A*T 1
sinx=%__+__...+(_ir__+„, (3)
ln(l+x)=x-y+y-...+(-l)”+1^+...; (4)
~ 3 ~ 5 ~2k+l
arctgx=%__+__...+(_lr+1__K., (5)
x 3 . l-3...(2w—1) ...
arcsinx=xH-1-x5 + ...H-/-2x2»+i_|_ _ (6)
6 40 2"и!(2п+1)
7*.7. Понятие гильбертова пространства
293
Ряды (1)—(3) сходятся при всех %, а ряды (4)—(6) сходятся при х, по модулю меньшем, чем единица.
1 Докажем, что ряд
а(а— 1)...(а—k+1) к
(7)
при а, не являющемся целым числом, сходится к функции (1+х)а на интервале — 1 < х < 1.
Достаточно доказать справедливость этого утверждения при 0<а<1, поскольку, дифференцируя или интегрируя почленно ряд (7) при этих значениях а, можно получить ряд для функции (1+х)“ с любым нецелым а.
Итак, пусть 0<а<1. Производная и-го порядка функции (1+х)а имеет вид
// ч ч/ч а(а—и+1), ,
1 ---Ц------Д +х)“-".
п\
Далее, имеем
,/ ч ч/ч |а| |а—1|...|а—1|, ч
| 1+х « (и)|=—-----4----------(1+х)а~п
п\
а(1 —а)...(и —а—1). . 1 • 1-2...(и—1) 1
<-А-----+ х)а“л<--------------------------(1 +х)а"”=-(1 +х)'
Это означает, что если х^О, то |((1+х)“)"|<- и множество производных п
{((1 +%)“)”} ограничено: |((1 + х)а)"|< 1.
Из утверждения на с. 38 вытекает, что ряд (7) абсолютно сходится к (1+х)“ при 0^х<1, а следовательно, и при —1<х<1
§ 1*.7. Понятие метрического пространства. Понятие гильбертова пространства. Изоморфизм гильбертовых пространств
1 Определение I. Множество X называется метрическим пространством, если задана функция р(х, j) с неотрицательными значениями, определенная для любой пары точек (х, у), х, уеХ и удовлетворяющая следующим свойствам:
1°) р(х, = х) V х, уеХ;
2°) р(х, у) = 0ох=у,
3°) р(х, ^) + р(^, z)^p(x, z) (неравенство треугольника}.
Функция р(х, у) называется метрикой.
О пр еде ление 2. Последовательность точек х1ч х2,..., хм,... метрического пространства х называется последовательностью Коши (или фундаментальной последовательностью), если для всякого 8>0 существует такое число N, что при всех р, qeN выполняется неравенство р(хр, х9)<8.
Опр еде ление 3. Метрическое пространство X называется полным, если каждая фундаментальная последовательность в X имеет предел, т. е. для всякой фундаментальной последовательности х15 х2,..., хп,... существует такая точка х, что lim хп = х (подробнее: для всякого £ > 0 найдется такое число
п—’00
N, что при всех n>N выполняется неравенство р(хи, х)<8).
294 Глава I*. Числовые ряды. Функциональные ряды. Ряды Фурье
Для всякого метрического пространства X можно построить метрическое пространство X, называемое пополнением X. Это пространство обладает следующими свойствами:
1°) X—полное метрическое пространство;
2°) в пространстве X существует подпространство Х°, изометричное исходному пространству X (это означает, что существует взаимно однозначное соответствие ср: Х-+ У0, сохраняющее расстояние, т. е. р (%, у) = р (ср (%), ср (_>>)), где р—метрика в X, для каждой пары точек х, уеХ}\
3°) каждая точка хеХ является пределом некоторой фундаментальной последовательности хх, х2, —> xv состоящей из точек подпространства XQ.
Теорема. Для всякого метрического пространства X с метрикой р существует пополнение. Всякие два пополнения и Х2 метрического пространства X удовлетворяют следующему условию: существует отображение f:Xl-^X2, которое является взаимно однозначным и сохраняет расстояние между любыми двумя точками; ограничение отображения f на множество Xi отображает X® взаимно однозначно на Х^.
Доказательство. Рассмотрим множество Q всех фундаментальных последовательностей в X. Назовем всякие две такие последовательности (х£):х1? х2, —, хп> •••» (Л):^1, ^2> —> Ую ••• эквивалентными, если для любого 8>0 найдется такое число N, что р(хр, ^)<£ ПРИ всех р, q>N. В этом случае будем писать (xf) ~ (уД Легко видеть, что: 1) для любой фундаментальной последовательности (xt) имеет место (xi)^(xi); 2) для любых двух фундаментальных последовательностей (х^ и (yz) из следует
(yf)~(xz); 3) для любых трех фундаментальных последовательностей (xt), (j/), (zi) из (xi) ~ (У{) и следует (xf)~(z-). Выполнение указанных
свойств 1—3, как известно, обеспечивает разбиение всего множества Q фундаментальных последовательностей на классы эквивалентности, т. е. на подмножества, состоящие из попарно эквивалентных между собой последовательностей. Обозначим через Х=ОД~) множество всех классов эквивалентности (т. е. фактор-множество множества Q по отношению ~).
Это множество станет метрическим пространством, если в нем определить метрику р формулой
(>j))=lim p(*i’ J'j)’ U)
J—co
где (xf), (>Д—произвольные фундаментальные последовательности, принадлежащие классам х, уеОДХ). Свойства метрики р, а именно соотношения р(х, ^) = р(у, х), р(х, у) — 0ох—у, р(х, у)0, р(х, ,у) + P(b z)^p(x, z) легко доказать, исходя непосредственно из определений (разумеется, следует установить, что формула (1) корректна, т. е. не зависит от случайного выбора представителей (xz), (уД в классах х, у). Итак, множество Х=£1/(~) есть метрическое пространство.
В метрическом пространстве X=Q/(~) существует подпространство Х°, изометричное исходному пространству X. Таковым является множество классов, состоящих из последовательностей, эквивалентных последовательностям вида х, х,..., х,..., т. е. фундаментальным последовательностям, все члены которых одинаковы. Очевидно, что р((х), (j?)) = p(x, у}, где (х), (j) означают элементы в П/(~), представители которых имеют вид х, х,..., х,... и у, у,..., у,... соответственно.
Метрическое пространство X является полным. Действительно, рассмотрим произвольную фундаментальную последовательность хх, х2,..., хм,... точек
£ 1*.7. Понятие гильбертова пространства 295
в X. Каждый элемент xt этой последовательности представляет собой класс эквивалентности в Q, а представителем этого класса является фундаментальная последовательность хп, xi2,..., xin , ... точек пространства X. Рассмотрим теперь последовательность точек х119 х22, хпп, в Очевидно, что эта последовательность точек фундаментальна и существует точка xQeX такая, что Ншхй = х°. Далее, та же точка х® является пределом последовательности i—>оо
jq, х2,хп, .... Таким образом, всякая фундаментальная последовательность в X имеет предел (нетрудно показать, что этот предел не зависит от случайного выбора представителей хп, xi2f ..., xin в Xi9 i= 1, 2,...).
Покажем теперь, что всякие два пополнения Х\ и Х2 метрического пространства X удовлетворяют указанному в формулировке теоремы условию. Рассмотрим изометрические отображения (p^.X^Xi, (р2:Х-+Х2. Построим отображение f’.Xr->X2. Если х1еУ1, то xt — класс эквивалентности в Q/(~); пусть х119 х12,..., х1п, ... — представитель этого класса. Так как то
определены элементы _У11 = (р2фГ1 (хи)ЕХ2, /=1, 2, .... Тем самым определена фундаментальная последовательность: j1]L, у129 ...9 Положим теперь
f(xr) равным пределу уг фундаментальной последовательности j?lx, j12, ..., yln, .... Элемент угеХ2 не зависит от выбора представителя х1Х, х12,..., х1п, ... класса хг. Легко установить, что отображение f является биективным и ограничение этого отображения на X® является биективным изометрическим отображением X® на Х2.
В § 1.7 было рассмотрено пространство Z2, состоящее из всех последовательностей (х1? х2, ..., хи, ...) таких, что £х?<оо, в котором задано i= 1 00
скалярное произведение (х, у)= £ х-_у-, где х = (х1? х2,..., хп,...), y=(yi, у2<> •••> i= 1
уп, ...) — элементы 12.
Покажем, что скалярное произведение (х, у) определено для каждой пары х, у элементов из 12. со
2 Пусть хп х2, ..., хп, ... eR, у2, ..., уп, ...eR таковы, что £ х?<оо, i= 1 00 00
£j/?<oo. Тогда ряд £ сходится. Действительно, поскольку i=l i=l
L I^Til< L ——<00’
ряд JL является абсолютно сходящимся и, следовательно, сходится. i = 1
3 Проверим справедливость свойств 1°—8° из § 1.7 для скалярного произведения элементов пространства 12.
Свойства 1°—4°, 5° и 7° проверяются непосредственно.
Установим справедливость свойства 6° Пусть последовательность х1? х2,..., xw, ...е/2 удовлетворяет условию lim (хи — хт, хп — хт) = 0, т е.
т, и—>оо
lim £ 0„,—xmi)2 = 0> гДе *„ = (*„!, *„2> •••) («=Ъ 2,...). Тогда
т, и—>оо i= 1
lim (xni — xmi)2 = 0 для каждого i= 1, 2,.... Числа xlh x2i->образуют
т, и—>оо
296
Глава I*. Числовые ряды. Функциональные ряды. Ряды Фурье
фундаментальную последовательность; обозначим ее предел через хг и рассмотрим последовательность хх, х2, ..., хп, которая задает элемент из Z2, со
так как £ xf < оо. i= 1
Для любого 8>0 начиная с некоторого N, т. е. при всех т, n>N, имеет место неравенство
хщ)— L \Хпк хтк) < £• к= 1 М
Следовательно, для любого М справедливо неравенство (хпк~хтк)2 < £•
к=1
Переходя к пределу под знаком конечной суммы (при фиксированном М), м
получаем (хпк — хк)2<Е.. После перехода к пределу при М-> со имеем
к= 1
X (х„к-хк)2^г (1)
к — 1
при п > N. СО 00
Из сходимости рядов £ хпк и Е (хпк~хк)2 вытекает сходимость ряда к=1 к=1
со
хк. Поскольку 8—произвольное малое число, неравенство (1) означает, к= 1
что lim (х(к} — хк, х(к} —хк) = 0. и—>00
Остается доказать справедливость свойства 8°. В качестве счетной последовательности элементов /1? 12, ..., /п...е/2, удовлетворяющих условию 8°, можно взять последовательность
4= {0, ..., О, 1, 0, ..., 0}, z=l, 2, ....
При этом для всякого элемента х=(х1? х2, ..., хп, ...}eZ2 и всякого 8>0 найдется такое N, что при всех n>N элемент х— £ хгЦ будет обладать 1
свойством (х —^xfZf, х —J^xfZf)<8, так как (х —£xfZf, x — ^xili) = У4 х*. к>Я
Теорема. Любые два гильбертова пространства над полем С {или R) изоморфны между собой.
4 Доказат ельство. Покажем, что всякое гильбертово пространство Н над R изоморфно пространству /2.
По определению, в Н имеется счетная система векторов /15 /2,..., удовлетворяющая свойству 8°. Можно считать, что эта система ортонор-мирована, т. е.
О при z/j 1 при i— f
(i, j= 1, 2,...).
Действительно, используя прием ортонормирования базиса (процесс ортогонализации), можно перестроить счетную систему векторов Zn Z2,..., Z„, ...
1*.8. Ряды Фурье. Тригонометрическая система. Неравенство Бесселя 297
в счетный ортонормированный базис; легко установить, что при этом новая система векторов будет удовлетворять свойству 6°.
Сопоставим каждому элементу хеН набор коэффициентов разложения 00
х= X т-е- х2, ..., хп), f(x) = (x1, х2, ..., хп, ...). Очевидно, что
i= 1
построенное отображение устанавливает биективное соответствие между Н и /2, 00
причем справедливо равенство (х, у) = £ xiyi. Итак, гильбертовы пространства i= 1
12 и Н изоморфны. Отсюда следует изоморфизм любых двух гильбертовых пространств над R.
Аналогично можно доказать, что всякие два гильбертова пространства над С изоморфны.
§ 1*.8. Ряды Фурье. Тригонометрическая система. Ортогональность. Сходимость в среднем. Неравенство Бесселя. Норма
Система функций
1, cosx, sinx, cos2x, sin2x,..., cos их, sin их,...
называется тригонометрической системой, а система функций
1 cos х sin х cos 2х sin 2х cos их sin их
(1)
(2)
— ортонормированной тригонометрической системой.
Скалярным произведением двух функций f (t) и g(t), заданных на отрезке тс
[—к, тс], называется число, равное j f(j)g(t)dt и обозначаемое через (/(7), gW)-
Скалярные произведения двух различных функций из тригонометрической системы равны нулю (всякие две различные функции этой системы ортогональны между собой). Скалярные произведения двух различных функций ортонормированной тригонометрической системы равны нулю, а скалярные произведения двух одинаковых функций такой системы равны единице. Справедливость сформулированных утверждений вытекает из формул (9)—(12) § 1.8. Ниже приведен вывод этих формул.
1 Непосредственным интегрированием находим
п
f 1<к=г|-„=2л;
— тс
п
С sinm/
coswrdr=------
J т
С cos mt
sinmtdt=--------
J m
cos2m/dr=
1 +cos 2mt
2
sin 2mt 2m
— 7t
~ Л
298
Глава I*. Числовые ряды. Функциональные ряды. Ряды Фуръе
п
sin2 mt dt =
я
f 1 — coslmt t
----------dz = -
2 2
sin 2mt я
4m — я
=я;
— n
я
cos mt cos nt dz=
1 sin(m+77)/
2 m + n
я
— я
— я
1 sin(m—n)t 2~
m — n
о
= 0, т + п;
— я
sin mt cos nt dt=-2
— я
1
2
cos(m + «)/ n cos(m—n)t
m + n -n m—n
я
= 0, m+n',
я
1 I sinmZsin«zd/ = -
2 J
— я
sin
1
2
(m + n)t n sin(m
m+n
—п
п
= 0, m + n.
Для всякой интегрируемой функции /(х), определенной на отрезке [—л, я], ряд
ao ..
—Ь X ancosnx+bnsmnx, 2 n= 1
где
Я
а,
я
Ь„=
(3)
(4)
называется тригонометрическим рядом Фурье функции /(х), а коэффициенты ап, Ьп—коэффициентами Фурье функции f(x).
Если ряд (3) при некоторых коэффициентах ап, Ьп сходится к некоторой функции f(x) равномерно, то ап, Ьп являются коэффициентами Фурье функции f(x) (доказательство дано в п. 2° § 1.8).
В теории рядов Фурье особое значение имеет понятие сходимости в среднем.
Определение 1. Последовательность функции f2,..., fn, ..., определенных на отрезке [а, Ь] вещественной оси, называется сходящейся к функции f(x) в среднем, если числовая последовательность (/—/—Л), (/—/г» •••> (/-/„, f~fn\ - СХОДИТСЯ к нулю.
1*.8. Ряды Фурье. Тригонометрическая система. Неравенство Бесселя 299
00
Ряд функций fi W называется сходящимся к функции f(x) в среднем,
i= 1
если последовательность частичных сумм ряда Sr, S2, S„ ..., где п
Sn(x)= fi(x) (w=l, 2,...), сходится к f(x) в среднем. 1=1
Функции f(x), для которых существует Jcp2(x)dx, называются функциями а
с интегрируемым квадратом (на отрезке [а, /?]). Множество всех функций с интегрируемым квадратом является линейным пространством.
При этом если последовательность функций <Pi (х), (р2(х),..., <ри(х) с интегрируемым квадратом сходится в среднем к функции /(х), то функция /(х) также является функцией с интегрируемым квадратом.
Пусть gr(x), g2(x),..., gn(x),...— произвольная ортонормированная система функций на отрезке [а, Ь}. Это значит, что скалярные произведения (&(х), g- (х)) имеют вид
(&•(*), g;M)= gi(x)gJ(x)dx=
1 при i—j, О при i^j.
(5)
Далее, пусть /(х)--функция с интегрируемым квадратом, определенная на [а, Ь}. Положим ь
Q=(/ig»M)=f/Wg*MdA: (£=1, 2,...) (6)
а
и будем называть ск коэффициентами Фурье функции f (х) по системе gY (х), g2 W-
При указанных условиях справедливо неравенство Бесселя
f/2(x)djc> X cl (и=1, 2,...).
а k- 1
(7)
О пр еде ление 2. Нормой функции /(х) с интегрируемым квадратом, определенной на отрезке [а, Ь], называется число H/2(x)dx.
Норма функции /(х) обозначается через ||/||. Она обладает следующими свойствами:
1°. 11/11^0.
2°. II/+SK ll/ll+ llg||.
3°. ||о/|| = |а|||/||.
Здесь / g—функции с интегрируемым квадратом, а а—произвольное число из R (или С).
2 Будем называть всякие две функции / и g с интегрируемым квадратом эквивалентными, если ||/— g||=0. Легко проверить, что множество всех функций с интегрируемым квадратом разделяется на классы, состоящие из функций попарно эквивалентным между собой (фактор-множество по введенному отношению эквивалентности). Это фактор-множество называется пространством L2 (нормированным пространством функций с интегрируемым квадратом).
300
Глава I*. Числовые ряды Функциональные ряды. Ряды Фуръе
§ 1*.9. Полнота и замкнутость тригонометрической системы
О пр еде ление 1. Ортонормированная система функций gi, gi, gn, (1)
определенных на отрезке [a, Z>], называется замкнутой, если для каждой функции /(х) с интегрируемым квадратом выполняется равенство
Ь со
f/2(^)dx= X cl, (2)
а п= 1
где ъ ck=$f(x)gk(x)dx. (3)
а
Теор ем а 1. Ортонормированная тригонометрическая система функций 1 cosx sinx cos2x sin2x cos их sin их
“7=, -у-, (4)
у2тс у 7C у/ Tt у/к yj 7Г yj 7C ул
является замкнутой.
1 Доказательство. Сначала проверим справедливость равенства (2) для п
функций вида /(х) = £ dkgk(x\ где dk 2, и)—произвольные числа,
Л=1
a gk(x)—функции системы (1). Затем докажем формулу (2) для всех непрерывных функций и, наконец,—для всех функций с интегрируемым квадратом. п
Для функций вида f(x)— £ dkgk(x) имеем
Л= 1
j/2(x)dx= j(£4gfc(x))2dx= £ dkdl]gkgldx = Y dl. (5)
— n —n k, 1= 1 n k = 1
Здесь использована ортонормированность системы функций (1), т. е. соотношения
Г1 при fc/0, gfcg/dx=<
[0 при k — l.
(6)
Легко установить, что коэффициенты dk совпадают с коэффициентами ск, определяемыми формулой (3). Действительно,
b Ь п
Ck=$f(x)gk(x)&x=f X digi(x)gk(x)dx=dk. (7)
а а 1= 1
Здесь снова приняты во внимание формулы (6). Сопоставляя (5) и (7), для функций /(х) указанного вида получаем формулу (2).
Докажем теперь справедливость этой формулы для непрерывных функций Л(х) и функций g(x) с интегрируемым квадратом. Переход от функций /(х) и
вида £ ckgk (для них формула (2) уже установлена) к функциям h(x) к—1
и переход от функций й(х) к функциям g(x) будет осуществлен на основе единой идеи, заключающейся в следующем.
1*.9. Полнота и замкнутость тригонометрической системы 301
Будем исходить из того, что для всякой непрерывной функции h(x) и любого £i>0 найдется функция /(х) вида ^ckgk такая, что ||/—g||^£i-Потребуем, чтобы ||/—5И(/) || ^8t. [этого можно достичь при большом п в силу уже доказанного равенства (2)].
Обозначим через Sn(F} частичную сумму ряда Фурье функции F(x) по ортонормированной системе функций (1), т. е. положим
5„(F)= £ ck(F)gk(x), (8)
fc=i
где
(fc=l, 2, ...). (9)
a
Отметим следующие свойства Sn(F):
S„ (aF)=aS„ (F); S„ + F2)=S„ (F,)+S„ (F2);
надкин-
Первые два свойства очевидны, а третье эквивалентно неравенству Бесселя, п
поскольку Sn(F)= £ Cft(F).
k= 1
Рассмотрим ||Л — 5„(А)||, где h(x)—непрерывная функция, и покажем, что для всякого 8>0 и достаточно большого п выполняется неравенство || А — 5„(А)||<8. Имеем
II й-5я(й)|| = || (Л-/)+(/-5„(/))+(5„(/)-5„(й))|| <
<1|/г-/11 + 11/-5„(/)|| + ||5'„(/)-5'„(Л)|| =
= II h -/II + II/-S, (/) II + II Sn (f-h) || <
8| Т £i Т Ei = 8, где 38! — 8 (в этих преобразованиях использованы свойства Sn(F) и свойства нормы).
Следовательно, норма разности || h — 5„(А)|| может быть сделана сколь угодно малой при достаточно большом п. Так как || А —5П(А)||2 = Ь п оо
= f A2 dx— ck (А) [см. формулу (5)], то ряд £ ck(h) сходится к ||/|| a k = 1 к = 1
и формула (2) имеет место для всякой непрерывной функции А(х).
Аналогично, выбирая для данной функции g(x) с интегрируемым квадратом и произвольного 81 > 0 непрерывную функцию А(х) так, чтобы ||g(x) — A(x)||<8i и требуя, чтобы ||g(x)—5n(g)||<81 при достаточно большом п, получим
llgM-^(g)il=ilg-^l+ll^-^(^)li+ii^(^)-^(g)ll<
^81 Т 8] Т8i — 381 = £•
Поскольку в силу формулы (5)
||g(x)-5,„(^)||2 = fg2(x)dx- £ ci(g),
а к=1
302 Глава I*. Числовые ряды. Функциональные ряды. Ряды Фурье
и
заключаем, что ряд £ ck(g) сходится, и его сумма равна ||g(x)||2. л=1
Итак, формула (2) доказана для произвольной функции с интегрируемым квадратом.
Определение 2. Ортонормированная система функций g2, —— определенных на отрезке [а, b ], называется полной, если для всякой функции из нормированного пространства Ь2 функций с интегрируемым квадратом, ортогональной ко всем функциям системы, выполняется равенство ||/|| = 0.
Теорема 2. Ортонормированная тригонометрическая система функций (4) является полной.
Доказательство дано в § 1.9.
Теорема 3. Пусть f(x)— функция с интегрируемым квадратом на отрезке [—л, тс] и
+ У ak cos kx+bk sin kx
(10)
— ее ряд Фурье по системе функций 1, cosx, sinx, cos2x, sin2x, ..., coswx, sinwx, ... (11)
Тогда ряд (10) сходится к /(х) в среднем.
Доказательство дано в § 1.9.
Теорема 4. Ряд Фурье непрерывной и кусочно-дифференцируемой на отрезке [a, Z?] функции сходится в любой точке интервала ] —л, л[ к значению /(—л + 0)+/(л—0) f в этой точке, а в точках х=—л и х=п— к значению ----------------------.
2
Для периодической с периодом 2л непрерывной и кусочно-дифференцируемой функции /(х) ряд Фурье этой функции сходится к ней равномерно.
Теорема 5. Если функция Дх) ограничена на некотором интервале, содержащемся в [ — л, л], имеет конечное число относительных максимумов и минимумов и точек разрыва первого рода, то на этом интервале ряд Фурье функции Дх) сходится в точке непрерывности х к Дх), а в точке А . /(х-0)+/(*+0)
разрыва первого рода х — к значению ---------------.
2
Глава II*
УРАВНЕНИЯ МАТЕМАТИЧЕСКОЙ ФИЗИКИ
§ 2*.1. Понятие об уравнении в частных производных. Решение линейных уравнений первого порядка в частных производных
Дифференциальным уравнением в ношение
частных производных называется соот-
/ ди ди ди д2и \
F х2, х„, и, — , —..., —, —... 1 = 0,
у дх± дх2 дип дх ]
(1)
где и = и(хг, х2, ..., хи)—искомая функция п независимых переменных ди ди ди
х2, •••? , ...,----частные производные функции и по переменным
дхг дх2 дхп
%1, х2, ..., хп. Левая часть уравнения (1) может содержать частные производные д2и , . д2и . .
второго порядка —г (z= 1, 2, ..., «), ----- (z, j= 1, 2, п), третьего
dxf dxidxj
порядка и т. д.
Наивысший порядок производной в левой части уравнения (1) называется порядком уравнения.
Определение. Уравнение
ди ди ди
т--7—Н..+ли -—\-bu = Q
дху дх2 дхп
(2)
относительно неизвестной функции и переменных х2, ..., хп, где д15 я2, —, ап, b—заданные функции этих переменных, называется линейным дифференциальным уравнением первого порядка в частных производных. Предполагается, что по крайней мере одна из функций а2, ..., ап тождественно не равна нулю.
Уравнение
" ди ” ди
L Яц, , + 1 bk—+cu = Q j=i dxidxj k-i dxk
(3)
относительно неизвестной функции и переменных х19 х2, ..., хп, где а^ (z, /=1, 2, ..., п), а^=ад, bk (A;=l, 2, ..., w), с—заданные функции этих переменных, называется линейным дифференциальным уравнением второго порядка в частных производных. Предполагается, что по крайней мере одна из функций ач не равна нулю тождественно.
Уравнения вида
304
Глава II*. Уравнения математической физики
X ai—+bu+f=Q i = i OXi
и
" ди ” ди
X aiJ^~7— + Е bk^~ + cu+f=O i,j=l dXidXj k=l
называются линейными неоднородными уравнениями в частных производных; при этом уравнения (2) и (3) называются однородными.
Решением уравнения в частных производных называют всякую функцию и(хг, х2, ..., х„) переменных х15 х2, — •> хп> которая обращает равенство (1) в тождество.
Уравнение
п
i=l
ди dxi
(4)
= 0
имеет следующий геометрический смысл. Пусть р = (я15 а2, ...
ап)— векторное поле. Тогда, как известно, производная функции
и(хг, х2, ..., хп) по направлению векторного поля р, т. е.
u(x1-Fa1As,x2y-a2As, xnFanAs} — u(x, у)
lim -------------------------------------------, (5)
Av—>0
равна
дщ dxi
Поэтому соотношение (4) означает, что произ-
водная функции и по направлению векторного поля р равна нулю. Пусть / ди ди ди\
gradw= -----, --, ...,— I/O. Всякое направление, вдоль которого производ-
\ дхг дх2 dxnJ
ная равна нулю, принадлежит гиперплоскости, касательной к поверхности уровня функции и. Поэтому векторное поле а2, ..., «„), определяемое
уравнением (4), в каждой точке (х:15 х2, ..., хи) задает вектор, касательный к поверхности уровня функции и, проходящей через эту точку.
1 Теорема. Пусть
" ди
X а( —+Z> = 0
i=i Sxi
(6)
—- уравнение первого порядка в частных производных относительно неизвестной функции и переменных х19 х2, ..., хп; ai (z=l, 2, ..., п), b — заданные гладкие функции этих переменных. Пусть, далее, фД*!, х2, ..., х„, и)= = Ci(i=l, 2, ..., п)—множество независимых первых интегралов системы обыкновенных дифференциальных уравнений
dxi d%2 &хп du
ar a2 an —b
Тогда для всякой гладкой функции F от п переменных, определяющей (неявно) функцию и с помощью соотношения
Лч>1> ч>2, •••> <рп)=о
(7)
в окрестности точки (х°, х°, , х°, и0) такой, что
Y аЦх[, х?, х°)+Ь2(х°1, х°, , х°)/0,
1 = 1
£ 2*.1. Линейные уравнения первого порядка в частных производных
305
функция и=и(х1, х2, х„) является решением уравнения (6) и всякое решение
уравнения (6) определяется некоторой функцией F с помощью равенства (7). 2 Доказательство. Рассмотрим сначала уравнение вида
£ а,(х1( х2, х„)^=0, (8)
i=i
где в окрестности точки (х?, х2, •••> *«)• Вместе с (8) рассмотрим
систему обыкновенных дифференциальных уравнений
dxi dx2 dx„
«1 а2 ап
(9)
Как известно из теории обыкновенных дифференциальных уравнений, существуют п— 1 функций ф1(х15 Х2, ..., Х„), ф2(х19 Х2, •••> Хп\ •••» фп-1(х1> х2> •••> Хп)» определенных в окрестности Q точки (х?, х2, ..., х„ ), независимых и таких, что для всякого решения системы (9) х = (х1? х2, xn), Xi = Xi(t) (z=l, 2, п) в области Q функции ф1 (х, (/), х2 (/), ...» хл(г)), x2(t), ...
..., x„(r), ..., ф„-1 (xi (/), х2 (t\ ..., xn(t) не зависят от t. При этом каждая функция ф(х1з х2, ..., х„), сохраняющая свое значение вдоль всякой интегральной кривой системы (9), называется первым интегралом этой системы.
Система гладких функций ф1? ф2,фи-1 является независимой в окрестности Q точки (х?, х2, ..., х„°), если матрица
б}ф1/5х1 дф1/дх2 ... 5ф1/5хи
дф2/дХ1 аф2/ах2 ... аф2/ах„
афи-i/axi афи_!/ах2 ... аф„_1/ах„
в точке (х?, х2, ..., хл) имеет ранг п—1.
Пусть F—произвольная гладкая функция от п— 1 переменных, определенная в окрестности точки (с?, с2, ..., j); пусть, далее,
ф^Х!, х2, ..., х„)=с£ (z — 1, 2, ..., п- 1) (10)
определяющая однозначно интегральную кривую си-близких К (<?У, С2, ..., г ).
что всякая функция
и(%1, х2, x„) = F(<p1(x), <р2(х)>
уравнению (8).
правилу дифференцирования сложной функции, имеем
" " "-1 a<ps --1 ”
L ak^-= L ak L Fs—= L Fs L ak—=0, k=i oxk k=1 S=1 dxk S=1 fc=1 dxk
поскольку для каждого первого интеграла ф5 справедливо равенство
V d(ps А
L в‘7-=°-
Л=1 дхк
Действительно, дифференцируя тождество фв(х(/)) = с5(»у= 1, 2, ..., п— 1), получим
— система уравнений, стемы (9) при (б1,с2, Покажем,
удовлетворяет Согласно
(11)
(12)
(13)
0=^ф5= Е —- dXf^X-— at = O. (14)
i=i oxt oxi
306
Глава II*. Уравнения математической физики
Последнее из равенств (14) является следствием (9) и выполняется в каждой точке области Q. через которую проходит какая-либо интегральная кривая системы (9). Таким образом, равенство (12) доказано, и всякая функция вида (11) удовлетворяет уравнению (8).
Обратно, если некоторая функция w(xx, х2, ..., х„) удовлетворяет уравнению (8),. то она может
Действительно,
быть представлена в виде (11).
добавим к системе из п— 1 функций
еще одну функцию
Cpl(x), (?2(х), ..., фи-1(х) ф(х) так, чтобы система функций
<Р1(х), <р2(х),
(15)
(16) была линейно независимой, и введем в области Q новую систему координат j?i, j/2> —, Уп по формулам
Л = Ф.(Л1, хг, ..., х„) (г=1, 2, ..., и-1]
К = '1'(^1> х2, ..., х„).
о неявной функции в некоторой окрестности точки существует однозначно определенное и гладкое обратное
(17)
По теореме (х?> х2, ..., %n)eQ отображение
= >2> •••> к) (' = 1> 2, .... и).
Если w(x) = w(x1, х2, ..., х„)— решение уравнения (8), то
” dw
Е 7-^ = 0-
1 dXi
(18)
(19)
Рассмотрим функцию
n(^) = n'(xi(j')> х2(у), .... х„(Я),
где Xi(y) определены равенствами (18). Покажем, что v в действительности не зависит от уп. Заметим прежде всего, что система (pi(Jc), Ф2 (^)>•••> <P«-i (*)> w(x) линейно зависима, поскольку система линейных однородных уравнений с матрицей
(20)
I dcpjdx! д(р2/дх1
д(р1/дх2
д(р21дх2
... dtyildxn ' - д(р2/дхп
(21)
SfPn-i/Sxi д<р„-1/дх2 - д(р„-1/8х„ dwjdxi dwfdx2 ... dw!dxn l
имеет ненулевое решение (tz1, , ап) в силу формул (13) и (19).
независимости системы функций (15) следует, что gradw, т. е.
dw dw
дх2 дхп
dq>i d<pi d($i
дх ’ дх2 дхп
, линейно выражается через gradcpf, i= 1, 2, ..., п— 1
вектор
Из линейной / dw дх ’
вектор
gradcpi есть
, возможно, с переменными коэффициентами:
gradw= £ bi grad ср р
(22)
£ 2*.1. Линейные уравнения первого порядка в частных производных
307
Далее, имеем
дю " 1 а<рг 7~= hil~ • dxj i=1 dXj
5Х,-
Умножая обе части равенства (23) на ------------- и суммируя по j, получаем
ду„
" chvSxj " 1 a<p, faj " 1 д<р|_" 1 ду, ~‘ldxjdy„ iJ,1dxJdy„ ‘ду„ Д ‘ду„'
(23)
(24)
Левая часть равенства (24) есть —, а правая часть равна нулю, так что ду„
cv ,
—=0 и v(y!, у2, у„) в действительности не зависит от уп; значит,
ду„
w(xt, Х2, .... х„) = р(>»1 (х), у2(х), j„_,(x))=
= в(ф!(х), <р2(х), ф„-1(х)). (25)
Тем самым доказано, что всякое решение уравнения (8) выражается через первые интегралы системы (15).
Рассмотрим теперь уравнение (6):
” ди
Е «,—+/>=о [ = 1 дх [
и вместе с ним систему обыкновенных дифференциальных уравнений
f dx,-
—=a,(xi, х2, х„),
л' (26)
-^= -Z>(xi, х2, х„),
Id/
которая эквивалентна системе уравнений dxi_dx2_ _ dx„ _ dn at а2 ап —Ь
И
Если £ а? + Ь2^0, то система (27) имеет п независимых первых интегралов i= 1
Ф1, ф2,Ф„. Пусть
Ф(Х1, х2, Хп, и) = Ъ (28)
— соотношение, задающее (неявно) функцию w, удовлетворяющую уравнению (6). Тогда
Ф(х15 х2, w(xj, х2, ..., хи)) = 0 и дФ 5Ф ди dxi ди dxi
п.
308
Глава II*. Уравнения математической физики
ди дФ /дФ ч " / ЗФ\ ЗФ л
Подставляя —=-------/ — в уравнение (6), получим > at\-------+ я—= 0.
dxt dxi I ди i=i \ ^xi/ ди
Это означает, что Ф(х1? х2, ..., хп, и) является решением линейного однородного уравнения в частных производных и, следовательно, выражается через первые интегралы системы (27), т. е. через функции <рх, <р2, ..., Ф„.
Итак, если Ф(х15 х2, хп, и)—произвольная гладкая функция такая, что уравнение (28) неявно задает функцию u = u(xli х2, ..., хп), удовлетворяющую уравнению (6), то Ф имеет вид Ф(х1, х2, ..., хп, u) = F(cp1, ср2, фи)-
Обратно, если гладкая функция F от п переменных определяет (неявно) функцию и с помощью соотношения F((pt, (р2, •••> фп) = 0 в окрестности точки (х?, х2, Хп, и°), то функция u=u(xl9 х2, ..., хп) является решением уравнения (6).
Заметим, что изложенное доказательство справедливо и для уравнений (6), в которых ai = ai(xr, х2, ..., хП9 и) и b = b(xr, х2, ..., хп, и) (z= 1, 2, ..., и). Такие уравнения называются квазилинейными.
§ 2 *.2. Уравнение колебаний струны. Решение задачи Коши методом Даламбера.
Метод Фурье для уравнения колебаний струны
1°. Вывод уравнения колебаний струны. При описании колебаний струны будем считать, что во все время движения струна находится в плоскости переменных х, w, начальное положение струны есть отрезок оси х от 0 до I и вектор смещения точки струны в каждый момент времени перпендикулярен оси х (каждая точка струны совершает лишь вертикальные движения). При сделанных предположениях функция и(х, г), равная при каждой паре х, t ординате точки х струны в момент времени /, полностью характеризует исследуемое движение.
1 Предполагается, что струна представляет собой гибкую упругую нить. Свойство гибкости понимается как отсутствие нормальной составляющей напряжения, возникающего в струне. Свойство упругости означает, что струна подчиняется закону Гука, т. е. напряжение пропорционально растяжению струны. Кроме того, предполагается, что струна совершает лишь малые г ди
колебания в том смысле, что —=их(х, t) мало по сравнению с единицей.
Итак, пусть положение струны в момент t задано функцией и(х, t). Растяжение участка струны от точки xt до точки х2 выражается приближенным равенством
Х2
f у/ i+(ux)2 dx^x1-x2. (1)
xi
Это означает, что при сделанных предположениях изменения длин отдельных участков струны не происходит. Вследствие этого по закону Гука сила натяжения струны в каждой точке не меняется со временем. Оказывается, что при сделанных предположениях натяжение струны постоянно по всей длине. Действительно, проекции Тх и Ти силы натяжения Т по осям х и и равны соответственно
Tx(x)=T(x)cosd—TI \+их^Т(х), (2)
Ти(х) = Т(х) sin Тх (х) tg Тх(х) их, (3)
2*.2. Уравнение колебаний струны. Решение задачи Коши методом Даламбера 309
где а—угол касательной к кривой и = и(х, t) в точке х в момент t.
Сумма сил, включая силы инерции, согласно принципу Даламбера равна нулю. Найдем сумму сил на участке [%!, х2 ], учитывая, что каждая точка струны движется в вертикальном направлении: Tx(xi)—Tx(x2) = 0 и, следовательно, Тх(х)=Т0.
Переходим к выводу уравнения движения. Количество движения участка х2
струны от хг до х2, имеющего плотность р, равно интегралу f ut(^, z)p(^)d^,
xi
а изменение количества движения за время от до t2—интегралу
х2
(4)
xi
Импульс сил, действующих на участок [х1? х2], есть
f 2о[и (х2, т)-их(^1, r)]dx+ f f T)d^dT. (5)
'i 'i
Здесь TqUx(x2, t) и TqUx(xy, t) проекции силы натяжения в точках х2 и xt; F(x, t)—плотность внешней силы в момент времени t.
Предполагая, что вторые производные функции и(х, t) непрерывны, применяя теорему о среднем значении к выражениям (4) и (5) и приравнивая их, имеем
б2 и
(**, Г*)=Т0 —Z**) + F(x***, Г***), где х*, х**, х***—точки отрезка [х15х2], а ?*, /**, t***— точки отрезка [^,/2]. При x2->Xi и t2-^t1 получаем
dt2 р дх2 р’ или д2и д2и -5ё=а^+/(х^’ (7)
где а=^Т0!р, f(x, t)=F/p.
2°. Метод Даламбера решения задачи Коши для неограниченной струны.
Функцией и(х, /), удовлетворяющей уравнению
и начальным условиям
д2и 2 д2и dt2 а дх2
w(x, 0) = <р(х), wj(x, 0) = ф(х)
и определенной на всей плоскости, является функция
г/(х, г) = -(ф(х+бЦ) + ср(х—6rt))+—
v|/(x)dx
x-at
(8)
(9)
(Ю)
(Н)
Вид решения (11) устанавливает существование двух волн—прямой и обратной (см. § 2.2).
310
Глава II*. Уравнения математической физики
3°. Задача Коши для полуограниченной струны с закрепленным концом. Здесь требуется найти функцию и(х, t) при х^О, удовлетворяющую уравнению (8), условиям (9) и (10), где ф(х) и ф(х) определены только для х>0 и <р(0) = \|/(0) = 0, а также условию г/(0, /) = 0.
Эта задача сводится к задаче, рассмотренной в п. 2°, если функции ф(х) и ф(х), определенные лишь для х^О, продолжить на всю ось Ох нечетным образом: ф(—х)=—ф(х), ф(—х)= — ф(х).
При такой трактовке задачи получает хорошее толкование явление отражения волн (см. § 2.2).
4°. Задача Коши для ограниченной струны с закрепленными концами. Здесь требуется найти функцию и(х, t), удовлетворяющую уравнению (8), условиям (9) и (10) при О^х^С/, а также краевым условиям
w(0, t) = u(l, /)=0. (12)
Эта задача сводится к задаче, рассмотренной в п. 2°, если функции ф(х), \|/(х), определенные лишь на отрезке [0, /], продолжить на отрезки [/</, (ArH-l)Z] (где fc=±l, ±2,...) по следующему правилу: f ф(х—kl) при четном k, Фир~ j / /у z\ 7 (13а)
( — ф(—х-+-(&+1)/) при нечетном к;
( ф(х—kl) при четном к, z _
'l'np=S . , t <136)
( —ф(—х+(к+1)Z) при нечетном к.
При этом имеет место явление многократного отражения волны от концов.
2 5°. Теорема существования и единственности решения уравнения колебания
струны. Теорема. Существует и притом единственная функция w(x, г), удовлетворяющая уравнению
д2и эд2и . .
0 04)
dt2 дх2 и условиям
и(х, 0) = ф(х), ut(x, 0) = ф(х), (15)
w(0,/) = Ц1(г), и(1, /) = ц2(*) (16)
д2и д2и д2и (при дополнительном предположении о том, что производные ——у, ---------
дх dt2 dxdt существуют и непрерывны на отрезке 0^х^/ при Z^0).
Доказательство. Вп. 1° было доказано существование функции и(х, t), удовлетворяющей уравнению (14) и условиям (12) и (15).
Более общая задача отыскания функции и(х, t), удовлетворяющей уравнению (14) и условиям (15) и (16), сводится к задаче с однородными краевыми условиями следующим образом:
Рассмотрим функцию v(x, t), положив
и(х, t) = v(x, r)+ V(x, t) (17)
и выбрав в качестве К(х, t) функцию
Г(х, z)=Hi(r)+j[n2(«)-Hi(O]- (18)
£ 2*.2. Уравнение колебаний струны. Решение задачи Коши методом Даламбера 311
Легко установить, что функция v(х, t) удовлетворяет уравнению вида
d2v d2v ~
~^=а 7-7+ЖО
at дх2
(19)
и условиям
v(x, 0) = ф(х), vt{x, 0) = ф(х),
(20)
р(0, z) = 0, v{l, t)=0.
(21)
Граничные условия (21) называются однородными.
Существование решения уравнения (19) при условиях (20) и (21) будет доказано ниже методом разделения переменных (см. п. 6°).
Докажем единственность решения уравнения (14) при условиях (15) и (16). Допустим, что существуют два решения этой задачи: ur (х, t) и и2(х, t). Тогда w(x, t)=Ui(x, t) — u2(x, t) удовлетворяет уравнению
d2w 2^w dt2 a dx2
и условиям
w(x, 0), wt(x, 0) = 0, w(0, z) = 0, w(l, /) = 0.
Покажем, что w(x, () = 0. Для этого рассмотрим функцию
i
£(z)=l j'(°2b'*+H'2)dx-
0
Находим
dE f 2
—= la wxwxt+wtwttdx.
(22)
(23)
(24)
(25)
(26)
Здесь применена теорема о дифференцировании функции по параметру под д2и д2и д2и
знаком интеграла, что возможно вследствие непрерывности —------, —-. Да-
дх dxdt dt
лее, интегрируя по частям, получаем
i II i
f wxwxtdx = wxwt I -f wtwxxdx = -f wtwxxdx. (27)
0 0 0 0
В равенстве (27) учтено, что = 0 в силу условий (23).
Из равенств (26) и (27) следует
'wu-a2wxx)dx,
dE 0
откуда —=0 в силу уравнения (22). Следовательно, Е не зависит от t dr
любом х: ,
при
£’(z) = £(0) = | (a2w2 + wf)
о
dx = 0, t=o
поскольку w(x, 0) = 0, wt(x, 0) = 0 согласно (23).
312
Глава II*. Уравнения математической физики
Интеграл (25) описывает энергию колеблющейся струны, при этом
—-— ах — потенциальную
о
гию. Равенство (24) означает, что энергия струны не изменяется со временем
описывает кинетическую энергию струны, а
' 2 А —ах 2
энер-
[речь идет о струне, подчиняющейся уравнению (22)].
Учитывая, что подынтегральная функция a2wx + w2 неотрицательна и непрерывна, имеем wx(x, /) = 0, wt(x, /) = 0 и w(x, t) = const. Наконец, w(x, t) = = w(x, 0) = 0.
Тем самым доказано, что w(x, t) = u1(x, t) — u2(x1t) = 0, а значит, любые два решения уравнения (14) при условиях (15) и (16) совпадают.
3 6°. Метод Фурье решения уравнения колебаний струны. Решение уравнения
колебаний струны
д2и ? д2и . ч
(28)
при однородных краевых условиях ц(0, ?) = «(/, /) = 0 (29)
и начальных условиях
и(х, О)=ср(х), u't(x, 0) = ф(х) (30)
можно найти с помощью метода Фурье (метода разделения переменных). Пусть i
, ч / х ппх . х 2 f . к пп
f(x, /)= Z /fc фт—^dE,, (31)
п= 1 1 t J *
0
I 00 ТЕИХ 2 I
<?(*)= X «Р» sin — , <p„ = - <p(£)sin(32) n — 1 * * J I
0
I
, x iwix 2 f z x япЕ
Ф(*) = Z Фи sin——, фл=-т pU)sin—— (33)
n = 1 1 - 1 J 1
0
— разложения функций /(x, t), cp(x), ф(х) в ряд Фурье по синусам на отрезке [0, /].
Будем искать неизвестную функцию w(x, /) в виде япх
и(х, t)= Е (34)
п= 1
Подставляя w(x, t) из (34) в (28), замечаем, что уравнение (28) обратится в тождество, если / лл \
й„(1)+(у ) п=1, 2, ... (35)
(и„ означает вторую производную ип по /).
J> 2*.2. Уравнение колебаний струны. Решение задачи Коши методом Даламбера 313
(йп означает вторую производную ип по t).
Действительно,
£ .. , ч . TWIX X «„(Z)sin— И=1 Z II 1 a bO Д M 8 1 bJ H 3 1 w <z> nnx ™ x nnx X /л(ф1П — , 1 n=l 1
или 00 tt2n2 7U77X
L n= 1 йп4 ci и fn\t) sin —j- = 0.
В силу равенств (30), (32), (33) имеем
00 ТГИХ 00 "ТГИХ
и(х, о)=<р(х)= £ K„(0)sin—-= X <P„sin—(36) n=l 1 n=l *
Ttnx 00 TWIX
ut(x, 0)=ф(х)= X “„(0)sin——= £ 4>„sin—, (37)
n=l Z n= 1 Z
ИЛИ
Ц.(о)=<р»> й„(О)=ф„, (38)
где д„(0) -значение производной функции u„(t) в нуле.
Обыкновенное дифференциальное уравнение второго порядка (35) и условия (38) однозначно определяют функцию un(t). Построенный по функциям un(t) ряд (34) дает решение поставленной задачи в предположении, что функции ф(х), \|/(х) и /(х, t)—гладкие.
Изложенный метод решения имеет большое практическое и теоретическое значение. Он может быть применен ко многим задачам математической физики.
Приведенные выше рассуждения доказывают существование решения задачи (28) — (30), т. е. задачи Коши для неоднородного уравнения струны с однородными краевыми условиями.
Как было показано при доказательстве теоремы существования и единственности, к этой задаче сводится общая задача (14)—(16). Таким образом, вычисления с помощью метода Фурье завершают доказательство теоремы существования решения.
4. 7°. Задача Коши общего вида. Как было отмечено в п. 5°, общая задача колебания струны (14) —(16) может быть сведена к случаю |ii(z) — 0, p2(0 = 0 (т- е-к случаю однородных краевых условий). Это можно сделать, введя новую неизвестную функцию v(x, t), связанную со старой функцией и(х, t) соотношением
и(х, t)=v(x, г)+Ц^ц1(/)+уЦ2О)-
Если и(х, t) — решение уравнения д2и 0 д2и . .
-ХТ2=« 7-2+жо (39)
Ct ох при условиях ди
и(х, 0) = ф(х), — (х, 0) = ф(х); w(0, /) = 0, и(1, /) = 0, (40)
то, как легко установить,
и(х, t) = ur(x, t} + u2(x, z),
(41)
314
Глава II*. Уравнения математической физики
где их(х, t)—решение уравнения
d2^i 2 д2и
dt2 дх2
при условиях
(х, 0) = ф(х), -^(х, 0) = ф(х), Wi(0, z) = 0, ut(l, г) = 0,
(42)
(43)
а и2(х, t)—решение уравнения
д2и2 2д2и2
—— = а2——+f(x, t) dt2 дх2 v 7
при условиях
и2(х, 0) = 0
w2(0, *) = 0> u2(l, t) — 0.
(45)
При этом естественно считать, что д/Дх, t) описывает колебания струны, обусловленные начальным отклонением от положения равновесия и(х, 0) = ф(х)
ди , ч ч . ч
и начальной скоростью — (х, 0) = ф(х), а функция и2\х^ /) описывает движение
струны под воздействием внешних сил.
Для нахождения функции и2(х^ /) можно применить метод Фурье, изложенный для более общего случая в п. 6°. В рассматриваемом случае
и2(*> t) = Е w„(r)sin——, (46)
и = 1 I
00 7ГИХ
(47)
п = 1 1
и неизвестные коэффициенты un(t) в равенстве (46) можно найти как решение дифференциального уравнения
/ \ 2
(^) “Ь ( ~~j~ j a Un(f) —fn (t) (48)
при нулевых начальных условиях
w„(0) = 0, wJ,(O) = O. (49)
Утверждение о том, что функция (46) является решением поставленной задачи, легко проверяется в предположении, что функция /(/, х) разлагается в ряд Фурье и ряд (46) можно почленно дифференцировать.
§ 2*.3. Уравнение теплопроводности. Решение задачи Коши методом Фурье
1°. Вывод уравнения теплопроводности. Рассмотрим тонкий однородный теплоизолированный с боков стержень длины /. Пусть в начальный момент он нагрет (вообще говоря, неравномерно) и на его концах поддерживается определенный температурный режим. Отождествим точки стержня с точками отрезка оси х на участке [0, /].
С течением времени в соответствии с физическими законами распространения теплоты температура каждой точки х стержня будет изменяться.
2*.3. Уравнение теплопроводности. Решение задачи Коши методом Фурье 315
Процесс изменения температуры будем описывать функцией и(х, t), значение которой в точке (х, t) равно температуре точки х стержня в момент времени t.
1 Покажем, что функция и(х, t) удовлетворяет уравнению теплопроводности
Прежде всего отметим, что количество теплоты Q, протекающее через сечение стержня на участке [х, х + Дх] за промежуток времени [z, Z+Az], пропорционально скорости изменения температуры на участке [х, х+Дх], площади сечения 5 и промежутку времени Az (закон Фурье). Таким образом, для малых Дх и Az имеем
. . м(х+Дх) —м(х) де^-к(х )S-±-----------— Az, (2)
Дх или в дифференциальной форме, ди dQ=—kS — dt, (3)
дх
где к — коэффициент пропорциональности [для неоднородного стержня к = =к (*)]•
Количество теплоты, которое необходимо сообщить однородному телу, чтобы повысить его температуру на Дм, пропорционально Дм, объему тела V, плотности тела р и равно
стки = ср V &и, (4)
где т — масса тела, а с — коэффициент пропорциональности, называемый удельной теплоемкостью.
Если Дм зависит от точки х, то количество теплоты, необходимое для изменения температуры от м(х) до м+Дм(х), можно найти интегрированием функции (4):
*2
f ср5Дм(х)бх. (5)
Пусть на температурный режим тела влияют источники теплоты с плотностью F(x, z); это означает, что на участке [х, х + Дх] за время [z, Z+Az] выделяется количество теплоты, приближенно равное
\Q^SF(x, z)AxAz; (6)
в дифференциальной форме:
dg = 5F(x, z)dxdz (7)
в интегральной форме:
Q = S f f F(x, z)dzdx (8)
(Q — количество теплоты, выделяемое источником с плотностью F(x, z) на участке [xi, х2 ] за время от Zi до Z2).
Запишем уравнение баланса теплоты на участке [хх,х2]:
316
Глава II*. Уравнения математической физики
*2
+ П f ср[и(£, f2)-w(£,
(9)
Применяя к равенству (9) теорему о среднем, имеем
к — (х, т) дху '
ди
—к — (х, т) дхК '
At+F'(xn9 tn)AxAt =
=ср[н(£, «2)-и(£, /1)]к=ъЛх
(Ю)
Согласно теореме о
конечных приращениях, получим
д ( ди к— — дх\ дх
AzAx+F(x4, z4)AxAr=
*3
ди i \ = ср —(х, Г)
Ах А/,
-хз
(11)
где /3, г4, г5 и х3, х4, х5—промежуточные точки интервалов [?15 12] и [х19 х2].
Сокращая равенство (11) на Ах А/ и переходя к пределу при х15 х2->х и t19 получим
ди д2и . .
cpaT^+jF(xu)’
или
ди д2и
—=а2 —^+f(x, t), dt дх2 ' '
(12)
(13)
Пс F(x, t)
где а= / —, ./(х, t) =-----------
у ср ср
2 2°. Задача Коши с краевыми условиями. Рассмотрим следующие задачи,
связанные с уравнением (13). В каждой из этих задач требуется найти функцию и(х, t), удовлетворяющую уравнению (13) и условию
w(x, 0) = ф(х)
(14)
(начальное условие).
Для того чтобы из множества решений выделить единственное, нужно к начальному условию (14) добавить некоторые условия, описывающие поведение функции и(х, t) в концах стержня (краевые условия).
Краевые условия могут ставиться различным образом в соответствии с характером теплообмена на границе.
Самые простые краевые условия имеют вид
w(0, z) = gi(z), и (I, /) = ц2(*)> (15)
где Ц1(г), Цг(0—заданные функции.
Однако на каждом из концов отрезка можно потребовать выполнения условий
J> 2*3. Уравнение теплопроводности. Решение задачи Коши методом Фурье 317
^(0, z) = t>!(z), ^(/, t)=v2(t). (16)
дх дх
В этих случаях через конец стержня протекает тепловой поток, характеризуемый заданными функциями vx(z), v2(t).
Можно рассматривать также условия вида ?(о,1)=-х1[«(о, гЬМО], дх
(17) ^(/,/)=-х2[и(/,/)-е2(О]. дх
Такие условия описывают теплообмен концов стержня с окружающей средой, температура которой 0(0 задана.
Описанные выше задачи называют задачами Коши для уравнения теплопроводности при краевых условиях (15), (16), (17).
3°. Метод Фурье решения задачи Коши для однородного уравнения теплопроводности. Рассмотрим задачу Коши для уравнения теплопроводности
ди 2д2и dt дх2 (18)
при условиях w(0, x) = cp(x), (19)
w(0, = t) = 0. (20)
Пусть ср(х)= X bnsm — п=1 1 (21)
—разложение функции ср(х) в ряд Фурье по синусам. Вычисления показывают, что функция пп Л2”3 22, кпх и(х, t)= \ Z)nsm е 1 , п=1 * (22)
где коэффициенты Ьп определены формулами 2' ттх bn = ~;](f>(x)sm—-dx, / 0 t (23)
удовлетворяет уравнению (18) и условиям (19) и (20).
Задача Коши для уравнения (18) при условиях (19) и (15), как было показано в п. 3° § 2.3, сводится к нахождению решения уравнения (13) при условиях
w(0, х) = 0, «(0, г) = 0, «(/, г) = 0. (24)
Решением этой задачи является функция
°° лпх
и(х, t)= Y w„(/)sin-—, (25)
И=1 t
где un(t)—решение обыкновенного дифференциального уравнения
318
Глава II*. Уравнения математической физики
U'n = a =
при условии ми(0) = 0, a fn(t) — коэффициенты разложения функции f(x, t) в ряд Фурье по синусам:
У Ч 7 X ППХ
f(x, t)= E/„(z)sin~T~-п=1 1
(26)
Сформулированные утверждения /(х, t), ср(х) разлагаются в ряды дифференцировать.
3- Докажем, что ряды
справедливы при условии, что функции Фурье и ряд (25) можно почленно
£ £4 Ti дх2 ’
00 ди т д2и иип и ип
зг и „5^
(27)
, . ппх
и„(х, t)=bnsm—e 1 (28)
2 1 bn=~ih(X) 1 о
ттх sin——
(29)
(см. формулы (21) и (17) § 2.3), сходятся равномерно.
со
Более того, докажем, что существует сходящийся числовой ряд £ ап,
для которого выполняются условия
.X 17(x’z)
д2ип дх2
ап
Л=1 [мажоранта
И
И
рядов (27)], откуда следует равномерная сходимость рядов (27) и возможность почленного дифференцирования рядов
Имеем
и £^10. (30)
/1=1 Л=1 СХ
Из ограниченности ограниченность Ьп:
<р(х) =—- (т. е. из того, что |<р(х)|<М) вытекает dt
и, следовательно,
|7>„|<2Л/
(31)
(32)
для всех t > а > 0.
Аналогично получаем
(33)
f 2*.3. Уравнение теплопроводности. Решение задачи Коши методом Фурье
319
и далее
Z>a>0.
Положим
(34)
(35)
где N, s—постоянные. Исследуем сходимость ряда У ап. Согласно признаку
Даламбера, имеем
lim
л—*00
аи+1 /«+1Y Ч7ра[(и+1)2-к2]
---- =lim ----)е 4 7
а„ \ п J
/и+lV -(ура(2«+1)
= lim |---) е 17 =0.
л—оо у п J
(36)
В силу неравенства (34)
00
ряд У ап является мажорантой для рядов л = 1
(37)
при ДГ=2Л/1у I a2q и s = 2q-yp. Так как ряд сходится, то все ряды (37) сходятся равномерно при Г>ос; число а>0 можно взять произвольным, поэтому ряды У ип(х, t) можно почленно дифференцировать при любом Г>0.
Тем самым полностью доказано, что функция и(х, t), заданная формулами ди 0д2и
(27) — (29), удовлетворяет уравнению —=а —- и условиям и (х, 0) = ср (х), dt дх2
w(0, О = w(Z, г) = 0.
4 4°. Неоднородное уравнение теплопроводности. Функция Грина. Для неоднородного уравнения теплопроводности
ди 82и
—=а2—r+f(x, t) dt дх2 ' '
(38)
функция /(х, г), как известно, описывает влияние внешних источников теплоты, распределенных вдоль стержня. Полезно проследить влияние точечного источника теплоты. Для этого рассмотрим уравнение (38), предполагая, что
1
2е’ О,
|х—л0|<е,
|х-х0|>е
(39)
при малом е; дополнительно предположим, что
м(х, 0) = 0, w(0, /) = 0, w(Z, /) = 0.
(40)
Функция (39) описывает источники теплоты, локализованные на малом участке стержня вокруг точки х0. Решение поставленной задачи при 8->0 стремится к функции w(r, х, х0), описывающей изменение температуры стержня под
320
Глава II*. Уравнения математической физики
влиянием точечного источника теплоты, сосредоточенного в точке х0. Известно, что коэффициенты un(t) в разложении решения и(хч Z) поставленной задачи в ряд Фурье по синусам
” ттх
и(х, t)= Уt w„(Z)sin——-п= 1 *
удовлетворяют дифференциальному уравнению г/ \ i%2n2 / \
w „(?) + « — un(t)=gr
(41)
(42)
при нулевом начальном условии
«„(0)=0.
(43)
Число gn(n=\, 2, ...) в правой части равенства (42) представляет собой я-й коэффициент разложения функции gE х (х) (39) в ряд Фурье по синусам. Имеем
Х0+£
21 лпх 2 Г
g„—~\f(х, /)sin----dx = — !
I V 7 I 2ls J
X0-£
1 / Tin Tin . — l Т1ПХ
= — COS (x0 —8) —COS (x0 + 8)) =------COS----
ley I I l&nn I
2 . nnxQ . Tins
ттх sin —— dx =
/8
=----sin-----sin----.
7Ш8
(44)
При малых 8 получим 2 ..........
----sm-----sm----- JUZ? 8 I I
Т1ПХ
Tins 2 7ШХ0
-sm------
I I
(45)
в силу первого замечательного предела.
2 7U7XO
Решением уравнения (42) при условии (43) и g„=jsin—— является функция
2 . ттх0
тс2л2а2 (1-е
I2
. TinXn
21 sm —-— а 2тс2 п
2 2 -2 (1-е~~ п п а
(46)
Поэтому функция
I X V- / \ • ппх
u(t, х, х0)= X un(t, х0) sin ——
и= 1
(47)
(38)- (40) при 8—>0.
есть решение задачи
Так как для всякой функции f(x, t) справедливы соотношения
0,
то
т
Х28/(х, t)g£tXk(x)=f(x, t),
(48)
где 28 = I/(т +1) и xk = (2k— l)s.
1
I I
j>' 2*.3. Уравнение теплопроводности. Решение задачи Коши методом Фурье
321
Решение и(х, t) (47) и (48)
зависит от функции f(x, t) линейно, поэтому в силу
и(х, У х, хк),
fc=i и при 8—>0 имеем i
и(х, t)u(t, х, £)d£,
о
где w(x, г)—решение задачи (38) — (40).
Аналогично рассматривается задача Коши для уравнения ди 2 д2и dt dx2
(49)
(50)
при однородных краевых условиях w(0, t) = u(l, r) = 0 (51)
и начальном условии
r 1
| , |Х-ХО|<8,
/ ) 28
«kO)=g8,Xo(x)=|0> |x_%o|>g (52)
В этом случае «2л2«2
w(x, z)= X и„(х, t)= Y b„e /2 sin^, (53)
п= 1 п= 1
а коэффициенты Ьп являются коэффициентами разложения функции g£j А-о (х) в ряд Фурье по синусам. Таким образом [см. формулы (44), (45)], при 8->0 имеем
2 71 пха
bn=-sm—j-. (54)
Обозначая функцию и(х, t) в равенстве (53) через и(л х, х0), получим а 2тс2л 2
2 “ ” * ппх ттх0
u(t, х, х0)=- е 1 sin—— sm——.
/„=1 I I
(55)
Эта функция называется функцией Грина задачи (50)—(52).
Если в рассматриваемой задаче вместо условия (52) при 8->0 взять п(х, 0) = ф(х), (56)
то оказывается, что решение и(х, t) связано с u(t, х, х0) формулой
u(t,x)=f и(z, X, £)<р(£)d£. (57)
О
Доказательство справедливости этой формулы вытекает из того факта, что решение и(х, t) зависит от функции ср (х) линейно; функция ср (х) с любой степенью точности представляет собой линейную комбинацию функций (р(хЛ), т. е.
т
<рМ= Е 2е<р(х4)&,хДл:), к= 1
(58)
где 2s = //(m+l), хк — {2к— l)s.
11 Мантуров О.В.
322
Глава II*. Уравнения математической физики
Так как начальному условию задачи, заданному функцией ge,Xfc(x), соответствует решение u(t, х, xk), то
и(л, г)« X <РМ«(г> Х’ **)д>
к=1
что в пределе при А = 2е->0 дает формулу (57).
§ 2 *.4. Уравнение Лапласа. Решение задачи Дирихле в круге методом Фурье
1°. Уравнение Лапласа. Уравнение
д2и д2и д2и л
А «=-—j+——у+...+——7—О дх2 дх2 дх2
(1)
относительно функции и вещественных переменных xl9 х2, ..., хп называется уравнением Лапласа.
Уравнение
д2и д2и д2и . .
Ди== + +...+ =/(х х х ) (2)
дх{ дх2 дх„
относительно функции и(х19 х2, ..., хп) при заданной функции ф(х1,х2,...,хп) называется уравнением Пуассона.
Заметим, что
Aw = div grad и
(3)
(ди ди ди \
дх} дх2 дхп/
dpi др.
, а диверге-
\ ж Л- - . vР2 I I
, ..., рп) есть функция div/?=--Ь- Н..+-— .
nJ
, хи), имеющая непрерывные частные производ-внутренних называется
нция векторного поля p = (pi, р2,
Всякая функция w(x15 х2, ...
ные второго порядка, удовлетворяющая уравнению Aw = 0 во всех точках области D и непрерывная на границе области £>, гармонической в области D.
1 2°. Важнейшие свойства гармонических функций. Доказываемые ниже свой-
ства сформулированы для гармонических функций в областях трехмерного евклидова пространства, однако справедливы их «-мерные аналоги.
1°. Пусть S—гладкая замкнутая поверхность, принадлежащая открытой области D, и f—гармоническая функция в D. Тогда
о — da = 0, дп
(4)
д/
где------производная функции f в направлении нормали к поверхности S,
дп
a du—элемент площади поверхности. Справедлив и «-мерный вариант формулы (4).
2°. Пусть f—гармоническая функция в открытой области D. Тогда
7^tifd,3=f(xo, УО’ Zo)>
3
(5)
j1 2*.4. Уравнение Лапласа, Решение задачи Дирихле в круге методом Фурье 323
где SR — сфера с центром в точке (х0; у0; z0) и радиусом R, принадлежащая области D, a des—элемент площади поверхности сферы.
Свойство 2° утверждает, что среднее значение функции f на всякой сфере внутри области D равно значению функции в центре сферы.
3°. Принцип экстремума. Если f— гармоническая функция в замкнутой области D с границей S, то всякий локальный экстремум функции f достигается в точках границы.
4°. Если и и v — гармонические функции в замкнутой области D с границей 5, причем u>v на S, то u^v всюду в D.
5°. Пусть w=f(z)—функция комплексной переменной, аналитическая в точке z—x+yi. Тогда Rew = w(%, у) и = j) — функции, гармонические в окрестности точки (х; у).
Доказательство. 1. Для гладкого векторного поля Е в области D, ограниченной поверхностью S, справедлива формула Остроградского
Ш div f dw=fJ (Г, n) d a, (6)
D S
где n — внешняя нормаль к поверхности 5; dw, da—элементы объема области D и площади поверхности 5.
Применим формулу Остроградского к случаю
/ dv ди dv\
F=wgradr = и—, и—, и— ), (7)
\ дх ду dz J
где и, v—гладкие в D функции.
После несложных преобразований получаем
f/ди dv dudv dudv\ f Г dv иЛН — )dco= w —da. (8)
\dxdx дуду dzdzj J J dn d s
Действительно,
- d ( dv\ d ( dv\ d / dv\ divF=— u—- |+—- и— I+— u— | = dx\dxj dy \ dy J dz\ dz J
(d2v d2v d2v\ du dv du dv du dv
= ul т——о'Ьу ~—f-~ — • (9)
\cbc2 dy2 dz2/ дхдх дуду dzdz
Что касается потока векторного поля F=wgradr через поверхность S, т. е. Jf(F, w)da, то
s
JJ(F, n)d<y = s
jj (wgradr, w)da=J s s
dv и—da, on
(10)
поскольку —=(grad г, n) в силу известного свойства производной по направлению. дп
Формула (8) называется формулой Грина. Если в ней взять w=l,
а в качестве v выбрать гармоническую функцию, то получим
Ядо
-da = 0. (11)
дп
s
Таким образом, свойство 1° доказано.
11*
324
Глава II*. Уравнения математической физики
2° Поменяем местами и и v в формуле (8) и вычтем из левой и правой частей формулы (8) соответствующие части равенства, полученного такой заменой:
(12)
Пусть в равенстве (12) и—гармоническая функция точки М и MQ области D имеют координаты (х; у; z)
1
' = ->/('x-xo)2 + (j;-J'o)2-(z-zo)2
JKL 17 , v •
г(ММ») и (х0; у0; z0), а
где
(13)
Функция v, как легко проверить, является гармонической функцией переменных х, у, z при постоянных х0, у0, z0 всюду, кроме точки х = х0, 1 у=у0, z = z0, в которой v=—----г не определена.
Рассмотрим область D, полученную из D исключением шара D£ с радиусом а и центром в точке Мо. Эта область имеет границу, представляющую собой объединение поверхности 5 со сферой Se, ограничивающей шар Z)e.
К области D применим формулу (12). При этом ее левая часть обратится в нуль, поскольку в области D функции и и v являются гармоническими. Правая часть разлагается в сумму двух слагаемых, соответствующих интегрированию по двум частям границы: 5 и SE (вектор нормали п в точках сферы направлен внутрь сферы и является внешним по отношению к D). Из приведенных рассуждений следует
1 1 ди
и—— — JJ \ г г dry S
do =
С С 1 1ди
и———do, JJ £ гдп SE
(14)
причем
в силу равенства (11). Поэтому правая часть формулы
i/do, что по теореме о среднем равно — 4п&2и(М*),
ди
—do = 0 дп
sE
(14) примет вид —
£2
Se
где М*—некоторая точка сферы при £->0 последнее выражение стремится к 4тш(Л/0).
Таким образом, формулу (14) можно переписать
в виде
do = 4Tiw(Af0),
(15)
S
если Мо — внутренняя точка области D. Если же Мо не принадлежит замыканию области D, то
(16)
в силу формулы (12) и того факта, что функции и и v=1/r гармоничны во всей области D.
2*.4. Уравнение Лапласа, Решение задачи Дирихле в круге методом Фурье 325
Интеграл в левой части равенства (15) в случае, когда 5 есть сфера с центром в MQ и радиусом R, преобразуется следующим образом:
поскольку и—гармоническая в D функция и поэтому справедливо
равенство (11).
Итак, —- I | wda=47rw(M0), откуда
J J
= С18)
чем и завершается доказательство свойства 2°.
3°. Предположим противное, т. е. что гармоническая в области D функция и имеет локальный экстремум (для определенности — максимум) во внутренней точке Мо. Тогда для достаточного малого 8 имеем
и(М0)>и(Р), PeSs (19)
(5е—сфера с центром в Мо и радиусом е). Используя формулу (20) и теорему о среднем, получим
ц(Л/0) = 4лА2-^м(М)*==^(М*), М*б5е.
(20)
Равенство (20) противоречит неравенству (19), и значит, неравенство (19) в действительности не имеет места.
4°. Пусть и и v—гармонические функции в области Z), причем на границе области u^v. Тогда функция u — v гармонична в области D и на ее границе 5" принимает только неотрицательные значения. Если бы в какой-либо внутренней точке MeD выполнялось неравенство и(М} — то
минимум функции не принадлежал бы границе, что противоречит свойству 3°. Полученное противоречие доказывает свойство 4°.
5°. Для функции f(z) комплексной переменной z = x-}-yi, аналитической в точке z — x+yi, выполняются условия Коши — Римана, состоящие, как известно, в следующем. Если w=f(z) = u(x, iv(x, j>), Re£(z) = u(x, у), Im f(z) — v(x, j^), to
du dv dv du
—=—, — =-------. (21)
dx dy dx dy
Отсюда
d2u d2u d /du\ d /du\ d dv d du
—--I---= — I — I-|-( — ----------= 0.
dx2 dy2 dx\dxj dy\dyj dx dy dy dx
d2v d2v d /dv\ d /diA d /du\ d du dx2~^dy2 dx\dx/dy\dyj dx\dyj dydy
Гармонические функции w, v двух переменных, удовлетворяющие условиям (21), называются сопряженными.
2 3°. Гомеморфизм и диффеоморфизм. В пространстве переменных
х2, ..., хи рассмотрим множество Еп точек (х1? х2, , х„) таких, что
326
Глава II*. Уравнения математической физики
Рис. 59
Xj +Х2 ••• ~^~^п
(22)
Множество Еп называют п-мерным (замкнутым) шаром.
Пусть х2, ..., х„), f2(xt, х2, х„), f„(xr, х2, ..., х„)— набор
функций, определенных в Еп и имеющих непрерывные частные произ-
3/,
водные — (i, j — 1, 2, ...,
<3х/
О'!, У2. - Л) вида
п). Обозначим через f(En) множество точек
У1 =fi (*i, х2, -, х„), y2=f2(x2, х2, .... х„), ..., y„=/„(x!, х2, .... х„), (23)
где (хг, х2, х^еЕп.
Формулы (23) определяют отображение
f:En->f(E"\
(24)
Сделанные предположения означают, что это отображение является «отображением на» f(En) (т. е. каждая точка из f(En) имеет свой прообраз в в таких случаях говорят, что отображение f является сюръекцией). Кроме того, отображение (24) называют непрерывно дифференцируемым [в силу непрерывной дифференцируемости функций (23)].
Пусть для отображения (24) существует обратное отображение
g:f(En)-*En, (25)
*i=gi (У1, У2, Я,), x2=g2(yi> У2, - , л),
x„=gn(yi, З'г, -,К), (26)
и каждая из функций &(/=!, 2, в f(En) имеет непрерывные частные dgi(- • 1 э \
производные —2, ..., п).
Syj
Существование обратного отображения (25) означает, что множество соотношений (23), рассматриваемое как система уравнений относительно неизвестных х1?х2, ...,х„ при каждом наборе у2, ..., _yw)e/(£"), имеет единственное решение (х1? х2, ..., хи)е£”. При этом говорят, что множество /(£”) диффеоморфно Еп (если взаимно обратные отображения f и g непрерывны, то множества Еп и f(En) называют гомеоморфными’, разумеется, диффеоморф-ные множества Еп и /(£") являются гомеоморфными).
Мы будем рассматривать в пространстве переменных х15 х2, ..., хп множества D, диффеоморфные замкнутому шару Еп. Граница множества D представляет собой, как легко видеть, множество /(5й-1), где Sn~l есть (п — 1)-мерная сфера, т. е. множество точек (х15 х2, ...,х„) таких, что Xi+x2 + ... + x2 = 1. Это множество является гладкой поверхностью размерности п— 1, гомеоморфной сфере Sn~l. На рис. 59, а и б изображены области D, диффеоморфные шару Е2, а на рис. 59, в и г — не диффеоморфные шару Е2.
J 2*.4. Уравнение Лапласа, Решение задачи Дирихле в круге методом Фурье
327
4°. Задача Дирихле. Формулировка задачи Дирихле заключается в следующем: требуется найти функцию и(хг, х2, ..., хи), гармоническую в замкнутой области D и принимающую на границе области D заданные значения ср (S'), seS.
3 Для ограниченных областей с гладкой границей решение задачи Дирихле существует при любой непрерывной функции ср. Доказательство этого факта связано с построением функции источника (или функции Грина).
Решение задачи Дирихле единственно. Это вытекает из следующих рассуждений. Пусть имеется два различных решения w, v задачи Дирихле. Тогда функция и— v является гармонической в области D и принимает нулевые значения на ее границе. В силу принципа экстремума минимум и максимум функции и— v должны быть равны нулю и, следовательно, u=v.
Решение задачи Дирихле непрерывно зависит от функции (р (5). Действительно, если граничным значениям ср (5) отвечает решение w(x15 х2, ..., хи) задачи Дирихле, а значениям <р-Ь Д(р — решение w+Aw, то решению задачи Дирихле с граничными значениями А(р соответствует функция Aw. В силу принципа экстремума, имеем max А(р^ Aw > min А ср. Следовательно, малое изменение граничных условий влечет малое изменение решения задачи Дирихле. При этом имеет место непрерывная зависимость решения от граничных условий.
5°. Решение задачи Дирихле для круга. Пусть требуется найти такую функцию и(х, у] двух переменных, что внутри круга S'.x2 -\-у2 ^R2 она удовлетворяет уравнению
д2и д2и
дх2^ ду2
(27)
и
w|s=gCs), seS. (28)
Используя полярные координаты р и ср, получим x=pcoscp, j>=psin(p, w(x, _y) = w(pcos(p, psin<p) = r(p, ср).
Тогда уравнение (27) перейдет, как было показано в § 2 4, в уравнение относительно функции и(р, ср):
d2v 1 dv 1 d2v
7“2 + _7— др р др р дер
а функция g(s) будет зависеть только от полярного угла ср, т. е.
g(d=J(<d- (3°)
Применим метод разделения переменных. Пусть г(р, <р) = р(р)ф(ф).
В результате последующих рассуждений (см. § 2.4) приходим к уравнениям
1 Р
Р"+-Р'=г—. (31)
р р
Ф" + ХФ = О. (32)
Для того чтобы выполнялось условие Ф (ср + 2л) = Ф (ф), необходимо и достаточно, чтобы Х=и2, где п — целое неотрицательное число
При этом непрерывным решением уравнения (31) является функция Л=РИ- ОЗ)
328
Глава II* Уравнения математической физики
Пусть
vn (р, (р) = р” (Ап cos п <р + Вп sin п ф) (34)
и
а 00
г=у+ Е г»(р> ф)- <35)
2 и —1
Если ряд (35) можно дифференцировать почленно, то он будет решением задачи Дирихле при условии, что Ап и Вп в формуле (34) взять соответственно равными aJRn и bnfRn, где ап и Ьп—коэффициенты разложения функции у(ф) в ряд Фурье:
а 00
у(ф) =—+ £ ancosnx+bn sin их (36)
П=1
4 Покажем, что ряд (35) можно дифференцировать почленно. Имеем а °° /р\”
f=y+ Y Н) (a„cos«<p + Z)„sinn<p). (37)
Прежде всего покажем, что этот ряд сходится равномерно. Действительно, так как ап cos иф + sin и ф ^/а„ +Ь„ и ап, Ьп ограничены, то и-й член ряда по абсолютной величине меньше, чем и-й член сходящейся геометрической прогрессии:
£
7?
и
(ап cos п ф + bn sin иф) а^ + Ь^
Р
R
где 101< 1, а М—постоянная такая, что M>y/a„+bl (и=1, 2, ...). Поэтому на основании признака Вейерштрасса ряд (37) сходится равномерно. Аналогично
можно доказать, что ряд, полученный А;-кратным формальным дифференцировани-оо ' 4
ем исходного ряда (37), мажорируется сходящимся числовым рядом £
п = 1 , .
Кроме того, можно доказать существование мажоранты для к-х производных ряда
Р Л
пкМ.
(37) по ф, а также для смешанных производных. Из всего сказанного вытекает справедливость формулы почленного дифференцирования ряда.
Следовательно, функция (37) является решением задачи Дирихле, если ап и Ьп выбраны так, что справедливо разложение (36).
5 Преобразуем функцию (37). Учитывая, что
пл п
°о=т- /('I'W, Дф)со8пф<1ф, b„=- I j(\|/)sin«x|/d\|/, (38)
2л J л J тс J
-л —л —л
перепишем формулу (37), подставив в нее выражения ап и Ьп из равенств (38):
л
— л
л
(cos п ф cos п ф + sin п ф sin п ф) > ёф =
и )
(cost? (ф —ф)>дф =
£ 2*.4. Уравнение Лапласа, Решение задачи Дирихле в круге методом Фурье
329
С fl °°
•/(ФК 7+ X
J I2 П=1
1
7С
1
2я
; — 2—+2cos(\|/ —(р) .
j;(*к) (1+7---------------------г f d'k=
I R P / X P
. 1 - 2—cos (ф-<p)+
1
2л
./.Л, 27?pcos(\|/-<p)-2p2 )
Я2-2/?рсо8(\|/-<р)+р2]
1 f Л2-р2
2n R 2 — 27?pcos(x|/— <p)+ p2*^?
— Л
(44)
Последний интеграл называется интегралом Пуассона
Глава III*
ТЕОРИЯ ФУНКЦИЙ КОМПЛЕКСНОЙ ПЕРЕМЕННОЙ И ОПЕРАЦИОННОЕ ИСЧИСЛЕНИЕ
§ 3*.1. Комплексные числа.
Действия с комплексными числами. Тригонометрическая форма комплексного числа. Формула Муавра
1°. Определение и свойства комплексных чисел. Определение комплексного числа как числа вида a + bi, где а и b—вещественные числа, a i обладает свойством i2= — 1, несовершенно с логической точки зрения (хотя и является удобным). Действительно, в этом определении обойдены ответом естественные вопросы: существует ли такое i, что означает Ы и т. п.
Строгим определением комплексных чисел является следующее: комплексным числом z называется упорядоченная пара вещественных чисел (а, Ь\ где a, beR. При этом на множестве С всех комплексных чисел формулы
(a, b) + (c, d) = (a+c, b + d),
(a, b)-(c, d) = (ac — bd, ad+bc)
(О
(2)
определяют соответственно операцию сложения и операцию умножения [любым двум комплексным числам zx=(a, b) и z2 = (c, d) формулы (1) и (2) ставят в соответствие числа + z2 = (а + с, b + d} и zxz2 = (ac — bd,.ad+bc}\. .
1 Комплексные числа вместе с операциями (1), (2) обладают рядом замечательных свойств, а именно:
z-^ + z2 — z2 Z} VZj, z2 eC, (3)
(z1+z2) + z3 = zi+(z2 + z3) z2, z3 eC, (4)
(0, 0) + z = z VzeC, (5)
(a, b) + ( — a, — b) = (0, 0), (6)
Z Z2 Z2 zr Vzn z2 eC, (7)
(zt z2)z3 = z1(z2z3) Vz1? z2, z3 eC, (8)
z1(z2 + z3) = z,(z2 + z3) Vzn z2, z3eC, (9)
(1, 0)z = z VzeC. (10)
При этом удобно обозначение («, 0) = я. Так как (я, 0) + (b, О) = я + Ь, (я, 0) х х (b, ti) = ab 4a,beR в силу формул (1), (2), то, отождествляя комплексные числа вида (а, 0) с действительными числами <2, замечаем, что это обозначение позволяет считать множество вещественных чисел R вложенным в множество комплексных чисел, и операции (1), (2), примененные к вещественным числам, совпадают со сложением и умножением вещественных чисел.
Обозначим комплексное число (0, 1) через z, т. е. z=(0, 1).
5*.2. Элементарные функции комплексной переменной 331
В силу равенства (2) имеем z2 = (0, 1) (0, 1) = (—1, 0)= — 1. Комплексные числа вида (О, Ь) в соответствии с принятыми соглашениями, можно записывать как Ы\ это означает, что (0, £>) = (£>, 0) (О, l) = bi. Наконец, всякое комплексное число (а, Ь) в смысле вышеописанных обозначений можно представить как (a, b) = (a, 0) + (0, b) = a + bi.
Все правила (3) — (10) в терминах принятых обозначений формулируются следующим образом: сложение и умножение комплексных чисел производится по правилам сложения и умножения многочленов относительно символа i при дополнительном условии i2—— 1.
2°. Основная теорема алгебры. Справедливо следующее утверждение, которое называется основной теоремой алгебры: любой многочлен
Pn(z)=zn + arzn~Y +a2zn~2 + ... + ап (11)
с комплексными коэффициентами а19 а2, ..., ап имеет по крайней мере один корень на множестве комплексных чисел при п 1.
В действительности всякий многочлен (11) имеет ровно п корней в С с учетом их кратности. Это означает, что он разлагается в произведение множителей первой степени:
^n(z)=(z-z1)(z-z2)...(z-zB). (12)
Комплексные числа zv z2, z„ являются корнями многочлена Р„ (z); среди чисел могут быть совпадающие. Если zk встречается в наборе z1? z2, ..., zn ровно rk раз (k= 1, 2, ..., п), то
^n(z) = (z-zl)'''(z-z2)''2-(z-z2)r“, (13)
а числа rk называются кратностями корней zk (k— 1, 2, ..., п).
Разложение (13) (т. е. числа zk и гк, к—1,2,...,п) определены для каждого многочлена Pn(z) однозначно с точностью до нумерации.
3°. Тригонометрическая форма комплексного числа. Для всякого комплексного числа z = x+yi неотрицательное число х2+у2 называется модулем z и обозначается р = | z |; угол ср такой, что х=р cos ф, у—р sin ф, называется аргументом комплексного числа z. Очевидно, аргумент определен с точностью до 2п (или до 360°).
Для любого комплексного числа x+yi справедливо представление х+у/=р(со8ф + г8Шф), (14)
которое называется тригонометрической формой комплексного числа.
ЕСЛИ Zj =pt (cOS ф! + Z Sin фг ) И Z2 = p2 (сО8ф2 + /8Шф2), то
zi z2 = Pi P2 (cos (<Pj + <p2) + isin (<px + q>2)). (15)
Отсюда следует, что
(cos ф + i sin ф)" = cos n ф + i sin n ф (16)
{формула Муавра).
§ 3*.2. Элементарные функции комплексной переменной
Степенная функция w=zn («—целое положительное) вводится следующим образом:
z" = Z-Z...Z
к____Y >
п раз
Функция w = zn (neZ, п>0) определена для всех zeC.
332 Глава III*. Теория функций комплексной переменной и операционное исчисление
Рассматривают также степенную функцию w = zn при целом неположительном п. По определению,
zn=l/z~n.
Функция w — zn (neZ, и<0) определена для всех zgC, z/0 Функции ez, sinz, cosz определяются с помощью формул 2 2 z” е’=1+г+2! + -+^+-’ z2 z4 z2n
3 _5 _2и+1
sinz=z-3!+¥--+(-1)"(^Tl)i+-- (3)
Ряды (1) — (3) сходятся при любом zgC. 00
1 Сходимость комплексного степенного ряда £ anzn в точке z=z0 понимают n = 0 N
как существование предела последовательности SN частичных сумм SN = £ anzn при и->оо. п=0
Комплексное число С называется пределом последовательности комплексных чисел SY, S2, ..., SN, ..., если для любого действительного £>0 найдется такое N(s), что при всех n>N(s) выполняется неравенство |5„ — С| <£.
Для комплексных степенных рядов справедлив признак сходимости
Даламбера: ряд £ anzn сходится в тех точках z, для которых 1=
Применяя этот признак к ряду (1), находим
|zw+1|«! |z|
/= lim ----------= lim------= 0,
и (и+1)! |z"| „_„«+!
т. е. ряд (1) сходится при любом zgC.
Аналогично можно доказать сходимость рядов (2) и (3) при любом zeC. 2 Из сравнения рядов (1), (2) и (3) (и из факта их сходимости при всех zgC) вытекает формула
eiz = cosz+zsinz (4)
для любого zgC.
Функция w = Lnz определяется как обратное соответствие к функции е2. Это означает, что w = Lnz есть такое комплексное число, для которого ew — z. Оказывается, что
w = Lnz = ln |z| + z'Argz, (5)
где z=x+yi—комплексное число, \z\ — ^/x2+y2 — модуль z и Argz—любой угол такой, что cos Argz = х/^/х2 + j?2, sin Argz=уД/х2 + у 2.
Действительно,
eln |z| +1 Argz _ | z | (cos ArgZ _j_ I sjn Argz) = x + iy
3 Здесь была использована формула
eMev = e“+t;, (6)
3*.3. Производная функции комплексной переменной. Условия Коши—Римана
333
справедливая для любой пары zz, re С. Справедливость формулы (6) есть м v|r|" я
е1 1 = У - и алгебраического
п!
следствие сходимости
рядов
ем_ у М “Д «!
|«
и
тождества
= z
р = 0
СО 00
р'-
Um'Vn т\ п\ 1 ,
zzw
т = 0 и = 0 р = 0
1 гр А
У------—-umvn= У — (zz + r? = e'
т^п=рР\т\п\ Ь 7
Р=оЛ’
(7)
т + п = р
Равенство (5) показывает, что функция Lnz является многозначной.
Как вытекает из формул (1) — (3), при любом zeC справедливы равенства
eIZ + e lz e‘z-e Iz cosz=----------, sinz =--------
2 2i
(8)
По определению, w = tgz =----; область определения этой функции есть
cosz
71
множество всех комплексных чисел, за исключением z=-+kn (к=0, +1, ±2, ...).
Рассматривают также гиперболические функции, определенные с помощью равенств
ez+e z ez—е z ez—е z
chz=-------, shz=------, thz =-----;
2 2 ez + e“z
(9)
функции w = chz и w—shz определены при всех zeC, а функция w = thz—только при z^^+2/cTt^i (к—О, ±1, ±2,...).
Функции w = Arccosz, w = Arcsinz, w = Arctgz определяются как обратные соответствия к функциям w = sinz, w = cosz, w = tgz; это означает, что w = arccosz, w = arcsinz, w = arctgz тогда и только тогда, когда cosw = z, sinw=z, tg w=z. Из формул (8) следует, что
w = Arccos z=-Ln(z± Jz2 — 1), w=Arcsin z = - Ln (z (z + -Jz2—\), z z
w = Arctgz = -Ln z
liz-yA у/ 1 —zi
Аналогично, из формул (9) следует
£+T V\-z
w=Arcchz = Ln (z±yJz2 — \), w = Arcshz — Ln (z±^/z2+l), w = Arcthz=Ln
§ 3*.3. Производная функции комплексной переменной.
Условия Коши—Римана. Дифференцируемость элементарных функций
1°. Производная функции комплексной переменной. Определение. Пусть w=/(z)- функция комплексной переменной, определенная в а-окрестности точки z0, и существует предел
334
Глава III*. Теория функций комплексной переменной и операционное исчисление
Рис. 60
Um/(z0 + Az)-/(z0)
Az—*0
Тогда этот предел называется производной функции w=/(z) в точке z0; при этом функция w=f(z) называется дифференцируемой в точке z0.
Если функция w=/(z) дифференцируема в каждой точке области D, функция
Az
(1)
то
ГЫ-
Az—>0 называется производной функцией w—f(z) в области D.
равносильно существованию предела
Az
(2)
от
1 Существование производной
которое понимается в том смысле, что Az стремится к нулю любым способом. Заметим, что на плоскости комплексной переменной Az может стремиться к нулю многими различными способами. Многообразие таких возможных способов, как видно из рис. 60, гораздо более широкое, чем для вещественного Ах, стремящегося к нулю.
Таким образом, требование существования предела (1) является гораздо бо-р-fy 4- Д у)—£f(x)
лее жестким по сравнению с аналогичным пределом lim --------------, с по-
Дх—*0 Л*
мощью которого определяется производная функции вещественной переменной. В этом и заключается основная причина того факта, что дифференцируемые функции комплексной переменной обладают многими свойствами, не имеющими аналогий в вещественном случае.
(I).
2°. Теоремы о дифференцируемости функций комплексной переменной. Теорема 1 (условия Коши —Римана). Пусть w=f(z) — функция комплексной переменной, где z~x+yi, w=u-\-vi', вещественная и мнимая части значений функции f(z) являются (вещественными) функциями переменных х, у: и = и(х, у), v — v(x,y). Для того чтобы функция f(z) была дифференцируемой в точке z = x+yz, необходимо и достаточно, чтобы в точке (х; у) функции и и v были дифференцируемы и выполнялись условия Коши — Римана
ди dv ди dv
———, —=-------. (3)
дх ду ду дх
2 Д оказательство. Необходимость. Пусть предел (2) существует. Покажем, что для функции /(z) выполнены условия (3). Имеем
ч .. /(z+Az)-/(z f (z) = llm-----------
Az—*0
w(x+Ax, y+Ay)—z/(x, y)+(r(x+Ax, y + Ay) — v(x, y))i
Ax—>-0
(4)
Ax-И A y
Так как предел (2) существует при любом способе стремления Az к нулю, то он существует, в частности, при Ау = 0 и Ах->0; в этом случае
j1 3*.3. Производная функции комплексной переменной. Условия Коши—Римана 335
/'(z)
и(х+Ьэс, у) — и(х, j;)+(u(x+Ax, j;)—v(x, y))i = lim --------------------------------------------=
Дх-—О Ах
и(х-\-Лх, у) — и(х, у) v(x+&x, й — v(x, j>) ди dv
= lim -А------------------ + i lim -А-----А--------'=—+/— (5)
Дх—О Ах Дх—О Ах дх дх
Аналогично при Ах = 0 и Aj;—>0 находим
х, j;+Aj;)-w(x, y) + i(y(x, у, y + Ay) — v(x, j;))
/'(z)= lim
v(x, j+Ay) — v(x, j) f. u(x, y + Ay)—u(x, y) dv du
= lim —---------------— i lim — --~---------=-—i— (6)
ду—о Ay Ду_0 Aj; dy dy
Сравнивая соотношения (5) и (6), получаем условия (3).
Докажем дифференцируемость функций и (х, у), v (х, j;) как функций двух переменных при условии существования предела (2).
Действительно, при указанных условиях
/(z+Az)-/(z)=/' (z)Az+e|Az|, где 8 = e(z, Az) стремится к нулю при Az->0. Полагая A/=/(z+Az)—/(z) = = Au+i&v, Az = Ax + i&y, f' (z) = a+ib, где Aw, Ax, a—вещественные, a Au, Aj;, b — мнимые части A/(z), Az, f (z) соответственно, имеем
Aw + i Au = (a + ib) (Ax+i Aj>)+8 %/Ax2 + Aj;2.
Отсюда
Aw = wAx — Z?Aj;+8 i 5/(Ax)2 + (Aj;)2, Au — bAx+aAj; + 82 ^/(Ax)2 + (Aj;)2, (7) где 8Х и 82 стремятся к нулю при Ах и Aj;, стремящихся к нулю. Равенства (7) эквивалентны дифференцируемости функций w(x, у) и и(х, у) в точке (х; j;) такой, что предел (2) существует в точке z=x+iy.
Достаточность. Пусть выполнены условия (3). Воспользуемся тем, что для любых дифференцируемых функций и и и справедливы равенства
/ А А \ / \ A ^W *
w(x + Ax, y+Aj;) — w(x, у)=—Ах.Ч Aj;+ab dx ду
dv dv
u(x + Ax, j;+Aj;) —u(x, j;)=—Ax+—Aj;+a2, (8)
где ai, a 2—бесконечно малые более высокого порядка малости, чем ^/(Ax)2^^)2.
Подставляя равенства (8) в (4), получаем ди ди (dv А dv \ — АхЧ—Aj;-H —АхЧ—Aj; +^i + z’a2
ч .. 8х ду ду J_____________
дх-о Ax+zAy
Ду—О
ди dv / dv ди \
— Ах——Aj> + z +—-Ах+—Aj; l + a1 + za2 dx дх \ дх дх )
= lim
Дх—О Ду—О
Ax+zAj;
336
Глава III*. Теория функций комплексной переменной и операционное исчисление
— (Ax+zAy)+z —(Ax+zAj;) + a1 + za2 Ax+zAp
= lim
Дх—>0 Ду—+0
.. ди
Дх->0^Л
Ду—*0
dv о^ + осг ди dv
= lim -—bz-—h------—-=7—H‘~
дх дх Дх “Рt Ду дх дх
ди .dv ---------1- i—. дх дх элементарных функций z, w = sinz, и, = cosz,
Таким образом, производная f'{z) существует и равна
Теорема 2 (дифференцируемость комплексной переменной). Функции w — zn (zzeN), w = e w = shz, w = chz дифференцируемы в любой точке zgC.
71
Функция w = tgz дифференцируема в любой точке zeC, (z^—Ч-Агтг, /ceZ);
(/тс \ \
zAl -+2£тс I z, keZ ).
Для функций w — Lnz, w = az, w = za(aeC, a^O) в окрестности каждой точки z^O можно выбрать однозначную ветвь, которая является дифференцируемой в точке z функцией.
3 Доказательство. Для степенной функции w=z" имеем
(z + Az)”—z" z"+wz”-1Az+(?(Az)—zn lim --------=lim---------------— -= nz1
Az Az
(9)
где о (Az) — бесконечно малая более высокого порядка малости, чем Az. Формула (9) означает существование производной функции w = z" и тот факт, что (zn)' = nzn~1.
Докажем дифференцируемость показательной функции w = ez. Находим
ez+Az- z г/ дг-1\ ez(l+Az + o(Az)-l)
lim ---------= lim —Ц-----lim —--------------------^=ez. (10)
Дг—0 Az Az—*0 Az Дг—>0 Az
Тем самым установлено существование производной функции w = ez и формула (ez)' = ez.
Перейдем к доказательству дифференцируемости тригонометрических функций у = sinz и j^ = cosz. Имеем
(sinz)' = (-----) =—(eIZ)' —(e~iz)' = z • —(eIZ + e ~fz)==cosz. (11)
v 7 \ 2i J 2Г ' v ’ 2Г 7
Здесь использованы равенства
(elz)' = zelz, (e-lz)'= —ze-/z, (12)
вытекающие из формулы (10). Действительно,
ei(Z+AZ)_ez2 e^/eiAZ_1\ elz(l + zAz + o(Az)-l) lim -----------= lim — --------= lim — ---------—-— ---- = ielz.
Д2->0 Az Дг—*0 Az Дг—0 Az
Аналогично получается второе из равенств (12).
Формула (И) доказывает существование производной функции w=sinz и тот факт, что (sinz)' — cosz.
3*.3. Производная функции комплексной переменной. Условия Коти — Римана
337
Далее, находим
/eiz+e-izY 1 1
(cosz)' = l------I = -(e,z + e IZ)' = -f(eIZ-e IZ)=-sinz, (13)
т. e. производная функции w=cosz существует, причем (cosz)'~ —sinz.
sin z sh z
Дифференцируемость функций w=tgz=---------------------------------- и w=thz=- в точках
cos z ch z
71 /тГ \
и z/l -+nk Ji вытекает из «правила дифференцирования дроби», состоящего в следующем. Если Wi = Wi(z) и w2 = w2(z)— дифференцируемые в точке z0 функции и w2(zo)^0, то существует (wj (z)/w2(z))'|z=Zq, причем
/(z)\' = W1 (z) W2 (z) - ич (z) w'z (z)
\w2(z)/ (w2(z))2
Действительно,
lim 1 AMzo + Az) Wi(z0)\ km Wi (zo + Az)w2(zo)-w1 (z0) w2(z0 + Az)_
Az_0 Az\w2(z0 +Az) w2(z0)J az—*o Azw2(z0 + Az)w2(z0)
_ Um (^1 (zq + Az) - Wi (zp)) w2 (z0) + (z0) w2 (z0)- Wj (z0) w2 (z0 + Az)_
Az—>o Az w2 (z+ z0) w2 (z0)
wJzo + Az)-Wi(z0) , . ( xw2(zo + Az)-w2(zo)
----------- W2 (z0) - W1 (z0) -- Az-----------------------------------------------Az
az->o w2(z+z0)w2(z0)
_ w'l (zp) W2 (z0) - W1 (z0) W2 (Zq)
W2(z0)
Рассмотрим теперь логарифмическую функцию Lnz. Как известно,
Lnz=ln|z| +/Argz=ln|z| +z(argz+2&7i).
Если z^O, to в малой окрестности точки z однозначно определен argz— вещественное число такое, что
|z|cosargz= Rez, |z|sinargz = Imz, 0^argz<2Tt.
При фиксированном k получим функцию
ln(^)Z= ln|z| + z(argz+2Zc7i). (15)
Полагая z=x+iy и ln(fc)z=M4-w, находим u = -ln(x2 + y2), v = argz+2kn, где
x у
cosv = — -----sin г = -—- -. (16)
x/x2 + jZ2 x/x2 + J22
Для функции w=ln(A)z выполняются условия Коши —Римана. Действитель-ди X ди у
но, — = —----г, —=—z-------v и далее, дифференцируя равенства (16), имеем
дх х2 + у2 ду х2 + у2
338
Глава III*. Теория функций комплексной переменной и операционное исчисление
COSV • —=у (х2+у2) 3/2
2х\ х dv ху
2/ ^2^2 8х (х2+у2)3'2’
dv —у du
dx х2+у2 dy'
— sin г—=xf —^](х2Гу2)~3/2-2у; dy \ Ц
dv ху х du
dy (х2+у2)312 х2+у2 dx
Следовательно, функция ln(fc)(z) дифференцируема в каждой точке zeC, z/0 при любом keZ.
Следует заметить, что производная (1п(Л)г)' не зависит от к, поскольку функции ln(/c)z при различных к отличаются на постоянную, как это следует из равенства (15).
Так как ln(fc)z—дифференцируемая функция, то
. ч du dv х у 1
(lnwz) ' = — + ; — = - i - = -, (17)
dx dx x +y x +y z
/ \ 1 t. e. (Lnz)' = -. z
По определению, функция w = az (я/0) есть w=ez,na. При я/0 однозначно определен arg я и при фиксированном &eZ—логарифм 1п(Л)я. Функция w=ezln<fc)a дифференцируема, поскольку (z+Az)ln(k)a_ zln(k)a / Azln(k)a_ i\
lim --------------= lim е'Ч ----------- =
Az Дг_0 \ Az /
= Um ег1п№Д+^1п(^+о(А2)-1=ег^1п№)Д=аг
Аг—>0 Л Z
Наконец, функция w = za дифференцируема в силу того, что w=za = e“Lnz и для функции z=ealn<*)Z (где кеЪ — фиксированное число), имеем
a 1п(Л) (z+Az) a ln(k)z / a (lnfc (z+Az) - ln(k)z) _ i \
lim ----------------= lim eta«zI---------------------- =
Az—0 Az—0 у Az J
= lim cttl,w 1 + - -|П ft) (z+Az) ~ ln« z)+° ~lnw ~1
Az—0 AZ
==ocealnwzl=zot--=aza 1; . (18)
z z
здесь za означает ealn(fc)Z. Таким образом, функция za при z/0 дифференцируема и справедлива формула (z^'^az”-1.
Теорема 3. Если функции f(z) и g(z) дифференцируемы в точке z, то функции /(z)+g(z), /(z)g(z) также дифференцируемы в точке z, а функция f(z)/g(z) дифференцируема в точке z при условии g(z)/O.
Если функция w=f(z) дифференцируема в точке z, а функция z—g{y) дифференцируема в точке v и f(z) определена в окрестности точки z=g(v), то функция дифференцируема в точке v.
3*.4. Теорема Коши. Интегральная формула Коши. Ряд Тейлора 339
4 Доказательство. Утверждения о дифференцируемости функций /+g, fg и fig непосредственно вытекают из свойств предела.
Для доказательства последнего утверждения теоремы преобразуем выраже-/(g(v+А»))—/(₽(»))
ние lim ——------------> следующим образом:
Av—О Аг
lim /(g(v+A0-/(g(t>)) Um [/(z+Az)-/(z)]Az_
Av—>0 Ar Av—>0 Az Ar
/(z+Az)-/(z) g(i>+Ap)-g(t>)
= lim —----y----— lim —-------------=f (z)g («). (19)
Az—0 Az Av—0 Ar
Равенство (19) означает дифференцируемость функции /(g(r)) в точке г при условии, что Az и /(z) определена в окрестности точки z=g(r).
§ 3*.4. Интегрирование по комплексному аргументу.
Теорема Коши. Интегральная формула Коши. Ряд Тейлора
1°. Интегрирование по комплексному аргументу. Пусть в комплексной плоскости задана кусочно-гладкая кривая L с начальной точкой а и конечной точкой b(a, be С); пусть в каждой точке z кривой L определено значение /(z) функции f.
Рассмотрим предел
11)
/с=1
где z0 = a, zb z2, zn = b—точки кривой L, ck — точка, принадлежащая участку кривой с концами zfc_t и zk(k= 1, 2, ..., п); предел (1) рассматривается при условии, что разбиение кривой L точками z0, z15 ..., zn становится как угодно мелким, т. е. max | zk—zk _ х | ->>0.
Если предел (1) для функции f существует при любом способе стремления max|zfc—zfc-i| к нулю и любом выборе точек ск на участках zft_15 zk кривой, то значение предела (1) называется интегралом функции /(z) по кривой L от ь
точки а до точки b обозначается через j/(z)dz или j/(z)dz. Следовательно, L а
lim X f(c^(zk-zk-i)=\f(z)dz. к = 1 а
Теорема 1 (достаточный признак существования интеграла). Если функция f(z) непрерывна на кривой L, то |/(z)dz существует.
L
1 Доказательство. Пусть zeL и z — x+iy, f(z) — u(x, у>) + zr(x, у). По определению, вдоль кривой L имеем
ь
/(z)dz = lim X /(clt)(z*-z*_l)=lim £ (uk + ivk)(&xk + i&yk) (2)
J k=l k=l
где
Zk = xk + iyk, uk-bivk==f(ck), Axk=xk-xk-i, &Ук=Ук~Ук-1-
340 Глава III*. Теория функций комплексной переменной и операционное исчисление
Далее, находим ь * / п п \
/(z)dz = liml £ ukAxk-vkAyk + i £ vkAxk + ukAyk I. (3)
J \k=l k=l /
a
В силу определения криволинейного интеграла пределы сумм £ ukAxk — vkAyk ь ь
и ^vkAxk + ukAyk равны соответственно Jwdx — i>dy и fvdx + udy. a a
Известно, что для существования криволинейного интеграла вдоль кусочногладкой кривой достаточно, чтобы подынтегральная функция была непрерывна. Так как f(z) непрерывна по условию, то непрерывны и(х, у), v(x, у), и, п
следовательно, существуют пределы lim X ukAxk — vkAyk, lim£vkAxk + ukAyk, k= 1 n n
а значит, и предел lim J (uk + ivk)(Axk + iAyk) = lim X f(ck)(zk — zk- Д Последний k=l k=l
из этих пределов и есть криволинейный интеграл ff(z)dz.
L
2°. Свойства криволинейного интеграла
1°. Для любых ос, реС и любых двух функций f(z), g(z), непрерывных на кривой L, справедливо равенство
f (a/(z) + Pg (z)) dz = a J/ (z) dz+ Р f / (z) dz. (4)
a a a
2°. Если кривая L между точками а и с разбита на два участка: Lx от а до b и Ь2 от b до с, то
f/(z)dz= f/(z)dz+ f/(z)dz. (5)
L Lt l2
3°. Пусть L—кривая с начальной точкой а и конечной точкой b и L~ означает ту же кривую, но ориентированную противоположно, т.е. с начальной точкой b и конечной точкой а. Тогда
\f(z)dz= - f /(z)dz. (6)
L L
4°. Пусть M—максимум модуля функции f(z) на кривой L от точки а до точки Ь. Тогда
|J7(z)dz|^MZ, (7)
L
где I— длина кривой L.
2 Доказат ельство. Вдоль кривой L имеем:
ъ
Г п п
1°. (a/(z)+Pg(z))dz = lim X (a/(cfc)+pg(ct)) Azt = a lim X /(ct)Azt +
J k=l k=l
+ Plim X ^(сц))Агй = а /(z)dz+P g(z)dz. k= 1 J J
f 3*.4. Теорема Коши. Интегральная формула Коши. Ряд Тейлора
341
2°. f/(z)dz=lim £ /(с*)Дг4=1пп £ /(q) Az,c+lim £ f(ck)&zk =
J к=1 fc=l fc = «i + l
a
Z.
b
Здесь точки a = z0, z1? ..., zni = b и zni=b, z«1 + 1, zn = c разбивают участки кривой от а до b и от b до с.
п п Г
/(z)dz=lim X /(cJi)(z)i-zft_1)=-lim X /(c*)(z*-i-z*)= - /(z)dz.
к=1 к=1 J
lim £ f(ck)Azk <lim £ l/(c*)l|Azt|<lim £ M\Azk\=Ml. k=l k=l k=l
3°. Теорема Коши. Теорема 2 (теорема Коши). Если D — односвязная конечная область и f(z)—(однозначная) дифференцируемая в каждой точке zeD функция, то для любой замкнутой кусочно-гладкой кривой L, лежащей в области D, интеграл от f(z) вдоль L равен нулю, т. е. f/(z)dz = 0.
L
3 Доказательство. Пусть z=x+iy, w=u+iv=f(z) и x—x(t), y—y(t) —параметрические уравнения замкнутой кривой L. Тогда
и(х, y)dx — v(x, y>)dy+zJи(х, y)dy+v(x, y)djc.
L L L
К двум последним интегралам применим формулу Грина f Р(х, y)dx+Q(x, y)dy=^(^—^\dxdy, L D \C'X ОУ/
справедливую для кусочно-гладкого контура L, ограничивающего область D, и функций Р=Р(х, у), Q = Q(x, у), частные производные которых непрерывны в области D. Получим
Г \ {*(*( dv ди\ f f (ди dv\
/(z)dz= I --—— )dxd^+ I -—— Jdxdj. (8)
J JJ \ dx oyj JJ \ox oyj
L D D
Подынтегральные функции в правой части формулы (8) равны нулю в силу
условий Коши—Римана. Теорема Коши доказана при дополнительном
ди ди dv dv
предположении, что частные производные —, —, —, — непрерывны в D. дх ду дх ду
Доказательство теоремы Коши без предположений о непрерывности частных производных дается в более подробных курсах.
4°. Интегральная формула Коши. Пусть f(z)~ (однозначная) функция, дифференцируемая в односвязной области D, a L—кусочно-гладкая кривая, содержащаяся в области D вместе с областью D, которую эта кривая ограничивает.
342
Глава III*. Теория функций комплексной переменной и операционное исчисление
Тогда для всякой точки ZqeD имеет место интегральная формула Коши: ft 1 1
f (zo) = —; -----dz. (9)
2ni J z — Zq L
Кривая L ориентирована так, что при движении вдоль L в направлении ориентации область D остается слева (рис. 61).
Г / (z) f /'(z)
4 Доказательство. Интегралы ----------dz и ------dz равны при любом
J z— Zq J z— z0
L Se
e>0. Действительно, изображенная на рис. 62 замкнутая кривая £1? состоящая из кривой L, отрезка АВ, окружности Sf и отрезка В А, ограничивает область, „ . /(z) . .
в которой функция-----дифференцируема, поскольку точка z0 не принадлежит
Z~Zq
f f(Z)
этой области. Значит, -------dz=0. Далее, имеем
J z-Zq Lt
f* f (^0 г* f
Так как -----— dz= — -——dz, to -——dz+ -------------— dz = O и если в последнем
J Z Zq j Z Zq J Z Zq J Z Zq
AB BA L S£
интеграле изменить ориентацию окружности SE (тогда при движении в направлении ориентации круг, ограниченный окружностью Se, останется слева), то получим
L
(10)
Интеграл
-----dz можно вычислить следующим образом:
Z—Zq
[f(z) . f/(z)-/(zo) f/(zo) ,
-----dz= -----------dz+ ------dz.
J Z~ Zq J Z— Zq J Z Zq
S£ Se Se
(11)
f 5*.4. Теорема Коши. Интегральная формула Коши. Ряд Тейлора
343
При этом
f ——- dz =f (zo) f------------—f (zo)' 2л i.
J Z Zq J Z ^0
Se Se
(12)
Для первого интеграла в правой части равенства (11) получим
f/(z)-/(z0)
I----------az
J z~zo
se
^l/(z)-/(zo)l.. . 1 f|z.M f( ....
< —r-------TZ'ldzl = _ l/(z)-/(z0)l|dz|<
J Iz Zq I £ J
1
< Мг - 2ле = 2Me, 8
где Мг—максимум модуля функции f(z)—f(z0) на окружности Ss. Поскольку f(z) непрерывна, при 8->0 имеем f(z)->f(z0), т. е. Ме->0.
Из равенства (11) следует, что
(13)
----— dz=0, этот интеграл z-z0
Интегралы в правой части равенства (13) не зависят от с: первый в силу (10) равен f dz, а второй в силу (12) равен 2^z/(z0). Таким образом, РЦ—— dz J Z — Zq J z — Zq
L Sr
также не зависит от 8 и вследствие того, что lim £—*0
•Э£
тождественно по 8 равен нулю. Из равенств (10) и (12) вытекает формула (9).
Следствие 1. Всякая дифференцируемая в области D функция f(z) является бесконечно дифференцируемой, т. е. наряду с f'(z) существуют производные f"(z), f'"(z),...,fw(z) всех порядков «=1,2,3,... . При этом справедлива формула
/w(zo)=^ f, dz («=1> 2> 3> -)• (14)
2kzJ (z-z0)"+1
L
К п гг r /(Z1)“/(Z<>)
5 Доказательство. Покажем, что существует предел lim ------------, zx,
zi—z0 zx— Zq
ZqgD, где/(zx)=— f-^^-dz,/(z0)=— f — -dz. При этом область D является 2kZJZ — Zjl 2nZ*JZ — Zq
L L
односвязной, а замкнутая кусочно-гладкая кривая L целиком лежит в D и ограничивает область D.
Имеем
,. /(zj-ftzo) 1 f f(z) ( 1 Iх
lim ------------= lim «—-. -----1-------------
zi—zo Zi~ Zq z1-^z0ZT:IJz1—Zq\Z — Zi Z~Zq/
1
= lim —; zi—>z0 2л i
(z-zi)(z-zo)
dz= lim —. zi—z0 2 л i
~ /(z) ! /(z) _(z-z0)2 (z-zx)(z-zo)
/(z) ~ (z-z0)2_
dz =
344
Глава III*. Теория функций комплексной переменной и операционное исчисление
1 f A A.V f/7 » Z1-Z° Я
= -- 7-----\2dz+ 1,m Лг);-------w----й™
2jczJ (z— Zo) zi->z0J (z—Zi)(z—Zo)
L L
Последний интеграл стремится к a Zi —zo~>0. Таким образом,
нулю, поскольку
f(z)dz (z-zi)(z-zo)2
ограничен,
L
Рассуждая аналогично, можно доказать, что
/w(z0) = -- f, —v^rydz (я = 2, 3, ...), ' ' 2tC/J(z-z0)"+1 ' 7
L
т. e. справедлива формула (14).
Следствие 2. В окрестности каждой точки z0, где существует производная, функция f(z) может быть представлена сходящимся рядом:
/(z)=/(z0)+/'(zo)(z-z0)+C^(z-Zo)2+ •••+-———(z—z0)" + ... (15)
2! п\
6 Дока зательство. Покажем, что ряд (15) сходится в окрестности каждой точки zogZ>- Имеем
\ 1 RW я /(zo)=— --------du,
2ni J и — zG
sE
где —окружность радиуса 8>0 с центром в точке z0- Пусть z—такая точка, что |z— z01 < £• Рассмотрим геометрическую прогрессию
f(u) _ f(u) f(u) 1
и — z и — Zq — (z—Zo) (w —Zo) z—Zo
u — Zo
u—Zg\ u-z0 (u-Zo)2 («-Zo)" )’ V ’
Z-Zo которая сходится, поскольку ее знаменатель q =----- по модулю меньше
U-Zo
р „ /(«)
единицы. Разность между суммой прогрессии --------- и суммой ее первых
и—z
п членов Sn удовлетворяет неравенству
откуда следует, что
(П)
(18)
f 3*.4. Теорема Коши. Интегральная формула Коши. Ряд Тейлора
345
где I—длина контура L. Неравенство (18) означает, что последовательность
Г f f(u\
Sn(u\&u сходится к —— dz. Следовательно,
J J U—Zq
L L
/(“) dlJ V Г/(ц)(г~го)" u-zau Л) (a-Zo)" + 1
dw =
= L
n = 0
(f Ш
(u-z0)n+l
du\z-zoy=if-^
/ n = 0 ni
(z-z0)",
т. e. ряд (15) сходится к функции /(z) внутри круга |z—z0|<£, целиком принадлежащего области D.
Функция f(z), которую в некоторой окрестности точки z0 можно представить в виде 00
/(z)= £ a»(z~zo)", (19)
л = 0
называется аналитической функцией.
Доказанное выше свойство дифференцируемой в точке z0 функции f(z\ устанавливает аналитичность этой функции в точке z0. Если функция /(z) /(и)(г0) разлагается в ряд (19), то этот ряд задается коэффициентами ап=--------j—
(и = 0, 1, 2, ...), т. е. является рядом Тейлора функции /(z).
5°. Степенные ряды с комплексными членами. Известно, что для любого ряда an(z—z0)n существует вещественное неотрицательное число р такое, и = 0
что этот ряд сходится при |z—z01 < р и расходится при | z—z0|>p.
Число р (или символ оо, если множество Q неограничено) называется радиусом сходимости, а множество точек z таких, что |z—z0|<p,— кругом сходимости степенного ряда. 00
Для вычисления радиуса сходимости степенного ряда £ an(z~ zo)n удобно использовать следующую формулу:
р= lim
п—-ао
(20)
an+i
если этот предел существует.
С помощью формулы (20) можно найти радиусы сходимости рядов Тейлора для функций ez, sinz, cosz, ln(l+z), (l+z)“.
Ряды
оо -k oo / i\fc+l_2A—1 co /
у i у f________________ у (7.2- (21)
(2Л-1)! ’ k% (2k)l
сходятся соответственно к функциям ez, sinz, cosz при всех значениях z (т. е. р=оо).
Ряды
g (-ir1**, £ a(ot—l)...(a—fc+l)_fe
k=i fc = o 1 *2... k
п = 0 цироватъ внутри круга
346 Глава III*. Теория функций комплексной переменной и операционное исчисление
сходятся соответственно к функциям ln(l+z) и (l+z)a при |z|<l (для многозначных функций ln(l+z) и (l+z)“ в круге |z|< 1 можно выделить однозначные ветви с помощью условия — 7i/2<Arg(l +z)<n/2).
Степенной ряд ап (z~zo)n можно почленно интегрировать и дифферен-сходимости. Это означает, что если
X a„(z-z0)" = JF'(z), и = 0
(23)
то
b
b Г
Е ап^^-
„=о и+1
lz
(24)
Е ann(z-z0)‘
п = 0
(25)
Здесь fF(z)dz означает а
Ь и целиком принадлежащей кругу сходимости.
со
Вывод формул (24) и (25). Пусть ряд an(z—z0)n сходится в точке
п = О
и |zx — z0|<p. Как было доказано выше, этот ряд сходится при всех
z таких, что |z—Zol<l^i—-Zol, и Для всякого числа q такого, что |zi — z0|<#<p. Далее, так как lan(z—то
N
F(z)- Е «„(z-z0)‘
п = О
интеграл вдоль всякой кривой £, соединяющей точки
<7,
X ад'
n = N+l
Е kll«’i. n = N+l
В силу того, что l6Zw#"|->0 ПРИ А->оо, для всякого £>0 найдется такое N,
n = N+l
N
что при всех n>N справедливо неравенство F(z)— £ an(z—z^n <£. При этом
и=0
п+1
<г1,
(26)
И
7
О
а
а
о
а
где /—длина кривой £, соединяющей сходимости.
Неравенство (26) означает, что
точки а, b и принадлежащей кругу
b
а
lim
N—+оо
J F (z) dz,
(27)
X ап !
п = 0
а это эквивалентно равенству (24).
Докажем теперь справедливость формулы (25) почленного дифференцирова-00
ния ряда £ an(z~zo)n в круге сходимости. Так как при любом целом «>0 имеем п = 0
3*.4. Теорема Коши. Интегральная формула Коши. Ряд Тейлора
347
и + 1
<|a„(z-zo)"||z-zo|^|z-zo|2|««„(z-zo)"l,
то из абсолютной сходимости ряда X na(z—z0)n вытекает
п = 0
a„(z-z0)"+1 —----------. Поэтому
абсолютная
сходимость рядов X an(z~zo)n и X л = 0 п = 0 П+1
неравенства Pi>p>p2, где рь р, р2 — соответственно радиусы
” (z-z0)',+ 1
рядов X ап------—> Хм2”^) > \nan(z-z0)n \
л = 0 И+1
Покажем, что pi = p = p2. Для этого достаточно доказать,
- an(z-zQy^
В точке сходимости z ряда X —'----------- имеем
и = о л+1
справедливы
сходимости
что р2>Р1.
|n<7„(zj-Zo)" 4 =
апг
Zi — Zq
,2
такое,
где г— положительное вещественное число аиг«+1
ку Г<Р1, ряд У—-------- сходится и, значит,
д+1
ограничена, т. е. существует такое М, что
(28)
ЧТО |Zi—20|<Г<р1- Посколь-a„r"+1
последовательность --------
п-3-1
Z1 ~~Z0
М. Взяв q =
« +1
, из
равенства (28) получим
. . , и(я+1)
\nan(z-zQ)n |<7~2-----TiMqn l, 0<q<l.
(Zi-Zo)2
(29)
Ряд У -г-2------^Mqn+l сходится на основании признака Даламбера,
л = 0 (Z1 ~~Zo)
так как
lim
л—>оо
(И + 2)(”+1)М< + 2
п(п+1) (z, -z0)2
Mqn+l
— lim
n—»00
^(w + 2)(«+l) n (и+ 1)
1
n = 0
В силу неравенства (29) и принципа сравнения рядов
сходится и ряд
^„(zjl-Zo)"
т. е. p2^pi, а значит, pi = p = p2.
Согласно доказанному выше, ряд X ann(z — zо)'11 при \z — z01<р мож-л = 0
но почленно интегрировать. Это означает, что из равенства
00 оо Г
X z0)"-1=/(z) следует X an(z — zo)n= /(^)dz = F(z). Итак, сумма
п = О п = О J
zo
Z
ряда ^an(z—z0)n имеет вид F(z) = f f(z)dz и производная этой суммы F'(z)
го
со
равна /(z), т. е. сумме ряда X dnn(z — z0)n~1. Этим завершается вывод
п = 0
формулы (25).
348 Глава III*. Теория функций комплексной переменной и операционное исчисление
3*.5. Изолированные особые точки функции комплексной переменной. Их классификация. Ряд Лорана
1°. Изолированные особые точки. О пр еде ление 1. Точка zoeC называется изолированной особой точкой (однозначной) функции f(z), если существует такая окрестность точки z0, что функция /(z) определена и дифференцируема во всех точках этой окрестности, за исключением данной точки z0.
Если существует (конечный) предел lim f(z), то изолированную особую Z—-ZQ точку z0 называют устранимой.
Если lim/(z) = oo, то изолированную особую точку z0 называют полюсом. z—>0
Если предел lim/(z) не существует (и не равен бесконечности) то г—*zq
изолированную особую точку z0 называют существенно особой.
Пусть Zq--ПОЛЮС функции /(z). Говорят, ЧТО точка Zq является полюсом
кратности к (или полюсом k-го порядка), если существует конечный не равный нулю предел lim (z—z0)ft/(z).
z—>zo
2°. Ряд Лорана. О предeление 2. Пусть функция /(z) аналитична внутри кольца S—{z\r<\z—ZQ\<R}, где 0^г<1?<оо. Тогда существует и притом + 00
единственный ряд £ аь(z—Zo)k такой, что в каждой точке z, где r<\z—z0\<R, к= - оо
его сумма равна /(z):
f(z)=...+c-2(z-zo)-2 + c-1(z-Zo)~1-l-CQ + c1(z-Zo) + c2(z-Zo)2+... (1)
Ряд (1) называется рядом Лорана функции f(z) в кольце S.
1 Доказательство существования и единственности ряда Лорана. Аппроксимируем кольцо S односвязной областью Se, ограниченной линией L£ (на рис. 63 эта область заштрихована). Для точки zeS£ справедлива формула Коши:
(2)
При s—>0 интеграл по кривой Ьг
1
стремится к — 2тп
/(«) , 1 f
—— du----
u—z 2тп J
/(«)
—— du, где и—z
Рис. 63
Lr Lr
Lr и Lr—окружности с центром в точке z — zq и радиусами R, г, ориентированные так, как показано на рис. 63 (интеграл по кривой Ц в равенстве (2) есть сумма интегралов по LR, Lr и отрезкам А^В^, В2А2, сумма последних двух интегралов при £—>0 стремится к нулю). Итак,
/(«) . 1 f
—-—du-----
и—z 2ти J
----du.
u—z
(3)
Покажем, что интегралы в правой части равенства (3) можно предста-
3*.5. Изолированные особые точки и их классификация. Ряд Лорана
349
вить в виде ряда по положительным и отрицательным степеням z—z0. Имеем
f(u) = f(u) = f(u) 1
U—Z1 (u-z0)-(z1-z0) u-z0 1 z-z0
u-z0
/(ц)
U-Zq
zl~z0 [ u-Zq
~z0
(4)
2l~z0 и — Zq
в силу ТОГО, что
1 для ueLr, ряд (4) сходится.
f(u) Аналогично преобразуем ----- для ueL,.
u—z
= /(ц) = _ 1 /(«) u—z (u-z0)-(z1-z0) Zi-Z0 J »-z0
Z1 — Zq
так как
u-Zq
Z1 — Zq Интегрируя
Л»)
Z1 — Zq
Л U-Zq 1+------+
\ zl~ z0
U — Zq
Z\.—ZQ,
U — Zq
Z1 ~ z0,
< 1 для z e Lr, то ряд (5) сходится.
равенства (4) и (5), получим
1
2л/
/(«) я V ( 1
----du= У I —.
Z k = о \^Л i
I
U — Zi k = Q
(5)
f(u) л U
(^r7J(z“Zo)’
(6)
(7)
1
2 л i
Интегралы -------^-rrdz и If (и) (и—z0)ftdw равны соответственно 7——TTrydz
J (м-Zo) J J(w-^o)
sR sr г
и /(w)(w—z0)dw, где Г—произвольная окружность с центром z0 и радиусом г
р (г^р^Л).
Из равенств (6) и (7) с учетом сделанного замечания имеем
где
1 f /(ц) . 1 f /(») .
=— —^-t-du-------—!-!-du=
2ni J u—zr 2лi J u—Zi
Sr sr
= C0 + Cl(z —z0)+ ... +ct(z — z0)k+ ... +
+ c-i(z-z0)_1 + c_2(z-z0)-2+... +C-k(z—z0)-,:+...,
Ck=f. [/(«)(«-Zo) k 1dz.
(8)
(9)
Z-Zq
1
Q =--
2ш
350 Глава III*. Теория функций комплексной переменной и операционное исчисление
Итак, всякая аналитическая в кольце S функция разлагается в ряд (1) с коэффициентами (9).
Разложение функции f(z) в ряд (1) единственно; это означает, что в любом разложении (1) коэффициенты ск такие же, как в (9). Действительно, если + 00
/(z) = Е cs(z-z0)s, ТО
S= - 00
/(z)(z-z0)“'l"1 = X cs(z-z0)s“'‘_1.
s= — 00
Отсюда получим
-Ц f/(z)(z-z0)"‘_1dz=-i; £ cs f(z-z0)s"‘‘“1dz. (10)
2ft i j 2ftis-_O0 J
г г
1 г . .
При этом, как известно, среди интегралов — I (z—z0)p dz (р = 0, ±1, ±2, ...) 2 л i J г
только один отличен от нуля (в случае р= — 1); он равен — 2ти *
Следовательно, в правой части равенства (10) имеется только одно ненулевое слагаемое, а именно ск, значит,
/(z)(z“zo)“'‘“1 dz-г
Таким образом, для всякого разложения вида (1) его коэффициенты определяются формулой (9).
§ 3*.6. Вычеты. Основная теорема о вычетах
Определение. Пусть z0— изолированная особая точка функции /(z) + 00
и /(z)=* X ck(z—zQ)k—разложение функции f(z) в ряд Лорана в окрестности к= — оо
точки z0. Коэффициент c-t в этом разложении называется вычетом функции f(z) в точке Zq и обозначается ResZo/(z).
Теорема (основная теорема о вычетах). Пусть (однозначная) функция f(z) аналитична в области D, за исключением изолированных особых точек, а замкнутый контур L принадлежит вместе со своей внутренностью области D, содержит внутри себя конечное число особых точек zb z2, ..., zk и не проходит ни через одну из них. Тогда имеет место равенство
f k
lf(z)dz = 2fti X ResZi/(z)« (1)
L
1 Доказательство. Как видно из рис. 64, интеграл J/(z)dz равен сумме L
интегралов f/(z)dz (j= 1, 2, ..., к) вдоль малых окружностей в направлении, Lj
указанном стрелками. Это утверждение вытекает из того факта, что контур L, отмеченный на рис. 64 пунктиром, ограничивает область D, в которой
3*.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
351
функция f(z) аналитична, в силу чего f/(z)dz = 0. На участках кон-L
тура АГВГ, В2А2; А3В2, В^А^ и т. д. интегрирование ведется по одинаковым кривым, но в противоположных направлениях. После взаимного уничтожения этих интегралов получим равенство
f/(z)dz+ X f/(z)dz=O
J j=i J
L Lj
ИЛИ k Г f/(z)dz= £ |/(z)dz=0 (2) L j=1J
Lj
X
Рис. 64
в случае другой ориентации окружности Lj.
Как было показано выше,
ResZ1/(z) = c_1(zt)=-J-. |/(z)dz. (3)
L,
Из соотношений (2) и (3) вытекает равенство (1).
§ 3*.7. Преобразование Лапласа. Основные теоремы об интегралах и изображениях. Формула обращения интеграла Лапласа.
Свертка функций. Интеграл Дюамеля
1°. Преобразование Лапласа. Определение 1. Пусть f(t)— функция вещественной переменной г, равная нулю при Z<0, a g(p)—функция комплексной переменной р, определенная равенством
со
?(p)=f (1)
О
(предполагается, что интеграл (1) сходится). Соответствие /(/)->£(/?) называется преобразованием Лапласа [функция f(t) преобразуется по Лапласу в функцию £(/>)]. При этом функцию f(t) называют оригиналом, a g(/>)— изображением.
Функция f{t) вещественной переменной t, определенная на [0, оо [, непрерывная на этом множестве за исключением конечного числа точек разрыва первого рода на каждом конечном интервале и удовлетворяющая условию \f (t)\<Mest для некоторых постоянных М и s, называется функцией конечного роста, а нижняя грань 50 множества чисел s, удовлетворяющих указанному неравенству при некотором М, называется показателем роста, со
Если f(i) — функция конечного роста, то интеграл определен
о
при ReДействительно,
I е " ptf(t) | < ] е ~(Re р) V0' |=е ~ Rep}1=е ~ at (а > 0), что обеспечивает сходимость несобственного интеграла.
352
Глава III*. Теория функций комплексной переменной и операционное исчисление
2°. Свойства преобразования Лапласа. Теорема 1 (об аналитичности изображения). Если f(t)— функция конечного роста с показателем роста s0, то преобразование Лапласа g(p) этой функции является аналитической функцией комплексной переменной р при всех р таких, что Re/?>50.
1 Доказательство. Покажем, что производная g'(p] существует и выражается формулой
со
s' (р) = f - te ~ At, (2)
О
где интеграл в правой части равенства (2) определен в области Re/?>50, a tf(t) является функцией конечного роста.
Для этого достаточно доказать, что несобственный интеграл (2) можно интегрировать по параметру р, т. е. что
Р2 / <Х> СО
f f-/e-₽‘/(/)ck)dp=f e-₽‘/(r)dr|?:K,
Pl \o 0
(3)
где pr, p2 — некоторые комплексные числа и интегрирование ведется вдоль гладкой кривой, лежащей в области Rej>>5o-
Имеет место неравенство
I - ptf (t)\< Mte~SlteSot ^MtQ (4)
для всякого вещественного Si такого, что Re/>>5i>50- При этом несобственный со
интеграл J h (/) dz сходится; действительно, о
/ x Ze Л(
Be’^rd/= — M------
—5o
0
0
0
е л'о)1 = —У------ < оо. (51 -So)
М I (aj ~50) J О
Вообще, рассмотрим несобственный интеграл, зависящий от параметра:
(5)
(7)
со
сходится. Тогда
о
(8)
(9)
$f(t,p)dt. (6)
о
Пусть f(x,p)^O и существует функция F(x) (мажоранта) такая, что F(x)^f(x,p)
для всякого р в пределах а интеграл
сходится и интеграл (6). Положим теперь
J/(f,p)dz=/(p), О
J F(z)dz= F. О
f 5*.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
353
В этих условиях справедлива формула
оо /Рг \ Р2 ~
fl f/(zi/’)dp)dz=f/(p)dp.
О \Р1 / Р1
Действительно, из неравенства (7) следует
N оо
l7(Z’)-f/(',/’)d^|f-f F(0l О о
и далее
Рг N Рг оо
f l7(/')-f/(^/’)dz| dp^f |/-f P(z)dz|d/>< Pi 0 Pi о
P2 N /Р2 \ 00
< J7(p)dp-fl f/(z,jp)d/>jdz<|F-f ^(zfdzIZ, (10)
Pi 0 \P1 / 0
где I—длина кривой с конечными точками р19 р2, вдоль которой ведется интегрирование.
Так как правая часть неравенства (10) стремится к нулю при 7V->co [в силу сходимости интеграла (9)], то стремится к нулю и левая часть (10); отсюда
N /Рг \ Р2
lim 11 f /(z> P)dP )d?= f J\p)dp
N~°° 0 \p. / Pl
и по определению несобственного интеграла оо /Рг \ Рг /со \
f ( f/(Ap)dp)dz=f I f/(z,p)dzldp. О \Р1 / Р1 \0 /
Из доказанного с учетом неравенств (4), (5) следует
со /Рг \ Рг /со \
f I f-(/'(Oe~','dJp)dZ=f If— te~p,f(t)dt}dp
О \Р1 / Pl \0 /
или ОО Р2 Р2 / 00 \
fe-'” /(z)dz=f I f —ze-p,/(z)dz Idp. (11)
0 Pl Pl \o /
oo
Функции g(p) и f e~ptf(t)\p dr отличаются (при постоянном р±) лишь на о 1
00
постоянную. Но функция f e~p//(Olpi^^ имеет производную, равную о
d dp
(12)
Равенство (12) получено с помощью формулы (11) и теоремы о дифференцировании интеграла по переменному верхнему пределу. Таким образом, 00
функция g(p)=f дифференцируема в каждой точке р, для которой
о
Rep>50-
12 Мантуров О.В.
354 Глава III*. Теория функций комплексной переменной и операционное исчисление
Теорема 2 (основные свойства преобразования Лапласа).
1°. Свойство линейности. Если gi(/?) и g2(p)— изображения, соответствующие оригиналам fi(t) и fiit), т. е. LfY(t)=gi(pj и Lf2(t)=g2(p), то
L (а/1 (0 + РЛ (И) = (р) + ₽Я2 (р)
для любых комплексных чисел а, р.
2°. Свойство подобия. Если Lf(t)—g(p), то Lf(at)=-g(~), а>0.
3°. Свойство запаздывания. Если Lf(t)=g(p), то Lf(t—b) = e~pbg(p), b>0.
4°. Свойство смещения. Если Lf(t)=g(p), то £[е “*/(/)] =g(p+а), аеС.
5°. Дифференцирование оригинала. Если f(t)—функция конечного роста с показателем роста sG и Lf(t)=g(p), причем при Z>0 существует производная f'(t) (также имеющая конечный рост), то
Lf'(t)=pg(p)-f(0), Rep>s0,
где /(0) = lim/(z); кроме того, если f", f", существуют и имеют
конечный рост, то
Lf"=p2g(p)-pf(0)-f’(py,
Lf"(t)=p3g(p)-p2f(())-pf(0)-f"(()y, ...
Lfw(t)=png(p)—p"~lf(O)—p"~2f'(p) —-
6°. Дифференцирование изображения. Если f(t)—функция конечного роста с показателем роста s0 и Lf(t)=g(p), то L(—tf(t))=g'(p) для р таких, что Rep>SQ.
7°. Интегрирование оригинала. Еслиф^)—функция конечного роста t
с показателем роста sQ и Lf(t)=g(p), то F(t) = \f(u)du—также функция о
, р/л g(p) конечного роста и LF\t)=---.
Р
8°. Интегрирование изображения. Если Lf(t)=g(p), то 00 00
L= Jg (z) dz (при условии, что е ~pt^~~ dz сходится).
р °
2 Д оказательство. Свойства 1°—5° непосредственно вытекают из определения преобразования Лапласа:
00 00 00
1°. f е"'*(а/1 (z)+P/2 (r))d*=a f е“'71 (/)dz+p f e^p'/2 (z)d/=ag1(p)+pg2(p). 0 0 0
oo co
2°. I e~ptf(at)dt= I e Paf(u)—=-g\ - | (использована замена переменной J J a a \aJ
о о
u—at).
3°. f e~pt/(/—Z))dz= f Q~p{u+b}f(u)du = Q~pb J Q~puf(u)du=Q~pbg{p) (сделана о ь о
замена переменной u=t—b и учтено, что /(/) = 0 при /<0).
j* 3*,7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
355
4°. fe P^z=f/(Oe (r+ct)* dr=g(/?+a).
о о
оо со со
5°- f e“'7''(f)df=e_p7(/)|S’-f/(z)(-p)e"'’'dZ= -/(0)+Р ^'rtf(t)di^pg(p)-О О о
—/(0) (использована формула интегрирования по частям).
6°. Согласно теореме об аналитичности изображения, функция g(p) = со
= J e-pf/(/)dz дифференцируема и ее производная находится по формуле (2): о
со
^'G’)=J(-/)e-"7(z)dz О
при р таких, что Re/;>50, где —показатель роста функции /(г). Тем самым справедливость свойства 6° установлена.
t
7°. Покажем сначала, что f/(w)dw—функция конечного роста. Дейст-о
вительно, t t t
f Г f M 1
| /(w)dw|< 11/(/)|d/< MesoMdw=—eso“
J J J so 0
ООО
t
где Далее, применяя к функции J/(w)dt/ свойство 5°, получаем
о
g(p) = Je p,f(t)dt=pL($f(u)du)-$f(u)du\l=0=pF(p). О 0 0
Итак, F(p)=- g(p), где g(p\ F(p)—изображения функций f(u) и f/(/)dr. Р о
8°. Пусть функция конечного роста и L j — F(p). Тогда, согласно свойству 6°, Lf(t)~ — F'(р\ т. е. g(p}= — F'(р), g(p) — изображение
функции /(/).
Интегрируя последнее равенство в пределах от р до и, имеем и
\g(z)dz = F(p) — F(u} и далее, переходя к пределу при я—>со (так, чтобы р .
Rew->oo), получим
lim $g(z)dz = F(p)— lim F(u). W—*00 n—*00
p
Следовательно,
]g(z)dz=F(p), (13)
p
поскольку limf’(w) = 0. В самом деле, так как F(u) есть изображение функции и—*00
Я?)
—у- конечного роста, то
12*
356
Глава III*. Теория функций комплексной переменной и операционное исчисление
1^)1 =
~utdt
dt<
t , M
Л/е5о*|е Mt|d/=------, где s=Reu.
s-s0
(14)
Правая часть неравенства (14) стремится к нулю при s-+co; значит, F(u)-+O при Rew->oo. Итак, формула (13) доказана.
О пр еде ление 2. Пусть a(t) и b(t}—кусочно-непрерывные функции действительной переменной /, определенные на ]—оо, +оо[, и a(t)=b(t) = 0 при Z<0. Сверткой функций a(t) и £>(/) называется функция c(t), определенная равенством t
c(t) = \a(t—x)b(x) dr.
о
Свертку функций а (Г) и b(t) обозначают через a*b(t). Операцию вычисления свертки называют свертыванием.
Теорема 3 (об умножении изображений). Если f2—функции конечного роста такие, что Lf1(t)=g1(p), Lf2(f)=g2(p)9 то Lf1^f2(t)=gi(p)g2(p>). 3 Доказательство. Имеем
La^b— \z~pt a*b(t)dt= f e-ptf a(x)b(t—r)drdz = lim Je-pt(ffl(T)Z>(Z—T)dx)dz. 0 0 0 о 0
Далее, находим
Nt NN
Je“pt(fa(T)Z>(Z—t) dr = j 6z(z)(f Q~ptb(t—r)dz)dr =
0 0 От
N N-r
= J«(t)( J е-р(т+м)Z?(w)dw)dr. (15)
о о
Здесь сначала изменен порядок интегрирования в повторном интеграле, а затем сделана замена переменной t—x+u.
Продолжая цепочку равенств (15), получаем
N N-x N N-т
fe“pt( f a(x)b(t—T)dr)dz=fя(т)е-рт( f e~pub(u)du}dx = оо оо
NN NN
= fe~px a(x)dx $e~pub(u)du—fе-ртя(т)бт J e~pub(u)du. (16) 0 0 0 N-T
N N
Произведение интегралов |е~ргя(т)бт J e~pub(u)du стремится к нулю О /V-т
при N^»co. Действительно, так как a(t), b(t)— функции конечного роста с показателем роста s0, то N N N оо
| Jе~ртб?(т)dT f c~pub(u)du\<\Mq~pxqs^xdx f M1e~pMesoMdw =
0 N-r 0 ^-т
N Г q-(P~Sq)(N-x)
= MMr I e-(p~so>TdT---------
о
P-s0
5*.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях 357
Последнее выражение стремится к нулю при TV—>оо, р—so>0 вследствие того,
N е-(p~s0)(N-t)
что fe“(p“so)xdT — ограниченная величина, а------------->0 при N-+оо.
о P~so
Возвращаясь к равенству (16) и учитывая, что
N N
Jе~рх a(y)di: f е~ри b(u)du^»0 при N-+co, получим
О N—c
lim f e~pt( f a(y)b(t—T)dr)d/ = f e“^(f a(y)b(t—T)dr)d/= 0 0 0 0
= J e~pxfl(?)dT J e~pu b(u)du, о 0
чем и завершается доказательство.
Теорема 4 (интеграл Дюамеля). Пусть fi(t)—непрерывная, a f2(t)— непрерывно дифференцируемая на [0, оо[ функции конечного роста такие, что fi(t)=f2(t) = $ при t<0 и Lf1(t)=gi(p\ Lf2(t)=g2(p). Тогда имеет место равенство
L(f/i &)f'2 (t-u)d«+/i (t)f2 (0))=pgr (p)g2 (p). 0
4 Доказательство. В силу теоремы об умножении изображений t
L^f1(u)f2(t-u')du)=g1(p)g2(p), о
а согласно свойству дифференцирования
L(jfi(u)f2(t-u)du)=pg1(p)g2(p), о t
поскольку значение функции f/i (u)f2 (t—и)du в нуле равно нулю, о
Покажем, что
(f/i^)/2a-«)^)'=f/1(^)/,2G-^)dw+/1(OA(0). (17)
о о
В самом деле, для гладких функций f(t), F(t), <p(t,u) имеет место общая формула
( J ф(г, u)du)t= f u)du+<p(t, (18)
f(t) fit)
Чтобы убедиться в справедливости равенства (18), рассмотрим приращение
F(t + At) F(t)
AZ= f ф(Л-Аг, u)du— J ф(/, u)du (19)
/(t + At) f(t)
С точностью до бесконечно малых более высокого порядка малости, чем Аг, приращение (19) имеет вид
F(t) + F'(t)At f(t)
j (ф(/, м) + ф'(г, w)A?)dw+ J ф(г, м) + ф'(/, w)Azdw +
F(t) f(t) + f (OAt
358
Гласа ///* Теория функций комплексной переменной и операционное исчисление
Fit) Fit)+F'it)bt fit)
4- f ф'(Л w)Azdw = J ф(л u)du+ f ф(л u)du +
fit) Fit) fit) + f'it)At
Fit) F(t) + F'(t)At fit)
+ ( f ф'(л u)du) At+ [ f ф'(л u)du+ j ф'(л w)di/] Az. A (l) Fit) fit) + fit)M
Так как
F it) + F’ it) At fit)
lim f (р(Л u)du = O, lim f ср(Л w)dw=O
AZ“*° Fit) ЛГ~*° fit) + f’ it) At
И
Fit) + F' (t) At f ср(Л и)du lim -------------------=<p(r, F(Z))-K(Z),
At—о Д/
F(t) + F' (t) At j cpfz, u}du lim -------------------=-<?it,fU))-fit),
At—О А/
го получаем Fit)
M f
lim —= ф(Л F(t) — <p(t, f(t)+ ф'(Л u)du,
At—о А/ J
fit)
вследствие теоремы о производной определенного интеграла по верхнему пределу и правила дифференцирования сложной функции. Таким образом, справедливость равенства (18) установлена.
Равенство (17) следует из формулы (18) как частный случай при F(z)=Z И /«) = 0-5 Пусть задано линейное отображение
H-.fit)-h(.t), (20)
сопоставляющее функциям действительной переменной Z(/e [0, со [) функции гой же действительной переменной так, что
Hf(t—a) = h(t—a\ а>0.
(21)
В изучении таких отображений важную роль играет функция #(z), соответствующая функции
Z>0;
Z<0
(22)
при преобразовании (20). Функция e(t) называется функцией Хевисайда.
Функцию Hf(F) можно описать с помощью функции e(t— а) следующим образом.
Разобьем отрезок [0, Z ] числовой оси на п равных частей точками деления zo = 0, Z1? Afc= [4-ь tk [ и аппроксимируем функцию J (z)
ступенчатой функцией fn (t 1), xeAfc, k—1, (рис. 65). Очевидно, что
Л(0-/о^(0 + СЛ-/о)^(^-А) + (/2-Л)е(/-2А)+ ...+(/„-1-/„-2)e(Z-(«-l)A).
П ри этом
3*.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
359
я7„(/)=/ов(О+
fc=l
Если и->со, то, учитывая равенство А-Л-1=/'(Ск)А, получаем Я/0)=/(0)й(0+}/' (т)«0-т)<1т.
О
Теорема Дюамеля устанавливает связь преобразования Лапласа функции Hf(t) и функций a(t), e(t).
Линейное отображение (20)
при условии (21) реализуется в те- Рис. 65
ории электрических цепей. Для вся-
кой цепи определено отображение: функции /(?), описывающей электродвижущую силу, соответствует функция описывающая установившийся
в цепи ток. В связи с этим теорема Дюамеля находит широкое применение в расчетах электрических цепей.
3°. Формула обращения преобразования Лапласа. Теорема 5 (обращение преобразования Лапласа). Пусть функция f(t) обладает следующими свойствами: при t<0; 2) на любом конечном интервале f(t) является
кусочно-гладкой функцией', 3) f(t)— функция конечного роста, т. е. существуют М>0, SqgR такие, что \f(t)\<Mesot. Тогда
c + iao
I ^F(p)dp,
2л J
c — ioo
(23)
00
где c>s0, F(p)= J e~ptf(t)dt, и интеграл (23) понимается в смысле главного о
значения.
+ оо N
Главным значением интеграла f f(x)dx называется lim f /(x)dx, в то N—>оо — оо — N
+ оо M
время как f f(x)dx означает lim (/(x)dx, где M и N стремятся
M—>o0 + ю
к бесконечности независимо друг от друга. Если существует f /(x)dx, то
- 00
+ 00 + 00
существует и главное значение f f(x)dx. Обратное неверно: например, J xdx — 00 - со
М
равен нулю в смысле главного значения, но не существует как lim f xdx.
М-ео _N
N—-oo
6 Доказательство теор емы 5. Из теории интеграла Фурье известно, что для абсолютно интегрируемой и кусочно-гладкой на каждом конечном участке числовой оси функции f(t) справедливо равенство
360
Глава III*. Теория функций комплексной переменной и операционное исчисление
I + ОО + 00
Л0 — f е^( J e"“W)dW)dco,
(24)
где внешний интеграл понимается в смысле главного значения; формула (24) имеет место для всех t, при которых функция /(г) дифференцируема.
Рассмотрим вспомогательную функцию <р (О —е s>sG. Функция
<р(г) удовлетворяет условиям, при которых справедлива формула (24), т. е.
<p(O=z-2ти
J eI0)Z O(co)dco,
(25)
1
где Ф(о)=|е l<otcp(r)d/. В последнем интеграле в качестве нижнего предела о
взят 0 вместо — оо, поскольку <р(г) = О при /<0.
Далее, имеем
У е -<р (t) dt = f e -e ~af(t) dt = J e "<s+iM) '/(Г) dt. 0 0 0
Обозначим /? = c + zco
и g(p)=fe pz/(r)dz. Так как O(co)=g(/0, то о
eIC>tg(c + za)/)d(o
(26)
и, следовательно,
Л0=^
2л
J e(c + l‘<o)ig(5_|-fco)(]CO.
(27)
Это означает, что
(28)
чем и завершается доказательство. Интегралы (25) — (28) рассматриваются в смысле главного значения.
Теорема 6 (единственность обращения). Если две функции j\(t) и /ИО» удовлетворяющие условиям теоремы 5, имеют одно и то же изображение g(p), то функции fr(t) и f2(t) совпадают во всех точках t, где обе функции дифференцируемы.
7 Д оказательство. В точке t, где функции fr (t) и f2(t) дифференцируемы, имеют место формулы
+ оо 4-оо
/1(0=2-. f e',‘g(p)d^, /2(О=2-. j eptg(p)dp.
2тп J 2ттг J
— 00 — 00
(29)
Так как правые части формул (29) одинаковы, то
J> 3*.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях 361
4°. Оригиналы с рациональными изображениями. Теорема 7. Всякая правильная дробно-рациональная функция является изображением.
8 Доказательство. Из курса алгебры известно, что всякую правильную дробно-рациональную функцию можно представить в виде суммы дробей вида
А Ар + В А Ар + В
Rr=—, 8l=-^——^—^, Rk=-^^-k, Sk=-^Z^b2^’ *=2,3,...
Как было установлено выше,
1 b р
Lqm —-----, Lsinbt=-^---г, Lcosbt=—-----. (30)
р—а р +b р +Ь2
Отсюда следует тождество
t В+Аа Ар-\-В
L(Ae cos bt-\--— е sin bt)=-----=—-=. (31)
b (p—aY + b2
Для любого k > 1 имеем
A A 1 1
------г—------ь—г'----’ Bk — Br—1'---, (3 2) (p-a)k (p—a)k~l p—a ‘ p-a
Ap+B^ = Ap + B^_______I = 1 z33x
((p-a)2 + b2Y ((p-a)2 + b2)k~1 (p-a)2 + b2’ * k 1 (p-a)2 + 62
Если Rk-i и Sk-i—изображения, то в силу формул (32), (33) и теоремы об умножении изображений Rk и Sk также являются изображениями. Функции Rr и являются изображениями в силу формул (30) и (31).
Таким образом, данная теорема доказана индукцией по к (начало индукции—формулы (30), (31), шаг индукции — формулы (32), (33) вместе с теоремой об умножении изображений). Более того, показано, что оригиналы, соответствующие изображениям А(р)1В(р), где А(р)1В(р)—правильная дробно-рациональная функция, являются гладкими функциями, поскольку свертка гладких функций соответствующая произведению изображений
gi (р) g2 (р), является гладкой функцией.
Теорема 8. Пусть А(р)1В(р) — правильная дробно-рациональная функция; р19 p2,...,ps—полюсы этой функции, имеющие кратности rt, r2,...,rs. Тогда оригинал f(t), соответствующий изображению g(p) = A(pYB(p\ имеет вид
X 7-----77 llm r. , \(Р~РкУке TTTf- <34)
k=i fa-i)! o^i’k dpr*-i ( B(p))
9 Доказательство. Для правильных дробно-рациональных функций справедлива формула обращения (28), т. е.
(35)
где f(t) — оригинал, соответствующий изображению A(pYB(p), и c>Repk (k — 1, 2, ...,s).
362
Глава III*. Теория функций комплексной переменной и операционное исчисление
теграл в правой части разобьем на
Интеграл (35) можно найти, используя понятие вычета. Рассмотрим замкнутую кривую LN, состоящую из отрезка, соединяющего точки c—iN и c+iN, и дуги окружности SN с центром в точке р = 0 и радиусом R, равным J'N2 + с2, где Rep—c<d
(рис. 66).
Согласно теореме о вычетах, имеем
1
2л z
fe<,i"4^--dp= У res -
J в(р)р Д Р=Р‘
ln
е"А(р) В(р)
(36)
(интегрирование ведется в направлении против движения часовой стрелки). Ин-сумму двух слагаемых:
1 Г 1
— Qpt---------dp = —
2л z J В(р) 2rcz ln
с + iN
c-iN
e₽<^dp+± В(р) 2ni J
SN
e-^dp. В(Р)
(37)
Покажем, что
lim
N—*oo
ep‘d^dp=o. B(p)
(38)
Разобьем дугу окружности SN на
и МВ. Пусть максимум функции
четыре части— дуги А К, КЦ А(р)!В(р) на дуге окружности
LM Sn-
Оценим интеграл
KL
/2 = ^(cos(p + zsin(p). Поэтому
Л(р) е —т~:&Р-В(р}
Для точки р на имеем
| Rt — л
=MnR е л d(|/=Afw — (1-е-*').
-п/2
(39)
Здесь было использовано неравенство 1 — (2/л) ф > cos ф при л/2^ф<л и произведена замена переменной ф = л/2 —ф.
Так как рациональная функция А(р)1В(р) является правильной, то при N-+C®. Следовательно, из равенства (39) вытекает, что
§ 3*.7. Преобразование Лапласа. Осн, теоремы об интегралах и изображениях
363
lim I ept dp = O. J B(p} P
KL
(40)
Оценим теперь интеграл
f P^(p) тл ер -----dp. Имеем
J В(р)
АК
АК
e’^dp В(р)
(41)
^MNectl(N),
где l(N)—длина дуги А К. Поскольку /(7V) ограничена при А->оо, из неравенства (41) следует
lim j ept—— dp = 0. n-*°o J B(p}
AK
Аналогично можно показать, что
lim f ept ^-^dp = 0, V->co J B(p)
LM
lim f e₽< ^-Up=O.
J B(p) P
MB
Равенства (40), (42), (43) означают, что
lim fepZ^-^dp = O.
N—°° J B(p)
SN
Вернемся теперь к равенству (37). Его правая часть стремится к
1
2 л i
c + i<x>
J
Левая часть равенства (37) не зависит от N и совпадает с правой частью равенства (36). Как было доказано ранее, вычет функции g(p) в полюсе рк кратности гк находится по формуле
R“-’A-dn)i d sM1 (r-p‘),ksu’>-
Следовательно, правой части равенства
(36) можно придать вид
S
Е Resp=pfc fc=i
QPt А^= у В(р)
1 Г Z V, »tA<^
------- lim ------(р — рк ) rk ept--. (rfc—1)! р—dpr*-i PkJ В(р)
(45)
Итак, в силу (44) и (45) справедлива формула (34).
Глава IV*
ОСНОВНЫЕ ЧИСЛЕННЫЕ МЕТОДЫ
§ 4*.L Приближение функции методом наименьших квадратов
1°. Метод наименьших квадратов. Пусть дана функция /(х), определенная на отрезке [а, b ], и точки хх=а, х2, ...,xn = b (Xi<xi+1; f=l, принадлежащие
этому отрезку. Далее, пусть ф(х, Ср С2,..., Сш) — m-параметрическое семейство функций, определенных на отрезке [а, b ].
Рассмотрим следующую задачу: найти минимум функции
*(G> с2,...,с„)= £ 1Ж)-9(*,> Q, c2,...,cm)|2. (i)
i=l
Особое значение имеет случай
ф(х, Ср С2, •••> Ст) = С1ф1 (х) + С2ф(х2) + ••• + Стф(хж), (2)
когда R(C19 С2, •••, Ст) принимает вид
C2,...,Cm)= £ ...-Cm(pm(Xi)y. (3)
Для того чтобы функция (3) имела в точке (С?; минимум,
необходимо, чтобы в этой точке выполнялись условия
dR dR dR
----= 0, = 0,...,- dCY dC2--------------------dC
Условия (4) в развернутом виде таковы:
dR " г
—=2 X [/(х<)-С1Ф1(х,)-С2<р2(х()- ... -Cw<Pm(xi)]<p/xi)=0; (5)
i=l
j= 1, 2,
1 Введем обозначения у, xt, х2,-,хй для упорядоченных наборов чисел /=(/(Х1)> /(х2)>->/(х„))> х/=(фу(х1), g(x2),-,<Pj(x„)) (J=l,
и определим скалярное произведение в пространстве R” упорядоченных наборов из п чисел формулой
(а, Ь)= £ акЬк, (6)
к=1
4*. 7. Приближение функции методом наименьших квадратов 365
где а—(аи а2, b — (bu Ь2, ...,Ьп). Тогда условия (6) можно толковать
следующим образом: если набор чисел С?, С2,С ° реализует минимум функции (1) [что эквивалентно условиям (4)], то вектор у—— С2х2— ... -С°тхт ортогонален в смысле скалярного произведения (6) всем векторам х15 х2,...,хт. Действительно, условия (4) совпадают с условиями
(у-С^-С^-... -С°тхт, х,) = 0 (/=1, 2,..., т). (7)
Таким образом, вектор у — C°xt — С°х2 — ... — С;’„хт является ортогональ-ной в смысле скалярного произведения (6) проекцией вектора у на подпространство, порождаемое векторами х2, ...,хш.
В описанных выше обозначениях значение функции R(C\, С2,...,Сп) равно квадрату длины вектора у—С1х1 — С2х2—...—Стхт.
Применяя к треугольнику, построенному на векторах у, х1 + С2х2-У ...
... +C£xw, теорему Пифагора, имеем
Я(С?, С°2,...,С°т)=(у, у)-(С°1х1 + С2х2+ ... + С°тхт, С?*,+
+ С°2х2+ ... +С°хт)=(Я,Я)+(Я-С?х1-С§х2- ...-С°тхт, С?х1 + С?х2 + ...
...+С°тхт)-(у,С°1х1 + С°2х2+...+С°тхт), (8)
поскольку в силу (7)
(у-СЧ^-С0^-...-С°тхт, C?xt + C§x2+ ... + С«х„)=0. (9)
Из равенства (8) следует
Л(С?, С°2,...,С°т) = (у, у)-(у, СЧх1+С^х2 + ... +С°тх°т)
или в прежних обозначениях
R(Ct (10)
Если векторы х2,...,хт образуют ортонормированную систему, то из равенства (8) получаем т
R(Ct с?, )=(/,/)- Z (С?)2. (11)
7=1
Приведенное выше утверждение позволяет установить следующий факт.
Пусть на отрезке [а, b ] задана функция R (х). Тригонометрическим многочленом
а т
—4- ак cos kx+bk sin кх,
к=1
(12)
для которого функция
R(a0, ar, а2,...,ат, bt, b2,...,bm) =
2л
о
достигает минимального
2л
1 й° = 2ти
/(x)dx,
а т
—— £ akcoskx+bksinkx)2 2
(13)
значения, является многочлен с коэффициентами
2л 2л
1 Г - I f(x)sinkxdx.
ак =
cosfcxdx, bk =
(И)
О
О
О
366
Глава IV*. Основные численные методы
2 Действительно, условия минимума функции R(aQ, аг, а2... ат, Ьг, Ь2, dR dR dR
имеют вид ----= 0, — = G, — = 0 и совпадают с условием ортогональности
daQ дак дЬк
функции
функциям
CL т
Sm(x)=f—akcoskx + bksinkx 2 k=i
• __—— coskx, ——sinkx (к=1, 2,
у/'Iti у/it yjTi
относительно скалярного произведения
2л
fe(x), Л(х))= f g(x)/z(x)dx. о
(15)
(16)
(17)
Таким образом, обладает свойствами
функция (15), реализующая минимум выражения (13),
(5m, 1) = 0, (Sm, cos&x) = 0, (Sm, sin/cx) = 0 (к = 1, 2, ...,m),
откуда следует, что скалярные произведения функции f и тригонометрического а т
многочлена — + У 6zfccos/cx + Z>fcsin% с функциями (16) совпадают; значит, 2 л=1
тригонометрический многочлен (12), (14) реализует минимум функции (13).
2°. Ортонормированная система функций и задача о приближении. Можно рассмотреть и более общую задачу. Пусть система функций {<р1? <р2, —,ФМ,—}, определенных на отрезке [а, b ], обладает свойством ортонормированности:
(Фр =
0 при it£j,
1 при i=j,
где скалярное произведение /ng выражается формулой
ь
(f, g)=jp(x)f(x)g(x)dx, а
(18)
(19)
a р(х)^0—заданная Решением задачи
функция («вес»).
о минимуме [при данной функции /(%)] выражения
Ь т
R(C„ C2,...,Cm)=^p(x)(J(x') — X Ск<рк(x))2dx (20)
а Л-1
т т
является функция У Ск cpfe(%) такая, что разность f— У Ск <рк(х) ортогональна
Л—1 к=1
в смысле (18) всем функциям (рк(к= 1, 2, ...,т). В этом случае
(/,%) = (£ C°<Ps(*),<pO = C*° (Л=1,2,...,т) (21)
s= 1
и
mb т
Rtd С°2, .... X (С°к)2 = $pf 2(x)dx- X (С°)2 (22)
к=1 а к=1
4*.2. Интерполяционный многочлен Лагранжа. Линейная интерполяция 367
3 Пусть f(x) и <р1? <р2, ..., фт, ...принадлежит линейному пространству непрерывных на отрезке [а, b ] функций L, причем выполняется следующее условие: если фукция g(x)eL ортогональна всем функциям системы {ф1? ф2, ..., фт, ...}, то g(x) = 0. Тогда система {ф15 ф2, ..., фт, ...} называется полной.
Для полной системы функций {ф19 ф2, ..., фП1, ...} справедливо следующее утверждение.
Пусть ряд X ct<pv где
к=1
ъ
ck=(f, <Pt) = f/’(%)/(?c)<Pi(-x)djc> (23)
а
сходится к некоторой функции F(x) в том смысле, что
lim X ск<рк, F(x)— X ct<pj= lim f (F(x)-S ct<pt)2p(x)dx=0. (24)
m-*co \ Л = 1 k=l / W->CO a
Тогда F(x)=f(x).
Действительно, функция F(x)—f(x) ортогональна всем фЛ (к = 1, 2, ..., т, ...), поскольку
dk=(F, t?k) = ck=(f, <pt), (25)
что видно из следующих преобразований: т т т т т
(F- X скЧ>к, F- X с1Ф1) = (^> F)- X ckdk- X ckdk+ X d =
V Л=1 1=1 7 к=1 с=1 с=1
т т т т
=(/?>F)- X <§ **+| Е <К~2 Е <&*+ X с*]=
к=1 Lk=l k=l к=1 J
т т
=(^,к)-Х <42+Е I<4-qI2 (26)
k=l k=l
т
Если m->oo, то (F, jF) — Ydk остается неотрицательным, а £ (dk — ск)2 неот-
к=1
рицательна и не убывает. Из условий (26) и (24) следует, что dk = ck, т
(F, F)— £ ^к- Поэтому (F—f,(pk) = dk — ck = 0. В силу полноты системы к=1
{ф1? ф2, ..., Фт, ...} ясно, что F(x)=f(x).
§ 4*.2. Интерполяция. Интерполяционный многочлен Лагранжа. Линейная интерполяция
1°. Интерполяционный многочлен Лагранжа. Пусть на отрезке [а, b ] определены функция f(x) и семейство функций .
ф(х, Со, С15 С2, ...,Ст), . (-1). .
зависящее от т+1 параметров Со, С15 С2, ..., Сш; пусть, далее, х0 = «1,’ х2, ..., хт-ъ xm = b (Xi<xi+1, z = 0, ..., т— 1) — множество из точек
отрезка [а, b ] (они называются узлами- интерполяции).
Требуется найти такую функцию вида (1) (т. е: определить значения С0 = С°0, С1 = С?, Ст=С°т\ чтобы
368
Глава IV*. Основные численные методы
Дх()=<р(х., С8, С?, .... С°), /=0, 1, .... т. (2)
Сформулированная задача называется задачей интерполяции функции f(x) в классе функций (1).
О пр еде ление. Формула, сопоставляющая функции f(x) функцию ср(х, Со, С?, ..., С°) вида (1) так, что выполняются условия (2), называется интерполяционной формулой.
Интерполяционной формулой Лагранжа называется такая формула, которая всякой функции f(x) сопоставляет многочлен
М)=1Ж)П^- (3)
i = 0 Xj
Формула (3) дает решение задачи интерполяции в классе многочленов степени меньшей или равной т, т. е. функций вида
<р(х,Со,С1,...,Ст) = Сох"‘ + С1х'”-1 + ... + Ст. (4)
Если функция f (%) имеет непрерывную производную порядка т +1, то остаточный член интерполяционной формулы Лагранжа, т. е. f(x)—Lm(x), можно представить в виде
/W-LmМ = / ,П| М-4 (5)
т
где £ принадлежит отрезку [min (х0, х), max (хт, х)] а сош(х) = ]Д х—xt.
i = 0
1 Легко проверить что значения Lm и f в точках х0, х1? ...хт совпадают. Действительно,
(6)
... xi Xi
Если i^p, то произведение П ——— содержит нулевой множитель при J=p\
Х; — Х:
i*j 1 J хх
таким образом, в сумме (6) остается только один член ,/(хр) П -----
г! \ J*pXi,~Xj
который равен j(xp).
Докажем теперь справедливость формулы (5). Рассмотрим функцию
гЛ \ \ г / \ Г \ т ( И хо)(и Хх)...(и Хт)
-f (w)— (и) — [ / М — Lm (*)] 7~ ТТ7“ “Г\ 77 77~\
\х — хо) \X — Xly..\X — Xm)
от переменной и при фиксированном х; допустим, что функция f(x) имеет непрерывную производную порядка ш+\ на отрезке [а,Ь].
Легко показать, что F(u) обращается в нуль при и = х0, xlf ..., хт, и = х.
т %,__
Действительно, если u—xh то произведение П —----- в правой части равенства
j=o X~Xj
(7) равно нулю и /(xj = £m(xt), как было показано выше. Если и = х, то
Ц*) =/ (х) - Lm (х) - [ f (х) - Lm (х)] • 1 = 0.
Повторное применение теоремы Ролля позволяет установить, что F(m + 1)(w) обращается в нуль в некоторой внутренней точке промежутка [min (х0, х), max(xm, х)]. Из равенства (7) следует, что
J>' 4*3. Решение линейных систем методом Гаусса
369
w] хГ (8)
И~ — хт)
а из условия F{nt +1}(£) = 0 и равенства (8) что
f(x)-Lm(х) = ^+1), 0)га(х), (9)
где юш(х)=(х—х0)(х—х1)...(х—хт). Обозначая через М максимум функции
на отрезке [min(x0, х), шах(хт, х)], получаем из (9) оценку \f(x)-Lm(x)\<-—
§ 4*3. Решение линейных систем методом Гаусса
Определение. Система уравнений относительно неизвестных х15 х2, ..., х„, имеющая вид
«nXi 4-д12х2 4-...4-fli„x„ = Z>1,
a2Xt +^22^2 + — + а2ПХп=Ь2, Г1\
4“ ^m2x2 4" 4“ OtnnXn Ьт, называется системой линейных уравнений.
В § 4.3 был изложен алгоритм Гаусса решения системы (1). Этот алгоритм позволяет последовательными преобразованиями превратить исходную систему уравнений в эквивалентную ей систему вида
^а.цХ^ а^2х2~\~ а^гхг-\~ а^г-^ xr+i 4-...4_^i«xw = Z>1,
а22х2 + ...+a2rxr+a2,r+ixr+l + ...+a2„x„=S2,
a„xr + ar>r+1xr + 1 + ... + ar„x„ =fr, ' '
0 = £,+ i,
0=bm,
где Яц/0, <222^0, ..., arr^0. В этой системе неизвестные х1? х2, х„ представляют собой прежние неизвестные х1? х2, ..., хп с измененной нумерацией, причем по ходу вычислений ясно, какая именно перенумерация имеет место.
В системе (2) коэффициенты atj (т. е. коэффициенты при ху в z-m уравнении) равны нулю если i>j и i>r, и ац^О (7=1, ..., г).
Системы уравнений (1) и (2) имеют решения тогда и только тогда, когда br+i — ^r+2 = ...=₽m=0. При этом последние т — г уравнений принимают вид 0 = 0 и могут быть опущены. Это означает, что система (2) эквивалентна системе уравнений
4-й12х2 + ... 4~я1гхг 4-Я1,г+ 1ХГ+1 4-... 4-^lnxn = Z?13
522^2 4- — 4-52rxr4-a2>r+iXr+i 4-... + а2пхп = Ь2,
arrxr +4>r+1xr+i +... + <2гихп =ЬГ, где г—ранг системы и Яц/0, я22^0, ..., агг^0.
370
Глава IV*. Основные численные методы
Алгоритм Гаусса на z-м шаге преобразует систему в систему (так что Sq—исходная система уравнений, а система (3) есть Sk при некотором значении к). При этом системы уравнений 50, Sk попарно эквивалентны.
Алгоритм Гаусса предусматривает на каждом шаге выполнение таких операций:
1) исключение из системы уравнения вида 0 = 0;
2) прибавление к обеим частям одного из уравнений системы соответствующих частей другого уравнения, умноженных на подходящее число;
3) перенумерацию неизвестных.
Доказательство того факта, что с помощью описанных выше операций, выполненных в том порядке, который предписан алгоритмом Гаусса, можно перейти от любой системы вида (1) к эквивалентной ей системе (3) или установить несовместность системы уравнений (1), дано в томе I (см. § 1.9).
Сведение системы уравнений (1) к эквивалентной ей системе (3) позволяет описать множество решений этих систем следующим образом. Переменные xr+i, хг+2, •••, хп называются свободными; им можно придавать любые значения. При этом неизвестные хх, х2, ..., хг однозначно определяются системой уравнений (3). Таким образом, общее решение системы (1) зависит от п — г произвольных постоянных cr+i, сг+2, —, сп—значений переменных хг+1, хг+2, ..., хп.
§ 4*.4. Итерационные методы решения уравнений 1°. Решение уравнений с помощью итераций. Для численного решения уравнения /М=о (1)
применяют итерационные методы, сущность которых в общих чертах состоит в следующем.
Уравнение (1) преобразуют в уравнение вида х = (р(х), (2)
равносильное исходному. Затем рассматривают последовательность чисел %1, Х2 = (Р(Л1)> •»3 = <р(л:2), •••> *„ = <Р(*»-1), (3)
которые при некоторых условиях сходятся к решению уравнения (2).
Последовательность (3) называется последовательностью итераций функции <р(х).
Аналитические условия, достаточные для сходимости последовательности (3), связаны с принципом сжатых отображений. Прежде чем дать формулировку и доказательство этого принципа, введем следующие определения.
Определение 1 Множество X называется метрическим пространством, если на X х X определена функция р(х, у), х, уеХ («метрика»), удовлетворяющая следующим свойствам:
1°) р(х, у) = р(у, х) для любых х, уеХ;
2°) р(х, у)+р(у, z)^p(x, z) для любых х, у, zgX;
3°) р (х, у) > 0, причем равенство р (х, у)=0 эквивалентно х=у.
О пре де ление 2. Последовательность точек х1? х2, хи, ... метрического пространства X называется фундаментальной, если для любого е>0 найдется такое N, что для всех натуральных р, q>N справедливо неравенство р(х„, Х,)<8.
4*.4. Итерационные методы решения уравнений 371
Если для всякой фундаментальной последовательности хх, х2, хп метрического пространства X существует точка хеХ такая, что lim р(хп, х) = 0, И->00 то метрическое пространство X называется полным.
Определение 3. Пусть f: Х-+Х отображение метрического пространства X в себя. Это отображение называется сжатым, если существует число а такое, что 0 < ос < 1 и для каждой пары х, у е X выполняется неравенство р(/М,/(д'))<ар(л, j>). (4)
1 Теорема (принцип сжатых отображений). Для всякого сжатого отображения f полного метрического пространства X в себя существует и притом единственная точка х такая, что
f(x)=x. (5)
Точка х называется неподвижной точкой отображения f.
Доказательство. Покажем сначала, что точка х, удовлетворяющая свойству (5), существует. Рассмотрим последовательность точек в X:
x1,x2=f(x1), x3=f(x2), ..., x„=f(x„-l), ... (6)
Пусть = xi+1). Тогда в силу неравенства (4) имеем dk+x <akd1. Для
расстояния fk = p(x1,xk) получим неравенство
р(*1> •**)<Р(хп Х2)+р(х2, Х3)+... + р(хк-1, хк)<
<d1 + a.dl + a2dl + ...+a.k~2d1=d1----<——. (7)
1 —а 1 —ос
Следовательно, все члены последовательности отстоят от хг не более, чем Ji
на----. Аналогично получаем, что все члены последовательности (6) начиная
1 —ос
dj aj~idl ccJ-1
с х- отстоят от х (p>j) не более, чем на —— <-----. Так как lim-----dt=0,
1—а 1—а ,/->оо1—ос
то последовательность (6) является фундаментальной. Далее, поскольку X—полное метрическое пространство, последовательность (6) имеет предел, т. е. существует точка хеХ такая, что lim р(хк, х) = 0.
А:-» со
Покажем теперь, что х является неподвижной точкой отображения f Действительно, множество членов последовательности (6) переходит в себя под действием /, т. е. /(хЛ) = хЛ+1 (к=1, 2, ..., п, ...). Следовательно, пределы последовательностей хх, х2, ..., хп и f(xx),f(x2), ...,/(хи), ... совпадают. С другой стороны, легко установить, что предел последовательности /’(_Xi), /'(x2), ...,/(хп), ... равен f(x). Отсюда следует равенство (5).
Покажем, наконец, что существует только одна точка хеХ, удовлет4-воряющая условию (5). Допустим противное. Тогда существуют такие х, уЕХ, что f(x) = x, f(y)=y. Однако в этом случае получим р(х, >>) = р(/(х),/(^)), что противоречит условию (4).
Если X—отрезок [а, б] числовой оси и р(х, j>) = |х—у |, то функция <р, отображающая отрезок [а, б] в себя и удовлетворяющая-условию
<g<i, (8)
— х2
372
Глава IV*. Основные численные методы
задает сжатое отображение. Согласно теореме существует точка х такая, что ф(х)=х. Тогда, как было отмечено выше, уравнение /(х) = 0 можно решить с помощью метода итераций, заменив его эквивалентным уравнением х=<р(4
На практике в качестве ф(х) берут функцию
(9)
В этом случае последовательность
х1г Х2 = ф(х1), л3=<р(л2), Л^ф^-Д ...
(10)
допускает наглядное геометрическое истолкование, а именно хк есть абсцисса точки пересечения с осью х касательной, проведенной к графику функции y=f(x) при Х = Хк-!.
2 Действительно, уравнение касательной к кривой у =f(x) в точке с абсциссой x=xk-i имеет вид
У =f (хк _ 1) +/' (хк _ 1) (х - хк _ 1).
При у = 0 получим
Ж-l) х ,1П
f (л*-1) или
х=ф(х*_1)=х4. (12)
3 Пусть функция f (х) дважды дифференцируема на отрезке [а, b ], причем f(a) и f(b) имеют разные знаки, a f'(x) и f"(x) сохраняют знак на [а,Ь]. Из двух значений f(a) и /(/>) выберем то, которое совпадает со знаком второй производной /"(х), и обозначим через х0 аргумент выбранного значения /(«) или f(b), т. е. положим
(а, если /(о)/"(«)>();
Х° (/>, если f(b)f"(b)<0.
Построим последовательность (6) и покажем, что она имеет предел.
Докажем, что функция ср отображает в себя отрезок [х0, х ], где х—решение уравнения /(х) = 0, принадлежащее отрезку [а, Ь]. Имеем
(р(х)=-^^+х=х, ф(хо)=-77уЦ+хо- (14)
/ М f Но)
Формула Тейлора для функции /(х) в точке х0 имеет вид /(x)=/(xo)+/'(^o)(-x-?co)+'^Y^(jc-^o)2, (15)
где с—внутренняя точка отрезка [х, х0]. Так как /(х) = 0, то из равенства (15) следует, что
Д*о)
(16)
£ 4*.4. Итерационные методы решения уравнений
373
На интервале ]х0, х [ функции f(x),f'(x\f"(x) сохраняют знак, а знаки f(x) и f"(x) по предположению совпадают. С учетом сделанного замечания формула (16) дает:
а) если /(лг)>0, /'(л)>0, /"(х)>0, f(x0) - то x0>x0 <>x; f (*o)
б) если /(х)>0, /'(х)<0, /"(х)>0, /(%o) to x>x0 >x0; f (*o)
в) если /(х)<0, f'(x)>0, /"(х)<0, f(x0) to x>x0 >x0; f (*o)
г) если f(x)<0, f"(x)<0, /(*o) _ TO xQ>xG >x. f Ho)
Таким образом, во всех случаях образ отрезка [х0, х] под действием ф содержится в [х0, х ].
В силу неравенств (а) — (г) последовательность (10) является монотонной [убывающей в случаях (а), (г) и возрастающей в случаях (б), (в)] и ограниченной [снизу числом х в случаях (а), (г) и сверху числом х в случаях (б), (в)]. Таким образом, последовательность (10) имеет предел хе [а, Ь]. Как было показано выше, предел последовательности (6) является решением уравнения ф(х) = х или эквивалентного ему уравнения /(х) = 0. Вследствие монотонности функции f(x) на [a, b J (это вытекает из того, что знак f'(x) на [а,Ь] постоянен), уравнение /(х) = 0 имеет единственное решение на отрезке [а,Ь]. Следовательно, х = х и последовательность (10) сходится к х.
Последовательность (10) стремится к х справа в случаях (а) и (г) и слева—в случаях (б) и (в). Можно построить последовательность точек, стремящуюся к х с противоположных сторон, т. е. слева в случаях (а) и (г) и справа—в случаях (б) и (в). Такова последовательность х2, ..., хк, ... точек пересечения хорд кривой ^=/(х) с осью х. Точнее, в случаях (а), (г)
упомянутая последовательность имеет вид
. f(xk)(b-xk)
Xk+1 f(b)—f(xk)
(17)
+хк
[xt+1 является абсциссой точки пересечения с осью х хорды, соединяющей точки (xk;f(xk)) и (b;f(b))]; в случаях (б) и (в) эта последовательность имеет вид
Хк+1 —
f(xk)(a-xk) f(a)-f(xk) +Xl
(18)
[xk+i есть абсцисса точки пересечения с осью х хорды, соединяющей точки (xk;f(xk)) и (а;/(«))].
4 Действительно, уравнение прямой, проходящей через точки (xk;f(xk)) и таково:
х—хк хк — Ь
(19)
Точка пересечения этой прямой с осью х имеет координаты (хЛ+1; 0) и значение xfc+1 можно найти из равенства (19), полагая в нем у = 0; в результате получим формулу (17).
Аналогично в случаях (б) и (в) находим абсциссу хк+1 точки пересечения с осью х хорды, соединяющей точки (хк; f (xfc)) и (я; f (я)). При этом получаем формулу (18).
374
Глава IV*. Основные численные методы
Последовательность х2, xfc, ... является монотонной [возрастающей в случаях (а), (г) и убывающей в случаях (б), (в)] и ограниченной [сверху числом х в случаях (а), (г) и снизу числом х в случаях (б), (в)]. Поэтому последовательность х15 х2, ..., хк, ... имеет предел х. Ясно, что х = х, поскольку х является решением уравнения
Дх)(а-х) /(*)-/«
(20)
[в случаях (а), (г)] и уравнения
/(*) (а-х) /(д)-/(х)
+х = х
(21)
[в случаях (б), (в)].
Уравнения (20) и (21) эквивалентны соответственно уравнениям f(x) х х(Ь—х) = 0 и /(х)(а — х) = 0, которые соответственно имеют решения {х; Ь} и {л; х}. Так как хк^х<Ь и хк^х>а [соответственно в случаях (а), (г) и (б), (в)], то x = limxfc = x для всех случаев.
2°. Решение систем уравнений с помощью итераций. Итерационные методы применяются также и для решения систем уравнений. Пусть дана система линейных уравнений
-allx1+al2x2 + ... + alnxn==bl, а21Х1 + ^22Х2~^ ... + ^2пХп = ^2
+ Gn2X2~V ••• + аппхп —Ьп.
Эта система, как известно, эквивалентна векторному уравнению
Ах = Ь, (23)
где х=(х1? х2, ..., хп) и b — (b1, Ь2, ..., Ьп) — вектор-столбцы, А — матрица
системы (22).
Очевидно, что при любом вещественном к^О уравнение (23) эквивалентно уравнению
х = х+к (Ах—Ь).
Обозначив вектор х + к(Ах — В) через Ф(х), получим
Ф(х) = (кА + £) х—kb
и рассмотрим последовательность векторов
хо = 0, .... х„+1=Ф(х„),
(25)
(26)
5 Докажем, что последовательность (26) при малых к сходится, если собственные значения матрицы А вещественны и имеют одинаковые знаки.
Так как корни матрицы А — действительные числа одного знака, то, выбирая подходящее число к, можно добиться того, что бы все корни матрицы А были по модулю меньше единицы. Пусть к выбрано именно так и пусть для матрицы А существует базис из собственных векторов Л,/2, принадлежащих собственным значениям Х1, Х2, |XJ<1
4*.4. Итерационные методы решения уравнений 375
(z = l, 2, ..., ri). Тогда последовательность итераций {кА+Е^х сходится к нулевому^ вектору для любого начального _ значения х, поскольку если x=x1f1+x2f2 + ... + x„f„ и (кА + Е)"х = х1кп1/1 + x2’k"2f2 + ... + x„Wf„, то
lim (кА+£)"=б (27)
я->оо
вследствие того, что Х"->0 при и->оо, г=1,2, п.
Если матрица А не имеет базиса из собственных векторов, то предел (27) по-прежнему равен нулевому вектору. Действительно, в этом случае можно взять последовательность Л2, ..., Ат, ... матриц, сходящуюся к Л и такую, что каждая матрица имеет базис из собственных векторов. Тогда по доказанному lim (кА£ + £)” = б (z=l,2, ...), т. е. предел (27) равен
И->00 нулевому вектору.
При этом Ф"х имеет вид
Ф"х = (кА + Е)пх+[(£Я + £)"“1 + (кА + Е)"~ 2 + ... + £](-кБ) и в силу (27) получим
lim Ф"х = [7Г— (ЪЦ-Е)]-1 ( — kb}=A ~Yb.
П-+СО
Таким образом, последовательность (26) имеет предел, который совпадает с решением системы уравнений (23).
6 Итерационный метод можно применять и в значительно более общей ситуации.
Пусть дана система уравнений
'bi =ft (*i, х2, х„),
b2=f2 (*1> хг, •••> х„), ^28)
Л=Л(*1, х2, хп).
Далее, пусть отображение
f: x=(xt, х2, х„)-+у=(У1, у2, у„), (29)
где У1=/[(х(, х2, х„), 1=1, 2, п, переводит некоторую область D простран-
ства R" переменных х1; х2, х„ в себя и матрица
(bfi /8х1 df1/dx2...df1/Sx„\
df21bxr df2 /дх2...df2 /дх„ (30)
dfn!8x1 dfjdx2...dfn!dx„ /
такова, что в каждой точке ее собственные значения вещественны и имеют одинаковые знаки, а множество всех собственных значений ограничено. Тогда при подходящем вещественном к итерации отображения
Ф :х=(х1, х2, х„)-*у=(У1, у2, у„), (31)
где yi = xi + kfi(xi, х29 x^—kbi обладают свойством
376
Глава IV*. Основные численные методы
lim Фи (х) = х0 (32)
н->оо
(т. е. предел (32) существует для любого xeD, и последовательность хп Ф(х), Ф2(х), ..., Ф"(х), ... сходится к решению системы уравнений, единственному в области D).
Доказательство этого утверждения основано на том, что при сделанных предположениях для подходящего к матрица £'+А;/гимеет корни по абсолютной величине меньшие, чем единица. Поэтому отображение Ф является сжатым и последовательность х}=х17 х2 = Ф(хг), х3 = Ф(х2), ..., хи+1=Ф(хя), ... в силу принципа сжатых отображений сходится к решению системы х = Ф(х), эквивалентной системе (28).
§ 4*.5. Квадратурные формулы
Формулы вида
J7(x)dx= £ Ckf(xk), (1)
а к = 0
b задающие приближенное значение искомого интеграла J/(x)dx, называются а
квадратурными формулами, точки х0, хп ..., хп — узлами квадратурной формулы, числа Со, С\, ..., Сп — коэффициентами квадратурной формулы.
1°. Формула трапеций. Эта формула имеет вид
Ь~а(Уоi , i , /ох
f/x)dx« —+^i+^2 + -+K-i+v ; (2)
а П \2 2/
где yt=f(x,), xt=a+ih, h = (b—a)/n, z = 0, I, 2, .... n.
На каждом участке [xf, х£+1] (i= 0 1, ..., n— 1) функция аппроксимируется многочленом первой степени
(х —xj + y£-,
(3)
значения которого в точках х£ и х/+1 совпадают со значениями функции х; Н1
/(х) в этих же точках. Заменяя интеграл J /(x)dx на
Xtr fyi+i-yi, v V л+л+1
J ---~}-(x-xj+л- ldx =---, (4)
х \ п J Л
получаем приближенную формулу трапеций:
f/(x)dx= X f/(x)dx»/z £ Ь +
J i=0 J i=0
b xt
b — a (v \
=---1 т+ММ-Пм+т-
n \2 2 J
Заметим, что многочлены первой степени (3) являются интерполяционными многочленами Лагранжа Lr (х) на отрезках [xf, xi+1 ], z = 0, 1,..., и—1.
4*.5. Квадратурные формулы
377
Для функций /, имеющих непрерывную вторую производную, справедливо соотношение
ь
f/(x) dx-—- (у+^1 + У 2 + -+Уп-1 +у) = ft). (6)
J И у 2 2у 12
а
trq £—внутренняя точка отрезка [а,Ь].
1 Вывод формулы (6). На участке [xf, Х;+1] разность между функцией f(x) и аппроксимирующим ее многочленом первой степени
------(x—Xif+yi равна
h
f"&\ W А НА
-(x-Xi) (x-xi + 1), xt.<^<x/+1. (7)
Это следует из формулы (5) § 4*.2, выражающей остаточный член интерполяционной формулы Лагранжа.
b п — 1 xl+t h
Так как f/(x)dx=£ f f(x)^x, то разность между ff (х)dx
a i = 0 х,
Ь — а/Уо у'
И ----I ~^ + У1 +Т2 + -+Тл-1+“7
п \ 2 2 ?
а
равна следующей сумме интегралов:
(С)
и — 1 р И д= у —
i = 0 2
xi
Эта сумма равна
h
”-1 f"(£) С л3и~1
д= S Чг x(x-h)dx=.-- X /"О
i = 0 2! J Z i = ()
О
Для непрерывной функции f"(x) на [а, b ] среднее арифметическое I"-1
- £ равно значению функции f" в некоторой точке [а, b ]. Поэтому ^i = 0
h3
Отсюда получаем оценку
h3
| А | < — М,
12
(Ю)
(11)
где М—максимум модуля /"(*) на b ].
2°. Формула Симпсона (формула парабол). Эта формула имеет вид
b h
$f(X)dxx-(y0 + 4y1 + 2y2 + ... + 2y2n_2+4y2„_1+y2„), (12)
а
где yi=f(x^, Xi — a + ih, h = (b — a)/(2n), i—0, 1, 2, 2п.
2 На каждом участке [x2l> x2i+2 ] функция /(х) аппроксимируется многочленом второй степени Ь2(х), значения которого в точках x2i, x2i+i^ x2i+2
378
Глава IV*. Основные численные методы
совпадают со значениями y2i, y2i+1, У 21+2 функции f(x) в этих же точках x2i+1
(£2(х) является интерполяционным многочленом Лагранжа); далее, J f(x)dx x2i+l X2t
приближенно равен J L2(x)dx. Имеем
x2i
, (^-^2i)fai + 2)
2% У2‘(ХЦ-Х21-и)(.Х21-Х21 + 2) y2l+1(x2i+1-X2i)(x2i+l-X2i + 2)
(*-*2i)(*~*2.+ l)
2' + 2 (*2i + 2 ~*2l)(X2i-X2i+ 1)
ИЛИ
L2(x)=^[y2i(x-x2i+1)(x-x2i+2)-2y2i+1(x-x2i)(x-x2i+2)+
+y2i + 2(x-x2i)(x-x2i+1)=^[x2(y2i-2y2i+l+y2i+2)-x[(y2i(x2i+1 + x2l+2)-
-2y2l+1(x2i+x2i+2)+y2l+2(x2i+x2l+1)]+y2lx2t+1x2i+2-2y2t+ix2ix2i+2 +
У21 + 2 X2iX2i+T
Интегрируя Л2(х) по отрезку [x2l-, x2i+2 L получаем
x2i + 2
x2i+2 j Г
f L2(x)dx=— y2t(x-x2i+1)(x-x2i+2)~2y2i+1(x-x2i)(x-x2i+2)+
x2i J
x2i
+y2i+2(x-x2i)(x-x2i+l)dx=
h
= Ihi f y2iU(U-hV2y2l+l(U + fl)(U-h) + y2t+2(U + h')udu =
-h
1 Г 2h3 /2h3 А 2й3"1 hr _
=7T3 У21-5---------------2/13 +y2i+2— =-[y2i+4y2i+1+y2l+2J.
/jit 2) \ Jz / *z *7
Используя формулу трапеций, находим
J/(x)dx= £ j f(x)dx& ^[y2i+4y2l+1+y2i+2] =
a i = 0 x2i i = 0 J
=- (У 0+4y 1 + 2У 2+3 + • • • + 4y2n _ 1 + У 2n)-
Для функций /(x), имеющих на [a, b] непрерывную четвертую производную, справедливо соотношение
^f(x)dx-^—^(y<)+4y1+2y2+4y3 + ...+4y2„_
„ 6п
Mh 5п
(13)
где М—максимальное значение модуля /(4)(х) на [а, b ].
3 Вывод формулы (13). Пусть первообразная для /(х), равная F(x), имеет на отрезке [а, b ] непрерывную четвертую производную. Будем исходить из очевидного тождества
f 4*.5. Квадратурные формулы
379
h
F(x+h)— F(x) = f F'(x+h — z)d/. (14)
о
Интегрируя это тождество по частям, имеем h h2 fa2 Ct4
F(x+h)-F(x)=hF’(x)+— F"(x)+—F"’(x)+—Fw(x)+ — F(x+ht)dt (15) z J. 4. J 4.
0
Заменяя F на F' и F", из (15) получаем h h2 h3 Ct3
F'(x+h)-F'(x) = hF"(x)+—F"'(x)+—F(4)(x) + — F(x+h-t)dt, (1.6) о h h2 Ct2
F"(x+h)-F'(x)=hF"’(x)+—Fw(x)+ — Fw(x+h-t)dt. (17) 0
Умножая обе части равенств (15), (16), (17) соответственно на 1, —h/2, h2/\2 и складывая результаты в левой и правой частях равенств, после сокращения подобных членов имеем h h2
F(x+h)-F^--(F'{x+h)-F'(x)+-(F''(x+h)-F''(x))=
h
C (t4 t3h t2h2\
=AF»(x)+j +—Jdt (18)
0 t4 t3h t2h2 t2 Так как ———Ч—T0 по теоРеме 0 среднем значении интеграла находим h h
С (t4 13h 12h 3\ Гt2(t—h}2 h3
j F-(x+/!-z)^_f2+__^z=FW(c)j _L_Ldr=FW(c)_ (I9)
о 0
и, следовательно, h h2 h5
F(x + h)-F(x)=-(F'(x+h)+F'(x))-—(F''(x+h)-F"(x+h)+Fm — . (20)
Здесь c—точка интервала ]x, x+h [.
Пусть xk = x+kh; из равенства (19) следует h h2 h3
F(xk + h)-F(Xk)^-(F(xk + h) + F'(xk))--(F"(xk+h-F"(xk)+F^(ck)—. (21)
Здесь ck e ]xfc, xk + h [.
Просуммируем равенства (21) по к от 0 до 2п— 1, считая, что xQ = a и х2п = Ь; будем использовать обозначения F'(x)=f (х\ f(x^=yb F"(x)=f (x), /'(Xi)— у[. Получим
380
Глава IV*. Основные численные методы
h2 f h5 2п~1
+ — X F^(ck). (22)
1Z \ /ZU
£ — 0
Запишем формулу (22) для точек xk = x + 2kh, k=0, 1, ..., n. Имеем
F(b)-F(a) = 2h^+y2+y^ + ...+y2„-2+~^-
Ah2 / 32 2”-1
-jyX F^(c'k\ (23)
1Z у /ZU k=Q
где ске ]х'к, хк+1 [, k=0, 1, ..., п — 1.
Умножая обе части равенства (22) на 4 и вычитая из результатов соответствующие части равенства (23), получим
l(F(b)-F(a))=h(y0+4yl+2yz+4y3+...+4y2n-i+y2n)+
4А52”-1 32Л 5/1-1
(24)
Из равенства (24) находим
h
| F(b)- F(a)--Цо+4у! + 2у2+4у3 +...+4v2„_ 2 + >'2„) | <
1 /4Л5 32й5 '
-I----2пМ-\------пМ
3\720 720
h 5 Мп
54 ’
т. е. справедливость формулы (13) доказана.
4 3°. Формула Гаусса. Среди многочисленных квадратурных формул особое место занимает формула Гаусса. Эта формула описывает приближенное значение интеграла и имеет вид
f /(x)dx» X CJlxi). -1 i = 0
(25)
С помощью линейной подстановки любой определенный интеграл можно ъ
свести к интегралу вида (25). Действительно, если в интеграле Jcp(x)dx а
произвести замену переменной, используя формулы
(26)
то получим
Если в правой части равенства (25) выбрать в качестве xt (z = 0, 1, 2, ..., п) корни многочлена Лагранжа Рп+1 (х), а в качестве коэффициентов Q взять
i П и — us
Ct= ----------dW, (28)
П щ — щ
4
j> 4*.6. Численные методы решения задачи Коши для обыкн. диф. уравнений
381
где us (5 = 0, 1, 2, ..., п)—корни многочлена Ри+1(л:), то формула (25) окажется точной для всякого многочлена степени 2и+1. Такая точность обеспечивается всего лишь w+1 узлами квадратурной формулы Гаусса.
Для каждого п числа х0, хп могут быть вычислены с большой
точностью, что и сделано для п = 1, 2, 3, 4, 5, 6, 7, 8; также с большой степенью точности вычислены коэффициенты Ct.
По известным и х; (z = 0, 1, 2, п) формула (25) позволяет вычислить 1
J f(x)dx с большой точностью. Например, если п = 2, то х0=—0,774596669240, *1=0, х2 = 0,774596669240, а Со = 5/9, С1 = 8/9, С2 = 5/9.
§ 4*.6. Численные методы решения задачи Коши для обыкновенных дифференциальных уравнений
1°. Теорема существования и единственности. Метод ломаных Эйлера. Теорема 1 (существование и единственность решения задачи Коши для обыкновенного дифференциального уравнения). Пусть дано дифференциальное уравнение
y'=f(x,y\ (1)
и и
где f(x, у) — функция двух переменных, определенная в окрестности точки (xQ \ уq), непрерывная в этой окрестности и имеющая в этой окрестности df
частную производную —. Тогда в некоторой окрестности точки х0 существует ёу
притом единственная
начальному условию
функция у=у(х\ удовлетворяющая уравнению (1)
1 Доказательство, решением уравнения
. J'(^o)=J,o- (2)
Заметим прежде всего, что если у=у(х) является
>'(x)=J;(-xo)+ f f{x, /(*))<!*, (3)
хо
то у=у(х) удовлетворяет уравнению (1) и условию (2), и обратно.
Обозначим
Ф(ф(х)) = ф(х0)+ f/(xl5 <p(x))dx (4)
*0
X
Отображение Ф переводит функцию ср(х) в функцию ф(х0)+f/(х, ф(х))dx.
Пусть х достаточно близко к х0; тогда Ф окажется сжатым отображением, если расстояние р между функциями фДх) и ф2(х) определить следующим образом:
р(<Рп Ф2)=тахI<Р1 (/)-ф2(/)|.
(5)
Действительно,
|ф(ф1)-ф(ф2)|=Ц f(x, Ф1(х))-Д*> ф2(х))<м< х0
382
Глава IV* Основные численные методы
< f 1/(*> Ф1(*)~Ж <p2(*)|d*sS
*0
х0
|<p2(x)-ip1(x)|dx^|x-x0|Mp(<p2, (pj, (6)
где М—максимальное значение модуля производной — (х, у) в малой ду
замкнутой окрестности точки (х0; у0).
Если |х—х0|<1/М, то, как показывает неравенство (6), Ф есть сжатое отображение. Пространство дифференцируемых функций ср(х), определенных на отрезке |х—х0\<1/М и удовлетворяющих условию <р(х0)=у0, является полным метрическим пространством и отображение Ф переводит это пространство в себя. В силу принципа сжатых отображений (см. § 4*.4) отображение Ф имеет и притом единственную неподвижную точку, т. е существует единственная функция ф(х), такая, что
<р(х) = <р(х0)+ f/(x, <p(x))dx. (7)
*о
Следовательно, у = ф(х) является единственной функцией, удовлетворяющей уравнению (1) и условию (2).
Численное решение дифференциального уравнения (1) при условии (2) состоит в последовательном вычислении значений ук (к = 0, 1, 2, ..., п), аппроксимирующих значения у(хк), где у(х)—решение задачи Коши (1), (2), a xk=x0+kh (h—малое положительное число, называемое шагом). Таким образом,
Л+1=Цл.А-1, -'-хк+1,хк, ...). (8)
Различные функции F в правой части равенства (8) определяют различные методы численного интегрирования.
Если
Ук+1=Ук+11/(хк, ук), (9)
то получается метод, называемый методом ломаных Эйлера.
Если
/Л /Л
Ук+i = Л+/1 Хк~^2’ ^к^к2/ (Ю)
где fk=f(xk, ук), то имеет место так называемый модифицированный метод Эйлера.
Другая модификация метода Эйлера определяется формулой
Ук+i =Ук+-[Л+/(лл+ь yk+fkh}]h- (11)
2°. Методы Рунге—Кутта. Положим (h к \
Хц+-, Ук+~2 Г’ k*=f(Xk + h’ yk+2k2~ki)h. (12) Формула
1
Ук+i — л+т(&1 +4&2 + ^з) (13)
о
f 4*.6. Численные методы решения задачи Коши для обыкн. диф. уравнений
383
позволяет по известным хк, ук вычислить к19 к2, к3 и ук+1>
Эта формула дает точное решение дифференциального уравнения (1) при условии (2) для функций f(x, у)= 1, х, х2, х3; для этих функций имеет место равенство Ул=у(хЛ).
2 Действительно, пусть, например, /(х, у) — х3, т. е. дифференциальное уравнение имеет вид
у' = х3. (14)
X4 Xq
Точное решение уравнения (14) при условии у(х0)=у0 таково: У~~^------
Следовательно,
/ к Хк xZ j(xfc)=y-—+у0.
(15)
( - '• h\3
При этом kr=xkh, ^2 = 1^л + “|
Л, k3 = (xk + h)3h, откуда находим
h+(xk + h)3 h 1 =
Xq / 3 1
—~+у о Т h I хк Ч- “ хк h Т xkh 2 -Т ~ А 3
_x^ xZ ~ 4 ' 4 —
= (Xk+/t) ^ + y0=y(X/i+/lJ:=y^Xli+ J
Это показывает, что yk и y(xft) совпадают, т. е. формула (13) дает точное решение уравнения (14).
Аналогично можно убедиться, что формула
Ук +1 = Ук+т (кг + 2к2 + 2к3 + к4), о
(16)
где
Г Г! Г h AV
k1=fkh, k2=f\xk+-> yk+—jh,
(17)
%3=f\xk+-, Ук-h— ^4=f(xk+/i, ук+/с3)/г, определяет решение дифференциального уравнения (1) при условии (2) с точностью до А5 если /(х, у)= 1, х, х2, х3, х4.
3 Действительно, пусть, например, /(х, у) = х4. Точное решение задачи . х5 Хо
Коши (1), (2) в этом случае есть у(х)=—-------5"“*“-У0* этом к^х^п,
г ( h' ^2 —I + ~
к3=1хк-У- lh4, lc4 = (xk-yh)4h. Далее, имеем
\h4,
Ук+1—Ук+~
h h4 h4
=yk~\— (xfc + 2x4+4xkh + 3xk h2 -I-xkh3 -I-1-2xk y-4xkh-I- 3xkh2Txkh3 +~“T
6 8 8
384
Глава IV*. Основные численные методы
A-xkA-4xkh + 6xkh2 + 4xkh3-+-h4) —
=^—^-+y0+xkh + 2xkh2 + 2xkh2+xkh3+Ah5 =
(xk + h)5 xj
='—---------+j'o+^5=J’(xt+1)+A5,
т. e. с точностью до h5 справедливо равенство =y(xfc+1).
§ 4*.7. Понятие о методе сеток решения простейших задач математической физики
Линейное дифференциальное уравнение второго порядка в частных производных относительно функции и (х, .у) двух переменных имеет вид
д2и д2и д2и ди ди
А—+2В——+С—+ 2D —+ 2Е—+ Fu+f=0, дх2 дхду ду2 дх ду
(1)
где А, В, С, D, Е, F, f—заданные функции переменных х, у.
Будем рассматривать это уравнение в области D плоскости переменных х, у. В этой области рассмотрим точки (хк, yj, где
хк = а+кЬъ yi = cA-lh2(k9l—O9 1, 2, ...) (2)
и [a, Z>], [с, d\ — проекции области D на оси х и у.
Под численным решением уравнения (1) будем понимать нахождение чисел ukh приближенно равных значениям и(хк, yz) искомой функции в точках (хк; yt)eD.
Для малых hx и h2 из определения частных производных следуют приближенные равенства
ди ^uk+i,i~~uki ди ^Щ,1+1~ик1
дх xk,yt hi 9 дх хкУ1 h2
1 Аналогично получаем приближенные равенства для вторых частных производных:
д2и
дх2 хк,у,
1 /ди hi \дх
>У1
1 fuk+l,l~~ukl ик, l~Uk-1, А 1 , о . \
I ---------------------- I — —^\uk+iti — 2uki + uk-i i);
hi\ hi hi J hi
d2u 1 /du du
дхду h2 \dx xk,y^t dx
1 / Uk+i, l+l~uk,l+l ^k+l,l~uk,l h2 у hi hi
(4)
1
—, /....(wfc+u+1 — икг1+1 —uk+u + w/cj;
hih2
£ 4*.7. Понятие о методе сеток решения прост, задач мат. физики
385
д2и 1 /ди
8у2 h2\dy
ди
8у
_ 1 (Ukl+1—Uu Uki — Uk-1-1\_ 1 . .
— — I --7----------i----- } — T^\uk, l+ 1 ~ uk, l+ 1
hl \ «2 ^2 / h2
x du du d2u d2u d2u
Заменяя в уравнении (1) u(x,y), —, —, —-------------- на uki и выражения
дх ду дх ду дх ду
(3), (4), в каждой точке (xk; yt) области D получим соотношение, связывающее значения uki в заданной точке и в соседних точках. Эти соотношения представляют собой систему линейных уравнений. Если к этим уравнениям присоединить соотношения, вытекающие из краевых условий, которым удовлетворяет искомое решение, то при соблюдении некоторых условий «объединенная» система уравнений имеет и притом единственное решение, приближающее в той или иной степени значения функции и(х,у).
Задача Дирихле в прямоугольной области Z) = {(х, у>) 10 < х а, состоит в нахождении функции и(х,у), удовлетворяющей уравнению
и краевому условию
(6)
где Г—граница области D, a f—заданная на границе функция.
С помощью метода сеток эта задача сводится к решению системы уравнений
1 . . .
uki = -(uk-i i + uk+ 1 i+uk i-i + uk i+i) {0<к<т, 0<1<п) (7)
4
«о,=/(0, hl) (1=1, 2, ..., n—1);
uk„=f(kh, p) (£=1, 2, m-1);
umi=f (a, mh) (1=1, 2, и-1);
ukQ=f(kh,0) (k=l, 2, .... m—1).
Здесь принято u = mh, fi = nh.
2 Систему уравнений (7), (8) можно записать в виде
Аи^Ь, (9)
где и—искомый вектор с компонентами uki(fd<k<m, 0<1<п), а компоненты вектора Ъ определяются числами, входящими в правые части уравнений (8). Матрица А имеет размер (т— 1)(я — 1) х (т—1)(« — 1); ее столбцы и строки занумерованы парами чисел (к', /), 0</<</??, 0</<«.
Элемент матрицы Л, находящийся на пересечении строки с номером (к', I) и столбца с номером (р; q), равен —1, если р = к, q—l', 1/4, если р = к+1, q = l; р = к—1, q = l', р = к, q = l+Y\ р — к, q = l—l; 0 в остальных случаях.
Перепишем систему уравнений (9) в виде
и=(А + Е)и— Ь, (10)
где Е— единичная матрица.
124 Мантуров О.В.
386
Глава IV*. Основные численные методы
Занумеруем неизвестные uki(O<к<т, 0<1<п) в следующем порядке:
«11, W12> •••, W21, W22, •••, •••, ит-1, 1, Um-2,2-> — ,
При этом матрица A +E примет вид
Е
а еО
Е ’ • Е
О Е а?
1
О .
1 .
О
ап
где
о
. •. .1 г • о
(12)
— матрица размера (п— 1)х(я — 1), а Е—единичная матрица размера (п— 1)х х(л—1); матрица (11) содержит (т— 1)2 блоков размера (п— 1)х(и— 1).
Покажем, что все собственные значения матрицы А +Е по абсолютной величине меньше чем единица.
Для этого сначала найдем собственные значения матрицы а. Так как а2 имеет вид 1 2 2
2 1/
то собственные значения а равны + 1, +^/2- Известно, что всякую симметрическую матрицу можно привести к диагональному виду с помощью ортогонального линейного преобразования, матрица которого равна С. Следовательно,
о
СаС-’Д
\ ч
где Xi, Х2, ..., Хи_
— собственные значения матрицы а и
— ортогональная матрица.
Заметим теперь, что для матрицы
£ 4*.7. Понятие о методе сеток решения прост, задач мат. физики
387
(с1ХЕ с12Е ... с^п^Е с2\Е с22Е ... с2п_1Е
сп-1,1Е сп_^2Е ...
справедливо равенство
/° Е 0\ 1^Е \
~ £ 0..Е.. Ь-iJ W О
Е.'-.Е j I
\0 Е '0/ \ О К,-1Е/
Поэтому
(T^E+d О
О %n~iE-{-di
1 . .
Отсюда следует, что корни матрицы А + Е имеют вид -(Xf + XJ. Поскольку
г- 1, х Ji
'ki — ±L ±V^’ максимальное значение модуля -(Xi+XJ равно —^—=0,7071 ... < 1.
Таким образом, доказано, что корни матрицы А + Е по модулю меньше
единицы.
В силу принципа сжатых отображений применительно к системе линейных уравнений (см. п. 2° § 4*.4) последовательность £715 и2, uki где й = Ф(цЛ), Ф(м) = (Л + Е) и—Ц сходится к решению уравнения Аи=Ь при любом начальном значении uG.
13
Глава К*
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
§ 5*.1. Случайные события, операции над событиями и отношения между ними.
Пространство элементарных событий.
Классическое определение вероятности.
Теорема сложения вероятностей.
Геометрическая вероятность
1°. Понятия случайного события и вероятности. Определение 1. Пусть Р* = {Р\, Р*2, Рп}—конечное множество и пусть каждому подмножеству £*с:Р* поставлено в соответствие число Р (£)*), равное т/п, где т— количество элементов множества 2*. Множество Р* вместе с функцией р(е*) называется пространством элементарных событий.
С каждым пространством элементарных событий Р* и функцией Р(2*) можно связать опыт, результаты которого будут зависеть от случая. Этот опыт состоит в том, что из множества Р * «наудачу» выбирают один элемент, причем предполагают, что все элементы множества Р * «равноправны». При этих предположениях естественно считать, что функция Р(б*) измеряет вероятность событий Q, состоящих в том, что в результате опыта будет выбран один из элементов множества Q*.
1 Действительно, формула
P(Q*) = m/n (1)
при т = 0 дает значение р = 0 (невозможное событие), а при т — п — значение р=\ (достоверное событие); если Q\ <=:Q*2, то P(2i)^P(22)-
Очевидно, что кроме перечисленных свойств функция Р(2*) обладает следующими свойствами:
1°. p(ewe,2)=p(e,i)+p(eu
2°. o«p(e*Hi.
Определение 2. Для заданного пространства элементарных событий ЧИСЛО р(е*) называется вероятностью события Q, состоящего в том, что в результате опыта будет выбран один из элементов множества Q*.
Событие Pi, состоящее в том, что в результате опыта будет выбран элемент Р*, называется элементарным событием. Вероятность каждого элементарного события равна Р(Р|)=1/и.
Элементы множества Q*, выбор которых означает наступление события Q, называют (элементарными) исходами, благоприятствующими событию Q.
Приведем пример одного из наиболее часто встречающихся пространств элементарных событий. Пусть 5* — конечное множество из N элементов. Рассмотрим множество Р* всех конечных подмножеств в 5*, состоящих из к элементов; такое множество вместе с функцией P(g*), определенной на подмножествах g* в Р* формулой (1), задает пространство элементарных событий.
5*.1. Классическое определение вероятности. Теорема сложения вероятностей
389
2 Докажем, что количество элементов множества Р * определяется по формуле
с № ". ~ *
(2)
Действительно, для того чтобы составить подмножество в S*, содержащее к элементов, нужно последовательно выбирать эти элементы из S*. Выбор первого элемента можно сделать N различными способами; в качестве второго элемента можно взять любой элемент из S*, кроме одного, уже выбранного первым. Количество возможных упорядоченных пар (первый и второй выбранные элементы) равно N(N— 1); третий элемент можно выбрать N— 2 способами, количество упорядоченных троек при этом будет равно N(N—l)(N—2) и т. д. Количество упорядоченных наборов из к различных элементов множества S* равно N(N— 1)...(7V —к+1); в частности, количество упорядоченных наборов из к различных элементов, выбранных из множества, содержащего к элементов, составляет
к(к-1)... [к—к+ \)=к[к-1)... 1 =к!
(говорят, что к\ равно числу перестановок из к элементов).
Количество подмножеств в S*, состоящих из к элементов, меньше, чем количество упорядоченных наборов из к различных элементов множества S'*, в к\ раз. Это следует из того, что каждому подмножеству из к различных элементов соответствует к\ упорядоченных наборов из к элементов; попросту говоря, заданные к элементов можно занумеровать (упорядочить) к! различными способами. Поэтому количество подмножеств в S*, содержащих i N(N-\)...(N-k+\\
к элементов, равно ------------------.
1-2. ..к
. f N\
Это число обозначают через CN (или ). Таким образом, количество у к J
элементов в пространстве элементарных событий Р* равно CkN.
В связи с пространством элементарных событий Р* часто рассматривают такую задачу.
Пусть множество S* является объединением двух непересекающихся множеств S1 и S2, т. е. S* = SilJS2, S*i A S2^0, причем S} и S| содержат соответственно NA и N2 элементов (Л^Л^+7V2)-
Требуется найти вероятность события Р, состоящего в том, что из к выбранных наудачу элементов множества S* кг элементов будут принадлежать множеству SI, а к2 элементов—множеству S2 (где кг+к2 = к}.
Решение этой задачи дает формула (1) при п = Ск^ и т = Ск^ Ск^, т. е. искомая вероятность составляет
Действительно, к элементов из общего числа Nr элементов, принадлежащих множеству Si, можно выбрать способами; аналогично, выбор к2 элементов из множества S2, состоящего из N2 элементов, может быть сделан С*2 способами. Для выбора из S* элементов нужного состава необходимо каждый выбор элементов из S! совместить с каждым выбором элементов из S2. Поэтому количество элементов множества Р* (т. е. наборов из
390 Глава V*. Теория вероятностей
к элементов множества 5*, из которых кг элементов принадлежат №5, а к2 элементов—множеству S2) равно . Таким образом, т в формуле
(1) равно С*1 С*2 и справедлива формула (3).
2°. Алгебра событий. Если дано пространство элементарных событий Р* и опыт, связанный с этим пространством, то каждое событие Q, которое может наступить в результате опыта, определяется некоторым подмножеством Q * cz Р *: по определению, Q наступает тогда и только тогда, когда в результате опыта наступает элементарное событие Р*—элемент множества Q*.
Этим устанавливается взаимно однозначное соответствие между событиями, могущими наступить в результате опыта, и подмножествами в Р*.
Широко известны такие операции над подмножествами, как объединение, пересечение, дополнение подмножества в множестве. Им соответствуют операции над событиями, называемыми соответственно суммой, произведением событий и переходом к противоположному событию.
О пр еде лени е 3. Суммой событий А и В называется событие, обозначаемое А + В и состоящее в том, что в результате опыта наступит или событие А, или событие В, или оба вместе.
О пре де ление 4. Произведением событий А и В называется событие, обозначаемое АВ и состоящее в том, что в результате опыта наступит и событие Л, и событие В.
О пр еде ление 5. Событием, противоположным событию Л, называется событие, обозначаемое Л и состоящее в том, что в результате опыта событие Л не наступит.
3 Операции суммы, событий, произведения событий, перехода к дополнению обладают следующими свойствами:
1°) А+В=В+А; 2°) ЛР=БЛ; 3°) Л + (Р+С) = (Л + Р) + С;
4°) (ЛР)С=Л(РС); 5°) Л(Р+С) = ЛР+ АС; 6°) Л+(ВС) = (Л+ В)(Л+ С);
7°) (ЛР)+_Р=Р; 8°) (А + В)В=В; 9°) АА + В=В;
10°) (А + А)В=В.
Множество Т вместе с операциями суммы, произведения, перехода к дополнению, удовлетворяющие вышеуказанным свойствам, называется булевой алгеброй.
Таким образом, множество событий, определяемых пространством элементарных событий, вместе с операциями суммы, произведения и перехода к дополнению является булевой алгеброй. Будем называть алгебру, построенную с помощью пространства элементарных событий, алгеброй событий.
Доказательства свойств 1°—10° непосредственно вытекают из определений операций суммы, произведения и перехода к дополнению.
В теории вероятностей часто используются следующие тождества алгебры событий:
А1+А2 + ... + Ап = А1’А2...А„, (4)
Л1 • Л2... Л„ = Л1 + Л2 4-... + Л„. (5)
4 Вывод формул (4) и (5). Покажем, что множества А1 ил 2 (J... (J А* и Л1ПЛ2Г|...ПЛ* совпадают (как обычно, Л* означает подмножество в Р* такое, что событие Л состоит в наступлении одного из элементов PJ, принадлежащего А *).
5*.7. Классическое определение вероятности. Теорема сложения вероятностей 391
Пусть P*i—произвольный элемент из Р* и пусть 7 = {4, i2, 4}—набор индексов таких, что P*ieAik; i, ke{l, 2, ..., п}. Если это множество непусто, то Р*еА 1 U^2 U ••• и Р'фА 1 П^2 А — CMnJ в этом случае Р- не принадлежит по крайней мере одному из А* (г=1, 2, ..., п) и Р*фА I А А 2 А ... ПЛ *п. Если же Р* не принадлежит ни_ одному _из Л - (т. е. I—{ii, h, • 4}^0)> то Р* не принадлежит (J^2 U — и
ЛI LM 2 U ••• в этом случае Р-еЛ J (j— 1, 2, ..., и) и Р|еЛ*3 f)A2 А — A^J-Таким образом, левая и правая части равенства
ЛЦл1йТйл1=л! А Л А... А
состоят из одних и тех же элементов (при любом наборе множеств А\, А2, ..., Л*), откуда вытекает равенство (4).
Аналогично можно установить совпадение множеств Л^А^гП-.-П^^ и лТиЛи...1Ж-
Два события Л и В называются несовместными, если множества Л * и В * элементарных событий, благоприятствующих событиям А и В, не имеют общих элементов.
Непосредственно из этого определения вытекает следующая теорема.
Теорема (теорема сложения вероятностей). Вероятность суммы двух несовместных событий равна сумме вероятностей этих событий.
3°. Аксиоматическое определение вероятности случайного события. Опыты, связанные с конечным пространством элементарных событий, дают важный, но далеко не исчерпывающий пример множества событий вместе с определенными на них вероятностями. Однако общее описание понятия вероятности удобно сделать, сохранив некоторые черты конечной модели.
5 Рассмотрим некоторое множество X, элементы которого будут играть роль элементарных исходов. Опыт, связанный с множеством X, заключается в том, что в X «случайно» выбирают некоторый элемент. В случае бесконечного множества X вероятность выбора данного элемента в условиях «равноправия» всех элементов равна нулю. Поэтому задать вероятность событий по формуле (1) невозможно. Понятие случайного выбора в опыте описывают более сложным, чем в конечном варианте, способом.
Для того чтобы разумно определить понятие вероятности, следует для подмножества А * благоприятствующих событию А исходов указать число Р(Л*) = Р(Л) — вероятность события А. При этом должны выполняться следующие свойства:
1°. 0^Р(Л)<1.
2°. Если А—невозможное событие, то Р(Л) —0.
3°. Если А—достоверное событие, то Р(Л)=1.
4°. Если A* сВ*, то Р(Л)^Р(В).
5°. Для несовместных событий Аг, А2, ..., Ап, ... справедлива формула
00
р(л1+л2+...+ли+...)= х р(4).
П=1
Это свойство функции Р(Л) называется счетной аддитивностью.
Оказывается, что во многих практически важных случаях невозможно построить функцию Р(Л), удовлетворяющую свойствам 1°—5° и определенную на множестве всех подмножеств.
392 Глава V*. Теория вероятностей
6 В этих случаях рассматривают не все подмножества, а только так называемые измеримые подмножества. Разумеется, множество Q измеримых подмножеств в X должно обладать такими свойствами:
1°. Хе£1.
2°. Если А\, А 2, ..., А*, ...е£1, то (J А„е£1 и Q A*=Q.
__ п= 1 п = 1
3°. Если A*gQ то A*gQ.
Итак, пусть дано некоторое множество X; среди множества всех подмножеств в X выделено подмножество Q измеримых подмножеств, удовлетворяющее вышеперечисленным свойствам 1°—3°. Пусть P(J*) — функция, сопоставляющая каждому А * е Q число 0 < Р (А *) 1 так, что выполняются свойства 1°—5°, сформулированные выше.
При этих условиях гройка (X, Q, Р) называется вероятностной моделью (вероятностным пространством), множество X—пространством элементарных исходов, подмножества А * е Q—событиями, а значения Р (А *) = Р (А)—вероятностями событий А. Таким образом, событие А отождествляется с подмножеством A*gQ, элементарных исходов, благоприятствующих А.
Изложенная точка зрения представляет собой аксиоматическое описание основных понятий теории вероятностей, принадлежащее А. Н. Колмогорову.
Наглядным примером вероятностной модели является следующий. Пусть X—множество точек квадрата 0<у<1; Q—множество тех подмно-
жеств в X, которые могут быть получены из множества По всех прямоугольников в X операциями счетного объединения и счетного пересечения; для всякого определено число Р(Л*), равное площади фигуры А*.
Вероятности событий в описанной вероятностной модели называются геометрическими вероятностями.
Отметим, что понятие площади фигуры невозможно определить для всех подмножеств в X. При этом построение подмножества, для которого нельзя разумным образом определить понятие площади, связано с очень сложными математическими построениями и так называемой аксиомой произвольного выбора. С другой стороны, измеримых множеств вполне достаточно для описания событий данной модели, связанных с какой-либо практической задачей.
§ 5 *.2. Условная вероятность. Независимость событий. Вероятность произведения событий. Теорема о полной вероятности.
Формулы Байеса. Последовательность независимых испытаний (схема Бернулли).
Предельные теоремы Муавра—Лапласа и Пуассона
1°. Теорема умножения вероятностей. Определение 1. Событие А называется независимым от события В, если вероятность события А не зависит от того, наступило событие В или нет. В противном случае событие А называется зависимым от события В.
Определение 2. Вероятность события А при условии, что событие В наступило, называется условной вероятностью и обозначается РВ(Л).
Теорема 1 (теорема умножения вероятностей). Вероятность произведения событий А и В равна произведению вероятности события А на условную вероятность события В при условии, что А произошло, т. е.
Р(ЛВ)=Р(Л)РДЯ).
(1)
5*.2. Формулы Байеса. Схема Бернулли. Теоремы Муавра—Лапласа и Пуассона 393
Для независимых событий А и В имеет место равенство
Р(Л£) = Р(Л)Р(В). (2)
Доказательство этой теоремы в случае конечного пространства элементарных событий непосредственно вытекает из определений и приведено в § 5.2.
Доказательство в общем случае основано на определении Рл(5) как отношения Р(ЛВ) к Р(Л).
Впрочем, доказательство теоремы умножения вероятностей для конечного пространства элементарных событий сопровождается (неявным) определением понятия «условная вероятность»—точнее говоря, способом вычисления условной вероятности, согласующимся с интуитивным представлением об этом . . Р(ЛВ)
понятии. Фактически было постулировано, что Рв(Л)=-^щ-. При таком толковании условной вероятности теорема умножения вероятностей становится непосредственным следствием этого определения.
Определение условной вероятности с помощью формулы
/ ч Р(ЛВ)
p'W-iW (3)
мотивируется следующими соображениями. Будем рассматривать только такие события А, для которых Л*сБ*> т. е. такие, наступление которых означает наступление события В. В этом случае сопоставим Р(Л) и РВ(Л) для каждого А. Для несовместных событий А2 это соответствие обладает таким свойством: если вероятностям Р(ЛХ), Р(Л2) и P(At+A2) соответствуют РвМ1), Рв(^г)> Рв(Л 1 + Ai), то
Pb(A+^2>Pb(A) + Pb(A). (4)
Из сравнения формулы (4) с формулой
Р(А +^2) = Р(^1 )+Р(Л2)
следует, что вероятность Р(Л) пропорциональна РВ(Л) с множителем пропорциональности X, зависящим от В, т. е.
Р(Л) = Х(В)Рв(Л).
Легко видеть, что Х(В) = Р(В), поскольку при А = В имеем Р(В) = Х(В) х х РВ(2?) = Х(1?). Этим оправдано определение условной вероятности с помощью формулы (3).
2°. Формула полной вероятности. Теорема 2 (теорема о полной вероятности). Пусть В19 В2, ..., Вк—попарно несовместные события, имеющие соответственно вероятности P(Bj), P(S2Р(А). Пусть событие А может наступить только вместе с одним из событий Bi9 В2, ..., Вк и РВ1(Л), Рв2(Л), .... РВДЛ) —условные вероятности события А при условии, что В19 В2, ..., Вк наступили. Тогда вероятность Р(Л) события А равна сумме произведений вероятностей событий Вк на условные вероятности РВк(Л), т. е.
Р(л) = Р(^)РВ1(Л) + Р(Б2)РВ2(Л)+...+Р(^)РВк(Л). (5)
Доказательство теоремы вытекает непосредственно из определений и теоремы сложения вероятностей. Оно приведено в § 5.2.
394 Глава V*. Теория вероятностей
3°. Формулы Байеса. Теорема 3 (теорема Байеса). Пусть события В19 В2, ..., Вк попарно несовместны и пусть событие А может наступить только вместе с одним из событий В19 В2, ..., Вк. Известны вероятности PfBA, Р(В2),...,Р(Вк) событий В19 В2, ..., Вк и условные вероятности РВ1(Л), РВ2(Л),...» PBl (Л) события А при условиях Вг, В2, ..., Вк. Известно также, что событие А наступило. Тогда вероятности событий Вг, В2, ..., Вк при условии, что А наступило, выражаются формулами
Р^РвДЛ)
4 ° Р(51)РВ1(Л)+Р(52)Рв2(Л)+...+Р(^)РвДЛ)’ u
Соотношения (6) называются формулами Байеса.
Доказательство теоремы непосредственно вытекает из определений и приведено в § 5.2.
4°. Последовательность независимых испытаний (схема Бернулли). Пусть производится серия из п испытаний, в каждом из которых событие А может наступить, а может и не наступить. Пусть при этом выполнено следующее условие: вероятность р наступления события А в каждом испытании постоянна, т. е. не зависит ни от номера испытания, ни от результатов предыдущих испытаний.
Это условие означает, что последовательность испытаний независима (вероятность р не зависит от результатов предыдущих испытаний).
Последовательность испытаний, удовлетворяющих указанному условию, называется последовательностью независимых испытаний (или схемой Бернулли}. Схема Бернулли полностью определяется двумя числами: натуральным числом п, означающим количество испытаний и числом /?(0</?<1), означающим вероятность наступления события А в одном испытании (безразлично, в каком по счету).
5°. Формула Бернулли. Вероятность Р„(&) того, что в последовательности из п испытаний в схеме Бернулли событие А наступит ровно к раз, находится по формуле
Pn(k) = Ckpkqn~k, (7)
п(п — 1) ...(п — к+ 1)
где С“ =-------------------число сочетаний из п элементов по к', р—
1 -2 ...к
вероятность наступлений события А в одном испытании, q=\—p— вероятность ненаступления события А в одном испытании.
1 Вывод формулы Бернулли. Рассмотрим последовательность из к плюсов и п—к минусов, расположенных в произвольном, но фиксированном порядке. Каждая такая последовательность задает событие при «-кратном испытании по схеме Бернулли: знак « + » или « —» на к-м месте последовательности означает соответственно наступление или ненаступление события А при к-м испытании. Вероятность такого события (расположение к плюсов и п—к минусов в произвольном, но фиксированном порядке) в силу теоремы умножения вероятностей равна pkqn~k и не зависит от порядка плюсов и минусов в рассматриваемой последовательности. При этом последовательности с различным расположением к плюсов и п — к минусов определяют различные попарно несовместные события. Количество последовательностей из к плюсов и п—к минусов равно числу сочетаний из п элементов по к. Действительно, последовательность будет полностью определена, если из
£ 5*.2. Формулы Байеса. Схема Бернулли. Теоремы Муавра —Лапласа и Пуассона 395
множества номеров {1,2, ..., п} выбрано к штук и плюсы последовательности поставлены на места с номерами из выбранного множества.
Отсюда по теореме сложения вероятностей получаем
где, как известно, число сочетаний из п элементов по к выражается формулой
п(п — 1)... (п — к+ 1) п\
1 • 2 ... к к\(п — к}\
2 6°. Локальная теорема Муавра — Лапласа. Теорема 4. Если л->со и к-^оо
так., что
то
при некоторых постоянных А и В.
Здесь Рп(/<) означает вероятность того, что в серии из п испытаний схемы Бернулли событие А наступит ровно к раз; р—вероятность успеха в одном испытании;
<р(х) = —5=е х2'2. у/2к
(Ю)
Локальная теорема Муавра — Лапласа устанавливает, что при указанных / к — пр\
<Р —7=
/ \ У-к/прЯ/
условиях отношение Ри(£) к ---------— близко к единице, и оценивает
x/W
отклонение этого отношения от единицы.
Доказательство этой теоремы связано со сложными выкладками и использует формулу Стирлинга
п 1~у/2'кпп,,е п при «->оо.
(11)
Знак ~ обозначает эквивалентность бесконечно больших величин п!
и у/2кп ппе п при п-+со, т. е. тот факт, что
х/2пп ппе п lim--------------= 1.
«->со п!
(12)
Вывод формул (11) и (12) и доказательство локальной теоремы Муавра — Лапласа приведены в более подробных курсах.
396
Глава V*. Теория вероятностей
Сформулированная выше теорема уточняет соответствующую теорему § 5.2.
3 7°. Интегральная теорема Муавра—Лапласа. Теорема 5. Если
у 1 а х (^-пр)3 (к2-пр)3
кг и к2 (к! <к2) изменяются так, что —-----и —---------стремятся
(npq) \npq)
к нулю, то
(k2—np\ (k^—npX j-ф _1 . (13)
у/ npq / \ у/ npq /
Здесь Р(/ч^к<к2) есть вероятность того, что в серии из п испытаний схемы Бернулли количество к наступлений события А будет находиться в пределах кг^к<к2, р—вероятность наступления события А в одном испытании;
х
(14)
знак ~ обозначает тот факт, что
1
₽(&! ^к<к2)
при «->оо.
(15)
Доказательство интегральной теоремы Муавра—Лапласа, так же как и доказательство локальной теоремы, связано со сложными выкладками и приводится обычно только в подробных курсах теории вероятностей.
Приведенная выше формулировка интегральной теоремы Муавра—Лапласа уточняет соответствующую теорему § 5.2.
8°. Теорема Пуассона. Теорема 6. Пусть «->оо, «>0 постоянно и р = а/п. Тогда в схеме Бернулли из п независимых испытаний в каждом из которых вероятность наступления события А равна р, справедливо приближенное равенство
ак
(16)
4 Доказательство. Имеем
р.Ы1--
<1*
2
= 1 — П —|--------
п 2 п
а2 а3 =1_й+___+...+о(1),
(17)
где о(1)->0 при «—>со. Таким образом, Р„(О>е-*.
Далее из формулы Бернулли вытекает, что
(18)
5*.3. Интегр. и дифференц. функции распределения. Совместное распределение
397
(19)
При fc=O, 1,2, ... исходя из формулы (18) и последовательно применяя равенства (19), получаем
7 3 к
z ч я z ч а , . а3 . . ак
Р„(1)«е-? Р„(3)«е~“ —, Р„(/с)«е-“—.
Формула (16) описывает вероятности Рл(/<) в схеме Бернулли при больших п и малых р = а!п. Следующая ситуация порождает именно такую схему Бернулли.
Рассмотрим работу телефонной станции, которая получает в среднем за час s вызовов. Найдем вероятность того, что за некоторый промежуток времени (для определенности—за 1 мин) на станцию поступит ровно к вы
зовов.
5 Разделив исследуемый интервал времени (Д=1 мин) на п частей Ду (у=1, 2, ..., п), количество вызовов за 1 мин можно рассматривать как сумму количества вызовов в каждом из интервалов Ду. Предположим, что вероятность одного вызова в каждом из Ду равна р (и не зависит ни от номера Ду, ни от количества предшествующих вызовов); предположим также, что вероятность двух вызовов за малый промежуток времени является величиной бесконечно малой более высокого порядка малости, чем \~sln. При этих условиях случайная величина к порождается схемой Бернулли при больших п и малых /? = 5/(б0«). В этой схеме Бернулли вероятность Pn(fc), как показано (s/60)fc
при доказательстве теоремы Пуассона, приближенно равна e-s/60———; более того, при и->оо вероятность Р(/<) того, что на станцию поступят к вызовов в минуту, будет равна е а —, где a—s)60.
к\
Перечисленные выше условия, которым по предположению удовлетворяет поток вызовов на телефонной станции, имеют следующие названия: стационарность (независимость вероятностей вызовов от номера Ду); ординарность (пренебрежимо малая вероятность двух вызовов по сравнению с вероятностью одного вызова в промежутках времени Ду, j=l, 2, ..., п); отсутствие последействия (независимость вероятностей вызовов в промежутке времени Ду от количества предыдущих вызовов.
§ 5*.3. Случайная величина. Дискретные и непрерывные случайные величины. Интегральная и дифференциальная функции распределения. Биномиальное, пуассоновское, нормальное, равномерное и показательное распределения. Совместное распределение нескольких случайных величин. Независимость случайных величин
1°. Случайная величина. О пр еде ление 1. Распределением дискретной случайной величины называется функция, сопоставляющая каждому возможному значению хк случайной величины ее вероятности рк (0^/?Л^1), причем £рл = 1.
398
Глава V*. Теория вероятностей
О пр еде ление 2. Интегральной функцией распределения случайной величины X называется функция переменной t, выражающая вероятность того, что X в результате испытания примет значение, меньше, чем число t.
Свойства интегральной функции распределения F(t)
1°. F( —оо) = 0, F(+oo)=l.
2°. при
3°. P(/i ^X<t2)=F(t2)—F(?i), где P(/1<Jf</2) означает вероятность того, что случайная величина X примет значения в промежутке [/1? Z2[.
Определение 3. Пусть X—непрерывная случайная величина и F(t) — ее интегральная функция распределения; далее, пусть F(t) дифференцируема всюду, за исключением, быть может, конечного числа точек
Производная F'(t) интегральной функции распределения называется дифференциальной функцией (дифференциальным законом) распределения непрерывной случайной величины X.
Свойства дифференциальной функции распределения /(/) = =К(/)
1°. /(0^ всюду, где f определена.
₽
2°. P(a^X<p) = f/(f)dz.
(X
3°. f/(z)dZ=l.
2°. Биномиальное, пуассоновское, нормальное, равномерное, показательное распределения. Определение 4 Распределение случайной величины т, равной количеству наступлений события А в схеме Бернулли из п испытаний, называется биномиальным распределением.
В этом распределении значению &={(), 1, 2, ..., п} случайной величины т соответствует вероятность Pn(k} — Ckpkqn~k, где р—вероятность наступления события А в одном испытании, a q=\—p.
Определение 5. Распределение случайной величины рк, принимающей
значения А:е{0, 1, 2, ..., и, ...} с вероятностями
ак
— е а.
к\
где я>0— некоторый
параметр, называется пуассоновским распределением (или распределением Пуассона).
Определение 6. Распределение непрерывной случайной величины X, заданной дифференциальной функцией распределения
/(z)=—5—=е-(^а)2/(2а2), (1)
называется нормальным распределением’, здесь а, сг>0 некоторые параметры.
Определение 7. Распределение непрерывной случайной величины X, заданное дифференциальной функцией распределения
{1 ------ при a^t^b, b~a (2)
0 при 1<а или t>b, называется равномерным распределением на отрезке [а, /?].
5*.5. Интегр. u дифференц. функции распределения. Совместное распределение
399
Определение 8. Распределение непрерывной случайной величины X, заданное дифференциальной функцией распределения
, , (ае at при t^O,
v 7 ( 0 при КО,
(3)
называется показательным распределением’, здесь а>0 — некоторый параметр.
Свойства всех перечисленных определений в общих чертах были рассмотрены в § 5.3. Там же приведены графики дифференциальных функций нормального, равномерного и показательного распределений; вероятностный смысл параметров этих распределений будет раскрыт в дальнейшем. Более строго свойства распределений будут сформулированы и доказаны в § 5 *.4.
3°. Совместное распределение нескольких случайных величин. Пусть результатом случайного испытания является упорядоченная пара чисел х, у. Будем говорить, что дана пара случайных величин X, Y, значения которых в данном опыте равны числам х, у. Положим
F(z1,r2) = P(Jf<r1, Y<t2), (4)
где Р(Л'<г1, Y<t2) означает вероятность того, что случайная величина X примет значение, меньшее, чем и при этом случайная величина Y примет значение, меньшее, чем t2.
Функция F(ti, t2) называется интегральной функцией распределения пары случайных величин X, Y.
Функция
/(*i, 12)~
d2F
dtr dt2
(5)
называется дифференциальной функцией распределения пары случайных величин X, Y.
Из определения функции F(tr, t2) непосредственно вытекает, что
P(cKX<b, c^Y<d)=F(b, d)—F(b, c)—F(a, d)+F(a, с), (6)
где P(cKX<b, c^Y<d) означает вероятность того, что значения пары случайных величин X, Y будут принадлежать прямоугольнику с вершинами (а; с), (a; d), (b; с), (b\ d).
Полагая в равенстве (6) b — a+Xa, d=c + Xc, где Ха, Хс малы, получим
Р(а^Х<а + Ха, К У<с+Ас) =
= F(a+Xa, c+Xc)—F(a+Xa, c)—F(a, c+Xc)+F(a, с). (7)
Покажем, что если функция F(t19 t2) имеет непрерывные частные производные второго порядка, то с точностью до бесконечно малых более высокого порядка малости, чем (Ая)2 + (Ас)2, справедливо равенство
d2F
Р(а^Х<а+Ха, c^Y^c+Xc) = -—— (а, с)ХаХс. (8)
oti ot2
1 Действительно, преобразуем правую часть равенства (7) следующим образом:
400
Глава V*. Теория вероятностей
F(a + Aa, с+Дс)—F(a+&a, c)—F(a, c + Ac)+F(a, с) =
, . 8F 8F к \(82F к , d2F к 82F 4 Л
=F(a, с)ч---Да+~— ДсЧ—( —гДд2 + 2-——Да Де+—5-Де 2 I—
v dt! dt2 2\8t2 dtidt2 8t% )
(9)
, 4 8F 1 82F , x cF A 1 82F k .
—F(a, c)----Ла---г- Ла2 —Fla, с}——Ла—~ —— Ac2 +
' ’ 8h 2 8t2 v ' dt2 2 dtl
d2F
+ F(a, с) + <?((Ай)2 + (Ас)2)=-—— (а, с)АйАс+<э((Абг)2 + (Ас)2). ctiOt2
В равенствах (9) использовано разложение функции F(fi, t2) в ряд Тейлора до второго члена включительно; здесь все частные производные берутся в точке ti~a, t2 = c.
Таким образом, с точностью до бесконечно малых более высокого порядка малости, чем (А«)2 + (Ас)2, вероятность того, что пара значений х, у будет принадлежать малому прямоугольнику с вершинами (а; с), (а-уЛа; с), d2F
(а; с+Ас), (я+Ая; с+Ас), равна -—— (а, с) Ла Ле.
OtiOt2
Пусть Р((х, y)eD) означает вероятность того, что значение пары случайных величин, т. е. точка (х; у), будет принадлежать области D. Из сказанного следует, что эту вероятность можно вычислить интегрированием:
Р((х, у)еD)=t2)dt1dt2. (10)
D
Аналогично рассматривают распределение к случайных величин Х19 Т2, ..., Хк. В этом случае интегральная функция F(rx, t2, ..., tk) и дифференциальная функция f(ti, t2, tk) определяются следующим образом:
F(ti, t2i ..., tk) = P(Xi <ti, X2<t2, ..., Xk<tk),
7 X dkF
f(ti, t2, ..., т~-
dti dt2... otk
Эти функции обладают свойствами, аналогичными свойствам функций F(ti, t2), /(^i, t2).
2 Условным распределением случайной величины X при условии У=уо называется распределение, заданное дифференциальной функцией
— 00
где f(ti, /2)—дифференциальная функция совместного распределения случайных величин X, Y.
Опр еделение 9. Пусть X и Y две случайные величины, a g(/), Л(^)—их дифференциальные функции распределения. Случайные величины X, Y называются независимыми, если дифференциальная функция их совместного распределения имеет вид f (^, t2)=g (?г) h (t2).
4°. Функции случайных величин. О пре деление 10. Пусть X—случайная величина и g(x) — функция, область определения которой содержит множество
5*.3. Интегр. и дифференц. функции распределения. Совместное распределение
401
значений случайной величины X. Функцией случайной величины X называется случайная величина g(X), которая в каждом испытании принимает значение g(x), где х—значение случайной величины X в том же испытании.
Пусть Xi, Х2, Xk — случайные величины, a g(x19 х2, ..., хк)— функция k вещественных переменных, область определения которой содержит множество значений совместно распределенных величин Х2, ..., Хк. Функцией случайных величин Хг, Х2, ..., Хк называется случайная величина g(X19 Х2, ..., Хк), которая в каждом испытании принимает значение g(x1? х2, ..., хк}, где х19 х2, ..., хк—значения случайных величин Х1} Х2, ..., Хк в том же испытании.
Для дискретных случайных величин X с распределением
хг
Х2
Pi
и функцией g, обладающей свойством g(xk)^g(xi) при xk^xt (k, 1=1, 2, ..., п), справедливо следующее утверждение.
Случайная величина g(X) принимает значение g (хк) с той же вероятностью, с какой случайная величина X принимает значение хк.
Если условие g(xfc)^g(xj при xk^xL не выполняется, то вероятность того, что случайная величина g(JV) примет значение gQ, равна сумме +Pi2+... +pir, где множество (4, i2, ..., ir) содержит номера всех х, для которых g(Xid=g(xl2)=... =g(xis)=g0.
3 Пусть X—непрерывная случайная величина, a g(x)—непрерывная строго монотонная функция, для которой, как известно, существует обратная функция g-1(x). Тогда вероятность P(oc^g(Ar)<p) того, что g(X) примет значения в промежутке [а, рГ, равна P(g-1 (a)^Jf<g~1 (р)), если g—возрастающая функция, и P(g-1 (P)^Ar<g-1 (а)), если g—убывающая функция.
Для немонотонных функций описание распределений случайных величин g(X) носит более сложный характер. Вероятность Р (а g (X) < р) в этом случае можно описать так. Пусть D означает множество тех х, для которых g(X) удовлетворяет условию a^g(Jf)<p. Тогда
P(a<g(X)<p)=f/(z)dZ,
D
где f(t)—дифференциальная функция распределения случайной величины X.
Действительно, неравенство a^g(Jf)<P выполняется тогда и только тогда, когда XeD\ в силу известного свойства дифференциальной функции
распределения вероятность того, что XeD, равна j/(/)dr.
D
Описанный выше подход к описанию распределений функции от случайных величин применим и к функциям нескольких случайных величин.
Пусть Xi, Х2, ..., Хк—случайные величины и g(Xi9 Х2, ..., функции этих величин. Вероятность того, что g(Xr, Х2, ..., Хк) с D, равна вероятности того, что (У1, Х2, ..., Хк) eg-1 (£>). Здесь D— интервал числовой прямой, a g-1(Z>) означает прообраз интервала D при отображении g, т. е. множество точек (хг, х2, хк) в А>мерном пространстве таких, что g(x1? х2, ..., xk)eD.
Теорема (о распределении суммы независимых случайных величин). Пусть X, Y—независимые случайные величины, a f(t) и g(t)
402 Глава V*. Теория вероятностей
— дифференциальные функции их распределений. Тогда дифференциальная функция распределения случайной величины Х+ У имеет вид f f (t—s}g(s}ds.
— 00
4 Доказательство. По данной непрерывной случайной величине X построим дискретную величину X, приближающую X способом, описанным в п. 1° § 5.3. А именно, рассмотрим множество Q чисел вида т)А (& = 0, +1, + 2, ...; т] — малое число). Положим, по определению, что случайная величина X принимает значение v\k, если т|&< Jf<r| (k +1). Тогда вероятность п(*+1)
Р(^=Т|А;)= j f(t)dt=f(ck)T[, где f—дифференциальная функция распред еле-Т]Л
ния случайной величины X, а ске]т)*А:, л(^ + 1)[ (предполагается, что функция f непрерывна). Аналогично построим дискретную величину У исходя из непрерывной случайной величины У: значениями случайной величины У являются числа т\1 (1=0, ±1, ±2,...); вероятность Р(У=т]/) =
n(*+i)
= f g(t)d(t) = g(dk)т|, где g(t)—дифференциальная функция распределения
T)-k
случайной величины У.
Вероятность того, что случайная величина Х+ У примет значение три, равна сумме вероятностей попарно несовместных событий Ак^: Х=т\к, Y=,r]l, k+l=m, к = 0, +1, ±2,... . Из независимости величин X, У вытекает независимость величин X, У; поэтому Р(Т=Г]/<, У=т]/) =
= P(X=t]k) P(Y=t]l)=f(ck)g(cl)ri2. Отсюда
P(X+f=m)= £ /(c*)g(^)n2 = k + l — m
= п( f j=
\ — 00 /
+ 00
= T) f 7(r-.s)g(s)ds+o(n). — 00
Случайные величины X и X, Y и Y, X+ Y и X+ Y мало отличаются друг от друга в том смысле, что разности X— X=£i, У—У=£2, X+Y—X+Y=z3, X+Y— X— У=е4 представляют собой случайные величины, значения которых в результате любого опыта не превосходят т|.
Вычислим теперь значение дифференциальной функции распределения случайной величины Х+ У в точке i как предел:
Р(/<АЧ-У<?+т|) Р(^< АЧ-У+£3 + £4<Z+t|)
lim----------------= lim-----------------------=
т]->о Л п->о Л
P(f-E3 — £4<АЧ" Y<t+ Л~ £3-^4) = lim------------------------------.
п—>0 Л
Так как разность между р —£3 —£4 и t— £3 — £4 равна т|, то
P(z-£3-£4<Y<t+ Л~£3 — £4) = Л f
£ 5*.4. Мат, ожидание и дисперсия случ. величин. Ковариация корреляция 403
здесь и—единственное число вида и = ч\т, где т—целое, а \т — Г|<2ц, которое принадлежит отрезку [/ —83 — 84, /+т| —83 — 84]. Поэтому
+ 00
Р(г<Х+ Г</ + г|) f ,, \ \ .
л-*о Л J
С другой стороны,
Р(г<У+Г<Г+ц)
1ПП----------------=JX + Y И )•
п->0 п
Итак, дифференциальная функция распределения случайной величины Х+ Y имеет вид J /(/—s)g(s)ds.
§ 5 *.4. Математическое ожидание, дисперсия и другие моменты случайных величин, их свойства.
Ковариация, коэффициент корреляции
1°. Математическое ожидание и дисперсия случайной величины. О пр еде ление 1. Пусть X—дискретная случайная величина, закон распределения которой имеет вид
(1)
—значения величины X, а ^—соответствующие вероятности; z=l, 2, п). Математическим ожиданием дискретной случайной величины X называется число
MX—xt рх +х2р2 +... +хпрп. (2)
О пр еде ление 2. Пусть X—непрерывная случайная величина и /(/)—ее дифференциальная функция распределения. Математическим ожиданием непрерывной случайной величины X называется число
МХ= f (3)
- 00
(если этот интеграл сходится)
О пр еде ление 3. Пусть X—дискретная случайная величина с распределением (1). Дисперсией дискретной случайной величины X называется число
T>X=t(xk-MX)2pk, (4)
fc = l
где MX—математическое ожидание случайной величины X.
Определение 4. Пусть X—непрерывная случайная величина и f(t)—ее дифференциальная функция распределения. Дисперсией непрерывной случайной величины X называется число
DX= J (z-MAj2/(z)d/ (5)
- 00
404 Глава V*. Теория вероятностей
(если этот интеграл сходится); MX означает математическое ожидание случайной величины X.
Для дискретной случайной величины X с распределением (1) справедлива формула
DX=X*zA-(X**a)z- (6)
1 Вывод формулы (6). Согласно определению дисперсии, получим
VX= t (xk-MX)2pk=Y(xl-2xkMX+(MX)2)pk = к=1 00
= X xipk-2MXXxkpk+(MX)2Ypk=
Рк~2(мХ)2+(МХ)2=Хх* Рк-(хкрку. п п
Здесь учтено, что ^хкрк = МХ и £pfc = l. fc=l k=l
Для непрерывной случайной величины X с дифференциальной функцией распределения f(t) справедлива формула
DX= J r2/(r)dr-( f r/(r)dr). (7)
— oo — 00
2 Вывод формулы (7). Имеем
DY= f (z-MX)2/(z)dZ= f (t2-2(MX)t+(MX)2)f(t)dt = — oo — co
+ 00 + 00 + 00 + CO + 00
= f t2f(t)dt—2M f z/(z)dz+()VLr)2 f /(z)dz= f t2f(t)dt-( f Z/(z)dz)2. — oo —oo —CO —00 —oo
+ 00 + 00
Здесь учтено, что f //(/)d/ = MXn J f(t)dr = 1; предполагается, что интегралы + — oo — 00
J r2/(r)dr и f сходятся.
— co - 00
Свойства математического ожидания 1°. М(У+ У) = МУ+МУ для произвольных случайных величин X, Y (зависимых или независимых).
2°. М(ХУ) = ХМУ для любой случайной величины X и произвольного числа X 3°. М(УУ) = МУ-МУ для независимых случайных величин У, У.
3 Доказат ельство. 1°. Пусть сначала У и У—дискретные случайные величины; х2, ..., хк и у15 у2, ..., yt—их значения; р2, ..., рк и ql9 q2, ..., —соответствующие вероятности. Пусть значение пары случайных величин У, У—пара чисел xr, ys—имеет вероятность Prs. Тогда
I к к I I к
м(х+ r)= X X &+л)Л,= X X Prs+ X л X Л.= 8=1г=1 г = 1 8=1 S = 1 г = 1
к I
= X хгР,+ X Л^=МА'+МК Г=1 8=1
I к
Здесь учтено, что Prs=pr, ^PrS = qS’ Действительно, событие, состоящее 8=1 Г=1
в том, что У примет значение хг, является суммой попарно несовместных
£ 5\4. Мане ожидание и дисперсия случ. величия Ковариация корреляция 405
событий (xr,yk), (х„у2), (хг, у„), откуда pr=Prl+Pr2+...+Prs; аналогично к
показывается, что £ Prs = qs.
г - 1
Пусть X и Y—непрерывные случайные величины; /(/) и g(t)—их дифференциальные функции распределения; F(tY, Г2)—дифференциальная функция распределения пары X, Y. Имеем
4- со + оо
M(X+r)= f J (z1 + /2)^(/1>/2)d/1d?2 =
— 00 — 00
+ 00 + 00 + СО + 00
= f Ч f r2)dz2+ f t2 f F(/1; Z2)d/1 =
— oo —oo —oo —00
+ 00 + 00
= f <i/(G)di1+ f t2g(t2)dt=MX+MY.
— 00 — 00
Здесь учтено, что f F(z1, z2)dr2=/(z1) и f F(tt, t2)dt2=g(t2). — oo — 00
2°. Для любой случайной величины X и произвольного числа X имеем
М (XX)=Х YxkPk=Х£ хк рк=ХМ X;
М(ХХ)= f Xr/(z)dr=X f z/(r)dZ=XMX.
Эти равенства доказывают справедливость свойства 2° для дискретных и непрерывных случайных величин.
3°. Пусть сначала X и Y—дискретные независимые случайные величины;
х2, ..., хк и _у2, yt—их значения; р2, ..., рк и q2, qt—соответствующие вероятности. Тогда вероятность того, что X примет значение xr, a Y—значение ys, равна prqs. Найдем математическое ожидание случайной величины XY:
S г
Пусть теперь X и Y—независимые случайные величины, a f(t) и g(t)—их дифференциальные функции распределения. Тогда дифференциальной функцией совместного распределения пары (X, Y) является функция F(tY, £2)=/(/i)£^2)-Тогда, согласно определению математического ожидания непрерывной случайной величины, имеем
+ со + оо м(хг)= f f — СО — со
+ 00 + со
= f 'Mdtp f <2g(/2)d<2=My-MK — 00 — 00
Свойства дисперсии
1°. DC=0, где С—постоянная.
2°. D(AX) = A,2 DX для любой случайной величины X и произвольного числа X.
3°. D(A4-r) = DJr+DF для независимых случайных величин X и Y.
4 Доказательство. 1°. Всякую постоянную С можно истолковать как дискретную случайную величину, принимающую одно единственное значение С с вероятностью р=\. В этом случае DC=(C—С)2 • 1 =0.
406 Глава V*. Теория вероятностей
2°. Для дискретной случайной величины X с распределением (1) имеем
D(MT)= £ (Кхк-МХХ)2 рк = Х2^(хк-МХ)2 p^^DX. k=l
Для непрерывной случайной величины X с дифференциальной функцией распределения /(/) получим
D(XX)= f (Xz-M(A.A'))2/(?)d/ = X2 f (t-MX)2f(t)dt = X2BX. — 00 — 00
3°. Пусть сначала X и Y—дискретные случайные величины; х2, хк и у17 у2, - Yi —их значения; р19 р2, рк и ql9 q2, ..., qt—соответствующие вероятности. Тогда вероятность того, что X примет значение хгЧ a Y—значение ys, равна prqs. При этом
D(x+ г)=ЕХ[к+Л)-м(х+ r)]2Aft=
= X X (+•+Л)2 Р, <Ъ - [М (X + Y)] 2 = X X X 2 pr qs + Г S Г S
+ Е^2А^ + ЕЕ2хгЛрг^-(МХ)2-2МХ-МУ-
-(му)2==1х,2-(мх)2+Еь2-(му)2+2Езд-1л^-мх-му=
= ^r2-(MX)2 + ^b2-(My)2 = DI+Dy.
Здесь использованы тождества ^Рг = 1, Ел = L М (X • МУ и формула (6).
Пусть теперь X и У—независимые случайные величины, a /(f) и g(f)—их дифференциальные функции распределения; тогда дифференциальная функция совместного распределения пары (X, У) имеет вид F(t19 f2)=/(*i) #(<?)• Далее, находим
+ 00 + 00
D(X+X)= f f (z1 + Z2-Mpr+y))2/(?l)g(f2)= “00 — co + oo 4- oo
= J f (G + ^)2/(^i)^(^)dGdz2-(M(X+y))2 =
— 00 — co + 00+00 +00+00
= f f tif(tl)g(t2)dtldt2+ f f ‘2f(ti)g(t2)dtldt2 + — 00 — 00 — 00 — 00
+ 00 +00
+2 f f /1Z2/(/1)g(G)drIdz2-(MA-)2-2M(A'y)-(My)2 =
— co — 00
+ co +00
= I ^i/(?i)d?i+ f t2g(t2)dt2-MX2-MY2 + — 00 —00
+2 f tlf(t1)dti f t2g(t2)dt2-2MX-MY=DX+DY. - co — 00
+ 00 too
Здесь использованы тождества f /(fjdf^l, J и формула (7).
— оо - 00
2°. Математические ожидания и дисперсии биномиального, пуассоновского, нормального, равномерного и показательного распределений
1. Биномиальное распределение. Здесь случайная величина к означает количество наступлений события А в схеме Бернулли из п испытаний.
5*.4. Мат. ожидание и дисперсия случ. величин. Ковариация, корреляция 407
5 Очевидно, что кп равна сумме п независимых случайных величин &(1), ^(2>> —» гДе (*=1> 2, п) — случайная величина, равная количеству
наступлений события А в z-м испытании, при этом k(i) принимает значения 0 и 1 с вероятностями q=\—p и р. Таким образом, распределения случайной величины k(i} (z= 1, 2, ..., и) одинаковы и задаются таблицей
0 1
<1 Р
Отсюда DA;(i) = O -^+12 • р — (0 -q + 1 'р)2=р~р2=р<1-
Согласно свойству 1° математического ожидания, имеем
Mkn = YMk(i} = np. (8)
Аналогично, в силу свойства 1° дисперсии,
D^ = XDA;(£) = ^. (9)
2. Пуассоновское распределение.
Здесь значение ^={0, 1, 2, ...} принимается
с
6
вероятностью P(s) = e‘ Используя формулы
s’!
(2) и (4),
находим
00 e ~aas 00 as~}
X s-----=е~аа X 7-------------v-=e~aa-еа = а, (10)
s=0 **! s=i(J—
Таким образом, параметр а пуассоновского распределения равен математическому ожиданию и дисперсии пуассоновской случайной величины
3. Нормальное распределение. Дифференциальная функция нормального
распределения случайной величины X имеет вид f(t) =-----------— е-(*-а)2/(2о2)
ст ^/2 тс
7 Сначала, используя формулу (3), найдем математическое ожидание:
Ь ОО + СО
Г 1 fl zje-(t-«)2/(2a2)
Г----- Q-^-a^/(2.2}dt== (z_^_L_e-^-«Wa2) + ^____________________________dt==
J a J а а/2тс q /2Й
- 00 - co
+ OO + 00
| we“"2/2dw+zz——= I e““2/2dw = a,
J -\/2я J
-oo — co
(12)
+ 00
Здесь произведена замена переменных w=(z—я)/а, учтено, что J we““2/2dw = 0
- 00
как интеграл от нечетной функции в пределах от — оо до +оо; кроме того,
408
Глава Г*. Теория вероятностей
+ 00
использован тот факт, что J e~z2 dz= у/л (интеграл Пуассона) и, следователь-“ 00 + оо
но, j e~w2/2dw=^/27c.
Таким образом, параметр а нормального распределения совпадает с математическим ожиданием.
Теперь найдем дисперсию. Применяя формулу (5), имеем
DX=
J су -ч/2т1
- оо
После замены переменных (t — а)/<з=и получим
° - f u2e““2/2dw. ^/2 л J
Последний интеграл можно вычислить по частям: су2 DX--—
ь 0° I ,-е-2
f f uuq~u212 du = - u( — e~u2/2)
2 Л _ — oo _ yj 2 Л _
2л _
+ f е и2/2 du =
— ^/271 = а2.
(13)
Дифференциальная функция распределения X имеет
Значит, параметр с нормального распределения совпадает со среднеквадратическим отклонением, а су2 — с дисперсией.
4. Равномерное распределение. равномерной случайной величины
вид
при
t<a,
8 Находим
М1=
b—a
О
при
при
ь
f— dt= b — a
2 (Ь - а)
Ь2 — а2 а + Ь 2\Ь-а\~~2~"
(14)
b
Г /2 1 (a + b' ------d/—(--------
J b — a a
b (a-\-b)2 b3 — a3 (a + b)2 4(a2 + ab + b2)—3 (a + b)2 ___ _ ___
DX=
Г
3(Ь —а)
3(Ь —а)
/И =5
О
2
2
4
t
а + Ь
2
2
|a-Z>|
<sX=—
12 ./3
(15)
5. Показательное распределение. Дифференциальная функция распределения показательной случайной величины X имеет вид
$ 5*.4. Мат. ожидание и дисперсия случ. величин. Ковариация, корреляция
409
9 Имеем
0 при
Xe“Xt при
Г>0.
МХ= zXe“x,dz=z
X
е и
О
1
X*
4 UaU.
X J X о
(16)
Г 1
DX- г2Хе"хМг------7-Х/2
X2
е и :7~
о
1
2re ---------г
X2
о
о
2 1
^Х2"!^
1 1
-X <зХ=-X X
(здесь применена формула интегрирования по частям).
Таким образом, величина 1/Х в показательном распределении и среднеквадратическим отклонением
(П)
совпадает
с математическим ожиданием
3°. Ковариация и коэффициент корреляции. О пр ед е ление 5. Пусть X, У— случайные величины, XY—их произведение, MX. МУ, М(ХУ)—математические ожидания этих величин, суХ, су У—среднеквадратические отклонения случайных величин X и У.
Число
суХсуУ
(19)
к(Х, У) = М(ХУ)-МХ-МУ (18)
называется коэффициентом ковариации случайных величин X, У, а число
/с(Х, У)_М(ХУ)-МХ-МУ
’ суХ-суУ
— коэффициентом корреляции.
Свойства коэффициента корреляции
1°. г(Х, У) = 0 для независимых случайных величин X, Y.
2°. — 1^г(Х, У)<1 для любых случайных величин X, У.
3°. Если |г(Х, У) |==1, то случайные величины X, У связаны нием
соотноше-
(20)
где то
У=яХ+6,
а и b—некоторые постоянные {если г(Х, У)=1, то а>0; если г(Х, У)= —1,
Обратно, если X, Y связаны соотношением (20), то |г(Х, У)|=1 (г(Х, У)=И а<0 и г(Х, У)=1 при а>0).
Доказательство. 1°. Так как случайные величины X и Y независимы, М(Х, У) = МТ- МУ (согласно свойству 3° математического ожидания.
при
10
то
Поэтому к'(Х, У) = 0, г(Х, У) = 0.
2°. Рассмотрим случайную величину Z=(cr Y)X+(aX) Y, где аХ и стУ— среднеквадратические отклонения случайных величин X и Y. Используя свойства математического ожидания и дисперсии, имеем
DZ=M[(ay)2X2 + 2aX-cy-Zy+(cX)2 У2] — (ст У-МУ+ аХ-МУ)2 =
= DY-MX2 + 2uX-<yY-M(XY}+DX-MY2-VY(MX)2-2<yX-vY(MX)(M.Y)-— DX-М У2 = DX-D У+DX D У—2qJT-ст У-/с (X У).
Так как DZ^O, то DX DY^vX- cY к(Х, У), откуда
410
Глава V*. Теория вероятностей
1
к(Х, Y)_ суX - су Y~r
(X У).
(21)
Проводя аналогичные преобразования со случайной величиной Z=(cyY)X— — (суX) У, находим
-1<г(У, У). (22)
3°. Очевидно, что равенства в (21) и (22) достигаются тогда и только тогда, когда DZ=0. В этом случае при Z=(cyY)X+(cyX) Y= C=const получаем соотношение
У=----х+—,
суХ суХ
(23)
которое определяет зависимость вида (20) между X и Y. Аналогично, при Z = (cy Y)X— (суУ) У= С= const получим
а У С
--Х+---
суХ суХ
(24)
Ясно, что в (23)—огУ/(тУ<0 и, значит, г(Х, У)= — 1, а в (24) аУ/аУ>0 и, значит, г(Х, У) = 1.
Справедливы следующие формулы:
к(Х, у)=м[(у-му)(у-му)],
(25)
г(Х У)=
М[(Х-МХ)(У-МУ)]
стХстУ
(26)
11 д оказательство. Имеем
М [(У- МУ) (У- М У)] = М [У У— (MX) У- (М У) Х+ МУ • М У] =
= М(УУ)-МУ-МУ-МУ’МУ+МУ-МУ=М(УУ)-МУ-МУ=^(У, У).
Этим доказана формула (25); формула (26) непосредственно вытекает из (25).
Пусть X и У—дискретные случайные величины; х2, ..., хк и у19 J22, ..., yt—их значения; р2, ..., рк и qr, q2, ..., qt— соответствующие вероятности; prs—вероятности совместного появления значений хг и ys. Тогда формула (26) примет вид
Г' ’У> аХаУ
12 Аналогично можно показать, что для непрерывных случайных величин X, У с дифференциальными функциями распределения f(t), g(t) и дифференциальной функцией f(tlt t2) совместного распределения пары случайных величин У, У справедливы формулы
к(Х, У)= J f (ft-MX)(z2-My)/(G,f2)dG<k2, (27)
— ОО — 00
J J (G-MXjfe-My)/^, r2)dGdr2
r(X, У) = ^^2-------——----------------. (28)
cyXcyY
5*.4. Мат, ожидание и дисперсия случ. величин. Ковариация, корреляция 411
4°. Моменты случайных величин. Пусть X—случайная величина. Числа mk=MXk (k=0, 1, 2, ...), (29)
где М знак математического ожидания, называются Хми начальными моментами случайной величины Х\ числа
— a)k, (30)
где а—некоторое число, называются Аг-ми относительными моментами случайной величины X (относительно я); числа
m" = M(X-MX)fc (31)
называются /<-ми центральными моментами случайной величины X.
13 В задачах теории вероятностей и математической статистики особенно важны центральные моменты. Справедливы следующие формулы, выражающие центральные моменты через относительные:
т2=т'2 — (mi)2, тз=т'3 —3m'2mi+2(mi)3, (32)
Am'^m'i + 6m'2 (mi)2 — 3 (mi)3.
Вывод формул (32). Имеем
m'2 = М (X- MX)2 = М [X- а - (MX- л)] 2 =
= М [(X- а)2 - 2 (X-а) (М (X) - а) + (MX- а)2] =
= т'2 — 2 (MX— а)М(Х— я) + (М(Х)—а)2 = т'2 — 2(mi)2 + (mi)2=m'2 —(mi)2; т'з = М(Х—МХ)3 = М[Х—л —(MX—<з)]3 =
=М [(X- а)3 - 3 (X- а)2 (MX- а) + 3 (X- а) (MX- а)2 - (MX- а)3] =
= т'3 —3m'2mi + 3(m'i)3 —(т'1)3 = тз —3m'2mi 4-2(mi)3;
ml = М [(X- MX)4] = М [(X- а) - (MX- а)] 4 =
= М [(X- а)4 - 4 (X- а)3 (MX- а)+6 (X- а)2 - 4 (X- а) (MX- а)3 + (MX- а)4] = = т4—4т'3т'1 +6m'2(mi)2 —4(mi)4 + (mi)4 = m4 —4т'3т'1 +6m'2(mi)2 —3(mi)4.
Для пары случайных величин X, Y рассматривают моменты
т'1;=М(Х-а)‘(у-Ьу, z,j=O, 1, 2, ... .
Они называются соответственно начальными, относительными и центральными моментами порядка /, j.
Пусть X и Y—дискретные случайные величины; х19 х2, ... хк и yi, у2, ..., yi—их значения; ръ р2, рк и q2, ..., qt—соответствующие вероятности; prs —вероятность совместного появления значений xr, ys. Тогда справедливы следующие формулы:
412
Глава V*. Теория вероятностей
тц=^х‘гУ1Ргз,
r,S
т'ц = 1^(хг-а)‘(у.-ЬУ prs, (33)
г, s
«1у=Х(^-мх);(л-м^р„.
r,S
14 Для непрерывных случайных величин X, Y с дифференциальными функциями распределения /(/), g(/) и дифференциальной функцией f(tr, t2) совместного распределения пары (X, У) справедливы аналогичные формулы:
ти= i f z2)d*id*2,
m'tj= f f (t1—aY(t2—b)if(t1, r2)dr1dr2, (24)
— 00 — 00
+ 00 + 00
m"j= f H'l-W^-MlWb^d'tdZz. — 00 — 00
§ 5*.5. Закон больших чисел. Неравенство Чебышева. Теорема Бернулли. Теорема Чебышева
Лемма (неравенство Чебышева). Пусть X—произвольная случайная величина; MJf и DX—ее математическое ожидание и дисперсия; 8>0— произвольное вещественное число. Тогда имеет место неравенство
/ ч DJT
Р(|%-М%|<е)>1-р-, (1)
где Р( | X— МУ| <е) означает вероятность того, что отклонение случайной величины X от своего математического ожидания MJf меньше 8.
1 Доказательство. Пусть X—дискретная случайная величина, распределение которой задано таблицей
Xj Х2 ... Хп
Pi Рг ... Рп
Имеем
DJT= X (xi-МА')2/7г = Х'(л,— МХУpi+Y"(х1-^ЛХУPi, i=l
где Y'(xf- Ml)2/?,- означает сумму всех слагаемых вида (xf—таких, что (Xi — Ml)2<82, a Y"(xi—MX)2pi—сумму всех слагаемых вида (xf—MJf)2pf таких, что (%/ — МХ)2>е2. При этих условиях £"(xf—MX)2 р^^" Рь £' (xi — MLY)2 pi 0, откуда
BX^s2Y/fPi,
где под знаком собраны вероятности всех тех значений хь для которых (xi — MX)2^e2. Поэтому ^',pi = P(| X— МУ| и, следовательно,
DA>82P(|Z-MJn ^8) = 82[1-Р(|Аг-МАг| <е)].
5*.6. Характеристические функции. Центр, предельная теорема Ляпунова 413
Из последнего соотношения получим
Р(|А-МХ| <8)>1--2-.
Аналогично доказывается неравенство Чебышева для непрерывной случайной величины X с дифференциальной функцией распределения /(/). Имеем
DX= f (z-MX)2/ (?) dz=J' 1t—MI| V (?) dz+J" 11-MX I 2f (t) dz.
Интеграл j' взят по множеству тех значений z, для которых |Z—МХ| <е, a J" — по множеству |z — МХ| >е. Отсюда получим
DX>e2f'/(z)dz,
где J'/(z)dZ равен вероятности того, что |z—МХ| >е. Следовательно, Ш>е2Р(|Х-МХ| >е) = е2(1-Р(|Х-МХ| <е))
и, наконец,
/ ч
Р 1Х-МУ1 <е)^1------г.
8
Теорема 1 (теорема Бернулли). Пусть кп — количество наступлений события А в серии из п испытаний схемы Бернулли, р—вероятность наступления события А в одном испытании. Тогда
lim Р
И—>00
Теорема 2 (теорема Чебышева). Пусть Xt(i= 1, 2, ..., п)—попарно независимые случайные величины с одинаковыми распределениями’ МХ[ = а, DXi=o2. Тогда имеет место соотношение
§ 5*.6. Предельные теоремы. Характеристические функции и их свойства. Центральная предельная теорема Ляпунова
Опр еделение. Характеристической функцией случайной величины X называется математическое ожидание случайной величины eItX.
Свойства характеристических функций
1°. Пусть X, Y—случайные величины такие, что Y=aX, где а—постоянная. Тогда gy(t)=gx(at), где gx(t) и gy(^—характеристические функции случайных величин X и Y.
2°. Характеристическая функция gx+y(t) суммы двух независимых случайных величин X и Y равна произведению их характеристических функций gx{t) и gr(t\
Теорема (центральная предельная теорема Ляпунова). Пусть Xi, Х2, —•> Хп—одинаково распределенные случайные величины с математическим ожиданием MXi = a и дисперсией DX=o’2. Тогда при большом п распределение суммы У=А'1 + У2 + ... +Хп близко к нормальному распределению.
414
Глава V*. Теория вероятностей
1 Доказательство. Положим %£ = (А^~а)/а; так как все случайные величины Xi одинаково распределены, то и величины Xi(i— 1, 2, ..., п, ...) распределены одинаково; их общую функцию распределения обозначим через f (t). Очевидно, что
мхг=о, ш>1, (1)
где М и D—соответственно математическое ожидание и дисперсия.
Пусть g(t)— характеристическая функция случайной величины (/=1, 2, ..., и...) (характеристические функции одинаково распределенных величин совпадают). Тогда характеристическая функция случайной величины
(Д+Х2+ ... +Д)/Л/й в силу приведенных выше свойств равна g[—=]".
Разлагая функцию g(t) в ряде Тейлора в точке Г = 0, имеем g(z)=g(0)+g'(0)z+^4^+a(z))z2, (2)
где а(/)->0 при г->0.
Значения g(0), g'(0), g"(0) можно вычислить следующим образом:
+ 00 + 00
g(0)= f ete/(x)dx|/=0= f/(x)dx=l (3)
— oo — co
[здесь использовано известное свойство функции распределения /(%)];
g'(0) = ( f eltx/(-x)d-x)z=o=: f zxeux/(x)dx| f ix/(x)dx = /MJf=O (4) — oo — oo — co
[здесь применено правило дифференцирования интеграла по параметру, а также учтены равенства (1)];
+ 00 + со
g"(0)=( f е-“*/(*) <М"= о = f -x2/(x)dx=-l (5)
— 00 — 00
+ со
(так как Ш?=сг2 = J x2/(x)dx—(IVLV)2, то при МХ=0 получаем
— 00 + 00
J X2f(x)dx==T)X=<52= 1).
— 00
Следовательно, характеристическая функция случайной величины (Xi+Xz-l- ... +Х^!у/п имеет вид
При п ->оо получаем
Итак, предел случайной величины Yn — (Xi+X2+ ••• + Х)/-\А в качестве характеристической функции имеет функцию е~1 /2.
Далее, докажем, что для нормального распределения с математическим 1 2
ожиданием <7 = 0, дисперсией <у2 = 1 и плотностью вероятности f (х) = ------— е~х /2 у/Хл
характеристическая функция имеет вид g(t) = e'~t Действительно,
j> 5*.6. Характеристические функции. Центр, предельная теорема Ляпунова
415
f2/2 1 f _z2 _^/2
= е —— е dz=e 1 .
у/к J — 00
+ 00
Здесь использована подстановка z=(x—it)/y/2 и учтено, что Je~z & = у/л (интеграл Пуассона). - <»
Можно доказать, что если последовательность характеристических функций gift) распределений /(г) сходится к некоторой функции g(t), являющейся характеристической функцией распределения f(t), то последовательность распределений fi(t) сходится к f(t) (сформулированное утверждение принимаем без доказательства).
Поэтому распределения случайных величин Yn = (Xl-^-X2+ ... +Хп)/у/п (п=1, 2, ...) при и->оо стремятся к нормальной случайной величине, имеющей нулевое математическое ожидание и единичную дисперсию.
Отсюда следует, что случайная величина у/п Yn=X1+X2 + ... +Х„ при больших п имеет распределение, близкое к нормальному с нулевым математическим ожиданием и дисперсией, равной п.
Наконец, случайная величина — +Xn = G y/nY„+na имеет рас-
пределение, близкое к нормальному с математическим ожиданием па и дисперсией пи2. Последнее утверждение совпадает с утверждением центральной предельной теоремы.
Утверждение о нормальном распределении суммы большого количества случайных слагаемых справедливо при более общих предположениях, чем те, которые использованы в приведенном выше доказательстве: слагаемые Xi могут быть и не одинаково распределены.
2 Приведем формулировку одного из обобщений центральной предельной теоремы Ляпунова.
п
Пусть Y— £ Хк—сумма независимых, имеющих быть может, различные к=1
распределения случайных величин, Dfc—дисперсия Хк, а Ьк—третий абсолютный момент случайной величины Хк, т. е. М(|X— Л/Т|3). Пусть при этом
£ьк
lim nfe~1-----= 0.
Dfc)3/2
И=1
Тогда распределение случайной величины Y„ при п-+со стремится к нормальному.
416
Глава V*. Теория вероятностей
§ 5*.7. Цепи Маркова. Теорема о предельных вероятностях. Вычисление предельных вероятностей. Стационарное распределение
Опр еделение 1. Последовательность испытаний объекта с конечным или счетным множеством состояний А±, А2, ..., Ап, ... и вероятностями перехода Pij из состояния А[ в состояние Aj, зависящими только от номеров i и j, называется цепью Маркова.
Опр еделение 2. Пусть дана цепь Маркова с п состояниями Аг, Л2, ••., Ап и вероятностями ptj перехода из состояния в состояние Aj. Тогда матрица
IP11 Р12 - Pin \
Р21 Р22 ••• Р2п |
Рп1 Рп2 ••• Рпп j называется матрицей вероятностей перехода.
Цепь Маркова называется регулярной, если для некоторого No матрица PN(> обладает свойством р$°>0.
Теорема 1. Пусть дана цепь Маркова с состояниями Аг, А2, ..., Ап и матрицей Р вероятностей перехода. Тогда вероятности р^} того, что система после п испытаний перейдет из состояния At в состояние Aj, образуют матрицу, равную N-й степени матрицы Р, т. е.
. п(Ю n(N) (N) .
Pll Р12 ••• Pin \
„(N) П(Ю nW) | nN P21 P22 ••• P 2n I
„(Ю n(N) n(N) / \Pnl Pn2 ••• P nn /
1 Доказательство. Применим метод математической индукции по индексу N. При N=1 теорема справедлива, поскольку рц}=рц- Пусть теорема справедлива при некотором ЛГ; докажем ее справедливость при Лг+1.
Для того чтобы перейти из состояния At в состояние Aj за 7V+1 испытаний, необходимо и достаточно, чтобы имело место одно из следующих п попарно несовместных событий:
Вг: Ai-^Ai-tAj', B2:Ai-^A2-^Aj; ..., Вп: A^A^Aj,
где событие Bk(k = 1, 2, ..., п) означает, что система после первых N испытаний переходит из состояния Л/ в Ак, а при испытании с номером У+ 1 переходит из состояния Ак в состояние Aj. Вероятность перехода Аг-*Ак за п испытаний равна p(ik\ вероятность перехода Ak->Aj в последнем испытании равна pkJ, вероятность совместного наступления этих (независимых) событий (т. е. вероятность события Вк) равна puPpkj (согласно теореме умножения вероятностей). Вероятность перехода Ai~+Aj за 7V+1 испытаний равна сумме вероятностей:
<+1)=хр(^)= i P^Pik. о)
к- 1
Как показывает формула (3), матрица PfJV+1), составленная из чисел Рц+1}, равна произведению матрицы, составленной из чисел р$°, на матрицу Р, составленную из чисел р^; иными словами,
£ 5*. 7. Цепи Маркова. Теорема о предельных вероятностях Стац. распределение 417
p(N + 1) _ p(N) . р_ pN . р_ pN+ 1
(4)
Здесь использовано предположение индукции о том, что p^ = pN,
Теорема! (о предельных вероятностях регулярной цепи Маркова). Пусть дана регулярная цепь Маркова с п состояниями и Р—ее матрица вероятностей перехода. Тогда существует предел lim рп = р(оо)
и—*00 и матрица Р(оо) имеет вид
Щ и2 ... ип
иг и2 ... ип
щ и2 ... ип
2 Доказат ельство. Введем следующие обозначения:
т = min р [j), MjV = max р .
(5)
(6)
Согласно формуле (4), имеем P(N+1} = PN+1 = Р • PN, откуда
и п
mj —mrnpij — mm д pikPkj ^ппп /, Pikmj
n
(здесь учтено, что £ Pik=l)-k= 1
Аналогично можно показать, что +.
Последовательность m(f} (7V=1, 2,...) — неубывающая, а последовательность (N—1, 2, ...) — невозрастающая; обе последовательности ограничены, поскольку т{р<М^\ М^}>т{р. Тогда в силу теоремы о существовании предела монотонной ограниченной последовательности имеем
lim т^} = тр lim М{^} = МГ (7)
7V->oo TV—*оо
Покажем, что т.— М=. Для этого достаточно установить, что lim (M^-m^O.
TV—оо
Имеем
p^+n,=Yp^'p^-
(8)
Пусть Nq таково, что /?^о)>0, z, j= 1, 2,..., п (для регулярных цепей Маркова число Ао, удовлетворяющее этому условию, существует); пусть, далее, 8 = тт/?!Уо). Тогда, преобразуя равенство (8), получим
п
n(N0 + N)_ у n(N0)n(N)_y (n(No^—pn^}n(N)icyn(N)n(N) Pij° ~ L Pik° Pkj ~L\PikG Wjk )Pkj +^LPjk Pkj
> i (р^-Ёр^Р+гр^^(1-е)т^ + гр^. (9)
k~ 1
Здесь было использовано неравенство о) —вытекающее из того, что р^)^ттД°) = £ и
i, к
14 Мантуров О.В.
418
Глава V*. Теория вероятностей
Таким образом,
(10) Аналогично находим
М^ + ^<М^(1-8)+^8. (11)
Из неравенств (10) и (11) следует, что 0<Mfo^)-w^o^)^[M7)-^f)](l-8) (12)
и далее
0 +N) - mf N°+(1 - s)m (13)
(при переходе от (12) к (13) был использован тот факт, что разность М^—т^ монотонно не возрастает с увеличением N).
Правая часть неравенства (13) при га-» ос стремится к нулю, поскольку это означает, что монотонно невозрастающая последовательность при N-+cq стремится к нулю. Отсюда следует, что Mj = mp т. е. существует предел lim p$)=Pj, не зависящий от к. N—>oo
§ 5*.8. Элементы математической статистики. Выборка. Точечные оценки неизвестных параметров распределения по выборке. Понятие о доверительных интервалах и статистической проверке гипотез
1°. Задачи математической статистики. Основными задачами математической статистики являются изучение и описание случайной величины по ее значениям, полученным в результате опыта. Можно ставить задачу о нахождении функции распределения случайной величины (или системы случайных величин), о вычислении или об оценке характеристик случайной величины.
Пусть имеется случайная величина X, функция распределения которой содержит неизвестный параметр а. Для многих практических задач важно найти (пусть приближенно, с некоторой приемлемой вероятностью) этот параметр по результатам испытаний, проведенных над величиной X.
Обозначим через X-t случайную величину, представляющую собой (случайный) результат z-ro испытания величины X в серии независимых испытаний. Всякая оценка неизвестного параметра а по опытным данным имеет вид
« = ф(^, Х2,..„ Хп), (1)
т. е. является случайной величиной.
1 Для того чтобы функция <р(Х19 Х2, —, Хп) давала разумную оценку неизвестного параметра а, она должна удовлетворять следующим «естественным» требованиям:
1. Состоятельность оценки. Это означает, что при больших п значение случайной величины <p(XY, Х2,..., Хп) мало отличается от числа а. В более строгой формулировке,
lim P(|a-<p(jr1, Х2,Х„)|<£)=1 (2)
п—>00 для любого 8 > 0.
2. Несмещенность оценки. Это означает, что математическое ожидание McpOG, У2,..., Хп)—а.
£ 5*.8. Точечные оценки неизв. параметров. Статистическая проверка гипотез 419
3. Эффективность оценки. Это означает, что дисперсия Dcp(A'1, А'2, Хп) минимальна.
Следует заметить, что получаемые в практических задачах оценки не всегда удовлетворяют этим требованиям, поскольку оценки, обладающие свойствами состоятельности, несмещенности и эффективности, бывают довольно сложными. 2°. Точечные оценки параметров распределения. Сначала рассмотрим оценку математического ожидания. Пусть X—случайная величина Тогда случайная величина
(3)
является оценкой математического ожидания случайной величины X (напомним, что Xt есть (случайный) результат z-ro испытания случайной величины X в серии независимых испытаний).
Согласно теореме Чебышева, эта оценка является состоятельной Ее несмещенность вытекает из равенства
1
-па —а. п
Если случайная величина X распределена по нормальному закону, то оценка (3) является эффективной (для других законов распределения оценка (3), вообще говоря, неэффективна).
Перейдем теперь к оценке дисперсии. Положим
D = -X (Х.-аУ,
1
где а = -(Хг + Х2 +... + Хп). п
Покажем, что при больших п случайная величина D принимает значения, близкие к DA' (дисперсия X) с вероятностью, близкой к единице. Имеем
О = -Ж-« =-S Xt—i—2--------------=-^{nX-s 2 =
п п \ п / п
— \^Ьп2 X2 — 2sn^Xi + s2nj
= -XXi + X-2s2n + s2n)^ п п
Здесь было использовано обозначение 5= Х{ + Х2 + ••• + Хп. Согласно теореме
Чебышева, случайная величина -^Х2 при больших п близка к М(Х2), п
а — + Х2-У ...-УХп)2 близка к (МА')2. Таким образом,
»М(А'2) — (МА')2 = DA', т. е. оценка (4) состоятельна.
14*
420
Глава V*. Теория вероятностей
2 Рассмотрим вопрос о несмещенности оценки (4). Находим мв=м--£у?-м(У1+Г2+"'+Х") =-иМ(Х2) = п \ п ) п
М (XI + Х22 +... + X2 + 2 X ^Xj) =
. п . 2 п(п— 1), п(п— 1) . п— 1.
= М(Х2) гМ JT2)—<(мх)2 = -^—рг2)-—(м^)2 = п п 2 п п
=^2.[М(У2)-(МУ)2]=—-ИУ. (6)
п п
Равенство (6) означает, что оценка D не является несмещенной, однако из него следует, что
М| —D | = ОУ. \ п— 1 J
и ~
Таким образом, оценка ---D является несмещенной оценкой дисперсии:
п— 1
п ~ "
---D= У
И-1
(7)
п ~
Очевидно, что оценка -----D также является состоятельной (так как
п—\
~ п
D при больших п близко к DJf, то и -----D при больших п близко к DX).
п— 1
~ п ~
Оценки D и ------D, вообще говоря, не являются эффективными. Для
п— 1
случайных величин X, распределенных по нормальному закону, оценка п ~
----D асимптотически эффективна—это означает, что отношение дисперсии п — 1
п ~
случайной величины -----D к минимально возможной стремится к единице
п— 1
при и-» со.
3°. Интервальные оценки параметров распределения. Рассмотрим теперь интервальные оценки параметров распределения случайной величины X.
Пусть Х=-(Х1 + Х2 + ... + Хп), где Xf—(случайный) результат z-ro ис-п
пытания случайной величины Xt (z=l, 2,..., п), распределенной нормально с параметрами а = МХ и cy2 = DX (предполагается, что случайные величины Xt (z-e испытание величины X; z=l, 2,..., п) попарно независимы).
_ 1
Тогда для случайной величины Х=-(Х1+Х2 +... + Хп) справедливо следующее п
равенство:
£ 5*.8. Точечные оценки неизв. параметров. Статистическая проверка гипотез
421
-}=)’ (8)
где 8>0— произвольное число, а
1 / ч 1 9 а2
DX=D-(X1 + y2+... + Xj = -7«cy2 = — (9)
п п п
3 Докажем сначала, что сумма независимых случайных величин X, Y с одинаковым нормальным распределением имеет нормальное распределение. Пусть распределение случайных величин задано дифференциальной функцией 1 2 2
распределения f (t) =--— /(2ст \
<5 у/2л
Распределение суммы Х+ Y задается, как показано в п. 3° § 5*.3, сверткой СО
функций распределения, т. е. g(t) = f f (t— s)f(s) cis. В данном случае
Следовательно, сумма X+Y распределена нормально, причем (j(X+Y) = y/2o.
Из доказанного вытекает, что сумма Xt + Х2 + ••• + Хп (в предположении, что слагаемые независимы и распределены нормально) имеет нормальное распределение; при этом очевидно, что случайная величина _ 1
Х—-(Х14-У24- —+ ^и) также распределена нормально с параметрами п
_1 1 су2 ,--
MJr=-rtMLr=MJr=a, DX=-ynDX=~, & = y/DX. п п п
Для нормальной случайной величины с параметрами а и <у справедливо равенство
Р
Р(ос^Х<р)= —L_e-(/-«)W)dz?
J о‘Л/2л откуда
Р(а —8<Г<« + 8) = 2Ф^|^=2Ф(8хА/сг), (10)
что и требовалось установить.
Обозначив число 8^/Й/су через Z, получим
Р(|Т-«|<8) = 2Ф(/). (11)
Интервал ]х — 8, х+8[ называется доверительным интервалом, а вероятность 2Ф(7) — доверительной вероятностью Формула (11) определяет
422 Глава V*. Теория вероятностей
(доверительную) вероятность того, что значение случайной величины X принадлежит (доверительному) интервалу ]х — 5, х + 5[. Отметим, что правая часть формулы (11) зависит от а, поскольку t=§y/nl<5.
4 Если среднеквадратическое отклонение ст случайной величины X неизвестно, то в качестве приближенного значения а в формуле (10) можно взять число
Q V П-\
Здесь Xi — значения случайных величин, зафиксированные в результате опыта, X—среднее арифметическое чисел Хг, Х2, •••, а п — количество испытаний случайной величины X; выражение
представляет собой, как было показано выше, несмещенную оценку дисперсии.
4°. Выборочные моменты. При вычислениях, связанных со множеством значений величины X, полученных в результате п испытаний х19 х2,..., хи, рассматривают выражения вида
„ £(•*»-*)* , . 9 ,19А
mfc =---, т^ =--------, =, к=\, 2 ... (12)
n n n
Эти выражения называются статистическими (выборочными) моментами к-го порядка, соответственно — начальными, относительными (относительно числа а) и центральными.
Центральные моменты имеют важное значение для оценки неизвестных характеристик случайной величины X При вычислении центральных моментов легче сначала вычислить относительные моменты (относительно подходящего числа а), а затем преобразовать их в центральные.
5 Формулы, дающие выражение центральных моментов через относительные, имеют вид
m2^m'2-(m’r)2, m 3 = m 3 - 3m'2 m ; + 2 (т )3, т 4 = т 4 — 4m 3 т \ + 6m 2 (т \ )2 — 3 (т \ )4.
Вывод формул (13). Имеем
п п
— ~(^(xi~а)2 — 2 (xf — а)(х — а) + (х — а)2) — т '2 — 2т \ т i + (т 2 )2 = т 2 — (т \ )2; п
m3=-Y(xi-x)3==-X[(.xi-a)(x~a)Y= 2 п
— -Qa(xi — a)3 — 3(xi — a)2(x — a) + 3(xi~a)(x — a)2 — (x — a)?>) = п
= т'3 — Зт 2 т j + Зт \ (т \ )2 — (т i )3 = т '3 — Зт 2т\ + 2(т j )3;
£ 5*.8. Точечные оценки неизв. параметров. Статистическая проверка гипотез
423
п п
= -(Х (*i —я)4 —4(л; —я)3 (х — а)+ 6 (xt — а)2 (х— a)2 — 4(х- — а)(х — а)3 + (х — а)4) = п
= т\ — 4т 3^1 + 6т '2 m i — 4т \(т\)3 + (/и 'i )4 = m 4 — 4т 3^1 + 6т 2т2 — 3(т j )4.
Здесь учтено, что x-a = -^(xi — a) = m'1. п
При испытании пары случайных величин X, Y имеем совокупность пар полученных значений (х19 yt), (х2, j^2),(хп, уп). Для такой совокупности рассматривают смешанные моменты:
= mki^-'Z(xs-a)k(ys-b)1,
п S п s
m'ki = -lL(xs-^k(ys-y')t- О4)
п
5°. %2-критерий Пирсона. Пусть задана случайная величина X и проведено п испытаний этой величины, в результате чего получены значения х19 х2,...,хп. Положим fl = minxf, ^ = таххг- и разобьем интервал [а, b ] на т равных частей Д1? Д2, ...,Дт; пусть к19 к2,...,кт означают количество элементов множества х2,хп}, принадлежащих интервалам Дп Д2, ...,хт. Таблица
*2 ••• *т
кг к2 ... кт
где xt — центр интервала Л, (i= 1, 2,т ), называется статистическим рядом, а числа р^к^п — статистическими вероятностями.
Если предположить, что случайная величина X распределена с помощью конкретной дифференциальной функции f(t)9 то каждому интервалу Д£ будет
соответствовать вероятность =j/(/) dZ и можно сравнивать вероятности д/
/>* и pi. Если предположение о законе распределения случайной величины X соответствует действительности, то разности p*—pt должны быть малы с большой вероятностью.
Как было установлено американским математиком К. Пирсоном, случайная величина
2 v X = L ------------------
Pi
(15)
при больших п распределена по дифференциальному закону
при t>0,
при ^<0,
(16)
424
Глава V*. Теория вероятностей
называемому ^-распределением. с г степенями свободы (параметр г равен числу интервалов т минус количество независимых условий, накладываемых на статистические вероятности р]}
Функции kr(t) табулированы.
Распределение kr(t) имеет случайная величина, равная сумме квадратов г независимых случайных величин, распределенных нормально с нулевым математическим ожиданием и единичной дисперсией.
Символом Г (г/2) в формуле (16) обозначено значение гамма-функции r(z)= j tz~r е ~*dt в точке z=r/2. о
6 Функция Г (z) обладает следующими свойствами:
1°. zF(z) = F(z-b 1), Г(1)= 1, Г(п) = (д-1)!
2°. F(z)F(l-z)=—
sin?uz
_ я! nz
3°. F(z) = lim г
z(z+ 1)... (z + я)
Гамма-функция является функцией комплексной переменной, аналитической в каждой точке zeC, за исключением точек z = 0, —1, —2,, где T(z) имеет простые полюса.
Тот факт, что величина %1 2 распределена по закону (16), позволяет вычислять вероятности Р(%2>Л). Выберем так, чтобы вероятность Р(%2>Ле) = £ была мала. Тогда если полученное в результате опыта значение величины %2, определяемое формулой (15), окажется больше, чем Ле, то гипотезу о предполагаемом распределении заданной случайной величины X следует признать противоречащей опытным данным; в противном случае — непротиворечащей им.
§ 5*.9. Понятие о выборочной регрессии и методе наименьших квадратов
Пусть
y=yo+F, YQ = kx+b,
(1)
где к, Ь—неизвестные постоянные; X, У - пара случайных величин, значения которых известны из опыта:
(Wi), (х2, у2),...,(х„, у„); (2)
V—некоторая случайная величина (ошибка измерения случайной величины Уо). При описанных условиях рассматривают задачу о вычислении неизвестных
постоянных к, b по опытным данным (2).
1 Пусть
v1,v2,...,vn (3)
— набор значений случайной величины V, полученных в результате w-кратного испытания. Если случайная величина V распределена нормально с нулевым математическим ожиданием и если имела место независимая серия испытаний, то плотность вероятности того, что в п испытаниях получены значения (3), равна
1 -vj/2 -vl/2
—= I е е .^/271/
-^/2^1
(х/2^)"
— (yf+t>2+ ••• +v«)/2 е
5* .9. Выборочная регрессия и метод наименьших квадратов 425
и эта плотность тем больше, чем меньше сумма квадратов Последнее утверждение будем называть принципом максимального правдоподобия.
Значение можно получить из опытных данных (2), если задать конкретные значения коэффициентов к и Ь, а именно
£>? = X (yi-kxt-b)2.
i—1
Положим R(k, b) = ^v2. Согласно принципу максимального правдоподобия, чем меньше значение функции R(k, b), тем больше плотность вероятности соответствующего события; минимум функции R(k, b) соответствует максимуму плотности вероятности события v19 v2,---,vn.
2 Для нахождения минимума функции R(k, b) двух переменных вычислим dR 6R
частные производные — и — и приравняем их нулю: dk дЬ
fi7=2X(^-/cji;i-fc)(-xi)=-2X?::.Z-+^X%?+z’X?i:i=0> с’/с
1 8R ( }
^=2£(л-^-*)(-О=-2£л-+^1л.-+6„=0>
откуда
( к^х 2+b^Xi=Yxi Уi’ /5-j
Решая эту систему уравнений, получаем ху-х-у _ = —-----------------------------; b—y — kx, (6)
х2 — (х)2 где
ху=-^х1У1' x=~Yxi’ У = ~ХУ1’ x2 = -Yxi- (7)
п п п п
Точка с координатами (6) является точкой минимума функции R(k, b), поскольку эта функция имеет минимум и решение системы уравнений (4) единственно.
3 Найдем значение функции R(k, b) в точке минимума (6):
R=Y(yi-kxi-bY='L(yi-y-k(xi-x))2=Y(yi-y)2-2kX(yi-y)(xi-x)+ +к2^(х1-х)2=ЦУ1-2Цу,У+пУ2-2к(Хх1У1-Их1У-ХхУ-+пху)+ +к2^х?~2Т;х1х+пх2)=пУ2~2пУ2+пУ2~2к(пхУ~п*У+п*У+п*У>)+
+к2 (пх2 — 2пхх+пх2) = (пу 2 — пу2) — 2кп (ху—ху)+к2п (х2 — (х2)) = п (у2 — (j>2)) —
-2п +и
х2-(х)2 х2-(х)2
R = n(a2Y—k2<j2X), (8)
где <32Y=y2—y2, g2X—x2—x2.
426 Глава V*. Теория вероятностей
4 Пусть даны к+\ случайных величин Xr, Х2,...,Хк, Y, из которых
Х2, ...,Хк попарно независимы. В результате серии из п независимых испытаний получены значения совместного распределения Х1У Х2,...,Хп, Y:
(х\, х2,—,х'к, У1), z=l, 2,..., п.
Если известно, что
Y=AiX1+A2X2 + ... +АкХк + В+ V,
тд$ Al9 А2,...,Ак, В—неизвестные постоянные, а V—случайная величина с нормальным распределением и нулевым математическим ожиданием, то значение величины V, соответствующее z-му опыту, равно
у1=у1-^Акх1к-В.
Это значение зависит от неизвестных постоянных Aj и B(J= 1, 2,...,к). В силу принципа максимального правдоподобия набор vl(i=l, имеет наиболь-
шую плотность вероятности тогда, когда функция
R(.At, А2’-’Ак> = X (У‘-А1Х1-А2Х2~ - -Акхк~В)2
1=1
принимает наименьшее значение.
Для нахождения минимума функции R(Ar, Л2,..., Ак, В) нужно решить систему уравнений
dR dR
— (А19 А2, ...,Ак, В) = 0, —=0.
5Л/ 1 2 к дВ
В развернутом виде эта система записывается следующим образом:
^1^11+^2^12+ — ++/с^1к + ^^01 1,
Л17Й21+Л27Й22+ ... +Акт2к + Вт02 = т2,
+ 1^Л1++2^Л2+ ••• +A^fc + ^Ofc-WL ^^01+^2^02+ - +Акток+Втоо = т*о, п к
где mpq=Yxpxq 2,..., к); ^or=£*r; (г=1> 2,...,/с); т00 = п; т* =
i=l i=l
п п
= '£х‘гу‘ 2,...Л); «о=Ел
1=1 1=1
5 Пусть даны две случайные величины X и У; в результате серии независимых опытов получены значения (х19 у±\ (х2, у2), ...,(хп, уп). Если известно, что
y=C1xfc“1 + C2xfc“2+ ... + Q+E,
где Ct, С2,..., Ск—неизвестные постоянные, а V—случайная величина с нормальным распределением и нулевым математическим ожиданием, то значение к
V, соответствующее z-му опыту, равно v^y^ £ Crxi-~r. Это значение зависит г= 1
от неизвестных постоянных Сг (г=1, 2, ...,к). В силу принципа максимального
5*. 10. Случ. процессы. Процессы с незав. приращ. Пуассоновский процесс 427
правдоподобия, набор (z= 1, 2, ...,и) имеет наибольшую плотность вероятности тогда, когда функция
R(CU C2,...,Ck)= £ i=l
принимает наименьшее значение.
Для нахождения минимума функции R(Cl9 С2,Ск) нужно решить систему уравнений
dR
— (С1? С2,...,СЛ) = 0 (r=l,...,Zr).
В развернутом виде эта система записывается следующим образом: Qw2fc-2 + C,2wfc-3+ ••• У-Сктк-Г =тк-1у 1, Сктк-Ъ + С2тк-4.+ ... +Сктк_2 = тк_2у1,
Српк_г + С2тк-2 + ... +Скт0 = т0,1,
где ws=£xf (5 = 0, 1,...,2k—2); 0 —l,...,/b—1).
i=l i= 1
Решение этой системы уравнений, т. е. набор чисел С19 С2,....Ск, порождает многочлен C1xfc-1 + C2’2-|-...+Cfe, приближающий опытные значения (х^уД (х2, у2), у„) наилучшим образом с точки зрения принципа максимального
правдоподобия.
§ 5*. 10. Понятие о случайном процессе.
Процессы с независимыми приращениями. Пуассоновский процесс
1°. Понятие о случайном процессе. Пусть проводится некоторое испытание, результатом которого является зависящая от случая функция X(t) из некоторого класса L. В этих условиях говорят о случайной функции X(t) или (что то же самое) о случайном процессе. Для количественного описания случайного процесса нужно уметь вычислять вероятности Р (Q) того, что функция X(t) принадлежит тому или иному подмножеству Q множества L. При этом должны быть выполнены следующие условия:
0^P(Q)^l; (1)
P(fi1U^2)=P(Q1)+P(n2) (2)
для любых двух непересекающихся множеств и П2.
Ниже будут описаны некоторые обстоятельства, при которых можно задать обозримое описание функции Р(П) со свойствами (1) и (2)
Однако сначала рассмотрим следующие определения.
Каждая конкретная функция X(t), полученная в результате опыта, называется реализацией или (траекторией) случайного процесса.
Каждое значение t = t0 определяет случайную величину X(t0), которая называется сечением случайного процесса X(t); в каждом опыте Х(/о) есть значение траектории X(t) в точке t=t0.
Определение I. Математическим ожиданием случайного процесса X(t) называется (неслучайная) функция MJf(/), значение которой в каждой точке
428 Глава Г*. Теория вероятностей
’ 1 X _ * .г*
t0 равно математическому ожиданию случайной величины X(t0}—сечения случайного процесса X(t).
Определение 2. Дисперсией случайного процесса X(t) называется (неслучайная) функция DX (t), значение которой в каждой точке t0 равно дисперсии случайной величины X(t0) — сечения случайного процесса X(t).
По определению, среднеквадратическое отклонение oX(t) случайного процесса X(t) равно квадратному корню из его дисперсии: <зХ(Z) = у/ТУХ(t).
О пр еде ление 3. Корреляционной функцией случайного процесса X(t) называется (неслучайная) функция cov(5, Z), значение которой в каждой точке (s0, t0) равно ковариации случайных величин X(t0) и У(50)—сечений случайного процесса X(t) в точках tQ и s0.
Нормированной корреляционной функцией случайного процесса X(t) называется (неслучайная) функция rx(s, t), значение которой в каждой точке (s0, Zo) равно коэффициенту корреляции случайных величин X(s0) и X(t0).
В силу формулы (29) § 5.4, имеем
СОУ(5,0 М [(Л^)-МХ(5))(У(0-МХ(<))] rx(S’ ’ uX(s)aX(t) aX(s)oX(t) ' ' }
Рассматривают также корреляционную функцию covxy(Z, s) и нормированную корреляционную функцию рХуА, О пары случайных процессов X Y. По определению,
covxy (5, z)=М [X(s) У (z)] - MX(s)M У (z), cov(.s-, t)
Pxr("’
При этом справедливы соотношения
м[(х(5)-мх(5))(у(/)-му(г))]
Рхг1’ } vX(s)<3Y(t)
(4)
(5)
(6)
— DX(s) = covxx(s), Dy(z) = covyr(z, z),
где ТУХ и ВУ—дисперсии случайных процессов X(t) и У(/).
Значения функций covXy(5, t) и рХу(^, Z) измеряют степень линейной зависимости сечений X(л) и y(z).
Конечномерной п-й функцией распределения случайного процесса X (z) называется функция
t2,..„ t„; %i, x2,x„)=
= P(X(tl)<x1, X(t2)<x2,X(t„)<x„),
(7)
где P(X(Z1)<x1, X(t2)<x2,..., X(Z„)<xw) есть вероятность совместного наступления событий X(Z1)<x1, X(t2)<x2,..., X(tn)<xn.
Дифференциальной п-й конечномерной функцией распределения называется функция
Ли)(^1> ^2’ •••>
22 *1’ *„)
дх1дх2 ...дхп
(8)
х2, ...,
(если, конечно, производная в правой части равенства (8) существует).
Значения функции /(п) в точках (Z15 Z2,...» Z„; х2,..., х„) равны плотности
вероятности совместного наступления событий X(Z1) = x1, X(t2)=x2,..., Х(1п) = хп.
5*. 10. Случ. процессы. Процессы с незав. приращ. Пуассоновский процесс
429
Конечномерные дифференциальные функции распределения рассматривают для тех случайных процессов X(t), у которых сечения X(tQ} представляют собой непрерывные случайные величины. Если же сечения ЛДг0) дискретны, то используют функцию Р(В)(/1, t2,х2,хп), значения которой в точках /х, t2,1п; х15 х2,..., хп равны вероятности совместного наступления событий X(t1)=xl, X(t2) = x2,..., X(tn) = xn.
Условные распределения вероятностей задаются с помощью функции
6и + 2э •••? Хт+1, Хт + 2, ..., Xn]ti, t2, ..., tm, Xj, X2, Xm)
_f(n)(tlr> ^2j ---j fnj X19 X2, ..., Xn)
^2, •••» X^, X2, ..., Xm)
ЗдеСЬ f (tm+1, tm + 2? Xm+i, Xm + 2, ..., ^2? X}, X2, ..., Xm\
означает плотность вероятности события Ar(zm+1)=xm+1, X(tm+2)=xm+2, X(tn) = x„ при условии наступления событий X(tl)=x1, X(t2)=x2,...» X(tm)=xm.
Для случайных процессов с дискретными сечениями рассматривают функцию
Р(^и+1> ^т + 2> Xm + i, Хт + 2, ..., X„|^i, t2, ..., tm, Xi, Х2, Хт) =
xi, x2, *„)
P(m)(^l> ^2> tnv> Xl. X2, Xm)
Значения этой функции в точках tm+1, tm+2, —•> tn; %ш+1, jv7h+2,xn, tr, t2,..., tm; xt, x2,..., xm (t1<t2<...<tn) равны условным вероятностям событий X (tm+1)=xm+1, X (tm+2) = xm+2,..., X (tn)=xn при условии наступления событий X(/1) = x1, X— х2,..., X(tm) = xm.
О пр еде ление 4. Случайный процесс называется стационарным, если для всех его «-конечномерных функций распределения при любом t0 е R справедливо равенство
= ^2? •••> ^n> Xi, Х2, ..., %и) =
==Лл) = (*1 + *0> ^2 + ^0>-”> ^ + ^0» Х1> %2> •••> Хп}. (И)
Для стационарного случайного процесса корреляционная функция Rx — (s, t) = Rxx — (s, t) является функцией одной переменной T = t—s.
Среди всевозможных случайных процессов простейшими являются те, для которых т-е конечномерные функции распределения выражаются через п-е при малом значении п (самый простой случай: п=1, п = 2).
2°. Марковские случайные процессы. Марковские случайные процессы характеризуются следующим свойством их условных конечномерных функций распределения:
Р(/„, ХИ|Г1? t2,..., tn-i’, Xi, х2,..., Ли-1) =
= £?(^л-1> Хп-1> Хп^ (12)
(для процессов с дискретными сечениями), а в случае непрерывных сечений — свойством
f(tn, xn\ti, t2,..., tn-r; Xi, x2,x„-i)= =g(/«-i, tn, Xn-i, xw). (13)
Смысл равенств (12) и (13), выражающих характеристическое свойство функции Р(Г„, t2,..., tn-i, Xi, х2,..., Xn-i) или f(tn, xn\ti, t2,..., tn-i,
430
Глава V*. Теория вероятностей
X], х2,..., заключается в том, что значения каждой из этих функций
зависят только от t„-1, xn-i> хп и не зависят от Z15 t2,..., Zn_2, х2> •••> хп— 2 I Zj < Z2 < ”• < ^п — 1 < ^п)’
Марковский процесс вполне определяется своей второй конечномерной функцией распределения вероятностей F(2}(t1, t2; х1? х2) или первой конечномерной функцией распределения х±) совместно с функцией
x2\tx, xi) [или парой функций P<d(Zi, хг) и P(Z2, х2> *i> xi)]-
3°. Случайный процесс Пуассона. Важным частным случаем марковского процесса является процесс Пуассона. Сечения X(tQ) случайного процесса Пуассона представляют собой дискретные случайные величины, а реализации процесса—неубывающие функции.
Кроме условия (12), определяющего марковский процесс, для пуассоновского процесса предполагается выполнение дополнительных условий. А именно, вторая конечномерная функция распределения должна удовлетворять следующим свойствам:
P(z1 + Az, x2|Z1?
1 —aAz+o(Az) aAr+o(Az) 0
при х2 —xt <0, при х2 —Xi=0, при х2 — xt — 1, при х2 — хг > 1.
(14)
Здесь а—некоторая положительная постоянная (параметр распределения Пуассона), о (А/) — бесконечно малая более высокого порядка малости, чем Az = z2 —Z15 т* е- o(Az)/Az = 0.
дг->о
Вероятности P(z2, x2|Z1? %!) можно вычислить в явном виде. Оказывается, что вследствие условий (14) функция P(Z2, x2|Z1} xt) зависит только от х2—xt и t2 — tr, т. е. имеет вид
P(z2, -^'2, ^i) = <p(^ к—х2—х1, t = t2 — tr.
При этом
(atV1
<р(/с, z) = e“azL-2-, Z>0, к=0, 1, 2,.... (15)
К!
1 Вывод формулы (15). С точностью до бесконечно малых более высокого порядка малости, чем Az, справедливо равенство
P(z2 + Az, x2|Z15 xt) = aAzP(z2, х2 — l|Zt, %i) + + (1 — ocAz)P(z2, x2|Z15 Xi).
Событие C: y(z2 + Az) = x2 при условии X(t1) = x1 является суммой двух несовместных событий А и В, где А: (X(t2))—x2 — 1, Jf(z2+Az)=x2), В : (Jf(Z2))=x2, Ar(z2 + Az) = x2). Оба события А и В рассматриваются при условии X(tl) — x1.
Действительно, в силу (14) значения случайных величин X(t2) и y(z2 + Az) отличаются самое большее на единицу; используя умножения вероятностей, вычислим вероятности Р(Л), Р(В) событий А и В:
P(?l) = P(z2, х2 — 1|Z15 xj-P(z2 + Az, x2|Z2, x2 —1), P(_S) = P(z1, x2|Z19 X}) • P(z2 + Az, x2|z2, x2).
Согласно теореме сложения вероятностей, вероятность Р(С) события С равна сумме вероятностей Р(Л) и Р(В); с учетом формул (14) имеем
5*.10. Случ. процессы. Процессы с незав. приращ. Пуассоновский процесс 431
Р(С) = Р(Л) + Р(Б)=Р(г2, x2-1|G> *i)aA/+ + P(z2, x2Ui> xr (1 — aAz)+o(Az). (16)
Поскольку P(C) = P(Z2 +А/, xJZj, далее находим
P(z2 + Az, х2|/1? *i) = Pfe’ *2 Un x1) = a(P(/2, x2ltl, xj —
— aP(z2, x2— ll/j, xJ + ofAf). (17)
Переходя к пределу в равенстве (17), имеем
dPz
——(z2> Х21л» Х1)~~ с/2
= aP(z2, x2|Zj, Xj)-aP(z2, х2—ljzr, xj. (18)
Обозначим через фЛ(/) функцию P^ + Z, x1+klt1, хг) (числа Z, хг — параметры). Тогда равенства (18) при k = x2 — x1 = 0, 1, 2, ... дадут систему уравнений
фо= -а<Ро
91= acpo-occpi
ф'2 = оцр^афг (19)
<Р« = афл-1-а<Ри-
Это линейная система обыкновенных дифференциальных уравнений с постоянными коэффициентами относительно неизвестных функций ф0(г), ф! (Z), Ф»(0-
Легко проверить, что решение системы (19) при начальных условиях
Фо(0)=1, Ф1(О) = О, <р2(0) = 0,ф„(0) = 0 (20)
имеет вид
Фо(1) = е““> Ф1(1) = е*“‘,
/ х (°^)2 / \ (aZ)"
Ф2Й = е-“‘Ц/-,-, Ф„« = е-“,!4-. (21)
2! п!
Условия (20) справедливы при любых значениях параметров z15 хг; в самом деле,
<ро(0) = Р(<!, xJZi, х,)=1, (22)
<pli(O) = P(z1, Xj + ftlZ!, Xj)~0, к>0 (23)
(фо(0) в равенстве (22) означает условную вероятность события X(t1) = x1 при условии Jf(Z1) = x1, а эта вероятность равна единице; фл(0) в равенстве (23) означает условную вероятность события Xtj^^ xt-\-к, к>0 при условии, что X(t1) = xli а эта вероятность равна нулю).
Из формулы (21) и равенства ф^) = Р^! + Z, Xj+^IZj, xj вытекает, что условные вероятности P(z2, x2|Z1} хг) зависят только от t2 — t1 = t и х2 — х1=к.
4°. Случайные процессы с независимыми приращениями. Пусть дано однопараметрическое семейство X(t) случайных величин такое, что для любого конечного множества вещественных чисел Z1<Z2<...<Zn приращения 2f(Zfc+i) — X(tk) (&= 1, 2,..., п—1) попарно независимы. Это семейство определяет
432
Глава Г*. Теория вероятностей
случайный процесс, который называется случайным процессом с независимыми приращениями.
Стационарный процесс с независимыми приращениями называется процессом со стационарными приращениями, если распределение X(t + s) — X(t) зависит только от 5 и не зависит от /.
Случайные процессы со стационарными независимыми приращениями обладают рядом интересных свойств и описывают важные в практическом отношении реальные случайные процессы.
2 Главным свойством случайного процесса X(t) с независимыми приращениями является следующее. Пусть числовой интервал р, s+z[ разбит на п равных частей точками z0 = < t2,..., tn = s+t. Рассмотрим случайные
величины Хк,п = X(tk) — X(tk — 1). Приращение случайного процесса X(s+t) — X(t) является суммой п независимых случайных величин Хк,п:
X(s+t) = £хк,п. (24)
k = 1
Если процесс стационарен, то все случайные величины Xt>n распределены одинаково.
Случайная величина X [а также ее интегральная и дифференциальная функция распределений F(t), f (z) ] называется безгранично делимой, если для всякого п > I существуют такие п независимых и одинаково распределенных случайных величин Хх, Х2,..., Х„, что Х= XY +Х2 +... +Х„.
Как видно из равенства (24), приращение случайного процесса со стационарными независимыми приращениями является безгранично делимым распределением.
Пусть Q(t) = X(s+t) — X(t)— приращение случайного процесса со стационарными приращениями и /Дх)— дифференциальная функция распределения этого приращения. Тогда имеет место формула
(?. «>0), (25)
где ft*fu означает свертку функций ft и fu.
Действительно, из определения стационарного случайного процесса с независимыми приращениями следует, что
Q(t) = X(s+ t)-X(s) = X, +Х2+... + Хп,
Q (z + и) — X(s + Z+ и) — = Т Х2 + ... + Хт,
Q(n) = X(s+ t) = X+i + Хп+2 + ••• + Хт
и распределение случайной величины Q (и) совпадает с распределением Q(u) = X(s+n)-X(s).
Из равенства g(Z)+ Q(u) = Q(t+ и), где g(z) и Q(u)— независимые случайные величины, вытекает формула (25), поскольку распределения случайных величин 2(Z), Q(u), Q(t+u) совпадают соответственно с /р fu, ft+u.
Справедливо и обратное утверждение: если однопараметрическое семейство случайных величин Qt представляет собой приращение стационарного случайного процесса с независимыми приращениями, то для функций распределения ft случайных величин Qt имеет место формула (25).
Опр еделение 5. Спектром Фх(со) (или спектральной плотностью) стационарного случайного процесса X(t) называется преобразование Фурье его корреляционной функции ^x(z) = cov(jr(5), Jf(^+Z)), т. е.
5*.1Q. С луч, процессы. Процессы с незав. приращ. Пуассоновский прогресс
433
Ф
&х(т)е lmdT.
(26)
Формула (23) допускает обращение, а именно, если кх(т)—непрерывная абсолютно интегрируемая функция, имеющая в каждой точке односторонние производные, то
+ 00
&х(т) = J е1й)х Фх (со) dco. (27)
— 00
В том случае, когда Фу(со)— вещественная функция, получаем
&х(т) = f eImcos сот dr. (28)
- 00
3 Представляет интерес стационарный случайный процесс, спектр которого имеет вид
/ х (Фо ПРИ
7 (0 при
О < со < т,
со>т.
(29)
В силу формулы (28) корреляционной функция
функцией
такого процесса
является
Ф<
/ \
Фх (со) cos сот dco = Фо cos сот dco =— sin сот
Фо shitT
(30)
Если т 0 0, то
sinTT
lim------=0, а если т=0, то при каждом
Т—-ОТ'
конечном
Т функцию
sinTT
можно по непрерывности доопределить
значением
sinrT
----- — Т9 т- О
ной функции
причем
lim
sinrT
Г—» со \ Т не определен.
= оо. Таким образом, предел
спектраль-
sinrT
Тем не менее при больших Т функцию кт(т) =---------- можно сравнить
с функцией
о
т
о
о
т
т = О
{I
2? |Т|<6’ (31)
О, |т|>Е.
Это можно сделать следующим образом. Для всякой непрерывной абсолютно + оо
интегрируемой функции f (т) рассмотрим Тг(т)= f £т(т —£,)/(£) dJ;
и Ge(t) = f 3E(-r-i;)/(i;)dij. Имеем
— 00
j 5Е(т—£)/({;) d(; =
J 2e 2s
t — e
434
Глава V*. Теория вероятностей
где т —£<с<т + е; ясно, что /(с)->/(т) при 8->0. Далее, рассмотрим
+ о° Фо
f кТ(х — Qf(Q==FT(i;). Можно доказать, что lim Ft(t) = —/(т). Следователь-
— оо Т—*оо
но, линейные отображения lim Гт(т) и /(т)-► lim л(7е (т), построенные Г—*00 £—>-0
с помощью функций 5£ (т) и кт (т), совпадают на всякой непрерывной абсолютно интегрируемой функции f. В этом смысле говорят, что спектр фо
кт (т) при большом Т близок к функции —5е(т) при малом 8. Корреляционная тс
функция — 6е(т) имеет следующий вероятностный смысл: эта функция ТС
описывает стационарный случайный процесс, в котором независимы даже близкие между собой сечения x(tr), x(t2) при 1^ —Z2|<2s.
ОСНОВНЫЕ ФОРМУЛЫ
РЯДЫ
▲ Ряд Тейлора функции /(х) в точке х0-
/(4 =/(х0) +(' (х0) (л - х0) (х - Хо)2 + • • + ~ (х - х0)" + • • •
z! п\
А Разложения некоторых функций в ряд Тейлора при хо = 0:
х2 хп
ех=1+% + —+ ...Н—А=со;
2! п\
х2 х4 (-1)пх2и
cosx=l-------1----...4-7—г----Ь-..; А = оо;
2! 4! (2п)!
х3 х5 (-1)”х2" + 1
sinx = x----1----...4—------г—
3! 5! (2/74-1)!
, . х2 х3 (—1)"х'
1п(1+х)=х-—+--•• +---------—у
2 3 п 4~ 1
А=со;
А=1;
.2
2!
п\
Я=1;
х3 х5
arctgx = x——-+-—...+
3 5 2п +1
2п+ 1
А=1;
1 3 2//-1
х3 Зх5 2 2 2
arcsinx = x4—— 4——-4--4----7-----т-
6 40 п\(2/7 4-1)
x2w + 14-
Л=1;
А Ряд Фуръе функции f(x) на отрезке [ — тс, л];
б?о 00
/(х) = —h ^Mcos/7x4-Z>„sin/7x;
п= 1 п
/(x)cos/?xdx (/7 = 0, 1, 2, ...),
— п
1 здесь ап = -л
1
Ьп = -л
п
J/(х)sin/?xdx (/7=1, 2, ...)
— 71
436
Основные формулы
▲ Ряд Фурье функции f(x) на отрезке [ —/, /]:
а0 " ттх . ттх f(x)=—+ X fl„cos—+6„sm—;
И=1 I *
I ппх ч
здесь an—~j /(xjcos—— cbc (и = 0, 1, 2,
I
ъ„ =
▲ Комплексный ряд Фурье:
00
/(%)= х
п = — 00
п
здесь сп = — | /(x)e~lwpd(p (п = 0, + 1, ±2, ...) 2ти J
“Л
▲ Интеграл Фурье:
/(х) = f (а^ cos Хх+sin кх) dX; о
+ оо +оо
1 Г 1 Г /ч
здесь а^- /(dcosXzd/, b^—- fytjsm'ktdit
71 J 7U J
— оо — 00
▲ Преобразование Фурье: + 00
s(x)=7- f/(0e“iX'd*
271 J
А Обратное преобразование Фурье:
f(x)= g(X)eiJjcdX
УРАВНЕНИЯ
МАТЕМАТИЧЕСКОЙ ФИЗИКИ
▲ Уравнение колебаний струны:
д2и 2д2и
dt2 дх2
+f(x, t)
Основные формулы
437
А Уравнение теплопроводности:
ди ~д2и . ч ~ = а2— +f(x,t) dt дх2
А Уравнение Лапласа:
д2и д2и д2и
.дх2 дх2 + дх2
А Уравнение Пуассона:
д2и д2и д2и
Т~2 + Т~2~^ %2’ •-
dxf дх2 дх2
ТЕОРИЯ ФУНКЦИЙ КОМПЛЕКСНОЙ ПЕРЕМЕННОЙ
А Модуль комплексного числа:
r=\z\ = y/x2+y2
А Определение аргумента комплексного числа'
х У
cos ср = —, , sin ср = —.
л/х2+^2 у/х24-у2
А Тригонометрическая форма комплексного числа: z= r(cos<p + / sin ср)
А Формула Муавра:
(cos ср-Н sin <р) " = cos и ср +/sin и ср (и = 0, +1, +2, ...)
А Выражение для Lnz в комплексной области'
Ln z = In | z | + i Arg z
А Выражения для cosz и sinz в комплексной области: elz+e-lz elz—e-IZ
cos z=--------, sin z=--------
2 2/
А Условия Коши — Римана:
ди dv ди dv
дх ду ’ ду дх
А Интегральная формула Коши:
1 f/(z) я
--- ----dz
2л/J z—Zo
L
А Формула для нахождения вычета относительно тОЧКи Zq'.
изолированной особой
ResZo/(z)=L f/(z)dz 2л i J
438 Основные формулы
к Формула для нахождения вычета относительно полюса z0 порядка к: d*'1 1
ReV(z)=lim5?rT/(z)(z-z0)‘(r-Iyi
▲ Основная теорема о вычетах:
f f (z) dz = 2л i Y Res z.f (z)
L i= 1
А Преобразование Лапласа: co
g(p)=J e“<«/(/)dp 0
А Обращение преобразования Лапласа: c + ioo
f(t)=d-. I g(p)eptdp
zni J
ЧИСЛЕННЫЕ МЕТОДЫ
А Многочлены Лежандра:
1 d"
2K«!d%nV 7
А Многочлены Чебышева:
Tn (х) = cos (п arccos *)
А Интерполяционная формула Лагранжа:
т х Y
Д„(х)=£/(х;) П —2
(=0 J,jt‘X‘~Xj
А Формула трапеций: ь
(г/ \А Ь-а(у0 + уп , , , \
/(x)dx«---- —-—+Л+.У2 + - + К-1
J п \ 2 /
а
А Формула Симпсона: ь
|/(x)dxa;^—^[j/0+j;2„ + 4(j/1+>'3 + ... + >>2„-i) + 2(j;2+^4 + ... + ^2„_2)]
J
а
А Квадратурная формула Гаусса:
f /(x)dx« X CJixt) - 1 i = 0
А Метод ломаных Эйлера:
Ук + 1=Ук + Ь/(хк, ук)
Основные формулы
439
▲ Модифицированный метод Эйлера: / h
Ук+i = Л+/1 хк~^~2 ’ №“*“^2/
▲ Метод Рунге — Кутта третьего порядка:
1 . .
Ук+i =Л+7(^1 +4&2 + ^з)? о
(h к^\
^ + 2’ л+2~Г k3=f(xk+h, yk+2k2-kl)h ТЕОРИЯ ВЕРОЯТНОСТЕЙ
▲ Определение вероятности события:
. х т г^-„
А Формула умножения вероятностей:
Р(Л2?) = Р(Л)Рл(В)
▲ Формула полной вероятности:
Р (А)=Р (Bt) РВ1 (Л)+Р (В2) РВ2 (А) +...+Р (Вк) РВк (А)
А Формулы Байеса:
р /в) =____________Р(Д<)Рв,И_______________ 2
4 Р(Л)РВ1и)+Р(52)РВ2(Л)+...+Р(^)РВ4(Л) 1 '
А Формула Бернулли:
P„(k) = Ckpkq"~k
А Локальная теорема Муавра—Лапласа:
. . 1 , . к—пр . . 1 2.„
Р„(/<)(р(х); здесь х=--—ф(х)=——е х /2 y/npq yjnpq
А Интегральная теорема Муавра—Лапласа:
Р„(ль л2)«ф(лу-ф(л'!);
X
здеськ-1=^, к'2 = к-^, ®W=^fe-^dx
Jnpq Jnpq Л2т1 J
о
А Теорема Пуассона: ак
P„(fc) = P(fc)«e-“-
А Математическое ожидание случайной величины (соответственно дискретной и непрер ывной):
МХ= X xkPk, МЛГ= f tf(t)At k= 1 — 00
440
Основные формулы
к Дисперсия случайной величины:
£ (хк-МХ)2рк, VX= f (t—MX)2f(t)dt
к=1 -оо
А Формулы для вычисления дисперсии: + оо / + оо \ 2
~ВХ=^х1рк-&хкрк)2, DX= f Z2/(r)dr-1 j tf(t)dtj
А Биномиальное распределение
Закон распределения:
Р„(А) = С‘рЧ"^
Параметры распределения:
МЛ: = пр, D/c = npq, ск = \Jnpq
А Пуассоновское распределение
Закон распределения: as
?(s)=Q-a —
Параметры распределения:
М5=я, Ds=a, cs=y/a
А Нормальное распределение
Дифференциальная функция распределения:
f(t) = —1—
су
Интегральная функция распределения:
.. 1 (t—а\
—)
2 \ О’ /
Параметры распределения:
ШГ=су2, сХ=с
Вероятность попадания случайной величины X в интервал [а, р [:
(р—/а —
---- -Ф ------ ,
а / \ а /
(р-а)/а
Р(а^Х<р)= f tp(z)dz
(а - а)/а
А Равномерное распределение
Дифференциальная функция распределения:
1
---- при а t Ъ, Ь — а
О при t<a или t>b
/(0=1
Основные формулы
441
Интегральная функция распределения:
' О при t<a,
t—а Ь — а при a^t^b,
. 1 при t>b
Параметры распределения:
a + b МХ= , 2 Г»у „у |a~f’1 их = , СТА = 12 2^/3
Показательное распределение
Дифференциальная функция распределения:
/Ы 0 при z>0, при £<О
Интегральная функция распределения: fl—e~u при г>0, j 0 при Г<0
Параметры распределения:
1 1 1
MJ=-, DX=—, аХ=-
X X2 X
А Коэффициент ковариации: k(X, Y) = M(XY)-MX'MY
А Коэффициент корреляции:
М(1Г)-М1-МГ
vX-vY
А Начальный, относительный и центральный моменты k-го порядка:
тк = £ xkiPi, m'k= X (xi-a^Pi, mk= £ (х—МХ)кР( i=l i=l i=l
А Точечная оценка математического ожидания:
Xi + x2 + ... + x„
1VIA —
П
А Точечная оценка дисперсии:
Y(Xi-x)2 п— 1
А Интервальная оценка математического ожидания: Р(|Г-а|<а//7«)=2Ф(/)
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Абсолютно сходящийся ряд 17, 287
Автоковариационная функция 276, 277
Алгебра событий 195, 390
Алгоритм Гаусса 163—167, 369, 370
Амплитуда 51
Аналитическая функция 124, 345
Апостериорная вероятность 206
Априорная вероятность 206
Аргумент комплексного числа 104, 331
Аффикс 103
Безгранично делимая случайная величина 432
Белый шум 282
Биномиальное распределение 221, 237, 240, 398, 406, 407
Булева алгебра 390
Вероятностная модель 392
Вероятность 193, 202, 388, 392
Вес 157, 366
Вещественная часть комплексного числа 102
Входной сигнал 282
Выборка 262
Выборочная дисперсия 263
Выборочные моменты 263, 422
Выборочный коэффициент ковариации 271
-----корреляции 271
Выходной сигнал 282
Вычет 131, 132, 350
Вычитание комплексных чисел 103
Гамма-функция 265, 424
Гармоника 51
Гармоническая функция 97, 322—325
Гармонический ряд 9
Гармоническое колебание 51
Гауссова кривая 209—211
Генеральная дисперсия 262
— совокупность 262
Геометрическая вероятность 202, 392
— прогрессия 8
Гильбертово пространство 46
Гиперболический косинус 113, 333
— синус 113, 333
Гипотеза 206
Главная часть ряда Лорана 129
Главное значение интеграла 359
Гомеоморфные множества 326
Деление комплексных чисел 103, 105 6-функция 77
Диаграмма Эйлера 192
Дискретная случайная величина 216
Дисперсия дискретной случайной величины 235, 236, 239, 403—406 — непрерывной случайной величины
235, 236, 239, 403—406
— случайного процесса 276, 428
Диффеоморфные множества 326
Дифференциальная функция распреде-
ления случайного процесса 275, 428
-------случайной величины 219—
221, 228, 398—400
Дифференцирование изображения 140, 151, 354, 355
— оригинала 139, 151, 354, 355
Дифференцируемость функции комп-
лексной переменной 116, 334
Доверительная вероятность 259, 421
Доверительный интервал 259, 421
Дробно-рациональная функция 144
Зависимые события 203, 392
Задача Дирихле 98, 327
— —, решение в круге 98—101, 327— 329
— интерполяции 160, 367, 368
— Коши для уравнения колебаний струны 83
Предметный указатель
443
----------------, решение в общем виде 89, 313, 314
----------------, — для неограниченной струны 83—85, 309
— — —--------—, — — ограничен-
ной струны с закрепленными концами 87—89, 310
—---------------—,----полуограни-
ченной струны с закрепленным концом 85—87, 310
----------теплопроводности 91, 316, 317
-------------, решение в общем виде 94—96, 319—322
-------------, — для частных случаев 91—93, 3’16—319
— линейной интерполяции 162, 163
— регрессии 268—273, 424—427 Закон больших чисел 244—246, 413 Замкнутость 62, 300
Запаздывание 139, 151, 354
Знакопеременный ряд 16 Знакочередующийся ряд 18, 287
Измеримое подмножество 392
Изображение 138, 351
Изолированная особая точка 126, 348
Изоморфизм гильбертовых пространств 50
Инвариантность 277
Интеграл Дюамеля 143, 357
— по комплексному аргументу 118— 120, 339—341
— Пуассона 329
— Фурье 74, 75
Интегральная формула Коши 123, 342
— функция распределения 217—219, 227, 398—400
Интегральный признак сходимости 13, 14, 287
Интегрирование изображения 140, 151, 354—356
— оригинала 140, 151, 354, 355
Интервал сходимости степенного ряда 27
Интервальная оценка 258
Интервальные оценки параметров распределения 259—261, 420—422
Интерполяционная формула 160 -----Лагранжа 160, 161, 368, 369
Квадратурная формула 176, 376 -----Гаусса 180, 380, 381
Квазилинейное уравнение 304, 308
Классическое определение вероятности 193
Ковариационная функция случайного процесса 276
Комплексное число 102, 330
Комплексный интеграл Фурье 75
— ряд Фурье 68
Корреляционная функция случайного процесса 277, 278, 428
Коэффициент ковариации 241—243, 271, 409, 410
— корреляции 241—243, 271, 409, 410
Коэффициенты квадратурной формулы 176, 376
— степенного ряда 26, 27
— Фурье 52, 53, 58, 298, 299
Кратность корня 331
— нуля 128
— полюса 127
Кривая нормального распределения 209—211
Круг сходимости степенного ряда 27, 126, 345
Лапласиан 97
Линейность 139, 354
Логарифм комплексного числа 109
Логарифмическая функция в комплексной области 109, НО, 332
Мажоранта 12
Марковский случайный процесс 278, 429
Математическое ожидание дискретной случайной величины 233, 234, 239, 403—405
— — непрерывной случайной величины 234, 239, 403—405
—------случайного процесса 276,
427, 428
Матрица вероятностей перехода 252, 416
Мера 275
Метод Гаусса 163—167, 369, 370
— Даламбера решения задачи Коши для уравнения колебаний струны 83—85, 309
— итераций при решении систем уравнений 174—176, 374—376
444
Предметный указатель
Метод итераций при решении уравнений 169—173, 370—374 — касательных 173
— ломаных Эйлера 181, 382
— наименьших квадратов 152—157, 270, 364—366
— Ньютона 172, 173
— Рунге — Кутта 183, 383, 384
— сеток 184—189, 384—387
— Фурье решения задачи Дирихле в круге 98 —101
----------Коши для уравнения колебаний струны 312, 313
------------------- теплопроводности 91—93, 317—319
— хорд и касательных 173
— Эйлера модифицированный 182, 382
Метрика 293, 370
Метрическое пространство 293, 370
Мнимая часть комплексного числа 102
Многочлены Лежандра 60, 159
— Чебышева 60, 159, 160
Множество значений функции комплексной переменной 115
Модель процесса диффузии 252
Модуль комплексного числа 104, 331
Начальный момент 243, 244, 263, 410—412, 422, 423
Независимые случайные величины 230, 400
— события 203, 392
Некоррелированные величины 242
Неоднородная линейная система 163
Неподвижная точка отображения 371
Непрерывная случайная величина 216
Неравенство Бесселя 58, 299
— треугольника 293
— Чебышева 245, 412, 413
Несепарабельное гильбертово пространство 48
Несмещенность оценки 262, 418
Несовместные события 196, 197, 391
«-мерный шар 326
Норма функции 58, 59, 299
Нормальное распределение 221—224, 237, 398, 407, 408
Нормированная автоковариационная функция 276, 277
— ковариационная функция случайного процесса 276, 428
Нуль 128
Область определения функции комплексной переменной 115
— сходимости функционального ряда 20
Обратная волна 85
Обратные гиперболические функции в комплексной области 114, 333 — тригонометрические функции в комплексной области 113, 114, 333
Объем генеральной совокупности 262
Однородная линейная система 163
Односвязное множество 120
Окрестность 106
Оператор 282
— Лапласа 97
Ординарность 397
Оригинал 138, 351
Ортогонализация 59
Ортогональная тригонометрическая система 53, 54
Ортонормированная система 157, 158, 366, 367
— тригонометрическая система 54, 297
Остаточная дисперсия 269, 270
Остаточный член ряда Тейлора 33, 292
----------в форме Коши 35, 36, 292
----------------Лагранжа 34, 292
Открытое множество 120
Относительный момент 243, 244, 263, 411, 412, 422, 423
Отсутствие последействия 397
Первообразная 121
Передаточная функция 79
Плотность амплитуды 74 — вероятности 219, 228
Подобие 139, 151, 354
Показатель роста 138, 351
Показательная функция в комплексной области 108, 109, 332
Показательное распределение 226, 227, 238, 399, 408, 409
Полнота 47, 62, 293, 302, 367, 371
Полюс 126, 127, 348
Попарно несовместные события 197
Пополнение метрического пространства 294
Предметный указатель
445
Порядок случайного процесса 278 — уравнения в частных производных 80, 303
Последовательность итераций 170, 370 — Коши 293
— независимых испытаний 207, 394
Поточечная сходимость 20
Правила операционного исчисления 139, 140, 143, 151
Правило «трех сигм» 213
Правильная дробно-рациональная функция 144
— часть ряда Лорана 129
Практически достоверное событие 212, 213
Предгильбертово пространство 48
Предел последовательности комплексных чисел 106, 332
— функции комплексной переменной 115
Предельная вероятность 255
Преобразование Лапласа 78, 79, 137, 138, 351
— Фурье 75—79, 248
Признак равномерной сходимости Вейерштрасса 26, 201
— сходимости Даламбера 13, 286, 287
-----интегральный 13, 14, 287
— Коши 13, 286, 287
-----Лейбница 18, 19, 290
Применение операционного исчисления к решению дифференциальных уравнений 147 —150
— рядов к приближенному вычислению значений функций 40—42
-------решению дифференциальных уравнений 42—44
Принцип максимального правдоподобия 270, 424, 425
— сжатых отображений 170, 371
— сравнения 11 —13, 286
— экстремума 323
Произведение событий 194, 195, 390
Производная функции комплексной переменной 116, 333, 334
Простой полюс 128
Пространство /2 48, 295, 296
— L2 48, 49, 299
— функций с интегрируемым квадратом 49
— элементарных исходов 392
-----событий 192, 388
Противоположные события 195, 390
Процесс Пуассона 279, 430, 431
Прямая волна 85
— выборочной регрессии 269
Пуассоновское распределение 221, 237, 398, 407
Равенство Парсеваля 62
Равномерная сходимость функционального ряда 22, 291
Равномерное распределение 224—226, 238, 398, 408
Радиус сходимости степенного ряда 27, 126, 291, 345
Разложения функций в ряд Тейлора 36—40, 125, 126, 292, 293
Распределение случайной величины 216, 217, 397
См. также соотв. названия
Расходящийся ряд 8
Реализация случайного процесса 275, 276, 427
Регулярная матрица 254
— цепь Маркова 254, 416
Решение уравнения в частных производных 81, 304
Ряд Лорана 128, 129, 348
— Маклорена 32, 292
— Тейлора 32, 292
-----для функции комплексной переменной 124
- Фурье 52, 53, 55, 65, 68, 298 -----для четной и нечетной функций
66
— Фурье—Бесселя 61
Свертка 142, 233, 356
Свертывание 142, 356
Свободная переменная 167, 370
Связное множество 120
Сепарабельность 47
Сжатое отображение 371
Сечение случайного процесса 274, 427
Система линейных уравнений 163, 369
Скалярное произведение 46, 48, 49, 53, 54, 157, 297
Сложение комплексных чисел 103, 104, 330
— рядов 10
446
Предметный указатель
Случайная величина 216
— функция 274, 427
Случайное блуждание на прямой 251
— событие 190, 392
Случайный процесс 274, 427
----с независимыми приращениями 279, 431, 432
----со стационарными приращениями 280, 432
Смещение 139, 151, 354, 355
Сопряженные гармонические функции 325
— комплексные числа 103
Состоятельность оценки 262, 418
Спектр 74
— стационарного случайного процес-
са 280, 281, 432, 433
Среднее значение случайной величины 234
Среднеквадратическое отклонение случайного процесса 276
— — случайной величины 236, 239
Средняя выборочная 262
— генеральная 262
— статистическая 258
Статистическая вероятность 201, 423
— совокупность 264
Статистический ряд 264, 423
Стационарность 397
Стационарный случайный процесс 277, 429
--------в широком смысле 280
Степенная функция в комплексной
области 107, 108, 114, 115, 331, 332
Степенной ряд 20, 291
Степень многочлена 144
— свободы 265, 266, 424
Стохастическая матрица 254
Ступенчатая система 164
Сумма ряда 8, 285
— событий 194, 195, 390
Существенно особая точка 126, 127,
348
Схема Бернулли 207, 394
Сходимость последовательности
в среднем 55, 298
— ряда в среднем 55, 56
-------- точке 20, 291
----на множестве 20, 291
Сходящийся ряд 8, 285
Счетная аддитивность 391
Таблица некоторых преобразований Лапласа 151
Теорема Абеля 27—29, 291
— Байеса 206, 394
— Бернулли 245, 246, 397
— Коши 120, 121, 341
— Ляпунова центральная предельная 247, 413, 414
— Муавра—-Лапласа интегральная
212, 396
----- локальная 210, 395
— о единственности обращения преобразования Лапласа 144, 360
-----необходимом условии сходимости ряда 9, 10, 285
-----полной вероятности 205, 393
-----пополнениях метрического пространства 294—296
-----предельных вероятностях регулярной цепи Маркова 254, 255, 417, 418
-----решении линейного уравнения в частных производных 81, 82, 304—308
-----сходимости в среднем ряда Фурье 63, 64, 302
— об аналитичности изображения 139, 352, 353
-----изоморфизме гильбертовых пространств 50, 296, 297
-----интеграле Дюамеля 143, 357, 358
-----обращении преобразования Лапласа 143, 144, 151, 359, 360
-----операциях над рядами 10, 11, 285, 286
-----основных свойствах преобразования Лапласа 139, 140, 354—356
-----умножении изображений 143, 151, 356, 357
—- основная алгебры 330
-----о вычетах 133, 350, 351
— Пуассона 214, 396, 397
— сложения вероятностей 197, 391
— существования и единственности решения задачи Коши 381, 382 ----------- уравнения колебаний
струны 310—312
— умножения вероятностей 203, 204, 392, 393
— Чебышева 246, 413
447
Предметный указатель
Теоремы о дифференцируемости функций комплексной переменной 116, 117, 334—339
-----замкнутости и полноте орто-нормированной тригонометрической системы 62, 63, 300—302
-----знакопеременных рядах 18, 19, 287—290
-----равномерно сходящихся функциональных рядах 23—26, 291
-----распределении суммы случайных величин 231 — 233, 401—403
-----рядах с положительными членами 11 — 14, 286, 287
--------Фурье 66, 67, 302
-----степенных рядах 29, 30, 291, 292
— об оригиналах с рациональными изображениями 144, 145, 361 — 363
Точечная оценка 258
Точечные оценки параметров распределения 258, 260, 261, 419, 420
Точка сходимости функционального ряда 20
Траектория случайного процесса 275, 276, 427
Трехсигмовый интервал 213
Тригонометрическая система 53, 297
— форма комплексного числа 104, 105, 331
Тригонометрические функции в комплексной области ПО—113, 332
Узел интерполяции 160, 367
— квадратурной формулы 176, 376
Умножение комплексных чисел 103, 105, 330
— ряда на число 10
— рядов 10
Уравнение Бесселя 44, 60
— в частных производных 80, 303
----- ---- второго порядка линейное--------неоднородное 81, 304
-----------однородное 80, 81, 303, 304
— первого порядка линейное---------------------------неоднородное 81, 304
—-------—-----------однородное 81,
303, 304
— колебаний струны 83, 89, 308, 309
— Лапласа 96, 97, 322
— Пуассона 97, 322
— теплопроводности 90, 314—316
Условия Коши—Римана 117, 334
— Эйлера — Даламбера 117, 334
Условная вероятность 203, 392
Условно сходящийся ряд 17, 287
Условное распределение 230, 400
Устранимая особая точка 126, 127, 348
Фаза 51
Формула Бернулли 208, 394, 395
— Гаусса квадратурная 180, 380, 381
— Грина 323
— Лагранжа интерполяционная 160, 161, 368, 369
— Лапласа 212
— Муавра 105, 331
— обращения преобразования Лапласа 144, 359
— парабол 178, 377—380
— полной вероятности 205, 393
— Рунге—Кутта 183, 382, 383
— Симпсона 178, 377—380
— трапеций 177, 178, 376, 377
Формулы Байеса 206, 394
Фундаментальная последовательность 293, 370
Функции Бесселя 45
Функциональный ряд 19, 20, 290
Функция Грина 321
— Дирака 77
— комплексной переменной 115
— конечного роста 138, 351
— распределения случайного процесса 274, 275, 428
— с интегрируемым квадратом 56, 299
— случайной величины 231, 400, 401
— Хевисайда 358
Характеристическая функция случайной величины 248, 249, 413
%2-критерий Пирсона 265, 266, 423,
424
^-распределение 265, 266, 423, 424
Центральный момент 243, 244, 263, 411, 412, 422, 423
Цепь Маркова 251, 416
448
Предметный указатель
Частичная сумма ряда 8
Частота 51
— появления события 201
Числовой ряд 7, 285
Чисто мнимое число 104
— случайный процесс 278 Член ряда 7
Шаг 180, 382
Экспоненциальное распределение 226, 227
Элементарное событие 192, 388
Элементарные функции комплексной переменной 107—115, 331—333
Элементарный исход 388
8-коридор 22
Эргодичность 283, 284
Эффективность оценки 262, 419
Учебное издание
Мантуров Олег Васильевич
КУРС ВЫСШЕЙ МАТЕМАТИКИ
Ряды. Уравнения математической физики. Теория функций комплексной переменной. Численные методы. Теория вероятностей
Зав. редакцией Е. С. Гридасова. Редактор А. М. Суходский. Мл. редактор Н. А. Власова. Художественный редактор В. И. Пономаренко. Технические редакторы Н. В. Яшукова, Г. А. Фетисова. Корректор В. И. Власова.
ИБ № 8170
Изд. № ФМ — 885. Сдано в набор 29.06.90. Подп. в печать 28.02.91. Формат 60x90/16. Бум. офсет. № 1. Гарнитура Таймс. Печать офсетная. Объем 28,00 усл.печ. л.+0,25 усл. печ. л. форзацы 28,50 усл. кр.-отт. 26,69 уч.-изд. л+0,34 уч.-изд. л. форзацы. Тираж 70000 экз. Заказ № 945. Цена 2 руб.
Издательство «Высшая школа», 101430, Москва, ГСП-4, Неглинная ул., д. 29/14
Ордена Октябрьской Революции и ордена Трудового Красного Знамени МПО «Первая Образцовая типография» Государственного комитета СССР по печати. 113054, Москва, Валовая, 28.