Текст
                    —...........
Р.С.ГУТЕР
Б.В.ОВЧ ИНСКИЙ
ЭЛЕМЕНТЫ
ЧИСЛЕННОГО АНАЛИЗА
И МАТЕМАТИЧЕСКОЙ
ОБРАБОТКИ 1
РЕЗУЛЬТАТОВ ОПЫТА

Р. С. ГУТЕР, Б. В. ОВЧИНСКИЙ ЭЛЕМЕНТЫ ЧИСЛЕННОГО АНАЛИЗА И МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ОПЫТА ИЗДАНИЕ ВТОРОЕ, ПЕРЕРАБОТАННОЕ Допущено Министерством высшего и среднего специального образования СССР в качестве учебного пособия для студентов высших технических учебных заведений о ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 1970
618 Г 97 УДК 518 Элементы численного анализа и матема- тической обработки результатов опыта. Р. С. Гутер и Б. В. Овчинский. Книга состоит из трех частей. Первая часть содержит основные методы вычисли- тельной математики: приближенное решение уравнений и систем, простейшие задачи линейной алгебры, парабо- лическую интерполяцию, численное интегрирование и решение дифференциальных уравнений. Вторая часть посвящена теории вероятностей в объеме, предусмотренном общей программой втузов. В третьей части рассматривается теория ошибок наблюдений, интерполяция по способу наименьших квад- ратов, а также выражение наблюденных данных урав- нениями (подбор эмпирических формул). Излагаемый материал сопровождается разбором примеров вычислений и обработки опытных данных. Книга предназначается в качестве учебного пособия для студентов втузов по вычислительной математике и тео- рии вероятностей и может быть использована инжене- рами, преподавателями специальных кафедр и научными сотрудниками в области технических наук, В книге 66 рисунков, 106 таблиц. Рафаил Самойлович Гутер Борис Владимирович Овчинский ЭЛЕМЕНТЫ ЧИСЛЕННОГО АНАЛИЗА И МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ОПЫТА М , 1970 г., 432 стр. с илл. Редактор Г. Я. Пирогова. Техн, редактор С. Я. Шкляр. Корректор Н. Д. Дорохова. Сдано в набор 30/Х 1969 г. Подписано к печати 5/1II 1970 г. Бумага 84Х108’/з2» Физ. печ. л. 13,5. Услозн. печ. ч. 22 63. Уч.-изд. л. 19,62. Тираж 60 000 экз. Т-00210 Цена книги 79 к. Заказ № 388, Издательство «Наука». Главная редакция физико-математической литературы. Москва, В-71, Ленинский проспект, 15. Ордена Трудового Красного Знамени Ленинградская типография № 2 имени Евгении Соколовой Главполиграфпрома Комитета по печати при Совете Министров СССР. Измайловский проспект, 29. 2-2-3 4-70
ОГЛАВЛЕНИЕ Из предисловия к первому изданию.............................6 Предисловие ко второму изданию...............................8 ЧАСТЬ ПЕРВАЯ ЭЛЕМЕНТЫ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ Введение ................. . . ..................9 Глава I. Численное решение уравнений и систем .... 24 § 1. Общие соображения ................................24 § 2. Способ хорд и способ касательных .................27 § 3. Дальнейшее рассмотрение способов хорд и касатель- ных. Комбинированный способ...........................32 § 4. Способ итераций .... 39 § 5 Случай алгебраического уравнения..................45 § 6. Решение системы линейных уравнений по способу Гаус- са . .....................................56 § 7. Применение способа Гаусса для вычисления определи- теля и нахождения обратной матрицы....................64 § 8. Итерации для линейных систем...................71 § 9. Способ Зейделя . .... ....80 § 10. Способ Ньютона для системы уравнений ... .85 § 11. Способ итераций для нелинейных систем уравнений . 89 Глава II. Интерполирование ..............................93 § 12. Понятие об интерполировании.......................93 § 13. Параболическое интерполирование. Интерполяционная формула Лагранжа..............................96 § 14. Интерполяционная схема Эйткина..............100 § 15. Равноотстоящие значения аргумента. Конечные раз- ности 104 § 16. Интерполяционные формулы Ньютона............117 § 17. Применение интерполяционных формул для экстрапо- ляции. Обратная интерполяция 125 § 18. Численное дифференцирование .....................129 § 19. О точности интерполяционных формул..........133 1
4 ОГЛАВЛЕНИЕ Глава III. Приближенное интегрирование.................. . 138 § 20. Интегрирование с помощью рядов................♦ . 138 § 21. Формулы численного интегрирования................141 § 22. О точности формул численного интегрирования . . . 146 § 23. Квадратурные формулы типа Гаусса.................152 Глава IV. Приближенное интегрирование дифференциальных уравнений . . ..........162 § 24. Общие замечания. Интегрирование с помощью рядов 162 § 25. Другие аналитические методы......................173 § 26. Численные методы интегрирования. Метод Эйлера . . 178 § 27. Метод Адамса — Крылова ......................... 187 § 28. Простейшие методы прогноза и коррекции. Метод Милна .................................................198 § 29. О точности методов численного интегрирования диф- ференциальных уравнений................................205 ЧАСТЬ ВТОРАЯ ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ Глава V. События и вероятность.............................209 § 30. Основные понятия. Классическое определение вероятно- сти . ... ..................209 § 31. Сложные вероятности Теоремы сложения и умноже- ния. Условные вероятности . 213 § 32. Полная вероятность. Формула Бейсса...............222 § 33. Другие определения вероятности...................228 § 34. Повторение испытаний ............................235 § 35. Асимптотические формулы. Локальная теорема Муав- ра — Лапласа .... . . ... .241 § 36. Нормальная функция распределения . . . . . 243 § 37. Интегральная теорема Муавра — Лапласа. Теорема Бернулли . . .........................245 Глава VI. Случайные величины...............................253 § 38. Случайная величина и ее закон распределения . . . 253 § 39. Функция распределения и плотность вероятности . . 257 § 40. Основные примеры дискретных и непрерывных распре- делений . ..................................266 § 41. Числовые характеристики случайных величин. Матема- тическое ожидание и дисперсия ... . . 278 § 42. Двумерная случайная величина. Функция распределе- ния и плотность вероятности ....................... ... 294 § 43 Числовые характеристики системы двух случайных ве- личин . . . . .... . „ . . 303 §'44. Нормальное распределение двумерной случайной вели- чины ................................314 § 45. Степень неопределенности дискретного распределения. Понятие об энтропии....................................322
ОГЛАВЛЕНИЕ 5 ЧАСТЬ ТРЕТЬЯ МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА Вводные замечания.......................................332 Глава VII. Теория ошибок................................343 § 46. Случайные ошибки .............................343 § 47. Формула Гаусса для распределения вероятностей слу- чайных ошибок . . ................ ... 346 § 48. Функция ошибок. Вероятная ошибка. Средняя и сред- няя квадратичная ошибки........................... ... 351 § 49. Определение меры точности по результатам произве- денных наблюдений ... . 355 § 50. О функциях величин, полученных из наблюдений . . 360 Глава VIII. Способ наименьших квадратов.................367 § 51. Общие замечания...............................367 § 52. Примеры применения способа наименьших квадратов 373 § 53. Ортогональные многочлены Чебышева.............382 § 54. Приближение функций по способу Чебышева .... 389 Глава IX. Представление наблюденных данных уравнениями. Эмпирические формулы ...................................393 § 55. Вводные замечания.............................393 § 56. Представление наблюденных данных линейными функ- циями . . .... ........................395 § 57. Функциональные шкалы и их применение . . . . 402 § 58. Нахождение коэффициентов для степенных функций 409 § 59. Подбор коэффициентов для показательных функций. Замечания о числе параметров ....................... 424 Приложения .............................................429
Из предисловия к первому изданию Значительное расширение области применения мате- матики увеличивает интерес к методам численного ана- лиза, позволяющим получать нужные результаты в кон- кретной числовой форме, и к методам математической обработки результатов опыта. Как? и почему? — так можно коротко сформулиро- вать вопросы, которые возникают при встрече с конкрет- ной задачей. В нашей литературе имеется уже ряд книг, посвященных численному анализу и дающих ответ на эти вопросы. Однако большинство этих книг ставит своей целью рассмотрение главным образом одного из них. Авторы поставили перед собой задачу, положив в основу «как»?, не упускать из виду также и «почему»?, чтобы книга могла служить учебным пособием для вту- зов. В основу книги положены лекции, неоднократно читанные каждым из авторов по соответствующему раз- делу курса. Вторая часть книги посвящена методам математи- ческой обработки результатов наблюдений, необходи- мость в которых очень велика и которым в литературе уделялось до сих пор меньше внимания. Нам казалось естественным объединить этот материал с методами чис- ленного анализа. Изучение методов обработки наблюдений требует знакомства с теорией вероятностей. Мы сочли полезным
ИЗ ПРЕДИСЛОВИЯ К ПЕРВОМУ ИЗДАНИЮ 7 не отсылать читателя к другим учебникам, уделив спе- циальную главу элементам теории вероятностей. Так как она несколько разрослась, то ей придан сравнитель- но самостоятельный характер, в результате чего она может служить учебным пособием по курсу теории вероятностей. Мы не стремились к тому, чтобы изложение мате- риала было однородным. Вопросы, входящие во втузов- скую программу, и методы, наиболее часто используемые на практике, разобраны довольно подробно, другие — более сжато и меньше проиллюстрированы примерами. Мы выражаем свою признательность А. Л. Брудно и Л. 3. Румшискому, внимательно прочитавшим рукопись и давшим большое число ценных советов. Мы особенно благодарны редактору книги И. Г. Арамановичу, чья работа во многом способствовала улучшению книги.
Предисловие ко второму изданию Настоящее издание нашей книги предназначено в ка- честве учебного пособия для втузов по вычислительной математике и теории вероятностей. В связи с этим пришлось несколько расширить первую часть в соответ- ствии с программой, выделить в самостоятельную часть и расширить материал по теории вероятностей и опу- стить ряд параграфов, не входящих во втузовскую про- грамму. План переработки книги был составлен авторами со- вместно, но фактическую переработку пришлось сделать мне одному. Мой близкий друг и многократный соавтор Борис Владимирович Овчинский скоропостижно скон- чался 29 июля 1968 года. Мне всегда будет недоставать его мягкого юмора и твердых формулировок. Большую помощь мне оказала Т. А. Муратова, про- верившая все вычисления. Благодаря ее работе в на- стоящем издании исправлено большое число опечаток и погрешностей. Я выражаю ей глубокую признательность не только от своего имени, но также и от имени всех будущих читателей этой книги. Я благодарю И. Г. Ара- мановича, внимательность которого заметно улучшила книгу. Р. Гутер Январь 1970
ЧАСТЬ ПЕРВАЯ ЭЛЕМЕНТЫ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ ВВЕДЕНИЕ Вряд ли удастся указать математическую операцию, которую приходилось бы применять чаще, чем вычисле- ние значений функции по заданной формуле. Первая встреча с этой операцией относится к самому началу курса алгебры в средней школе — вычисление числовых значений алгебраического выражения. При построении графиков функций приходится прибегать к ней же. На- конец, почти каждая прикладная задача требует, в ко- нечном счете, знания каких-то величин, которые полу- чаются путем вычисления значений функции по формуле. Для многих функций, которые часто встречаются, можно пользоваться готовыми таблицами. С такими таблицами нам приходилось встречаться даже раньше, чем с формулами, с помощью которых они получены, как, скажем, с таблицами тригонометрических функций или логарифмов. По мере углубления в курс математики и расширения области ее применения приходится встре- чаться все с новыми и новыми таблицами функций. Од- нако, сколько бы ни было составлено таких таблиц, все- гда будут возникать новые функции и необходимость их табулирования. Задача табулирования функции, т. е. выполнения вы- числений по данной формуле, и будет первой задачей, которую мы рассмотрим. С вычислениями по готовым формулам связан вопрос о точности вычислений, кото- рый мы также должны будем рассмотреть. Прежде чем приступать к непосредственным вычис- лениям, следует продумать программу действий и соста- вить схему вычислений. Для осуществления этой схемы необходимо объединить все вычисления в расчетной ра- бочей таблице.
10 D3L4ZH1IE Форма рабочей таблицы определяется видом задан- ной функции, и для ее составления трудно указать ка- кой-либо единый рецепт. Приведем только несколько общих соображений. Таблица должна быть составлена так, чтобы в каждом ее столбце выполнялись однообраз- ные действия. Столбцы располагаются в таком порядке, чтобы результаты, полученные в одном столбце, исполь- зовались при вычислении значений для следующего. При вычислениях рекомендуется заполнять последовательно столбец за столбцом. Это, во-первых, ускорит вычисле- ния, так как при заполнении каждого столбца мы вы- полняем только однотипные операции1), а во-вторых, облегчит контроль за вычислениями: часто благодаря монотонности изменения результатов отдельные ошибки (просчеты) могут быть легко обнаружены. Эти общие соображения лучше всего проиллюстриро- вать на примере. Пример 1. Мощность электрического тока, давае- мого батареей, выражается формулой W~ (R + r? ’ (1) где w — мощность, выраженная в ваттах, Е — электро- движущая сила в вольтах, г и R— соответственно вну- треннее сопротивление батареи и сопротивление внеш- ней цепи в омах. Полагая £=10 в, г — 0,57 ом, составим таблицу значений w как функции R для промежутка из- менений последнего 1 с интервалами по R в 1 ом. Составим прежде всего программу вычислений. Их можно проводить, как это показано в табл. 1. Нужные окончательные результаты вычислений со- держатся в столбцах (1)—значения независимой пере- менной R — и (5)—значения функции ш. В заголовке столбца (5) показано, что для отыскания его значений нужно значения из столбца (2) делить на значения из столбца (4). Аналогично можно было написать (4) = (З)2, Следует при этом заметить, что если пользоваться автомати- ческой клавишной машиной, то иногда можно не записывать неко- торых промежуточных результатов, и тогда несколько столбцов объ- единятся в один.
ВВЕДЕНИЕ 11 Таблица t (1) (2) (3) (4) (5) R 100 R R + r (R + r)2 (2) (4) 1 100 1,57 . . . . . . показывая, что для получения значений для столбца (4) нужно значения из столбца (3) возводить в квадрат. При заполнении столбца (4) необходимо выяснить, сколько цифр после запятой нужно вписать в эту графу. Такой же вопрос возникает и при заполнении столб- ца (5). Вопросы эти тесно связаны друг с другом. Прежде всего следует отметить, что в формулу (1) входят кон- станты Е=10 в и г=0,57 ом\ поэтому нужно выяснить характер этих констант. Если эти величины являются приближенными, то выписывать в столбцах (4) и (5) большое число знаков не имеет смысла. Но даже если считать значения Е и г абсолютно точными (что мало вероятно), все равно нет необходимости выписывать че- тыре знака в графе (4), если требуется, например, найти значения, w с точностью до одной сотой. Для выяснения необходимого числа знаков в проме- жуточных вычислениях следует рассмотреть вопрос о точности арифметических действий. Пока, до рассмотре- ния этого вопроса, будем считать значения Е и г точ- ными и сохранять в столбце (4) все четыре знака после запятой. При этом, как мы увидим дальше, в столбце (5) можно считать верным третий знак после запятой. Полезно отметить, что форма расчетной таблицы за- висит от того, какими вычислительными средствами мы располагаем. Например, схема табл. I особенно удобна при производстве вычислений на клавишной вычисли- тельной машине с автоматическим делением. Если де- ление придется выполнять на ручном арифмометре или без помощи вычислительных машин, но есть возможность воспользоваться таблицами обратных величин, то
12 ВВЕДЕНИЕ в табл. 1 удобно ввести столбец вида 1/(4) и получать значения w вместо деления умножением значений из этого столбца на значения из столбца (2). Если же та- ких таблиц под рукой нет, то вычисление обратных вели- чин будет излишней работой и следует пользоваться де- лением, как в табл. 1. Таким образом, вычисления по формуле (1) будут иметь вид, приведенный в табл. 2. Таблица 2 (1) (2) (3) (4) (5) । R 100(1) (!) + г (V (2; w = (4) 1 100 1,57 2,4649 40,570 2 200 2,57 6,6049 30,281 3 300 3,57 12,7440 23,539 4 400 4,57 20,8840 19,153 5 500 5,57 31,0240 16,116 6 600 6,57 43,1649 13,900 7 700 7,57 57,3049 12,215 8 800 8,57 73,4449 10,893 9 900 9,57 91,5840 9,827 10 1000 10,57 111,7249 8,951 Значения w, полученные в столбце (5) табл. 2, яв- ляются приближенными, потому что точное деление невозможно. К сказанному выше примыкают часто возникающие в практике вопросы следующего характера. Предположим, что радиус круга г измерен с некоторой ошибкой. Как оценить ошибку величины площади круга, вычисленной по формуле S = nr2? Иногда необходимо решать и обрат- ную задачу: задается величина допустимой ошибки для площади круга; требуется определить, с какой точностью следует измерять ее радиус. Ясно, что если величину площади круга нужно иметь с небольшой точностью, то нет смысла добиваться слишкОхМ большой точности в из- мерении его радиуса. В более общей постановке эти задачи можно форму- лировать следующим образом. Независимое перемен- ное х известно с некоторой точностью; с какой точностью
ВВЕДЕНИЕ 13 можно найти значение функции y=f(x)? Аналогично формулируется и обратная задача: необходимо получить значение функции у с заданной точностью; какова дол- жна быть точность значений независимого перемен- ного %? Для рассмотрения этих вопросов познакомимся бо- лее подробно с приближенными числами и способами их записи. Пусть А — некоторая величина, истинное значение ко- торой известно или неизвестно. Число а, которое можно принять за значение величины А, мы будем называть приближенным значением величины А или просто при- ближенным числом. Число а называют приближенным значением по недостатку, если оно меньше истинного значения, и по избытку, если оно больше. Например, число 3,14 является приближенным значением числа л по недостатку, а 2,72 — приближенным значением чис- ла е по избытку. Абсолютная погрешность *) приближенного числа есть абсолютная величина разности между истинным значе- нием величины и данным ее приближенным значением.- Поскольку истинное значение величины обычно остается неизвестным, неизвестной остается также и абсолютная погрешность. Вместо нее приходится рассматривать пре* дельную абсолютную погрешность, которая означает число, не меньшее абсолютной погрешности* 2). Приближенные числа принято записывать таким об- разом, чтобы вид числа показывал его абсолютную по* грешность, которая не должна превосходить половины единицы последнего разряда, сохраняемого при записи. Например, запись 3,1416 означает, что абсолютная по- грешность этого приближенного числа не превосходит 0,00005. Для числа 370 абсолютная погрешность не пре-, восходит 0,5. Если это число имеет большую точность, например если абсолютная погрешность меньше 0,05, то следует писать уже не 370, а 370,0. Таким образом, приближенные числа 37-10; 370; 370,0; 370,00 имеют ’) Часто говорят также абсолютная ошибка. 2) Иногда для краткости речи слово «предельная» опускают, понимая под абсолютной погрешностью именно предельную.
14 ВВЕДЕНИЕ различную степень точности: их предельные абсолютные погрешности составляют соответственно 5; 0,5; 0,05 и 0,005. Для больших чисел абсолютные погрешности могут иметь порядок единиц, десятков, сотен и т. п. Сохраняя и для таких чисел упомянутое выше правило, не следует выписывать все его цифры. Так, число двести семьдесят пять тысяч с абсолютной погрешностью, не превосходя- щей 500, надо писать в виде 275* 103. Запись вида 275 000 применять нельзя, ибо она означала бы предельную аб- солютную погрешность 0,5. При наличии большего количества цифр число сле- дует округлять, отбрасывая излишние цифры и руковод- ствуясь следующим известным правилом округления: если первая из отброшенных цифр 4 или меньше, то по- следняя оставшаяся цифра сохраняется без изменения; если первая из отброшенных цифр 5 или больше, то по- следняя оставшаяся цифра увеличивается на единицу. Исключением из этого правила является случай, когда отбрасывается только пятерка или же пятерка с нулями. Здесь принято сохранять последнюю оставшуюся цифру без изменения, если она четная, и увеличивать ее на еди- ницу до четной, если она была нечетная. Высказанные правила записи приближенных чисел применяются для записи исходных данных, полученных в результате измерений, и в математических таблицах. Абсолютная погрешность при этом не выписывается, и всегда предполагается, что она не превосходит половины единицы последнего разряда, сохраняемого при записи. В указанной форме записи все цифры, таким образом, являются верными. В окончательных результатах расчета принято запи- сывать числа с одной сомнительной цифрой (т. е. сохра- няя следующую за верной). При этом следует указывать предельную абсолютную погрешность, выписывая ее с одной значащей цифрой. Для этого погрешность округ- ления числа прибавляют к предельной абсолютной по- грешности и результат округляют в сторону увеличе- Дия ')•_________ ’) При массовых расчетах полученная таким образом погреш- ность может оказаться слишком завышенной.
ВВЕДЕНИЕ 15 Например, если в результате расчета получено число 2,734 с предельной абсолютной погрешностью 0,043, то это надо записать так: 2,73±0,05. Для уменьшения погрешностей округления промежу- точные действия рекомендуется производить, сохраняя несколько лишних знаков (обычно один или два). Точность данного приближенного числа не характе- ризуется его абсолютной погрешностью. Действительно, погрешность в 0,5 м слишком велика при измерении длины комнаты, допустима при измерении участка, от- веденного для постройки дома, и не может быть заме- чена при измерении расстояния между городами. На- стоящим показателем точности результата измерения или вычисления является его относительная погреш- ность. Относительной погрешностью приближенного значе- ния величины называют абсолютную величину отноше- ния его абсолютной погрешности к истинному значению этой величины. Часто эту относительную погрешность выражают в процентах. Ввиду того, что фактически вместо абсолютной по- грешности приходится рассматривать предельную, отно- сительную погрешность также заменяют предельной от- носительной погрешностью, которая означает число, не меньшее относительной погрешности. Более того, при отыскании предельной относительной погрешности при- ходится заменять неизвестное истинное значение вели- чины приближенным. Последняя замена обычно не от- ражается на величине относительной погрешности ввиду близости этих значений и малости абсолютной погреш- ности. Например, для приближенного значения л = 3,14 пре- дельная абсолютная погрешность составляет 0,0016, а относительная — 0,00051 или 0,051%. Выражение отно- сительной погрешности в процентах иногда называют процентной погрешностью. Установим теперь основные свойства абсолютной и относительной погрешностей. Выше были сформулиро- ваны две основные задачи: определение абсолютной по- грешности функции по погрешности независимой пере- менной и обратная задача — определение абсолютной
ВВЕДЕНИЕ погрешности аргумента по известной допустимой по- грешности функции. Решение этих задач дается следую- щей основной теоремой. Теорема. Предельная абсолютная погрешность функции равна произведению абсолютной величины ее производной на предельную абсолютную погрешность аргумента. Доказательство. Пусть число х является при- ближенным значением величины X с абсолютной по- грешностью | Дх|, Х — х+Ьх, (2) причем Дх может быть как положительным, так и отри- цательным, потому что х может быть приближением как по недостатку, так и по избытку. Обозначим абсолютную погрешность функции через | Дг/|. Тогда \Ьу\ = If К) -Цх) | = |f (х + Ах) -f(x) I'. Ввиду малости |Дх| мы можем заменить приращение функции ее дифференциалом. Тогда получим f (х + Дх) ~ f (х) + f'(x) Дх, откуда |Д{/|~|Г(*)1 • |Д*1- Обозначив предельную погрешность аргумента че- рез а, т. е. считая, что | Ах | 4Та, найдем |Ду| <a|f'(x) |. Таким образом, предельную абсолютную погрешность р функции f(x) можно принять равной Р = ос|Г(х) (3) Теорема доказана. Обозначим предельную относительную погрешность аргумента через бх и функции через 8У. Тогда, учитывая, 2 a что д*=КТ’т- е. а=|х|бж> получим для 6Й выражение л 0 - а1Н*)1 °"-lf(x)l lf(*)l (4)
ВВЕДЕНИЕ 17 Вспомнив выражение для логарифмической произ< водной dlnf(x) _ f'(x) dx f (x) ’ перепишем последнее выражение в виде 6, = |x^4r^|6- (4') Формулой (4) можно воспользоваться для отыскания относительных погрешностей ряда конкретных функций. Пусть, например, f(x)=xn. Тогда бу = IX-^5—| бд. = | n |6X, т. е. предельная относительная погрешность степени равна предельной относительной погрешности основания, умноженной на абсолютную величину показателя сте- пени. Найдем еще предельную абсолютную погрешность р для логарифмической функции. Положив f(x)=lnx, по формуле (3) находим Р “ а I Т | I ~х I так что предельная абсолютная погрешность натураль- ного логарифма равна предельной относительной по- грешности аргумента. Пример 2. Определим предельную относительную погрешность площади круга, вычисляемой по формуле 5 = лг2. Из (4) следует 6*=|г^|б'==2д" Таким образом, относительная погрешность вычислен- ной площади вдвое больше относительной погрешности измеренного радиуса. Пример 3. Определим, с какой относительной по- грешностью может быть найдена сторона квадрата, если известно, что его площадь равна 5=12,34 см\ 2 ₽. С. Гутер, Б. В. Овчинский
ВВЕДЕНИЕ Из выражения площади видно, что ока дана с пре- дельной абсолютной погрешностью 0,005 си2, откуда сле- дует, что ее относительная погрешность = = 0,0004 (=0,04%). Так как сторона квадрата а='/5, то из (4) находим da = |s- Д z_ = 16S = 0,0002 (= 0,02 %). Рассмотрим теперь вопрос об оценке предельной аб- солютной погрешности функции u=f(x, у) двух незави- симых переменных. Пусть х и у являются соответственно приближенными значениями величин X и Y с абсолют- ными погрешностями |Ах|, |А//1. Следовательно, Х = =х + Дх, T=f/4-Az/. Тогда |Au| = |/(X, Y)—f(x, у) | или I Au I = \f(x + Ах, у + ку) — f(x, у) Считая величины | Ах| и |А#| малыми, заменим при- ращение ки полным дифференциалом du. Это приводит к приближенному равенству . ди А . ди . _дх+__ду> откуда i4“i<|£hA*i+!-5-HAsl- Если обозначить предельные абсолютные погреш- ности аргументов х и у соответственно через ах и ау: то |Дх|<аж, |ДуКаи, 1 a I I ди I . I ди I । । I дх I + I ду | аУ’ и за предельную абсолютную погрешность р функции f(x, у) можно принять величину n I ди I , I ди i 0 ~ | дх Ittx + Ь// | аУ
ВВЕДЕНИЕ 19 Ясно, что аналогичное равенство имеет место и для дифференцируемой функции любого большего числа ар- гументов. Рассмотрим несколько примеров функций частного вида: 1. Пусть u = x + z/4-z + ...-H. Тогда I ди I __ I ди I __ | ди I . I дх | I ду | 1^1 И \ки\^ах + ау + .. . + аь т. е. абсолютная погрешность суммы не превосходит суммы предельных абсолютных погрешностей слагае- мых. При этом слагаемые могут иметь различные знаки. Следовательно, предельная абсолютная погрешность суммы равна сумме предельных абсолютных погрешно- стей слагаемых. При установлении предельной относительной погреш- ности суммы надо различать два случая: а) все слагаемые имеют одинаковые знаки; б) слагаемые имеют разные знаки. В первом случае, считая для простоты все слагаемые положительными, имеем (lx + + ... 4- а/ х + у + ... +1 Обозначим через бх, б^, ..., б* относительные погреш- ности слагаемых х, у, ..., t. Тогда ах = бхх, ау — ^уу, ... • ••» = Обозначим еще через бтах и бтт соответ- ственно наибольшее и наименьшее из чисел бх, бу, ... ..., б/. Будем иметь следующие оценки: Ъхх + Ъуу+ ... 4-d/f (* + #+ ... +0 бтах _ А о = ггг гт < х + у + ... -н ~°тах х + у+ ... +/ и аналогично 6>6min. Таким образом, бт!п < б < бтах, т. е. относительная погрешность суммы слагаемых од- ного знака заключена между наименьшей и наибольшей относительными погрешностями слагаемых. 2*
20 ВВЕДЕНИЕ Во втором случае дело обстоит сложнее. Пусть х>0, у>0 и и — х— у. Тогда (сохраняя прежние обозначения) будем иметь ах + ау О = -]----г . 1*~ #1 Следовательно, если числа х и у близки друг к другу, то даже при очень малых погрешностях х и у величина пре- дельной относительной ошибки может быть весьма зна- чительной. Поясним сказанное числовым примером. Пусть 1,245, //=1,235. Здесь ах = = 0,0005; бх«6У«0,04%. Вычисляя же предельную относительную погрешность 5 0,0005 + 0,0005 1ПЛл/ inn/ пг разности, получим д =------------100% = 10%. Таким образом, в результате вычитания двух близких чисел может произойти большая потеря точности. 2. Положим и—xyz (х>0, //>0, г>0). Тогда Формула (5) дает Р=yzax + xzay+xyaz. Предельная относительная погрешность функции и будет равна 0 yzax + xzay + xyaz о,. —---=------------------- " xyz xyz = Sx + by + sz, так что предельная относительная погрешность произве- дения равна сумме предельных относительных погреш- ностей сомножителей. 3. Положим, наконец, и = у (х>0, у>0). Тогда 1^1=1 1^.1 = |_ 41=4. I дх I у ’ I ду I I у2 I у2 Из (5) находим Р = У а* + Uy*
ВВЕДЕНИЕ 21 откуда В Ux 0,и д« = — =----1--= д х 4- д„, и и х 1 у х у следовательно, предельная относительная погрешность частного равна сумме предельных относительных по- грешностей делимого и делителя. Пример 4. При определении силы сопротивления квадратной пластинки, поставленной перпендикулярно к воздушному потоку, пользуются формулой P = kSv\ где Р — сила сопротивления, S — площадь пластинки, v — скорость воздушного потока и k — коэффициент про- порциональности. Зная, что величина k определена с от- носительной погрешностью 5%, S и v— с относитель- ными погрешностями 1%, определим относительную по- грешность величины Р. Согласно выражению для предельной относительной погрешности произведения имеем dp = Sfc + ds+26f, откуда др = 8%. Итак, для оценки погрешности мы получили следую- щие правила: 1) При сложении и вычитании абсолютные погреш- ности складываются. 2) При умножении и делении относительные погреш- ности складываются; при возведении в степень относи- тельные погрешности умножаются на абсолютную вели- чину показателя степени. 3) При отыскании значения функции абсолютная по- грешность функции равна произведению абсолютной погрешности аргумента на абсолютную величину про- изводной. Заметим еще, что при вычислении значений функции абсолютная погрешность может существенным образом зависеть от того, каким образом записана расчетная фор- мула и каково расположение операций в этой формуле. Для пояснения рассмотрим следующий пример. Пример 5. Вычислим площадь кругового кольца с внутренним радиусом г= 1,750 и толщиною й = 0,005.
22 ВВЕДЕНИЕ Здесь вычисления можно производить по формулам S = n[(r + /i)2 —г2] и S = n(2r+h)h. Хотя алгебраически эти формулы тождественны, но для вычислений вторая во много раз лучше первой, так как при вычитании близких величин в первой формуле отно- сительная погрешность сильно возрастает. Действительно, подсчитаем предельную абсолютную погрешность величины S/rc в том и другом случаях. В со- ответствии с правилом записи приближенных чисел, сле- дует считать, что предельная абсолютная погрешность величин г и 1г составляет 0,0005; при этом предельная абсолютная погрешность их суммы r + h равна 0,001. То- гда предельные относительные погрешности величин г и r + h равны соответственно 0,03 и 0,06%, а их квадра- тов— соответственно 0,06 и 0,12% (по второму правилу). Следовательно, предельная абсолютная погрешность ве- личины (r + h)2 равна 0,0037, а г2 равна 0,0018. По пер- вому правилу абсолютная погрешность их разности со- ставляет 0,0037 + 0,0018 = 0,0055, т. е. при расчете по первой формуле можно гарантировать лишь, что абсо- лютная погрешность величины S/л не превзойдет 0,0055. Совсем иначе обстоит дело в случае второй формулы. Предельные абсолютные и относительная погрешности множителя 2r+ h равны соответственно 0,0015 и 0,04%, а предельная относительная погрешность h составляет 10%. Поэтому предельная относительная погрешность отношения S/л составляет 10,04%. так что предельная абсолютная погрешность этого отношения при расчете по второй формуле равна 0,0018, что в три раза меньше, чем в предыдущем случае. Пример 5 показывает, насколько важно правильно выбрать вид расчетной формулы. Поэтому к указанным выше правилам подсчета погрешностей следует присо- единить важный практический совет: Формулы для вычислений надо стараться преобразо- вывать к такому виду, чтобы в них не было вычитания близких величин-, последнее может привести к большой потере точности и большим относительным ошибкам. Обращаем внимание читателя, что во всем предыду- щем изложении был рассмотрен только один вопрос:
ВВЕДЕНИЕ 23 как, зная погрешности исходных данных, оценить по- грешность результата расчета. Вопросу о методах оцен- ки погрешностей исходных данных, возникающих в про- цессе измерения, будет посвящена гл. VII. Причиной возникновения погрешностей является и то обстоятельство, что математический анализ отражает рассматриваемые процессы и явления лишь прибли- женно. Такого рода погрешностей мы касаться не будем. Точно так же мы оставляем без рассмотрения более де- тальный анализ погрешностей округления, ограничи- ваясь замечаниями, приведенными на сгр. 15. В связи с ошибками округления мы можем снова сравнить две расчетные формулы, приведенные в при- мере 5 с другой точки зрения. Можно считать, что зна- чения г и h являются точными, и интересоваться вопро- сом о том, с каким числом знаков нужно вести вычисле- ния для достижения нужной точности. И с этой точки зрения вторая формула, не содержащая разностей близ- ких величин, оказывается гораздо лучшей, нежели первая.
ГЛАВА I ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ § 1. Общие соображения Как известно, далеко не всякое уравнение может быть решено точно. В первую очередь это относится к большинству трансцендентных уравнений, т. е. уравне- ний, в которых неизвестная к находится под знаком трансцендентной функции. Доказано также, что нельзя построить формулу, по которой можно было бы решать произвольное алгебраическое уравнение степени выше четвертой 1). Однако точное решение уравнения не является без- условно необходимым. Задача отыскания корней уравне- ния может считаться практически решенной, если мы сумеем определить корни с нужной степенью точности и указать пределы возможной погрешности. Говоря о приближенном решении уравнений, мы всю- ду, кроме § 5, будем иметь в виду отыскание лишь действительных корней. Большинство употребляющихся приближенных спо- собов решения уравнений являются, по существу, спо- собами уточнения корней, т. е. для их применения необ- ходимо знание примерных значений корня. Для этой последней цели могут служить графические способы, о которых и будет сейчас идти речь. Пусть рассматриваемое уравнение имеет вид f(x)=O. (1.1) 1) Доказательство этого факта связано с именами замечательных математиков Абеля (1802—1829) и Галуа (1811—1832).
ОБЩИЕ СООБРАЖЕНИЯ 25 § И Построим в декартовой системе координат схематиче- ский график функции y = f(x). Абсциссы точек пересече- ния построенной кривой с осью Ох дадут нам значения действительных корней уравнения (1.1) После того как схематический график построен и примерно выделены участки оси абсцисс, в которых бу- дут лежать корни функции, мы приступим к уточнению значений корней. Для этого можно построить на выде- ленных участках график функции в более крупном мас- штабе, производя при этом более точное вычисление зна- чений функции. Разумеется, при этом мы значительно точнее найдем точки пересечения графика с осью абсцисс. Графическое отыскание корня можно производить иначе. Допустим, что уравнение (1.1) можно представить в виде Ш = Ж (2.1) В этом случае строим графики функций y=fi(x) и //^/Дх); абсциссы точек пересечения кривых будут дей- ствительными корнями уравнения. Пример 1.1. Найдем приближенно корни уравнения х — sinx— 1 =0 Записав это уравнение в виде х— 1 = sin х, построим графики синусоиды z/ = sinx и прямой у = х—1 (рис. 1). Точка пересечения этих линий имеет абсциссу л— 1,9, что можно считать грубым приближением значе- ния корня. Перейдем теперь к аналитическим способам уточне- ния значений корней. Сразу подчеркнем, что все эти спо- собы предполагают, что нам известен некоторый интер- вал [а, 6], в котором лежит уточняемый корень уравне- ния. Выбор этого интервала производится на основании известного свойства непрерывных функций: если функ- ция f(x) непрерывна на замкнутом интервале [а, Ь] и на его концах имеет различные знаки, f(a) -f (b) <0, то между точками а и Ь имеется хотя бы один корень урав- нения f(x) =0.
26 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. 1 Мы будем считать интервал [а, Ь] настолько малым, что на нем лежит в точности один коренылашего урав- нения. Тогда говорят, что интервал [а, Ь] является интер- валом изоляции корня1). Сужение интервала изоляции можно производить са- мым простым образом. Выбираем какую-либо точку с, лежащую внутри интервала (обычно за точку с прини- мают середину рассматриваемого интервала или близ- кую к ней точку, в которой удобнее вычислять значение функции), и вычисляем значение f(c). В качестве нового интервала изоляции мы примем ту из двух половинок интервала [а, 6], на концах которой функция имеет раз- ные знаки. Таким путем можно как угодно сузить участок, на котором находится корень, т. е. получить приближенное значение корня с любой степенью точности. Вместе с тем мы получаем здесь и оценку точности приближенного ре- шения (корень заключен между концами очередного участка). Однако, несмотря на принципиальную про- стоту, такое последовательное сужение участка на прак- Условия, при соблюдении которых интервал [а, Ь] будет ин- тервалом изоляции, сформулированы ниже.
§ 2] СПОСОБ ХОРД И СПОСОБ КАСАТЕЛЬНЫХ 27 тике не всегда проводится, ибо требует часто слишком большого количества вычислений. Поэтому мы перейдем к другим способам уточнения корня При применении этих способов будем требовать, чтобы на рассматриваемом интервале [я, &] функция f(x) удовлетворяла следующим условиям: 1) Функция f(x) непрерывна на отрезке [а, Ь] вместе со своими производными первого и второго порядков. 2) Значения f(x) на концах отрезка [а, &] имеют раз- ные знаки: 3) Первая и вторая производные f'(x) и f"(x) сохра- няют определенный знак на всем отрезке. Эти условия гарантируют, что корень у равнения (1.1) содержится в интервале [а, Ь] и других корней в этом отрезке не имеется. В самом деле, условия 1) и 2) га- рантируют, что между точками а и b находится хотя бы один корень уравнения; из условия 3) следует, что функ- ция f(x) на данном интервале монотонна и поэтому ко- рень будет единственным 1)- Заметим кстати, что мы можем ограничиваться только тем случаем, когда корни уравнения /"(х)=0 положи- тельны. Случай отрицательных корней может быть све- ден к рассмотрению положительных, для чего в уравне- нии достаточно заменить х на —х. В дальнейшем во всей этой главе мы будем предпо- лагать, что функция f(x) и интервал [а, Ь] удовлетво- ряют перечисленным выше условиям 1) —3). § 2. Способ хорд и способ касательных Наиболее распространенными способами приближен- ного решения уравнений являются способ хорд2) и спо- соб касательных. Идея способа хорд состоит в том, что можно с из- вестным приближением допустить, что функция на *) Значение постоянства знака 1"(х) выяснится несколько позже. 2) Способ хорд часто называют также правилом пропорциональ- ных частей, способом линейной интерполяции или ложного поло- жения.
28 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ {ГЛ. I достаточно малом участке [а, Ь] изменяется линейно. Тогда кривую y=f(x) на участке [а, Ь] можно заменить хордой и в качестве приближенного значения корня принять точку пересечения хорды с осью абсцисс. Для лучшего выяснения сути способа обратимся к чертежу (рис. 2). Построим график функции y = f(x) на участке [а, Ь]. Истинный корень уравнения F(,r)=O есть Рис. 2. абсцисса точки Л, являющейся точкой пересечения кри- вой ММ' с осью абсцисс. Заменив кривую ММ' хордой ММ', мы примем в качестве приближенного значения корня абсциссу точки В, в которой хорда пересекается с осью. Напишем уравнение прямой, проходящей через точки М(а, f(a)) и M'(b, y-f(a) = l(b)-f(a) b~a Абсцисса точки В, являющаяся приближенным корнем Х\ уравнения f(x)=O, может быть найдена из уравнения прямой, если положить в нем у = 0. Тогда получим y — а — ~ I (у 91 а (1.2)
§2] СПОСОБ ХОРД II СПОСОБ КАСАТЕЛЬНЫХ 29 или, иначе, af(b) — bf(a) Xi~ f(b) — f(a) • (3.2) Уравнение рассматриваемой прямой можно записать и в таком виде: y-f(b) х-Ь f (а) — f (Ь) а — Ь' Полагая здесь у = 0, придем к формуле x-b f (Ь) (Ь — а) ,42) 1 Ь I (b) — f (а) ’ Очевидно, формулы (2.2) и (4.2) тождественны. Мы бу- дем пользоваться той из них, которая окажется более удобной. Полученное значение Х[ можно снова использовать для дальнейшего уточнения корня по способу хорд, рас- сматривая интервал [a, %i] или же [хь 6], смотря по тому, в каком из них лежит истинный корень. Чтобы определить это, находят знак Пример 1.2. Найдем по способу хорд положитель- ный корень уравнения f(x)=x3 — 2х2 + 3х — 5 = 0. Прежде всего определяем знаки функции в различ- ных точках. Результаты вычислений приведены в таб- лице (табл. 1.2), причем значения аргумента помещены в том порядке, в каком вычисления проводились. Из таблицы видно, что функция меняет знак на интер- вале [1, 2]. Однако этот интервал слишком велик; даль- нейшее сужение дает интервал [1,8; 1,9], к которому мы и применим способ хорд, так как упомянутые в § 1
30 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. Т условия 1)—3) соблюдены1). Вычисление значений функции дает /(1,8) = —0,248, /(1,9)= +0,339. По формуле (4.2) x(i) =19___Lb9 -13) ♦0,339 _ । *1 1,У 0,339 + 0,248 - Вычислив значение функции при %=# 1,842, находим: /(1,842) = —0,01009 < 0. Отсюда видно, что истинный ко- рень расположен в интервале [1,842; 1,9]. Снова приме- нив к этому интервалу способ хорд, получим х(2) =19 0>°58 • 9,339 । 8427 ’ 0,339 + 0,01009 Вычисления значений функции дают /(1,8437) <0, /(1,8438)>0. Полагая значение корня равным х= 1,84375, видим, что погрешность полученного приближения меньше 0,00005. Отложим дальнейшие рассмотрения способа хорд до § 3 и перейдем к такому же элементарному рассмотре- нию способа касательных, который называют также спо- собом Ньютона. Обратимся снова к уравнению /(х) = 0. Возьмем некоторую точку с участка [а, Ь\ и проведем в точке [с, /(c)] графика функции касательную к этому графику. Уравнение касательной имеет вид у — f(c) = г (с) (х — с). В качестве приближенного корня уравнения /(х) = 0 примем абсциссу точки пересечения касательной с осью Ох, Полагая в уравнении касательной у = 0, нахо- дим для абсциссы точки пересечения X2 = c-W (5-2) (см. рис. 3, где принято с = &). 9 Для применения способа хорд условия 1)—3) из § 1 не являются необходимыми. Однако мы будем требовать их выполне- ния, имея в виду главным образом применение комбинированного способа (см. ниже, § 3).
§2] СПОСОБ ХОРД И СПОСОБ КАСАТЕЛЬНЫХ 31 Остается решить вопрос о выборе точки с. На рис. 3 мы приняли с = Ь. Нетрудно видеть, что в этом случае f'(c)>0 и f"(c)>0, ибо кривая вогнута. Обычно прини- мают с = а или с = &, смотря по тому, в какой из этих точек знак функции совпадает со знаком второй произ- водной, т. е. с выбирают так, чтобы произведение было положительно. Как будет показано ниже, в этом случае можно гарантировать, что приближенное значение корня, полученное по способу касательных, ле- жит в интервале [а, 6], т. е. что а<х2<Ь. в способе хорд, значение х2 можно использо- дальнейшего уточнения корня, беря интервал Как и вать для [а, х2] или [х2, &]. Пример 2.2. Рассмотрим то же уравнение, что и в примере 1.2: х3 —2х2 + 3х —5 = 0. Здесь fz(x)=3x2— 4х + 3 > 0 и f"(x) = 6x— 4 > 0, ибо мы выбрали интервал [1,8; 1,9]. Если принять с = а, то f (c)f"(c) <0, ибо /(1,8) <0. Наоборот, при с = & = 1,9 имеем /(c)f,,(c) > 0, так что касательную следует прово- дить в точке с = Ь. Формула (5.2) дает ^=1,9--^- = 1,846.
32 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I Так как /(1,846) =+0,0132, то на участке [1,8; 1,846] можно вновь применить метод касательных, полагая с = 1,846. Воспользовавшись снова формулой (5.2), по- лучим ^-1.846-^-1,8438, Как мы уже видели в примере 1.2, погрешность найден- ного значения не превышает 0,0001. § 3. Дальнейшее рассмотрение способов хорд и касательных. Комбинированный способ Рассмотренные в § 2 примеры показывают, что спо- соб хорд и способ касательных дают приближение корня с разных сторон (больше и меньше истинного корня). Такой характер приближения, как будет показано ниже, имеет место всегда. Поэтому обычно бывает выгодно применять оба эти способа одновременно, благодаря чему уточнение корня может быть получено быстрее. Ограничения, наложенные в § 1 на функцию и отре- зок [а, 6], показывают, что возможны четыре различных случая поведения функции на этом отрезке в зависи- мости от знаков производных. На рис. 4—7 изображены все возможные случаи поведения функции. По рисункам видно, что во всех четырех случаях точка Л, изображаю- щая истинный корень, лежит между точкой В, т. е. при- ближенным значением корпя по способу хорд, и точ- кой Р, изображающей приближенное значение корня, по- лученное по способу касательных. Обозначим абсциссу точки А через т, точки В — через Xi и точки Р — через х2. Из рис. 4 видно, что для слу- чая, когда у' > 0 и у" > 0, имеют место неравенства а < Х[ < х < л'2 < Ь. Это же неравенство имеет место для случая у' < 0, у"<0 (рис. 7). Если f/z>0, но у"<0 (рис. 5) или, наобо- рот, 1/'<0, у">0 (рис. 6), то Я < Х2 < X < Х[ < Ь.
§ 3] КОМБИНИРОВАННЫЙ СПОСОБ 33 При этом во всех случаях касательная проводится в соответствии с указаниями § 2. Таким образом, во всех четырех случаях истинный корень уравнения заключен между приближенными кор- нями, получающимися по способу хорд и по способу ка- сательных. Расположение корней можно охарактеризо- вать таблицей (табл. 1.3). Сделаем теперь несколько замечаний, касающихся практического применения комбинации способов хорд и касательных. Прежде всего необходимо, как было указа- но выше, выделить интервал [я, Ь], т. е. изолировать корень. Далее, определив знаки производных, мы можем судить о расположении корней по приведенной здесь таблице 1.3. 3 Р С Гутер, Б. В. Овчинский
34 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. Г Таблица 1.3 Способ хорд Способ касательных у'у" ' > 0 с недостатком с избытком у'у" < С 0 с избытком с недостатком Пусть, например, у'у" > 0. Тогда способ хорд дает значение корня с недостатком. Для отыскания этого кор- ня мы воспользуемся формулой (2.2), записав ее в виде ai = а + Да, где Да = - • U -3) Для способа касательных следует выбрать с = Ь, так что формулу (5.2) можно записать в виде Ь^Ь + \Ь, где Д6=-^-. (2.3) Так как способ касательных дает значение с избыт- ком, то истинный корень находится на интервале [аь &1]. Поэтому можно продолжать дальнейшее уточнение кор- ня, получая новый отрезок по формулам а2 = ai + -/(а// ’ (3-3) б2=б1 + Дб1, д&1 = -Ж1. (4.3) Подобное уточнение следует продолжать до тех пор, пока не получится интервал, длина которого не превос- ходит допустимой погрешности. Отметим, что обычно среднее арифметическое при- ближенных корней, полученных по способу хорд и спо- собу касательных, дает лучшее приближение, нежели каждый из этих корней в отдельности. Если у'у" < 0, то ход решения остается тем же, но формулы меняются местами. Способ хорд дает в этом случае корень с избытком, а способ касательных — с не- достатком. Для способа касательных следует выбирать с = а, поэтому формулу (5.2) мы запишем в виде at = а + где \а = — . (5.3)
КОМБИНИРОВАННЫЙ СПОСОБ 35 § з] В способе хорд мы воспользуемся формулой (4.2), запи- сав ее в виде bt — b + \b, где . (6.3) Истинный корень находится в интервале [аь Z»j]. Даль- нейшее уточнение производится по формулам о,-«, + Да„ Да,= -21а1, (7.3) »2./,,+лб„ 'у,1!1,;;;’- (8.3) и т. д. Пример 1.3. Решим способом хорд и касательных уравнение (х- \)2 = ^е\ Записав уравнение в виде ех— 2(х—1 )2 = О', поло- жим /(%) = ех — 2(х — I)2. Легко убедиться, что f (0) = — 1 <0 и f (1) = е = 2,7 > 0, так что корень уравнения лежит в интервале [0, 1]. Что- бы уменьшить участок, вычислим f (0,5): /(0,5)=/Г-2.4>0. ибо Уе > 1. Таким образом, можно принять а = 0, b = 0,5. Для этого интервала f'(x) = ех — 4(х— 1)>0 (ех>0, х— 1<0), ^(Х) = ех — 4 < 0. Таким образом, здесь у'у" < 0, так что способ хорд дает приближение с избытком, а способ касательных — с не- достатком. Результаты вычислений удобно записывать в форме таблицы (табл. 2.3 на стр. 36), в которую введены про- межуточные графы, облегчающие вычисление значений функции и производной. Как показывает таблица 2.3, в результате трех шагов оба способа дают с точностью до пяти знаков одно и то 3*
Таблица 2.3 Приближение X еХ х— 1 (х- I)2 -2 (х- I)2 f (х) = еХ - - 2 (х - I)2 — 4(х — 1) Г (х) = еХ- -4 (х- 1) , Да = На) V (а) Д/? = f (ЩЬ - а) Iff (b) - f(a) I 0 0,5 1,0 1,6487 -1,0 -0,5 1,о 0,25 -2,0 -0,5 -1,0 1,1487 4,0 5,0 0,20 -0,26 II 0,20 0,24 1,22140 1,27125 -0,80 -0,76 0,64 0,57760 -1,28 -1,15520 -0,05860 0,11605 3,20 4,42140 0,013 -0,026 III 0,213 0,214 1,23738 4,23862 -0,787 -0,786 0,61937 0,61780 -1,23874 -1,23560 -0,00136 0,00302 3,14800 4,38538 0,00031 -0,00069 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ
§ 3] КОМБИНИРОВАННЫЙ СПОСОБ 37 же приближенное значение корня х = 0,21331. Если бы мы хотели ограничиться двумя шагами приближения, то в качестве приближенного значения корня лучще всего было бы взять среднее арифметическое значений, полу- ченных различными способами: х = 0,2135. Остается только показать, что, пользуясь этими двумя спосо- бами в отдельности (или их комбинацией) несколько раз, можно получить корень с любой степенью точности, т. е. доказать сходи- мость рассматриваемых процессов. Пусть х®\ ...» ... — последовательность приближен- ных корней уравнения, полученных по способу хорд, ах — точный корень того же уравнения. Как было показано выше, в зависимости от знака производных имеют место неравенства или При этом два соседних значения связаны соотношением ?П+1)_Х(П) 1 1 • (9.3) Так как последовательность [х^] монотонна и ограничена, то она имеет предел. Обозначив его через а: lim х^ = а, П-»оо перейдем к пределу в равенстве (9.3), что дает а = а — (&-а) f (а) откуда вытекает f(a) = 0, т. е. а = х1), ибо других корней в интер- вале [а, 6], по предположению, нет. Аналогично доказывается сходимость для способа касательных. Обозначим через последовательность корней, получающихся по способу касательных. Как и выше, эта последовательность моно- тонна и ограничена, а потому имеет предел. Кроме того, _ х(п) f (*2 ) (10 3) 2 2 f'W J) Здесь а =/= b и f(a) =# f(b).
38 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I Пусть lim = р. Перейдем к пределу в равенстве (10.3); ПО- ri->оо лучим 0- 0 HP) 0 0 Г(Р). что дает f (Р) — 0, т. е. р = х. Все предыдущие рассуждения основывались на том, что нам удавалось выделить интервал [а, 6], в котором функция Пх) изменяет знак, а ее производные f'(x) и f"(x), наоборот, сохраняют свои знаки. Может, однако, случиться, что производная (х) обращается в нуль при значении, равном корню рассматриваемого уравнения, или вблизи него. В этом случае выделение нужного нам интервала встречает серьезные трудности. При этом часто бывает удобно предварительно найти корень уравнения /‘'(х) =0. Пусть этим корнем будет х = х0, т. е. Г(хо) = О. Вы- числим f(x0) и f"(xQ). Если f(x0) = 0, то х = Хо является двойным корнем уравнения f (х) = 0. Это следует из фор- мулы Тейлора, которая в данном случае (f(x0) =Г(хо) = = 0) имеет вид Н*) = (x~^)27,,Uo)+ ... Если f"(xo)=/=O, то f(x) содержит множитель (х — х0)2, что и означает, что х0 является двойным корнем. Если же f(xo)=#O, то нужно исследовать знак произведения Г(Хо)Г(Хо). Положительность произведения f (х0) f" (х0) > 0 воз- можна в двух случаях: f(xo)>O, f"(xQ)>0 и f(xo)<O, f"(*o)<O. В первом случае функция имеет положитель- ный минимум, во втором — отрицательный максимум (-напомним, что ^(хо) = О), так что уравнение f(x) = O не может иметь корней вблизи точки х0. Наоборот, при f(xo)f"(xo) <0 функция имеет отрицательный минимум или положительный максимум, так что в окрестности х = х0 можно ожидать два корня рассматриваемого уравнения. Воспользовавшись представлением функции f(x) по формуле Тейлора в окрестности точки х0 и огра- ничившись членами второй степени, найдем f(x) = F(xo) + 4r(xo)(x-xo)2+ ... (11.3)
§ 4] СПОСОБ ИТЕРАЦИЙ 39 Приравнивая f(x) нулю, из (11.3) найдем приближе- ния для этих двух корней. Эти значения равны Л'1 = xQ — fM Хо — Xq + (12.3) Каждое из этих приближений можно уточнять дальше обычными приемами, рассматривая интервалы [xi,xo] и [х0, *2] или несколько сдвинув конец того или иного ин- тервала в необходимую сторону. § 4. Способ итераций В ряде случаев весьма удобным приемом решения уравнений является метод итераций (повторений). Для применения этого метода исходное уравнение нужно за- писывать в форме х = <р(х). (1.4) Пусть каким-либо способом выделен интервал [а, Ь] изоляции корня этого уравнения и xQ — любая точка этого интервала (нулевое приближение). Для получения следующего приближения Xi в правую часть уравне- ния (1.4) вместо х подставляем значение х§, так что Xi = ф(х0). Следующие приближения получаются по схеме Х2 = ф(Х1), х3 = ф(х2), х„ = ф(хп-1), Если последовательность •••, хп, ... имеет пре- дел lim хп = х, то х является корнем уравнения (1.4). П-»оо В самом деле, предполагая, что ф(х)—непрерывная функция, получим х — lim хп — lim ф(хп_1) = ф< lim хп_Л = ф(х), П-»оо П->оо \П->оо J
40 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ (ГЛ I т. е. X = ф (х). Следовательно, х является корнем нашего уравнения. Поэтому7 одно из значений хп с достаточно большим но- мером можно принять за приближенное значение корня. Однако может случиться, что последовательность хь х2, • • •, *п, • • • не имеет предела, и тогда метод итера- ций не приводит к цели. Представляет большой интерес выяснить условия, при которых итерационный процесс сходится. Имеет место следующая теорема. Теорема. Пусть интервал [а, Ь] является интерва- лом изоляции корня уравнения х = ф(х) и во всех точ- ках эггого интервала производная ф'(х) удовлетворяет неравенству *) |ф'(х)|<М< 1. (2.4) Если при этом выполняется условие* 2) а^ф(х)^&, то итерационный процесс сходится, причем за нулевое при- ближение л'о можно брать любую точку интервала [а, 6]. Доказательство. Пусть дано уравнение х = ф(х) и интервал [а, Ь] изоляции корня этого уравнения. Будем считать, что функция ф(х) дифференцируема и ее произ- водная удовлетворяет условию теоремы. Пусть х0 — любая точка интервала [я, Ь] и Xj = = ф(хо) — первое приближение. Если х—точный корень уравнения, то, применяя теорему Лагранжа, получим х —X! = ф(х) —ф(х0) = (х—Х0)ф/(^о), *) Из этого неравенства 5 же следует, что уравнение (1.4) не мо- жет иметь в интервале [а, Ь] двух корней. В самом деле, допустив противное: х' ® ф(х') и х" = ф(х"), придем к равенству х'— х" =» = ф(х') — ф (х") = (х' — х")ф'(£), которое невозможно, так как ф'(Ю< 1. 2) При соблюдении этого условия все последующие приближения будут лежать в интервале [а, Ь] Если 0^ф'(х)< 1, то это условие следует само собой. Если же —1 <ф'(х)^0, то нужно только проверить, что пер- вое приближение Xi не выходит за границы интервала [а, 6]; тогда остальные приближения будут обязательно лежать в [а, Ь]. Доказа- тельство см. Б. П. Д е м и д о в и ч и И. А. М а р о н, Основы вычисли- тельной математики, гл. IV.
§4] СПОСОБ ИТЕРАЦИЙ 41 где точка g0 лежит между точками х и хп, т. е. заведомо на интервале [я, 6]. Согласно неравенству (2.4), будем иметь |х~ Х11 = |х — х0| |фх (go) \ ^М\Х — Х0|. Для второго приближения х% = ф(Х1) аналогично по- лучим (по условию теоремы точка Х[ принадлежит ин- тервалу [а, &]) X— Х2 = ф(т) — ф(Х1) = (х — Х1)ф'(^1), где gi заключено опять-таки между а и Ь. Применяя пре- дыдущее неравенство, установим оценку: j х— х21 | х — х0Л42. Повторяя указанный процесс, найдем I х — хп' <! х — Хо I Мп. (3.4) Так как М < 1, то Мп -> 0 и, следовательно, lim (х — xrt) = 0, т. е. limx„ = x. П-»оо П~>оо Таким образом, для сходимости итерационного про- цесса достаточно, чтобы неравенство | ф'(х) |< 1 соблю- далось на рассматриваемом интервале. При этом нера« венство (3.4) позволяет дать оценку точности приближе- ния. Так как }х — Хо| < Ь — а, то |х-хп|<(&-л)М”. • (4.4)' Пример 1.4. Решим методом итераций уравнение 4х — 5 In х = 5. 4х_~ 5 Записав уравнение в форме In х =—, ищем «ну* левое приближение» графически, находя пересечение ло- 4 гарифмической кривой с прямой z/ = yx — 1 (рекомен- дуем построение сделать самостоятельно). Находим два приближенных значения корня: хо = 2,28 и х0 = 0,57, ко- торые и принимаем за нулевое приближение. Для более точного отыскания правого корня запишем уравнение в виде х = 1,25(1 + 1пх).
42 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ I Здесь ф(х) = 1,25(1 4-1пх). Итерационный процесс схо- 1 25 дится, так как q/(x) =-J—, что в окрестности правого корня положительно и меньше единицы. Вычисления приведены в табл. 1.4. Таблица 1.4 (1) (2) (3) X In (1) + 1 1,25-(2) 2,28 1,82418 2,28022 2,28022 1,82427 2,28034 2,28034 1,82432 2,28040 2,28040 1,82435 2,28044 2,28044 1,82437 2,28046 2,28046 1,82438 2,28048 2,28048 1,82439 2,28049 2,28049 1,82439 2,28049 Для отыскания корня с точностью до пяти знаков по- требовалось восемь шагов. Такую скорость сходимости можно считать достаточно хорошей. Она объясняется, во-первых, тем, что производная вблизи корня доста- точно мала (около 0,55), а во-вторых, удачным выбором нулевого приближения. При отыскании левого корня итерационный процесс п \ 1,25 оказывается расходящимся, потому что здесь ф (х) =---- в окрестности х = 0,57 имеет значение около 2,2. По- этому первоначальное уравнение следует переписать иначе. Записав его в виде х = е0’8^'1, найдем: ф(х) = е°’8х“1 и ф'(х) = О,8ео’8х-1. Здесь производ- ная тоже положительна и меньше единицы (около 0,46), так что итерационный процесс сходится. Как показывают вычисления, приведенные в табл. 2.4, для отыскания корня с точностью до пяти знаков после запятой тре- буется уже одиннадцать шагов. Такую скорость также можно считать достаточной. Здесь процесс сходится медленнее, чем в предыдущем случае, хотя производная
§ 4] СПОСОБ ИТЕРАЦИЯ 43 Таблица 2.4 (1) (2) (3) (4) X 0,8.(1) (2) - (1) 0,57 0,456 -0,555 0,58042 0,58042 0,46434 — 0,53565 0,58528 0,58528 0,46822 -0,53178 0,58756 0,58755 0,47005 — 0,52995 0,58863 0,58863 0,47093 -0,52910 0,58913 0,58913 0,47130 -0,52870 0,58937 0,58937 0,47150 -0,52850 0,58949 0,58949 0,47159 -0,52841 0,58954 0,58954 0,47163 -0,52837 0,58957 0,58957 0,47166 -0,52834 0,58958 0,5895*8 0,47166 -0,52834 0,58958 и меньше. Причиной замедления является менее удач- ный, чем ранее, выбор нулевого приближения. Если в первом случае нулевое приближение отличалось от истинного корня на величину порядка 10-4, то во втором случае — на величину порядка 10-2. Для приведения уравнения f(x)=0 к виду х = ф(х) таким образом, чтобы получить сходящийся итерацион- ный процесс, часто поступают так: уравнение f(x) = O равносильно уравнению Х/(х)=0; прибавив х к левой и правой частяхм этого равенства, приходим к уравнению Z/(x) + х = х, (5.4) в котором уже можно положить kf(x) + х = ф(х), так что уравнение (5.4) приведется к виду х = ф(х). Параметр к остался свободным, и его можно подо- брать таким образом, чтобы ф'(х) ==к f'(x} 4-1 было меньше единицы по абсолютной величине, что будет га- рантировать сходимость итерационного процесса. Интересно рассмотреть геометрический смысл итера- ционного процесса. Построим графики функций // = ф(х) и у — х (рис. 8). Корнем уравнения является абсцисса точки пересечения кривой у = ф(х) с биссектрисой коор- динатного угла. Если Хо—абсцисса нулевого приближе- ния, то Х1 = ф(х0) равно ординате соответствующей
44 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. Т точки М кривой или же абсциссе точки Mi, Аналогично находятся следующие приближения (рис. 8). Здесь мо- жем также установить роль условия |ф'(х) | <1. Так, рис. 8 изображает случай, когда 0<ф'(х)<1, так что кривая пересекает биссектрису слева направо и справа лежит под биссектрисой. Итерационный процесс в этом случае сходится, причем приближения монотонно убывают, если х0 > х, или монотонно возрастают при
§Я СЛУЧАЙ АЛГЕБРАИЧЕСКОГО УРАВНЕНИЯ 45 xQ <х. На рис. 9 приведен случай, когда ср'(х)> 1. Здесь кривая пересекает биссектрису снизу вверх, процесс ока- зывается расходящимся. На рис. 10 и 11 изображены, соответственно, случаи, когда производная q/(х) отрица- тельна. Если при этом 11ф'(х)|<1 (рис. 10), то итераци- онный процесс сходится, но приближения колеблются около истинного значения корня. При |ф'(х)|>1 (рис. 11) процесс расходится. § 5. Случай алгебраического уравнения Методы приближенного решения уравнений, рассмо- тренные в предыдущих параграфах, одинаково примени- мы к любым уравнениям, как алгебраическим, так и трансцендентным. Вместе с тем можно указать ряд прие- мов, облегчающих отделение корней и отыскание их при- ближенных значений, которые пригодны специально для алгебраических уравнений. Пусть уравнение f(x) = 0 является алгебраическим уравнением n-й степени и записано в виде aoxn + aixn-l + . . . + ап-\х+ап=0. (1.5^ Прежде всего, мы имеем возможность указать грани- цы для корней этого уравнения как действительных, так и комплексных. Они могут быть найдены с помощью сле- дующей теоремы. Теорема. Если д (2.5) I ио I где А — наибольшее из чисел |ai|, | а21, | ап |, то |aoxn j> jajx"-1 + а2хп~2+ ... + + ап I. (3.5/ Действительно, пз (2.5) выводим * А 1 или |ао1^лттрт откуда I аохп | > А ц.|11 . (4.5)
46 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. Г С другой стороны |flIx"-1 + a2x"-2+ ... + an_1x + anK <Jail|x|n 1 +1 a211 x I” 2 + ... +1 an-i || x | +1 an | < Л(| x r1 +1X I"-2 + ... +|x|+0= I X |л - 1 I x |л Из (2.5) следует | х |> 1. Поэтому । „Т и \аххп~х + а2хп~2 + ... + ап_хх + ап\< А . (5.5) Сравнение неравенств (4.5) и (5.5) приводит к неравен- ству (3.5), которое и требовалось доказать. Если х является корнем уравнения (1.5), то, очевид* но, должно соблюдаться равенство \аохп\ = laix71-1 4- ... + ап_хх + ап\. Поэтому значения х, удовлетворяющие условию (2.5), в силу неравенства (3.5) не могут служить корнями урав- нения (1.5). Итак, корни алгебраического уравнения (1.5) удовле- творяют неравенству д lx|<1+ТГг (6-5) I ао I А Число N = 1 + является верхней границей моду- лей корней алгебраического уравнения. Если речь идет о действительных корнях уравнения, то можно получить оценку, гораздо более точную, чем (6.5). Прежде всего, как было отмечено в конце § 1, мо- жно ограничиться рассмотрением лишь положительных корней уравнения, так как для отыскания отрицательных корней уравнения f (х) = 0 достаточно найти положитель- ные корни уравнения f (—х) = 0 и изменить их знак. Предположим, что коэффициент aQ > 0. Если бы все следующие коэффициенты многочлена были положитель- ны, то f (х) > 0 при любом х > 0, так что уравнение (1.5) не имело бы положительных корней. Таким образом, среди коэффициентов уравнения (1.5) должны быть от- рицательные. Пусть теперь (&>1) является первым отрицательным коэффициентом. Обозначим через В паи-
СЛУЧАЙ АЛГЕБРАИЧЕСКОГО УРАВНЕНИЯ 47 § 5) большую из абсолютных величин отрицательных коэф- фициентов. Тогда верхней границей положительных кор- ней уравнения (1.5) служит число k 1 1+у-Г- (7.5) г а0 Доказательство этого утверждения аналогично при- веденному выше, и мы рекомендуем читателю провести его самостоятельно. Для отыскания нижней границы положительных кор- ней уравнения (1.5) заменим в нем х на 1/х. Получим но- вое уравнение Щ | Щ | I ап~1 I Х« X"-1 + •••“’" х +ап = = -^г(«о + ^1^+ ••• + ап_1Хп~' + апхп) = 0, корни которого обратны по величине корням исходного уравнения (всегда можно считать, что ап=£0, т. е. что ис- ходное уравнение не имеет корней х = 0). Если К — верхняя граница положительных корней уравнения a0 + ai* + .. . + a7i_iXn-1 + anxn = 0, (8.5) то число 1/К будет служить нижней границей положи- тельных корней уравнения (1.5). Необходимо только помнить, что указание границ для действительных корней многочлена не означает, что такие корни на самом деле имеются. Значения многочлена f(x) можно вычислить с по- мощью схемы Горнера. Разделив многочлен f (%) =аохп+^ -yaixn-1 + .. , + ап-\Х-т-ап на двучлен х — а, получаем f(x) = (х — а)ф(х) +г, где ф(х)—частное и r = f(a)—остаток, не зависящий от х. Полагая ф(х) =bQxn~x+ b\Xn~2 +.. . + &n_2x + &n-i и r=f(a) = bn, найдем aQxn + а{хп~х + ... + ап_}х + ап^ = (x-a)(&oxn_1 4- Ь[хп~2+ ... + 6п-2* + &п-1) + Ьп.
48 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I Раскрывая скобки в правой части тождества и срав- нивая коэффициенты при одинаковых степенях х в ле- вой и правой частях, получаем для отыскания коэффи- циентов &i, &2, •••» Ьп равенства = «о, bi = &0« + ab &2 = biCL + #2» ««•••• 6„= 6„_ia + an. Вычисления записывают с помощью схемы • | #0 #2 » » ♦ #/г a | 6о Ь[ • • • Ьп, Числа в нижней строке вычисляются последовательно слева направо так, что каждое число bk равно сумме коэффициента «&, стоящего над ним, и произведения пре- дыдущего коэффициента bk-i на а. Значение f(x) при х=а есть f(a) =bn- Пример 1.5. Рассмотрим алгебраическое уравнение х5+2х4 — 5х3 + 8х2 — 7 х — 3 = 0. Здесь «о=1, Л =8. Правая часть неравенства (6.5) равна 1 + у = 9, так что все корни этого уравнения по абсолютной величине не превосходят 9. Первым отрицательным коэффициентом уравнения является а2 = —5, так что k = 2, В = 7, поэтому, согласно оценке (7.5), верхняя граница положительных кор- ней равна 1 + ]/7/1 = 3,65. Для отыскания нижней гра- ницы корней составим уравнение (8.5). Получаем —Зх5— 7х4 + 8х3— 5х2+2х+1 =0. Так как требуется, чтобы старший коэффициент был по- ложителен, то следует изменить знак, и мы придем к уравнению Зх5+7х4 — 8х34-5х2— 2х— 1=0, где а0—3, k—2, В = 8. Поэтому верхняя граница положи- тельных корней нового уравнения равна 1 + 1^8/3 = 2,64,
§ 5] СЛУЧАЙ АЛГЕБРАИЧЕСКОГО УРАВНЕНИЯ 49 откуда следует, что нижняя граница положительных кор- ней первоначального уравнения равна -^-“О.Зв. Та- ким образом, положительные корни уравнения, если они существуют, удовлетворяют неравенствам 0,38<х<3,63. Для отыскания границ отрицательных корней следует в данном уравнении заменить х на —х. Получим —х5+2х* 4+5х3 + 8х2+7х — 3 = 0 или х5 — 2х4 — 5х3 — 8х2 — 7х 4-3 = 0. Здесь ао=1, 6=1 и В = 8, поэтому верхняя граница по- ложительных корней этого уравнения равна 9. Составив снова уравнение (8.5), получим Зх5— 7х4— 8х3 — 5х2 — 2x4-1=0, где «0=3, Л=1, В=8. Тогда верхняя граница положи- тельных корней 14-8/3=3,67, а нижняя граница положи- тельных корней уравнения, полученного переменой знака = 0,26. Итак, окончательно, отрицательные корни первоначального уравнения (если они существуют) на- ходятся в границах —9<х<—0,26. Найдем положительный корень уравнения. Непосред- ственно получаем /(0) =—3, /(!) =—4, /(2) =39, так что корень лежит в интервале [1, 2]1)- Для дробных значе- ний х можно воспользоваться схемой Горнера. Пусть х=1,4; тогда |1| 2 | -5 | 1,4 11 | 1 • 1,4 4-2 = 3,41 3,4- 1,4-5= - 0,241 J_______8________I______—7 | —3 | - 0,24 • 1,4 4- 8 = 7,66 | 7,66 • 1,4 - 7 = 3,72 13,72 • 1,4 - 3 = 2,21 ’ так что f(l,4) =2,21 >0. Аналогично для х=1,3 | 1 2 -5 8-7 -3 1,31 1 3,3 -0,71 7,08 2,20 -0,14’ откуда /(1,3)=—0,14. Таким образом, положительный ко- рень уравнения лежит в интервале [1,3; 1,4]. Дальнейшее 1) Предоставляем читателю проверить, что других п о лож и тел ных корней уравнение не имеет. 4 Р. С. Гутер, Б. В. Овчинский
50 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ (ГЛ. ( уточнение корня можно производить с помощью спосо- бов, рассмотренных ранее (например, хорд и касатель- ных или итераций). Рассмотрим теперь приближенное отыскание комплексных кор- ней алгебраического уравнения с действительными коэффициентами. Можно ограничиться рассмотрением уравнений, имеющих лишь комп- лексные корни, так как после отыскания всех действительных корней Xi, х2, ...» Xk мы можем уравнение (1.7) представить в виде /(х) = (х —Xi)(x — х2)...(х — Xh)fi(x), где многочлен fi(x) имеет только комплексные корни. Разделив дан- ный многочлен f(x) на произведение биномов, мы найдем fi(x). (Так как корни Xi, х2, ..., х^ находятся, вообще говоря, приближенно, то корни уравнения /Дх) = 0 будут несколько отличаться от корней ис- ходного уравнения; изучением погрешности, происходящей от при- ближенного деления, мы заниматься не будем.) Как хорошо известно, комплексные корни алгебраического урав- нения с действительными коэффициентами являются попарно сопря- женными. Произведение пар соответствующих линейных множителей приводит к квадратному трехчлену вида х2 4- рх 4- q с действитель- ными коэффициентами1). Поэтому для отыскания пары комплекс- ных сопряженных корней уравнения достаточно выделить множитель вида х2 -I- рх 4- q, корни которого могут быть потом легко найдены. Для выделения такого множителя можно воспользоваться схемой со- кращенного деления многочлена на квадратный трехчлен, аналогич- ной схеме Горнера. Ограничимся для простоты рассуждений уравнением четвертой степени. Тогда результат деления на квадратный трехчлен может быть записан в виде Дох4 4- flix3 4- а2х2 4- а3х 4- afl (х2 4- рх 4- q) (b0x2 4- biX 4- b2) + Ь3(х + р) 4- (9.5) причем остаток от деления, являющийся здесь многочленом первой степени, записан в специальной форме Ь3(х 4- р} 4- Ьь для удобства дальнейших вычислений. Раскрывая справа скобки и приравнивая коэффициенты при одинаковых степенях х, приходим к системе урав- нений а0 — ^о, «1 ^bop + bt, а2 = bQq 4- bip 4- b2, a3 = biq 4- b2p 4- b3t a4 = b2q 4- b3p 4- b4. ‘) Если комплексные корни равны а ± р/, то [х - (а 4- Р0] [х - (а - Р0] = х2 - 2ах 4- (а2 4- Р2), откуда р = —2а, q = а2 4- Р2.
§ 5] СЛУЧАЙ АЛГЕБРАИЧЕСКОГО УРАВНЕНИЯ 51 Отсюда находим ^0 ““ ^0, pbQ, ^2 = а2 — pb\ — рЬо, Ь3 = аз— рЬз — Qbit Ь4 = а^- pb3 - qb2. (10.5) Мы должны подобрать числа р и q так, чтобы деление соверша- лось без остатка, т. е. чтобы коэффициенты Ь3 и Ьь обращались в нуль. Покажем, не проводя детального доказательства, как следует выбирать поправки к принятым значениям р и q, чтобы уменьшить полученные значения Ь3 и Ьь. (Некоторые замечания по поводу вы- бора первоначальных значений р и q будут сделаны дальше.) Пусть новые значения коэффициентов будут р 4- Др и q 4- Д</. Подставим эти новые значения в два последних уравнения системы (10.5), не изменяя уже вычисленных коэффициентов Ьк в правых частях уравнений. Тогда а3-(р + Ьр) b2-(q + kq) Z>i = 53, а4 — (р + кр) b3 - (q + kq) b2 = 6t. Полагая новый остаток равным нулю, б3 — Ь4 = 0, и замечая, что аз — pb3 — qbi = &з, а4 — pb3 — qb2 = Ь4, находим систему уравнений для отыскания поправок Др, Др: b2 kp + bi kq = b3i j b3 Др 4- b2 kq = Z>4, J с помощью которых могут быть найдены новые значения pt = р+Др и pi = q 4- Др. Беря теперь значения pi и рь пересчитываем по формуле (10.5) значения коэффициентов Z>0, bit b2t b3 и Ь4 и снова из системы урав- нений (11.5) определяем поправки Др1 и Дрь Так следует поступать до тех пор, пока коэффициенты Ь3 и bi не станут пренебрежимо малы по сравнению с остальными. Остается указать способ выбора начальных значений р и р. Это можно сделать, основываясь на следующих соображениях. Если х по модулю невелико, то старшие степени пренебрежимо малы по сравнению с младшими степенями. Поэтому меньшие по модулю кор- ни уравнения могут приближаться корнями квадратного уравнения а2х2 4- а3х + а4 = 0, т. е. в качестве начальных значений можно брать Иногда бывает удобнее начинать не с меньших, а с наибольших по модулю корней, пара которых хорошо приближается парой кор- ней квадратного уравнения aQx2 + а^х 4- а2 = 0. (Здесь мы отбро- сили три последних члена уравнения.) При этом в качестве исходных 4*
52 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ (ГЛ Т значений р и q следует принять Разумеется, оба указанных способа быстро приведут к цели, если имеются корни, значительно отличающиеся друг от друга по абсо- лютной величине. Так как произведение всех корней должно рав- няться свободному члену уравнения (который всегда можно сделать равным единице), то в этом случае одна пара корней будет велика по абсолютной величине, а другая — мала. Вычислительные трудно- сти резко возрастают, если абсолютные величины обеих пар корней близки друг к другу *). Итак, с помощью описанной схемы левая часть уравнения разла- гается в произведение двух квадратных трехчленов, из которых на- ходятся корни уравнения. Обычно вычисления располагаются в виде схемы, показанной в табл. 1.5. Верхняя ее часть предназначена для отыскания коэффи- циентов, нижняя — для вычисления поправок. Таблица 1.5 а Р q b «о «2 -Ъар — biP -bBq bo — do bi=ai-bop b2 = a2~ bxp ~ b3p Лз -Ь2р ~btq b3 — a3~ b2p - bxq -ЬзР -b2q b — a4-b3p — b2q О II 1 * w ь2 Ьз . ^3^2 ~ ^1^4 - b\ ^2 b2b^ — Вычисление поправок производится до получения требуемой точ- ности. Пример 2.5. Решим уравнение х* — Зх3 + 20х1 2 4- 44х 4- 54 = 0. В качестве начальных значений р и q, как было предложено, 44 54 возьмем коэффициент квадратного трехчлена х2 4- х 4- , т. с. х2 4- 2,2х 4- 2,7. Вычисления приведены в табл. 2.5. Считая достаточной точность, достигнутую на пятом шаге, мы остановились на значениях р = 1,9413 и <7 = 1,9604. Шестой шаг 1) Для изучения этого вопроса мы отсылаем читателя к книге: Ланцош, Практические методы прикладного анализа, М., Физмат- гиз, 1961, гл. I.
§ 5] СЛУЧАЙ АЛГЕБРАИЧЕСКОГО УРАВНЕНИЯ 63 Таблица 2.5 I шаг р = 2,2 <7 = 2,7 1 -3 20 44 54 -2,2 11,44 -63,23 11,42 -2,7 14,04 -77,60 1 -5,2 28,74 -5,19 -12,18 -5,19 -12,18 799 28,74 -5,19 Др = -0,26 -5,2 28,74 bq = -0,47 II шаг Р1 = 1,91 <71 = 2,23 1 -3 20 44 54 -1,94 9,59 -53,08 -3,76 -2,23 11,02 -61,01 1 — 4,94 ’ 27,36 1,94 -10,77 1,94 -10,77 758 27,36 1,94 Api = 0,002 -4,94 27,36 bqt = -0,39 111 шаг р2= 1,94 <72= 1,84 1 -3 20 44 54 -1,94 9,58 -53,82 1,42 -1,84 9,09 -51,04 1 -4,94 27,74 -0,73 4,38 -0,73 4,38 768 27,74 -0,73 Др2 = 0,0018 -4,94 27,74 Д</2 = 0,1579
54 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ I Продолжение табл. 2.5 IV шаг р3 = 1,9418 q. = 1,9979 1 -3 20 44 54 -1,9418 9,5960 -53,5900 -0,5499 -1,9979 9,8732 -55,1382 1 -4,9418 27,5981 0,2832 -1,6881 0,2832 -1,6881 763,05 27,5981 0,2832 Дрз == 0,0007 -4,9418 27,5981 Дрз= —0,0612 V шаг р4 = 1,9411 44= 1,9367 1 -3 20 44 54 -1,9411 9,5912 -53,6801 0,2149 -1,9367 9,5694 -53,5585 1 -4,9411 27,6545 0,1107 0,6564 -0,1107 0,6564 764,22 27,6545 -0,1107 Др4 = 0,0002 -4,9411 27,6545 Д?4 = 0,0237 VI шаг р5 = 1,9413 45= 1,9604 1 -3 20 44 54 -1,9413 9,5925 -53,6422 -0,0868 -1,9604 9,6869 -54,1900 1 -4,9413 27,6321 0,0447 -0,2568
§ 5] СЛУЧАЙ АЛГЕБРАИЧЕСКОГО УРАВНЕНИЯ 55 Таблица 3.5 о Ci 1 Ci 5? | Cl «X сч о 1 1 Ci о — сч 1 О <5 «G 1 II II И II СО Ci Ci Ci Ci о Ст 1 1 о — сч Ci Ci Cl CL Ci. 1 1 1 о о — сч «G I I 1 Ci. Ci. 1 1 сч со »е> •О «О I | «О I I 1 1 О <N 1 1 со •* Q Q Q а а II II II II II о сч со * *С> «О •сь «С> СО Ci со «С О Сг <3* 1 Q о — сч сч Ст •G | »е> >с> | | — сч Ci С) Ci II Cj* <1 «сГ % а сх 1 Q СЧ СО •G «О >СЬ «О <N СО «S’ Ci Ci со 1 1 1 1 «О II О. <1 о? Ci С о сч Q Q Q со «г «о «а II
56 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ I проделан для проверки величины остатка и отыскания коэффициен- тов частного. Считая остаток пренебрежимо малым, находим, что ле- вая часть данного уравнения распадается на два квадратных трехчлена (х2 + 1,941 Зх + 1,9604) (х2 —4,941 Зх 4- 27,6321) = 0. Из последнего уравнения легко получаем четыре комплексных корня хь 2 = —0,9706 ± 1,00917; х3,4 = 2,4706 ± 4,6398г. Для проверки вычислим сумму и произведение всех корней. Как известно, сумма всех корней уравнения четвертой степени равна <4 , а4 ------, а произведение 4—т. е. в нашем примере сумма должна ^0----«0 равняться 3, а произведение 54. Подсчеты дают 4 4 2 х. = 3,00 и JJ = 54,17, i = 1 । = 1 т. е. точность вполне удовлетворительная. Описанный способ отыскания поправок обладает не только ма- лой скоростью сходимости (потребовалось пять шагов для получения остатков, меньших единицы), но также и малой устойчивостью и мо- жет оказаться расходящимся. Более удобным и устойчивым является отыскание поправок Др и \q из системы ^Др + г.Д^йз, | с3 Др 4- с2 kq == Ъь ) где коэффициенты clf с2, с3 получаются аналогично коэффициентам b по формулам Со — &0» ] С' = Ь'-РС°' ( (13.5) с2 — Ь2 — рс\ — qcc, । Сз ~ ~РС2~ Яс\- J Не останавливаясь на выводе формул (12.5), укажем, что вы- числения по этому способу удобно проводить по схеме, аналогичной только что описанной, как это показано в табл. 3.5. § 6. Решение системы линейных уравнений по способу Гаусса Способ Гаусса является одним из наиболее распро- страненных способов решения систем линейных уравне- ний. Если точно выполнить все требуемые в нем действия, то мы получим точное решение системы. В этом смысле способ Гаусса называют точным. Практически,
РЕШЕНИЕ СИСТЕМЫ ПО СПОСОБУ ГАУССА 57 § 6] впрочем, поскольку арифметические действия приходится выполнять с округлением, точного решения получить не удается. В основе способа Гаусса лежит идея последователь- ного исключения неизвестных. Вычислительные схемы, в виде которых может быть реализован этот способ, раз- личны. Мы рассмотрим одну из них — схему единствен- ного деления. Для удобства изложения ограничимся рассмотрением системы четвертого порядка. Те же приемы пригодны и в любом другом случае. Запишем рассматриваемую си- стему линейных уравнений в таком виде: 0цХ] + 012*2 + 0J3*3 + + Д15 = °, 021*1 022*2 Т* 023*3 “Ь 024*^4 Т” 025 =: 6, 03i*i + 032*2 + 03з*з 4- 034*4 4- 035 = О, 0Ц*1 4- 042*2 + 043X3 4" 044*4 + ^45 = °, (1.6) где все члены перенесены в одну часть равенства. При- мем, что 0ц=#О, либо, в противном случае, переставим уравнения так, чтобы это условие выполнялось. Находя Xi из первого уравнения, получим *1 — ОС12*2“Ь °C 13*3"1~ а14*4 “Ь «15, (2.6) где ан=_£11 (i = 2, 3,4,5). Теперь можно исключить из оставшихся уравнений хг, для этого достаточно подставить значение Х\ из (2.6) во второе, третье и четвертое уравнения системы. Тогда придем к системе трех уравнений, не содержащих Х\: ^22 *2 ^23*3 + 024 *4 + #25 “ а32Х2 + а<33Х3 + Л34 *4 4~ 035 = О, ^42^2 + ^43*3 + ^44^4 + ^45 “ (3.6) Из способа получения этой системы видно, что #22 = #22 "1” #21^12
58 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИИ И СИСТЕМ [ГЛ. I и, вообще, = + (/ = 2, 3, 4; k = 2, 3, 4, 5). Систему (3.6) можно подвергнуть тому же преобра- зованию, что и первоначальную. Как и ранее, можно предположить, что 0, либо переставить уравнения (или неизвестные)1). Находя теперь х2 из первого урав- нения системы (3.6), получим х2 = О^З-^З + ^24^4 + 0/25, (4.6) где положено а(,) ^21= (/ = 3,4,5). а22 Подставляя выражение (4.6) для Х2 во второе и третье уравнения системы (3.6), получим систему аВ)%3 + а34Х4 + а35 = О» «8«,+<«*.+«?-в. (ЗД коэффициенты которой находятся по формулам «^ = «^ + «^ О’ = 3, 4; Аг = 3, 4, 5). Наконец, из системы (5.6) легко тем же путем пе- рейти к уравнению с одним неизвестным. Сначала при- ходим к уравнению *з = а34*4 + аз5, (6.6) с коэффициентами а(2) «з/ — (2у О* ~ 4, 5). «33 Затем, подставляя найденное значение во второе урав- нение (5.6), получаем «£Ч + «45 = °> !) Если такая перестановка на каком-либо шаге окажется не- возможной, то это будет означать, что после какого-то исключения неизвестных все коэффициенты одного или нескольких уравнений обращаются в нуль, т. е. эти уравнения являются комбинациями предыдущих. Как известно, в этом случае первоначальная система уравнений оказывается несовместной или неопределенной. К таким системам способ Гаусса неприменим.
РЕШЕНИЕ СИСТЕМЫ ПО СПОСОБУ ГАУССА 59 §6] где + a43«3fe (fe = 4> 5)- Последнее уравнение можно переписать в виде Х4 = а45, (7.6) ПОЛОЖИВ “45 а<34> * Итак, мы получили четыре уравнения (2.6), (4.6), (6.6) и (7.6), которые можно объединить в систему: х{ = а12х2 + а1зхз + а1Л + а15> х2 = а23х3 + а24х4 + а25, А'з = U34X4 + а35, х4= а4? (8.6) Из этих уравнений последовательно находим значения всех четырех неизвестных. 2 Таким образом, процесс отыскания значений неизве- стных распадается на две части. Первая состоит в при- ведении системы к треугольному виду (8.6). Ее принято называть прямым ходом. Определение неизве- стных по полученным формулам^ (8.6) составляет вто- рую часть, которую называют обратным ходом. Причина такого названия в том очевидном факте, что известные значения подставляются последовательно из нижних уравнений в верхние, начиная с четвертого. Разберем теперь схему записи вычислений при их практическом выполнении. Прямой ход в свою очередь делится на несколько этапов, которые мы условно обо- значим через Ль Л2, Л3, Л4; обратный ход обозначим че- рез В. На первом этапе, Ль в таблицу записывают коэффи- циенты при неизвестных и свободные члены заданной системы уравнений (табл. 1.6). Затем к этим числам присоединяют строку коэффициентов ai/г уравнения (2.6). Числа в этой строке получаются делением всех элемен- тов первой строки на ее крайний левый элемент, взятый с противоположным знаком.
60 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ Т Таблица 1.6 X} х2 Хз Свободные члены V А1 «11 «21 «31 «41 «12 «22 «32 «42 «13 ’«23 «33 «43 «14 «24 «34 «44 «15 «25 «35 «45 С2 Сз -1 «12 «13 «14 «15 0! ^2 «22 J1) «32 JD «42 «23 «33 4’ «24 JD «25 JD «35 „(1) «45 с(1) с2 с3 г(1) «4 -1 «23 «24 «25 02 Аз „(2) а33 «43 Д2) «34 J2) «44 «35 „(2) «45 е(2) с3 J2) c^ -1 «34 «35 0з а4 «44 „в) а45 с(3) «4 -1 «45 04 в Х1 х2 Хз *4 1 XI Х2 Хз *4 1
§ 6] РЕШЕНИЕ СИСТЕМЫ ПО СПОСОБУ ГАУССА 61 На втором этапе вычисляются коэффициенты си- стемы (3.6): к каждому элементу матрицы этапа (кроме первой и последней строк) прибавляется произ- ведение крайнего левого элемента той же строки на крайний нижний элемент того же столбца. После этого вычисляют коэффициенты путем деления всех эле- ментов первой вновь полученной строки на ее крайний левый элемент, взятый с противоположным знаком. Этим завершаются вычисления этапа А2. Аналогично выпол- няются и вычисления этапов Л3 и А4. На этапе Л4 находят неизвестное х4 и на этом этапе завершают прямой ход вычислений. Затем на этапе В вычисляют значения остальных неизвестных и заносят их в первую строку этапа В. На пересечении этой строки со столбцом свободных членов ставится единица. Неизвестное х4 получают умножением этой единицы на число а45, стоящее над ней, и записывают на пересе- чении первой строки этапа В и столбца х4. После этого значение х3 можно получить, составляя сумму попарных произведений уже найденных чисел строки х и соответ- ствующей части последней строки этапа А3: х3 = х4 • &34 + 1 • а35- Так же вычисляют далее и х2 и Xj. Вообще, можно вос- пользоваться следующим правилом: каждое неизве- стное xk равно скалярному произведению уже вычислен- ной части строки неизвестных на соответствующую часть нижней строки схемы Ak. Для способа Гаусса можно получить простые конт- рольные соотношения, которые могут быть использованы для контроля вычислений. Рассмотрим новую линейную систему с той же матри- цей коэффициентов, что и в системе (1.6), и со свобод- ными членами, равными суммам всех элементов строки ci + аг2 + ^гз + ^м + Лг5 (1— 1, 2, 3, 4). Пусть числа Xi, х2, х3, х4 образуют решение системы (1.6). Легко проверить, что системе со свободными членами с^ удовлетворяют числа Xi— 1, х2— 1, х3— 1, х4— 1.
62 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I Действительно, подставим эти значения в левую часть первого уравнения ^llXj + Л 12'^2 + Я13X3 “Ь #14*4 +Й =0. Тогда получим «и(Х1 — 1)+^12(^'2— 1)+Я1з(*3— 1)+ Ян(-Г4— 1)+ С\=» = (<2цХ1+<2^X2+ ^13X3 +tZi4X4)— (^11+^12 + ^13 + ^14) + £1== = («11X1 + (212X2 + Я13Х3 + #14X4 + Я15) — — (^11+^12 + ^13 + ^14 + ^15) + <+ Здесь мы прибавили П15 в первой и второй скобках, что не изменит результата. Но теперь ясно, что первая скоб- ка равна нулю в силу уравнений (1.6), а вторая равная, так что вся сумма обращается в нуль. Произведя анало- гичную проверку для каждого из уравнений, убеждаемся в справедливости высказанного выше утверждения. Присоединим теперь к нашим вычислениям еще один столбец, элементы которого равны суммам элементов соответствующих строк. Выполняя с этим столбцом те же вычисления, что и с предыдущими, мы решаем одно- временно две системы уравнений со свободными чле- нами <2?-5 и Ci. Тем самым мы получаем возможность про- верить окончательный результат, так как решения вто- рой системы должны быть на единицу меньше решений первой. Кроме того, мы имеем возможность контролиро- вать и промежуточные вычисления, поскольку в процессе всех вычислений сумма элементов строки (кроме послед- него) должна быть всегда равна последнему элементу. Общая схема расположения вычислений при реше- нии системы линейных уравнений по способу Гаусса по- казана в табл. 1.6. Пример 1.6. Решим по способу Гаусса систему уравнений 7,24xi + 0,93х2 - 4,65х3 + 1,29х4 + 0,13 = 0, — 2,61 Xj + 3,1 2х2 + 4,97х3 - 0,78х4 +1,56 = 0, 3,18xi + 0,84х2 + 2,88х3 +4,13 = 0, 0,92xi + 1,38х2 - 2,54х4 - 3,69 = 0.
§6] РЕШЕНИЕ СИСТЕМЫ ПО СПОСОБУ ГАУССА 63 Вычисления будем проводить с двумя запасными зна- ками, т. е. с пятью значащими цифрами, по схеме, опи- санной выше. Вычисление приведены в табл. 2.6. Таблица 2.6 *1 Х2 Хз Xi Свободные члены X 1 7,24 —2,61 3,18 0,92 0,93 3,12 0,84 1,38 -4,65 4,97 -2,88 0 1,29 -0,78 0 -2,54 0,13 1,56 4,13 -3,69 4,94 1 6,26 5,27 -3,93 -1 — 0,1284 0,6423 -0,1782 -0,0180 -0,6823 3,4551 0,4317 1,2619 3,2936 -0,8375 0,5909 -0,3149 -0,5667 -2,7039 1,6070 4,0728 -3,7066 8,0408 3,1003 -4,5577 -1 -0,9532 0,0911 -0,4651 -2,3272 -1,2490 -0,6120 -0,5274 -2,5889 3,8720 -4,2935 2,0956 -7,4944 -1 -0,4223 3,1001 1,6778 -2,3304 -6,1908 -8,5212 -1 — 2,6565 -3,6565 3,7746 — 4,7314 4,2219 ’ -2,6565 1 2,7746 —5,7314 3,2219 -3,6565 1
64 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I § 7. Применение способа Гаусса для вычисления определителя и нахождения обратной матрицы Пусть требуется вычислить определитель £> = «п а12 ... аХп «21 «22 • • • «2п ^п\ &n2 • • • Щгп причем «и =#0. Вынесем из первой строки за знак опре- делителя элемент «и, который назовем ведущим элемен- том, разделив на него все элементы этой строки. Вводя обозначение а1; = — (/ = 2, 3, м), запишем определитель в виде D — «п 1 «12 «1з «1п «21 «22 «23 • • • «2п «п! «п2 «пз • • • «пп Вычитая первую строку, умноженную на надлежащие множители, из следующих строк, можно сделать нулями все элементы первого столбца (кроме первого), не изме- няя величины определителя. Для этого надо вычитать из второй строки первую, умноженную на «2ь из третьей — первую, умноженную на «зь ... из п-й— первую, умно- женную на апХ. Получившиеся элементы, которые мы обозначим «(zy, будут равны ^22 а22 ““ ^21а12» а23 = а23 “ ^21а13» а2п а2п а21а!п’ ^32 ~ а32 ^31а12’
§ 7} ПРИМЕНЕНИЕ СПОСОБА ГАУССА 65 Вообще, </) = a.7-ailai/> О?) а определитель примет вид 1 «12 • • . «1п D==fln 0 аО) .. ЛО) • и2п = ац и22 0 •• . «<» пп ип2 a(D и2п пп причем оставшийся определитель, полученный из пре- дыдущего разложением по элементам первого столбца, будет уже порядка п—1. С этим последним проделаем ту же операцию, что и с исходным, приняв за ведущий элемент, т. е. вынося за знак определителя множителем который также следует предполагать отличным от нуля. Тогда 1 «23 • • • a2n /у(1) п(1) а(1) ап2 ипЗ • • • ипп где jn 02/ = “ПГ (/ = 3, 4, п). а22 Умножая первую строку последовательно на элемен- ты первого столбца а$, и вычитая получаю- щиеся строки соответственно из второй, третьей, ... строк определителя, а затем снова разложив по элемен- там первого столбца, получим В ДЦЛ22 1 «23 * * * а2/г V . и3п апа22 О а<2> а(2) V ипЗ • • • ипп а(2} изз а(2} ипЗ а™ Зп а%> пп причем, как и раньше, а(2)= д(1) ,.(1)а Uij Uij UZ2U2/ 5 Р. С. Гутер, Б. В. Овчинский
68 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I. и оставшийся определитель будет уже (п — 2)-го по- рядка. Продолжая такие преобразования, придем к формуле так что определитель равен произведению ведущих эле- ментов схемы Гаусса. Все ведущие элементы должны быть отличны от нуля, так как в противном случае деление на них невозможно. Этого всегда можно добиться путем перестановки строк или столбцов, что возможно на любом шаге1). Нужно только соблюдать правило знаков. Вычислительная схема для отыскания определителя такая же, как и для Таблица 1.7 1 2,8 | 2,1 -1,3 0,3 3,9 -1,4 4,5 -7,7 1,3 -3,3 0,6 2,1 -5,8- 2,4 -0,7 3,5 —6,5 3,2 -7,9 -7,7 1 .0,7500 -0,4643 0,1071 1,3928 15,5500 | ' -8,3500 1,4499 -1,3501 1,6500 -5,5214 2,3357 -1,5357 -9,1250 4,8250 -8,2748 -12,5748 1 -1,5045 0,2612 —0,2433 | - 3.0390 |. 1.9047 — 1,1343 -8,9036 -5,8913 -14,7949 1 — 0,6268 0,3732 | -11,4721 | -11,4721 !) Если такая перестановка оказывается невозможной, то даль- нейшие вычисления не требуются: определитель в этом случае равен нулю (см. примечание на стр. 58).
1Л ПРИМЕНЕНИЕ СПОСОБ^ ГАУССА 67 решения системы линейных уравнений, толы^$ез столб- ца свободных членов. Контрольные соотношения также остаются прежними, Пример 1.7. Вычислим по способу Гаусса опреде- литель 2,8 2,1 -1,3 0,3 -1,4 4,5 — 7,7 1,3 0,6 2,1 -5,8 2,4 ' 3,5 -6,5 3,2 -7,9 Вычисления приведены в табл. 1.7 На каждом этапе приводится соответствующая матрица, а затем строка, получающаяся делением первой строки матрицы на ее ведущий элемент. Переход к матрице следующего этапа происходит по формулам (1.7). ©пределитель равен про- изведению ведущих элементов, которые в таблице взяты в рамку. Как показывают вычисления, £> = 541,8. Рассмотрим теперь применение схемы Гаусса к вы- числению обратной матрицы. Пусть дана квадратная матрица #11 #12 ••• #1п #21 #22 • • • #2п Л = ................. . (3.7) аП а12 • • • а1п ®nl ®п2 •• • Обратной к матрице А называют такую матрицу Л-1, для которой ЛЛ-1 = Е, где Е — единичная матрица О О О 1 £ = 0 О 0 ... 1 Квадратную матрицу, определитель которой отличен от нуля, называют невырожденной или неособенной. Если матрица А является невырожденной, то обратная ей матрица Л"1 всегда существует. Для отысканйя Л-1 обо- значим ее элементы буквами х с соответствующими 5*
68 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. L индексами Хц *12 • . . Х[П д-1 = *21 *22 • « • *2rt *Л1 * л 2 • • • *лл (4.7) Пользуясь равенством АА~Х=Е и определением про- изведения матриц, мы можем написать систему линей-' ных уравнений для неизвестных элементов обратной матрицы. Так как матрица имеет п2 элементов, то у нас есть п2 неизвестных и мы получим систему из п2 уравне- ний, которую можно решить методом Гаусса. Для получения первого столбца матрицы-произведе- ния надо взять скалярное произведение первой, вто- рой, ... строк матрицы Дна первый столбец матрицы Д~1. В результате должен получиться первый столбец матри- цы £, т. е. в качестве первого элемента — единица, а все остальные элементы — нули. Таким образом, получается система п уравнений: #п*н + #12*21 4- #13*3i + ... 4-#1п*П1 = 1, #21 *11 4“ #22*21 + #23*31 + . . . + #2л*л! = О, #з1*и 4“ #32*21 4- #зз*31 4- ... 4- #3я*п1 = О, #/11*11 4- #rt2*21 4- #/13*31 + . . . 4- #пп*п! = 0. . (5.7) Матрицей коэффициентов в системе (5.7) служит за- данная матрица Д, неизвестными являются элементы первого столбца искомой матрицы Д"1. Единицу в пер- вом уравнении системы (5.7) можно перенести влево и тогда система будет иметь вид (1.6). Отыскание второго столбца матрицы Е—АА'Х приве- дет к новой системе уравнений, аналогичной системе (5.7), неизвестными в которой будут элементы *12, *22, •••, *п2 второго столбца матрицы Д“1. Правые части (или свободные члены после переноса единицы влево) этой системы будут иными: единица переместится во второе уравнение. Но матрица коэффициентов оста- нется прежней; ею будет служить первоначально заданная матрица Д.
§ 7j ПРИМЕНЕНИЕ СПОСОБА ГАУССА 69 Итак, система из п2 уравнений с п2 неизвестными для отыскания элементов обратной матрицы распадается на п групп уравнений с п неизвестными в каждой. Все они имеют ту же матрицу коэффициентов, отличаясь лишь свободными членами. Поскольку при решении си- стемы по способу Гаусса основные вычисления прихо- дится проводить над матрицей коэффициентов, то реше- ние этих п систем можно объединить в одной схеме, рас- сматривая одновременно п столбцов свободных членов. Решив все системы, найдем все элементы xik обратной матрицы Л-1. Схема расположения вычислений для слу- чая матрицы четвертого порядка приведена в табл. 2.7. Таблица 2.7 «11 «12 «13 «14 -1 0 0 0 «21 «22 «23 «24 0 -1 0 0 «31 «32 «33 «34 0 0 -1 0 «41 «42 «43 «44 0 0 0 -1 -1 «12—. <*13 «14 «15 0 0 0 4 «(1) «24 «25? I п(1) «25, II 0 0 4 J1) «34 «35? I 0 fl(D «35,111 0 л»> «42 JD «43 «44 „(1) «45, I 0 0 я(1) «45, IV -1 а23 «24 а25, I а25, II 0 0 J2) «33 „(2) «34 J2) «35, I „(2) «35, II J2) «35, III 0 J2) «43 «(2) «44 „(2) «45, I д(2) «45, II 0 „(2) «45, IV -1 а34 а35, 1 а35, II а35, III 0 «(3) «44 „(3) «45, I J3) «45, II д(3) «45, III „(3) «45, IV -1 а45, I а45, II а45, III а45, IV Хц *21 *31 *41 1 *12 *22 *32 *42 1 Xl3 *23 *33 *43 1 1 ХЦ *24 *34 *41
Таблица 3.7 S 1,37 2,81 4,74 -1,12 -1 0 0 0 6,80 2,53 4,15 2,19 3,54 0 -1 0 0 11,41 — 4,36 -1,87 -0,21 3,39 0 0 -1 0 ^-4,05 2,54 3,76 3,71 -9,98 0 0 0 -1 -0,97 -1 -2,0511 -3,4598 0,8175 0,7299 0 0 0 — 4,9635 -1,0393 -6,5633 5,6083 1,8466 -1 0 0 — 1,1477 7,0728 14,8747 -0,1743 -3,1824 0 -1 0 17.5908 -1,4498 -5,0779 -7,9035 1,8539 0 0 -1 13,5773 -1 -6,3151 5,3962 1,7768 -0,9622 0 0 — 1,1043 — 29,7907 37,9919 9,3845 -6,8054 -1 0 9,7803 4,0777 -15,7269 -0,7221 1,3950 0 -1 -11,9763 -1 1,2753 0,3150 -0,2284 -0,0336 0 0,3283 -10,52^6 0,5624 0,4636 -0,1370 -1 -10,6376 — 1 0,0534 0,0440 -0,0130 0,0950 -1,0106 0,1750 -0,3544 0,3831 0,0534 1 -0,1131 0,3633 -0,1723 0,0440 1 -0,3434 0,2469 -0,0502 -0,0130 1 -0,1769 0,2528 -0,1212 -0,0950 1 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ.
} 3] ИТЕРАЦИИ ДЛЯ ЛИНЕЙНЫХ СИСТЕМ 71 Пример 2.7. Найдем матрицу, обратную для матри- цы четвертого порядка 1,37 2,81 4,74 1,12 2,53 4,15 2,19 3,54 —4,36 —1,87 —0,21 3,39 2,54 3,76 3,71 —9,98 Вычисления приведены в табл. 3.7 и пояснений не требуют. Последний столбец таблицы содержит суммы элементов строки и служит для контроля вычислений. Обратная матрица имеет вид 0,1750 —0,1131 —0,3434 —0,1769 —0,3544 0,3633 0,2469 0,2528 0,3831 —0,1723 —0,0502 —0,1212 ' 0,0534 0,0440 —0,0130 —0,0950 § 8. Итерации для линейных систем Способ итераций дает возможность получить после- довательность приближенных значений, сходящихся к точному решению системы, подобно тому как это было сделано для одного уравнения в § 4. Для определенности ограничимся снова системой уравнений четвертого порядка, которую запишем в виде (1.6). Разрешим первое из уравнений системы относи- тельно Xi, второе — относительно х2 и т. д. Тогда систему ,(1.6) можно будет переписать в виде Х]= а12х2 +ai3x3 + ai4x4-|-at5 Х2 = а21Х( +0^X3 + 024X4 + 025, Х3 = а31Х1 + О32Х2 + 034X4 + 035, х4 = а41Х1 + О42х2 + а43х3 + 045, . где а« = —(/=1, 2, 3, 4; й=1, 2, 3, 4, 5). (2.8)
72 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I Система (1.8) является частным случаем записи вида Х| = Li (хь х2, х3, х4) Х2 = L2 (Х|, х2, х3, х4) x3 = L3(*b х2, Х3, Х4) х4 = L4(xt, х2, х3, х4) (3.8) При этом, например, линейная функция Ц (хь х2, х4) фактически не зависит от хь Однако наши рассуждения не изменятся, если она будет содержать еще и слагае- мое вида ацХ1. То же относится и к правым частям остальных уравнений. Зададим какие-либо начальные значения неизвестных х^, х<°>, х^\ х(40). Подставляя эти значения в правые ча- сти системы (3.8), получим первые приближения; x^L.fx™ х® х<°>, 4»), 1 1\1 & о */ х<!> = £4(х<0>, х^\ х^\ х^у Полученные первые приближения могут быть таким же образом использованы для получения вторых, третьих и т. д., так что для любого v можно получить v-e при- ближение X(jV), х{£\ х^\ x(4v). Установим условия, выполнение которых обеспечит сходимость получающихся приближений к истинному решению системы хь х2, х3, х4. Последнее предполагается существующим, для чего, как известно, достаточно, что* бы определитель системы был отличен от нуля. Обозначим через ошибку v-ro приближения для fe-го неизвестного где Хь — точное значение неизвестного в решении си- стемы. Так как хл удовлетворяет системе (1.8), то из со- ответствующего уравнения системы находим — ад 1X1 -f- а/{2*2 + оса 3X3 + а/нА + оса 5.
§ 8] ИТЕРАЦИИ ДЛЯ ЛИНЕЙНЫХ СИСТЕМ 73 С другой стороны, по определению (v + l)-ro прибли- жения, X^,v+I) = a£iXiV) + ®k2X2} + a£3X3V) + Xfe4A'4V) + a^5* Вычитая первое уравнение из второго, находим 4V+° = (4-8) Оценим абсолютную величину ошибки e£v+l). Из (4.8) вытекает, что К”"|<ы-И’1+ +|»«Н»П <6-8> Неравенства типа (5.8) можно, очевидно, написать для всех 6=1, 2, 3, 4. Представим себе, что все эти неравен- ства выписаны, сложим их почленно и сгруппируем члены в первой части равенства по столбцам. Мы по- лучим le^^l + le^+oi + ieCv+Di + i^v+Di^ <(|ail| + |a21| + |a31| + |a41|)eiV) + + (|«14| + |a24| + |a34| + |«44|)e4V)' W Сравнивая между собой значения множителей при e^v) в правой части неравенства (6.8), найдехМ такое чис- ло С, чтобы при любом £=1, 2, 3, 4 выполнялось нера- венство I i 4- I U2k | + I <%3k I + I ot4k | <c. После этого неравенство (6.8) можно переписать в виде I 81V+1) | + I 4V+1) | + | 63V+1) | + | 64V+1) | < <C(|e<v)| + |8^| + |eW| + |80’>|). Если положить | | + ... + | e* | = cfv, то последнее не- равенство можно переписать так: ®v+l Cov (7.8)!.
74 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИИ И СИСТЕМ. [ГЛ. I Неравенство (7.8) справедливо для всех v=0, 1, 2,.,. Поэтому можно написать О'! <Соо, С о 1 ^С2<Уо, Оз Со2 С3о0, С о0, Если С<1, то limCv = 0, а значит, и limov=0. Но все V->oo V->oo слагаемые, входящие в ov, положительны. Поэтому для любого k справедливо неравенство |efcV)|<°v Отсюда вытекает, что при любом k lim e<v) = 0 и lim х^> = х.. к к к V->oo V->oo Таким образом, выполнение условия С<1 достаточно для того, чтобы наш итерационный процесс сходился к точному решению системы. Заметим, что С есть верхняя грань сумм коэффи- циентов системы (1.8) по столбцам. В свою очередь ко-» эффициенты системы (1.8) являются отношениями эле- ментов матрицы коэффициентов исходной системы (1.6)’ к диагональным элементам. Следовательно, условие С<1 означает, что все коэффициенты системы должны быть малы по сравнению с диагональными. Это условие можно сформулировать и более точно: для сходимости процесса итераций достаточно, чтобы в каждом столбце сумма отношений коэффициентов си* стемы к диагональным элементам, взятым из той же строки, была строго меньше единицы. Проведенные рассуждения можно использовать для оценки погрешности очередного приближения. Обозна- чим разность между двумя последовательными значе- ниями &-го неизвестного через A(V)_v(V+l) (V) 0/f Xk Xfc •
ИТЕРАЦИИ ДЛЯ ЛИНЕЙНЫХ СИСТЕМ. 75 § 8] Прибавляя и вычитая в правой части точное значение не- известного Xk, найдем 8?' - (хГ " - а) - (х1“ - х.) - еГ11 - Из последнего равенства выводим m>Ki-i'r,,|. (в-») Полагая в неравенстве (8.8) k—1, 2, 3, 4 и складывая затем все полученные неравенства, находим |б',”|+ ... +И’|>(1е!”’|+ ... +1Л)~ - (|в|’+'1| + ... +И'"|), или Av ^v-M’ где Av = 16iv) | + ... + | d4V) I- В силу (7.8) в последнем неравенстве можно заме- нить (jv+i через Cov, от чего оно лишь усилится. Но тогда Av ><rv(l — с)> откуда Av Как мы уже замечали, из определения av следует, что I efcV) | < для любых k. Поэтому <э'8> Неравенство (9.8) и дает оценку погрешности v-й ите* рации через разность двух последовательных итераций. Для построения вычислительной схемы заметим, что удобнее находить не непосредственно значения неизвест- ных, а поправки к предыдущим значениям. Прежде все- го за нулевые приближения значений неизвестных в си- стеме (1.8) можно принять свободные члены соответ- ствующих уравнений, т. е. x(o) = ^5 (fe=l, 2, 3, 4). (10.8) Вычислим первые поправки. Пусть S(|0) = — х(10> и вообще 6® = (£=1,2,3, 4). (11.8)
76 i ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I * При этом значения можно считать заданными ра- венствами (10.8), а первые приближения х^> находятся по формулам 4” = а12х<°) + а13х<°> + аих(°> + а15, 4'’ = а214^ -Ь а2з4°' а24Х4» + а25> 4° = «314°‘ + а32Х20) + “зХ0’ + «35- ' Х4} = а4140) + a42X20> + «4з40) + «45* Вычитая из написанных равенств соответствующие ра- венства (10.8), находим «(0) (0) . (0) , (0) 61 = О12Х2 + СС13ЛГЗ + 014X4 , 6^ = «21Х10) + «23Хз0) + О24Х40), (12 8) + +ад?', : (0) . (0) . (0) 64 = СС41Х| +042X2 + О43Х3 . I Равенства (11.8) можно переписать в виде 1 xl’^x^ + fi^ (*=1,2, 3,4), где dl0) уже определены равенствами (12.8). Таким же путем можно получить и поправки для следующих ' шагов. Действительно, по определению A(v)_ V(v+1)_ (V) \ 01 =Х1 —Xi , * откуда | Вместе с тем, 7 x<v+» = a12x<v> + a13x<v> + al4x^ + aI5, x<v) = a12x(v-D + a13x(3v-1) + a14x<v-‘» + a15. Вычитая второе уравнение из первого, находим = а12бГ“!) + ai3dSv-° + а14бГ(13.8) j Аналогичные 1}юрмулы получаются и для остальных трех 1 неизвестных. i
§ 8] ИТЕРАЦИИ ДЛЯ ЛИНЕЙНЫХ СИСТЕМ 77 Итак, мы получили формулы, позволяющие вычис- лять последующие поправки через предыдущие. Для определения искомых значений неизвестных можно те- перь воспользоваться тождеством X^ + xf _|_ (д-( 1) — д;(0)) _|_ (д'СЗ) _ ... +(х</)- которое можно записать в виде ал = *1 + 01 + 01 + ... +01 +Н1 —Xi ;• Так как при С<1 последовательность сходится к Xi, то разность — x(,v) стремится к нулю. Следовательно, можно написать А1 = Х1 + 01 +01 + 01 + ... +01 + ... и аналогично для других неизвестных. Вообще, xk = х(^ + 6^0) + + ... + + ... (14.8) (fc = 1, 2, 3, 4). Формулы (14.8) являются исходными для построения вычислительной схемы, которая приведена в таблице 1.8. Часть А схемы содержит коэффициенты и свободные члены исходной системы (1.6), часть В — коэффициенты системы (1.8), подготовленной для итерации. Для полу- чения строк части В строки части А делят каждую на свой диагональный элемент, взятый с противоположным знаком. Числа —1 на диагонали в дальнейших вычисле- ниях не участвуют и на их месте ставят прочерк. Часть X таблицы содержит последовательные значе- ния поправок и неизвестных. Строка нулевого прибли- жения образуется переписыванием столбца свобод- ных членов, т. е. последнего столбца части В. Элементы строки d<°) получаются как скалярные произведения строки х<°) и строк части В, причем прочерк восприни- мается как нуль. Запись х^-I означает Х(0) . (/) = ХЮ) . 0 + %(0) . а + U0) . а _]_ %(0) . а ' * I 14 О 1О 1 г Строка хО образуется сложением двух предыдущих строк х(°) и д<°>.
78 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИИ И СИСТЕМ [ГЛ. I Таблица 1.8 1П in in m г. сч со -ч* о <з с с сЛ 1П Ш Ш — С», СО * 8 8 8 8 « и * СЧ СО 5 <3 <3 <3 <3 ~ СЧ СО I 8 8 8 1 (ОГ > > о о * ~ II II О 3^ '<о «о 6(1) • IV 43> 2 сч ” 5 <3 <3 <3 <3 СО СО со «-> СЧ I -ч< 8 8 » 8 Seo Ц Ь—< •—< S S ц СО ю СО II 4 II 4 Seo С-со Ю Ю ^Х (ег Ш'(1)9 сч сч сч сч •— СЧ со я* Q Q Q Q сч сч сч ~ 1 и в 1 в е S СЧ * й)х П ’(О)? = (1)9 (1)х П-(о)х = (о)9 б(1) • II X® • • • 1ЕО IZD 1*ю 1ЕЮ 12» S^ s^ сч — II II kQ4 'Ю б(1) . I X® « I II III IV <s o' з S 3 s ss oq 'ю Ю Ц ю ю
§ 8] ИТЕРАЦИИ ДЛЯ ЛИНЕЙНЫХ СИСТЕМ 79 Таблица 2.8 4 0,09 0,04 0,02 0,24 3 -0,08 0,06 -0,08 -0,15 4 0,04 0,16 -0,12 0,06 -10 8 9 20 1 -0,0300 -0,0100 0,0020 -0,0600 0,0200 0,0060 0,0200 0,0500 0,0040 -0,0400 0,0400 -0,0150 2,0000 3,0000 5,0000 0,1000 2 -0,0840 3 0,1940 5 0,0385 0,1 0,0420 1,9160 3,1940 5,0385 0,1420 -0,0126 1,9034 0,0061 3,2001 0,0041 5,0426 0,0012 0,1432 -0,0003 0,0006 0,0002 0 1,9031 3,2007 5,0428 0,1432 -0,00003 0,00002 0,00002 0,000004 Далее, строка получается из строк (I), (II), (III) части В и строки б(0) таким же способом, как б<°> из (I), (II), (III) и х<°), а строка х<2>— сложением х<б и 6(|) и т. д. Вычисления продолжают обычно до тех пор, пока по- правки не станут меньше требуемых погрешностей с учетом оценки (9.8). Последнюю строку х принимают после этого за окончательные значения неизвестных. Пример 1.8. Решим способом итераций систему уравнений 4xi + 0,24х2- 0,08х3 + 0,16х4- 8 = 0, 0,09х! + Зх2 —0,15х3 —0,12х4— 9 = 0 0.04XJ - 0,08х2 + 4х3 + 0,06х4 - 20 = 0, 0,02х + 0,06х2 + 0,04х3 - 10х4+ 1=0.
80 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. 1 Вычисления приведены в табл. 2.8. Как видно из таб- лицы, после трех шагов поправки уже достаточно малы и вычисления можно закончить. Для оценки погрешности полученных решений вос- пользуемся формулой (9.8), полагая в ней v = 3. Суммы модулей коэффициентов по строкам равны соответ- ственно 0,12, 0,12, 0,045 и 0,012, поэтому можно принять С = 0,12. Для Дз можно принять Д3 = 0,0011. Поэтому фор- мула (9.8) дает = 0,00125. Таким образом, погрешности третьих приближении для неизвестных не превосходят 0,0013. § 9. Способ Зейделя При, рассмотрении обычного способа итерации для отыскания очередного приближения значений неизвест- ных мы пользовались формулами X(v) = zyi(x<v-1\ я**-1), ...), x<v) = L2(x<v-1), x£~l\ ...), (1-9) Иначе говоря, следующее приближение полностью опре- делялось значениями, полученными на предыдущем шаге. Между тем уже при построении первого приближения можно, например, вычисляя значение х<п, воспользо- ваться для Xi не нулевым приближением х\°\ а уже по- лученным нами первым приближением х<п. Вычисляя х3, можно использовать уже не только х^, но и х!,п и т. д. Таким образом, вместо формул (1.9) предлагается использовать для отыскания следующего приближения формулы такого вида (мы снова пишем их для конкрет- ного случая системы четырех уравнений с четырьмя
§ 9] СПОСОБ ЗЕЙДЕЛЯ 81 неизвестными): Это изменение и составляет идею итераций по способу Зейделя. Естественно ожидать, что итерации по способу Зей- деля дадут при том же числе шагов более точные ре- зультаты, чем обычные итерации, или, что то же самое, та же точность будет достигнута за меньшее число ша- гов. Вообще говоря, эти ожидания оправдываются. Од- нако нужно иметь в виду, что условия сходимости обыч- ного итерационного процесса и итерационного процесса Зейделя различны. Один из этих процессов для дан- ной системы может оказаться расходящимся тогда, ко- гда другой сходится. Вычислительная схема итерационного процесса Зей- деля строится, как и для обычных итераций, на вычисле- нии последовательных поправок. Рассмотрим эту схему, ограничившись, для краткости, системой трех линей- ных уравнений с тремя неизвестными. Формулы для оты- скания следующих приближений через предыдущие будут в этом случае иметь вид X1V) = + а13ХГ"П + ai4’ 4V) = a2ix(r> + a23x(v~ ° + a24, x’v) = a31x(.v) + ai2.dv) + a34. (3.9) Формулы для вычисления поправок легко получить, исходя непосредственно из определения и используя (3.9). Действительно, = (ct124v) + a15x<v> + aH) - + a13x$v- *> + a14) = = «.2 (4V) - °)+«.3 (4V) - 4v-°)’ 6 P. С. Гутер, Б. В. Обнинский
82 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I так что д(г) = а12бГ1) + а13бГ1). (4-9) Для d2v) формула выглядит несколько иначе. Так как d2W==x(v+1)_x(v> = = (а21^1'’+1) + «23^3^ 4" И24) ~ 4" ^З^З1 ” + «24)’ ТО 62^ = 02161^ + Ct23&3V ”. (5.9) Аналогично, diw> = a31d(iv) + (6.9) Как и для обычного итерационного процесса, фор- мулы (4.9)—(6.9) могут быть использованы для вычисле- ния поправок 6*v> для всех v = 1, 2, ..., но не для v = 0; для О/ формулы должны быть выведены отдельно. Если, как и в § 8, принять за начальные приближения значения соответствующих свободных членов у(0) = Q г(0) = Q г(0) = CL Л1 и14’ л2 24’ Л3 34’ то для первых поправок получим выражения дГ — „ V(O>_L„ J°> O]2x2 + 013X3 , = 021X1” + <Х23^3°\ (7.9) 6(3О) = 031X1” + (Х32*2 \ J1) J°)_L_a(°) тл J1* — v<°) _1_ А(°) ГДе Х\ = Х\ "Г 01 И %2 —Х2 "Г 02 • Расположение вычислений показано в табл. 1.9. Как легко видеть, верхняя часть ее не отличается от табл. 1.8, а таблица для вычисления поправок имеет уже несколько другой вид: при вычислениях очередных поправок в ряде случаев используются уже полученные поправки того же этапа вычислений. Соответствующие места в табл. 1.9 подчеркнуты. Вычисления продолжаются до получения достаточно малых поправок. Окончательные значения неизвестных получаются по формулам х& = . (fe = 1, 2, 3).
§ 9] СПОСОБ ЗЕЙДЕЛЯ 83 Таблица 1.9 Л11 #12 #13 #14 А «21 #22 #23 #24 #31 #32 #33 #34 —- «12 013 014 В «21 — 023 024 Оз1 Оз2 — O34 62 бз (4) — а21 (а14 + а31 («14 + 610)) (5) О12а24 — а32 (а24 + ^20)) (6) О13<Х34 а2зО24 — (7) = (4) + + (5) + (6) б® б® б® (8) — ”21^1° вЗ!^ (9) а126® — а32$2 (Ю) а13б® а23^30) — . (И)'=(8) + + О) + (10) б<о б<0 6о> (12) • • ♦ • • • • • • 6*
81 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИИ И СИСТЕМ [ГЛ. I Пример 1.9. Решим методом Зейделя систему уравнений lOxj + х2 + х3— 12 = 0, 2х! + 10х2 + х3 — 13 = 0, 2xi + 2х2 + Юх3 —14 = 0. Вычисления приведены в табл. 2.9. Так как решение си- стемы очевидно (Х1 = х2 = ^з=1), то можно проследить по таблице точность очередных приближений. Таблица 2.9 10 2 2 -0,2 -0,2 1 10 2 -0,1 -0,2 1 1 10 -о,1 -0,1 см со СМ СО ’*' — 777 1,2 1,3 1,4 0,1300 0,1400 -0,1860 -0,1400 -0,1860 -0,1948 — 0,27 -0,3260 -0,3808 0,0326 0,0381 -0,0141 0,0381 -0,0141 -0,0048 0,0707 0,0240 -0,0189 -0,0024 0,0019 0,0001 0,0019 -0,0006 0,0026 • -0,0005 0,0020 0,0020 1,0002 1,0000 1,0023
§ Ю] СПОСОБ НЬЮТОНА ДЛЯ СИСТЕМЫ УРАВНЕНИЙ 85 § 10. Способ Ньютона для системы уравнений Рассмотренные в начале главы способы решения уравнений могут быть перенесены на случай нелинейных систем уравнений с несколькими неизвестными. Разбе* рем случай системы двух уравнений с двумя неизвест- ными. Пусть система уравнений имеет вид f (х, у) = о; 1 <р(х, Z/) = O. J (1.Ю) Предположим известными начальные приближения Уо корней этой системы и будем искать поправки к этим грубым значениям. Обозначив эти поправки соответ- ственно через h и k, запишем точные значения корней х и у в виде х—Xq-\-h, у=yQ^-k. Таким образом, вместо системы (1.10) имеем f (х0 + h, уо + к) = 0, 1 Ф>(х0 + /г, yQ + k) = O. ) (2.10) Разложим функции f и ф в ряд Тейлора по степеням h и k: f(x0 + h, yo + k)^f(xo, yQ) + h[-^-\ +k +oi(h,k), \ /0 \ uу /о <р(х0 + Л, yo + k) = ^(x6,yo') + h (^)0 + ^ (17)0 + (3.10) Здесь символ ( )0 означает, что производная берется в точке х0, Уо; (h, k) и o2(/i, k) содержат члены более высокого порядка малости, нежели h и k. Разложение в ряд Тейлора функции двух переменных можно получить при помощи формулы Тейлора для функции одной перемен- ной. Введем вспомогательную функцию Ф(/) = /'(х0 + th, у0 + tk}. Тогда Ф(0) = f(x0, уо) и Ф(1) = f (хо + h, yQ + k). Зафиксировав х0, Уо, h и k, разложим функцию Ф(/) по степеням t. ф (0 = ф (0) + ^211 + /2 + ... (4.Ю)
86 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I Далее, положив х& + th — х и yQ + tk = уу по правилу дифферен- цирования сложной функции получим Ф' (/) = h + k и, следо- вательно, <1/ (0)« ДиФФ€Рен1*иРуя второй раз, най- дем, что Ф" (О) = РД) й2 + ^ + (^}к2 и т. д. \дх2 /о \ дх ду /о \ду2) Выражение для (0) можно символически записать так: ф<«) (о) = (JL h + kC f \дх ду 'x=xt’ У=Уо где после возведения «бинома» в степень по формуле Ньютона д& dn~k dnf надо выражения —---------f заменить на —--------(£ = 0,1, dxkdyn-k dxkdyn~k Подставив в (4.10) выражения для производных функции Ф (/) и поло- жив /= 1, получим формулу Тейлора для функции двух переменных» Остаточный член формулы Тейлора запишется в виде 1 / д д \"+1 7 А;;- Жп)> (п + 1)! \ дх ду } 1 17 где (£, ч) — точка лежащая на отрезке, соединяющем точки (х0, у0) и (х0 + Л, y0 + k). Отсюда, в частности, следует (при п = 0), что f(x} + h, y0 + k)-f (хэ, й+(-|С) k< где \ дх /р \ оу }р упомянутая точка. Последняя формула является обобщением тео- ремы Лагранжа для функций одной переменной. Пренебрегая в (3.10) членами более высокого по- рядка, чем h и k, т. е. принимая, что h и k невелики, по- лучим систему линейных уравнений для определения приближенных значений поправок h и k: f(x0, i/e) + /z1(-^)o + fe1(^)o = 0, ] Ф(ХО, i/o) + + (|9o = °- j Из системы (5.10) получаем значения для поправок у о) ш- f (.Хо, Уо) -ф(х0, Уо) /0 -• b — - \ С /о Ф (Хо, Уо) \ дх /о \ ду /о 1 д<Р \ / дф \ ( дх 'о ( ду /о (-Щ \ дх /о ( d<f \ \ дх Jq \ ду /о / \ \”дГ/о Л,= (6.10)
§ TOJ СПОСОБ НЬЮТОНА ДЛЯ СИСТЕМЫ УРАВНЕНИЙ 87 Поэтому более точные, чем х0, у& значения корней полу- чаются как Xi = x0 + /ii, У\ —Уъ + къ Дальнейшие поправки можно получить тем же путем, отправляясь от значений хь у у Этот способ носит на- звание способа Ньютона (иногда Ньютона — Раф- сона). Пример 1.10. Найдем действительные корни си* стемы уравнений х + 3 1g х — у2 = 0, 1 2х2 — ху — 5х + 1 = 0. J : Построим кривые f(x, t/)=x + 31gx — у2 = 0 и ф(х, у) =2х2 — ху — 5х+1=0 и определим графически точки их пересечения (рис. 12). Это будут точки (1,4; —1,4) и (3,4; 2,2) t Рассмотрим вторую из этих точек и вычислим поправки для корней по способу Ньютона,
88 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I Имеем л'о = 3,4, у0 = 2,2. Далее, дх 1 * х In 10 9 ду J) = -2JL__г дх у ду - X. Вычисляем значения функций и производных в рассма- триваемой точке: /(3,4; 2,2) = 0,1545, ср (3,4; 2,2) = —0,3600; (44= 1,383; (44 =6,400; (44 = — 4,400; (-^-) = — 3,400. ду /о \ ду k Таким образом, система уравнений (5.10) будет иметь вид 0,1545+ l,383A1-4,4fe1 = 0, — 0,36 + 6,4/it - 3,4^ = 0. Формулы (6.10) дают решения А. = - —0,1545 —4,4 _ _ л поп. —0,36 —3,4 1,ЗЬЗ —4,4 6,4 —3,4 I 1,383 —0,15451 , 6,4 0,36 л л«л 11,383 —4,41 = 0’063> 6,4 —3,4 Поэтому первые приближения для корней равны хг = 3,4 + 0,089 = 3,489, у, -2,2 + 0,063 = 2,263. Приняв полученные значения корней за исходные, можно проделать еще один шаг уточнений. Получим /(3,489; 2,263) = — 0,0041, (+),-1.3734; «Л ду /1 — 4,526; <р (3,489; 2,263) = 0,0056; 6.6930; Ш’-3 * * * * *'489- Подставив найденные значения в формулы (6.10), полу- чаем /г2 = —0,0016, /г2 = —0,0014,
СПОСОБ ИТЕРАЦИЙ 89 § И] откуда х2 = 3,489 —0,0016 = 3,4874, у2 = 2,263 —0,0014=2,2616. Если повторить те же операции с полученными вто- рыми приближениями, то мы получим поправки меньше, чем в четвертом знаке. § 11. Способ итераций для нелинейных систем уравнений Пусть дана система уравнений (1.11) и начальные приближения корней х0, W Перепишем систему в виде х = F (х, у), 1 у = Ф(х, у). J Подставив в правые части уравнений системы (1.11) вме- сто х и у значения нулевых приближений х0, 4/о, получим первые приближения корней хх = F (х0, Уо), у{ =Ф(х0, Уо). Аналогично определяются вторые приближения x2 = F (хь r/J, //2 = Ф(хь f/j), и вообще хп F (xft-i, Уп—1)> !/п = Ф(^-ь Уп-\\ Легко установить, что если функции F (х, у) п Ф(х, у) непрерывны и последовательности хь х2,..., х/7,... и у\, у2,..., Уп, •.. сходятся, то пределы их яв- ляются корнями системы (1.11). Сформулируем теперь условия, при которых описан^ ный итерационный процесс является сходящимся. Теорема. Пусть х и у — истинные значения кор- ней системы (1.11) и известно, что a<x<b, c<y<d\ предположим также, что в прямоугольнике, ограничен- ном прямыми х = а, х = Ь, у = с и y = d, других корней
90 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ И СИСТЕМ [ГЛ. I I С нет. Тогда, если в указанном прямоугольнике выпол* * няются неравенства \ dF I \dF | . | 0Ф I I дФ I 1 I дх I P[i I ду I I дх I Р2' I ду | ^2* где р\ + р2^М<\ и q\ ^q2 < 1, то итерацион* ный процесс сходится, причем в качестве нулевого при* 1 ближения (х0, у0) можно брать любую точку прямо* угольника1). i Доказательство. Так как x = F(x, у) и у=» = Ф(х, у), то по формуле Лагранжа для функции двух переменных (см. стр. 86) имеем х - %! = F (х, y) — F (х0, Уо) = У~У1 = Ф(Х, у)-Ф(х0, у0)= ; ^(^Q^-Xo}+^Q(y-y°}> ! где Р и Q — некоторые точки, лежащие на отрезке, сое- । диняющем точки (х, у) и (х0, уо), т. е. заведомо внутри прямоугольника а <х < &, с <у <d. Согласно усло- виям теоремы, переходя к оценке абсолютных величин разностей х — Xi и у—уь получим |x-X] K|x-xo|p14-|y-t/okb I У - У\ КIX - х01 р2 +1 у - I/O I <?2- Сложим эти неравенства: ! |Х-Х11 + |у-У1КМ{|х-Хо1 + |у-Уо1}. i Рассуждая аналогично, получим j |x-x2l + l^-{/2l<Af{|x-xI | + |у-У11}< ; <М2{|х-хо1 + 1У~Уо1} г) В условии теоремы следовало бы еще добавить, что ни одно из последующих приближений (хп, уп) не выходит за границы рас- сматриваемого прямоугольника; впрочем, обычно это условие выпол- няется (см. сноску на стр. 40),
§ И] СПОСОБ ИТЕРАЦИЙ 91 и вообще для n-го приближения IX - хп | +1 у - уп к Мп {| х - х01 +1У - Уо I}- (2.11) Так как М < 1, то при достаточно большом п. правая часть неравенства может быть сделана сколь угодно малой, так что и каждая из разностей х — хп и у — уп стремится к нулю, т. е. итерационный процесс сходится. Неравенство (2.11) можно также использовать для оценки точности приближения: так как |х—х0| < &— о и \y — yo\<d — c, то |х — х„| + \у — уп\ <Mn(b — а + d — с). Пример 1.11. Решим методом итераций систему, приведенную в примере 1.10: f (х, у) = х + 31g х — у2 = 0, Ф (х, у) — 2х2 — ху — 5х + 1 = 0. Прежде всего систему необходимо привести к виду (1.11), что можно сделать различными путями. Если приведем систему к виду х = у2 — 31gx, у = 2х ------5, то F(x, у) = у2 — 31gx, Ф(х, у) = 2х +Ч/х — 5. Здесь производные дх х 9 ду ^9 дх х2 9 ду Отсюда видно, что в окрестности точки Хо = 3,4, уъ — 2,2 будут иметь место неравенства 1^. |+т>1 |^|>4. | дх Р | дх К ’ | Это показывает, что при таком виде системы итерацион- ный процесс расходится. Определим теперь х из второго уравнения, а у из первого: х = ; Fix. , i/=yx + 31gx; Ф(х, у) = Ух + 3 1gх.
92 ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИИ И СИСТЕМ [ГЛ. 1 Здесь dF = 1_______5 + y dF = 1 х_____ дх V2 2 /х (5 + у) - 1 ’ ду ~ V~2 2 ) "х (5 + у) - 1 ’ 1+11£± дФ = х дФ -Q дх 2)^х + 3 1g х ’ ду За область изоляции корня можно принять прямо- угольник 3 < х < 4, 2 < у < 2,5. Легко установить, что в этом прямоугольнике |-^|<0,60, |-^|<0,32, | — |<0,34. I дх I ’ ’ I ду I I дх I Следовательно, процесс сходится, но так как сумма про- изводных по х сравнительно велика, то скорость сходи- мости оказывается небольшой. Вычисления с нулевым приближением х0 = 3,4; уо =* ==2,2 дают ^-/3'4,2'2г+5)~1 -3,426, Ух ~ Уз,426 + 3 1g 3,426 = 2,243, х2 = 3,451, z/2 = 2,2505, х3 = 3,466, Уз = 2,255, х4 = 3,475, у4 = 2,258, х5 = 3,480, у5 = 2,259, х6 = 3,483, у6 = 2,260.
ГЛАВА II ИНТЕРПОЛИРОВАНИЕ § 12. Понятие об интерполировании Первоначально под интерполированием понималось отыскание значений функции, соответствующих проме- жуточным значениям аргумента, отсутствующим в таб- лице. С такими задачами приходится встречаться при вычислениях с таблицами логарифмов, а также при пользовании таблицами тригонометрических и других функций. При этом интерполяцию можно было бы определить как «искусство чтения между строками». В на- стоящее время задача интерполяции понимается шире. В известном смысле можно сказать, что задача ин- терполирования обратна задаче табулирования функций. Именно при табулировании по аналитическому выра- жению функции находят таблицу ее значений, а при интерполировании, наоборот, по таблице значений функ- ции строят ее аналитическое выражение. Поясним, что следует понимать под этими словами. Пусть у = f (х)—некоторая функция, для которой известна лишь таблица ее значений, т. е. известно, что при значениях аргумента х = х0> ..., Хп функция принимает соответственно значения уп, ..., уп- f (*о) = у0, f(xl) = yi, f (хп)= уп. (1.12) Геометрически задача отыскания функции f(x) по за- данным ее частным значениям означает, что мы должны
94 ИНТЕРПОЛИРОВАНИЕ [ГЛ. И построить кривую, проходящую через точки плоскости с координатами (х0, Уо), (%i, f/i), ...» (хп, Уп) (рис. 13). Читателю должно быть ясно, что через данные точки (пусть даже в большом числе) можно провести бес- численное множество различных кривых. Таким обра- зом, задача отыскания функции f (х) по конечному числу заданных ее значений слишком неопределенна: таких функций можно построить бесчисленное множество. Рис. 13. Мы будем в дальнейшем обозначать через F(x) л км бую функцию, которая в заданных точках принимает заданные значения. Из сказанного выше следует, что функций F(x) может быть сколько угодно. Предположим теперь, что функция F(x) не произ- вольная, а удовлетворяет некоторым дополнительным требованиям; тогда задача приобретает значительно , более определенный характер. Чаще всего требуют, что- бы функция F(x) была многочленом степени, на еди- ницу меньшей, чем число известных значений. Таким образом, мы приходим к следующей форму- лировке задачи. Для данных значений х=х0, Xi, и у=уъ> У1, •.Уп найти многочлен у — F(x) степени /г, удовлет*. воряющий условиям F (х0) = Уо, F (х„) = уп.
§ 12] ПОНЯТИЕ ОБ ИНТЕРПОЛИРОВАНИИ 95 Иначе говоря, речь идет об отыскании аналитиче- ского выражения для многочлена, принимающего в заданных точках заданные значения. Такую задачу называют задачей параболической интерполяции !)< Точки х0, Xi, ..., хп называют узлами интерполяции. Многочлен F(x), удовлетворяющий условиям (2.12) называется интерполяционным многочленом, а формулы для его построения — интерполяционными формулами. Различным интерполяционным формулам будут посвя- щены следующие параграфы настоящей главы. Основная идея применения интерполяционных фор- мул состоит в том, что функция i/ = f(x), для которой известна лишь таблица значений (1.12), заменяется интерполяционным многочленом, который рассмат- ривается как приближенное аналитическое выра- жение для функции f(x). При этом, естественно, воз- никает вопрос о степени точности такого приближения и оценках погрешности, возникающей при замене f(x) на F(x) при различных действиях. Этот вопрос рассмат- ривается в дальнейшем изложении. Замена функции f(x) ее интерполяционным много- членом используется прежде всего для отыскания про- межуточных значений функций, как о том говорилось в самом начале. С этим применением интерполяционных формул связано и их название. Но этим случаем их применение не ограничивается. Такая замена может по- требоваться и тогда, когда аналитическое выражение для f(x) известно, но является слишком сложным, а функция f{x) должна подвергаться различным матема- тическим операциям (например, интегрированию). Воз- можно также, что значения функции f(x) получаются из экспериментальных данных, так что получение других промежуточных значений может оказаться затруднитель- ным или невозможным, а аналитическое выражение функции — неизвестным. Несмотря на указанную выше «противоположность» задач табулирования и интерполирования, интерполя- *) В некоторых случаях рассматриваются также задачи триго- нометрической интерполяции. При этом в качестве класса функций, о котором шла речь выше, берутся тригонометрические полиномы.
96 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II дионные формулы широко используются при составле- нии таблиц функций. Именно, отдельные значения функ- ции вычисляются (чаще всего с помощью степенных рядов) непосредственно с большой точностью, а затем полученные таблицы многократно уплотняются с по- мощью интерполяционных формул, благодаря чему по- лучают более или менее подробные таблицы. Этим обстоятельством мы будем широко пользо- ваться в настоящей главе. Для примеров будем брать таблицы функций со сравнительно большим шагом, ана- литическое выражение которых известно. Значения, по- лученные с помощью интерполяционных формул, будем сравнивать со значениями, взятыми из более подробных* таблиц для этих же функций. § 13. Параболическое интерполирование. Интерполяционная формула Лагранжа Как было сказано выше, задача параболического ин- терполирования ставится следующим образом: рассмат- ривается функция f(x), для которой заданы значения yi=f(Xi) (z = 0, 1,2, ..., и), причем все и yt известны. Требуется определить многочлен y = F(x) степени п, для которого F(Xi)= f(Xi) (z = О, 1,2, ..., п). Мы можем написать F(x) = д0 4- а\х + а2х2 + ... + апхп. (М3) Используя написанные выше условия, получим для оты- скания неизвестных коэффициентов д0, Дц Дг, ..., ап систему п 4- 1 уравнений с и 4- 1 неизвестными: ао 4- Д1х0 + д2Лф 4- ... 4- апХц = у^ д0 + аххх 4- д2г* 4- ... 4* апх" = yv ао+аА + а2-<+ ••• +апхп = Уп' Дальше будет показано, что эта система имеет един- ственное решение, если значения л'О, х{, ..., х}1 отличны друг от друга, и тогда, определив значения коэффициен- (2.13)
§ 13] ИНТЕРПОЛЯЦИОННАЯ ФОРМУЛА ЛАГРАНЖА 97 тов Qi из системы (2.13), мы и получим интерполяцион- ный многочлен F(x), дающий решение поставленной за- дачи. Однако, прежде чем перейти к рассмотрению этого вопроса в общем виде, рассмотрим простой пример. Пример 1.13. Пусть заданы значения х0 = О, Xi = 1, х2 = 2 и уо = 1, у\ = 1, у2 = 3. Требуется отыскать многочлен второй степени F(x), для которого F(0) = 1, F(l)= 1, F(2)= 3. Записывая F(x) в виде F(x) = а0 + а\Х 4- а2х2, составим систему уравнений (2.13) а о 4~ ci\ • 0 4~ «2 • О2 — 1, «о + «1 * 1 + «2 • 12 = 1» ciq ~Ь €i\ • 2 4~ а2 • 22 = 3, т. е. «о= 1, «о 4" «1 4- «2= 1, aQ 4- 2а 4- 4я2 = 3, к откуда «о=1, «I = ~ 1, «2=1, так что интерполяцион- ный многочлен имеет вид F(x) = 1— х + х2. Нетрудно проверить, что он удовлетворяет поставлен- ным условиям. Перейдем теперь к решению общей задачи отыскания интерполяционного многочлена. Вместо того чтобы ре- шать систему уравнений (2.13), мы поступим иначе, не- посредственно построив многочлен F(x), удовлетворяю- щий всем поставленным условиям. Найдем прежде всего выражение для многочлена, принимающего в точке х = х0 значение z/0 = 1, а в точ- ках х = Xi, х = х2, .. •, х = хп — значения у{ — у2 = .. * ... = уп = 0. Легко проверить, что такой многочлен бу- дет иметь вид (х-хн (у-х2) ... (х-хп) (хд - Х\) (хэ - х2) ... (х0 - хп) • 7 PC. Гутер, Б В Овчинский
4 98 ИНТЕРПОЛИРОВАНИЕ [ГЛ 1Г j| В самом деле, значения х = хь х = х2, , ♦., х = хп яв* j ляются корнями нашего многочлена, а при х = х0 чис- I литель равен знаменателю. Теперь построим многочлен (/ = F0(x), принимающий с в точке х = х0 значение у$ и обращающийся в нуль для । значений х = хг- (г = 1, 2, п). Учитывая предыду- * щее построение, легко заметить, что многочлен Fo(x) ' i должен иметь вид Р / Ч _ (x-xi)(x-x2) ,,,(х-хп) . 0 ' ' (х0 - Х1) (х0 - х2) ... (х0 - хп) ‘ ^°’ * После этих предварительных построений можно пе- рейти к отысканию многочлена F(x), принимающего в точках х — Xi (f = О, 1, 2, ..., п) заданные значения : Г(хг) = yt (f = 0, 1, 2, ..., п). Для этого определим при фиксированном / (0<С/<Сп) многочлен /j(x), прини- мающий в точке х = Xj значение Fj(Xj) = г/, = F(Xj), а во всех остальных точках х = хг- (I = 0, 1, 2, ... ..., п, i =£= j) —значение Fj(Xi) = 0. Это будет многочлен f (*~*о)(х~х1)...(х-х/,1)(х~х/+1) , J (Х/ — Хо) (Х/ *1) • • • (х/ ~ х/-1) (х/ ~ х/ + 1) • • • (Х/ Л‘п)^ 11 Искомый многочлен будет равен сумме | "° так как в каждой точке Xj одно из слагаемых принимает J нужное значение i/j, а все остальные слагаемые обра- 1 щаются в нуль. Итак, многочлен, удовлетворяющий ус- I ловиям поставленной задачи, найден. Подставляя вместо ’ Fj(x) их выражения, получим J Г(х)= И (x-xo)(* — xi) ••• (’с~*/-1)(х — А7+1) ••• (х--"ч) К “ (х/ “ хе) (х/ ~ xi) ’ • • (х/ “x/-i) (х/ ~x/+i) • • • (х/ ~хп) |1 (3.13)
| 13] ИНТЕРПОЛЯЦИОННАЯ ФОРМУЛА ЛАГРАНЖА gg или, в развернутом виде Г / \ (Х-Лд) (Х-Х2) .,. (х~Хп) г W (Хо - X,) (х0 - х2) ... (х0 - хп) Уо (x-xQ)(x-x2) ... (х-х„) ‘ (Х1 - Xq) (Xj - х2) ... (Xj - хп) Ух (Х~ХО)(Х~Х1) ... (X-X^Q ( ” HXn-XoHXrt-Xj) ... (Хп-Хя-О У*' Полученная формула (3.13) называется интерполя- ционной формулой Лагранжа. Покажем теперь, что интерполяционный многочлен Лагранжа является единственным решением по- ставленной задачи. Действительно, пусть существует еще один многочлен /?(х) степени п, принимающий в задан- ных точках заданные значения. Тогда разность F(x)—R(x) представляет собою многочлен степени не выше п, который обращается в нуль в точках х = х< (i = 0, 1, 2, ..., п), т. е. имеет п 4- 1 корень. Отсюда следует, что эта разность равна нулю тождественно, так как многочлен степени не выше п не может иметь п 4-. 1 корней. Мы заключаем, таким образом, что, каковы бы ни были значения х0, ..., хп, среди которых нет совпа- дающих, и совершенно произвольные значения yQ, ух, ... ,Уп, существует единственный многочлен F(x) сте- пени п, принимающий в заданных точках заданные зна- чения, т. е. удовлетворяющий условиям F(Xi)=tji (z = 0, 1, 2, ..., п). Пример 2.13. Положим n= 1. Ясно, что мы имеем в этом случае две точки и интерполяционная формула Лагранжа дает уравнение прямой, проходящей через две заданные точки. Обозначив абсциссы этих точек че- рез а и Ь, получим интерполяционный многочлен в виде г / \ х — Ь , х — а F (х) =-----------------г- уо 4- -У1» 47 а — Ь д — а Пример 3.13. Примем п = 2. Тогда мы получим уравнение параболы, проходящей через три точки. Если обозначить %о = и, х} = b, х2 = с, то искомое уравне- ние имеет вид г /И - с) „ । (x-Q)(x-f) (х-а) (х — Ь) {a_b)(a_c) Уо± {b_a)(b~c) yi± (с_а)(с_ь) У 2* 7*
100 ИНТЕРПОЛИРОВАНИЕ (ГЛ 1Г § 14. Интерполяционная схема Эйткина Для практического нахождения значений функции интерполяционная формула Лагранжа (4.13) плохо приспособлена. Она требует не слишком большого чис- ла действий, но мало удобна для записи вычислений. Наиболее удобным является расположение вычислений по предлагаемой ниже схеме, которая носит название схемы Эйткина. Начнем с рассмотрения линейной интерполяции. Пусть даны два значения аргумента х0 и xh в которых функция принимает соответственно значения £/ои#ьДля вычисления значения функции в некоторой точке х с помощью линейной интерполяции нужно построить прямую, проходящую через эти точки и вычислить вели- чину ординаты этой прямой в требуемой точке. Это значение может быть вычислено по формуле П / \ 1 #0 *0 X ,, г (1Л4) Л1 ло у\ Х[ — л Действительно, выражение для Ро, i(x) представляет собой многочлен первой степени. Легко убедиться, что Ро. 1W принимает в заданных точках нужные значения. Чтобы это сделать, вычислим значения Ро, i(x) в точках Хо и Хь п , . 1 Уо 0 Ро, 1 W — А. _ х ,. _ г — Уо, Л> х° 1/1 Х[ — Хо г. 7 X 1 Уо Хо — Х1 Ро. 1 (Х1) = _ Л1 л0 У1 о = У\ Пример 1.14. По значениям функции у = ех в двух точках хо = О,4О, z/o=l>4918, %! = 0,42, г/, = 1,5220, найдем с помощью схемы Эйткина значение ех для х = 0,411.
§ И] ИНТЕРПОЛЯЦИОННАЯ СХЕМА ЭЙТКИНА 101 Пользуясь формулой (1.14), находим 1 0,42 - 0,40 1,4918 —0,011 1,5220 0,009 1,4918.0,009+1,5220.0,011 1 -ЛО4 ------------оде------------= 1 ’5084< Интерполяция более высокой степени производится совершенно аналогично, причем для построения каждого многочлена следующей степени используются уже по- строенные предыдущие. Если даны три значения аргумента х0, х{, х2, в кото- рых функция принимает соответственно значения Уо» Ун Уз, то предварительно строятся два линейных мно- гочлена 1 Уо х0 —х „ r у (2.14) Xi х0 х 1 — X И , ч 1 У1 Xj -X Р'.Лх) = -±т- Х2 — У 2 *2~Х (3.14) Значение функции в точке х, соответствующее интерпо- ляции второй степени по указанным трем точкам1), по- лучается путем линейной интерполяции между значе- ниями этих линейных выражений, т. е. по формуле . _ 1 Ро. I (х) ХО ~ X 0, 1, 2 (X) — Xi_Xg Р' 2 х2 — X (4.14) Действительно, так как Ро, i и 2 — многочлены первой степени, то Ро, i, 2— многочлен второй степени от-, носительно х. Далее, по построению Ро, i(x) и /\2(х) имеем Ро, 1 (Хо) = Уо; Ро, 1(Х1) = У1,- Р1,2(Х1) = УГ, Р\, 2(х2) = у2- 9 Такую интерполяцию называют квадратичной.
102 ИНТЕРПОЛИРОВАНИЕ [ГЛ II Поэтому Ро, 1, 2 Uo) — 1 %2-Хо Ро, 1, 2 (х2) — 1 х2 -Хо Ро, I (х0) о Р1,г(х0) х2~х0 Ро, 1 (Х2) Хо ~ х2 Р1,2(х2) о = Ро, 1 (*о) — £/о> == Pi, 2(х2) = У 2- Кроме того, Ро, 1,2 (xj) = ________ Ро, 1 (Х1) Хо ~ Х1 *2 —*о pit 2 (Xi) Х2 — Х1 1 У\ Xo-Xi ^2-~X0 х2 —Xj Таким образом, Ро, i,2(x) действительно является многочленом второй степени, принимающим в заданных точках заданные значения, а такой многочлен, как было показано в § 13, является единственным. Пример 2.14. Функция i/ = f(x) задана табл. 1.14. С помощью квадратичной интерполяции по схеме Эйт- кина найти значение f (13,13). Таблица 1.14 (1) (2) (1) (2) X fix) X f (х) 13,00 13,05 13,10 1,499 362 1,501 061 1,502 923 13,15 13,20 13,25 1,504 942 1,507 111 1,509 425 Примем Хо = 13,10. Тогда последовательно находим 1 0,05 1,502923 —0,03 1,504942 0,02 = 1,504134, 0,05 1,504942 0,02 1,507111 0,07 = 1,504074, ^0,1,2 О)ю 1,504134 —0,03 1,504074 0,07 = 1,504116.
§>14] ИНТЕРПОЛЯЦИОННАЯ СХЕМА ЭЙТКИНА 103 Итак, искомое значение функции, полученное квад- ратичной интерполяцией, есть 1,504116, тогда как ли- нейная интерполяция на участке (х0, Xj) дала 1,504134. Точное значение функции, взятое из более подробной таблицы, равно f (13,13) = 1,504116, так что квадратич- ная интерполяция сохраняет все знаки точными, в то время как линейная дает погрешность порядка 20 еди- ниц последнего знака. Рассмотренная схема легко обобщается на более высокие степени. Например, при интерполяции третьей степени по четырем точкам (кубическая интерполяция) имеет место формула ч 1 Ро, 1,2(х) Х0-Х о, 1.2.3W- х3_Хо р12>3(х) х3 — X (5.14) где многочлен Ро, 1,2 определен формулой (4.14), а Р\, 2, з построен аналогично. Вообще, если даны п + I значений аргумента х0, Xi, ..., хп и функция в них принимает соответственно значения у$, у\, ..., уп, то интерполяционный много- член и-й степени можно получить по формуле 1 Ро, 1, Ро, 1, ..., rt-l(x) х0 — X (6.14) Pi, 2....п (х) хп - х в которую входят предполагаемые построенными много- члены предыдущей степени. Нетрудно убедиться в том, что формула (6.14), если ее выразить последовательно через значения функции Уо, .Уп, совпадает с формулой Лагранжа (4.13). В самом деле, линейный многочлен (1.14) имеет вид Ро. 1W = Т~- Х - х) Уо - (х0 - х) 1/J = Л1 ло X — X] . X — х0 = х„-х, У°+ х.-х л Q л\ Xq что совпадает с формулой Лагранжа. Далее, для Pi, 2(х) аналогично можно написать п , ч X —Х2 . X — Xi Pl.2 “ 'х.-Х, + х.-х.
104 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II Поэтому для многочлена второй степени (4.14) чаем полу- Ро. 1, 2 (х) — —---7“ [( у ’ Уо + V —х° У1) (Х2 ~ х)~ Х2 Xq L\ Л1 Л1 / ( х — х2 . х — Х[ \ , хТ - V—Г //I + V-T Уг] (*0 - X) = \ Х\ — Х2 Х2 ~ А1 / j _ (х-Х|)(х-х2) , (X - Хр) (х - Х2) / 1 1 \ | (хр-х^хр-хг) х2 — х0 х0-х, X;-х2/"И , (х —Хр)(х—Х1) (х —Xj) (х — х2) (х2 - Хр) (Х2 - Х|) •'2 (х0 - Х|) (Хр - х2) 1,0 . (х - Хр) (х - х2) (Х-Хр) (х-х,) ' («1 - *о) (*1 - х2) V' "Г (Х2 - Хр) (х2 - Х1) У'2’ что снова совпадает с формулой Лагранжа для трех узлов интерполяции. Предоставляем читателю самостоя- тельно убедиться в том, что такое совпадение многочле- на, полученного по схеме Эйткина с интерполяционной формулой Лагранжа (3.13), имеет место для любой сте- пени п. § 15. Равноотстоящие значения аргумента. Конечные разности До сих пор не делалось никаких предположений о за- данных значениях аргумента, которые могли быть со- вершенно произвольными. Предположим дополнительно, что рассматриваемые значения аргумента являются рав- ноотстоящими, т. е. образуют арифметическую про- грессию. Такое предположение обычно имеет место при интер- полировании функций, заданных в виде таблиц с по- стоянным шагом, где Xi = x0 + ^, x2=x0 + 2/i, ..., xw = =х0 + тй. Разность h арифметической прогрессии и на- зывается шагом таблицы. Построение интерполяцион- ных формул в этом случае значительно упрощается. Прежде чем перейти к рассмотрению этого вопроса, познакомимся с понятием конечных разностей. Пусть значения функции f(x) заданы в точках х0, = Xq + h, ..., хп = Хо + nh (узлы интерполяции).
§ 15} РАВНООТСТОЯЩИЕ ЗНАЧЕНИЯ АРГУМЕНТА 105 Составим разности значений функции У\ - Уо = f(*o + h) - f (x0) = ЛУо = Af (Xo), У2 “ Уi = f (*o + 2ft) - f (x0 + h) = (x0 + h), yn-yn-i = f(xo + nh)-f(xo + (n- 1) A) = kyn-i = = Af(xo + («— 0 h). Эти значения называют первыми разностями функ- ции, или разностями первого порядка. По ним мы мо- жем составить разности второго порядка, или вторые разности \2у^ = \у{—\у^ \2yl = \y2 — Д//1, \2ym==kym+i — kym и вообще разности любого порядка k, или k-e разности \hym = \k~'ym±{ —&k~'ym. (1.15) Эти последовательные разности обычно располагают в форме таблицы. Употребляются две формы таблиц по- следовательных разностей. В табл. 1.15 разности в каж- дом столбце вписываются между соответствующими Таблица 1.15 X У Разности первые вторые третьи Хо Уо Луо Х1 == х0 + h У1 Д21/о Д2г/1 Д31/о х2 == х0 + *з = *0 + 3/г У2 Д</2 Д3г/1 Д2</2 Уз Ai/з Д3г/2 Х4 == Хд 4- 4А Л2</з У1 - х5 = х0 -Ь 5/z Уз
106 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II значениями уменьшаемого и вычитаемого; такая таб- лица называется диагональной. В таблице же 2.15 Таблица 2.15 X У Разности первые вторые третьи Хо Уо Д//о Д2//о Д3//о Х1 == х0 + h У\ Д'/! Д2//1 Д3У1 х2 = х0 + 2Л У2 Д</2 Д2//2 Д3{/2 х3 = х0 + 3/г Уз Д//з Д2//3 • • ♦ х4 = х0 + 4/г У4 Д//4 • • • „ х5 = х0 + 5А Уь • • • • . . • • • разности ставятся в одной строке с вычитаемым; в этом случае таблицу разностей называют горизонтальной. Так как разности функций обычно бывают невелики, то их принято записывать в единицах последнего знака без нулей впереди. Равенства (1.15) определяют разности различных по- рядков последовательно. Установим соотношения, даю- щие выражения для конечных разностей непосредственно через значения функции. Действительно, так как Дг/о = = У\ — Уо И \У\=У2 — У1, ТО Д2г/о=(У2 — У\) — (у\ — Уо), так что №уо = У2-2У\ + Уо- Точно так же Л2 У о = Уз~ Ъуъ + 3//1 - у0. Нетрудно доказать, что для любого k ^кУо = Ук~ kyk-i + +АЦ=П^_2_ +(-!)*-! ^1 + (-l)fey0. (2.15) Эта формула имеет место и для разности Д*//т; доста- точно ко всем номерам значений функции прибавить tn.
РАВНООТСТОЯЩИЕ ЗНАЧЕНИЯ АРГУМЕНТА 107 § 15] Формула (2.15) легко запоминается, если заметить, что ее выражение напоминает разложение (у—1)к по фор- муле бинома Ньютона. Надо только вместо yk писать Ук, вместо yh~l писать и т. д.; в последнем слагае- мом вместо 1=//0 пишем yQ. * Нередко бывают полезны и другие формулы, даю* щие выражение значений функции через конечные раз*» ности. Действительно, из Af/o = i/i—Уо вытекает, что У\ =Уо + Ауо- Аналогично, У% = У\ + = (Уо + Af/o) 4-Ar/г, но так как Д2г/о = А*/1 — Дуо, то Уч — У о 4- 2 Д у о 4- Д2//0. Как и выше, эти выкладки можно провести для любого что дает Ук — Уо + & Af/o 4-^“2!—~ A2i/0 4- < ♦ • 4- А^Уо* (3.15) Полученная формула дает возможность определить значения ук при любом k через значение г/о и конечные разности до &-го порядка включительно. Число k необ- ходимо является целым. Формулу (3.15) удобно запи- сать символически следующим образом; ;/* = (14-А)\уо- (4.15) Здесь скобка (I 4- A)ft раскрывается по формуле бинома Ньютона, а полученные «произведения» Arz/0 означают разности соответствующих порядков. Отметим некоторые простейшие свойства конечных разностей: 1°. Если С постоянно, то АС = 0. 2°. A[Cf(x)] = CAf(x). 3°. А [Л (х) 4-(х) ] = АЛ (х) 4- Д/2 (х). Перечисленные свойства достаточно очевидны. Кроме них, нам потребуется выражение разности функции f(x)=xw для целого п: 4°. Д (хп) = пЛх"-1 + -(n~i} h2xn-2 + ... + nhn~lx+hn.
108 ИНТЕРПОЛИРОВАНИЕ (ГЛ. IT Для доказательства этого равенства достаточно на- писать А (х”) = (x + h)n — хп и воспользоваться формулой бинома Ньютона. С помощью этих свойств легко получить выражения для последовательных разностей многочлена. Действи- тельно, если y=f(x) =Ло*?1+Л]*п-1 + .. .4-я„-]Х + яп, (5.15) то в силу свойств 3° и 2° Ау = а<£(хп) +П1Д(хп-1) +.. . + лп_]А(х), так что вследствие 4° Ау = а0[лЛЛ' + й2х"-2 + ... + nh,l~'x 4- Л"] + +a,[(n- 1) hxn~2 + {n~'\\n~2)h2xn~3 + +an^h, или, окончательно, Д^^а0пЛхп“1 + ^0??^^Л2 + й!1(п— l)/i]x'2-2+ ... ... + an_xh. (6.15) Таким образом, первая разность многочлена степени п со старшим членом аохп есть многочлен степени п— 1 со старшим членом аоп/гхп~\ Вычисляя аналогичным пу- тем последовательные разности многочлена любого по- рядка, убедимся в справедливости следующего утвер- ждения. Если f(x)—многочлен степени п относительно х со старшим членом аохп, то для любого т<п разность Anlf(x) есть многочлен от х степени п — m со старшим членом п(п—1)...(п— m + \)aQh™xn~m. Для m = п &nf(x) *=n\a$hn и при m>n разность Amf(x) тождест- венно равна нулю. Подчеркнем, что этот вывод верен только тогда, когда h постоянно, т. е. значения х образуют арифметическую прогрессию. Справедлива и обратная теорема, которую мы при- ведем без доказательства: если п-е разности функции,
§ 15] РАВНООТСТОЯЩИЕ ЗНАЧЕНИЯ АРГУМЕНТА 109 образованные для равноотстоящих значений аргумента при любом шаге h, постоянны, то функция представляет собой многочлен степени п. Последнее утверждение, как мы увидим дальше, на- ходит широкое применение в практике: оно позволяет при отыскании промежуточных значений функции (если шаг таблицы постоянен) ограничиваться вычислениями таких многочленов, степень которых равна порядку прак- тически постоянных разностей. Способы построения та- ких многочленов будут указаны в следующем параграфе. Пример 1.15. Рассмотрим таблицу значений много члена f(x)=x2— ЗхЦ-2 (табл. 3.15). Таблица 3.! 5 X У Разности Ду А3// 1 1,0 1 0,00 -16 1,2 -0,16 - 8 8 0 1,4 — 0,24 0 8 0 1,6 -0,24 8 8 0 ‘ 1,8 -0,16 16 8 0 2,0 0,00 24 8 0 2,2 0,24 32 8 0 2,4 0,56 40 8 0 2,6 0,96 48 8 2,8 1,44 Согласно принятому условию записываем разности в единицах последнего знака без нулей впереди. В соответствии с доказанной выше теоремой вторые разности оказываются постоянными, а третьи разности равны нулю.
НО ИНТЕРПОЛИРОВАНИЕ [ГЛ. И Пример 2.15.’Рассмотрим функцию, значения кото- рой заданы табл. 4.15, и составим разности функции. Таблица 4.15 X У Разности Д2£/ 0,30 1,0313 -330 0,35 0,9983 -368 -38 6 0,40 0,9615 -32 -400 -27 5 0,45 0,9215 -427 4 0,50 0,8788 -450 -23 7 0,55 0,8338 -466 -16 5 0,60 0,7872 -477 -11 6 0,65 0,7395 -482 - 5 0,70 0,6913 Мы видим, что третьи разности можно считать прак- тически постоянными, и, следовательно, четвертые рав- ными нулю. Поэтому на рассматриваемом участке функ- ция ведет себя приблизительно как многочлен третьей степени. Необходимо, однако, иметь в виду, что теорема о ко- нечных разностях для многочленов относится к точным разностям функции. Если же допускать округления, то, как видно из приводимых ниже примеров, порядок праю тически постоянных разностей существенно зависит как от точности вычисления значений функции, так и от шага таблицы. Пример 3.15. Рассмотрим многочлен четвертой сте- пени у = 0,02х4 + 0,05х3Н-_0,04х2 + 0,01 % — 8,85.
§ 15] РАВНООТСТОЯЩИЕ ЗНАЧЕНИЯ АРГУМЕНТА 111 Точные значения этого многочлена даны в табл. 5.15. Как видно из таблицы, разности четвертого порядка по* стоянны, что вполне соответствует утверждениям тео- ремы. Таблица 5.15 X У А2г/ А3г/ д<^ 4,0 0,150000 810 972 4,1 0,960972 864 420 53 448 2 292 4,2 1,825392 920 160 55 740 2 340 48 4,3 2,745552 978 240 58 080 2 388 48 4,4 3,723792 1 038 60 468 2 436 48 4,5 4,762500 1 101 612 62 904 2 484 48 4,6 5,864112 65 388 48 1 167 000 67 920 2 532 48 4,7 7,031112 1 234 920 70 500 2 580 48 4,8 8,266032 1 305 420 73 128 2 628 4,9 9,571452 1 378 548 5,0 10,950000 : Если же рассматривать значения этого многочлена с точностью до четвертого десятичного знака, то, как по* называет табл. 6.15, при сохранении того же шага й = 0,1 практически постоянными можно считать уже третьи разности. Более того, в табл. 7.15 приведены значения того же многочлена с точностью до сотой, и из нее мы видим, что в этом случае практически постоянными ока- зываются уже вторые разности. Опираясь на замечание, сделанное выше, можно ска- зать, что если бы мы заранее не знали, что табл. 6.15 и 7.15 дают значение многочлена четвертой степени, то мы бы искали промежуточные значения с помощью
112 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II Таблица 6.15 X У А1/ ^у 4,0 0,1500 8 НО 4,1 0,9610 8 644 534 24 4,2 1,8254 9 202 558 22 4,3 2,7456 9 782 580 25 4,4 3,7238 10387 605 24 4,5 4,7625 11 016 629 25 4,6 5,8641 11 670 654 25 4,7 7,0311 12 349 679 27 4,8 8,2660 13 055 706 24 4,9 9,5715 13 785 730 5,0 10,9500 многочленов третьей степени в первом случае и второй степени во втором случае. Это означает, что чем с мень- шей точностью даны значения функции, тем более про- стые интерполяционные формулы надо выбирать. Необходимо еще иметь в виду, что на разностях выс- ших порядков заметно сказываются ошибки округления. Сравнение разностей в табл. 6.15 и 7.15 с разностями в табл. 5.15 наглядно это поясняют. Чтобы выяснить влияние шага таблицы на разности, рассмотрим таблицу значений того же многочлена с ша- гом h = 0,01. Как показывает табл. 8.15, при таком шаге вторые разности оказываются практически постоянными даже для таблицы с пятью знаками. Если функция на рассматриваемом участке не имеет аналитических особенностей, то обычно ее разности из- меняются плавно. Поэтому нарушение плавного измене- ния разностей позволяет в ряде случаев обнаружить
§15] РАВНООТСТОЯЩИЕ ЗНАЧЕНИЯ АРГУМЕНТА 113 Таблица 7.15 X У Д2// 4,0 0,15 81 6 4,1 0,93 87 5 4,2 1,83 92 5 4,3 2,75 97 7 4,4 3,72 104 6 4,5 4,76 ПО 7 4,6 5,86 117 7 4,7 7,03 124 6 4,8 8,27 130 8 4,9 9,57 138 5,0 10,95 Таблица 8.15 X У &У д2# 4,00 0,15000 7876 4,01 0,22876 7927 51 4,02 0,30803 7978 51 4,03 0,38781 8031 53 4,04 0,46812 8083 52 4,05 4,06 0,54895 0,63030 8135 52 8 Р. С Гутер, Б. В. Овчинский
114 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II ошибки в отдельных значениях функции, заданной с по-» мощью таблицы. Пусть одно из значений функции содержит ошибку. Влияние этой ошибки на разности функции можно про* следить по табл. 9.15. Таблица 9.15 X У &2У Ь9У ХП — 2 У П-2 . . . • • • . . . Ь-Уп-г Д2«/л-г+е Д3г/л+е хп — 1 Уп-\ btjn-i + s Л3г/л-2-Зе хп Уп + Ь А2г/я-1-2е Д2«/я+е Д3</л-1+Зе xn+i У п + 1 Ьуп+i Д3гм-е Хп + 2 Уп + 2 Из табл. 9.15 видно, что ошибка тем больше, чем выше порядок разности. Если предположить, что вторые разности в рассма* триваемой таблице практически постоянны всюду, кроме выделенного участка, то в качестве исправленного значе- ния второй разности A2r/n-i можно принять среднее ариф- метическое трех выписанных в табл. 9.15 вторых раз- ностей, потому что сумма этих трех разностей уже не содержит ошибки. Таким образом, полагаем Д2!М-1 = у [(Д2!Л»-2 + е) + (Д2г/п-1 - 2е) + (Д2уп + е)] = к2уп 2 + №yn-l + №уп 1КХ где \2уп-\ означает исправленное значение второй раз- ности. Напомним, что вторые разности предполагаются постоянными. Зная исправленное значение второй разности, легко найдем ошибку значения уп, находящегося в той же го--
§ 15] РАВНООТСТОЯЩИЕ ЗНАЧЕНИЯ АРГУМЕНТА H5 ризонтальной строке, что и исправляемая вторая разность 8 = y(A2z/„_i-A2f/„_]). (8.15) Ошибка выражается в целых единицах последнего раз-» ряда, как и значения функции и все разности. Исправив ошибочное значение функции, следует сно- ва пересчитать все разности. Нужно только иметь в виду, что таким путем могут быть обнаружены лишь отдельные ошибки, находящиеся в таблице друг от друга далеко. Кроме того, функция может иметь на рассматри- ваемом участке такие особенности (например, резко вы- раженный максимум), что ее разности вообще не будут иметь плавного течения. Пример 4.15. Функция задана таблицей (табл. 10.15), в которой вторые разности можно считать практически постоянными, кроме участка, соответствующего значе- Таблица 10.15 X У д Д2!/ 0,00 0,2928341 15 632 0,05 0,2943973 15 665 33 0,10 0,2959638 15 699 34 0,15 0,2975337 15 733 34 0,20 0,2991070 15 766 33 0,25 0,3006836 15814 48 0,30 0,3022650 15 823 9 0,35 0,3038473 15 871 48 0,40 0,3054344 15 906 35 0,45 0,3070250 15 941 35 0,50 0,3086191 8*
Н6 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II ниям аргумента 0,25, 0,30, 0,35. Естественно считать, что значение у, соответствующее х = 0,30, содержит ошибку. Исправленное значение второй разности найдем по формуле (7.15) = 48 + 9 + 43 = 35 О в единицах седьмого знака. Ошибка найдется по фор- муле (8.15) е = у (9 — 35) = — 13 единиц седьмого знака. Таким образом, исправленное значение функции при х = 0,30 должно быть у = 0,3022637 вместо указанного в таблице 0,3022650. Пересчитывая разности (табл. 11.15), убеждаемся, что у вновь полу- ченной таблицы вторые разности практически постоянны всюду. Таблица 11.15 X У Д2// 0,20 0,299 1070 15 766 0,25 0,300 6836 15 801 35 0,30 0,302 2637 15 836 35 0,35 0,303 8473 15 871 35 0,40 0,305 4344 Рассмотренный прием позволяет исправлять отдель- ные ошибки функции также и в том случае, когда по- стоянны третьи разности. В заключение отметим связь между конечными раз- ностями и производными функции. Из определения про- изводной следует, что Г (.<) - lim + = lim AfM. h h Л-.0 ,l
$ 161 ИНТЕРПОЛЯЦИОННЫЕ ФОРМУЛЫ НЬЮТОНА Н7 Отсюда вытекает, что при малых h имеем /'(л')~ '» или, в более короткой записи: <9|5> Найд» теперь lim = lim И£±ЭД^±*1±1« . h->0 П Л->0 П Считая функцию /(х) дважды непрерывно дифферен- цируемой, применим два раза правило Лопиталя (при постоянном х и переменном h). Тогда 1 f (х + 2/г) — 2f (х + h) + f (х) _ f'(x + 2h)'2-2f'(x + h) _ 11111 J 2 11111 r Qf» A->0 tl h->Q -lim ro + a).2-ru + t)_7„M| h->0 1 t. e. lim — fff (x)» Отсюда при малых h будем иметь Л->0 п и" ~ у п* • Рассуждая аналогичным образом и дальше, получим приближенную формулу для любого п (предполагая, что функция y = f(x) имеет п-ю непрерывную производную) (10.15) Формулы (9.15) и (10.15) могут быть использованы для приближенного отыскания производных. Однако их точность весьма невелика (особенно при н>1), и по- этому на практике применяются более совершенные приемы (см. ниже, § 18). § 16. Интерполяционные формулы Ньютона Интерполяционные формулы Ньютона, к рассмотре- нию которых мы переходим, предназначены для решения той же общей интерполяционной задачи, что и формула Лагранжа. При их выводе сделаем дополнительное пред- положение, что рассматриваются равноотстоящие зна- чения аргумента.
118 ИНТЕРПОЛИРОВАНИЕ (ГЛ и Пусть значения функции y=f(x) заданы для равно- отстоящих значений аргумента х0, X\=xQ+h, х2 = =x0+2/z, xn=x0 + nft. Обозначим эти значения со- ответственно tjQ = f(Xo), i/n = f(^n). Как было показано в § 13, существует единственный многочлен F (х) степени п, такой, что F(xk)=yk (& = 0, 1, ..., п). Сейчас речь пойдет о другом способе записи и отыскания этого многочлена, который в конечном счете совпадает с многочленом, полученным по формуле Ла- гранжа. Запишем искомый многочлен в виде F (х) = aQ + (х - х0) + а2 (х - х0) (х - xj + + а3 (х - х0) (х — xj (х — х2) + ... ... +«п(х-х0)(х-х1)... (x-xrt-i). (1.16) Для определения коэффициентов я0, ..., ап положим в (1.16) х=х0. Тогда yo = F(xo) — а^ Далее, полагая х=хь получаем y{ = F(x{) = 0o + 0i(xi —х0), или, так как Xi— Xo=h, У\—Уъ+а\к> откуда „ _ У1 " Уо _ А'/о а'—h т- Продолжая вычисление коэффициентов, положим х=х2. Тогда у2 = F(x2) =0o + 0i(x2 — х0) + я2(х2 —х0) (х2 —Xi). Заменим найденные коэффициенты 0О, их значениями У2~ Уо~^—• 2h + а2 * 2h * h*t тогда у 2 — 2 А у о — у о = у 2 — 2у! 4- yQ = 2a2h2.
§ 16] ИНТЕРПОЛЯЦИОННЫЕ ФОРМУЛЫ НЬЮТОНА , Ц9 Воспользовавшись формулой (2.15), выражающей раз- ности через значения функции, получим а 2 21 Л2 ‘ Точно так же получим аз 31 й3 ’ Аналогичные дальнейшие вычисления позволяют запи- сать общую формулу для отыскания коэффициентов Подставив найденные выражения коэффициентов в формулу (1.16), находим F (*) = Уо + (* “ хо) + (х ~ *о) (х ~ + ... . • • + (х ~ ХО) (х - х,)... (х - xn-i). (2.16) Полученную формулу и называют первой интерполяцион- ной формулой Ньютона. Теперь ясно видно различие между формулами Нью- тона и Лагранжа. В формуле Лагранжа (4.13) каждое из слагаемых представляет многочлен n-й степени и все эти слагаемые равноправны. Поэтому мы не можем за- ранее (т. е. до производства вычислений) пренебрегать какими-либо из них. В формулу же Ньютона входят в качестве слагаемых многочлены повышающихся степеней, причем коэффициентами при них служат последовательные конечные разности, деленные на фак- ториалы. Как мы уже видели в § 15, последовательные разности обычно довольно быстро уменьшаются. Мы по- лучаем поэтому возможность не учитывать в формуле Ньютона тех слагаемых, коэффициенты при которых становятся пренебрежимо малыми ’). Благодаря этому можно вычислять промежуточные значения функции !) Вопрос о точности получаемых таким образом приближе- ний б\дет рассмотрен в § 19.
120 ИНТЕРПОЛИРОВАНИЕ [ГЛ. 1Г достаточно точно, пользуясь простыми интерполяцион- ными формулами. Для практического пользования формулу Ньютона (2.16) обычно записывают в несколько преобразованном виде. Чтобы получить его, введем обозначение х-х0 . .. —— = t или х = х0 + th. Множители, входящие в формулу (2.16), выразятся че- рез t следующим образом: X ~ Х[ X — Xq ~ h . . ~ ~ h ~ 1 ~ ’ х — х2 _ х — — 2h , о h “ h ’ x-xtl{ _ x-xQ-(n-\)h । h h ' ’ Подставив эти выражения в формулу (2.16), приве- дем ее к виду F (%о + th) = z/o + у Az/o -(—g— A2z/0 + + ... + ,<,-1) „,|,~'| + ')лЧ.(3.1б) Это и есть окончательный вид первой интерполяционной формулы Ньютона. По причинам, которые будут указаны ниже, ее называют также итерполяционной формулой Ньютона для интерполирования вперед. Если в формуле (3.16) положить t равным целому числу k(k^.ri), то правая часть формулы будет содер- жать &-Н слагаемых, причем последнее из них будет 1 )...(& — £ 4-1) k k k] Уо — Уо- Коэффициенты при всех последующих слагаемых бу- дут содержать множитель (k — k) и, следовательно, об- ратятся в нуль. Формула для F(xQ+kh) примет тогда в точности тот же вид, что и формула (3.15), выражаю- щая z/fe через z/o и последовательные разности. Следова- тельно, F(xQ + kh) = yh.
ИНТЕРПОЛЯЦИОННЫЕ ФОРМУЛЫ НЬЮТОНА 121 § 16] Впрочем, последнее равенство ясно и из хода вывода формулы (3.16). Если же t не равно целому числу, а этот случай и является наиболее интересным, то формула (3.16) дает значения функции F(x) для значений аргумента, отсут- ствующих в исходной таблице, т. е. для значений х, не совпадающих ни с одним из Хь, (6 = 0, 1, л). Формулу (3.16), как и формулу (3.15), можно запи- сать в символической форме F (х0 + th) = (1 + А) fz/o> (410) где скобку (1+Д)* нужно разложить в биномиальный ряд, оборвать его на члене, содержащем Дп, и каждое произведение Дг на yQ заменить разностью Дг£/0- Формулой (3.16) следует пользоваться при вычисле- нии значений функции f(x) для значений аргумента, ле- жащих между х0 и Xi, т. е. для t < 1. Переходя к интервалу xi<x<x2, нецелесообразно брать ту же формулу, так как t будет больше единицы. В этом случае удобнее принимать за х0 следующий узел интерполяции. Приведем теперь пример применения интерполяцион- ной формулы Ньютона. Пример 1.16. По данной таблице значений семи- значных логарифмов для чисел от 1000 с шагом 10 (табл. 1.16) вычислить значения логарифмов всех целых чисел от 1000 до 1010. Таблица 1.16 X У &У А3// 1000 3,0000000 43 214 —423 8 1010 3,0043214 42 788 -418 9 1020 3,0086002 42 370 -409 8 1030 3,0128372 41 961 -401 1040 3,0170333 41 560 1050 3,0211893
122 ИНТЕРПОЛИРОВАНИЕ [ГЛ. 1Г Составленная таблица разностей, записанная как го* ризонтальная, показывает, что третьи разности функции можно считать практически постоянными. Полагаем х0 = = 1000, #о = 3,0000000, Д#о = 0,0043214, Д2#0 = —0,0000426, Д3#о=0,0000008. Остается определить значение t. Так как здесь //г=10, то для *1 = 1001 имеем /1 = 0,1, для х2 = = 1002 будет /2 = 0,2 и т. д. Для определения искомых значений у при выбранных t yw&RQ расположить тре- буемые вычисления в таблицу (табл. 2.16). При этом промежуточные вычисления проводятся с одним запас- ным знаком. Таблица 2.16 (1) (2) (3) (4) (5) (6) t X fAt/o t 0-1)Л2 2 Ауо д’,, о £/ = !/о + (3) + (4) + (5) о, 1000 0 0 0 3,0000000 0,1 1001 43 214 192 2 3,0004341 0,2 1002 86 428 341 4 3,0008677 0,3 1003 129 642 447 5 3,0013009 0,4 1004 172 856 511 5 3,0017337 0,5 1005 216 070 532 5 3,0021661 0,6 1006 259 284 511 5 3,0025980 0,7 1007 302 498 447 4 3,0030295 0,8 1008 345 712 341 2 3,0034605 0,9 1009 388 926 192 1 3,0038912 1,0 1010 432 140 0 0 3,0043214 Проверив полученные значения по семизначной таб- лице логарифмов, убедимся, что полученные значения верны до последнего знака. Для составления таблицы значений в интервале 1010<х<1020 полагаем хо=1О1О. Тогда #0 = 3,0043214, Д#о=0,0042788, Д2#о = —0,0000418, Д3#0 = 0,0000009; далее поступаем, как и раньше. Как видно из рассмотренного примера, в интерполя- ционной формуле (3.16) используются разности, стоя- щие в одной горизонтальной строке таблицы горизон-
ИНТЕРПОЛЯЦИОННЫЕ ФОРМУЛЫ НЬЮТОНА 123 § 16] тальных разностей. Если использовать таблицу диаго- нальных разностей, то в (3.16) входят разности, идущие по диагонали вниз. Поэтому применение этой формулы удобно в начале таблицы, где имеется достаточное число разностей. Наоборот, она оказывается непригодной в конце таб- лицы, где этих разностей слишком мало. Скажем, в том же примере для х=1030 имеются только первая и вто- рая разности, а для х=1040 — только первая. Таким образом, первая интерполяционная формула Ньютона наиболее удобна для отыскания значений функ- ции, соответствующих большим, нежели начальные, зна- чениям аргумента, чем и объясняется приведенное выше ее другое название — интерполяционная формула для ин- терполирования вперед. Для интерполирования в конце таблицы применяется иная формула, которую мы сейчас и рассмотрим. Напишем искомый интерполяционный многочлен в форме F (х) = а0 + fli (х - х„) + а2 (х - х„) (х - х„_!) + ... ... +а„(х-х„)(х-х„_1)... (x-xi). (5.16) Как и выше, коэффициенты а0, ..., ап опреде- ляются из условия yi~f(хг) =F(xi). Положим в (5.16) X == хп. Тогда ^0 — Уп‘ Точно так же, полагая x=xn_i, имеем Уп—1 ~Уп 4~ (хп—1 хп), а так как хп_\—хп =—h, то л Уп~~Уп-\ кУп-1 al- h Далее, полагая в (5.16) х=хп-2 и заменяя найденные ко- эффициенты а0, их значениями, получаем __ Уп ~ ^Уп~\ + Уп-2_Ь?Уп-2 а2~ ~ 2U2 •
124 ИНТЕРПОЛИРОВАНИЕ [ГЛ. И Продолжая аналогичные вычисления, получим общую формулу для коэффициентов = (^=1, 2, .... п). k\hR После подстановки в (5.16) полученных значений коэф- фициентов формула примет вид Р (х) = Уч + (х - х„) + -^^-(х - х„)(х - Хп-1)+ . . . ••• +-^р-(х-Хп)(х-х„_|)...(х-Х1). (6.16) Это и есть вторая интерполяционная формула Нью- тона. Для применения, однако, ее предварительно преоб- разуют, как и первую. Введем обозначение *= t или х = хп + th. Выразим теперь через t множители в формуле (6.16): x-xn-i x-(xn-h) , . —h-----=------~h-----=/ + 1, х-хп-г _ x-(xn-2h) 0 h ~ h =‘+2> x-х, = x —(xn —(n —\) h) = * _ j h h. Произведя такую замену, получим окончательно Р (х) = Р (х„ + th) = уп + t \уп-\ + < (-2у-)-А2ув-2 + ... ... + + Д^о. (7.16) Формулу (7.16) называют второй интерполяционной формулой Ньютона или интерполяционной формулой Ньютона для интерполирования назад. Приведем при- мер использования формулы (7.16) для интерполяции. Пример 2.16. По таблице, данной в примере 1.16 (табл. 1.16), найти значения логарифма для х = 1044. Примем х„ = 1050, уп=3,0211893, Az/n_] = 0,0041560, Д2^,.-2 =-0,0000401, A3z/n_3=0,0000008. Для х=1044 по-
§ 17] ЭКСТРАПОЛЯЦИЯ. ОБРАТНАЯ ИНТЕРПОЛЯЦИЯ 125 лучаем отрицательное значение / = —0,6. По формуле (7.16) F (1044) = 3,0211893 + (-0,6) • 0,0041560 + + -(-Т_01Ш.-9-.6 + 0 (_ 0,0000401) + + + . 0,0000008. Произведя вычисления, получим F{ 1044) = 3,0187005. Проверка по семизначным таблицам логарифмов пока- зывает, что все семь знаков верные. § 17. Применение интерполяционных формул для экстраполяции. Обратная интерполяция I. Экстраполяция. Выше были приведены при- меры применения интерполяционных формул для отыска- ния значений функции, соответствующих промежуточным значениям аргумента, отсутствующим в таблице. Эти же формулы могут быть использованы и для отыскания значений функции, соответствующих значе- ниям аргумента, находящимся вне пределов таблицы, т. е. для экстраполяции. Применение интерполяционных формул для экстрапо- ляции ничем не отличается от рассмотренного в преды- дущих примерах. Единственным различием является то, что при интерполировании по первой формуле Ньютона значение / оказывается положительным, а при экстра- полировании— отрицательным. Для второй формулы Ньютона, наоборот, при интерполировании значение t отрицательно, а при экстраполяции — положительно. Таким образом, первая интерполяционная формула Ньютона применяется для интерполирования вперед и экстраполирования назад, а вторая — для интерполиро- вания назад и экстраполирования вперед. Отметим, что экстраполяция, вообще говоря, дает большие ошибки, нежели интерполяция, и пределы ее применения ограничены. Пример 1.17. Дана таблица значений функции i/=.sinx с шагом 5° с точностью до шести знаков в
126 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II пределах от 15° до 55° (табл. 1.17). Вычислить значения sinx для углов от 10° до 15° через Г. Таблица 1.17 X у = sin х Д2// Д3£/ А4 г/ 15° 0,258819 83 201 20 0,342020 80 598 -2 603 -613 25 0,422618 77 382 -3216 -590 23 30 0,500000 73 576 -3 806 -558 32 35 0,573576 69 212 -4 364 -529 29 40 0,642788 64 319 -4 893 -489 40 45 0,707107 58 937 -5 382 -447 42 50 0,766044 53 108 -5 829 55 0,819152 Разности мы записали в диагональную таблицу, огра* ничиваясь четвертыми, хотя они и не очень малы. При* мем х0= 15, у0 = 0,258819, A yQ = 0,083201, A2 yQ = —0,002603, Д3у0 = —0,00613, Д4уо=0,000023. Результаты вычислений приведены в табл. 2.17, Вычисления велись в целых единицах шестого знака, причем во всех промежуточных выкладках сохранялся лишний знак, округляемый в окончательном результате. Сравнение с таблицей синусов показывает, что вычислен- ные значения синусов для углов 14°, 13° и 12° оказывают- ся точными до шести знаков. Для угла 11° получились ошибки на две, а для угла 10° — на три единицы шестого знака. Эти ошибки объясняются тем, что для больших по абсолютной величине значений t нельзя было уже пренебрегать разностями более высокого порядка. Экстраполяция по второй интерполяционной формуле Ньютона производится точно так же. Что касается фор- мулы Лагранжа, то для вычисления значения функции
$ 17] ЭКСТРАПОЛЯЦИЯ ОБРАТНАЯ ИНТЕРПОЛЯЦИЯ 127 Таблица 2.17 (I) (2) (3) (4) (5) (6) (0 X t <1 1 СЧ < сч 1 1 3» 1 CD < сТ 7 3» 1 сч ю ю + + II а. 14° 13 12 11 10 -0,2 -0,4 -0,6 -0,8 -1,0 — 16640,2 -33280,4 -49920,6 -66560,8 -83201,0 -312,4 -728,8 -1249,4 -1874,2 -2603,0 + 53,9 +137,3 + 255,0 + 411,9 + 613,0 + 1,7 + 4,4 + 8,6 + 14,7 + 23,0 0,241922 0,224952 0,207913 0,190811 0,173651 при любом х, т. е. и для интерполирования и для экстра- полирования, требуется только подставить в формулу (3.13) соответствующее значение аргумента. П. Обратная интерполяция. До сих пор мы рассматривали лишь задачи отыскания значений функ- ции, соответствующих данным значениям аргумента, от- сутствующим в таблице. Между тем нередко приходится сталкиваться и с задачами иного характера: по таблице функции отыскать значение аргумента х, которому соот- ветствует данное значение функции, отсутствующее в таблице. Так поставленную задачу называют задачей обратной интерполяции. Таблица 3.17 X 0,880 0,881 0,882 0,883 2,4109 2,4133 2,4157 2,4181 Задачу обратной интерполяции можно легко обра- тить, считая значения функции, наоборот, значения- ми аргумента. Однако так как разности функции не
128 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II постоянны, то обратная интерполяция приводит к необ- ходимости интерполировать в таблице, значения аргу- мента в которой не являются равноотстоящими. По этой причине для обратной интерполяции применяется обыч- но интерполяционная формула Лагранжа или интер- поляционная схема Эйткина. Пример 2.17. Функция y=f(x) задана таблицей (табл. 3.17). Определим, какому значению х соответ- ствует значение функции у = 2,4142. Чтобы не менять обозначений в интерполяционных формулах, поменяем местами х и у. Тогда придем к функции у = ф(х), значения которой заданы табл. 4.17 и для которой требуется найти ф (2,4142). При этом значе- ния х уже не будут равноотстоящими. Таблица 4.17 X 2,4109 2,4133 2,4157 2,4181 у = ф (х) 0,880 0,881 0,882 0,883 Пользуясь интерполяционной формулой Лагранжа (3.13), в которой следует положить х=2,4142, найдем _ (2,4142 — 2,4133) (2,4142 — 2,4157) (2,4142 — 2,4181) р , У (2,4109 — 2,4133) (2,4109 — 2,4157) (2,4109 — 2,4181) 0,660 + . (2,4142 — 2,4109) (2,4142 — 2,4157) (2,4142 — 2,4181) п оо. , (2,4133 — 2,4109) (2,4133 — 2,4157) (2,4133 — 2,4181) 0,661 + . (2,4142 — 2,4109) (2,4142 — 2,4133) (2,4142 — 2,4181) n (2,4157 — 2,4109) (2,4157 — 2,4133) (2,4157 — 2,4181) 0,662 . (2,4142-2,4109) (2,4142-2,4133) (2,4142-2,4157) л qqq + (2,4181 -2,4109) (2,4181 -2,4133) (2,4181 -2,4157) °,66<к Вычислив значения дробей, получим 0,0634766 • 0,880 + 0,6982422 • 0,881 +. '+0,4189453 • 0,882 — 0,0537109 • 0,883, откуда /7 = 0,88138. Таким образом, ф (2,4142) =0,88138, т. е. значение х, при котором функция f(x), заданная табл. 3.17, принимает значение 2,414Й, есть х = 0,88138.
§ 18] ЧИСЛЕННОЕ ДИФФЕРЕНЦИРОВАНИЕ 129 § 18. Численное дифференцирование Перейдем теперь к вопросу о численном дифферен- цировании. С таким дифференцированием мы нередко встречаемся на практике, когда нужно находить произ- водные, имея в своем распоряжении только таблич- ные значения функции (например, экспериментальные данные). Соображения, изложенные в § 12, подсказывают, как следует поступать в таком случае. Действительно, если интерполяционный многочлен на рассматриваемом участке с достаточной степенью точности совпадает с заданной функцией, а сама функция достаточно гладкая и плавно изменяется на рассматриваемом участке, то можно считать, что производная интерполяционного мно- гочлена также мало отличается от требуемой произ- водной. При этом следует предположить, что расстояние ме- жду узлами интерполяции достаточно мало, чтобы функ- ция не имела между ними большого числа экстремумов. В противном случае может оказаться (рис. 14), что раз- ность между значениями функции и интерполяционного многочлена мала, тогда как их производные не имеют между собой ничего общего. Если рассматриваемая функция плавно изменяется между узлами интерполяции, то для отыскания произ- водной функцию, заданную таблично, следует заменять интерполяционным многочленом. По этой причине применение интерполяционной фор- мулы Лагранжа для численного дифференцирования не требует никаких дополнительных пояснений. Для приме- нения формул Ньютона нужно сделать одно небольшое замечание. В интерполяционных формулах (3.16) и (7.16) роль независимой переменной играет переменная /, связанная с х соотношением х = х0 + th. Так как функция f(x) заменяется функцией F(x0 + Z/i), 9 Р. С. Гутер, Б. В. Овчинский
130 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II то правило дифференцирования сложной функции дает dF _ dF dx di — dx * dt ’ что можно переписать так: а так как = /г, то dt о-18» Итак, для отыскания производной от таблично задан- ной функции нужно продифференцировать по t ее ин- терполяционную формулу Ньютона и результат разде- лить на шаг таблицы. Приведем пример численного дифференцирования по формуле Ньютона. Для этого рассмотрим функцию, ана- литическое выражение которой известно, и, задавая ее таблицей, найдем значение производной с помощью ин* терполяционной формулы. Полученное значение произ- водной можно тогда сравнить с ее истинным 3Ha4eHHeMt найденным аналитическим путем.
§ 18] ЧИСЛЕННОЕ ДИФФЕРЕНЦИРОВАНИЕ 131 Пример 1.18. Пусть функция z/=f(x) задана четы- рехзначной таблицей с шагом Л = 0,1 (табл. 1.18). Вы- числить производную /'(1,06). Таблица 1.18 X у = f (х) Д«/ &у Д8«/ 0,6 1,8221 1917 0,7 2,0138 2117 200 24 0,8 2,2255 2341 224 22 0,9 2,4596 2587 246 26 1,0 2,7183 2859 272 28 1,1 3,0042 300 3159 1,2 3,3201 Так как требуется определить значение производной для х в конце таблицы, то применяем интерполяционную формулу Ньютона (7.16) для интерполирования назад. Полагаем хп = \,\, Уп^3,0042, Дуп-\ = 0,2859, Д2уп_2 = = 0,0272, \3уп-2 = 0,0026. Тогда F(1 + th) = 3,0042 + t • 0,2859 + 0,0272 + + /(/+ П(< + 2) 0>0026> Применяя формулу (1.18), получаем = -J- [о,2859 + 0,0272 + 0,002б]. Так как /г = 0,1 и / =—0,4, то /'(1,06) = 10 [0,2859 + ~°’422t-1- 0,0272 + 3-0,16-6-0,4 + 2 000261 = 2,8865. О J 9*
132 ИНТЕРПОЛИРОВАНИЕ [ГЛ. 1Г- Заданная функция есть функция у = ех, поэтому ис- тинное значение производной есть 2,8864, так что ошибка равна единице четвертого знака, т. е. может быть и ошибкой округления. Конечно, в других случаях ошибки при дифференци- ровании с помощью интерполяционной формулы Нью- тона могут оказаться большими. Для значений аргумента, имеющихся в таблице, оты- скание производных может быть выполнено еще проще. Их можно искать без интерполяционных многочленов, выражая производные непосредственно через конечные разности. Вывод нужных формул основан на сравнении пред- ставления функции через конечные разности и с по- мощью степенного ряда. Представление функции через конечные разности дается, например, формулой Нью- тона для интерполирования вперед У = Уо + т At/0 + \ .2 A2t/o + t.2.3—- Д3£/о + ••• < (2.18) Напишем представление той же функции по формуле Маклорена y = F(0 = F(0) + 4F(0) + 4/?"(0)+ (3.18) Расположим члены равенства (2.18) по возрастаю- щим степеням t: u-u \ f Г\17 Л2^0 I Л3^° ^У° I 1 I У — Уо + ~ \&у<д---2----1--3--------4--г • • * J + + ~\~2 [а2^0 ~ A4f/o ~ • • • ] + + 1-2-3 ~ ~2 ^4f/o • • • ] + 1-2-3-4 £ “ • • • 1 + • • •
§ 19] О ТОЧНОСТИ ИНТЕРПОЛЯЦИОННЫХ ФОРМУЛ 133 Сравнивая полученные выражения с равенством (3.18) при одинаковых степенях /, находим F(0) = At/о -уд2^о + 4 Д3^-Т Д^о + • • • > F" (0) = А2г/о - дзУо + 4 - .... ^(О) = Д3уо-4аЧ+ .... F>v(O) = A4//o-... Согласно формуле (1.18), имеем f' (х) = у' = у F' (/) и, аналогично, у" = F" (0, у’" = р- F'" (0 и г. д. Обо- значив производные функции y = f(x) при х — х0 соот- ветственно через у’о, у", .... получаем ^=т[Д//о~4л^о+тдч-4д^о+•••]> ^=Яд^о-дч+41д^- •••]> %"=рг[дч-4дч+ •••]> ^=4^0- •••]• (4.18) Это и есть интересующие нас формулы, уточняющие формулы (9.15) и (10.15). § 19. О точности интерполяционных формул Как было указано в § 12, задача параболического интерполиро- вания состоит в отыскании многочлена F(x) степени л, совпадающего с функцией f(x) в узлах интерполяции, т. е. удовлетворяющего ра- венствам F(Xi) = f(Xi) (i = 0, 1, 2, ..., п). Если заданная функция f(x) сама является многочленом n-й степени, то имеет место тожде- ственное совпадение F(x)=f(x). Но в общем случае в точках х, отличных от узлов интерполяции, разность f(x)—F(x) — R(x) от- лична от нуля. При замене функции f(x) ее интерполяционным мно- гочленом F(x} разность R(x) представляет погрешность, которую на-
134 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II зывают остаточным членом интерполяции. Таким образом, можно Записать f(x) = F(x) +Я(х). (1.19) Для оценки точности интерполяции необходимо найти выраже- ние для остаточного члена /?(х), что делается аналогично отысканию остаточного члена формулы Тейлора. Рассмотрим вспомогательную функцию Т (г) = f (г) - F (г) - *o)(z - х.). . (z - х„). R (х) (2.19) (x-xo)(!*-xi) ... (Х-Хп) вспомогательной переменной г, где х0, Xi, ..., хп — узлы интерполя- ции, а х — произвольное фиксированное число из интервала (х0, хп). Предположим, что функция f(x) непрерывна и имеет непрерывные производные до порядка п + 1 включительно. Тогда то же самое можно сказать и о функции Г (г). Кроме того, из выражения для функции Т (г) вытекает, что она обращается в нуль в п + 2 точках интервала, а именно при z — хо, хь ..., хп, а также при г = х, как это следует из (1.19). Применив для каждого из п + 1 частичных ин- тервалов теорему Ролля, убедимся, что производная T'(z) обратится в нуль в интервале (х0, хп) по крайней мере п -Ь 1 раз. Применяя аналогичным образом теорему Ролля к T'(z)t T"(z), придем к заключению, что производная Лп+1)(г) обращается в нуль по край- ней мере в одной точке z = g. Вычислим теперь производную T<n+l>(z); для этого продиффе- ренцируем функцию (2.19) п + 1 раз. При этом нужно иметь в виду, что F(z) —многочлен n-й степени, так что его (п + 1)-я производная равна нулю. Кроме того, dn+l dgK + l *о) (^ *1) • • • (^ ^л)] ~ (^ 4” 1)1» ибо выражение в квадратной скобке представляет многочлен степени п + 1 со старшим членом zn+l. Таким образом, ') (2) = f"+1) (2) _ -- (”+Q! ----------- R (х). (x-x0)(x-xt) ..,{х-хп) Полагая здесь z = g, найдем /("+ " (D - (х-хЛ R (Х) = °’ ^Х Xq) ^Х Х[) . . • (X Хп) откуда Hrc+D/t) Я м = (х ~ Хо} {х ~ Х1) ’ • •(х ~ хД (ЗЛ9) где g— некоторая промежуточная точка интервала (хо, хп). Выражение для остаточного члена (3.19) можно преобразовать введением новой переменной t. Положим x-xQ h *
§ 19] О ТОЧНОСТИ ИНТЕРПОЛЯЦИОННЫХ ФОРМУЛ 135 тогда X ~ Xq = th, х — Xi = X — Xq — h = (t — 1) h, x ~ x2 = x — Xq — 2h = (t — 2) h, x — Xn = X — x0 — nil == (t — n) h. Воспользовавшись этими обозначениями, получаем #(*) = (H1)|A" '(<~1) •" или, иначе, Я(х) = /(п+1) (g)ft"+1(4i), где символ означает биномиальный коэффициент / t ч /(/-!)... (t-n) U+i; (п+i)! В большинстве случаев в выражении остаточного члена явно указывается также степень рассматриваемого интерполяционного многочлена, так что его пишут обычно с индексом п. Поэтому окон- чательное выражение для остаточного члена будет «n« = (n+i)/(n+l)(i)/!n+1’ (4.19) Если бы аналитическое выражение для функции f(x) было из- вестно и мы сумели бы оценить наибольшее значение ее (n + 1)-й производной на рассматриваемом участке |f<n+1)(x)| <М, то мы нашли бы оценку для остаточного члена Rn(x): |/?и(х)| (5.19) Этим самым и определялась бы точность приближения функции ее интерполяционным многочленом. Указанная форма оценки остаточ- ного члена очень похожа на оценку остаточного члена формулы Тей- лора. Если для функции f(x) аналитическое выражение не задано или если очень затруднительно найти и оценить /(п+1)(х), то мы не мо- жем оценить остаток Rn(x). Представление о его величине можно получить в этом случае, воспользовавшись приближенным равен- ством [см. (10.15)]: Так как обычно интерполяционную формулу мы обрываем на членах, содержащих разности, которые практически постоянны, то можно
136 ИНТЕРПОЛИРОВАНИЕ [ГЛ. II считать, что w <61” где п + 1 — порядок постоянных разностей. Применим формулу (6.19) к очень важному частному случаю. Именно, оценим ошибку линейной интерполяции таблицы с постоян- ным шагом в предположении, что вторые разности практически по- стоянны. В этом случае надо положить п = I, и мы будем иметь Я1(х)«-^2Г^Д2г/о. Так как при интерполяции 0 < t < I и при этих значениях t имеет место неравенство \t(t — 1)1 74» то I Ri WK-1^-. Таким образом, абсолютная ошибка линейной интерполяции по таб- лице с постоянным шагом и практически постоянными вторыми раз- ностями не превосходит 7в абсо- лютной величины второй разности. Пример 1.19. Оценим ошиб- ку интерполирования при отыска- нии 1g 1001 в примере 1.16. По формуле (4.19) имеем /?з(х) = Л4/(f — 1) (/— 2) (/— 3) (gb Так как f (х)« lg10x, то fw (х) = = поэтому I/,v (&) I < ТоЗо^ Далее, h = 10 и t = 0,1, так что окончательно Яз(1001)~ ~ 0,1 - 0,9 ♦ 1,9 *2,9» 104 lg10e 1 - 2 - 3 - 4 - (1000)4 « 10~10. Таким образом, интерполирование с учетом третьих разностей, т. е. с применением интерполяционного многочлена третьей степени, не вносит погрешностей до десятого знака.
§ 19] О ТОЧНОСТИ ИНТЕРПОЛЯЦИОННЫХ ФОРМУЛ 137 Для вычислений с большой степенью точности формулы Нью- тона могут оказаться недостаточными. Формулы с центральными раз- ностями, которые мы не рассматриваем, дают более точные резуль- таты, так как содержат разности, более близкие к исследуемым зна- чениям аргумента. Может показаться, что последнее утверждение противоречит единственности интерполяционного многочлена, что было высказано в § 13. Действительно, несмотря на то, что рассматриваемые интер- поляционные формулы содержат различные разности, они дают один и тот же многочлен и имеют в точности одинаковые выражения оста- точного члена (3.19). Однако если мы рассмотрим выражение (3.19), скажем, при п = 4 и пренебрежем изменением производной fIV(g), то величина остаточ- ного члена определится произведением (х — хо) (х — Xi) (х — х2) (х — х3) (х — х4). (7 19) График выражения (7.19) для случая хо = 0, Xi = 1, ..., х4 == 4 пред- ставлен на рис. 15. Как видно по графику, максимальная величина произведения, т. е. максимальная погрешность, в интервале х1 < х < < х3 меньше, чем в интервалах х0 < х < Xi и х3 < х < х4. Вместе с тем на практике первая интерполяционная формула Ньютона обычно применяется именно на участке Хо < х < Xi, вто- рая — на участке х3 < х < х4, тогда как формулы центральных раз- ностей — на участке Xi < х < х3. Именно этим обстоятельством и объясняется тот факт, что погрешности формул с центральными раз- ностями ниже, чем погрешности формул Ньютона.
ГЛАВА III ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ § 20. Интегрирование с помощью рядов Вычисление интегралов с помощью рядов известно из соответствующего раздела курса математического анализа. Поэтому мы ограничимся рассмотрением неко- торых примеров, особо обратив внимание на вычисли* тельную сторону дела. Пример 1.20. Найдем разложение в степенной ряд неопределенного интеграла J e~u7du. о Так как е"и2=1-тг+1г-^+ ••• то J e-^du — о уЗ у5 у-7 = Х~ 3- 5-2! “ 7-3! (2ге+ 1)п! + ‘ ' * Полученный ряд сходится на всей прямой. Пример 2.20. Вычислим с точностью до 0,0001 ин* 1 теграл J e~x2dx. о
§ 20} ИНТЕГРИРОВАНИЕ С ПОМОЩЬЮ РЯДОВ 139 Подставив значение х=1 в полученный выше ряд, имеем 1 Ц = | e~xidx = о __________L + J______L -_! L__l 3’10 42 ‘ 216 1320 9360 75600 ' ’ ’ * Найденный числовой ряд является знакочередующимся и быстро сходится. В силу теоремы Лейбница абсолютная величина ошибки, получающейся при замене суммы такого ряда его частичной суммой, не превосходит абсолютной ве- личины первого из отброшенных членов. Поэтому можно ограничиться семью членами ряда, ибо восьмой член 75600 <О’ООСИ- Подсчитав сумму этих семи членов, мы получим /1 = = 0,7468; при этом промежуточные вычисления следует вести с одним лишним знаком. Пример 3.20.Найти разложение в степенной ряд X о . f sin и 1 интегрального синуса Six= du и вычислить зна- о чение Si 2. Зная разложение sin и, можно написать sirc _ 1 и2 । и* ц6 । I / 1 \п _______. и 1 3! + 5! 7! +•••+( н (2п + 1)! + ••• Отсюда о у7 у2Л-1- 1 _ х _1_ । (_ 1 у1 х________. 4- 7.7! Т ... 1-1. М (2n + 1) (2п 4 1)! ~ ’ Подставив сюда х = 2, найдем Si2 = 2_____*. _?!_______27 I 23 2“ I- 3-3! 5 • 5 ! 7-7! 9-9! 11-11! ' Так как полученный ряд, как и в примере 2.20, является знакочередующимся, то, отбрасывая последний из
140 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. III написанных членов, мы совершаем чем его абсолютная величина, т. е. 0,000005, так что можно ручаться за образом, находим Si 2= 1,60544. ошибку, меньшую не превосходящую пять знаков. Таким Пример 4.20. Вычислим arcsin0,2, разложив в ряд соответствующий интеграл. Известно, что 0,2 0,2 1 arcsin 0,2= f г dx_._= = [ (1 — х2) 2 dx. J У 1-х2 J о о Пользуясь формулой бинома Ньютона, находим arcsin 0,2 = 0,2 Г /- , 1 2 I 1-3 4 I 1-3-5 6 . 1 -3-5.7 о , \ , J (1 + 2Х + 2-4Х + 2-4-6Х + 2- 4<6- 8Х + • • о -П 94- 1 0,23 -4- 1 * 3 0)25 4- 1 • 3 * 5 0)27 4- 1 ’ 3 * 5 * 7 °’29 4- 2 2 '2.4 5 +2.4.6 7 + 2 • 4 - 6 • 8 9 + Подсчитаем сумму этого ряда, ограничившись, например, первыми тремя членами, и определим получающуюся при этом погрешность. Полученный ряд является знакопостоянным, и его сумму следует оценивать иначе, чем в предыдущих при- мерах. Погрешность равна сумме ряда „ ЬЗ.5 0,27 . 1 -3 - 5 - 7 0,2э . * 2-4-6 7 “t" 2-4-6-8 9 + ’ ’ ’ Отбрасывая во всех членах ряда первые множители, меньшие единицы, и принимая все знаменатели равными 7, мы увеличиваем все члены ряда. Поэтому ... = у (0,27 + 0,29 + ...) = = 7 1-0 22 = °-0000018> так что можно гарантировать пять знаков. Таким образом, получаем arcsin 0,2 = 0,20136.
§ 21] ФОРМУЛЫ ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ 141 § 21. Формулы численного интегрирования Формулы для приближенного вычисления определен- ных интегралов применяются довольно часто. Дело в том, что для большого числа элементарных функций первообразные ул^е не выражаются через элементарные функции; в результате этого нельзя вычислить опреде- ленный интеграл с помощью формулы Ньютона — Лейб- ница. Встречаются также и случаи, когда приходится прибегать к формулам приближенного интегрирования даже для таких интегралов, которые могут быть найдены в конечном виде, но такое выражение оказывается слиш- ком сложным. Особенно важны формулы численного интегрирова- ния при решении задач, содержащих функции, заданные таблично. Наиболее удобным способом получения различных формул приближенного интегрирования является при- менение рядов и интерполяционных формул. Ознако- мимся с применением последних. Пусть y~f(x)—функция, непрерывная в интервале ь [а, &], и требуется вычислить | f(x)dx. Разобьем интер- а вал [а, &] на п равных частей точками a=xo<xi<x2<... ..-<xn = b так, что Xi — Xi-\— —=/i (l^i^n), и пусть yi = f (Xi) (0 — значения функции f(x) в точках деления. Воспользуемся первой интерполяционной формулой Ньютона (3.16), в которой х = xQ + ht. Тогда dx = hdt, пределы интегрирования равны а = х0, b = xQ + nh, и мы получаем b x9+nh п J f(x)dx ~ | F (х0 + th)h dt = h | (г/0 +/Ду0 + а хй О
142 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. III В результате интегрирования будем иметь Xo + n/l Г 1 < Г , п2 а (п3 п2 \ Д2//0 । J у dx = h\пу0 + -у Ау0 + ----г)~21 + *0 + (т--п3+/г2)т+ •••]• (1-21) Из (1.21) можно получить целый ряд формул числен- ного интегрирования («формул квадратур»), придавая п различные значения, т. е. деля участок на различное число частей, и пользуясь интерполяционными много* членами различных степеней. Положим в формуле (1.21) п=1. В этом случае разности выше первого порядка пропадают, ибо мы имеем только две точки х0 и xQ + h. Тогда J у dx ~ h [уо + 4 = h (уо + У' ~2У'~) = h У° tlJl ’ х0 (2.21) Геометрически этот результат совершенно очевиден. Действительно, положив п = 1, мы заменяем функцию интерполяционным многочленом первой степени, т. е. за- меняем кривую хордой (рис. 16). При этом интеграл за* меняется площадью обычной прямолинейной трапеции. Очевидно, что формула будет точной, если f(x) —линей- ная функция. Разумеется, формула (2.21) слишком груба для боль* ших участков. Но для ее уточнения нет необходимости брать большое п и пользоваться при этом интерполя- ционным многочленом высокой степени. Более выгодным является другой путь: разбив интервал [я, Ь] на п частей, можно применять формулу (2.21) для каждого из этих участков в отдельности, т. е. рассматривать не один ин* терполяционный многочлен степени п на всем интервале [я, 6], а п интерполяционных многочленов первой степени, различных на каждом из отдельных участков. При этом кривая заменяется ломаной линией (рис. 17).
§ 21] ФОРМУЛЫ ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ 143 Применяя формулу (2.21) к участкам по* лучаем \ydx = h*^, Xi (3.21) J ydx = hу"-. хп-1 Сложив все формулы (3.21) с формулой (2.21), придем к общей формуле, дающей приближенное . выражение для интеграла: ь J ydx ~ л[-^^- + //1 + г/2+ ••• +Уй-1]- (4.21) Эта простая формула дает при достаточно малых h9 т. е. при большом числе п точек деления, довольно хорошие результаты. Формула (4.21) носит название формулы трапеций, что вполне объясняется ее геометрическим смыслом. Перейдем к выводу другой формулы, также весьма распространенной и употребительной. Положим в (1.21) п = 2, т. е. отбросим все разности выше второй.
144 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. Ш Тогда х0+2й J у dx = л [21/0 + 2Дг/о + (у - 2) у A2t/0] = хо = h [2r/o + 2z/i - 2у0 + у (у2 - 2yt + у0)] = = у (Уо + tyi 4- #2)« (5.21) Нетрудно выяснить геометрический смысл полученной формулы: в интервале интегрирования [х0, х0 + 2h] функ- ция у = f (х) заменяется обычной параболой второй сте- пени у = Ах2 + Вх + С, проходящей через точки кривой с абсциссами х0, х0 + h, х0 + 2h (рис. 18). Разумеется, формула (5.21) дает точный результат, если f(x) пред- ставляет собой многочлен второй степени. Однако, как будет показано ниже (см. § 27), эта формула дает точ- ное значение интеграла и тогда, когда f(x)— много- член третьей степени. Из формулы (5.21) можно, как и выше, получить формулу для приближенного вычисления интеграла по всему интервалу [а, Ь]. Цля. этого разобьем интервал [а, 6] на 2п частей и для каждой пары участков приме- ним формулу (5.21): х2 / ydx « у(#о + 4f/i + у2), хо Xi / ydx ~ у(^2 + 4уз + ^). Х1 (6.21) Х2П | у dx ~ у (у2п-2 + 4у2п-1 + У2п) • Х2П-2 Просуммировав все формулы (6.21), получаем ь J ydx ^[уо +У2п +4(У1 +Уз+ ... +У2п-]) + ° +2(г/2 + ^4+ ••• + У2п-2)\- (7.21)
§ 21] ФОРМУЛЫ ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ 145 Формула (7.21) называется формулой Симпсона или формулой парабол. Если вычисления производятся с помощью арифмо- метра или другой вычислительной машины, то фор- мулу Симпсона удобнее писать иначе, не группируя ординаты: ь \ ydx~ а у [f/О + + 2f/2 + ••• + 2f/2n-2 + ^У2п-\ + У2п]- (8.21) мы выберем интеграл, При одном и том же числе участков разбиения фор* мула Симпсона обычно дает более хорошие результаты, чем формула трапеций. Поэтому пользуются предпочтительно ею, хотя она и требует несколько большего количества вы- числений. Особенно целе- сообразно предпочесть формулу Симпсона фор- муле трапеций в тех слу- чаях, когда нет возмож- ности получить значения функции в большом чис- ле точек. Отложив вопрос отеч- ности формул численных квадратур до § 22, рас- смотрим пример приме- нения этих формул. При точное значение которого хорошо известно, чтобы легко оценить точность полученных результатов. этом 1 Г tfx Пример 1.21. Вычислим , 2 способом трапе' «/ 1 т Я О ций и парабол, разбив участок 0 4^%^ 1 на 10 частей. При этом Л = 0,1. Найдем значения функции (табл. 1.21). 10 I3- С. Гутер, Б. В. Овчинский
146 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. III Таблица 1.21 X X2 1 + X2 Г(х)_т+ X X2 1+х2 Цх}~ 1 + х» 0,0 0,00 1,00 1,0000000 0,6 0,36 1,36 0,7352941 0,1 0,01 1,01 0,9900990 0,7 0,49 1,49 0,6711409 0,2 0,04 1,04 0,9615385 0,8 0,64 1,64 0,6097561 0,3 0,09 1,09 0,9174312 0,9 0,81 1,81 0,5524862 0,4 0,5 0,16 0,25 1,16 1,25 0,8620690 0,8000000 1,0 1,00 2,00 0,5000000 По формуле трапеций имеем 1 Г dx _ А i Г 1,0000000 + 0,5000000 , J 1 + х2 ~ L 2 + о + 0,9900990 + ... 0,5524862] = 0,7849815. По формуле Симпсона — 1 [ « + [1,0000000 + 0,50000004- J 1 + X о о = 4(0,9900990 + 0,9174312+ ... +0,5524862) + + 2(0,9615385+ ... +0,6097561)] = 0,7853981. 1 гр Г dx , I 1 л Так как —— = arctg х п = -т-, то можно считать, о что, вычисляя этот интеграл, мы находим приближенное значение числа л/4. Так как истинное значение •—= 0,78539816, то отно- сительная погрешность при пользовании методом трапе- ций не превосходит 0,06%, а при пользовании методом парабол — практически отсутствует. § 22. О точности формул численного интегрирования Перейдем теперь к вопросу об оценке точности фор-» мул численного интегрирования. Прежде всего оценим точность формулы трапеций (4.21).
§ 22] О ТОЧНОСТИ ФОРМУЛ ЧИСЛЕННОГО интегрирования 147 Как было указано при выводе формулы (2.21), она получается заменой функции f(x) на интервале [х0, Xi] интерполяционным многочленом первой степени. Обо- значим его Fi(x). Согласно общей формуле (3.19) для остаточного чле- на интерполяционной формулы, запишем f(x) = FI(x) + -™-(x-x0)(x-x1). (1.22) Интегрируя равенство (1.22) на интервале [х0, xj и учитывая, что Fi(x)— линейная функция, получим Xi Xi J f(x)dx — h Уо^-'-- + у J f"(&(x-xQ)(x-Xi)dx. xo xo Таким образом, ошибка приближенного равенства (2.21) равна остаточному члену г = 4 J f" (I) (X - Хо) (X - X.) dx. (2.22) хо Произведение <р(х) = (х— х0) (х — Xi) сохраняет по* стоянный знак на участке (х0, xj. Предполагая вторую производную f"(x) непрерывной, применим к интегралу (2.22) обобщенную теорему о среднем для определенного интеграла, что дает г=4 f" a,) J (х - хо) (х - х,) dx = - f" а.). *о где gi лежит в интервале (х0, х}). Обобщенная теорема о среднем формулируется так: Если f(x) и <р(х) непрерывны на [а, 6] и <р(х) 0, то а b J f (х) ф (х) dx = f (g) J Ф (x) dx, где a < g < b. b a Для ее доказательства достаточно заметить, что если т и М— соответственно наименьшее и наибольшее значения функции f(x) 10*
148 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. III и ф (х) 0, то ь ь ь tn J ф (х) dx < J f (х) ф (х) dx < М Уф (х) dx. а а а b Деля все члены неравенства на у ф (х) dx, видим, что отношение а двух интегралов будет заключено между т и М, т. е. равно как раз некоторому промежуточному значению f(g). В случае ф(х)=1 полу- чаем обычную теорему о среднем. Ясно, что теорема верна и при ф(х) < 0. Итак, остаточный член равенства (2.21) имеет вид (3-22) Просуммировав такие выражения для всех участков (хг-1, Xi), получим выражение для общей ошибки R: п i=l Обозначим среднее арифметическое значений второй производной в отдельных точках через rjn: Z=1 Так как вторая производная f"(x) по условию непре- рывна, то т[п можно считать приближенно равным сред- нему значению второй производной в интервале [а, &]; запишем это так: Тогда п 3 №) = «/"«)• 1=1 m / b — а Так как h =------, то окончательно получим выражение для остаточного члена формулы трапеций (4.21) R = (4.22)
§22] О ТОЧНОСТИ ФОРМУЛ ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ 149 Выражение остаточного члена (4.22) показывает, что формула трапеций дает точное значение интеграла в тех случаях, когда f(x) линейна, ибо тогда f"(x)=0 и ГШ = о. Оценка точности формулы Симпсона (7.21) может быть получена тем же путем, однако это потребует зна- чительно более громоздких преобразований. Поэтому мы приведем другой вывод выражения остаточного члена, который, с одной стороны, не требует сложных вычисле- ний и, с другой стороны, дает возможность иллюстриро- вать. другие методы оценки точности. Рассмотрим функцию f(x), имеющую непрерывную производную четвертого порядка в интервале (% — Л, x + /z); обозначим через F(х) ее первообразную функ- цию. По формуле Ньютона — Лейбница x+h J f (х) dx = F (х + /г) — F (х — /г). x-h С другой стороны, формула (5.21) дает x+h f f(x)dx«|[f(x-/i) + f(x + A) + 4f(x)]. x-h Рассмотрим вспомогательную функцию qi(h) = F(x + h) — F(x — h) — -4[f(x + h) + f(x-h) + 4f(x)], (5.22) считая х фиксированным, a h переменным. Очевидно, что ф(0)=0. Найдем производные от функции (5.22) по Л, учитывая, что F'(х) = f (х): <р' (Л) = /(х + й) + /(х-Л) — - yrlf (х + h) + f (х - h) + 4f (х)]~ О ~i[f'(x + h)-j'(x-h)],
150 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. III ф" (ft) = f' (х + h) - f'(x - h) - 4 [/' (x + h) - f'(x - h)] - О -4[Г(% + Л) + Г(х-Л)1. ф'" (А) = f" (x + ft) + f" (x - ft) - [f" (x + ft) + f" (x - ft)] - О Положив в первой и второй производных h — 0, полу- чаем q/(0) = 0, q/'(0) = 0. Выражение для третьей производной после приведем ния подобных членов примет вид <р"'[}"' (х + А)- f'"(х- Л)]. По формуле Лагранжа имеем Ф'^ЛН-Ъ2^), х-А<|1<х + Л. О При фиксированном х промежуточная точка gi будет, разумеется, зависеть от величины h. Проинтегрируем те- перь это равенство по h на участке (0, h), учитывая, что ф"(0) = 0: h h J ф'" (ft) dh = ф" (Л) = - 4 Jft2/IV G,) dh. о 0 В интеграле в правой части величина fIV(£i) является некоторой функцией от /г, так как от него зависит аргу- мент Не останавливаясь на доказательстве того, что эта сложная функция непрерывно зависит от /г, приме- ним к интегралу обобщенную теорему о среднем (см- отр. 147): h h /А2Г (|t) dh = $h?dh = ^ f” (|2). 0 0
§22] О ТОЧНОСТИ ФОРМУЛ ЧИСЛЕННОГО ИНТЕГРИРОВАНИЯ 151 где ^2, так же как и есть некоторая промежуточная точка в интервале (0, /г), зависящая от h. Таким o6pa3OMf h Ф" (Л) = - 4 / л2/IV (Bl) dh = - fw fe). о Рассуждая аналогичным образом, находим Ф'(Л)=-4^Йз). ф(Л)=--^-Г(В). " где £з и £ — новые промежуточные точки из интервала (О,/г). Таким образом, ошибка формулы (5.21) выра- жается так: T(A)=-fIV(B)-^-- (6.22) Чтобы получить остаточный член формулы Симпсона (7.21) необходимо просуммировать равенства (6.22) по п парам участков. Повторяя рассуждения, приведенные на стр. 148, получим rv t b —а где ц— новая промежуточная точка. Так как п= то последнюю формулу можно записать так: <7-22’ Равенство (7.22) показывает, что формула парабол (7.21) для приближенного вычисления интеграла дает точное значение в том случае, когда f(x) есть многочлен третьей степени или ниже, ибо тогда flv (х) s= 0. Следует отметить, что практическое значение оценок (4.22) и (7.22) невелико ввиду сложности их использо- вания. Это особенно относится к формуле (7.22), содер- жащей четвертую производную. Поэтому при численном интегрировании прибегают к другим приемам. Так, важнейшим критерием применимости формулы Симпсона является постоянство вторых или третьих раз- ностей в таблице значений функции, составленной с ша- гом й, используемым в этой формуле. Действительно, это означает, что функция достаточно хорошо изображается
152 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. Ш многочленами второй или третьей степени, для которых формула Симпсона дает точное значение. Часто при оценке погрешности формулы трапеций или парабол пользуются следующим приемом: вычис- ляют интеграл по формуле парабол при делении отрезка на п частей (п четное) и 2п частей. Если получающиеся при этом значения обозначить соответственно через !п И /гл, то совпадение первых знаков 1п и /2/г позволяет судить о точности полученных значений. § 23. Квадратурные формулы типа Гаусса Рассмотренные в предыдущих параграфах квадратур, ные формулы трапеций и парабол являются частными случаями общей линейной квадратурной формулы, в ко- торой интеграл выражается линейной комбинацией орди- нат интегрируемой функции. Такая формула имеет вид Ь п (1.23) а 1 = 1 Абсциссы Xi точек, в которых вычисляются значения функции, называются узлами, а коэффициенты Wi— ве- сами квадратурной формулы (1.23). Сравнивая формулы (4.21) и (8.21) с формулой (1.23), замечаем, что узлы этих квадратурных формул расположены равномерно по отрезку интегрирования. Веса в формуле трапеций равны у, h, ..., h, а в . h 4h 2h 4h h формуле парабол равны у, -у , -у-, •••’ Т’ Т* Вы- вод этих формул сводился к подбору весов при задан- ных узлах, в предположении замены функции между узлами интерполяции линейной функцией или пара* болой. Другим хорошим примером линейной квадратурной формулы является формула Чебышева, в которой, на- оборот, выбираются наилучшие узлы при некоторых предположениях, сделанных относительно весов. Именно, в квадратурной формуле Чебышева предполагается, что все веса равны между собой, что облегчает вычисления.
§ 23] КВАДРАТУРНЫЕ ФОРМУЛЫ ТИПА ГАУССА 153 Прежде чем перейти к выводу квадратурной формулы Чебышева, заметим, что нет нужды рассматривать про- извольный участок интегрирования [а, 6], а можно огра- ничиться каким-либо стандартным, например, отрезком ъ [О, 1]. Действительно, если дан интеграл J f(x)dx, то а , х — а замена переменных = или, что то же самое, х = а + (6 — a)t, приводит его к интегралу по отрезку [О, Ц: ь 1 J f (х) dx = (b — a) j* f [а + (b — а) /] dt, а О так что остается вычислить лишь этот последний. Соб- ственно говоря, формула (1.23) приобретает при этом вид Ь п J f(x)dx^(b-a)^Wtf(Xl), (2.23) а / =«= 1 где узлы Xi вычисляются по формуле Xi = a+ (b — a) ti> (3.23) a ti — соответствующие узлы для участка [0, 1]. Итак, пусть функция f(x) задана на отрезке [0, 1]. Будем искать для интеграла квадратурную формулу вида 1 п п J f(x)dx ^^wtf (х,) = w У f (хг), (4.23) О /=1 ( = 1 с фиксированным числом узлов п, полагая Wi = w2 = ... ... = wn = w. Узлы для формулы (4.23) подбираются таким образом, чтобы эта формула представляла собой точное равенство для тех случаев, когда функция f(x) является многочленом степени не выше п. Найдем сначала значение веса w. Полагая f(x)ss I и требуя, чтобы равенство (4.23) было для этой функции точным, находим 1 = wn, откуда w = ±. (5.23)
154 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. III Пусть теперь f (х) = aQ + ахх + ...'+ tZn-ix71”1 + апхп> Формула (4.23) перепишется тогда так I п J (а0 + (ЦХ + ... + a„-tXn-‘ + апхп) dx^—^f (xj = О * = 1 п = ~П (а0 + a\Xi ••• ап-\Х1 1 + апХТ)' (6-23) / = 1 Равенство (6.23) должно быть справедливо при лю- бых а0, «1, ап. Поэтому коэффициенты при них в ле- вой и правой частях равенства должны совпадать ме- жду собой. Так как 1 J(a0 + «ix+ ... + а^х”-1 + anxn)dx = о — Гху у I г2 1 I ап-\ п I ап _ г«+111 __ -|а0х4- 2 х 4- ... 4- п х+п+{х jo- то, приравнивая друг другу соответствующие коэффи- циенты, получаем систему уравнений Х\ 4” Х2 + ... 4“ хп ~2 9 Xj 4- х* 4- ... 4- = у , (7.23) х? + х”+ ... + х% п п+ 1 • Левые части уравнений полученной системы являются симметричными функциями своих аргументов хьх2,... ..., хп. Пользуясь алгебраическими свойствами симме- тричных многочленов, можно привести эту систему к одному алгебраическому уравнению n-й степени, корни которого и являются узлами квадратурной формулы Чебышева. Мы не станем приводить соответствующих преобразо- ваний, ограничившись готовыми результатами. В табли-*
§ 231 КВАДРАТУРНЫЕ ФОРМУЛЫ ТИПА ГАУССА 155 це 1.23 приведены значения узлов квадратурной фор- мулы Чебышева для некоторых значений п. Доказано, Таблица 1.23 п k xk w 2 1 0,211325 0,5 2 0,788675 3 1 0,146447 0,333333 2 0,500000 3 0,853553 4 1 0,102673 0,25 2 0,406204 3 0,593796 4 0,897327 5 1 0,083751 0,2 2 0,312730 3 0,500000 4 0,687270 5 0,916249 6 1 0,066877 0,166667 2 0,288740 3 0,366682 4 0,633318 5 0,711260 6 0,933123 что для п = 8 построить квадратурную формулу Чебы* шева невозможно, так как корни соответствующего мно- гочлена оказываются мнимыми. При п = 9 узлы могут быть найдены. Для значений п > 9 до сих пор не изве- стно, существуют ли на отрезке [0,1] п действительных узлов квадратурной формулы Чебышева. Для произ- вольного отрезка [а, Ь\, как следует из (2.23) и (5.23)f
156 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. III квадратурная формула Чебышева с п узлами имеет вид Г п ^f(x)dX^^-^f[a + (b-a)Xt], (8.23) a i-1 где xj —узлы для отрезка [0, 1], взятые из табл. 1.23. Пример 1.23. Вычислим по формуле Чебышева ин- теграл . , рассмотренный в примере 1.21, приняв J I "г л о п = 5. По формуле (4.23) получаем 1 / (0,083751) + / (0,312730) + f (0,5) + о + /(0,687270) + /(0,916249)]. Вычисления приведены в табл. 2.23. Таблица 2.23 (1) (2) (3) (4) (5) (6) X О)2 (D + (2) (1): (3) W (4)-(5) 0,083751 0,312730 0,500000 0,687270 0,916249 0,701423 • 10 ~2 0,978001 • 10"1 0,250000 0,472340 0,839512 1,0070142 1,097800 1,2500000 1,472340 1,839512 2 0,9930347 0,9109127 0,8000000 0,0791910 0,5436224 3,9247608 0,2 0,78495 Выбирая свободно и веса, и узлы квадратурной фор- мулы, можно получить линейные квадратурные формулы, дающие при той же вычислительной работе много боль- шую точность, чем формулы трапеций и парабол или формула Чебышева. Такие формулы со свободными узлами и весами называются квадратурными формула- ми гауссова типа. Если считать формулу (1.23) квадратурой гауссова типа, то она имеет при п узлах 2п свободных параметров.
КВАДРАТУРНЫЕ ФОРМУЛЫ ТИПА ГАУССА 157 § 23] Их можно выбрать так, чтобы формула была возможно более точной. С точки зрения приближения функции ин- терполяционными многочленами (см. гл. II) точность формулы определяется степенью многочлена, для кото- рого эта формула является точным, а не приближенным равенством. Пользуясь 2/г свободными параметрами можно точно интегрировать многочлены до степени 2п—1 включи- тельно. Для этого достаточно потребовать, чтобы равен- ство (1.23) было точным на отрезке [0,1] для функций f(x)=l, х, х2,..., х2п~\ что приводит к системе урав- нений W[ + w2 + .. .. + КУП=1, WiXi + w2x2 + . . . + 1 . (9.23) ny1x2rt"1 + w2x2n~l + ... +шпх2гг“1 = ^’, I аналогичной системе (7.23). Эта система имеет 2п неиз- вестных xi,x2, ..., хп, wi, ш2, wn и, как легко ви- деть, содержит 2п уравнений. Квадратурная формула типа (1.23), узлы и веса в которой выбираются в соответствии с системой уравне- ний (9.23), называется формулой Гаусса. Можно дока- зать, что система (9.23) при любых п совместна и имеет единственные решения, причем узлы хь х2,..., хп всегда находятся на отрезке интегрирования [0, 1]. Узлы и веса квадратурной формулы Гаусса для нескольких первых значений п приведены ниже. Для применения этой фор- мулы на любом отрезке [а, Ь] ее следует записать в виде (2.23). Применение формулы Гаусса для численного инте- грирования позволяет получать результаты с большой точностью при вычислении значений функции в неболь- шом числе узлов и поэтому весьма выгодно. Однако здесь возникают затруднения с оценкой погрешности по- лучаемых результатов. Оценка производных высоких по- рядков (остаточный член формулы Гаусса содержит про- изводную f(2n)(£)), как уже было сказано в § 22, практи- чески недоступна. Для оценки погрешности приходится
158 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. III поэтому прибегать к другому приему, также упоминав- шемуся в § 22, — сравнению результатов, полученных при использовании различных квадратурных формул. Вместе с тем, если в формулах трапеций или парабол при меньшем (вдвое) числе узлов можно было исполь- зовать уже вычисленные значения функции, то для квад- ратурной формулы Гаусса при различных п все узлы оказываются различными. Поэтому сравнение требует вычисления значений функции в значительно боль- шем числе точек. Например, при сравнении интеграла, вычисленного по формулам Гаусса, с п и п + 1 узла- ми, требуется вычисление значений функции в 2n + 1 узлах. Можно поставить следующий вопрос. Пусть интеграл ъ J f(x)dx вычислен по формуле Гаусса с п узлами. Как а построить новую, возможно более точную квадратур- ную формулу с 2п + 1 узлами так, чтобы использовать уже имеющиеся п узлов и уже вычисленные значения функции f(x) в них, а добавить лишь п + 1 новых узлов. Решением этого вопроса является выведенная А. С. Кронродом квадратурная формула, которую мы будем называть уточняющей квадратурой Кронрода'). Она является точной для многочленов степени Зп + 1 для четных и Зп + 2 для нечетных п. В практике вычис- лений можно полагать, что погрешность уточняющей квадратуры Кронрода с 2п + 1 узлами имеет порядок одной сотой разности между результатами, полученными по этой формуле и по формуле Гаусса с п узлами. Роль уточняющих квадратур можно пояснить следую- щим образом. Пусть в нашем распоряжении имеется возможность вычислить значения интегрируемой функ- ции в 2п 4- 1 узлах, которые мы можем расставлять про- извольно. Если использовать их для построения формулы Гаусса с 2п + 1 узлами, то мы получим возможность точно интегрировать многочлены до степени 4/г + 1 вклю-> 9 А С Кронрод, Узлы и веса квадратурных формул, «Нау- ка», 1964 г.
§ 23] КВАДРАТУРНЫЕ ФОРМУЛЫ ТИПА ГАУССА 159 Таблица 3.23 п k X *1 *1 2 1 0,03708995 0,09898990 2 0,21132487 0,50000000 0,24545455 3 0,50000000 0,31111110 4 0,78867513 0,50000000 0,24545455 5 0,96291005 0,09898990 3 1 0,01975437 0,05232811 2 0,11270167 0,27777778 0,13424404 3 0,28287813 0,20069871 4 0,50000000 0,44444444 0,22545828 5 0,71712187 0,20069871 6 0,88729833 0,27777778 0,13424404 7 0,98024563 0,05232811 4 1 0,01171987 0,03148869 2 0,06943184 0,17392742 0,08502680 3 0,17985689 0,13339917 4 0,33000948 0,32607258 0,16347459 5 0,50000000 0,17322150 6 0,66999052 0,32607258 0,16347459 7 0,82014311 0,13339917 8 0,93056816 0,17392742 0,08502680 9 0,98828013 0,03148869 5 1 0,00795732 0,02129102 2 0,04691008 0,11846344 0,05761666 3 0,12291664 0,09340040 4 0,23076534 0,23931434 0,12052017 5 0,36018479 0,13642490 6 0,50000000 0,28444444 0,14149370 7 0,63981521 0,13642490 8 0,76923466 0,23931434 0,12052017 9 0,87708336 0,09340040 10 0,95308992 0,11846344 0,05761666 11 0,99204268 0,02129102
160 ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ [ГЛ. III чительно, но не будем в состоянии судить о возможных погрешностях результата. Для оценки погрешности тре- буется иметь две квадратурные формулы. Имеющиеся 2п + 1 узлов можно распределить между двумя квадра- турами различными способами. Можно рассматривать две квадратуры Гаусса с п и п + 1 узлами, что дает возможность точно интегрировать многочлены до сте- пени 2п+1. Если же пользоваться уточняющими квад- ратурами Кронрода, то гауссова квадратура с п узлами и уточняющая квадратура с 2п + 1 узлами, в число ко- торых входит и п предыдущих, дают возможность точно интегрировать многочлены уже до степени Зп + 1 или Зп + 2. Узлы и веса квадратурных формул Гаусса и уточняю- щих квадратур Кронрода приведены в табл. 3.23. При каждом п уточняющая квадратура имеет 2п + 1 узлов, из которых п являются узлами соответствующей гауссо- вой квадратуры. Поэтому все узлы объединены в одну Таблица 4.23 (1) (2) (3) (4) (О2 (1) + (2) (1) : (3) 0,03708995 0,21132487 0,13756644-10~2 0,44656987 -10~ 1,00137566 1,04465639 0,99862623 0,95725283 0,50000000 0,78867513 0,93291004 0,25 0,62200846 0,92719575 1,2500 1,62200846 1,92719575 0,80000000 0,61651969 0,51888865 (5) (6) .(7) (8) Ai (4)-(5) (4)-(7) 0,50000000 0,47862642 0,09898990 0,24545455 0,09885391 0,23496206 0,50000000 S 0,30825980 0,78689 0,31111110 0,24545455 0,09898990 S 0,24888888 0,15132754 0,05136474 0,78540
§ 23] КВАДРАТНЫЕ ФОРМУЛЫ ТИПА ГАУССА 161 dx Т+х* таблицу, и веса гауссовой квадратуры приводятся лишь против тех узлов, которые одновременно являются гаус- совыми узлами. Пример 2.23. Вычислим тот же интеграл о при п = 3, пользуясь формулой Гаусса и уточняющей квадратурой Кронрода. Результаты вычислений приведены в табл. 4.23. Срав- нение полученных двух результатов дает представление о величине погрешности. При этом нужно еще иметь в виду, что различие в трудоемкости вычислений значения функции в «круглых» и «некруглых» узлах, имеющее значение при ручных вычислениях, при работе на элек- тронных вычислительных машинах полностью исчезает.
ГЛАВА IV ПРИБЛИЖЕННОЕ ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ § 24. Общие замечания. Интегрирование с помощью рядов Методы решения дифференциальных уравнений пер* вого порядка, изучаемые в курсе высшей математики, основаны главным образом на сведении этих уравнений к уравнениям с разделяющимися переменными с после- дующим интегрированием. Про такие дифференциала ные уравнения говорят, что они решаются в квадратурах. Уравнение второго порядка обычно стараются привести к уравнению первого порядка1); если полученное урав- нение решается в квадратурах, то и решение исходного уравнения может быть записано при помощи интегралов. Если интегралы не выражаются в элементарных функциях, то их можно находить приближенно2), вос- пользовавшись методами, изложенными в гл. III. Одна- ко при изучении дифференциальных уравнений указыва- лось, что число типов уравнений, допускающих решение в квадратурах, невелико. Многообразие видов уравнений, встречающихся при решении физических и технических вопросов, привело к созданию большого числа методов их приближенного решения. Все эти методы в зависимости от формы, в ко- ‘) Исключение составляют линейные дифференциальные уравне- ния с постоянными коэффициентами, решение которых находится просто. 2) При этом решение дифференциального уравнения следует за- писывать с помощью определенных интегралов.
§ 24] ИНТЕГРИРОВАНИЕ С ПОМОЩЬЮ РЯДОВ ЩЗ торой они представляют решение, можно разделить на три большие группы. Как известно, в анализе обычно рассматриваются три основных способа задания функции: аналитическим выражением, графиком и с помощью таблицы. В соот- ветствии с этим приближенные методы интегрирования мы можем назвать аналитическими, если они дают нам аналитическое выражение приближенного решения. Ме- тоды приближенного построения интегральных кривых, т. е. графика решения дифференциального уравнения, мы назовем графическими. Наконец, к численным методам интегрирования уравнений мы отнесем такие, в резуль- тате применения которых мы получаем приближенное решение в форме таблицы. Обычно в курс дифференциальных уравнений входит знакомство с простейшими графическими методами ин- тегрирования: методом ломаных Эйлера и методом изо« клин. Поэтому здесь мы разберем только некоторые ана- литические и численные методы. Впрочем, предложенная нами классификация методов приближенного интегри- рования является в известной мере условной. Среди аналитических способов очень употребитель- ным является интегрирование дифференциальных урав- нений с помощью степенных рядов методом неопреде- ленных коэффициентов. Метод неопределенных коэффи- циентов наиболее удобен для интегрирования линейных дифференциальных уравнений с переменными коэффи- циентами, которые, вообще говоря, не сводятся к ква- дратурам. Рассмотрим для определенности линейное уравнение второго порядка у” + Pl W у' + Р2 (X) у = q (х) (1.24) с начальными условиями, заданными в точке х ~ = 0: у|ж=о = уо и /|х=о = /о- Если функции Pi(x), Ръ(х) ' n q(x) непрерывны в окрестности точки х = 0, то, соглас- но общей теореме существования решения дифференци- ального уравнения существует единственное решение уравнения (1.24), удовлетворяющее заданным началь- ным условиям. Мы предположим, что коэффициенты уравнения не только непрерывны, но и могут быть 11*
164 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV разложены в ряды /^аклорена: оо оо оо Pl (х) = 2 а„хп, р2 (х) = 2 ьпхп, <? (х) = 2 qnxn. п—0 п=0 п=0 При этом предположении1) будем искать решение за- данного уравнения в виде степенного ряда оо У = 2 Спхп п=0 (2.24) с неопределенными ряд (2.24), получим коэффициентами. Дифференцируя оо /= 2 пспхп-', 1 оо у" = 1)с„хп"2. п=2 Подставив эти выражения для функции у и ее произ-» водных в уравнение (1.24) и заменяя в нем pi(x) и р2(^) их разложениями, получим 2 п (п — 1) crtxrt"2 + 2 S апхп + П=2 п-1 п=0 оо оо + 2 Спхп 2 ьпхп = q(x). (3.24) п=0 п=(Г Произведя перемножение и сложение рядов в левой части равенства (3.24), мы придем к степенному ряду, который сходится к функции q(x). В силу теоремы един- ственности коэффициенты данного ряда должны рав- няться коэффициентам разложения функции q(x). По- следнее обстоятельство и используется для отыскания неопределенных коэффициентов. Заметим еще, что если уравнение (1.24) однородное, т. е. д(х)н=0, то сумма ряда в левой части равенства (3.24) тождественно равна нулю, и следовательно, все его коэффициенты должны обратиться в нуль. Выпишем теперь коэффициенты при различных сте- пенях х в левой части равенства (3.24). Приравнивая 9 Если pi(x), рг(х) и q(x)—многочлены, то написанные ряды конечны.
§ 24] ИНТЕГРИРОВАНИЕ С ПОМОЩЬЮ РЯДОВ 165 их соответствующим коэффициентам qn, получим си- стему уравнений х° X1 X2 4 2с2 4* + Го^о — *7о> 3 • 2с3 + 2с2а0 + сщх + cxb$ + c0&i в Яъ Зс4 + Зс3я0 + 2с2Я1 + £1^2 + + Г2&о 4" С\Ь\ 4- Со^2 = ^2» хп (п + 2)(/г + 1) сл+2 + Q(crt+1, сп, с1? с0) = Яп, (4.24) где Q(crt+b сп,..., сь Со) означает линейную функцию аргументов Со, гь . • •, Сп, Cn+ь Слева от каждого уравне- ния из (4.24) указана степень х, коэффициент при кото- рой выписан. Как видно из системы (4.24), каждое ее последующее уравнение содержит один лишний неизвестный коэффи- циент по сравнению с предыдущим. Поэтому все коэффи- циенты Ci могут быть последовательно выражены через с0 и Сь Коэффициенты Cq и сх определяются при помощи на- чальных условий'. Со — У\х=с — У о, С\ — у' | х=о = у'о- После того как все коэффициенты сп найдены, подставим их в (2.24) и образуем таким образом степенной ряд. Естественно возникает вопрос: будет ли ряд, коэффи- циенты которого получаются из системы (4.24), сходя- щимися и дает ли он решение нашего уравнения? Отве- том на этот вопрос является теорема, которую мы при- ведем без доказательства. Теорема. Если ряды оо оо оо pi(x) = 5 апхп, р2(х) = 2 Ьпхп и q(x)= 2 qnxn n=Q n=Q ц=0 сходятся при jXj < R, то построенный степенной ряд схо- дится в той же области и служит решением уравне- ния (1.24).
166 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV Хотя мы с самого начала отыскивали частное ре- шение уравнения (1.24), приведенный метод дает воз- можность находить и его общее решение. Для этого нужно только считать Cq и С[ произвольными постоян- ными. Тогда все остальные коэффициенты, а следова- тельно, и решение будут зависеть от двух произвольных постоянных. Таким образом, вообще говоря, получается разложение общего решения в окрестности точки х = 0. Следует заметить, что выражение для общего члена ряда (2.24), т. е. общее выражение для коэффициента сп, удается найти лишь в редких случаях. Поэтому на практике обычно ограничиваются оты- сканием нескольких первых коэффициентов разложения (2.24), получая таким образом приближенное ре- шение. Здесь естественно возникают вопросы о точ- ности этого приближения; некоторые соображения по этому поводу будут приведены далее. Строго говоря, применение метода неопределенных коэффициентов не обязательно ограничивается линей- ными уравнениями, но использование его при решении нелинейных уравнений может привести к громоздким выкладкам и сложной системе уравнений для отыскания неопределенных коэффициентов. В этом случае будет удобнее метод последовательного дифференцирования, описанный в § 25. Описанный аналитический метод интегрирования дифференциального уравнения второго порядка приме- ним, разумеется, и к уравнениям любого порядка k. При этом все коэффициенты сп, начиная с ck, будут выра- жаться через cQ, ci, с2, ..., Q-i, которые определяются с помощью начальных условий: Г Уо Уо СО~Уо* С\~Уо' С2~ 2! ’ •••’ C^-l~ (fe-l)l* Если начальные условия уравнения (1.24) заданы в точке х = хо и в окрестности этой же точки функции Pi(x), Рг(*) и q(x) могут быть разложены в ряды Тей- лора по степеням разности (х— х0), то решение следует оо искать в виде ряда 2 сп(х — ха)п. Процесс отыскания п=0 коэффициентов ничем не отличается от описанного выше.
§ 24] ИНТЕГРИРОВАНИЕ С ПОМОЩЬЮ РЯДОВ 167 Пример 1.24. Проинтегрируем с помощью степен- ного ряда уравнение у" — ху=0. Положим у — с0 + ctx + с2х2 + с3х3 + с4х4 + с5х5 + ... + спхп + ... Тогда у' = Ci + 2с2х + Зс3х2 + 4с4х3 + 5с5х4 + ... +пспхп~1+ .... у" = 2 • 1 с2 + 3 • 2с3х + 4 • Зс4х2 + 5 • 4с5х3 + ... ... +п(п — 1)спхп~2 + ... Подставляя ряды для у и у" в исходное уравнение и группируя члены ряда по степеням х, получим 2-1 с2 + (3-2с3 —с0)х+ (4-Зс4 —Ci)x2 + + (5-4с5 —с2)х3+ (б-5с6 — с3)х*+ 4- ... + [п(п— 1)сп — сп_3]хп~2+ ... =0. Согласно нашим рассуждениям, все коэффициенты степенного ряда обращаются в нуль, что дает с2 = 0, Г — Сз — 6 5-6 2-3-5-6‘ Вообще, г =___________________________£о_________ t3rt 2 - 3 - 5 - 6.. .(Злг — 1) (Зп) ’ г =__________________________ Сзл + 1 3-4.6- 7 ... (Зл)(Зп+1)’ СЗп+2 = 0* Если начальные условия не заданы, то с0 и й играют роль произвольных постоянных. Общее решение можно
168 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ IV /’ записать в виде Г х3 г6 У = с0 Н + 2-3 2-3-5-6 + •••* хзл 1 + 2 • 3 • 5 • 6.. .(Зя - 1) (Зя) + • ’ • J ' + С1 [х + -374- + 3.4.6.7 + ‘ • 1 хзл+1 1 • • • + 3 • 4-6 • 7.. .(Зя) (Зя + 1) + ’ ’ ’ Легко проверить, что полученный ряд сходится при всех значениях х. Пример 2.24. Рассмотрим дифференциальное урав- нение у"— xy' + y=l — cos х с начальными условиями у\х^о=О, у'|xa=o=l. Решение будем снова искать в форме степенного ряда оо . с неопределенными коэффициентами y=hi спхп. - Разложение правой части в ряд Маклорена имеет вид < X2 X4 , хв 1 — COS X — 2! 4| + 5! • • • • Записав ряд и его производные, напишем слева коэффи- циенты, с которыми эти ряды входят в уравнение. По- лучим 1 — х 1 у = с0 4- с{х + с2х2 + с3х3 + с4х4 4- с5х5 + 4- + с7х7 4- с%х* 4- ..., у' = q 4- Ъс^х 4- Зс3х2 4- 4qx3 4- 5qx4 4- 6qx5 4- 4-7qx6 4-8qx7 4- . . у" = 2q + 6с3х 4- 12qx2 4- 20qx3 4- 30с6х4 4- 4- 42с7х5 4- 56с8х6 4- . Производя указанные действия, сразу находим коэффи- циенты при степенях х в левой части уравнения и при- равниваем их к соответствующим коэффициентам разло- жения правой части. Получаем систему уравнений (слева
§ 24] ИНТЕГРИРОВАНИЕ С ПОМОЩЬЮ РЯДОВ 169 указаны степени х, коэффициенты при которых выписы- ваются) Х° Сц + 2с2 — X 6с3 = 0, X2 -с2+ 12с4 = у, X3 — 2с3 + 20с5 = 0, X4 — Зс,| -{- dOCfj = — X5 — 4с5 + 42с7 = 0, X6 - 5с6 + 56с8 = ~ С помощью начальных условий находим со = О и Ci = l. Легко заметить, что Сз = ^5=^7 = 0 и вообще с2п^?=0. Далее, с2=0, с4=-^, Таким обра- зом, искомое частное решение есть функция, разложение которой в степенной ряд имеет вид х* хб . Их8 У Х + 24 ‘360 ' 40 320 * Если для рассматриваемого дифференциального уравнения у" + + Рг(х)У = точка х == 0 особая, т. е. в ней терпят разрыв коэффициенты уравне- ния, то решение может и не представляться в виде суммы обычного степенного ряда. Иногда уравнение допускает решение в форме обоб- щенного степенного ряда вида у = х«(со + са + с2х2 + ... + спхп +...), где а — некоторое действительное число. Очевидно, что только при целых и положительных а или а = 0 этот ряд совпадает с обычным степенным. Отыскание такого решения производится по тем же правилам, что и выше. При этом приравнивание первых коэффициентов левой и правой частей уравнения дает уравнение для определения показателя степени а, которое называют ^определяющим уравнением». Рассмот- рим его применение на одном примере. Пример 3.24. Найдем решение уравнения Бесселя х2/' + ху' 4- (х2 — ш2) у = 0, (5.24)
170 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. TV где т — произвольное положительное число или нуль. Его можно пе- реписать в виде откуда видно, что это уравнение имеет особую точку х — 0. По- ♦ этому будем искать решение в форме обобщенного степенного ряда. Положим у = ха(со 4- С1Х + с2х2+.. Лспхп +...) (6 24) или, раскрыв для удобства скобки, у = соха+ С1Ха+1+ с2ха+24-.. .4-CnXa+rt + ... Далее, находим у' == асо*61'1 4- (а 4- 1) С1Ха 4- ... 4- (а + п) спха+п~{ 4- ..., у" = а(а - 1) с0ха"2 4- (а 4- 1) acjX0-1 4- (а 4- 2) (а 4- 1)с2ха 4- ... ... +(а + п) (а 4- п- 1)спха+п~2 + ... Подставим полученные выражения в уравнение (5.24). Для этого нужно ряд для у умножить на (х2 — /и2), для у' — на х и для у" — на х2. Сложив эти выражения и приведя подобные члены, получим [а (а — 1)с0 4- ас0 - *а4- [(а + 1) act 4- (а 4- 1) — т2сх\ ха+1 + + [(а 4- 2) (а + 1) с2 + (а + 2) с2 — /п2с2 4- с0] ха+2 + ... 4* 4- [(а 4- п) (а 4- п — 1) сп 4- (а 4- п) сп — т2сп 4- сп_2] ха+/г 4- ... =0. Можно считать, что Cq =Н=0; тогда, приравнивая нулю коэффи- циент при ха и сокращая на cOt получаем определяющее уравнение a (a — 1) 4- a — т2 = 0, т. е. а2 — /и2 = 0, откуда a = ±т. Приравнивание нулю остальных коэффициентов дает систему (а 4- 1) aci 4- (а 4- 1) Ci — т2с{ — 0, (а 4- 2) (а 4-1) с2 4- (а 4- 2) с2 — т2с2 4- с0 = 0, (а 4- 3) (а + 2) с3 4- (а 4- 3) с3 - т2с3 4- Ci = 0, (а 4- 4) (а 4- 3) с4 4- (а 4- 4) с4 - т2с4 4- с2 = О, (а 4- п) (а 4- п — 1) сп 4- (а 4- п) сп - т2сп 4- сп_2 = 0.
ИНТЕГРИРОВАНИЕ С ПОМОЩЬЮ РЯДОВ 171 § 24] Полагая сначала а = т, последовательно находим все коэффи- циенты: С\ = О, ___________£о________ __ со 2 (т + 2)2 — т2 22 (т+1)’ £з ~ Г = С2 С2 4 (т + 4)2-т2 2(/н + 2)-22 =____________£о_________ 24 (ли 4- 1) (т 4-2) • 1 • 2 ’ с2п ( О" 22Пп\(пг+ 1)(т + 2) ...(т + п) ’ с2м+1 = О, Подставляя найденные значения коэффициентов в (6 24), получим / j^2 у = сохт - 22(„г + 1) + 24 • 2! (m + 1) (т + 2) “ ‘‘ + Х2П \ + (“122"n!(m+ 1)(т + 2)...(ш + п) + ''')' <7,24) Пользуясь признаком Даламбера, легко проверить, что ряд в скобках сходится на всей числовой оси. Функция (7.24) является решением уравнения Бесселя (5 24) и при надлежащем выборе коэффициента с0 называется бесселевой функцией первого рода и обозначается /т(х) *)• Отметим, что если tn = О, то л/х=о = Со, а если т > 0, то ух=о = 0. *) Функция Бесселя Jm(x) записывается обычно с помощью гамма-функции Эйлера Г(х). Гамма-функция определяется несоб- ственным интегралом оо Г (х) = J tx-'e-‘dt, о сходящимся при всех х > 0. При помощи интегрирования по частям легко получим основное свойство гамма-функции: Г(х4- 1) =хГ(х). оо Так как Г(1) — J dt = 1, то из основного свойства следует, что о если п — целое положительное число, то Г (л 4- 1) = п\ (отметим, что под 0! понимают Г(1) = 1). Последовательно применяя основное свойство, получим Г(п 4- tn 4- 1) = (п 4- tn) (п 4- tn—1)... (tn +1) X X Г(т + 1). Полагая в формуле (7.24) с0 = (^г 4- j) * п°лучим
172 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV Если положить а = —т, то приходится различать два случая: т — не целое число и т — целое число. Если т — не целое число, то, поступая как и раньше, получим решение уравнения в виде _ _ _т /1 X2 X4 У-СоХ Р 22(-m+l) + 24-2l(-m+l)(-m + 2) + Х2П \ + < “122"n!(-m+l)(-m + 2) ... (-т + п) + ''') ’ (8'2^ где ряд в скобках опять-таки сходится на всей числовой оси. При соответствующем значении с0 функцию (8.24) обозначают /_,п(х) *)• Заметим, что при т > 0 функция при х->0 стремится к бесконечности. Отсюда уже следует, что частные решения Jm(x) и J_m(x) линейно независимы, и общее решение уравнения Бесселя запишется в виде / = CiJm(x) + C2J -т(х) t где Ci и С2 — произвольные постоянные. Если т — О, то вместо двух частных решений получается одно. Если же т — целое положительное число, то в формуле (8.24) все знаменатели, начиная с некоторого, обратятся в нуль, что означает, что выбранная форма решения для а = —т не подходит. Отыскание второго частного решения в обоих последних случаях представляет более сложную задачу, и мы ее не рассматриваем2). выражение для Jm (х): оо / Х_j2n+m n=0 Для отыскания значений гамма-функции имеются подробные таб- лицы (см., например, Б. И. Сегал и К. А. Семендяев, Пяти- значные математические таблицы). Если т — целое положительное число или нуль, то оо /_Х\2«+™ п=0 ’) Согласно предыдущей сноске, оо /_х\2«-т J~m М = X (“ 1)" Г (я- т+1)' п=0 Относительно определения гамма-функции для х < 0 см., например, Р. О. К у з ь м и н, Бесселевы функции. 2) См. книгу, указанную в сноске *),
ДРУГИЕ АНАЛИТИЧЕСКИЕ МЕТОДЫ 173 § 25. Другие аналитические методы I. Метод последовательного дифферен- цирования. Этот метод, так же как и рассмотренный в предыдущем параграфе, основан на применении рядов Тейлора. Пусть дано дифференциальное уравнение у(п) = Ф(х, у, (1.25) с начальными условиями, заданными при л=х0- У = Уо, у' = у'о,..., Предположим, что искомое частное решение y=f(x) может быть разложено в ряд Тейлора по степеням раз- ности (х — х0): WUo) + ^(x-Xo)+-£^(x-xo)2+ ... . •. + 7^-iy!'- - -"о)"’1 + —/7Г1 + +Гпуг(*-*>>"'+ В силу заданных начальных условий это разложение должно иметь вид У = f/o + 77 U - х0) + ^|-(х - -Vo)2 + • • • ••• + /((7+(lH (x~xo)n+1+ ...(2.25) Таким образом, для отыскания решения (2.25) нужно знать значения производных f(n)(xo), f(n+l'(%o), ... иско- мой функции при х=х0. Значение производной /(п)(%о) можно найти из уравнения (1.25), подставив туда х=х0 и использовав остальные начальные условия. Мы по- лучим y0(n)=f(n)^ =ф(х0} у'^ . . . , i/0(n-l)). Последующие производные можно получить следую- щим образом. Продифференцируем уравнение (1.25)
174 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV по х: P(n+,) = ^ + j4'+^-/ + ... (3.25) дх ду ду ду' ' Правая часть равенства (3.25) будет известным образом выражаться через х, у, у', у(п~}\ уп, значения кото- рых при х = х0 известны. Поэтому, положив в (3.25) х==х0, мы получим значение /(п+1)Х^о). Дифференцирование (3.25) дает возможность опре- делить f(n+2)(x0) и т. д. Таким образом, путем Последова- тельного дифференцирования мы можем продолжить ряд Тейлора (2.25) как угодно далеко'). Пример 1.25. Найдем частное решение уравнения у"+а2у = 0 при начальных условиях у|х=о=О, у'\х=о=а методом последовательного дифференцирования. Из уравнения находим, что при х—0 также уо" = 0. Далее: у'" + а2у' = 0, у'0"=-а3, ylv + a2y" = 0, < = 0, yv + а2у'" = 0, у< = а5, Легко убедиться, что и вообще i/o(2n) = O, i/o(2n+I) = = (—l)na2n+1, откуда частное решение ах а3х3 . а5х5 , , .а2л+1х2л-м 3! *~“31 +(-1) (2п+ 1)! + Полученный ряд представляет разложение в ряд Макло- рена функции sin ах. Поэтому найденное решение у = sin ах. Так как заданное уравнение линейное с постоянными коэффициентами, то легко проверить, что, решая его обычным методом, получим то же решение. Метод последовательного дифференцирования можно без труда распространить на систему дифференциальных уравнений. !) Мы не формулируем условий, при которых ряд (2.25) будет сходящимся.
§ 25] ДРУГИЕ АНАЛИТИЧЕСКИЕ МЕТОДЫ 175 Действительно, пусть = У, Д =f2(x, у, z) (4.25) — система двух дифференциальных уравнений с двумя неизвестными функциями у и z, зависящими от х, удов- летворяющими начальным условиям f/(xo)=//o, z(x0)=z0. Напишем ряд Тейлора для обеих функций: f/U) = y0 + /(xo)U~*o) +-Мг^-U- х0)2 + .. х (5.25) z (х) = z0 + z' (х0)(х - хо) + 2 2, } (х - хо)2 + ... . Коэффициенты y'(xQ), z'(xo) находим из системы (4.25) при подстановке в нее х=х0, У = Уо, z = z0. Вторые производные мы сможем найти, продифференцировав оба уравнения системы (4.25) и подставляя в них x=xq и т. д. Пример 2.25. Проинтегрируем методом последова- тельного дифференцирования систему у' = х + z2, 2' = У с начальными условиями у(0)=0, z(0) = l. Из данной системы находим:/(0) = 1, z'(0) =0. Диф- ференцируя систему, получаем у" = 1 + 2zz', г" = откуда i/"(0) = l, zz,(0) = l. Далее, г/'" = 2 (z/j2 + 2zzr\ z"' = так что t/zzz(0) =2, z'/z(0) = l. Итак, частное решение си- стемы можно записать следующим образом: v2 Q г3 t/(x) = x + -2|-4--3i—h .... у-2 уЗ 2(х) = 1 + ‘2!~ + ’з['+ • • •
176 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. !V II. Метод последовательных приближе- ний. Перейдем теперь к рассмотрению еще одного ана- литического метода, который обычно называют методом последовательных приближений или итераций. Метод этот возник в связи с доказательством теоремы существо- вания и единственности решения дифференциальных уравнений. Он был применен Пикаром в 1890 г., и его называют также методом Пикара. Рассмотрим дифференциальное уравнение первого порядка / = у) (6.25) с начальным условием х = хо, у = у0. (7.25) Уравнение (6.25) можно переписать иначе: dy = f(x, u)dx. С учетом начальных условий ему можно придать вид х У = Уо + / fit, y(t))dt. (8.25) Хо Выражение (8.25) для у содержит неизвестную функ- цию под знаком интеграла. Поэтому уравнение (8.25) на- зывают интегральным уравнением. Очевидно, функция у, удовлетворяющая интегральному уравнению (8.25), удовлетворяет и начальным условиям (7.25) и дифферен- циальному уравнению (6.25). Чтобы убедиться в послед- нем, достаточно продифференцировать интеграл по верх- нему пределу. Тем не менее полученное выражение не может, конечно, служить для непосредственного отыска- ния решения, ибо операция интегрирования не может быть выполнена, пока функция у неизвестна. Мы можем, однако, воспользоваться интегральным уравнением (8.25) для получения последовательности приближений, предел которой дает искомое решение. Если считать участок (хо, х) сравнительно малым, то можно предположить, что функция на этом участке мало отличается от величины уо. Следовательно, в качестве
§ 25] ДРУГИЕ АНАЛИТИЧЕСКИЕ МЕТОДЫ 177 первого приближения можно взять функцию yw (х) = Уо + J f (t Уо) dt, Xq (9.25) причем здесь уже под интегралом стоит известная функ- ция. Определив функцию у-'Цх) и полагая в формуле (8.25) y(i) =У^(1), можно получить второе прибли- жение X У(2)(х) = у0+ jf(t, y(,)(t))dt, Хо и вообще х У(п)(х)-Уо+ ff(t, y(n~'4t))dt. Имеет место следующая теорема, которую мы приводим без доказательства. Теорема. Если в некоторой окрестности точки (х0, Уо) правая часть дифференциального уравнения yf=f(x, у) непрерывна и имеет ограниченную частную производную fy(x, у), то в некотором интервале, содер- жащем точку х0, последовательность сходится к функции <р(х), являющейся решением данного уравне- ния и удовлетворяющей условию ф(хо) = Уо- Пример 3.25. Найдем методом последовательных приближений частное решение уравнения у' = х + у с на- чальным условием у|х.=0= 1. Запишем уравнение в виде X У = 1 + / (t + y)dt. о По формуле (9.25) X £<0=1+ [ (/+ l)rfz = I + л + 4- о 12 Р- С. Гутер, Б. В. Овчинсм’й
178 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV Далее, X 1/(2) =1+ |(/+l+f + ^)^=l+x + x2+^.> О х у& = 1+ J (t+l+t + t2 + -^)dt = о = 1 + X + X2 + -у- + *24 » х {/0)=l+ j (/+1+m2+^ + ^_)^ = О Il I 2 . X3 I х* I х5 1 + X + X + 3 + 12 + 120 • Так как наше уравнение может быть проинтегриро- вано в конечном виде, то мы можем сравнить получаю- щиеся приближения с точным решением. Точное реше- ние имеет вид ^2^-х-1 = 1+х + ^ + 4+4+4 + ^+... Сравнивая последовательные приближения, полученные методом Пикара, с этим рядом, замечаем, что у каждого приближения все члены, кроме последнего, совпадают с членами ряда, представляющего точное решение1). Метод Пикара без затруднений может быть перене- сен на системы уравнений и на уравнения высших по- рядков, но на этом вопросе мы останавливаться не будем. § 26. Численные методы интегрирования. Метод Эйлера Численные методы интегрирования дифференциаль- ных уравнений употребляются обычно чаще других. При интегрировании уравнений с помощью рядов способом неопределенных коэффициентов или способом последо- вательного дифференцирования может потребоваться очень большое число членов. Оценка точности часто ока- !) Такое совпадение, разумеется, не обязательно в общем случае.
§ 26] ЧИСЛЕННЫЕ МЕТОДЫ ИНТЕГРИРОВАНИЯ МЕТОД ЭЙЛЕРА 179 зывается трудной, особенно в тех случаях, когда не удается найти выражение для общего члена. Примене- ние метода Пикара требует вычисления последователь- ных приближений с помощью интегралов, что может ока- заться слишком громоздким или даже невыполнимым в элементарных функциях. Кроме того, в вопросах практи- ческого применения математики чаще всего требуется не формула, дающая искомое решение, а его числовые значения при определенных значениях аргумента, кото- рые еще необходимо будет вычислять. Численные ме- тоды как раз и дают искомое решение в форме таб- лицы значений. Изложение численных методов начнем с метода Эйлера. Он является сравнительно грубым и может при- меняться только для ориентировочных расчетов. Однако идеи, положенные в его основу, являются, по существу, исходными для очень широкого класса численных мето- дов. Поэтому полезно разобрать его подробно. Пусть дано дифференциальное уравнение первого по- рядка У) (1.26) с начальным условием х = *о, У = Уп- (2.26) Выберем число h настолько малым, чтобы для всехх в интервале (х0, xj, где Xi=x0 + /i, значения функции у мало отличались от уо (функция у непрерывна). Тогда для указанного интервала изменения х можно написать У ~ Уо + (* *0) yQ = yQ + (х х0) f (х0, у^ где y'Q=f(xo, Уо) есть значение производной у' в точке х = х0. Иными словами, на этом участке кривая заме- няется отрезком прямой (касательной к ней в начале участка). Для конца участка xi=xo+ft получим У\х=х=Уй + Ьу'0 = Уг Точно так же для x = x2 = Xo + 2/z можно написать У2 = У\ + hy'v где у\ = f (хр z/J. 12*
180 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ (ГЛ. IV Продолжая строить дальнейшие значения функции по тому же закону, получим №+l = ^ + ^fe> причем №). Пользуясь известными обозначе- ниями, схему метода Эйлера можно представить фор- мулами - hyk> | (3.26) Ук+i = Ук + &Ук- 1 Речь идет, таким образом, о последовательном вычисле- нии разностей искомой функции. Геометрический смысл метода Эйлера легко усмо- треть из рис. 19. Интегральная кривая заменяется здесь ломаной, звенья которой имеют постоянную горизонталь- ную проекцию h. Первое звено касается истинной инте- гральной кривой в точке (х0, Уо)- Установленные формулы могут быть получены и из иных соображений, которые будут использоваться в дальнейшем. Из уравнения (1.26) можно написать xk+i y(xk+i) = y(xk)+ J f(x,y(x))dx. (4.26) хк Если в интеграле (4.26) принять функцию f(x, у(х)) по- стоянной, равной начальному значению в точке х=хл, то величина интеграла будет равна hf(xk, ук), так что формула (4.26) обращается в формулу (3.26).
§ 26] ЧИСЛЕННЫЕ МЕТОДЫ ИНТЕГРИРОВАНИЯ МЕТОД ЭЙЛЕРА 181 Пример 1.26. Проинтегрируем методом Эйлера уравнение у' = 2ху с начальными условиями Хо==0, £/о=1 на участке [0, 1], принимая /i = 0,l. Таблица 1.26 (1) (2) (3) (4) (5) (6) X У &у у' у2 У = ех У 0,0 1,00 0,00 0,0 1,00 1,00 0,1 1,00 0,02 0,2 1,01 1,01 0,2 1,02 0,04 °»4 /1,04 1,04 0,3 1/6 0,06 0,6 1,09 1,09 0,4 1,12 0,09 0,9 1,17 1,16 0,5 1,21 0,12 1,2 1,28 1,26 0,6 1,33 0,16 1,6 1,43 1,39 0,7 1,49 0,21 2,1 1,63 1,57 0,8 1,70 0,27 2,7 1,9) 1,80 0,9 1,0 1,97 2,32 0,35 3,5 2,25 2,72 2,12 2,53 Схема и результаты вычислений даны в табл. 1.26. По начальным данным заполнена первая строка в столб- цах (1) и (2). Затем из уравнения У о ~ %хоУо вычисляется у' для первой строки столбца (4) и зна- чение д У о = 1иЛ для столбца (3) между первой и второй строкой. Теперь можно заполнять вторую строку в столбце (2): У\=Уо + &Уо, затем вторую строку в столбце (4) и т д.
182 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV В столбце (5) приведено значение точного решения у = ех* с точностью до двух знаков. Сравнение результа- тов показывает, что относительная погрешность при х=1 составляет 14% (значения точного решения у = 2,72, тогда как способ Эйлера дает у = 2,32). т. е. довольно существенна. Для того чтобы улучшить приближение, необходимо уменьшить й, увеличив число точек деления интервала. В столбце (6) приведен результат вычислений .по ме- тоду Эйлера с шагом й = 0,051)- Здесь относительная ошибка при х=1 составляет уже 7%, т. е. в два раза меньше, а для х = 0,5 эта ошибка немногим превышает 1,5%, что можно считать удовлетворительным. Метод Эйлера может быть применен также и для интегрирования систем дифференциальных уравнений и уравнений высших порядков. Последние должны быть предварительно приведены к системе дифференциальных уравнений в нормальной форме. Рассмотрим коротко применение метода Эйлера к интегрированию системы двух уравнений первого по- рядка с двумя искомыми функциями. Пусть дана си- стема двух уравнений с двумя искомыми функциями у и z аргумента х: (х, у, z), ^-Мх, у, Z) . и начальные условия х=х0, у(хй)=уй, z(xQ)=z0. Как было указано выше, задача сводится к вычислению раз- ностей Ду, а в случае системы — разностей Ду и Дг. По- следние могут быть вычислены по формулам = y'kh = hfi (xk> / ' zk\ , ,, . t , к (6.26) tek = zkh = hf2(xk, yk, zk). Покажем, как используются формулы (6.26) на конкрет- ном примере. !) Значения функции в промежуточных точках 0,05, 0,15 и т. д. в таблице не указаны.
§ 26] ЧИСЛЕННЫЕ МЕТОДЫ ИНТЕГРИРОВАНИЯ МЕТОД ЭЙЛЕРА 183 Пример 2.26. Рассмотрим уравнение Бесселя с ин- дексом т = 0 (см. пример 3.24) у" + 4 у' + У = 0 и начальными условиями х0=1, £/0 = 0,765, y'Q =—0,440. Найдем приближенное решение этого уравнения на уча- стке (1,0; 1,5) методом Эйлера. Для применения метода Эйлера необходимо привести это уравнение второго порядка к системе двух уравне- ний первого порядка с двумя неизвестными функциями. Это достигается подстановкой y' = z. Так как y"=z\ мы можем заданное уравнение записать в виде системы /==г, Начальные условия будут иметь вид х0=1, £/о = О,765, £о = —0,440. По заданным начальным условиям находим значения производных и затем по формулам (6.26)—разности Д//о и Дг0. Они дают нам возможность найти у\ и по кото- рым затем находятся производные у\ и z\ и снова по формулам (6.26)—разности Дг/i и Д<?1 и т. д. Результаты вычислений приведены в табл. 2.26. Точ- ное значение решения для х=1,5 с четырьмя знаками: Jo (1,5) =0,5118. Таким образом, здесь относительная ошибка составляет 0,8%. Таблица 2.26 (1) (2) (3) (4) (5) (6) X У Az , z г= ---V 1,0 0,765 — 0,044 -0,440 — 0,032 -0,325 1,1 0,721 -0,047 -0,472 -0,029 -0,292 1,2 0,674 -0,050 -0,501 -0,026 -0,256 1,3 1,4 1,5 0,624 0,571 0,-516 -0,053 -0,055 -0,527 -0,549 -0,022 -0,218
184 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV Как было указано в начале настоящего параграфа и как показывают приведенные примеры, способ Эйлера часто не дает практически требуемой точности. Однако некоторое его изменение, не усложняя требуемых выкла- док, дает возможность значительно повысить точность результатов. Мы разберем сейчас так называемый уточ- ненный метод Эйлера. Возвратимся снова к дифференциальному уравнению у) с начальным условием х=х0, У = Уо и рассмот- рим общую формулу (4.26). Из этой формулы мы полу- чали формулу для метода Эйлера (3.26), полагая подын- тегральную функцию постоянной, равной f(xk, yh). Более точное значение лолучится, если мы примем /(х, у) так- же постоянной, но равной значению функции не в на- чале, а в середине участка. Заметив, что точка х{ является серединой участка (х0, х2), мы можем вычислять значение у2 по формуле x04-2/i У2~ Уо + / f[*i> //(*>)] dx. X» Так как f[xb y(jO] = y'i, ТО У2 = У о + 2hy\- По найденному значению у2 находим у'2, после чего можно найти уь рассматривая участок (xi,x3) и по- лагая Уз в У1 + Таким образом, уточненный метод Эйлера характери- зуется формулами Р*+1 = ^-1 + 2М (7-26) где Уъ=[(хъ У*)- По эт°й формуле нельзя, однако, оты- скать У1. Для его отыскания пользуются обычным ме- тодом Эйлера, полагая </1=Уо+Л^. Еще более точные результаты получатся, если нахо- дить уи пользуясь значением производной снова в сере-
§ 26] ЧИСЛЕННЫЕ МЕТОДЫ ИНТЕГРИРОВАНИЯ МЕТОД ЭЙЛЕРА 185 дине участка. Для этой цели следует вычислить сначала значение //у2 ~ Уо + ~2 кУо' пользуясь обычным методом Эйлера, а затем, найдя y'l,~f(x42> вычислять у\ по формуле У\ = Уо + hy'v Пример 3.26. Для сравнения рассмотрим то же уравнение у'=2ху с начальным условием Хо=О, г/о=1, что и в примере 1.26, и проинтегрируем его уточненным методом Эйлера. Таблица 3.26 (I) (2) (3) (4) (5) X У У' У 0 1,00 0,00 0 1,00 0,05 1,00 0,01 0,1 0,1 1,01 0,04 0,2 1,01 0,2 1,04 0,08 0,4 1,04 0,3 1,09 0,14 0,7 1,09 0,4 1,18 0,18 0,9 1,17 0,5 1,27 0,26 1,3 1,28 0,6 1,44 0,34 1,7 1,43 0,7 1,61 0,46 2,3 1,63 0,8 1,90 0,60 3,0 1,89 0,9 2,21 0,80 4,0 2,24 1 2,70 2,71 Вычисления приведены в табл. 3.26, причем разности выписаны так, что они по-прежнему находятся между значениями функции, к которым они относятся.
186 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ IV По значениям х и у в данной строке вычисляется зна- чение у' из дифференциального уравнения, т. е. запол- няется столбец (4). Затем находим Ду для столбца (3) умножением значения у' на 0,2 = 2Л. Для получения сле- дующего значения функции полученная величина Ду прибавляется к предыдущему. Уточненный метод Эйлера дает при х=1 величину у = 2,70. Сравнение с точным решением, приведенным в табл. 1.26 (столбец (5)), показывает, что относительная ошибка составляет здесь только 0,7% вместо 14%, по- лученных в примере 1.26 при интегрировании способом Эйлера при шаге 0,1, и 7%, полученных при шаге 0,05. В столбце (5) табл. 3.26 приведена таблица решения, полученного уточненным способом Эйлера с шагом /i=0,05. Здесь относительная ошибка при х=1 состав- ляет уже 0,4%. Таким образом, при той же вычислитель- ной работе, что и в обычном методе Эйлера, уточненный способ дает значительно более точные результаты. Геометрический смысл уточненного способа Эйлера показан на рис. 20. Исходя из начальной точки Л4(х0, Уо), получаем по методу Эйлера для х = ху2 точку Л1у2. Для x=xi способ Эйлера дал бы точку Л4Ь находящуюся на касательной к интегральной кривой в точке М. Уточненный
МЕТОД АДАМСА - КРЫЛОВА 187 § 27] способ состоит в том, что из точки М проводится отрезок ММ2, параллельный отрезку Mt/2A43, направленному в со- ответствии со значением углового коэффициента в точ- ке Mi/2. Точка М2, которая получена по уточненному спо- собу Эйлера, находится ближе к истинной кривой, чем точка All. В дальнейшем для получения каждой следую- щей точки проводится отрезок над участком длины 2/г параллельно направлению, которое определяется значе- нием производной в середине этого участка: ЛШ4, М2М$. § 27. Метод Адамса — Крылова Точность решения, даваемая методом Эйлера или его уточнением, обычно оказывается ниже требуемой. Зна- чительное уменьшение шага, повышающее точность, мо- жет потребовать слишком громоздких вычислений. Ме- тод Адамса — Крылова, изложению которого посвящен настоящий параграф, дает при том же шаге более точ- ные результаты, чем метод Эйлера и его уточнение. Как и в методе Эйлера, задача интегрирования диф- ференциального уравнения сводится к последователь- ному вычислению первых разностей решения Ду&, кото- рые определяются здесь более точно. Рассмотрим опять дифференциальное уравнение пер- вого порядка y'—f(x>y) (1.27) с начальным условием х=х0, У=У^ (2.27) Выберем шаг интегрирования h и введем новую вспо- могательную величину т), значения которой определяются соотношением = = yn)h- (3-27) Задача вычисления разностей Ду распадается на два этапа: отыскание первоначальных значений величины ц и ее разностей (начало решения или вход в таблицу) и вычисление дальнейших разностей по уже найденным величинам (продолжение таблицы). Начнем с рассмот- рения второго из них.
188 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV Предположим, что, интегрируя наше уравнение, мы уже составили приведенную ниже табл. 1.27, заполнен- ную до n-й строки. Таблица 1.27 п X У ч ДТ] А2т] Д3Ч п — 3 хп—3 У п-з П -з ДПп-3 п — 2 хп—2 Уп-2 &Уп-2 Пл-2 ДП„-2 д2Пл-з д3*)„-з п- 1 Хп-\ Уп-\ ^Уп-1 Пц-1 Дт1п-1 Д2Пп-2 п Хп Уп Пл Поставим себе задачу продолжить эту таблицу еще на одну строку, выразив значение Дг/П, а затем и yn+i через известные значения т)п, Ать-ь .не касаясь пока вопроса о том, как она была заполнена до номера п. Формула, которую мы хотим установить, является основ- ной в способе Адамса — Крылова. Если ограничиться применением третьих разностей, она имеет вид = Пп + 4 Ат1«-1 +12 а21Ь-2 + Т д3|Ь-з- (4-27) Выведем эту формулу, основываясь на известном со- отношении между функцией и ее производной: хп+1 Уп+1~Уп= / y'{x)dx, хп которое можно записать в виде хп+1 Ьуп- J hy'(x)^. (5.27) хп
МЕТОД АДАМСА - КРЫЛОВА 189 § 27] Считая здесь функцию hy' (х) равной своему интерполя- ционному многочлену ц(х), построенному по значениям hy'(x) в предыдущих точках, можно написать хп+1 f nW 4г- (6.27) «/ п хп Если считать, что величина hy'(x) имеет практически по- стоянные третьи разности, то интерполяционный много- член т](х) можно считать имеющим третью степень. Построим интерполяционный многочлен для функции т](х) на отрезке [хп-з, *п] с узлами интерполяции хп-з, хп-2, ^п-ь хп, применив вторую интерполяционную фор- мулу Ньютона (7.16). Используя обозначение (3.27), находим Т](х) = П(Х/г + th) = Y\n + /ДЦп-1 +-^у-^-Д2Пгг-2 + + -^Ц^ДЧ-з, (7.27) где _ X - хп l~ h • Формулу (6.27) можно преобразовать при помощи замены переменных x=xn + //i, dx = hdt, в результате чего получим 1 &Уп = J nW + th)dt. о Далее, использовав здесь выражение (7.27) для r[(xn + th), найдем Д«/п = 1 fr in , <(<+•) A2 . <(/+1)(/ + 2) -ч 1 = J [п» + /Ат1п-1 + - -2 Л2Пп-г +-----------А3г)п-з]^- О Остается вычислить интеграл. Интегрирование дает д|/ч=[ч,<+4 г2лгь-1 +4 +т(т+'’ + '!)4’М-
190 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV или, окончательно, At/„ = Пп + 4 А1Ь-1 + “b Д2Пп-2 + у Д3Пп-3> что и дает требуемую формулу (4.27). Прибавляя полученное значение Дг/П к имеющемуся в таблице уп, получаем следующее значение функции: Уп+i *= уп + Дг/П. По известным значениям xn+i и t/n+i можно вычислить v\n^\=yrn+\h=f{Xn^\,yn-¥\)h. Это дает возможность найти разности величины г] со следующими номерами. Таким образом, формула Адамса (4.27) по- зволяет продолжить табл. 1.27 на один шаг, а значит и на любое дальнейшее число шагов. Тем самым вторая из поставленных выше задач, задача продолжения таблицы, оказывается решенной. Если ограничиться предположением постоянства вто- рых разностей, то отпадает необходимость в рассмот- рении интерполяционного многочлена третьей степени. Считая в формуле (6.27) tj(x) многочленом второй сте- пени и отбрасывая последнее слагаемое в формуле (7.27), придем тем же путем к формуле Адамса вида ДУп = 1Ъ + 4А11«-1 + Т2 Д2^л—2* (8.27) Наоборот, если рассмотрение третьих разностей ока- зывается недостаточным, то тот же метод позволяет по- лучить формулу Адамса большей точности, содержащую более высокие разности величины тр Так, например, формула Адамса, учитывающая разности пятого порядка, имеет вид АУп = Пгг + 4 1 + ^п-2 + у Д3|1п-3 + + ^АЧ-4 + ^АЧ-5 (9.27) Отметим, что более простые формулы Адамса полу- чаются из более сложных путем простого отбрасывания членов с разностями более высоких порядков. Перейдем теперь к рассмотрению первой задачи — входа в таблицу. Для того чтобы пользоваться форму- лой (4.27), необходимо знать значения у\, у2, Уз, т. е. иь еть таблицу вида табл. 2.27.
§ 27] МЕТОД АДАМСА - КРЫЛОВА 191 Таблица 2.27 п X У ч Ат] А2т] А3т] 0 ХО Уо ЬУо По ДПо А2По 1 Х1 У1 А</1 41 Дт)1 А3По Д2П1 2 х2 У2 Д(/2 42 ДГ]2 3 Хз Уз Чз Для получения этих значений достаточно вычислить величины Дг/о, Af/i, Д#2- Проще всего это сделать, преобразовывая формулу (4.27), пользуясь предположенным постоянством третьих разностей. Полагая Д3Т)п = Д3Г)п-1 = Д3"Пп—2 = Д3Т)п- 3, заменим в формуле (4.27) разность Д3т)п—з на Д3г)п~2. Тогда = Лп + у ДПп-1 + "у ДЧг-2 + 4 ДЧг-2- (Ю.27) Далее, из определения конечных разностей вытекаем что Д2Пп- 2 = Д2П П-1 — Д3Пп-2. Подставив это выражение в (10.27) и снова заме-, нив номер третьей разности, придем к формуле Ьуп = Пп + у ДтЬ-1 + ТТ - -у Д3П«-1- (11.27) Так как д2п«-1 = д2Пп- ДЧ.-1. дПл-1 = дП« - Д2Н«-1 = - Д2Пп + д3Пп-1. . то после очередной замены третьей разности Д3т}п-1 на Д3т)п мы приведем формулу (11.27) к виду &Уп = % + у дП« “ "у д2П« + у д3Пп- (12.27)
192 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ IV Положим теперь в формулах (12.27), (11.27) и (10.27) соответственно п = 0, 1,2. Это дает Дуо = По + у Ат1о - Д2Но + -^4 Д3Ио> Д{/1 = П1 + у Лг1« + ТТ Д2По “ 41 ЛЗп°’ = *12 + 4 Лт>1 + ТУ Д2т1°+ 4 Д3110- (13.27) Формулы (13.27) являются исходными для входа в таб- лицу, т. е. для заполнения первых строк; мы будем на- зывать их формулами Крылова. Покажем теперь, как с помощью последовательных приближений заполнить начало таблицы до требуемого места, пользуясь формулами Крылова. Зная из начального условия х = х0 и у = #о, легко на- ходим По У^ f (хо» У в) к' В табл. 3.27 помещены уже известные значения. первой формулы (13.27), т. е. полагаем Дг/о = По- Это дает возможность определить последовательно У\ = Уо + Д«/о, Hi = У'^ = f (*р У1)Л, ДПо = Hi “ По> т. е. получить табл. 4.27. При этом вычисленные величины мы подчеркиваем одной чертой, чем отмечаем, что эти величины получены в первом приближении и по одночленной формуле (13.27). На этом заканчивается первое приближение.
§ 27] МЕТОД АДАМСА - КРЫЛОВА 193 Таблица 4.27 п X У п Дп д2п Д8т| 0 1 х0 Х1 Уо У1 Ь-Уо По Hi Ат|о Для второго приближения берем две формулы (13.27), в каждой из которых сохраняем по два члена. При этом мы перевычисляем (исправляем) значение Дуо и вновь вычисляем Ar/ь Последовательно получаем: Дуо = По + уДПо, И, = y'th = f(xv yx)h, tyi = Hi + у Atlo, П2 = У У1 = f (*2> y2) h, У1 = Уо + &y0, Дпо = П1 “ По, г/2 = У1 + АУ1, АП1 = Пг “ Hi, Д2По = ДИ1 “ Ат1о- Все вычисленные значения сводим в табл. 5.27, где ве- личины, полученные по одночленной и двучленной фор- мулам, подчеркнуты соответственно одной и двумя чер- тами. Таблица 5.27 п X У п ДТ| Д?п дзп 0 х0 Уо Пэ I 1 Xl У\ ЬУо 11 0 х0 Уо Ьуа По ДПо II 1 X} У\ Hi Д2По 2 А//1 Х2 Уг Л2 13 Р. С. Гутер, Б. В. Овчинский
194 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV Теперь, когда мы имеем не только первые, но и вто- рую разность Д2т]о, мы можем вновь перевычислить Az/0, Д#1 и найти Дг/2> пользуясь трехчленными формулами, т. е. сохраняя в формуле (13.27) по три члена» Как и ра- нее, последовательно вычисляем: ДУо = По + у Апо ~ 17 Д2По, ДУ1 = hi + 7 Дно+-у Д2по, Ду2 = Па + 7 ДП1 + -у Д2По, У1 = Уо + Дуо. У2 = У1 + ДУ1, Уз = У2 + ДУ2> Hi =f U1, У1)й, Иг = /(^2, Уг)Л. Пз = Н*з» Дно = Hi “ По, ДП| = П2-П1, ДПг = Из - П2, Д2Ио = ДП1 - Дно, Д2П1 = Дн2 - Дпь Д3т]о = Д2И1 ~ Д2По- Таблица значений функции приобретает уже новый вид, содержащий первые, вторые и третьи приближения (табл. 6.27). После проведенного третьего приближения мы можем воспользоваться полными формулами (13.27), которые позволяют перевычислить все имеющиеся в таблице зна- чения. Однако часто полученная разность Д3т]о оказы- вается настолько малой, что перевычисление разностей Дуо, Д*/1, Д^2 не изменяет их значения. В таких случаях можно не записывать следующего приближения и про- должать полученную в третьем приближении таблицу по формуле Адамса (4.27). Если, наоборот, полные формулы Крылова дают су- щественное расхождение с результатами третьего при- ближения, то после вычисления четвертого приближения необходимо перевычислить разности Дг/0, Д//1, Дг/2 еще раз или даже несколько раз, пока формулы Крылова не дадут установившихся результатов. После этого мо- жно уже продолжать таблицу по формуле Адамса (4.27). Если же результаты пересчета по формулам Крылова не устанавливаются, то необходимо уменьшить шаг рас- чета.
§ 27] МЕТОД АДАМСА - КРЫЛОВА 195 Таблица 6.27 п X У П АП Д2Т] Д3т) 0 Уо По I 1 У\ 1^Уо 'll Д'Пэ 0 Хо Уо ДУо По ДПо II 1 Х1 У\ Д'/| А.Г|1 Д2По 2 х2 П2 0 Хо Уо Ау0 По ДПо 1 Xi Уу Д2По III Д?/| Лт>1 Д3По 2 х2 у? = Д2Щ A.Z/2 Дт]2 3 Хз у? 2з — — Если мы можем ограничиться вторыми разностями, т. е. вместо формулы (4.27) пользоваться формулой (8.27), то достаточно иметь разности Ду0 и Дг/i, которые получаются по упрощенным формулам Крылова Луо = По + у Л11о “ ЛУ Л2|Ь Л«/1 = П1 + у ДПо + Л2По- . (14.27) Для более сложной формулы Адамса необходимы более сложные формулы Крылова. В общем случае трудно дать определенные рекомен- дации как по выбору шага, так и по тому, на какой раз- ности следует остановиться. Обычно поступают так: на- чинают пробный расчет с третьими разностями, задав- шись каким-либо шагом. Если в процессе расчета третьи 13*
196 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV разности мало изменяются, то выбор шага можно счи- тать удачным. Если к тому же третьи разности малы, то вполне допустимо ограничиться при дальнейшем рас-* чете вторыми разностями. Пример 1.27. Проинтегрируем уравнение у' = х2 + у2 + 1 с начальным условием х0 — 0, уо = 0 на участке [0, 1] с шагом h = 0,1. Таблица 7.27 Основной бланк п X У &У л Дт] Д2т] Д3т) 0 0 0 0,10000 200 1 0,1 0,10000 0,10000 0,10200 0 1 2 0 0,1 0,2 0 0,10100 0,20400 0,10100 0,10300 0,10000 0,10202 0,10816 202 614 412 0 1 2 3 0 0,1 0,2 0.3 0 0,10067 0,20542 0,31837 0,10067 0,10475 0,11295 0,10000 0.10201 0,10822 0,11914 201 621 1092 420 471 51 0 1 2 3 0 0,1 0,2 0,3 0 0,10067 0,20541 0,31867 0,10067 0,10474 0,11326 0,10000 0,10201 0,10822 0,11916 201 621 1094 420 473 53 0 0 0 0,10000 1 0,1 0,10067 0,1 W67 0,10201 201 420 473 575 756 1 071 2 0,2 0,20541 0,10474 0,10822 621 53 3 0,3 0,31868 0,11327 0,11916 1094 102 4 0,4 0,44549 0,12681 0,13585 1669 181 5 0,5 0,59246 0,14697 0,16010 2 425 315 6 0,6 0,76851 0,17605 0,19506 3 496 562 7 0,7 0,98368 0,21817 0,24635 5129 1 633 1 071 8 0,8 1,26758 0,28090 0,32468 7 833 2 704 л л 1 г* 2 213 9 0,9 1,64671 0,37913 0,45216 12748 4 915 10 1,0 2,19138 0,54467 <
Вспомогательный бланк Т а б л и ц а 8.27 п хп Уп х2п Угп У'п ^п 5 А4 12^п-2 ОО | со > 1 GJ Аг/„ 0 0 0 0 0 1,0 0,1 0,1 0 0 0 0 0 1,0 0,10000 0,00100 0,10100 1 0,1 0,1 0,01000 0,01000 1,02000 0,10200 0,00100 0,10300 0 0 0 0 0 1,0 0,10000 0,00101 -0,00034 0,10067 1 0,1 0,10100 0,01000 0,01020 1,02020 0,10202 0,00101 + 0,00172 0,10475 2 0,2 0,20400 0,04000 0,04162 1,08162 0,10816 0,00307 + 0,00172 0,11295 0 0 0 0 0 1 0,10000 0,00100 -0,00035 + 0,00002 0,10067 1 0,1 0,10067 0,01000 0,01013 1,02013 0,10201 0,00100 + 0,00175 -0,00002 0,10474 2 0,2 0,20542 0,04000 0,04220 1,08220 0,10822 0,00310 + 0,00175 + 0,00019 0,11326 3 0,3 0,31837 0,09000 0,10136 1,19136 0,11914 0 0 0 0 0 1 0,10000 0,00100 -0,00035 + 0,00002 0,10067 1 0,1 0,10067 0,01000 0,01013 1,02013 0,10201 0,00100 + 0,00175 -0,00002 0,10474 2 0,2 0,20541 0,04000 0,04219 1,08219 0,10822 0,00310 + 0,00175 + 0,00020 0,11327 3 0,3 0,31867 0,09000 0,10155 1,19155 0,11916 0 0 0 0 0 1 0.10000 0,00100 -0,00035 + 0,00002 0,10067 1 0,1 0,10067 0,01000 0,01013 1,02013 0,10201 0,00109 + 0,00175 -0,00002 0,10474 2 0,2 0,20541 0,04000 0,04219 1,08219 0,10822 0,00310 + 0,00175 + 0,00020 0,11327 3 о,з 0,31868 0,09000 0,10156 1,19156 0,11916 0,00547 0,00198 0,00020 0,12681 4 0,4 0,44549 0,16000 0,19846 1,35846 0,13585 0,00834 0,00240 0,00038 0,14697 5 0,5 0,59246 0,25000 0,35101 1,60101 0,16010 0,01212 0,00315 0,00068 0,17605 6 0,6 0,76851 0,36000 0,59061 1,95061 0,19506 0,01748 0,00446 0,00117 0,21817 7 0,7 0,98668 0,49000 0,97354 2,46354 0,24665 0,02564 0,00680 0,00211 0,28090 8 0,8 1,26758 0,64000 1,60676 3,24676 0,32468 0,03416 0,01127 0,00402 0,37913 9 0,9 1,64671 0,81000 2,71165 4,52165 0,45216 0,06374 0,02048 0,00829 0,54467 § 27] МЕТОД АДАМСА - КРЫЛОВА
198 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV Таблицу значений, содержащую основные сведения об искомой функции, мы будем называть основным блан- ком. Все остальные вычисления сведены в таблицу, ко- торую мы называем вспомогательным бланком. Резуль* таты и схема вычислений приведены в табл. 7.27 и 8.27 9- Рассматриваемое нами уравнение не интегрируется в конечном виде; оно относится к так называемым уравне- ниям Риккати. Поэтому мы не имеем возможности срав- нить полученное нами решение с точным. § 28. Простейшие методы прогноза и коррекции. Метод Милна Рассмотрим применение формул приближенного ин- тегрирования дифференциального уравнения первого по- рядка У' = f(x, у) (1.28) с начальным условием X = Хо, У = f/0. (2.28) Остановимся прежде всего на уточненном методе Эйле- ра, рассмотренном в § 26. Следующее значение функции получается здесь по формуле = + (3.28) которая применяется начиная с п = 1 (см. формулы (7.26)). Это значение может быть улучшено следующим путем. Пользуясь снова соотношением между производной и интегралом, напишем хп+1 yn+\ — Vn= J y'dx. (4.28) *) Так как третьи разности получаются довольно большими и быстро изменяются, то следует ожидать, что полученные решения содержат большие погрешности. Для достижения большей точности следовало бы уменьшить шаг. Мы не делаем этого, так как рассмат- риваемый пример имеет лишь иллюстративный характер.
§ 28] МЕТОД МИЛНА 199 К интегралу (4.28) можно применить какую-либо из формул численного интегрирования, например формулу трапеций (4.21). Тогда равенство (4.28) можно переть сать в виде ^+1-^ = 404 + Уп+1)’ откуда ^+1=^+4(к+к+1)- <5-28) Использование формулы (5.28) требует знания произ- водной в точке хп+ь Последняя может быть получена из уравнения (1.28), в котором уп+\ принимается равным значению, полученному по формуле (3.28). Таким образом, программа вычислений по этому но- вому методу, за исключением начальной строки, о кото- рой речь будет идти ниже, выглядит так: 1) находим предварительное значение уп+\ по фор-* муле (3.28); 2) вычисляем значение производной у'п+Р пользуясь дифференциальным уравнением (1.28) и принимая за уп+\ предварительное значение, найденное выше; 3) находим исправленное значение yn+i по формуле трапеций (5.28); 4) исправляем пользуясь дифференциальным уравнением (1.28) с исправленным значением yn+i. Шаги 3) и 4) можно повторять; если получающиеся значения уп+\ сильно различаются между собой, то сле- дует уменьшить шаг расчета. Таким образом, уточненный метод Эйлера дополняет- ся здесь итерационным процессом. Что касается началь- ной строки, то она может быть получена либо обычным способом Эйлера, либо с помощью формулы Тейлора. Чаще всего, однако, поступают так, как указано в § 26. Предварительно обычным методом Эйлера отыски- вают значения у и у' в точке xi/2 = х0 + h/2: У1/2 2 У^ Уу% У^)’ а затем уточненным методом Эйлера значения у{ и у\: У1 = Уо + У1 = 1(.хг
200 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИИ [ГЛ. IV Пример 1.28. Найдем решение дифференциального уравнения у' = ху2 с начальным условием х0 = 0, yQ = 1 на участке [0, 1] с шагом h = 0,1. Вычисления приведены в табл. 1.28. Первая строка вычислена, как было указано выше. Именно, для Таблица 1.28 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) X Первое приближение Исправленное значение У Ошиб- ка У &У У2 У' У 1 У2 1 у' 0 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 1 1,000 1,005 1,020 1,047 1,086 1,142 1,218 1,322 1,466 1,673 1,984 0 0,005 0,020 0,042 0,066 0,095 0,131 0,179 0,246 0,347 0,511 1 1,000 1,010 1,040 1,096 1,179 1,304 1,484 1,748 2,149 2,799 3,936 0 0,050 0,101 0,208 0,329 0,472 0,652 0,890 1,224 1,719 2,519 3,936 1,005 1,020 1,047 1,087 1,143 1,220 1,326 1,473 1,685 2,008 1,010 1,040 1,096 1,182 1,306 1,488 1,758 2,170 2,839 0,101 0,208 0,329 0,473 0,653 0,893 1,231 1,736 2,555 1 1,005 1,020 1,047 1,087 1,143 2,220 1,324 1,471 1,681 2,000 0 0 0 0 0 0 0,002 0,002 0,004 0,008 х = 0,05 значение найдено по методу Эйлера, а для % = 0,1—по формуле у. = у0 + hy\tr Столбцы (2) и (5) содержат предварительное значение у, полученное по формуле (3.28), и предварительное значение у', получен- ное из уравнения (1.28) с помощью у. взятого из столб- ца (2). Столбцы (6) и (8) содержат исправленное по формуле (5.28) значение у и исправленное значение у'. Столбцы (4) и (7) содержат вспомогательные значе- ния у2, используемые для отыскания производной. Ка- ждое следующее значение у в столбце (2) получается прибавлением Ду из столбца (3) к исправленному пре- дыдущему значению у из столбца (6).
МЕТОД МИЛНА 201 § 28] Вычисления показывают, что при х = 0,1, 0,2, 0,3 зна- чения у в столбцах (2) и (6) совпадают. Для проверки точности в столбце (9) даны значения точного решения 2 У = 2~^2 11 в столбце (10) — величина погрешности. Таким образом, описанный метод заключается в сле- дующем: сначала вычисляем предварительное зна- чение уп±\ по формуле (3.28), не содержащей значе- ния z/' + I, и по найденному значению уп+\ из дифферен- циального уравнения (1.28) отыскиваем #' + 1. После этого вычисляем исправленное значение r/n+i по формуле (5.28), уже содержащей у' + 1. Этот итерационный процесс состоит в последовательном чере- довании отыскания уп.л и y'n+v Существует немалое число методов интегрирования дифференциальных уравнений, использующих идею пред- варительного отыскания следующего значения функции, которое используется для вычисления производной, а затем исправляется с помощью этой последней. Все та- кие методы объединяются общим названием методов прогноза и коррекции. Большим достоинством методов прогноза и коррекции является возможность судить о точности получающихся результатов по различию ме- жду предварительным и исправленным значениями функции. Метод Милна, к рассмотрению которого мы перехо- дим, также относится к методам прогноза и коррекции. В этом методе опять-таки предварительное значение функции получается с помощью формулы, аналогичной (3.28), а для исправления этого значения используется не способ трапеций, а более точный способ Симпсона. В основе метода Милна лежит формула Уп+\ ~ Уп-з + "з“(^п-2 — У п-1 + %Уп)* (6.28) Чтобы получить ее, запишем хп+1 Уп+i Уп-з~ J У хп-з
202 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV и заменим у' интерполяционным многочленом F(x), по^ строенным по значениям у' в точках xn_s, xn_2, xn-i и хп: Р Щ-3 + th) = У п-3 + ' Ьу'п-З + Пользуясь результатами § 21, имеем ХП+1 4 J y'dx ~ F(xn_3 + th)dt = хп—з 0 = h [4у'п_3 + 8Д/„_3 + у- Д2у'_3 4- у Д3г<-з] • Заменяя разности A*z/'_3 их выражениями через значе- ния производной, получим формулу (6.28). Эта формула может применяться при п>3. Значение уп-н, найденное по формуле (6.28), позво- ляет при помощи дифференциального уравнения вы- числить Уп+\ ж f (Хп+Р Уп+\)* Дальнейший итерационный процесс производится при помощи формулы Симпсона, примененной к интегралу J у' dx: Уп+i -Уп_{ = 4 (y'n-i + 4у'п + у'п+х). (7.28) Применяя метод Милна, нужно иметь в виду, что для пользования формулой (6.28) необходимо заполнить начальные строки, получив значения у\, у2, у$ и значения производных в этих точках. Они могут быть найдены по формуле Тейлора или по формулам Крылова (13.27) для входа в таблицу. Здесь требуются те же три строки, что и в начале таблицы для метода Адамса — Крылова. Значения у2 и уз могут быть уже пересчитаны и исправ* лены по формуле (7.28). Пример 2.28. Рассмотрим уравнение у' = х + у с начальным условием Хо = О, */о=1, которое решалось
§ 28] МЕТОД МИЛНА 203 Таблица 2.28 X У &У 11 Дт] д2л Ah) 0 0,1 1 1,10000 0,10000 0,10000 0,12000 2000 0 0,1 0,2 1 1,11000 1,24000 0,11000 0,13000 0,10000 0,12100 0,14400 2100 2300 200 0 0,1 0,2 0,3 1 1,11034 1,24267 1,39900 0,11034 0,13233 0,15633 0,10000 0,12103 0,14427 0,16990 2103 2324 2563 221 239 18 0 0,1 0,2 0,3 1 1,11034 1,24280 1,39963 0,11034 0,13246 0,15688 0,10000 0,12103 0,14428 0,16937 2103 2325 2569 222 244 22 0 0,1 0,2 0,3 1 1,11034 1,24280 1,39972 0,11034 0,13246 0,15692 0,10000 0,12103 0,14428 0,16907 2103 2325 2569 222 244 22
204 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ’ IV методом Пикара в § 25 (см. пример 3.25). Выбрав шаг й& = 0,1, рассчитаем первые значения с помощью формул Крылова (13.27). Вычисления приведены в табл. 2.28, причем ввиду простоты нахождения производных вспо- могательный бланк не требуется. Для значений х, которые нужны в этой таблице, по- лучим совпадение всех пяти знаков. Теперь можно приступить к вычислению дальнейших значений функции по способу Милна. Все требуемые вычисления помещены в табл. 3.28. В столбце (2) поме- щены начальные значения функции у и затем значения, Т а б л и ц а 3.28 (1) (2) (3) (4) (3) (6) (7) (8) (9) X У Дг/(-4) / У г у—2 4-2) У У 0 1 I 1 0.1 1,11034 1,21034 1,11034 1,21034 0,2 1,24280 1,44280 4,84136 1,00000 0,24280 1,24280 1,44280 0,3 1,39972 0,58364 1,69972 5,77120 1,21034 0,28938 1,39972 1,69972 0,4 1,58364 0.68709 1,98364 6,79888 1,44281 0,34084 1,58364 1,98364 0,5 1,79743 0,80142 2,29743 7,93456 1,69972 0,39772 1,79744 2,29744 0,6 2,04422 0,92777 2,64422 9,18976 1,98364 0,46059 2,04423 2,64423 0,7 2,32749 1.06742 3,02749 10,57692 2,29744 0,53006 2,32750 3,02750 0,8 2,65’06 1,22175 3,45106 12,11000 2,64423 0,60684 2,65107 3,45107 0,9 3,01918 1,39231 3,91918 13,80128 3,02750 0.С9170 3,01920 3,91920 1 3,43653 4,43654 15,67680 3,45107 0,78548 3,43655 получающиеся по формуле (6.28). Следует иметь в виду, что для получения уп+\ разность, взятая из столбца (3), прибавляется к уп-з- Чтобы подчеркнуть это обстоятель- ство, мы ставим у \у в столбце (3) соответствующий индекс. Значения уп_3 берутся уже исправленными (из столб- ца (8)). Столбец (4) содержит первоначальные значения про- изводной. В столбцах (5) и (6) даны производные в пре- дыдущих точках, используемые для исправления значе- ния функции по формуле (7.28). Найденное приращение помещено в столбце (7) и прибавляется к исправленному значению функции, стоящему в столбце (8) двумя стро- ками выше, вследствие чего у Ду поставлен соответ- ствующий индекс. Наконец, столбец (9) содержит
О ТОЧНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ 205 § 291 исправленные с помощью столбца (8) значения произ- водной. Значение Ду<-4) для столбца (3) получается при по- мощи формулы (6.28) с использованием трех соседних производных из столбца (9). § 29. О точности методов численного интегрирования дифференциальных уравнений Как мы видели в предыдущих главах, для большин- ства приближенных методов математического анализа существуют оценки точности, позволяющие оценить по- грешности полученных результатов. Для методов при- ближенного интегрирования дифференциальных уравне- ний дело обстоит значительно сложнее. Для некоторых методов точные оценки погрешности не существуют вовсе. Задачи с начальными условиями, которые мы здесь рассматриваем, с этой точки зрения являются наиболее неблагоприятными. Дело в том, что погрешности, допу- щенные при определении первоначальных значений 4/ь 4/2,. • • , вызывают систематическое нарастание погреш- ностей при дальнейших вычислениях, причем порядок роста может оказаться довольно большим. Причины такого нарастания можно проиллюстриро- вать следующим примером. Уравнение у" = 10z/ + 1Лу с начальными условиями х0 = 0, z/o = 1, Уо = — 1 имеет точное решение у = е~х. Применение приближенных ме- тодов на участке сравнительно большой длины даст для этого уравнения совершенно непригодные результаты. Действительно, общее решение этого уравнения имеет вид у = С\в~х 4- С2е11х, где Ci и С2— произвольные по- стоянные. В наших условиях Cj = 1, С2 = 0, т. е. компо- нента С2е11х отсутствует. При применении приближенных методов компонента С2е11х, принимающая при х = % зна- чение е, уже для х = £ + 2 вырастает до размеров е • е22 ~ 3,6 • 109е, что полностью перекрывает точное зна- чение решения, так что относительная погрешность ре- зультата будет превосходить 100%. Правда, в большинстве случаев дело обстоит бо- лее благополучно, чем в этом исключительном примере.
Таблица 1.29 X Точное решение У Метод рядов Метод Пикара Метод Эйлера решение ДО Xе погрешность решение у^ погрешность решение погрешность абс. % абс. % абс. | % 0 1,00000 1,00000 0 0 1,00000 0 0 1,00000 0 0 0,1 1,11034 1,11034 0 0 1,11034 0 0 1,10000 0,01034 0,93 0,2 1,24280 1,24280 0 0 1,24280 0 0 1,22000 0,02280 1,84 0,3 1,39972 1.39372 0 0 1,39970 0,00002 0,00 1,36200 0,03772 2,69 0,4 1,58364 1,58364 0 0 1,58355 0,00009 0,01 1,52820 0,05544 3,48 0,5 1,79744 1,79744 0 0 1,79714 0,00030 0,02 1,72102 0,07612 4,24 0,6 2,04423 2,04422 0,00001 0,001 2,04345 0,00078 0,04 1,94312 0,10111 4,90 0,7 2,32750 2,32747 0,00003 0,001 2,32574 0,00176 0,08 2,19743 0,13007 5,58 0,8 2,65107 2,6509.) 0,00008 0,003 2,64753 0,00354 0,13 2,48717 0,16390 6,20 0,9 3,01917 3,01898 0,00019 0,006 3,01459 0,00458 0.15 2,81589 0,29328 6,72 1,0 3,43656 3,43611 0,00045 0,013 3,42510 0,01146 0,33 3,18748 0,24908 7,23 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV Bl
Таблица 1.29 (продолжение) Уточненный метод Эйлера Уточненный метод Эйлера с итерациями Метод Адамса — Крылова Метод Милна решение погрешность решение погрешность решение погрешность решение погрешность абс. % абс. % абс. 1 * абс. 1 % 1,00000 0 0 1,00С00 0 0 1,00000 0 0 1,00000 0 0 1,11000 0,00034 0,03 1,11050 0,00016 0,01 1,11034 0 0 1,11034 0 0 1,24200 0,00080 0,06 1,24310 0,00030 0,02 1,24280 0 0 1,24280 0 0 1,39840 0,00132 0,09 1,40014 0,00042 0,03 1,39972 0 0 1,39972 0 0 1,58178 0,00186 0,12 1,58423 0,00059 0,04 1,58363 0,00001 0,001 1,58364 0 0 1,79476 0,00268 0,15 1,79824 0,00084 0,05 1,79741 0,00003 0,002 1,79744 0 0 2,04063 0,00360 0,18 2,04529 0,00106 0,05 2,04420 0,00003 0,002 2,04423 0 0 2,32289 0,00461 0,20 2,32885 0,00135 0,06 0,32746 0,00004 0,002 2,32750 0 0 2,64521 0,00586 0,22 2,65272 0,00165 0,06 2,65104 0,00003 0,002 2,65107 0 0 3,01193 0,00724 0,24 3,02124 0,00207 0,07 3,01914 0,00003 0,002 3,01920 0,00003 0,001 3,42760 0,00896 0,26 3,43906 1 0,00250 0,07 3,43647 0,00009 0,002 3,43655 0,00001 0,000 § 29] О ТОЧНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ
208 ИНТЕГРИРОВАНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ [ГЛ. IV Например, для некоторых методов установлены точные границы погрешности. Однако при большом числе ша- гов фактическая погрешность оказывается значительно меньшей, чем дают эти оценки. Это объясняется теми же причинами: погрешность нарастает очень быстро, а так как точная оценка должна выполняться и в неблаго- приятных случаях, то нельзя ожидать, чтобы при благо- приятных условиях, когда погрешность остается малой, общая оценка правильно указывала ее порядок. Поэтому практическое значение таких оценок оказывается незна- чительным. Обычно при практическом применении методов при- ближенного интегрирования уравнений ограничиваются ориентировочными представлениями, среди которых ос- новную роль играет сравнение приближений, полученных с различным шагом. Для методов, опирающихся на применение интерпо- ляционных формул, можно получить сравнительно точ- ные оценки. К таким методам относятся, например, методы Адамса — Крылова и Милна. Тем не менее прак- тическое значение этих оценок по-прежнему мало, так как они содержат высшие производные искомой функ- ции, которые в свою очередь нужно оценивать прибли- женно с помощью разностей высших порядков. В связи с этим мы не станем подробно останавли- ваться на этих оценках, ограничившись сделанными об- щими замечаниями. Для иллюстрации точности рассмо- тренных методов приведем еще один пример уравнения первого порядка, которое будет решено всеми рассма- тривавшимися в предыдущих параграфах методами. Пример 1.29. Рассмотрим дифференциальное урав- нение , У = * + У с начальными условиями х0 = 0, у0 = 1- Это уравнение рассматривалось в § 25 (пример 3.25) и в § 28 (при- мер 2.28). В табл. 1.29 приводятся значения его точного решения у = 2ех— х— 1 для отрезка [0, 1] с шагом h = = 0,1, а также значения приближенных решений, полу- ченных различными методами. Для каждого из прибли- женных решений даются абсолютные и относительные погрешности.
ЧАСТЬ ВТОРАЯ ЭЛЕМЕНТЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ ГЛАВА V СОБЫТИЯ И ВЕРОЯТНОСТЬ § 30. Основные понятия. Классическое определение вероятности Под событием мы будем понимать всякое явление, которое происходит или не происходит. Легко понять, что эта фраза отнюдь не может служить точным определе- нием в том смысле, как мы понимаем математическое определение, однако мы вынуждены им ограничиться. Для большей ясности приведем некоторые примеры. Так, например, событием является выпадение герба при бросании монеты, выпадение того или иного числа очков (например, шестерки) при бросании игральной кости, попадание в цель при выстреле, нахождение молекулы газа в заранее выделенном объеме и т. п. Различные события мы будем обозначать буквами Л,В,... Событие называют достоверным, если оно непременно должно произойти. Так, достоверным является выпаде- ние не более шести очков при бросании обычной играль- ной кости, появление белого шара при извлечении из урны, содержащей только белые шары, и т. д. Наоборот, событие называют невозможным, если оно заведомо не наступит. Примерами невозможных событий являются извлечение более четырех тузов из обычной карточной колоды, появление красного шара из урны, содержащей лишь белые и черные шары, и т. д. Пусть А — некоторое событие. Под событием, проти- воположным ему, будем понимать событие, состоящее в том, что А не наступило. Его обозначают через А. Если, 14 Р. С. Гутер, Б. В. Овчинский
210 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ. V скажем, событие А состоит в появлении красной масти при вытаскивании карты из колоды, то А означает по- явление черной. События А и В называют несовместными, ес^ч на- ступление одного из них исключает возможность насту- пления другого. Так, появление любого возможного чис- ла очков при бросании игральной кости (событие А) несовместно с появлением *иного числа (событие В). Вы- падение четного числа очков несовместно с выпадением нечетного числа. Наоборот, выпадение четного числа очков (событие Д) и числа очков, кратного трем (собы- тие В), не будут несовместными, ибо выпадение шести очков означает наступление и события А и события В, так что наступление одного из них не исключает насту- пления другого. Легко понять, что события А и А всегда будут несовместными. Рассмотрим некоторую совокупность событий Д, В,... L. Эти события принято называть единственно воз- можными, если в результате каждого испытания хотя бы одно из них наверное наступит. Говорят также, что рассматриваемые события образуют полную группу со- бытий. Так, например, при бросании игральной кости полную группу образуют события, состоящие в выпаде- нии одного, двух, трех, четырех, пяти и шести очков. Теперь мы можем перейти к рассмотрению важней- шего понятия вероятности события. Рассмотрим систему конечного числа событий Д1, Д2,..., Ап, относительно которой сделаем следую- щие предположения: 1. Эти события попарно несовместны; иначе го- воря, для любых двух событий Ai и Ak = 1,2, ..., и, i4=k) появление одного из них исключает появление другого. 2. События Дь Д2,..., Ап единственно возможны, т. е. какое-либо одно из них непременно должно наступить. 3. События Д1,Д2, ...,ДП равновозможны. Это озна- чает, что не существует никаких объективных причин, вследствие которых одно из них могло бы наступать чаще, чем какое-либо другое. Пусть имеется событие А, которое наступает при по- явлении некоторых из наших «элементарных» событий
ОСНОВНЫЕ понятия 211 § 30] Ль Л2,... ,Ап и не наступает при появлении других. Мы будем говорить в таком случае, что те из «элементар- ных» событий Л*, при наступлении которых наступает также событие Л, благоприятствуют событию Л. Допустим, что из общего числа п рассматриваемых событий Л1,Л2, ...,ЛП событию Л благоприятствует m из них. Тогда вероятностью события А называется отно- шение числа событий, благоприятствующих событию Л, к общему числу всех равновозможных событий. Если, как это принято, обозначить вероятность события Л че- рез Р(Л), то мы получаем, по определению, Р(Л) = —. х 7 п Поясним приведенное нами определение примером. Рассмотрим бросание игральной кости и обозначим через Л1,Л2, ...,Л6 события, состоящие в выпадении соответ- ственно одного, двух,..., шести очков. Легко проверить, что эти события удовлетворяют всем сделанным выше предположениям. Отсюда следует, что Р(Л,.) = Р(Л2) = ... =Р(Л6) = |, потому что каждому из этих событий благоприятствует только оно само, так что здесь m = 1, а п = 6. Если событие Л означает появление четного числа очков, то ему благоприятствуют события Л2, Л4, Л6, со- стоящие в появлении двух, четырех и шести очков. По- этому для события А имеем m = 3, так что Р(Л) = 3/6 =* = v2. Пусть событие В состоит в появлении числа очков, кратного трем. Тогда событию В благоприятствуют «эле- ментарные» события Л3 и Лб, откуда следует, что для со- бытия В имеем m = 2. Поэтому Р(В) = 2/б = 7з- Приведенное нами определение вероятности носит на- звание классического определения. При всей его ясности и простоте у него есть недостатки, на которых мы по- дробно остановимся в дальнейшем (см. § 33). Сейчас мы хотим отметить некоторые простые свой- ства вероятности, основываясь на приведенном опреде- лении. 14*
212 СОБЫТИЯ и ВЕРОЯТНОСТЬ [ГЛ. V Прежде всего, легко заметить, что для любого собы- тия А число благоприятствующих событий т удовлетво- ряет неравенствам O^m-^/i. Поэтому вероятность лю- бого события А подчинена условиям 0<Р(Л) <1. Далее, если обозначить через Е некоторое достовер- ное событие, то ему, очевидно, должны благоприятство- вать все «элементарные» события Ль так что для него должно быть т = п. Поэтому вероятность достоверного события равна единице Р(Е) = 1. Если, наоборот, U — невозможное событие, то из са- мого определения следует, что здесь т = 0, так что ве- роятность невозможного события равна нулю Р((/)=0. Рассмотрим несколько примеров, разъясняющих вве- денное нами понятие вероятности. Пример 1.30. В урне находятся три синих, восемь красных и девять белых шаров одинакового размера и веса, неразличимых наошупь. Шары тщательно переме- шаны. Какова вероятность появления синего, красного и белого шаров при одном вынимании шара из урны. Так как появление любого шара можно считать рав- новозможным, то мы имеем всего /1 = 3 + 8 + 9 = 20 эле- ментарных событий. Если через Л, В, С обозначить со- бытия, состоящие в появлении соответственно синего, красного и белого шаров, а через mi, m2, m3 — число благоприятствующих этим событиям случаев, то ясно, что /71! =3, т2 = 8, т3 = 9. Поэтому Р (4) = А =0,15; Р(В) = А = о,4О; Р (С) = + = 0,45. Пример 2.30. Одновременно бросаются две играль- ные кости, на гранях которых нанесены очки 1, 2, 3, 4, 5, 6. Какова вероятность того, что сумма очков, выпав- ших на двух костях, равна восьми. Так как любое из возможного числа очков на одной кости может сочетаться с любым числом очков на дру-
ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 213 § 31] гой, то общее число различных случаев равно п = 6*6 = = 36. Легко убедиться в том, что все эти случаи попар- но несовместны, равповозможны и образуют полную группу событий. Для ответа на вопрос следует подсчи- тать, в каком числе случаев сумма очков равна восьми. Это будет, если число очков на брошенных костях равно 2 + 6, 3 + 5, 4 + 4, ‘ 5 + 3, 6 + 2, причем первое слагаемое означает число очков на пер- вой, а второе — на второй кости. Отсюда видно, что со- бытию Л, состоящему в том, что сумма очков, выпав- ших на двух костях, равна восьми, благоприятствует т = 5 случаев. Поэтому § 31. Сложные вероятности. Теоремы сложения и умножения. Условные вероятности Непосредственный подсчет случаев, благоприятствую- щих данному событию, может оказаться затруднитель- ным. Поэтому для определения вероятности события бы- вает выгодно представить данное событие в виде ком- бинации некоторых других, более простых событий. При этом, однако, надо знать правила, которым подчиняются вероятности при комбинации событий. Именно к этим правилам и относятся упомянутые в названии параграфа теоремы. Первая из них относится к подсчету вероятности того, что осуществится хотя бы одно из нескольких со- бытий. Теорема сложения. Пусть А и В — два несо- вместных события. Тогда вероятность того, что осущест- вится хотя бы одно из этих двух событий, равна сумме их вероятностей, т. е. Р(Л или В)=Р(Л)+Р(В). (1.31) Доказательство. Пусть Ль Л2, ..., Л„ — полная группа п попарно несовместных событий. Если Р(Л) = р| = -~-, Р (В) — р2 = то среди этих п
214 СОБЫТИЯ и ВЕРОЯТНОСТЬ [ГЛ. V элементарных событий имеется событий, благоприят- ствующих А, и т2 событий, благоприятствующих В. Так как события А и В несовместны, то никакое из со- бытий Ai не может благоприятствовать обоим этим событиям. Событию (Л или В), состоящему в том, что наступает хотя бы одно из этих двух событий, благо- приятствует, очевидно, как каждое из событий Лг-, бла- гоприятствующих Л, так и каждое из событий Лг-, благо- приятствующих В. Поэтому общее число событий, бла- гоприятствующих событию (Л или В), равно сумме /П1 + т2, откуда следует Р(4 или В) = ^-^- = ^ + ^- = р14-р2 = Р(Л) + Р(В), что и требовалось доказать1). Нетрудно видеть, что теорема сложения, сформулиро- ванная выше для случая двух событий, легко перено- сится на случай любого конечного числа их. Именно, если Л, В, С, ..., L — несовместные события, то Р(Л, или В, или С, или ..., или L) = = Р(Л) + Р(В) + Р(С)+ ... +Р(А). (2.31) Для случая трех событий, например, можно написать Р(Л, или В, или С) = Р[(Л или В), или С] = = Р(Л или В) + Р(С), откуда уже следует наше утверждение. Аналогично про- водится доказательство при любом другом конечном числе событий. Важным следствием теоремы сложения является утверждение: если события Ah Л2, ..., Лп несовместны и единственно возможны, то Р(4,) + Р(42)+ ... +Р(.4„)=1. (3.31) Действительно, событие (41 или А2, или ..., или 4П), по предполжению достоверно, и его вероятность, как было указано в § 30, равна единице. В частности, если А и А означают два взаимно противоположных события, то Р(4) + Р(Л)=1. *) Заметим, что Р (Л) + Р (В) 1, так как mt + m2 п.
§ 31] ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 215 Проиллюстрируем теорему сложения примерами. Пример 1.31. При стрельбе по мишени вероятность сделать отличный выстрел равна 0,3, а вероятность сде- лать выстрел на оценку «хорошо» равна 0,4. Какова ве- роятность получить за сделанный выстрел оценку не ниже «хорошо»? Если событие А означает получение оценки «от- лично», а событие В — получение оценки «хорошо», то Р(Д или В) =Р (Л)+Р (В) =0,7. Пример 2.31. В урне, содержащей п шаров белого, красного и черного цвета, находятся k белых шаров и I красных. Какова вероятность вынуть шар не черного цвета? Если событие А состоит в появлении белого, а собы- тие В — красного шара, то появление шара не черного цвета означает появление белого либо красного шара. Так как по определению вероятности Р(Л)=|, Р(В) = |, то по теореме сложения вероятность появления шара не черного цвета равна Р(Д или в) = -+- = —. v 7 п ‘ п п Эту задачу можно решить и так. Пусть событие С состоит в появлении черного шара. Число черных шаров равно п—(& + /), так что Р(С) = ——~Появление шара не_черного цвета является противоположным со- бытием С, поэтому на основании указанного выше след- ствия из теоремы сложения имеем Р(С) = 1 -Р(С)= 1- = -^-, как и раньше. Прежде чем перейти к следующей теореме, необ- ходимо ознакомиться с новым важным понятием — по- нятием условной вероятности. Для этой цели мы начнем с рассмотрения следующего примера.
216 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ V Пусть на складе имеется 400 электрических лампо- чек, изготовленных на двух различных заводах, причем на первом изготовлено 75% всех лампочек, а на вто- ром— 25%. Допустим, что среди лампочек, изготовлен- ных первым заводом, 83% удовлетворяют условиям определенного стандарта, а для продукции второго за- вода этот процент равен 63. Определим вероятность того, что случайно взятая со склада лампочка окажется удов- летворяющей условиям стандарта. Для того чтобы подсчитать интересующую нас веро- ятность, заметим, что общее число имеющихся стандарт- ных лампочек состоит из 400 • 0,75 • 0,83 = 249 лампочек, изготовленных первым заводом, и 63 лампочек, изготов- ленных вторым заводом, т. е. равно 312. Так как вы- бор любой лампочки следует считать равновозможным, то мы имеем 312 благоприятствующих случаев из 400, так что P(«)-W-0.7S, где событие В состоит в том, что выбранная нами лам- почка стандартна. При этом подсчете не делалось никаких предположе- ний о том, к продукции какого завода принадлежит вы- бранная нами лампочка. Если же какие-либо предполо- жения такого рода сделать, то очевидно, что интересую- гая нас вероятность может измениться. Так, например, если известно, что выбранная лампочка изготовлена на первом заводе (событие Л), то вероятность того, что она стандартна, будет уже не 0,78, а 0,83. Такого рода вероятность, т. е. вероятность события В при условии, что имеет место событие Л, называют услов- ной вероятностью события В при условии наступления события А и обозначают РА(В). Если мы в предыдущем примере обозначим через Л событие, состоящее в том, что выбранная лампочка из- готовлена на первом заводе, то мы можем написать Р4(В)=0,83. Теперь мы можем сформулировать важную теорему, относящуюся к подсчету вероятности совмещения со- бытий.
ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 217 § 311 Теорема умножения. Вероятность совмещения событий А и В равна произведению вероятности одного из событий на условную вероятность другого в предпо- ложении, что первое имело место: Р(Л и В) = Р(Л)РА(В). (4.31) При этом под совмещением событий А и В пони- мается наступление каждого из них, т. е. наступление как события Л, так и события В. Доказательство. Рассмотрим полную группу из п равновозможных попарно несовместных событий Ль Л2, Л??, каждое из которых может быть благоприят- ствующим или неблагоприятствующим как для собы- тия Л, так и для события В. Разобьем все эти события на четыре различные группы следующим образом. К первой группе отнесем те из событий Л], Л2, Лп, которые благоприятствуют и событию Л, и событию В; ко второй и третьей группам отнесем такие события Лг-, которые благоприятствуют одному из двух интересующих нас событий и не благо- приятствуют другому, например ко второй группе — те, которые благоприятствуют Л, но не благоприятствуют В, а к третьей — те, которые благоприятствуют В, но не благоприятствуют Л; наконец, к четвертой группе отне- сем те из событий Лг-, которые не благоприятствуют ни Л, ни В. Так как порядок нумерации событий Ль Л2, Ап не играет роли, то можно предположить, что это разбие- ние на четыре группы выглядит так: I группа Ль Л2, ...» Ak, II группа Ak+h Ak+2, ..., Ak+b III группа Ak+l+b Л^+/+2, AkU+m, IV группа Ak+l+m+h ..Ап. Таким образом, среди п равновозможных и попарно несовместных событий Ль Л2, Ап имеется k событий, благоприятствующих и событию Л, и событию В, / со- бытий, благоприятствующих событию Л, но не благо- приятствующих событию В, m событий, благоприят-
218 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ. V ствующих В, но не благоприятствующих Л, и, наконец, п—(k + 1 + т) событий, не благоприятствующих ни Л, ни В. Заметим, между прочим, что какая-либо из рассмот- ренных нами четырех групп (и даже не одна) может не содержать ни одного события. В этом случае соответ- ствующее число, означающее количество событий в та- кой группе, будет равно нулю. Произведенная нами разбивка на группы позволяет сразу написать Р(ДиВ) = 4, Р(Д) = -^-> Р(В) = -Ц^, ибо совмещению событий Л и В благоприятствуют со- бытия первой группы и только они. Общее число собы- тий, благоприятствующих Л, равно общему числу собы- тий в первой и второй группах, а благоприятствую- щих В — общему числу событий в первой и третьей группах. Подсчитаем теперь вероятность РА(В), т. е. вероят- ность события В при условии, что событие Л имело место. Теперь события, входящие в третью и четвертую группы, отпадают, так как их появление противоречило бы наступлению события Л, и число возможных случаев оказывается равным уже не n, a k + l. Из них событию В благоприятствуют лишь события первой группы, так что мы получаем Для доказательства теоремы достаточно теперь на- писать очевидное тождество & _ k + I k п п k +1 и заменить в нем все три дроби вычисленными выше ве- роятностями. Мы придем к утверждавшемуся в теореме равенству Р(Л и В) = Р(Л)Рл(В). Ясно, что написанное нами выше тождество имеет смысл лишь при k + что справедливо всегда, если только Л не есть невозможное событие.
§ 31] ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 219 Так как события А и В равноправны, то, поменяв их местами, получим другую форму теоремы умножения: Р(Д и В) = Р(В)Рв(Д). (5.31) Впрочем, это равенство можно получить тем же путем, что и предыдущее, если заметить, что Рв (Д) = > и воспользоваться тождеством—= —------'^"+т * Сравнивая правые части двух выражений для вероят- ности Р (Д и В), получим равенство Р(Д)Рд(В) = Р(В)Рв(Д), (6.31) которое часто применяется. Рассмотрим теперь примеры, иллюстрирующие тео- рему умножения. Пример 3.31. В продукции некоторою предприятия признаются годными (событие Д) 96% изделий. К пер- вому сорту (событие В) оказываются принадлежащими 75 изделий из каждой сотни годных. Определить вероят- ность того, что произвольно взятое изделие будет год- ным и принадлежит к первому сорту. Искомая вероятность есть вероятность совмещения событий Д и В. По условию имеем Р(Д)=0,96 и Ра(В)=о ,75. Поэтому теорема умножения дает Р(Д и В) =0,96-0,75 = 0,72. Пример 4.31. Вероятность попадания в цель при от- дельном выстреле (событие Д) равна 0,2. Какова вероят- ность поразить цель, если 2% взрывателей дают отказы (т. е. в 2% случаев выстрела не произойдет)? Пусть событие В состоит в том, что выстрел произой- дет, а В означает противоположное событие. Тогда по условию Р (В) =0,02 и, согласно следствию из теоремы сложения, Р(В) = 1 — Р (В) =0,98. Далее, по условию Рв(Д)=Р1=0,2. Поражение цели означает совмещение событий В и /1 (выстрел произойдет и даст попадание), поэтому по тео- реме умножения р=Р(Д и В) = Р(В)Рв(Д) =0,196.
220 СОБЫТИЯ И ВЕРОЯТНОСТЬ 1ГЯ V Важный частный случай теоремы умножения можно получить, если воспользоваться понятием неза- висимости событий. Два события называются независимыми, если веро- ятность одного из них не изменяется в результате того, наступило или не наступило другое. Примерами независимых событий являются выпаде- ние различного числа очков при повторном бросании игральной кости или той или иной стороны монет при повторном бросании монеты, так как очевидно, что ве- роятность выпадения герба при втором бросании рав- на V2 независимо от того, выпал или не выпал герб в первом. Аналогично вероятность вынуть во второй раз белый шар из урны с белыми и черными шарами, если выну- тый первым шар предварительно возвращен, не зависит от того, белый или черный шар был вынут в первый раз. Поэтому результаты первого и второго извлечения неза- висимы между собой. Наоборот, если шар, вынутый пер- вым, не возвращается в урну, то результат второго извле- чения зависит от первого, ибо состав шаров, находя- щихся в урне после первого извлечения меняется в зависимости от его исхода. Здесь мы имеем пример за- висимых событий. Пользуясь обозначениями, принятыми для условных вероятностей, можно записать условие независимости событий А и В в виде Рл(В) = Рд (В) = Р(В) или Рв(А)=РвИ) = Р(Л). Воспользовавшись этими равенствами, мы можем привести теорему умножения для независимых событий к следующей форме: Если события А и В независимы, то вероятность их совмещения равна произведению вероятностей этих со- бытий Р(А и В) = Р(А)Р(В). (7.31) Действительно, достаточно в первоначальном выра- жении теоремы умножения положить Рд (В) = Р(В), что
§ ЗЦ ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 221 вытекает из независимости событий, и мы получим тре- буемое равенство Рассмотрим теперь несколько событий* Л, В, ..., L. Будем называть их независимыми в совокупности, если вероятность появления любого из них не зависит от того, произошли ли какие-либо другие рассматриваемые со- бытия или нет *). В случае событий независимых в совокупности тео- рема умножения может быть распространена на любое число событий. Тогда ее можно формулировать так: Вероятность совмещения событий А, В, ... ,L, незави- симых в совокупности, равна произведению вероятностей этих событий Р(Д, и В, и ..., и £)=Р(Д)Р(В) ... P(L). (8.31) Пример 5.31. Рабочий обслуживает три автомати- ческих станка, к каждому из которых нужно подойти для устранения неисправности, если станок остановится. Ве- роятность того, что первый станок не остановится в те- чение часа, равна 0,9. Та же вероятность для второго станка равна 0,8 и для третьего — 0,7. Определить ве- роятность того, что в течение часа рабочему не потре- буется подойти ни к одному из обслуживаемых им станков. Если считать станки работающими независимо друг от друга, то в силу теоремы умножения искомая вероят- ность совмещения трех событий равна произведению 0,9-0,8.0,7 = 0,504. Пример 6.31. Вероятность сбить самолет винто- вочным выстрелом р = 0,004. Какова вероятность унич- тожения неприятельского самолета при одновременной стрельбе из 250 винтовок. Вероятность того, что при одиночном выстреле са- молет не будет сбит, по теореме сложения равна 1 — р = 0,996. Тогда можно подсчитать с помощью тео- ремы умножения вероятность того, что самолет н е будет сбит при 250 выстрелах, как вероятность 1 Для того, чтобы события были независимыми в совокупности, недостаточно, чтобы они были лишь попарно независимы.
222 СОБЫТИЯ и ВЕРОЯТНОСТЬ [ГЛ. V совмещения событий. Она равна 0,996250. После этого мы можем снова воспользоваться теоремой сложения и найти вероятность того, что самолет будет сбит, как вероятность противоположного события 1 — 0,996250 « 0,63. Отсюда видно, что хотя вероятность сбить самолет одиночным винтовочным выстрелом ничтожно мала, тем не менее при стрельбе из 250 винтовок вероятность сбить самолет оказывается уже весьма ощутимой. Она существенно возрастает, если число винтовок увеличить. Так, при стрельбе из 500 винтовок вероятность сбить самолет, как легко подсчитать, равна 1 —0,996500 ~ 0,87, а при стрельбе из 1000 винтовок — даже 1 — 0,9961000 ~ ~ 0,98. Пример 7.31. Можно разобрать теперь пример 6.31 в самом общем виде. Пусть вероятность наступления некоторого события при отдельном испытании равна р. Решим два следующих вопроса: а) какова вероятность Р, что это событие наступит хотя бы один раз при N независимых испытаниях? б) сколько требуется произвести испытаний, чтобы вероятность наступления события хотя бы один раз была не меньше 1 — е? Повторяя рассуждения, приведенные в примере 6.31, получим, что решение задачи а) дается формулой Р = 1—(1— Для решения задачи б) требуется решить неравен- ство Р > 1 — е, что дает In е In (1 -р) § 32. Полная вероятность. Формула Бейеса При вычислении вероятностей сложных событий ча- сто приходится одновременно применять теоремы сло- жения и умножения. Перед выводом общей формулы рассмотрим следующий пример. Пример 1.32. Имеется три одинаковых на вид урны с различным составом белых и черных шаров.
32] ПОЛНАЯ ВЕРОЯТНОСТЬ. ФОРМУЛА БЕЙЕСА 223 Пусть в первой урне находится т,\ белых и П\ черных шаров, во второй урне соответственно пг2 белых и ft? черных и, наконец, в третьей — т3 белых и п3 черных шара. Выбирается наугад одна из урн1), и из нее выни- мается один шар. Требуется определить вероятность того, что вынутый шар окажется белым. Предположим сначала, что шар вынут из первой урны. Можно сказать, что это предположение означает наступление события или осуществление ги- потезы Н\. Так как выбор любой урны равновероя- тен, то вероятность этой гипотезы равна P(//i)=l/3. Из предположения о составе шаров следует, что вероят- ность вынуть белый шар из перво?! урны (событие Д1) равна Рассмотрим сложное событие, состоящее в том, что выбрана первая урна и вынутый из нее шар оказался белым. Тогда вероятность такого события, в силу тео- ремы умножения, будет равна (см. формулу (4.31)). Точно так же вероятность вынуть белый шар из второй урны есть вероятность сложного события, состоящего в совмещении события Н2 (вы- брана вторая урна) и события А2 (из второй урны вы- нут белый шар), в результате чего эта вероятность равна а для третьей урны Р (Яз и Д3) = Р (Яз) Ря, (Дз) 4 • о m3 -f- Пз Пусть теперь событие А означает извлечение белого шара независимо от того, из какой именно урны он был вынут. Тогда, учитывая, что события Н2, Н3 яв- ляются несовместными, ибо выбирается лишь одна урна, мы можем воспользоваться для отыскания вероятности То есть выбор каждой урны равновероятен.
224 СОБЫТИЯ и ВЕРОЯТНОСТЬ [ГЛ. V события А теоремой сложения (1.31), которая дает Р (Л) = Р [(ZZi и Л|), или (Я2 и А)» или (Я3 и Л3)] = ~ Р (#1) РЯ1 (Л1) + Р (Я2) Ря2 (Л2) + Р (Я3) РЯз (Л3) - = 1 ( ml I ffl2 I \ 3 \ mj + ni ‘ т2 + п2 ’ т3 + п3 / * Сформулируем теперь общую задачу. Пусть собы- тия Н2, ..., Нп образуют полную группу событий и при наступлении каждого из них, например собы- тие Л может наступить с некоторой условной вероят- ностью РЯ/(Л). Какова будет при этом вероятность на- ступления события Л? Воспользовавшись, как и в примере 1.32, теоремой умножения (4.31), найдем, что вероятность наступле- ния Л при условии наступления Н\ равна Р(Я1 и Л) = Р(//1)Ря1(Л). (1.32) Аналогично Р(Я2 и Л) = Р(//2)Ря2(Л), ............................... (2.32) P(tf„ и Л) = Р(Яп)Ряя(Л). Теперь для отыскания вероятности события Л можно воспользоваться теоремой сложения (1.31), так как со- бытия //j, Н2, ..., Нп несовместны. Складывая все ра- венства (1.32) и (2.32), приходим к формуле Р (Л) = Р (/Л) Ря. (Л) + Р (Я2) Ря, (Л) + ... + Р (Нп) Рнп (А) или, короче, п Р(Л)=2РШРяДЛ). (3.32) Формула (3.32) называется формулой полной вероят- ности. События Н\, Н2, ..., Нп обычно называют в таких случаях гипотезами. В примере 1.32 имелось три гипо- тезы (п = 3), которые были равновероятны между со- бой: Р(Я1) = Р(Я2)= Р(Я3)= 1/3. Пример 2.32. При разрыве снаряда образуются крупные, средние и мелкие осколки, причем число круп-
§ 32] ПОЛНАЯ ВЕРОЯТНОСТЬ. ФОРМУЛА БЕЙЕСА 225 ных осколков составляет 0,1 их общего числа, а число средних и мелких — соответственно 0,3 и 0,6 общего числа осколков. При попадании в танк крупный оско- лок пробивает броню с вероятностью 0,9, средний — с вероятностью 0,3 и мелкий — с вероятностью 0,1. Ка- кова вероятность того, что попавший в броню осколок пробьет ее? В нашем примере имеется три гипотезы, вероятности которых Р(//1) = 0,1, Р(#2) = 0,3 и Р(#з) = 0,6. Поль- зуясь формулой полной вероятности (3.32), находим Р (Л) = 0,1 • 0,9 + 0,3 • 0,3 4- 0,6 • 0,1 = 0,24. Используя формулу полной вероятности, можно по- лучить еше одну важную формулу, которая потребуется для теории ошибок (см. гл. VII). Эта формула назы- вается формулой Бейеса или формулой вероятностей гипотез. Пусть мы имеем некоторую полную группу собы- тий— гипотез 2, ..., п), вероятность каждой из которых P(Hi) до производства опыта имеет определенное значение. Предположим, что в ре- зультате опыта наступило некоторое событие А. Появ- ление этого нового сведения — наступление события А — может повлечь за собой изменение первоначальных вероятностей гипотез. Поясним сказанное примером. Пример 3.32. Пусть урна содержит три шара бе- лого и черного цвета, однако распределение числа ша- ров по цветам неизвестно. До производства опыта о со- держимом урны можно сделать четыре гипотезы: 1) 3 белых и 0 черных (/Л), 2) 2 белых и 1 черный (Н2), 3) 1 белый и 2 черных (/73), 4) 0 белых и 3 черных (Н4), которые можно считать равновероятными: P(/7i) = = Р(//2)= Р(77з) = Р(/Л)= 1/4. Допустим, что в ре- зультате опыта был вынут белый шар (событие А). В таком случае вероятность гипотезы Н4 делается рав- ной нулю. Вероятности остальных трех гипотез также 15 Р С Гутер, Б. В. Овчинский
226 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ. V изменятся, причем их уже нельзя будет считать равно- вероятными; вероятность гипотезы Н{, например, больше, чем вероятность гипотезы Н3. Поставим вопрос в общем виде: выяснить, каковы будут вероятности гипотез Hi после опыта в пред* положении, что в результате опыта наступило собы- тие А. Обозначим вероятности гипотез Hif Н2, ..., Нп до производства опыта соответственно через ai, аг, ...» ап Р(Я/) = а» (г= 1, 2, п), 5^ = 1. 1=1 Вероятности тех же гипотез после опыта, в результате которого наступило событие Л, обозначим через Р1, ₽2, ..»> Рп- РаШ-Р, (/= 1, 2, ..., п), причем снова 21. 1=1 так как события Н2, Нп по-прежнему несо- вместны и единственно возможны. Обозначим условную вероятность РН/(Л) через pt и полную вероятность со- бытия А через Р(Д) = Р. Пользуясь равенством (6.31), полученным из тео- ремы умножения, напишем P(H1)Ph1(A)=-P(A)Pa(Hi) или, с введенными обозначениями, O^iPi = Ррг* Отсюда Подставляя сюда выражение для полной вероятности Р из формулы (3.32), получим R — -- =___________а*Р*_____________ (л ооХ Л, а1Р1 + О^2р2 + • * • + Ct/lPrt * \ • / 2 «/Р/ 1 = 1
$ 32] ПОЛНАЯ ВЕРОЯТНОСТЬ. ФОРМУЛА БЕЙЕСА 227 Нетрудно проверить, что сумма всех вероятностей р< действительно равна единице. Формула (4.32), дающая выражение вероятности ги- потезы Hi после опыта, и есть нужная нам формула Бейеса. Отметим важное следствие этой формулы, кото- рое будет использовано в дальнейшем. Если все гипо- тезы Hi до производства опыта равновероятны, т. е. Р(/Л) = Р(//2) = ... =Р (Нп) или ой = «2 = ... = ап = а, то формула (4.32) примет вид Pi = —Г—Г—т— • (5.32) Из формулы (5.32) находим, что при любом i (г=1, 2, ..., п) Р/ „ 1 _ с Р1 Р1 + Рг+ ... + рп Таким образом, Ь = Ср< (i= 1, 2, .п). (6.32) Напомним, что pi означает вероятность наступив- шего в результате опыта события А в предположении гипотезы Hi. Поэтому формула (6.32) утверждает, что если все .гипотезы до опыта равновероятны, то вероят- ности гипотез после опыта пропорциональны вероятно- стям наблюденного события в предположении соответ- ствующей гипотезы. Вернемся снова к примеру 3.32. В соответствии с принятыми обозначениями имеем а1 = а2 = аз=а4 = 1/4, т. е. применима формула (6.32). Далее, находим Р1 = РЯ(4)=1, Р2 = У’ ^з=з"» = Следовательно, Q =______!______= _1 с 1 + 2/3+1/3 + 0 2* Окончательно получим Рд(Я() = |. РдШ = |, Рд(Яз) = -|, Рд(Я4) = 0. 15 *
228 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ. V § 33. Другие определения вероятности Рассмотренное выше определение вероятности, кото- рое мы назвали классическим, оказывается непримени- мым во многих случаях, важных для приложений. Прежде всего, далеко не всегда удается разложить рассматриваемое событие на равновозможные случаи. Далее, для классического определения вероятности тре- буется рассмотрение конечного числа единственно возможных и несовместных равновозможных событий. хМежду тем, добиться конечности числа допустимых случаев далеко не всегда удается. Нужно отметить, кроме того, что понятие равно- возможности, которым мы пользовались при опре- делении вероятности, означает, собственно говоря, по- нятие равновероятности, так что при класси- ческом определении вероятности уже приходится пользоваться понятием равновероятности. В ряде случаев можно воспользоваться геометриче- ским определением вероятности, сущность которого вы- ясняется следующим примером. Пример 1.33. Территория нефтебазы имеет форму прямоугольника со сторонами а = 50 м и b = 30 м. На территории имеются четыре круглых нефтебака, диа- метром 10 м каждый. Какова вероятность прямого по- ражения нефтебаков бомбой, попавшей на территорию нефтебазы, если попадание бомбы в любую точку оди- наково вероятно? Ясно, что здесь речь идет о вероятности попадания точки в некоторую область. Рассмотрим сначала более простые случаи. Пусть прямоугольник разделен осями симметрии на четыре равные части. Тогда можно считать, что попадание в каждую из этих частей равновозможно. Так как число частей конечно, то здесь применимо классическое опре- деление вероятности и вероятность попадания в любую из этих частей равна V4. Аналогично, если разбить пря- моугольник на п равных частей, то вероятность попа- дания в каждую из них будет равна 1/п, т. е. отношению площади каждой части к площади всего прямоуголь- ника. Если указанные части не равны, но р а в н о в е-
§ 33] ДРУГИЕ ОПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ 229 лики, т. е. имеют одинаковую площадь, то все равно попадание точки в каждую из них будем считать рав- новероятным. Таким образом, если прямоугольник раз- бит на некоторое число п равновеликих частей, то вероятность попадания в каждую из них равна 1/п. Теперь ясно, что если взять область, соизмери- мую с прямоугольником, т. е. прямоугольник можно разбить на конечное число равновеликих частей, таких, что в данной области будет содержаться целое число их, то вероятность попадания в эту область будет равна отношению ее площади к площади прямоугольника. Если же область и прямоугольник несоизмери- мы (т. е. отношение их площадей иррационально), то указанное разбиение невозможно. Это означает, что при определении вероятности попадания в такую область мы не сможем воспользоваться классическим определением вероятности, так как не сможем образовать полную группу, состоящую из конечного числа равновоз- можных событий. Введем поэтому новое определение, которое назовем геометрическим определением вероят- ности. Пусть D — некоторая конечная область. В эту об- ласть бросается точка, причем попадание ее в любую точку области D считается равновероятным1). Тогда вероятностью попадания точки в любую область D\, ле- жащую в D, назовем отношение площади области D\ к площади области D. Обозначим эту вероятность через Р(£>1). По определению Р(А) = -^, где S— площадь области £>, a Si — области D{. Легко заметить, что это новое определение не про- тиворечит классическому: в тех случаях, когда удается воспользоваться двумя определениями, оба приводят к одному и тому же значению вероятности. Теоремы сло- жения и умножения вероятностей легко могут быть сформулированы и для геометрической вероятности. !) Здесь также приходится с самого начала пользоваться поня- тием равновероятности.
230 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ. V 1) Если области и D2 принадлежат области D и не пересекаются, то вероятность попадания в Dj или в D2 равна сумме вероятностей попадания в D\ или в D2. P(£>i или О2)= Р (D0+ Р(Р2). Условие, что области D\ и D2 не пересекаются, соответ- ствует условию несовместности событий. Если же об- ласти D\ и D2 пересекаются, то теорема, как это ясно видно, не имеет места. 2) Если области £>i и D2 имеют общую часть, то вероятность попадания в их общую часть D3 равна про- изведению вероятности попадания в D\ на условную ве- роятность попадания в D2 при условии, что имеет ме- сто попадание в £>ь Запишем это так: Р(А и O2) = P(Di)PD1(P2). Обе теоремы читатель легко докажет самостоятельно. Пользуясь первой теоремой, легко решить вопрос, поставленный в примере 1.33. Здесь область D — пря- моугольник и S = 1500 м2. Области Dj, £>2, D3 и D4 — круги, площадь каждого из которых равна 25л м2 « 78,5 м2. Так как эти области не пересекаются, то искомая вероятность Р равна р = 4 . . «0 21 Г * 1500 U,Z1‘ При рассмотрении геометрической вероятности мы встречаемся уже с некоторыми новыми фактами. Так, при классическом определении справедливо не только утверждение, что вероятность достоверного события равна единице, но и обратное: если вероятность события равна единице, то событие достоверно. Действительно, Р(Л)=1 означает, что т = п, т. е. данному событию благоприятствуют все «элементарные» события Лг- пол- ной группы, так что А необходимо наступит. Для геометрических вероятностей это обратное за- ключение оказывается несправедливым. В самом деле, выделим в рассматриваемой области D конечное число точек или даже целую линию. Площадь оставшейся ча- сти равна площади всей области, поэтому вероятность попадания точки в эту оставшуюся часть равна единице.
§ 33] ДРУГИЕ ОПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ 231 Тем не менее это событие не является достоверным, ибо возможно попадание в выделенную точку или линию. Точно так же вероятность попадания в выделенные точки равна нулю, в то время как это событие является возможным. С подобного рода явлением мы встретимся и дальше при изучении случайных величин. В различных приложениях теории вероятностей в естественно-научных и технических вопросах часто поль- зуются так называемым статистическим определением вероятности. Допустим, что имеется возможность неограниченного повторения испытаний, в каждом из которых при со- хранении неизменных условий отмечается появление или непоявление некоторого события А. В качестве при- меров можно привести бросание монеты или игральной кости, извлечение шара из урны (с возвратом), стрельбу по цели и т. п. Пусть при достаточно большом числе п испытаний интересующее нас событие А наступило m раз. Отноше- ние р, = m/n принято называть частостью (иногда так- же частотой или относительной частотой) события А. Изучение на практике частоты появления некоторых событий показало, что в ряде случаев при очень боль- шом числе испытаний эта частота сохраняет почти постоянную величину, причем колебания ее стано- вятся тем меньше, чем больше число испытаний. Так, например, распределение новорожденных по полу может быть каким угодно, пока мы ограничи- ваемся рассмотрением одной или нескольких семей или даже небольшого города, да еще за сравнительно ко- роткий промежуток времени. Дело будет обстоять со- всем иначе, если перейти к рассмотрению большой тер- ритории с большим населением. Здесь полностью обна- руживается устойчивость частоты рождения девочек и мальчиков, причем она оказывается примерно одинако- вой для самых разных территорий. По данным шведской статистики частота рождения девочек в 1935 г. изменялась по месяцам как показано в табл. 1.33. Подобная устойчивость частот дает основание по- лагать, что рассматриваемое событие (в данном случае
232 СОБЫТИЯ и ВЕРОЯТНОСТЬ (ГЛ. V Таблица 1.33 Месяц I II Ш IV V VI VII Частота рождения дево- чек 0,486 0,489 0,490 0,471 0,478 0,482 0,462 Месяц ...... VIII IX X XI XII За год Частота рождения дево- чек 0,484 0,485 0,491 0,482 0,473 0,482 рождение девочки) имеет определенную вероятность, вокруг которой и происходит колебание частоты. Это допущение тем более естественно, что в тех случаях, когда применимо классическое определение вероятно- сти, поведение частот оказывается примерно таким же1)- Для изучения частот выпадения герба2) были про- изведены эксперименты, давшие следующие результаты (табл. 2.33). Таблица 2.33 Экспериментатор Число бросаний Число выпадений герба Частота Бюффон 4 040 2 048 0,5069 К. Пирсон 12 000 6019 0,5016 К. Пирсон 24 000 12012 0,5005 Используя указанные свойства частот, вероятностью события называют характеризующее его число, около которого колеблется частота появления события при сохранении неизменных условий опыта. Приведенное определение называют статистическим определением вероятности. !) Подробнее об этом будет сказано ниже, в § 37. 2) К этому случаю применимо классическое определение вероят- ности.
§ 33] ДРУГИЕ ОПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ 233 Это определение также не может охватить всех слу- чаев применения понятия вероятности. Более того, оно и не определяет однозначно численного значения ве- роятности, поскольку колебания частот оставляют для этого значения довольно широкие границы. В настоящее время при строгом построении теории вероятностей принято пользоваться аксиоматическим определением. По этому определению каждому собы* тию из определенного множества событий ставится в со- ответствие некоторое число, причем это соответствие должно обладать определенными, заранее предположен- ными свойствами. Аксиомы, приводимые в определении, не являются произвольно придуманными. Они заимствованы из прак- тики и отражают именно те свойства вероятности, кото- рые нужны для приложений и которые были установ- лены нами выше для классического определения. Для большего удобства формулировок введем еще определения суммы и произведения событии. Суммой событий А и В называется новое событие С, состоящее в том, что наступило или событие А, или событие В 1). Таким образом, запись С — А + В заменяет использовавшееся в § 31 Обозначение (Л или В). Аналогично произведением событий А и В называется событие С, состоящее в совмещении событий А и В, так что запись С — АВ за- меняет (А и В). Чтобы пояснить введенные термины, рассмотрим следующий пример. Пусть в сосуде с газом выделены области а и Р (рис. 21). Если событие А означает попадание некоторой молекулы газа в область а, а событие В — попадание той же молекулы в область р, то сумма со- бытий А + В означает попадание в какую-либо из этих областей, т. е. в сумму а + р, а произведение АВ — попадание в их общую часть, т. е. в пересечение ар. Рассмотрим теперь некоторое множество событий, обладающее тем свойством, что сумма или произведение конечного числа или бес- конечной последовательности событий, принадлежащих нашему мно- жеству, также принадлежит этому множеству. Это множество событий должно содержать также достоверное событие. События, входящие в рассматриваемое множество, будем называть допустимыми. Предположим, что на этом множестве допустимых событий опреде- лена числовая функция, ставящая в соответствие каждому собы- тию А число Р (А) и обладающая следующими свойствами: Ч Не исключается возможность наступления обоих.
234 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ. V Г. Для любого допустимого события А 0^ Р (Л)< 1. 2°. Если событие Е достоверно, то Р (Е) = 1. 3°. Если событие А влечет событие В, т. е. из наступления собы- тия А следует также наступление события В, то Р(А) Р (В). 4°. Если события А, В, ... попарно несовместны, то Р (Л + В+...) = Р(Л) +Р(В)+... 5°. Если события А, В, ... в совокупности независимы, то Р(Л В...) = Р(Л) Р(В),.. Перечисленные свойства 1°—5° называют аксиомами вероят- ности Числовое значение функции Р(Л), удовлетворяющей аксиомам вероятности, называют вероятностью допустимого события А. При практическом применении этого определения обычно посту- пают следующим образом. Выделяется множество Ль Л2, ... ос- новных «элементарных со- бытий», каждому из кото- рых, исходя из смысла за- дачи, приписывается опреде- ленная вероятность Р (Лг) = —Pi. Множество допустимых событий составляется из всех событий, которые мо- гут быть получены в виде комбинаций сумм и произ- ведений элементарных со- бытий. Вероятность каждого из допустимых событий на- ходится теперь из вероят- ностей элементарных со- бытий с помощью свойств 1°—5°. Что касается вероятностей элементарных- событий, то необхо- димо еще раз подчеркнуть, что они не получаются из математических соображений, а должны быть выведены исходя из смысла задачи. В условиях применимости классического определения число п эле- ментарных событий конечно и вероятность каждого получается рав- ной 1/и, так как события равновозможны, а их сумма досто- верна.
ПОВТОРЕНИЕ ИСПЫТАНИЯ 235 § 34] § 34. Повторение испытаний Пусть при некотором испытании событие А может наступить или не наступить. Обозначим вероятность на- ступления события А через Р(Д) = р и вероятность его ненаступления — через Р (Д) = q = 1 — р. Рассмотрим возможные исходы двух последователь- ных независимых испытаний. Они описываются схемой (табл. 1.34), Таблица 1.34 Результаты испытаний . . АА АА АА АА Вероятность р2 pq ЯР Я2 в которой приведены также вероятности различных исходов. Теперь нетрудно подсчитать, что вероятность двукратного появления события А равна р2, вероят- ность его однократного появления (безразлично, при каком испытании, т. е. вероятность того, что при двух испытаниях один раз наступит А и один раз Д) рав- на 2pq, а вероятность того, что А не наступит ни разу, равна q2. Очевидно, что эти результаты единственно воз- можны, причем р2 + 2pq + q2 = (р + q)2 = 1. Приведенное рассуждение без труда переносится на случай большего числа испытаний. Например, при трех испытаниях вероятность наступления события А три раза подряд равна р3, как вероятность совмещения со- бытий. Чтобы найти вероятность наступления события А два раза, безразлично в каком порядке, заметим^что это .возможно при следующих трех исходах: ДДД, ДДД, ДДД, вероятность каждого из которых p2q, так что ве- роятность двукратного наступления события А при трех испытаниях 3p2q. Аналогично подсчитывается вероят- ность однократного наступления 3pq2 и вероятность того, что событие А не наступит ни разу, которая равна q3.
236 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ. V Как и выше, р3 + Зр2р + 3pq2 + q3 = (р 4- q)3 = 1. Мы можем теперь формулировать общую задачу. Производится серия из п независимых испытаний, при- чем вероятность наступления события А при каждом отдельном испытании равна р. Требуется определить ве- роятность Рт> п того, что событие наступит точно tn раз. Такая задача может встретиться, например, при под- счете вероятности m попаданий в цель при п выстрелах и во многих аналогичных случаях, которые будут рас- смотрены ниже. Заметим прежде всего, что два крайних частных случая Рп, п ~ рп И Pq, п ~ qn легко находятся по теореме умножения, как вероятно- сти совмещения событий. Подсчитаем теперь вероятность того, что при п испытаниях событие А появится ровно m раз в опре- деленном порядке, например, как в схеме АА ... А А ... А. tn раз п — tn раз Ясно, что эта вероятность равна Очевидно, что вероятность появления события А также пг раз, но в другом порядке будет той же самой. Число всех воз- можных схем из п элементов, в которых m раз встре- чается А в различном порядке, равно числу сочета- Ctn п • Поэтому, пользуясь теоремой сложения вероятностей, получаем г> nA mn-m qA\ Pm,n=Cnp с/ q . (1.34) Из этой формулы видно, что вероятности Рт, п пред- ставляют отдельные слагаемые в разложении бинома (p + q) =р +пр q-\-----jpFj—р q + .. ,+Спр q +
§ 34] ПОВТОРЕНИЕ ИСПЫТАНИЯ 237 Итак, сформулированная выше задача полностью ре- шена. Проиллюстрируем теперь полученную формулу двумя примерами. Пример 1.34. Бросается монета 6 раз. Какова ве- роятность выпадения герба 0, 1, ..., 6 раз? В данном случае р = q = 1/2. Пользуясь полученной формулой, приходим к результатам Эти результаты можно изобразить графически, отло* жив по оси абсцисс значения /и, а по оси ординат — значения Рт, 6 (рис. 22). Очевидно, что наиболее рл вероятное число выпаде- ний герба т = 3, однако 05 _ вероятность эта невелика. Пример 2.34. Произ- водится восемь выстре- лов по резервуару с го- / X. рючим, причем первое X. попадание вызывает течь, ------J---h—t\ а второе — воспламене- ние горючего. Какова ве- Рис. 22 роятность того, что резер- вуар будет подожжен, если вероятность попадания при отдельном выстреле равна р = 0,2? Найдем сначала вероятность противоположного со- бытия, т. е. вероятность того, что резервуар не будет подожжен. Это произойдет лишь тогда, когда число по- паданий не превзойдет единицы. Вероятность этого равна Рол + Р\,$ “ q8 + C$pq7»
238 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ. V Так как здесь р = 0,2 и q = 0,8; то Р0 8 + р18 = (0,8)8 + 8 • 0,2 (0,8)7 ~ 0,503, откуда следует, что вероятность того, что резервуар бу- дет подожжен, равна Я = 1 — 0,503 = 0,497. Из примера 1.34 видно, что с ростом т вероятность Рт, п сначала возрастает, а затем с некоторого т на- чинает убывать. Покажем, что это имеет место и в об-* щем случае, и установим такое значение т, при кото- ром Рт>п будет наибольшим для данного п. Сравним два соседних значения Рт,п н Pm+i,n: г» л! ™ _ р —-------------- nmnn-tn — Гт>п пг\(п-т)\ Р q = м(^г- 1)(п-2) ... 1) п_т т>\ р Ч р , =---------—-------пт+1пп-т-1 _ ^т + \,п (п+ !)| (п_т_ 1)| Р Ч _ п(п-1)(п-2) ... (гс-/п) +1 (т + 1)! Р Ч Отношение последующего члена к предыдущему равно п = И Р /q д м Рт, п т+1 q' Второй множитель этого отношения p/q есть вели- чина постоянная, не зависящая от т. Первый множи- тель (п— т)/(т + 1) с ростом т убывает, так как чис- литель дроби убывает, а знаменатель растет. Благодаря этому мы можем написать ряд неравенств ^Р __ Р\, П ^2, n >> Рп, п _ Р q Pq, п Pi, п Pn—i,n nq Если предположить, что число опытов п достаточно велико, так, чтобы пр > q и nq > р, то ^ЬД>1 и -^<1. го, п гп—1,п Таким образом, отношение Рт+i, п/Рт, п для малых т больше единицы, а затем становится меньше еди«
§ 34] ПОВТОРЕНИЕ ИСПЫТАНИЙ 239 ницы. Выберем такое целое число р, для которого Рц+1,п/Рц,п> 1, НО для всех т>ц уже Pm+ii п/Рт> n< 1. Иначе говоря, Рт,п< Рт + \,п ПрИ ГП < р, Рт, п Рт 4-1, п ПрИ /71 = р, Рщ,п > Рт + \,п При т >р. Очевидно, что при т = р вероятность п будет иметь наибольшее при данном п значение. Если Рц+Ьп = = п, то максимальное значение вероятности дости- гается при двух значениях m = р и m = р + 1. Опреде- лим сначала величину р в этом последнем случае. Здесь Рц + \.п _ п-р р_ _ Рц, п “ и 1 7 “ ’ откуда находим пр — рр = м + q и р = пр — q. Следовательно, если число пр — q будет целым, то наиболее вероятным числом появления событий будут р = пр — q и р + 1 = пр — q +' 1 « (п + 1) р. Если число пр — q не будет целым, то отношение Рт+\,п!Рт,п переходит от значений, больших единицы, сразу к значениям, меньшим единицы. Пусть р — такое целое число, что п п t “р “ 1 И р <. 1 , ^Ц-1, п п Согласно формуле (2.34), Рц. п _ п-ц + 1 Р_ P\i-i. п I1 ’ так, что пр — цр + р> цд, т. е. р < пр + р. С другой стороны, Рц+1,п п-ц р -р^- = 7+Т7<1- или np-W<W + <J> так что И > пр — q.
240 СОБЫТИЯ И ВЕРОЯТНОСТЬ (ГЛ V Таким образом, для р получаются неравенства пр — q < р < пр + р, что и указывает границы1), в которых заключено наи- более вероятное число появления события А при п испы- таниях. Рассмотрим теперь еще один пример применения вы- веденных формул. Пример 3.34. В некотором производстве вероя г- ность для отдельной детали оказаться бракованной равна 0,005. Какова вероятность того, что в партии из 10000 изделий бракованных окажется а) ровно 40, б) не более 70. Ответ на первый вопрос дается непосредственно формулой Рт п*=С™ pmqn~m. Здесь р = 0,005, q = 0,995у п= 10000, т = 40, так что искомая вероятность равна Р(т = 40) = Рю, юооо = С1оооо(О>О5)4Э (O.995)"30 = -4гпя5|<«’005>,’(0'995)”“ Для ответа на второй вопрос следует воспользоваться теоремой сложения вероятностей. Искомая вероятность выразится суммой 70 Р (0 70) = 2 Р т, ю ооо = 7/2 = 0 • 70 = 2 СТо ооо (О.ООбГ (O,995),0000~w. 7/2=0 Итак, ответ на оба наших вопроса мы получили. Однако практически осуществить требуемые здесь вычис- ления очень трудно. Это вынуждает нас искать другие формулы, позволяющие решать аналогичные вопросы хотя и приближенно, но более просто. Рассмотрению та- ких формул и будут посвящены следующие параграфы. 9 Так как пр + р — (пр — q) = р + q = 1, то интервал [пр — q, пр + р] имеет длину, равную единице, и в нем обязательно лежит ровно одно целое число.
§35] ЛОКАЛЬНАЯ ТЕОРЕМА МУАВРА - ЛАПЛАСА 241 § 35. Асимптотические формулы. Локальная теорема Муавра — Лапласа Рассмотрим снова задачу о повторении испытаний, разобранную в § 34; производится серия из п независи- мых испытаний, в каждом из которых появление собы- тия А имеет постоянную вероятность р. Найдем для вероятности Рт, п появления события А ровно т раз при п испытаниях асимптотическую формулу, т. е. при- ближенную формулу (удобную для практических вы- числений), которая при достаточно большом числе испы- таний дает сколь угодно малую относительную погрешность. Поставленная нами задача решается тео- ремой, которая носит название локальной предельной теоремы Муавра — Лапласа. Локальная предельная теорема. Если ве- роятность наступления события А при каждом отдель- ном испытании постоянна и равна р, то вероятность наступления события А ровно m раз в серии из п испытаний может быть представлена приближенной фор- мулой п . т — пр где q= 1 — р, х = —7==. У npq Относительная погрешность этой формулы стремится к нулю при неограниченном возрастании п. Мы не приводим доказательства этой теоремы, от- сылая читателя к более полным курсам теории вероят-* ностей. Применение формулы (1.35) требует для вычисле- ния вероятности Рт,п знания значений функции <р(х) = = 2_- е~*2/2. Ввиду важности этой функции1) для нее у 2л составлены специальные таблицы, которые приведены в приложениях (см. стр. 429). Совершенно ясно, что функция ф(х) четная. Пример 1.35. Мы можем воспользоваться форму- лой (1.35) для окончательного решения примера 3.34. Ц Эта функция будет подробно изучена в § 36. 16 Р. С. Гутер, Б. В. Овчинский
242 СОБЫТИЯ и вероятность [ГЛ. V Там требовалось определить вероятность того, что в партии из 10000 изделий встретится ровно 40 бракован- ных, если вероятность быть бракованной для отдельной детали равна 0,005. Здесь р = 0,005, q = 0,995, п = 10 000, т = 40. По- этому = V10 000-0,005-0,995 « 7,05, т — пр 40— 10 000-0,005 . х = ==-------------— « — 1,42. У прд 7,05 В силу четности функции ф (х) = находим ее /2т значение при х = 1,42. По таблице получаем ф(1,42) = = 0,1456. Таким образом, ^0. юооо « -ун? - 0,0207. Подсчет по точной формуле дает Р40, ю ооо=0,0197. Наша приближенная формула дает в этом случае ошиб- ку в 0,0010, что составляет около 5,1%. Такая ошибка, однако, вполне искупается серьезным облегчением вы- числений. Пример 2.35. Произведено 10 000 испытаний, в каждом из которых вероятность появления события А равна р = 0,5. Требуется приближенно найти вероят- ность наиболее вероятного числа появлений события Д. Как следует из рассуждений, приведенных в § 34, наиболее вероятным числом появления событий будет здесь т = пр = 5000. Таким образом, получаем р = 0,5, q = 0,5, /2=10 000, т = 5000, /пр/ = /10 000 • 0,5 - 0,5 = 50, х = = 0, <р (0) = = 0,3989. Vnpq /2л Полученные числовые данные приводят к вероят- ности Р5000, юооо = -^ = 0,007978. Как было указано, число т = 5000 является наибо- лее вероятным числом наступлений события Д, однако
§ 36] НОРМАЛЬНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ 243 вероятность появления точно этого числа весьма мала. Для сравнения приведем некоторые вероятности Pm>n для других т в тех же условиях. ^4950, юооо = -Р5050, ю ооо = 0,00484 (х = 1), ^4900, 10000 ^5100, юооо = 0,00108 (х = 2). § 36. Нормальная функция распределения При разборе примеров в § 35 нам пришлось поль- зоваться функцией ф (х) = е~х2/2. Эту функцию на- зывают плотностью вероятности нормального распреде- ления. Причины этого названия будут выяснены позже (см. § 40). Построим график функции у = ф(х). Так как ф(х) — четная функция, то ее график симметричен относительно оси Оу. Кривая имеет ось Ох горизонтальной асимпто- той при х—>±оо. Функция достигает максимума при <р(х) приведен на рис. 23, где для большей наглядности приняты различные масштабы по осям. Площадь, ограниченная этой кривой и осью Ох, рав- на единице: оо J q(x)dx = 1. 16*
244 СОБЫТИЯ И ВЕРОЯТНОСТЬ (ГЛ. V Действительно, используя известное значение интеграла о I = j е 2 dx = находим оо оо 0 J - yU2/-1. —-оо т —оо Еще большую роль, нежели функция ср(х), играет ин- теграл от нее, взятый в пределах от 0 до х, т. е. функ- ция Ф(х) = 1 У 2л -JL в 2 dt. о Эту функцию называют нормальной функцией распре- деления. Иногда употребляются также названия функ- ция Лапласа или интеграл вероятности. Функция Ф(х) является нечетной. Действительно, положив t = —т, получим х -х х2 J е 2 — Ф(— х). О ’ о Ф(х) = -Д=- [е 2 dt — ~^= v J У2я
§ 37] ИНТЕГРАЛЬНАЯ ТЕОРЕМА МУАВРА - ЛАПЛАСА 245 Кривая (/ = ф(х) симметрична поэтому относительно начала координат. Она имеет две горизонтальные асимп- тоты, ибо lim Ф{х)= — 4» Ит Ф(х) = 4* Х->—оо Х-»4-оо i При х = 0 имеем Ф(0) = 0. Начало координат слу- жит точкой перегиба кривой, причем угловой коэффи- циент касательной в этой точке равен k = = 0,3989. График функции г/ = Ф(х) изображен на рис. 24. В некоторых случаях вместо функции Ф(х) рассмат- ривают функцию Г(х), определяемую равенством 1 f F (х) = -^= е 2 di. /2л J — ОО Между этими функциями существует очевидное соотно- шение Г(х) = Ф(х) + 4- Ввиду большой важности функций <р(х) и Ф(х) для них составлены подробные таблицы, которые приведены в приложении I. Вследствие четности <р(х) и нечетно- сти Ф(х) в таблице даны лишь положительные значе- ния аргумента. § 37. Интегральная теорема Муавра — Лапласа. Теорема Бернулли Примеры, разобранные в § 35, показывают, что при больших п вероятность появления события А определен- ное число раз весьма мала. В практических приложе- ниях нас обычно интересует не наступление события А какое-то определенное число раз, а вероятность того, что число наступлений события А заключено в некото- рых пределах. Как было отмечено еще в примере 3.34, эту вероятность можно получить путем суммирования, однако это требует громоздких вычислений. Интегральная предельная теорема, которую мы сейчас рассмотрим, дает возможность приближенно
246 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ. V подсчитать эту вероятность значительно проще, подобно тому как это делалось для вероятности Ли, п с помощью локальной теоремы, разобранной в § 35. Интегральная теорема Муавра — Ла- пласа. Если вероятность наступления события А при каждом отдельном испытании равна р, то при неограни- ценном увеличении числа испытаний п вероятность того, что число m наступлений события А удовлетворяет не- равенству (1.37) Г npq где q = 1 — р, имеет своим пределом интеграл г х2 е~~ dx. (2.37) Го Доказательство. Как было указано выше, иско- мая вероятность может быть получена суммированием: Р (/0 < < Л = 2 рт. П, (3.37) \ У npq / где сумма распространяется на все значения т, удов- летворяющие неравенству (1.37). Эти значения можно записать в виде т = пр + х Уnpq , (4.37) где х принимает значения, лежащие между /0 и t\. Из (4.37) следует, что при неограниченном возрастании п также и т неограниченно возрастает. Так как формула (4.37) выражает т через х, то суммирование в (3.37) распространяется на некоторые значения х на отрезке [/0, Л]. Подсчитаем приращение х при переходе от значения т к значению т +; 1 для од- ного и того же числа испытаний п. Пусть т+ 1 = пр + (х + Ах)У npq . (5.37) Вычитая из равенства (5.37) равенство (4.37), получаем 1 = Дх Vnpq
§ 37] ИНТЕГРАЛЬНАЯ ТЕОРЕМА МУАВРА - ЛАПЛАСА 247 ИЛИ V npq Пользуясь этим выражением, перепишем выражение вероятности Рт,п (см. (1.35)) в виде D ~ _ р—Х2/2 А у Ит'п Уйе (6.37) Выражение (6.37) для вероятности простую геометрическую иллюстрацию, построим кривую у = <р (х) = -у.— е~х1/2 у 2эт роятности нормального распределения). Рт, п допускает Действительно, (плотность ве- При заданных n, т, р и q вычислим по формуле (4.37) значение х и построим на кривой */ = <р(х) точ- ку М с абсциссой х (рис. 25). Затем выберем Дх = = и построим прямоугольник (на рис. 25 он за- V npq штрихован). Площадь этого прямоугольника будет рав- на <р(х) Дх = —=• е~х2/2Дх. Таким образом, согласно формуле (6.37), вероятность Рт,п приближенно выра- жается площадью заштрихованного на рис. 25 прямо- угольника. Подставим выражение (6.37) в сумму (3.37). Тогда вероятность неравенства (1.37) приближенно выразится
248 СОБЫТИЯ и ВЕРОЯТНОСТЬ (ГЛ. V суммой р \ У npq (7.37) Сумма в правой части равенства (7.37) представляет собой интегральную сумму, построенную для функции <р(х) на отрезке (/о, Л) при разбиении этого отрезка на равные части длиной Дх = —==-. При неограничен- V npq . 1 ном возрастании п величина Дх = -р= стремится к нулю и поэтому предел этой суммы равен интегра- лу (2.37). Можно показать, что при этом ошибка приближен- ного равенства (7.37) стремится к нулю. Таким образом, при неограниченном возрастании п вероятность неравенства (1.37) стремится к интегралу (2.37). Поэтому при больших значениях п можно счи- тать, что р J. т — пр г Но < - \ У npq У 2л Заметим, ЧТО i t 44 1 44 1 Г —— 1 Г 1 г >._= I е 2 dx = г— <? 2 dx---------•?== е 2 dx = /2л J /2л J /2л J t Q V U = Ф(/1)-Ф(/0). (8.37) В частности, если to — —ti, то 1 f e 2 dx^Ф(tl)-Ф(-ti) = 2Ф(t1). (9.37) У 2л J Значения функции Ф(х) могут быть найдены в таблице. Это дает возможность легко находить приближенные значения искомой вероятности интересующего нас нера- венства. Пример 1.37. Вернемся к рассмотрению второй ча- сти примера 3.34. В ней требовалось определить вероят- ность того, что в партии из 10 000 деталей окажется не
§ 37] ИНТЕГРАЛЬНАЯ ТЕОРЕМА МУАВРА — ЛАПЛАСА 249 более 70 бракованных, если для каждой детали вероят- ность оказаться бракованной равна 0,005. ______ Здесь р = 0,005, q = 0,995, п = 10 000, У « 7,05, пр — 50. Поэтому неравенство 0 m 70, вероятность которого нас интересует, равносильно неравенству: —50 4^ т — пр 20 или - 7,09 < '”—2? < 2,84. Г npq В силу доказанной теоремы 2,84 7,09< <2,84) ~ 77== ( У npq / V2л _7J9 Пользуясь равенством (8.37), получаем Р = Ф (2,84)-Ф(—7,09) = Ф (2,84) + Ф (7,09) = = 0,4977 + 0,5 = 0,9977. Таким образом, вероятность того, что число брако- ванных деталей не превзойдет 70, очень мало отличается от единицы. * Пример 2.37. Определим вероятность Р того, что при 8000 бросаний игральной кости частота выпадения шестерки будет отклоняться от вероятности Р = ~ мень- 1 и ше чем на-эд-.Нас интересует вероятность неравенства I т_____L I 1 I 800(Г 61^80’ 1 5 где т — число выпадении шестерки, ^=="б‘» п = 8000. Приведенное неравенство можно переписать в виде - 100 <т-8000 -4- < юо. Последнее неравенство равносильно следующему: _______100 < m-8000--g- < 100 т/8000.4--4 ^прч л/~ 8°0()44 Г 6 6 у о о
250 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ. V откуда следует, что to — —3 и /1=3. Поэтому, в силу формулы (9.37), искомая вероятность равна Р = 2Ф (3) = 2 • 0,49865 = 0,9973 (см. таблицу значений функции Ф(х) в приложениях). Пример 3.37. Вероятность попадания в цель при отдельном выстреле равна 0,63. Сколько выстрелов нужно произвести, чтобы с вероятностью 0,9 получить не менее 10 попаданий. Требование получить не менее 10 попаданий равно- сильно неравенству 10 т < + оо, в котором верхняя граница не определена. Перепишем это неравенство в нужной форме. Тогда 10 — 0,63/1 . m — Q,Q3n . . < -^======- < + 00, у п • 0,63 • 0,37 Vп • 0,63 • 0,37 . 10 —0,63п , о откуда следует Го = и t\ = оо. Вероятность Р/, т —пр . , \ ^0<-y==-</ij в данном случае по условию рав- на 0,9. С другой стороны, по формуле (8.37) имеем Р(/о<х</1) = Ф(/1)-Ф(/о). Так как t\ = Н-оо и Ф(оо) = 0,5, то Ф(/о) = —0,4000, от- куда, пользуясь таблицей функции Ф(х), находим /о = —1,28, что дает для определения п уравнение 10 - 0,63n = _ J 28 /о^Зп Решив это уравнение и заметив, что с увеличением п вероятность получить не менее 10 попаданий может лишь возрасти, получаем окончательно п>20. В § 33 указывалось, что наблюдаемые на практике частоты появления некоторых событий тем меньше от- личаются от вероятности, чем больше число испытаний.
§ 37] ИНТЕГРАЛЬНАЯ ТЕОРЕМА МУАВРА - ЛАПЛАСА 251 Мы можем сейчас выяснить этот вопрос с теоретической стороны. Пусть производится п независимых испытаний, при* чем в каждом из них вероятность появления некоторого события А равна р. Если через т обозначить число испытаний, в результате которых событие А появлялось, то отношение mln представит частость события А. Имеет место следующая теорема. Теорема Бернулли. Для всякого е > 0 ве- роятность неравенства при неограниченном возрастании п стремится к еди- нице. Иными словами, при достаточно большом числе испытаний с вероятностью, как угодно близкой к еди- нице, частота появления события мало отличается ог вероятности события. Доказательство. Интересующее нас неравен- ство равносильно следующему: т — пр — е <------- < е. п Умножив все части неравенства на j/", приведем его к нужной нам форме; Г п т — nq -Г п * pq Vnpq I pq Таким образом, В силу интегральной предельной теоремы эта ве* ? X2 роятность близка к интегралу j е 2 dx, где * -а
252 СОБЫТИЯ И ВЕРОЯТНОСТЬ [ГЛ V а = е|/ FF ’ * РИ неогРаниченном возрастании п имеем также а—*оо, поэтому вероятность интересующего нас °° 1 Г —— неравенства стремится к интегралу "у==“ J е 2 который, как это было показано в § 36, равен единице. Теорема доказана. Теорема Бернулли является частным случаем ряда важных теорем (Чебышева, Пуассона, Хинчина, Кол- могорова и др.), известных под названием закона боль- ших чисел. Этих более общих теорем мы касаться не будем.
ГЛАВА VI СЛУЧАЙНЫЕ ВЕЛИЧИНЫ § 38. Случайная величина и ее закон распределения Понятие случайной величины является одним из центральных понятий теории вероятности. Под случай- ной величиной понимается величина, принимающая в ре- зультате опыта какое-либо числовое значение. Приведем некоторые примеры случайных величин. 1. Число очков, выпадающих на игральной кости. Эта случайная величина может принять одно из значе- ний 1, 2, ...» 6. 2. Число наступлений события А при п независимых испытаниях. В результате п испытаний эта случайная величина может принять одно из значений 0, 1, 2, ... ..., п. 3. Число выстрелов, производимых до первого попа- дания в цель. Эта величина может принимать любое це- лое положительное значение. 4. Расстояние от центра мишени до точки попадания. Эта случайная величина, вообще говоря, может прини* мать любые положительные значения или нуль. Случайная величина, принимающая конечное число или последовательность различных значений, называется дискретной случайной величиной. Из описанных выше случайных величин дискретными являются случайные величины примеров 1, 2, 3. Случайная величина, принимающая все значения из некоторого интервала, называется непрерывной слу- чайной величиной1). К таким величинам относится ’) Это определение неполное. Более точное определение непре- рывной случайной величины будет приведено в § 40.
254 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI случайная величина примера 4. Мы ограничимся пока рассмотрением дискретных случайных величин. Чтобы охарактеризовать случайную величину, прежде всего необходимо указать возможные ее значения. Од- нако этого недостаточно: нужно еще знать, на сколь* ко часто принимаются различные значения этой ве- личины, что лучше всего характеризовать вероятностью отдельных ее значений. Иначе говоря, для случайной величины X следует указывать не только ее значения Xi, х2, но и вероятности событий X = р. =р(Х = хг) (i = 1, 2, ...,), (1.38) состоящих в том, что случайная величина X приняла значение хг-. Если перечислены все возможные значения X, то события X = Xi не только несовместны, но и единственно возможны, так что сумма заданных вероятностей дол- жна равняться единице. Соотношение, устанавливающее связь между значе- ниями случайной величины и вероятностями этих значе- ний, называют законом распределения случайной вели- чины. Для дискретной случайной величины закон распре- деления удобно записывать в виде таблицы 1.38, при- чем Spi= 1. Число значений может быть конечным или i бесконечным. В последнем случае ряд из вероятностей со S Pi должен сходиться и его сумма должна быть равна единице. Таблица 1.38 х2 • . . Хп. . . . Pl Р2 • • • Рп • « • Иногда удобно изображать закон распределения гра- фически. Для этой цели откладывают по оси абсцисс
§ 38] СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ ЗАКОН РАСПРЕДЕЛЕНИЯ 255 возможные значения случайной величины X, а по оси ординат — соответствующие значения вероятностей. Ло- маную, соединяющую полученные точки, называют мно- гоугольником распределения. Приведем примеры зако- нов распределения. Пример 1.38. Пусть X — число очков, выпадаю- щих на игральной кости. Возможные значения 1, 6 равновероятны. Закон распределения имеет вид Пример 2.38. Пусть X — число выстрелов по цели до первого попадания, причем вероятность попадания при отдельном выстреле равна р. Возможными значениями случайной величины будут здесь все натуральные числа 1, 2, п, ... Вероят- ность того, что X = 1, равна, очевидно, р. Если X = 2, то это означает промах при первом выстреле и попада- ние при втором, так что вероятность этого равенства, как вероятность совмещения событий, равна произве- дению qp, где q = 1 — р. Аналогично найдем, что вероят- ность того, что X = п, равна q^p, так что закон рас- пределения задается таблицей 3.38.
256 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI Таблица 3.38 1 2 3 4 п . . . Pi р pq pq2 pq3 . . . pqn~x . . . оо Найдем сумму ряда 5 Pi* Имеем i = l оо оо 2 Рп= 3 РЧп~' =Р(1 + <7 + <72 + ••• +<7"-1+ ...). П=1 П=1 Ряд в скобках представляет геометрическую прогрессию со знаменателем 0<q< 1; его сумма равна 1 1 1-? р ’ следовательно, 2р„=1. П=1 АЛ 1 Многоугольник распределения для р = q = -к* изо- бражен на рис. 27.
§ 39) ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ 257 § 39. Функция распределения и плотность вероятности Закон распределения случайной величины не всегда может быть задан таблицей. Например, если речь идет о непрерывной случайной величине (в том смысле, как она была определена в предыдущем параграфе), то все ее значения перечислить невозможно. Поэтому ее харак- теризуют не вероятностями отдельных значений, как дискретную, а вероятностями того, что случайная вели- чина принимает значения из определенного интервала, т. е. вероятностями неравенств вида а < X < [}. Впро- чем, такого рода характеристики бывают полезными отнюдь не только для непрерывных случайных ве- личин. В дальнейшем мы будем говорить о вероятности не- равенства —оо<Х<х, т. е. вероятности того, что слу- чайная величина принимает значение, меньшее х. Эта вероятность Р(Х<х) является, очевидно, функцией от х; обозначим ее через F(x): F(x) = Р(Х<х). Функцию F(x) называют интегральным законом распре- деления или функцией распределения случайной вели- чины. Если изображать значения случайной величины точ- ками числовой оси и обозначить буквой W точку с абс- циссой х, то F(x) есть вероятность того, что точка Л1, являющаяся значением случайной величины, окажется левее N. Установим некоторые свойства функции распреде- ления. Пусть X — случайная величина, Х\ и х2 — две про- извольные точки, причем Xi<x2. Сравним значения функции распределения F(x) в этих точках. Так как со- бытие Х<Х[ влечет событие Х<х2, то ясно, что Р (X < xj)< Р(X < х2), или, по определению функции распределения, F(xi)<F(x2). 17 Р. С. Гутер, Б. В. Овчинский
258 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI Таким образом, функция распределения для любой случайной величины всегда является монотонно неубы- вающей. Далее, очевидно, F(— оо) = 0, F( + oo)= 1, значения случайной величины откуда следует, что F( + oo)—F(—оо)= 1. Так как F(x) О и 1, то график функ- ции у = F(x) имеет две горизонтальные асимптоты: у=0 при х->—оо и у—\ при +оо. Перечисленные свой- ства функции распре- деления делают доста- точно ясным ее поведе- ние на всей действи- тельной оси. К сказан- ному следует только добавить, что если все принадлежат интервалу (а, &), то слева от точки а имеем F(x)=0, а справа от точки b — функция F(x) = l. Заметим, что функцию распределения (интеграль- ный закон распределения) можно построить для слу- чайных величин любого типа — как непрерывных, так и дискретных. Для дискретной случайной величины F(x) = P(X<x) = P(-oo<X<x)= 2 pit Xi<X где суммирование распространяется на значения хг-, удовлетворяющие неравенству хг- < х. В промежутке между двумя последовательными значениями X функ- ция F(x) постоянна. При переходе же аргумента х че- рез возможное значение случайной величины хг- функ- ция F(x) скачком возрастает на величину p; = P(X=Xi), так что Xi будет точкой разрыва первого рода функции F(x). Таким образом, функция распределения для ди- скретной случайной величины будет ступенчатой функ,-
§ 39J ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ 259 цией. Вид ее указан на рис. 28. Рассмотрим некоторые примеры построения функций распределения. Пример 1.39. Случайная величина X — число по-* паданий при одном выстреле, причем вероятность по- падания равна 0,3. Очевидно, для X возможны два значения —0 и 1. Закон распределения может быть записан таблицей (табл. 1.39). Таблица 1.39 X/ 0 1 Р1 0,7 0,3 Отсюда следует, что функция распределения может быть задана равенствами 0 для — со х 0, Р(х) = 0,7 для 1 для 0 < 1, 1 < График функции распределения приведен на рис. 29. Пример 2.39. Точка бросается наугад (без при- целивания) на отрезок [0, 1]. Случайная величина X — абсцисса точки попадания (считается, что бросаемая точка обязательно попадает на отрезок [0, 1]). 17*
260 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI равенство X < х в этом В этом случае мы имеем дело с непрерывной случай* ной величиной, все значения которой принадлежат от- резку [0, 1]. Поэтому для имеем F(x) = 0, ибо не- случае невозможно. Напротив, для х>1 неравенство Х<х достоверно, так что здесь F(x) = l. Пусть теперь число х удо- влетворяет неравенству 0<х< <1. Так как точка бросается наугад, то следует считать все значения абсциссы одинаково вероятными. Согласно опре- делению геометрической ве- роятности, данному в § 33, ве- роятность попадания на неко- торый интервал пропорциональна длине этого интервала или, в данном случае, просто равна ей, потому что длина всего интервала возможных значений равна единице. Таким образом, вероятность неравенства Р(Х<х) равна длине интервала (0, х), т. е. F(x) = Р(Х<х) = х. Окончательное выражение для функции распределе- ния нашей случайной величины может быть записано равенством F(x) = 0 при х при — оо < X < О, О х 1, 1 при 1 < х < + ОО. График функции распределения изображен на рис. 30. Разберем теперь следующую задачу. Задача 1. Зная функцию распределения величи- ны X, вычислим вероятность того, что непрерывная случайная величина X удовлетворяет неравенствам а<Х<р. Пользуясь теоремой сложения вероятностей, напи- шем Р(Х<₽) = Р(Х<а) + Р(а<Х<р), откуда Р(а<Х<р)= Р(Х < р)—Р(Х < а).
§39] ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ 261 Исходя из определения функции распределения, мо- жем написать P(a<X<p) = F(p) — F(a). (1.39) Равенство (1.39) можно использовать для нахож- дения вероятности Р (X = а). Для этого достаточно рас- смотреть предел при р—►«, что дает P(X = a)= limP(a<X<p)= lim [F (р) - F (а)]. ₽-»а р->а Если функция /?(х) непрерывна, то последний предел равен нулю. Следовательно, Р(х = а) = О, т. е. если функция распределения случайной величины непрерывна, то вероятность того, что случайная вели- чина примет заранее заданное значение, равна нулю. Так как Р (a < X < р) = Р (X = а) + Р (а < X < 0), то вместо (1.39) можно написать также Р (а < X < Р) = F(p)-F(a). (2.39) Особо обращаем внимание читателя на следующий факт. Известно, что вероятность невозможного события равна нулю. При классическом определении вероятно- сти, когда полная группа событий состоит из конеч- ного их числа, верно и обратное: событие, вероятность которого равна нулю, невозможно. Для непрерывной случайной величины это обратное утверждение невер- но. Хотя, как мы только что видели, вероятность того, что X = а, где а — заранее выбранное число, равна нулю, это событие не является невозможным. С подоб- ным явлением мы сталкивались уже в § 33 при рас- смотрении геометрической вероятности. Рассмотрим непрерывную случайную величину X, функция распределения которой предполагается не- прерывной и дифференцируемой. Производ- ная функции распределения ф(х) = F'(x)
262 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. V[ также играет важную роль. Эту функцию ф(х) назы- вают дифференциальным законом распределения или плотностью вероятности случайной величины X. Легко установить вероятностный смысл этой функ- ции. Из определения производной следует Ф(х) = Г'(х) = lim F(X + ^~F№ . (3.39) Дх->0 Как было замечено выше, числитель (3.39) выражает вероятность того, что случайная величина X принимает значения между х и х +.Дх, F(x + Дх)— F(x) = Р(х <Х < х + Дх). Таким образом, вместо (3.39) можно написать ф(х) = lim , (4.39) Дх->0 т. е. плотность вероятности случайной величины X в точке х равна пределу отношения вероятности попада- ния величины X в интервал (х, х + Дх) к 1хх, когда Ах стремится к нулю. Для дальнейшего выяснения роли плотности вероят- ности рассмотрим еще одну задачу, аналогичную первой. Задача 2. Зная плотность распределения вели- чины X, вычислим вероятность того, что случайная ве- личина X удовлетворяет неравенствам а < X < р. Используя (2.39) и известную из интегрального ис- числения формулу Ньютона—Лейбница, получим ₽ Р Р (а < X < р) = F (р) — F (а) = j F' (х) dx = j qp (х) dx. а а (5.39) Формуле (5.39) легко дать наглядное геометрическое истолкование. Построим график плотности распределе- ния у = ф (х) (рис. 31). Из (4.39) вытекает, что с точно- стью до бесконечно малых высшего порядка по сравне- нию с Дх, Р (х < X <х Дх) ~ ф (х) Дх.
§ 391 ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ 263 Полученное произведение геометрически изображается площадью заштрихованного горизонтально прямоуголь- ника / (рис. 31). Вероятность того, что случайная ве- личина примет значения внутри участка (а, Р), выра- жается площадью криволинейной трапеции, расположен- ной над этим участком и ограниченной сверху графиком У = Ф (*)• В этом и состоит геометрический смысл фор- мулы (5.39). Заметим, что кривая у = <р (х) всегда лежит над осью Ох. Действительно, функция распределения F(x), как было доказано выше, монотонно неубывающая, по- этому, как известно из дифференциального исчисления, ее производная должна быть неотрицательна, т. е. <р(х) > 0. Из равенства (5.39) и свойств функции распределе- ния вытекает также, что оо | ф(х)б/х = 1. — 00 (6.39) Легко установить выражение функции распределе- ния через плотность вероятности. Функция распределе- ния есть первообразная от плотности, причем такая, которая обращается в нуль при х = —оо. Поэтому F(x) = (7.39) — оо
264 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ (ГЛ. VI Пример 3.39. Найдем плотность распределения ве- роятности случайной величины X, рассмотренной в при- мере 2.39. Из определения легко получаем, что <р(х) = О при — оо < х < О, 1 при 0 < х < 1, О при 1 < х < + оо. В точках х = 0 и х = 1 функция <р (х) не существует. В этих точках график функции F(x)—функции распре- деления — имеет излом (см. рис. 30). Пример 4.39. Показательный закон распределения определяется плотностью вероятности <р(х) = 0 Ае~Кх при при х < 0, х>0, где А и X — постоянные величины. Считая Х>0 задан- ной, найдем А и построим функцию распределения. Согласно формуле (6.39) имеем оо оо J <p(x)dx= | Ae~Kxdx^ — = -^-=1, — ОО 0 0 т. е. А = К. Далее, по формуле (7.39) при х>0 F(x)= J (p(t)dt = Л J e~udt= — e~u | =1— е~Кх — ОО 0 0 При х^СО, очевидно, F (х) = 0. Рекомендуем чита- телю самостоятельно построить графики интегрального и дифференциального законов. Аналогично примеру 3.39, график функции F (х) имеет угловую точку в начале ко- ординат. Пример 5.39. Пусть время работы электронной лампы есть случайная величина X. Найдем ее функцию распределения и плотность распределения, если экспе- риментально установлено, что вероятность выхода рабо- тающей лампы из строя за небольшой промежуток вре- мени наблюдения приблизительно пропорциональна
ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ 265 § зэ| времени ее дальнейшей работы и не зависит от того, сколько времени работала лампа до этого. Пусть событие А состоит в том, что лампа прорабо- тает не менее х дней, а событие В — в том, что лампа выйдет из строя между х и х 4- Дх днями. Мы имеем Р(Д) = Р(Х>х) = 1 — Р(Х<х) = 1 -F(x), р (В) = Р (х < X < х + Дх) = F (х + Дх) - F (х). Так как мы начинаем вести наблюдение за работаю- щими лампами, то экспериментально устанавливается не сама вероятность Р(В), а условная вероятность РА(В). Воспользуемся следствием из теоремы умно- жения Р(Д)РА(В) = Р(В)Рв(Д) и заметим, что если событие В произошло, то наверняка произошло и событие Д, т. е. Рв(А) = 1. Поэтому р (Ft\ - pW F(x + bx)-F(x) р(Л) l-F(x) Если Дх достаточно мало, то можно записать, что Рд(В)~ , (8.39) где <р(х) =Е/ (х)—плотность распределения, С другой стороны, по условию вероятность Рд(В) приближенно равна Рл (В) ~ k\x, (9.39) где k — коэффициент пропорциональности. Сравнивая приближенные равенства (8.39) и (9.39) и учитывая, что ошибка их стремится к нулю при Дх—>0, получаем уравнение "i4= k> или <f(x) = k-kF(x). Дифференцируя последнее равенство, приходим к диффе- ренциальному уравнению для искомой плотности веро- ятности <р'(х) = —&ф(х).
266 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ ГГЛ VI Интегрирование этого уравнения дает ф(х) = Ce~kx, где С — произвольная постоянная. Для ее нахождения заметим, что в нашей задаче X > О, поэтому для х < О имеем ф(х)=0. Согласно решению примера 3.39, полу- чим, что С = k. Поэтому окончательно [ 0 при X < :о. ф(х) = ] I. ke~kx при X so, 0 при X < с о, F (х) = j 1 J _ Q~kX при х^ S0. Коэффициент k должен быть установлен эксперимен- тально. Примем его равным 0,01 (при измерении вре- мени в днях) и вычислим: 1) Какова вероятность того, что электронная лампа проработает не менее 30 дней? 2) Какова вероятность того, что электронная лампа вый- дет из строя между 30 и 40 днями работы? Ответ на первый вопрос дается формулой ?! = 1 - F (30) = 1 - (1 ~ е-0’3) = е“0,3 ~ 0,74. Для второй вероятности получаем 40 Р2 = / Ф W dx = F (40) - F (30) = е~й* - е~°-3 « 30 ~ 0,74 - 0,67 = 0,07. § 40. Основные примеры дискретных и непрерывных распределений Пользуясь введенными в предыдущем параграфе по- нятиями функции распределения и плотности вероят- ности, можно теперь дать точное определение непрерыв- ной случайной величины. Случайная величина называется непрерывной, если ее функция распределения F (х) непрерывна на всей число- вой оси, а плотность распределения ф (х) — F' (х) суще- ствует и непрерывна всюду, кроме, быть может, дискрет- ного множества точек. При этом плотность ф (х) может
§ 40] ПРИМЕРЫ РАСПРЕДЕЛЕНИЙ 267 иметь как точки разрыва первого рода, так и точки бес- конечного разрыва. В настоящем параграфе приводятся наиболее часто встречающиеся типы распределений непрерывных и дискретных случайных величин и примеры их приме- нения. I. Равномерное распределение вероят- ностей. Пусть плотность вероятности равна нулю всюду, кроме интерва- ла (а, &), на котором она постоянна. Если обозначить эту посто- янную через Л, то в силу формулы (6.39) получим ъ J Adx = 1, Рис. 32. а откуда А = « Поэтому плотность равномерного распределения задается формулой ' 0 при — оо < Z X < Z а, ф(х) = 1 Ь —а при а < Z х < Zb, (1.40) 0 при b < С х < ^4-оо (рис. 32). В точках х = а и х — Ь функция ф (х) раз- рывна. Для нахождения функции распределения вос- пользуемся формулой (7.39). Если х а, то х F(x) = J <р (t)dt = 0. — оо Для а < х < b получаем х ах F(x)~ J(p(/)df= j* (t) dt 4- j* <p (0 dt = — oo — co a X = 0+ f -7-!— dt = 4—^~, J b—a b — a ’ a
268 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI ибо для a<t<b имеем ф(0 = уту* Наконец, при х^Ь получим х а Ъ х F(x) = J ср (/) dt = J* ф (О dt + J ф (/) dt + J <p(t)dt = —оо —оо а b b = о+ [ -т-5—/ + о = 1. J о — а а Таким образом, интегральный закон равномерного распределения задается формулой F(x) = 0 х — а b — а 1 при при при оо < х < а. Ь < х < + оо а х ь (рис. 33). Эта функция непрерывна всюду. Частный слу- чай равномерного распределения встречался нам в § 39 (см. пример 2.39). II. Закон Коши. Пусть плотность распределения случайной величины X задана формулой / ч А 4>W = T+F- Величина А определяется из соотношения г л 1°° ф(х)б/х= 2 dx = A arctg х = лЛ=1, J I + х |_ откуда Л=—. Таким образом, закон Коши принимает вид ф(х)= (2Л0) Л, 1 -г л у (рис. 34). Функция распределения получается с помощью фор- мулы (7.39): X X F(x)= У<р(ОЛ= J я (1^ t2) = ± arctg < |_w ° arctg х + ± — ОО —оо (рис. 35).
I Рис. 34.
270 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI В качестве примера найдем вероятность того, что случайная ве- личина, распределенная по закону Коши, примет значение, принадле- жащее интервалу (—1, 1). Формула (2.39) дает III. Закон арксинуса. Пусть дана следующим образом: 0 А при плотность распределения за- /1-х2 0 при при ф w = Прежде всего находим величину А: j г. dx — A arcsin х J /1-х2 — 1 = nA = 1, т. е. А = 1/л. Составим выражение для функции распределения А FM = ' о х 1 Г______________________________ 1 dt при arcsin х , I --------4----при л 2 при Графики функций <р(х) и F(x) изображены на рис. 36; здесь функция <р(х) имеет бесконечные разрывы в точках х=—-1 и х=1. IV. Биномиальное распределение. Рас- смотрим серию из п независимых испытаний, в каж- дом из которых вероятность наступления события А равна р. Случайная величина X означает число наступ- ления событий. Она дискретна, и ее возможными значе- ниями являются неотрицательные целые числа 0, 1, 2, ..., п. Закон распределения случайной величины X зада- ется уже известной нам формулой (см. § 34) n ^гптп-т Рт, п— С п Р Q , (3.40) определяющей вероятность равенства X = т. Из § 34 известно, что это выражение представляет член разложе- ния бинома (р + q)n. Поэтому говорят, что случайная
§ 401 ПРИМЕРЫ РАСПРЕДЕЛЕНИЙ 271 величина X подчиняется биномиальному закону распре- деления. Примеры приложений биномиального распределения уже встречались нам в предыдущих параграфах. V. Нормальный закон распределения '(закон Гаусса). Среди законов распределения, которым подчиняются встречающиеся на практике случайные ве- личины, чаще всего приходится иметь дело с нормаль- ным законом распределения. Для этого закона плот- ность вероятности <р(х) задается формулой ф(х) = 1 с 2о2 ар^л (4.40) Функция ф(х) положительна, и остается только прове- рить выполнение условия (6.39). Для этого совершим в ! Г° (*-а)2 интеграле —е 209 dx замену переменной, поло- G У 2л_ оо жив - ~ g = /, dx^odt. Получим 1 f° 1 f° —4= е 202 = е 2 dt. а/2л J V 2л J — сю —сю Последний же интеграл равен единице (см. § 36). С частным случаем нормального закона распределе-< ния (при а=0, о=1) мы уже встречались в § 35 при
272 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI рассмотрении асимптотической формулы в задаче вторении испытаний. Функция ф (х) = __1 К2л х2 е 2 о по- была подробно изучена в § 36. Там же приведен и ее график (см. рис. 23). Для построения графика функции (4.40) выясним прежде всего геометрический смысл параметров а и о, отложив выяснение их вероятностного смысла на более поздний срок. Из формулы (4.40) видно, что кривая у = ф (х) до- стигает максимума при х = а, причем максимальное значение утах =* ростом а величина макси- мального значения уменьшается, а так как площадь, ограниченная всей кривой и осью абсцисс, равна еди- нице, то с ростом о кривая как бы растягивается вдоль оси Ох. Наоборот, при уменьшении о кривая вытяги- вается вверх возле максимума, но сжимается в горизон- тальном направлении. На рис. 37 изображены графики нормальных зако- нов у = ф (х) при различных а, но одном и том же о. На рис. 38, наоборот, даны графики функций */ = ф(х) при а = 0, но различных о. Причина того, что нормальный закон распределения встречается очень и очень часто, кроется в следующем. Оказывается, что если значения, которые принимает случайная величина, зависят от большого числа различ- ных факторов, каждый из которых, взятый в отдель- ности, влияет на ту величину сравнительно мало, то можно приближенно считать, что рассматриваемая слу- чайная величина подчиняется нормальному закону рас- пределения. Точная формулировка всех условий, при которых это действительно будет так, составляет очень важную предельную теорему Ляпунова, рассмотрение которой, однако, выходит за рамки нашего курса. В качестве примера можно указать на задачу о рас- сеивании снарядов. Производится стрельба из орудия при постоянном прицеле и сохранении неизменными всех прочих условий. Предполагается, что все снаряды ложатся на прямой и что рассеяние снарядов симмет-
§ 40] ПРИМЕРЫ РАСПРЕДЕЛЕНИЙ 273 рично, т. е. одинаковые отклонения вперед и назад от точки прицеливания равновероятны. Случайной величи- ной X является координата точки падения снаряда. Ясно, что отклонение точки падения снаряда от точки прицеливания зависит от очень большого числа факто- ров: изменившиеся атмосферные условия, изменение формы снаряда, различный вес заряда пороха и т. д., т. е., согласно сказанному выше, мы вправе ожидать, 18 Р. С. Гутер, Б. В. Овчинский
274 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI что случайная величина X должна приближенно подчи- няться нормальному закону. И действительно, опытные данные показывают, что закон распределения обычно хорошо согласуется с нормальным законом. Тот факт, что нормальный закон распределения хорошо прибли- жает биномиальный (см. § 37), также теперь может быть объяснен. Дело в том, что общее число положи- тельных исходов испытаний слагается из большого чис- ла отдельных положительных исходов, каждый из кото- рых сам по себе мало влияет на их общее число. Рассмотрение нормального закона распределения за- кончим разбором следующей задачи, аналогичной разобранным в § 39 задачам 1 и 2. Задача 3. Случайная величина X распределена по нормальному закону с плотностью вероятности (х-д)2 <р(х) = —7=-е 2°2 . ' а/2л Вычислим вероятность того, что случайная величина X удовлетворяет неравенствам а<Х<р. Пользуясь формулой (5.39), получаем г 1 г (х-д)2 Р(а<Х<р)= <p(x)dx =—7= е 2а’ dx. J ay 2л J а а Последний интеграл легко сводится к интегралу Лап- ласа. В самом деле, положим -—- = dx = adt. а Тогда а-а в _ф(1^)_ф(^). (5.40) Значения Ф и Ф g а j’ могут быть найдены из таблицы, помещенной в приложениях. Для а — 0, о = 1
§ 40] ПРИМЕРЫ РАСПРЕДЕЛЕНИЙ 275 мы получаем простой результат: Р(а<Х< 0) = Ф (0) — Ф (а). Для интеграла, симметричного относительно точки а, формула (540) упрощается. Пусть 0=а+уиа=а — у; тогда Р(й - y < X < а + у) = ф(£) -Ф ( - -J) = 2ф(-£). (6.40) Проделаем некоторые числовые расчеты. Положим сперва а= а и 0 = а + о. Тогда формула (5.40) дает Р(а<Х<а + о) = ф(1) — ф(0) =0,3413. Таким же точно образом найдем Р (а + о< X <а + 2а) = Ф(2) — Ф(1) = = 0,4772 — 0,3413 = 0,1359, Р (а + 2а < X < а 4- За) = Ф(3) — Ф (2) = = 0,49865 — 0,4772 = 0,02145. Наконец, если положить а = а — За, 0 = а + 3а, то Р(а — За < X < а + За) = 2Ф (3) = 0,9973. Последний результат означает, что с вероятностью, близкой к единице (= 0,9973), случайная величина, под- чиняющаяся нормальному закону распределения, не вы- ходит за пределы интервала (а — За, а + За). Это ут- верждение носит название правила трех сигм. VI. Закон распределения Пуассона. По- добно нормальному закону распределения, закон Пуас- сона весьма часто встречается в различных приложе- ниях теории вероятностей. Как и закон Гаусса, закон Пуассона может быть получен как асимптотический для биномиального. Именно, рассмотрим серию из п независимых испы- таний, в каждом из которых вероятность наступления события А равна р. Как было показано в § 34, вероят- ность Рт>п наступления события А ровно m раз равна Pm,n-Cnp q = Q > 18*
276 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ vr где q = 1 — р. В § 35 была формула, которая позволяла подсчитать Рт>п значительно формула имеет вид приведена приближенная при достаточно больших и более простым путем. Эта 1 —X., е 2 У2лпрд Р т, п (7.40) т — пр где X = з . Г npq Формула (7.40) дает при одном и том же п тем луч- шие результаты, чем ближе число р к половине. Однако при достаточно малых р (т. е. при рассмотрении ред- ких событий) ошибка, даваемая этой формулой, мо- жет быть уже довольно значительной. Рассмотрим случай, когда вероятность р положи- тельного исхода каждого испытания в серии из п испы- таний равна к/п, где X — некоторая постоянная вели- чина1), и выведем в этом случае новую приближенную формулу для Рт,п. Теорема. Пусть в серии из п испытаний вероят- ность появления события А в каждом испытании равна Ъ/п. Тогда вероятность появления события А пг раз в этой серии при большом п выражается приближенной формулой Рт,п^^те-\ (8.40) Доказательство. Как мы уже знаем, П ___ nl m n—m _ nl пт(\ __________ п\п~т гт,п ml (п — т)1 Р Ч ml(n-m)l Р V Р' Положим здесь Р = Тогда nl Рщ,п — \ п) I1 п) или, после алгебраических преобразований, р __ n (п — 1) ... (/z — m Ч- 1) (п — т) ... 1 Ат / < A m»w ml (n — tn) (n — m — 1) ... 1 nm \ n) m! \ n ) \ 1 / \ n) \ n ) В § 41 мы увидим, что коэффициент А имеет определенный вероятностный смысл.
ПРИМЕРЫ РАСПРЕДЕЛЕНИЙ 277 § 40] Найдем теперь предел Рт,п при п->оо и постоянном т. Так как пределы множителей 11 ——I, .... II--------—I *Л~т .• Ь\п к и II---- равны единице, a lim 1-----------= е-А, то \ П / П-> оо \ П ! 1 т lim = П->оо откуда и вытекает приближенное равенство (8.40). Пусть теперь X—дискретная случайная величина, которая может принимать целые неотрицательные зна- чения. Если вероятность равенства X = т определяется формулой = <9-40) то мы говорим, что величина X распределена по закону Пуассона. Легко проверить, что m=0 m=0 К случайным величинам, подчиненным закону Пуассона, приводит большое число задач, относящихся к вопросам массового обслуживания. В качестве примера укажем работу телефонной стан- ции. Можно доказать, что при выполнении некоторых условий вероятность т вызовов за промежуток времени длины t определяется формулой Рт(/) = -^е-< (10.40) Если положить at = X, то из формулы (10.40) сле- дует, что случайная величина X распределена по закону Пуассона. Приведем пример использования закона Пуассона в качестве приближенной формулы. Пример 1.40. Работница обслуживает* 800 веретен. Вероятность обрыва пряжи на каждом из них за про- межуток времени т равна 0,005. Найти наиболее вероят- ное число обрывов и его вероятность.
СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI 278 Наиболее вероятное число обрывов будет р = пр = 4. Точное значение вероятности четырех обрывов равно Р4(8оо = C8ocO,OO54(O,995)7SS. Пользуясь формулой Пуассона с X = пр = 4, полу- чаем />4.800 - 4 е~4 = °’0'83 = 0’1952' Вычисление по точной формуле дает 0,1959, так что ошибка при пользовании формулой Пуассона состав- ляет 0,0007. Локальная предельная теорема Муавра — Лапласа дает для данного случая Р. 800 « -г-....----------е~*а/2 ~ 0,2000, 4,6 V2л • 800 • 0,005 • 0,995 ибо здесь х = 0, так что ошибка составляет уже 0,0041, т. е. в шесть раз больше, чем при использовании фор- мулы Пуассона. § 41. Числовые характеристики случайных величин. Математическое ожидание и дисперсия Мы познакомились с тем, каким образом изучается случайная величина, если известен ее закон распределе- ния. В ряде случаев для решения задач, поставленных практикой, можно ограничиться рассмотрением лишь не- которых числовых характеристик случайной величины. Определение этих характеристик дается с помощью за- кона распределения. Бывает даже, что закон распреде- ления случайной величины неизвестен, и поэтому ее полное изучение невозможно, но знание этих числовых характеристик все же позволяет решить некоторые во- просы, относящиеся к случайной величине. Основными числовыми характеристиками случайной величины, с которыми мы сейчас познакомимся, явля- ются математическое ожидание (или среднее значение) и дисперсия. Пусть X — дискретная случайная величина, все возможные значения которой хь х2, .... хп принима- ются соответственно с вероятностями рь р2, ..., Рп, так
§ 41] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 279 п что 2р» = 1- Математическим ожиданием случайной / =* 1 величины X называется число М(Х) (иногда обозна- чается также £(%)), определяемое равенством п М(Х) = XiPi+ Х2р2+ ... + Хпрп = 2 Xipi. (1.41) i=l Число возможных значений дискретной случайной величины может оказаться и бесконечным. В этом слу- чае сумма вероятностей представляет ряд, который дол- жен сходиться к единице. Для определения математиче- ского ожидания нужно тогда воспользоваться рядом оо М (X) = x,p, + Х2Р2 + ... +Хпрп+ ... = ^xlPi> (2.41) причем для существования математического ожидания следует предполагать, что ряд (3.41) схо- дится абсолютно. Таким образом, математическим ожиданием (или средним значением) дискретной случайной величины на- зывается сумма произведений всех ее возможных значе- ний на соответствующие вероятности. Выражение математического ожидания имеет следующий механи- ческий смысл. Учитывая, что р. — 1, запишем (1.41) в виде 5 XiP; М(Х)= 1 1 , (3.41) liPi Из (3.41) следует, что М(Х) есть абсцисса центра тяжести системы точек, абсциссы которых равны возможным значениям X, а массы, помещенные в эти точки, равны соответствующим вероятностям. Рассмотрим некоторые примеры. Пример 1.41. Найдем математическое ожидание случайной величины X — числа очков, выпадающих на игральной кости (см. пример 1.38). Здесь X принимает значения от 1 до 6 с вероятно- стями, равными 7б‘ 6 Mw=2 п|=|-ЦАб=3’5- л-1
280 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ VI Итак, математическое ожидание равно 3,5; как видим в данном примере, это число не совпадает ни с одним из значений случайной величины. Пример 2.41. Пусть X — число выстрелов по цели до первого попадания, причем вероятность попадания при отдельном выстреле равна р (см. пример 2.38). Найдем М (х). При решении примера (2.38) указывалось, что слу- чайная величина X может принимать значения 1, 2, ..., п,... с вероятностями р, pq, ..., pqn~\ ..., где q = 1 — р. Имеем оо оо М (X) = 2 tipqn~x = р 2 rt=i п=1 Для вычисления последней суммы воспользуемся фор- мулой для суммы членов геометрической прогрессии (Ы < 1) 1 + ? + <72 4- ... +qn+ ... = и продифференцируем обе части равенства по q: оо l+2q+ ... + nqn~l + ... = У] nqn~l = у, J-^-. n=l Окончательно М(х) = р ,2 =1. v ' (I-?)2 р Итак, среднее число требующихся для поражения цели выстрелов равно 1/р. Это число показывает, сколь- ко выстрелов потребуется в среднем при большом числе серий стрельб. Оно может служить исходным при расчете числа необходимых снарядов. Пример 3.41. Беспроигрышная лотерея содержит N билетов, из которых mi билетов с выигрышем х{ руб- лей, т2 билетов с выигрышем х2 рублей, ..., тп биле- тов с выигрышем в хп рублей. Какова должна быть цена билета а, чтобы сумма денег, вырученных от про- дажи билетов, равнялась сумме всех выигрышей?
§ 41] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 281 Это условие означает, что Na = т{Х1 + т2х2 + ... + тпхп, где N = т1 + т2+ ... + тп. Отсюда mi . т2 , . тп Я дг Х\ "Ь дг Х2-{- . . . + n Хп» Рассмотрим случайную величину X, означающую выигрыш, выпавший на данный билет. Возможными значениями этой случайной величины являются хь х2, ..., хп. Нетрудно подсчитать, что вероятность каж- дого такого значения pz = -~-. Сравнив выражение для математического ожидания случайной величины п п Vi VI т • м W = 2j PiXi ==^iJTXi i = 1 х = 1 с выражением для цены билета а, замечаем, что иско- мая величина цены билета равна математическому ожи- данию суммы выигрыша, а = М(Х). Для непрерывной случайной величины определе- ния (1.41) или (2.41) для математического ожидания непригодны, потому что вероятность каждого отдельного значения для непрерывной случайной величины равна нулю. Математическим ожиданием непрерывной случайной величины называется интеграл оо М(Х)= J x<p(x)dx, (4.41) — оо где ф(х)—плотность распределения случайной вели- чины X. Формула (4.41) является интегральным аналогом формулы (1.41). Действительно, все значения в интер- вале (х, x+dx) можно считать примерно равными х, а вероятность таких значений, как было выяснено в § 39, равна <p(x)dx. Поэтому значения Xi заменяются на х,
282 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI вероятности рг— на q?(x)dx, а сумма заменяется инте- гралом. Как и для дискретной случайной величины, математическому ожи- данию непрерывной случайной величины можно придать механиче- ский смысл. Для этого достаточно, воспользовавшись установленным оо в § 39 равенством J ф(х)д?х = 1, записать формулу (4.41) в виде — оо оо J Хф (х) dx . (5.41) J Ф (х) dx — оо Из формулы (5.41) видно, что математическое ожидание равно абс- циссе центра тяжести однородной плоской фигуры, ограниченной графиком функции #=ф(х) (плотности вероятности) и осью абсцисс. Определим теперь математические ожидания дискрет- ных и непрерывных случайных величин, законы распре- деления которых рассматривались нами в § 40. 1. Биномиальное распределение. Опре- делим математическое ожидание числа наступлений события А в серии из п независимых испытаний, если вероятность наступления А при каждом отдельном испы- тании равна р. Как известно из §§ 34 и 40, случайная величина X, означающая число наступлений события Л, подчиняется биномиальному закону распределения: она может при- нимать значения т = 0, 1, 2, ..., п с вероятностями Рт, п =C™pmqn~m> Иначе говоря, закон распределения случайной величины X задается таблицей (табл. 1.41). Таблица 1.41 X, 0 1 2 . . . т . . . п Pi <!П nw"“’ п(п-1) 2 п-2 1-2 р 4 C”pmqn~m . . . рп
§411 МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 283 По определению математического ожидания находим М(Х) = 0«<?'1+1 •np?'l-’4-2-^y^pV-2+ ... , П (п — 1) . . . (fl — т + 1) m и гм • . и ... + т —----ПТТТт-------Lpmqn~m + ... + пр\ Вынося за скобку пр и производя сокращения, получаем М (X) = пр ^n“I + (п — I) pqn~2 + ... .(ft ~ О * ‘ * (п — /П + 1) т-1 п~/п I I пП-11 1 -2... (zn — 1) Р q -- - ^Р ]• Выражение, стоящее в квадратных скобках, пред- ставляет разложение бинома (р + q)n~l и равно еди- нице, ибо р + q = 1. Поэтому мы получаем М(Х)=ир. (6.41) Заметим, что в § 34 для наиболее вероятного числа ц наступлений события А мы получили оценку пр — q < ц < пр + р. (7.41) Сравнивая (6.41) и (7.41), мы видим, что р, есть целое число, отличающееся от математического ожидания чи- сла наступлений события А меньше чем на единицу. II. Закон Пуассона. Рассмотрим дискретную случайную величину X, распределенную по закону Пу- ассона, т. е. принимающую значения 0, 1, 2, ..., т, .. ♦ с вероятностями Запишем закон распределения в виде таблицы (табл. 2.41). Таблица 2.41 Х1 0 1 2 . . . т . . . Pl е~к 21 . . . tn! . . .
284 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ VI Для математического ожидания имеем М(Х) = 0.е-Ч14е-Ч2угН ... +т^е-*+... л т — 1 \ 1+*+4+---+-(^)Г+ •••)• Но, как известно, ряд в скобках представляет разложе- ние функции ек в ряд Маклорена. Поэтому математиче- ское ожидание равно или М(Х)=Х. (8.41) Мы выяснили, таким образом, вероятностный смысл параметра X, входящего в закон распределения Пуас- сона: параметр К равен математическому ожиданию случайной величины. III. Р авно мерное распределение. Пусть непрерывная случайная величина X подчиняется закону равномерного распределения вероятностей. Плотность распределения в этом случае (см. § 34) имеет вид • 0 при х< С а, <₽(%) = 1 b — а при а < 'х<Ь, 0 при х^ >Ь. Пользуясь формулой (4.41) для математического ожидания, получим ь = (9Л1) а так что математическое ожидание случайной величины, равномерно распределенной на интервале {а, Ь), нахо- дится в центре этого интервала. IV. Нормальное распределение. Непрерыв- ная случайная величина X подчиняется закону распре- деления Гаусса, т. е. ее плотность имеет вид 1 (х-аУ
§ 411 МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 285 Г J хе 2j2 dx. Формула (4.41) для математического ожидания дает М(Х) = —7= V О'/2л Для вычисления интеграла применим подстановку х да = t. Тогда 1 Г -д М (X) = —7= (ot + а) е 2 a dt = оу 2л J — ОО Г _д Г _д = te 2 dt + -?= е 2 dt. (10.41) /2л J /2л J ' — ОО —оо t2 е 2 dt = а. Первый из полученных двух интегралов равен нулю, так как подынтегральная функция нечетная. Второе сла- гаемое, как было показано в § 36, равно 1 а - - — Г 2л Итак, М(Х)=а. (11.41) Мы выяснили, таким образом, вероятностный смысл параметра а, входящего в выражение нормального за- кона распределения; параметр а равен математическому ожиданию случайной величины. Нам остается только рассмотреть некоторые свой- ства математического ожидания. Теорема 1. Математическое ожидание постоян- ной величины есть сама эта величина: М (С) = С. Доказательство. Постоянную величину С мо- жно рассматривать как дискретную случайную вели- чину, принимающую лишь одно значение с вероятностью единица. Поэтому М(С) =С-1 = С.
286 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI Теорема 2. Постоянный множитель можно выно- сить за знак математического ожидания. Доказательство придется проводить отдельно для дискретных и непрерывных случайных, величин. Для дискретной случайной величины, пользуясь (1.41), имеем М (СХ) = 2 CxlPl = С s XiPi = CM (X). i =» 1 i — I Для непрерывных случайных величин нужно вос- пользоваться формулой (4.41), которая дает М(СХ)= J Cxq(x)dx — C J х<р(х)с?х = СМ(Х). — оо —оо Теорема 3. Математическое ожидание суммы не- скольких случайных величин равно сумме их математи- ческих ожиданий: М(Х+ Y + ... + Z) = М(Х)+М(У)+...+М(7). (12.41) Теорема 4. Математическое ожидание произведе- ния двух независимых случайных величин равно произ- ведению их математических ожиданий: М(ХУ) = М(Х)М(У). (13.41) Не будем приводить здесь доказательств теорем 3 и 4. Итак, мы познакомились с одной из основных число- вых характеристик случайной величины — математиче- ским ожиданием, которое характеризует среднее значе- ние случайной величины. Однако знание только среднего значения случайной величины недостаточно для того, чтобы представить себе расположение значений случайной величины отно- сительно ее среднего значения. Например, для случай- ной величины, принимающей значения + 1 и — 1 с ве- роятностью 0,5 каждое, как и для другой случайной ве- личины, принимающей значения + 100 и — 100 с теми же вероятностями, математическое ожидание одинаково
§ 41] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 287 и равно нулю. Между тем разброс этих величин относи* тельно их общего математического ожидания совер- шенно различен. Чтобы охарактеризовать отклонение случайной ве< личины от ее среднего значения, т. е. охарактеризовать разброс значений этой величины, вводят другую ее чи< еловую характеристику — дисперсию или рассеяние. Для характеристики разброса не удается использо- вать разность между случайной величиной и ее средним значением, хотя на первый взгляд это и кажется наи- более естественным. Дело в том, что сама эта разность есть также случайная величина. Если же взять ее мате- матическое ожидание, то в силу свойств математиче- ского ожидания для любой случайной величины X имеем М [X - М (X)] = М (X) - М [М (X)] = о, так что такая характеристика оказывается бесполезной. Среднее значение отклонения получилось нулем, по- тому что положительные и отрицательные отклонения, т. е. отклонения в ту и другую сторону от среднего, взаимно уравновешиваются. Чтобы этого избежать, рас- сматривают не сами отклонения от среднего, а их квад- раты, которые все неотрицательны, и в качестве ха- рактеристики рассеяния принимают среднее значение квадрата отклонения. Дисперсией или рассеянием случайной величины X называется математическое ожидание квадрата раз- ности случайной величины и ее математического ожи- дания D (X) = М [X — М (X) ]2. (14.41) Обозначив для краткости М(Х) =х, можем вместо (14.41) написать D(I) = M(X-x)2, т. е. дисперсия случайной величины X равна математи- ческому ожиданию случайной величины (X — х)2. Если случайная величина X дискретна и принимает значения х2, ...» ... с вероятностями рь р2, ••• /л*, то случайная величина (А’ — х)2 принимает
288 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI значения (хг-—х)2 с вероятностью Pi (f=l, 2, . .-)1)- Поэтому для дискретной случайной величины фор- мула для вычисления дисперсии имеет вид D (Х) = (15.41) i Аналогично, для непрерывной случайной величины получаем D(X) = | (х — х)2 <р (х) dx. (16.41) — оо Часто вместо обозначения D(X) применяется также обозначение о2 (X). Величину о = У D (X) называют средним квадратичным отклонением или стандартом. Пример 3.41. Число очков, выбиваемых при одном выстреле каждым из двух стрелков, подчиняется зако- нам распределения, приведенным в табл. 3.41 и 4.41. Таблица 3.41 Таблица 4.41 Xi 1 2 3 Xi 1 2 3 Pi 0,3 0,2 0,5 Pi 0,1 0,6 0,3 Найдем математическое ожидание числа очков при отдельном выстреле для каждого стрелка. Для первого стрелка имеем М(Х0 = 1-0,3 + 2-0,2 + 3*0,5= 2,2. Для второго стрелка М(Х2) = 1-0,1 +2-0,6+ 3-0,3 = 2,2. Таким образом, математическое ожидание числа оч- ков для обоих стрелков одинаково. Определим теперь дисперсию случайных величин X! и Х2. Для первого 0 Это верно, если все значения (Хг—х)2 различны. Если же (xi—x)2 и (xj—х)2 совпадают, то это значение принимается с веро-« ятностью pi+pj, так что формула (15.41) остается в силе.
§ 41] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 289 стрелка DpG) = (1—2,2)2.0,3+ (2 —2,2)2.0,2 + + (3 — 2,2)2.0,5 = 0,76. Для второго стрелка D(X2) = (1—2,2)2.0,1 + (2 —2,2)2.0,6 + + (3-2,2)2.0,3 = 0,36. Следовательно, при одинаковом среднем для числа очков, выбиваемых обоими стрелками, рассеяние ре- зультатов у первого превышает рассеяние у второго. Та- ким образом, у второго стрелка большая кучность, т. е, результаты его стрельбы более устойчивы. Вообще можно заметить, что чем меньше дисперсия, тем лучше значения случайной величины характери- зуются ее математическим ожиданием. Пользуясь свойствами математического ожидания, можно получить другое выражение для вычисления дис- персии, более удобное, чем (14.41). Для этого преобра- зуем выражение (14.41) следующим образом: D (X) = М [X - М (X) ]2 = М [X2 - 2ХМ (X) + (М (X) )2]. В силу теоремы 3 последнее выражение можно пред- ставить в виде суммы математических ожиданий. Заме- тим еще, что М (X) есть постоянная величина и ее мате- матическое ожидание, по теореме 1, равно ей самой. Поэтому мы получаем D (X) = М (X2) - 2М (X) М (X) + (М (X) )2, или, окончательно, D(X) =М(Х2)-(М(Х))2. (17.41) Таким образом, дисперсия случайной величины рав- на разности между математическим ожиданием квад- рата случайной величины и квадратом ее математиче- ского ожидания. В качестве примера применения формулы (17.41) подсчитаем дисперсию для результатов выстрелов пер- вого стрелка из примера 3.41. Как было подсчитано, M(Xi) =2,2. Далее, математическое ожидание квадрата равно М U?) = I2 • 0.3 + 2- • 0,2 4- З2 • 0,5 = 5,6. 19 Р С Гугер. Б. В Овчинский
290 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI Отсюда D(Xj) = 5,6 — 2,22 = 0,76, как и раньше. Рассмотрим теперь некоторые свойства дисперсии. Теорема 5. Дисперсия постоянной величины равна нулю D (С) = 0. Действительно, D (С) = М (С — М (С)) = М (С — С)2 = 0. Этого следовало ожидать, ибо математическое ожи- дание постоянной равно ей самой и никакого рассеяния значений в этом случае не может быть. Теорема 6. Постоянный множитель можно выно- сить из-под знака дисперсии, возводя его в квадрат: D(CX) = C2D(X). (18.41) Доказательство. Из формулы (17.41) следует D (СХ) = М (С2Х2) - (М (СХ) )2 = С2 [М (X2) - (М (X) )2]. Таким образом, D(CX) = C2D(X), что и утверждалось. Теорема 7. Дисперсия суммы независимых слу- чайных величин равна сумме дисперсий слагаемых: D(X + Y) = D(X) +D(T). (19.41) Доказательство. Пользуясь формулой (17.41), напишем D (X + У) = М (X + У)2 - (М (X 4- У) )2, Раскрыв скобки в правой части и пользуясь теоремами 3 и 4 о математическом ожидании, получаем D (X + У) = М (X2 + 2ХУ + У2) - [М (X) + М (У)]2 = = М (X2) + 2М (X) М (У) + М (У2) - (М (X) )2 - — 2М (X) М (У) — (М (У) )2, откуда D (X + У) = М (X2) - (М (X) )2 + М (У)2 - (М (У) )2 = = D (X) + D (У).
§ 41] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 291 Заметим, что математическое ожидание суммы слу- чайных величин равно сумме математических ожиданий как для независимых, так и для зависимых случайных величин. Для дисперсии суммы необходимо предполо- жить независимость слагаемых, ибо при доказательстве приходится пользоваться теоремой о математическом ожидании произведения. Вычислим теперь дисперсию для случайных величин, распределенных по рассмотренным нами ранее законам. I. Биномиальное распределение. Чтобы вычислить дисперсию случайной величины, распределен- ной по биномиальному закону, воспользуемся теоремой о дисперсии суммы случайных величин. Пусть случай- ная величина X означает количество наступлений собы- тия А в серии из п испытаний, причем в каждом испы- тании вероятность наступления события равна р. По- ложим X = Х\ + Х2 4- ... + ХП1 где Х{ — случайная величина, принимающая только два значения: 1, если в f-м испытании событие А произошло, и 0, если оно не произошло. Закон распределения каж- дой из величин Xi одинаков и задается таблицей Xi 0 1 Pl <7= 1 -р р Математическое ожидание Xi равно М (Хг) = 0 • q + 1 • р = р. Отсюда, кстати, пользуясь теоремой о математическом ожидании суммы, сразу видим, что М (X) = пр (на стр. 283 этот же результат был получен более слож* ным путем). Дисперсия Х{ равна (см. формулу (15.41)) DPG) = (0 — р)2д + (1 — р)2р = рд(р + д) = рд. 19
292 случайные величины [ГЛ vr Отсюда по теореме о дисперсии суммы D (X) = npq. (20.41) II. Закон Пуассона. Дискретная случайная ве- личина X, распределенная по закону Пуассона, может принимать значения 0, 1, 2, ..., т, ... с вероятностями } т Рт = е~\ причем М (X) = Z (см. стр. 284). Поэтому остается определить М(Х2). По формуле (2.41) оо оо оо м т - У ,П‘Р„ - У 21 е-:. = е-к у . ' 7 лы 1,1 Ы (m—1)’ т=0 т = \ т=Л Для вычисления суммы последнего ряда воспользуемся разложением (см. стр. 284) оо ж л У т У 7- (/// — 1)! m= I Дифференцируя это равенство по 7^, находим . , , , V ?-т-‘ ^ + е>-= 2ит~(^Т)Г’ т = I а после умножения на 7, оо т ^7^Tjr = ^-U + i), ш=1 так что математическое ожидание квадрата М(Х2) = 7? + А. Таким образом, дисперсия случайной величины Х> распределенной по закону Пуассона, вследствие (17.41) равна D (X) = М (X2) - (М (X) )2 = 7? + A ~ А2 - А, (21.41) т. е. в этом случае дисперсия равна математическому ожиданию. III. Равномерное распределение. Непре- рывная случайная величине! X, разномерно распределен-
§ 41] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 293 ная в интервале (а, Ь), имеет плотность вероятности ф(х) = 0 1 Ь — а 0 при при а<х< Ь, и математическое сления дисперсии (4.41): х^Ь ожидание М (X) = -а . Для вычи- найдем М(Х2), пользуясь формулой при ь М(Х2)= / а Поэтому дисперсия равномерно распределенной слу- чайной величины равна wo-w (22.4|) Отметим, между прочим, что среднее квадратичное отклонение (стандарт) равно в этом случае Ь — а О =--- 2/3 Таким образом, для случайной величины, равномерно распределенной в интервале (а, Ь), среднее квадратич- ное отклонение равно у=-= 0,288675... длины интер- х2 1____Ь3 — а3 __ а2 + ab + Ь2 йХ ~ З(Ь-а) ~ 3 (23.41) вала. IV. Нормальное распределение. Непрерыв- ная случайная величина X, распределенная по закону Гаусса, имеет плотность вероятности 1 (*-д)2 Ф (*) = - е 2о’ , а у 2л причем М (X) = а. ( Пользуясь формулой (16.41) для дисперсии непре- рывной случайной величины, находим оо 1 Г (х-а)2 (x — d)2e 2j2 dx. D(X) = H= оУ 2л — СО
294 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI Для вычисления интеграла положим Л U гр —— = z. Тогда I г2е 2 dz. — оо Последний интеграл легко вычислить по частям, пола- гая z = u, ze 2 dz = dv, откуда __Z2 du = dz, v = — е 2, так что D(X) = J е 2 dz Как легко видеть, проинтегрированный член обра- щается в нуль, а 00 22 [ е 2 dz= У~2я. — оо Поэтому мы получаем D(X) = а2. (24.41) Мы выяснили теперь вероятностный смысл второго параметра, входящего в выражение закона Гаусса: ве- личина о2 равна дисперсии случайной величины X, Это обстоятельство объясняет, * между прочим, применение для дисперсии обозначения о2 вместо D(X). § 42. Двумерная случайная величина. Функция распределения и плотность вероятности Рассматривавшиеся в предыдущей главе случайные величины принимали различные числовые значения и геометрически изображались точками прямой. Ча- сто приходится встречаться со случайными величинами более сложной природы, которые геометрически изо- бражаются точками плоскости. Их называют двумерными случайными величинами.
§ 42] ДВУМЕРНАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА 295 Примером такой случайной величины может служить точка падения снаряда, если обстреливаемый участок рассматривать как плоскую область. Аналогично, при изучении плоского броуновского движения поло- жение частицы, наблюдаемое под микроскопом в дан- ный момент времени, есть двумерная случайная величина. Можно привести пример и иного характера. В электрической цепи с активными и реактивными эле- ментами процесс полностью определяется двумя величи- нами: током и напряжением. Поэтому можно сказать, что состояние такой цепи при случайной нагрузке яв- ляется двумерной случайной величиной. Вводя на рассматриваемой плоскости систему коор- динат, мы можем каждую точку, являющуюся значением двумерной случайной величины, охарактеризовать па- рой чисел — ее координат. Каждая из координат в свою очередь является обычной (одномерной) случайной ве- личиной. Поэтому двумерную случайную величину мо- жно рассматривать как систему двух одномер- н ы х. При дальнейшем изучении двумерных случайных величин мы будем использовать обе возможности, в за- висимости от того, какая из них окажется более удоб- ной. В ряде случаев мы будем рассматривать точку М плоскости, в другом — пару ее координат X, У. Двумерную случайную величину называют дискрет- ной, если она может принимать конечное число или по* следовательность различных значений. Для ее полной характеристики достаточно указать множество возмож- ных значений (точек плоскости) и вероятность каждого значения, т. е. закон распределения. Закон распределения может быть представлен в фор- ме таблицы с двумя входами (табл. 1.42). Здесь по го- ризонтали записаны значения, которые может прини- мать абсцисса двумерной случайной величины, а по вер- тикали— ее ордината. В клетках таблицы приведены соответствующие вероятности того, что двумерная слу- чайная величина попадет в данную точку плоскости. Так, например, Р (хг-, у^) означает вероятность того, что значением двумерной случайной величины окажется точка с координатами (*;,!/?)• Если рассматривать дву- мерную случайную величину как совокупность двух
296 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI Таблица 1.42 \ X у\ A'i Х2 xi хп S У\ У2 Р (*>, У.) р (X|, Уч) Р(х2, //>), Р (хг, у2) Г ’ Р (xi, 1/1) Р (Xi, У2) р (хп, у>) Р (хп, У2) P(yt) Р(Уг) У! р (*'1. У/) Р (хг, 1Ц) р (Xi, щ) Р (хп, у/) Р(<Л) Ут Р ут) Р (*2, Ут) Р (л7» Ут) Р (Xfu Ут) Р(Ут) S Р(х>) Р(х2) Р (Xi) р (хп) 1 одномерных (X, У), то P(x?-,z/J есть вероятность совме- щения двух событий: X = У = у}. Предполагая, что все приведенные в таблице комби- нации X = xiy Y=yj являются единственно возможными, приходим к очевидному равенству п т 2 (1-42) 1=1 /=1 Имея таблицу вероятностей P(xf, можно найти вероятность того, что случайная величина X примет зна- чение Xj независимо от того, какое значение принимает У. По теореме сложения находим Р (х() = Р (X = Xi) = Р (xit У1) + Р (л;, у2)+ ... +Р {xh ут)= т = 2 Р (X,-, у,). (2.42) Таким образом, для нахождения вероятностей P(X=Xi) нужно произвести суммирование вероятностей Р(хг-, у/) в таблице по f-му столбцу. Эти вероятности и записаны в последней строке таблицы. Аналогично, вероятность того, что случайная вели- чина У примет значение У — yj независимо от значения X, получается суммированием вероятностей в /-й строке Р(у/) = Р(У = у/)= 2Р(х/, уД (3.42) i = 1 Эти вероятности образуют последний столбец таблицы.
ДВУМЕРНАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА 297 § 42] Как следует из равенства (1.42), сумма вероятностей в последнем столбце, как и в последней строке, должна равняться единице, которая и поставлена в правом ниж- нем углу. Найдем еще условную вероятность того, что случай- ная величина Y примет значение Y = yjt при ус л о в и и, что X = Xi. Эту условную вероятность будем обозна- чать Px-v. (У = z/j), или, короче, P(///xz). Согласно тео- реме умножения Р (Хг, У)) = PUi) РЫ-Vi). откуда получаем значение искомой условной вероятности р (X., У .) • <4-42) Если менять значения //;(/ = !, 2, ..., т), оставляя значение Х = лу неизменным,™ Р(у1/лу), Р(г/2/^), • • . ..., Р (r/nt/Хг) выражают вероятности того, что случай- ная величина Y принимает соответственно значения уъ ..., ут при одном и том же значении X = хг-. Сово- купность значении {г/;} и соответствующие им вероятно- сти {P(yj/*i)} естественно назвать условным законом распределения Y при постоянном X = При изменении Xi (Z= 1, 2, ..., it) будет соответственно изменяться и условный закон распределения. Легко показать, что сумма условных вероятностей P(f/;/Xi) при данном Xi равна единице. В самом деле, пользуясь формулой (4.42), получаем т /=1 /=1 так как знаменатель не зависит от индекса суммирова- ния /. Но вследствие формулы (2.42) числитель полу- ченной дроби равен ее знаменателю. Таким образом, т 2РШ=1. (5.42) /=1 Все сказанное относительно условного закона рас* пределения Y при данном значении X целиком перено-
298 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI сится и на случайную величину X при данном У. Услов- ная вероятность Р(хЛуз) того, что случайная величина X примет значение X = хг- при условии, что У = Уз находится по формуле Р (Xу ) Р(Ш)- р(>.) <6-42) Значения {х,} вместе с вероятностями {Р (xjyp] образуют условный закон распределения X при постоянном Y = у,. Сумма условных вероятностей вследствие формул (6.42) и (3.42) равна единице п ^Р(Х(1У1)=1. (7.42) 1 = 1 Отметим в заключение, что если для любой пары возможных значений X = х, У = у справедливо равен- ство P(x,f/) = P(x)P(r/), (8.42) то случайные величины X и У называют независимыми. Двумерная случайная величина, принимающая все значения из некоторой области G плоскости, называется непрерывной двумерной случайной величиной. Впрочем, это определение нуждается в уточнении, аналогичном сделанному в § 40. Для того чтобы двумерная случай- ная величина была непрерывной, необходимо еще допол- нительно предположить, что она обладает непре- рывной плотностью вероятности. Плотность вероятности двумерной случайной величи- ны определяется следующим образом. Плотность вероят- ности одномерной случайной величины X в точке х определялась нами в § 40 как функция ф(х), удовлет- воряющая условию Р (х < X < х + dx) ~ф (х) dx. (9.42) Аналогично этому, для двумерной случайной величины (X, У) плотность вероятности определяется как функция ф(х, у), удовлетворяющая в точке (х, у) условию Р(х< X < х + dx, у < Y <у + dy) <р(х, y)dx dy, (10.42)
§ 42] ДВУМЕРНАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА 299 причем это равенство выполняется с точностью до бес- конечно малых более высокого порядка, чем dx dy. Гео- метрически плотность вероятности выражает вероятность попадания случайной величины в прямоугольник (рис. 39) с точностью до бесконечно малых более высокого по-* рядка по сравнению с произведением dx dy. Из определения плотности вероятности следует, что вероятность попадания двумерной случайной величины в некоторую область G равна Р (М е G) = j j <р (х, у) dx dy. G (11.42) Действительно, разбив область G на прямоугольники и при- менив к каждому из них (10.42), получим, вследствие теоремы сложения, искомую вероятность в форме двойной y+dy У ~д (X.Y) ~А\(х,у) I х x+dx Рис. 39. интегральной суммы. Переход к пределу при стремлении площадей прямоугольников к нулю приводит к форму- ле (11.42). Если все возможные значения случайной ве- личины принадлежат G, то, очевидно, / J <р(х, y)dxdy = 1. G (12.42) Это равенство во всяком случае справедливо, если G совпадает со всей плоскостью, так что для любой непре- рывной двумерной случайной величины можно написать 4-оо 4-оо J / <Р (х, у) dx dy = 1. — оо —оо (13.42) Плотность вероятности двумерной случайной вели- чины иначе называют дифференциальным законом рас- пределения. Для двумерной случайной величины можно определить также интегральный закон распределения или двумерную функцию распределения, как это сде- лано в § 39 для одномерной случайной величины.
300 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ VI Значением функции распределения двумерной слу- чайной величины в точке (х, у) называют вероятность того, что случайная величина попадает левее и ниже этой точки, т. е. что ее координаты удовлетворяют не- равенствам F(x,y) = Р(Х<х, Y<y), (14.42) как показано на рис. 40. Из определения и формулы (11.42) следует, что X у F (х, у) — j ( ф(м, v)dudv. (15.42) Как было уже сказано, координаты X и У точки, вы- ражающей двумерную случайную величину, можно рас- сматривать как две случай- ные величины. Вообще го- воря, случайные величины X и У не являются неза- висимыми между со- бой. Если же они незави- симы, то изучение двумер- ной случайной величины значительно упрощается. В самом деле, пусть слу- чайная величина X имеет плотность вероятности q?i(x) и функцию распределения Ei(x)= | q>}(u)du. Пусть, далее, случайная величина У — оо не зависит от X и имеет плотность вероятности и функ- цию распределения соответственно ф2(//) и F2(y) = у = J ф2(^)^щ Тогда вероятности события х < X < х + dx, у < Y < у + dy можно получить с помощью теоремы умножения как произведение вероятностей Р (х < X < х + dx, у <Y <у -Y dy) — = Р(х<Х<х-У dx) • Р (y<Y <у + dy).
§ 421 ДВУМЕРНАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА 301 Сравнивая полученное выражение с (10.42), найдем, что ср(х, t/) = <pi(x)<p2(l/). (16.42) Аналогично этому для функции распределения получаем х у X у F(x, у) = | J ф! (u)<p2(v)dudv = j* q{(u)du- J ф2(и)йи ИЛИ F(x,y)= F\(x)F2(y). (17.42) Подчеркнем еще раз, что формулы (16.42) и (17.42) имеют место лишь в том случае, когда отдельные коор- динаты двумерной случайной величины будут незави- симы. Легко понять, что и наоборот, если плотность вероятности и функция распреде- ления двумерной случайной ве- личины могут быть представлены соответственно в виде произведе- ний (16.42) и (17.42), то отсюда следует, что координаты являют- ся независимыми. Пример 1.42. Двумерная случайная величина равномерно распределена в области G, пло- щадь которой равна Q, т. е. может принять любое зна- чение из этой области с одинаковой вероятностью. Опре- делим ее плотность вероятности. В этом случае, как ясно из определения, плотность вероятности следует считать постоянной. Пусть ф(х, у) = = А. Тогда по формуле (12.42) || A dx dy = 1, G а так как по известному свойству двойных интегралов J | dx dy = Q, то А = 1 /Q. G Пример 2.42. Двумерная случайная величина рас- пределена по всей плоскости с плотностью (1 + х2) (1 + г/2) b а & Рис. 41. О (18.42)
302 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VF (аналог закона Коши). Найдем двумерную функцию распределения F(x,y) и вероятность попадания точки М в прямоугольник R, изображенный на рис. 41. Определим сначала величину А. По формуле (13.42) 4-оо 4-оо 4-оо 4-оо [ [ <р (х, у) dx dy = f [ , ^2^,^ 2< = J J V! V J J (1 4-x2) ([ +у2) — oo — oo —oo —oo = A arctg x I1X arctg у |1“ = 1, т. e. Лл2 = 1, откуда A = 1/л2. Итак, плотность вероят- ности (18.42) должна иметь вид ф = л2 (1 + х2) (1 + у2) • Для функции распределения по формуле (15.42) на- ходим х у х у р ( \ 1 f f dudv _ 1 Г du f dv J J (l+tt2)(1+o2) “ n2 J 1+M2 J — oo —oo —oo —oo = ^2- (arctg x + y) (arctg у + -у) = = / arctg x _1_\ / arctg у П \ л 2 / \ л ' 2 / ’ Вероятность попадания точки M в прямоугольник R на- ходится с помощью (11.42) a b а Ъ Р(М C=7?) = A- f [ и х п =4- f -Лт f -ГТ^ = л2 J J (1 + и2) (1 + V2) л2 J 1 + и2 J 1 + V2 0 0 0 0 __ arctg a arctg b — л2 Легко заметить, что случайные величины X и У, яв- ляющиеся координатами точки Л4, в данном примере не- зависимы. Действительно, плотность вероятности пред- ставляется в виде произведения ф = ядЬ) 7(ГТ?) = ф> № ф2
§ 43] ХАРАКТЕРИСТИКИ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 303 Пример 3.42. Двумерная случайная величина рас- пределена в первой четверти координатной плоскости (0^х<4-оо, 0^(/<+оо) с плотностью вероятности ф(х, у) = Ае~х~у. Найдем двумерную функцию распределения и вероят-* ность попадания точки М в тот же прямоугольник изображенный на рис. 41. Так как <р(х, у) по определению тождественно равна нулю, если х<0 или у < 0, то формула (13.42) приобре- тает вид оо оо | J Ае~х~« dx dy = 1, о о откуда находим оо 4 J e~xdxj e~v dy = Ае~х = А = 1. о о Далее, формула (15.42) дает х у F(x, у) = | J е-«-° du dv = [- [- = о о = (1 — е_*)(1 -e-v). Вероятность попадания в прямоугольник R будет равна а Ъ р (М е= R) = | j е~и~° dudv = [ — е-“]“ [- = о о = (1 — е-а)(1 — е~ь) § 43. Числовые характеристики системы двух случайных величин Числовые характеристики двумерной случайной ве* личины удобно вводить, рассматривая двумерную слу- чайную величину как систему двух одномерных. Покажем сначала, как, зная двумерную плотность распределения <р(х, у), найти плотность распределения
304 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI случайной величины X. Аналогичный вопрос нахожде- ния закона распределения случайной величины X по из- вестному двумерному закону применительно к дискрет- ной случайной величине был уже рассмотрен нами в §42. Здесь мы займемся непрерывными случайными величи- нами. Если проинтегрировать плотность <р(х, у) по всем возможным значениям величины У (т. е., вообще го- воря, от —оо до +оо), то вследствие теоремы сложения получим плотность вероятности того, что случайная ве- личина X примет значения из интервала (х, х + dx). Обозначив эту плотность через <pi(x), можем написать 4-оо Ф1(х)= j ф(х, y)dy. (1.43) — оо Точно так же плотность вероятности случайной вели- чины У будет 4- оо Фг({/) = J <р(х, y)dx. (2.43) — оо Формулы (1.43) и (2.43) соответствуют формулам (2.42) и (3.42) для дискретной двумерной случайной величины, с той разницей, что входящие туда суммы за- менены здесь интегралами. Имея плотности вероятностей X и У, нетрудно найти соответствующие функции распределения. Их можно за- писать в виде X X 4-00 Fi (*) = / Ф1 W dx = J dx | ф (х, у) dy, (3.43) — оо — эо — оо у У +°° ^2(«/)= /ф2(«/)^= / dy J ф(х, y)dx. (4.43) — оо —оо —оо Можно ввести также условные законы распределе- ния, подобно тому как это было сделано в § 42 для ди- скретных случайных величин. Обозначим через у(у/х) плотность вероятности того, что У находится в интер- вале (у, у + dy) при условии, что X находится в ин-
§ 43] ХАРАКТЕРИСТИКИ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 305 тервале (х, x + dx). Аналогичный смысл имеет также и обозначение q(x/y). Тогда по теореме умножения найдем ф (х, у) dx dy = ф1 (х) dxcp (уlx) dy = ф2 (у) dyq (х/у) dx. Воспользовавшись формулами (1.43) и (2.43) для плотностей вероятности, получим <5 43) J <f(x,y)dy — ОО <р {х/у) = ЧФЦ1 = . (6.43) ф2(у) +о° I Ф (х, у) dx Величины ф(у/х) и ф(х/у), выраженные формулами(5.43) и (6.43), носят название условных плотностей вероят- ности. Пример 1.43. Случайная точка М(Х, Y) попадает с одинаковой вероятностью в любую точку эллипса с полуосями а, Ь, совпадающими с осями координат. Тре- буется определить плотность вероятности случайных ве- личин X и У, а также условные плотности вероятности <p(z//x) и <р(х/у). Для непрерывной двумерной случайной величины, равномерно распределенной в области G, как мы уже вывели в примере 2.42, плотность вероятности постоянна и равна ф(х, y) = l/Q для М е G, где Q означает пло- щадь области G. Как известно из интегрального исчис- ления, площадь эллипса с полуосями а и Ь равна Q = = лаЬ. Поэтому в нашем случае для двумерной плот- ности вероятности получаем 1 nab о при при <p(-v, у) = —+^-<1 а2 Ьг 1 — 1 О2 f b2 " 1 Если при этом х меняется на отрезке —то соответствующей областью изменения у при каждом х будет отрезок — b ]/ 1 — х2/а2 У b У1 — x2ja2. 20 Р. С. Гутер, Б. В. Овчинский
306 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI Плотность вероятности случайной величины X можно получить по формуле (1.43) при дополнительном усло- вии |х| + оо а ф1(х)= J ф(х, y)dy = | = — °О Ь у/-— ---V а2-х2 а При |х| >а имеем <pi (х)=0. Аналогично находится плотность вероятности Y при условии \у\ ^Ь: 4-оо Ь У ф2(*/)= / <р(х, y)dx= J -±-dx=.^.yb2~y2. Для \у\ > &, как и ранее, имеем ф2(^)~0. Найдем, далее, условную плотность ф(у/х). Применяя формулу (5.43) имеем вероятности 1 г / \ Ф (х, у) nab Ф (УМ == -"оо' ------= -5—.............. е tfa2 — хг J <р (х, у) dy ла2 — ОО _____а____ 2Ь / а2 —х2 ’ при условии | х к а и | у ~ ]/ а2 — х2. Если же | х \ ‘^а или | у |>-“ ]Аа2 — х2, то ф(///х) = О. Аналогичные вычи- сления дают Ф (х/у) =---- У 2а}^Ь2-у2 при условии |у|<6 и | х | у УЬ2 — у2 и ф(л7г/)=0, если хотя бы одно из этих двух неравенств не выпол- няется. Пусть теперь М (X, У) — двумерная случайная вели- чина с плотностью вероятности ф(х, у). Для ее числовых характеристик рассмотрим математические ожидания и дисперсии для случайных величин X и У.
§ 43] ХАРАКТЕРИСТИКИ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 307 Математические ожидания случайных величин X и У в соответствии с их определениями из § 41, находятся по формулам 4-оо 4-оо М(Х) = х = J xqi(x}dx, М(У) = у = J yy-i{y)dy. — оо — оо Пользуясь формулами (1.43) и (2.43), можно выразить эти математические ожидания через двумерную плот- ность вероятности ср(х, у)' 4-оо 4-оо М (X) = х = | | хф (х, у) dx dy, — оо —оо 4-оо 4-оо М(У) = £ = J J г/ф(х, y)dxdy. — оо —оо (7.43) Точка М с координатами (х, у), определенными по формуле (7.43), характеризует центр рассеяния двумер- ной случайной величины, около которой рассеяны слу- чайные точки М(Х, У). Мера рассеяния по осям задается дисперсиями одномерных случайных величин 4-оо 4-оо 4-оо D(X)= / (х—х)2ф!(x)dx = J | (х—х)2ф(х, y)dxdy, D(K) = / (y-y)2q2(x)dy= J J (г/-у)2ф(х, y)dxdy. — оо —оо —оо (8.43) Как и для одномерного случая, разлагая подынтеграль^ ную функцию на слагаемые, можно получить несколько иные выражения для дисперсий, более удобные для вы- числений: 4-оо 4-оо D(X)= j j х2ф(х, у) dx dy — х2, — оо —оо 4-оо 4-оо D(K)= j J 1/2ф(х, y)dx dy — y2. (9.43) 23*
308 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ VI Вычисления математических ожиданий и дисперсий в соответствии с формулами (7.43) и (9.43) можно объ- единить в одну вычислительную схему. Для этой цели введем понятие центрального момента системы случайных величин. Центральным моментом порядка k, s системы слу- чайных величин (X, У) будем называть математическое ожидание произведения (X— x)h(Y -— y)s. Для непрерыв- ных случайных величин центральный момент поряд- ка k, s находится по формуле + оо -f-оо щ, j j (x-x)k(y-y)s<f(x, y)dxdy. (10.43) При этом предполагается, что k и s — неотрицательные целые числа. Сумму k + s называют порядком центрального мо- мента, так что все моменты порядка k, s, для которых, например, & + s==l, называют моментами первого по- рядка, а все моменты, для которых k + $ = 2 — момен- тами второго порядка. Рассмотрением только этих мо- ментов мы и ограничимся. Из формул (7.43) вытекает, что центральные момен- ты первого порядка равны нулю. Действительно, так как k и s целые неотрицательные, то существуют только два различных центральных момента первого порядка—1,0 и 0,1. Они имеют вид соответственно 4-оо 4-оо Hi,o= J / (х-х)<р(х, y)dxdy — оо —оо 4-оо 4-оо Но.1= f / (У-У)<$(х, y)dxdy. — оо —оо 4-оо 4-оо Так как J | <р(х, у)dxdy — 1, то — оо —оо 4-оо 4-00 И1,о= J f х<р(х, y)dxdy — x, — оо —оо
§ 43] ХАРАКТЕРИСТИКИ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 309 что равно нулю по определению х (см. формулу (7.43)). По той же причине ц0,1 = 0. Определение (8.43) дисперсий показывает, что дис- персии D (Д') и D (У) представляют собой центральные моменты второго порядка, именно, порядка соответст- венно 2,0 и 0,2. Особую роль играет смешанный центральный момент второго порядка, т. е. момент порядка 1,1. Его называют корреляционным мо- ментом или моментом связи случайных величин X и Y и обозначают КХу- В соответствии с определением (10.43) имеем 4-оо 4-оо Кж»=Р1,1= / / (х - х) (у - у) Ф (х, у) dx dy. (11.43) — оо — оо Разбивая интеграл (11.43) на отдельные слагаемые и учитывая равенство нулю центральных моментов пер- вого порядка, можно получить другое выражение для корреляционного момента. Именно, 4-оо 4-оо Кху = J / Х(у-у)ф(х, y)dxdy — — оо —оо 4-оо 4-оо -X j J {у-y)q(x, y)dxdy = — оо —оо 4-оо -J-оо 4-оо 4-оо = хг/ф(х, у) dxdy-у | J хф(х, y)dx dy-xyM. — оо —оо —оо —оо Окончательно получаем 4-оо -{-оо КХу— J J хуф(х, у)dxdy — ху. (12.43) — оо —оо Пример 2.43. Точка М(Х, У) распределена в квад- рате 0^х^л/2, 0^г/^л/2 с плотностью вероятно- сти, равной ф(х, у) = 0,5 sin(x + у) внутри и <р(х, у) = О вне этого квадрата. Найдем: а) двумерную функцию распределения F(x, у)\ б) математические ожидания М(Х), М (У) случай- ных величин X и У, т. е. координаты центра рассеяния;
310 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI в) дисперсии D (X) и О(У); г) корреляционный момент Решение, а) Двумерная функция распределения F(x, у) находится по формуле (15.42): х у F(x, у) = Р(Х<х, Y<y) = 0,5 j j sin(x + y)dxdy = о 0 x x «=0,5 J [— cos(x + z/)]^=0 dx = 0,5 J [cosx—cos(x + t/)]dx = о о •= 0,5 [sin x — sin(x + z/)]*=0 = 0,5 [sin x — sin(x + //) + sin y\. б) Математическое ожидание случайной величины X находится по формуле л/2 л/2 M(X) = 0,5j J х sin (х + у) dx dy = о о л/2 л/2 = 0,5 | х dx | sin (х + y)dy = о о л/2 = 0,5 | х [cos х — cos (х + л/2)] dx. о Заменяя cos(x + л/2) = — sin х и интегрируя по частям, находим окончательно М (х) = л/4. Для величины Y на- ходим аналогично л/2 л/2 M(y) = 0,5j J i/sin(x + y)dxdy = л/4, о о так что центром рассеяния является в данном случае точка (л/4, л/4), т. е. центр квадрата. в) Для вычисления дисперсий воспользуемся фор- мулой (9.43); л/2 л/2 D(X) = 0,5 J j х2 sin(x + y)dx dy - (л/4)2 = о о л/2 = 0,5 J x2[cosx —cos(x +n/2)](Zx —л2/16. о
§43] ХАРАКТЕРИСТИКИ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 311 Заменяя cos(x + n/2) =—sinx, как и в пункте б), и дважды интегрируя по частям, получим D(X) = n/2 + n2/16-2 0,187. Дисперсия случайной величины У имеет то же самое значение. г) Вычислим, наконец, корреляционный момент Кху. Согласно формуле (12.43) л/2 л/2 KXI/ = 0,5j j ху sin (х +у) dxdy — л2/16. о о Те же приемы вычислений дают КхУ ~ —0,045. Рассмотрим теперь более подробно роль корреля- ционного момента в характеристике связи между слу- чайными величинами. Эта роль устанавливается прежде всего следующей теоремой. Теорема 1. Если случайные величины X и Y не- зависимы, то их корреляционный момент равен нулю, Кху = 0. Доказательство этой теоремы мы проведем для слу- чая непрерывных случайных величин, хотя она справед- лива и в общем случае. Как было установлено в § 42, если случайные величины X и У независимы, то плот- ность вероятности двумерной случайной величины (X, У) представляется в виде произведения ф(*, У) — Ф1 (х)<р2(у). Воспользовавшись этим равенством, запишем выра- жение для корреляционного момента в виде 4-оо 4-оо = J / (x-x)(y-y)q>(x, y)dxdy = — оо —оо 4-оо 4-оо == J (х-х)ф](х) dx J (y-y)<P2(y)dy.
312 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ (ГЛ VI Но каждый из интегралов в правой части равенства представляет собой центральный момент первого поряд- ка соответствующей случайной величины и потому ра- вен нулю. Итак, для независимости случайных величин необ- ходимо, чтобы их корреляционный момент равнялся нулю. Обратная теорема, однако, не верна и равенство нулю корреляционного момента не является доста- точным для независимости случайных величин. Часто взамен корреляционного момента для харак- теристики связи между случайными величинами X и Y пользуются безразмерной величиной, равной отношению корреляционного момента к квадратному корню из про- изведения дисперсий _ Кху ____________ ху ~ (D (X) D (Г) “ ‘ (13.43) Это отношение называют коэффициентом корреляции. Коэффициент корреляции гху по абсолютной величине не превосходит единицы, т. е. всегда удовлетворяет не- равенствам 1. (14.43) Из определения коэффициента корреляции (13.43) и теоремы 1 сразу вытекает следующая Теорема 2. Если случайные величины X и Y неза- висимы, то их коэффициент корреляции равен нулю. Имеет место еще одна теорема, более подробно вы- ясняющая роль коэффициента корреляции для харак- теристики связи между случайными величинами. Теорема 3. Если случайные величины X и Y ли- нейно зависимы, т. е. между ними существует соотноше- ние Y = aX + b, то абсолютная величина коэффициента корреляции равна единице. Более подробно, гху = + 1, если а>0, и гху = — 1 при а<0. Доказательство. Корреляционный момент равен Кху = М[(Х — х) (Y — у)] = М[(Х-х) (аХ + Ь — у)]. Воспользуемся тем, что математическое ожидание сум- мы случайных величин равно сумме математических ожиданий слагаемых (см. § 41).
§ 43] ХАРАКТЕРИСТИКИ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН 313 Далее у=М(У) =M(aX + b) = аМ{Х) + b = ах + &, поэтому для корреляционного момента получаем К ку = М [(X - х) (аХ + b - ах - Ь)] = М[(Х-х)а(Х-х)] = = аЩХ - х)2 = aD (X) = ао2х. Найдем дисперсию Y D (у) =» а2 = м (у - уУ = М (аХ + b - ах - Ь)2 = = а2М (X - х)2 = a2D (X) = а2а2, откуда оу = \а^х. Таким образом, Кху __ аа2 _ а /+1 при а > ° Гху ~ Wy ~ ъх | а | ”~ | а | — 1 при а < О, чем наша теорема доказана. Сделаем несколько общих замечаний относительно зависимости между случайными величинами. Понятно, что крайними «полюсами зависимости» являются пол- ная независимость случайных величин или, наоборот, функциональная зависимость между ними. Если случай- ные величины независимы, то знание значений одной из них никак не отражается на сведениях о другой случай- ной величине. Наоборот, если случайные величины свя- заны функциональной зависимостью, то значение, при- нятое одной из них, однозначно определяет значение, принимаемое другой. Существует другой вид зависимости между случай- ными величинами, когда знание значения одной из них не определяет однозначно значение другой, а определяет лишь закон распределения другой случайной величины или, инауе говоря, вероятности, с которыми другая случайная величина может принимать те или иные свои значения. Такую зависимость принято называть корреляцион- ной или стохастической. Ее легко проиллюстрировать на примере дискретной двумерной случайной величины. Именно, в § 42 мы задавали закон распределения дву- мерной дискретной случайной величины в виде таблицы с двумя входами и рассматривали условные законы
314 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ VI распределения, определяемые вероятностями Р или соответственно P(x/#0- Выбор определенного зна- чения случайной величины X задает определенный закон распределения для случайной величины У. Коэффициент корреляции численно характеризует корреляционную зависимость между случайными вели- чинами. Если они независимы, то коэффициент корреля- ции равен нулю. При значениях г в пределах 0< |г| <1 между случайными величинами имеет место корреляци- онная зависимость, тем более «тесная», чем ближе вели- чина |г| к единице. Значение же |г| = 1 соответствует линейной функциональной зависимости между случай- ными величинами вида Y=aX + b. Нужно только иметь в виду, что значение г показы- вает отклонение зависимости между случайными вели- чинами от линейной. При других видах функцио- нальной зависимости между X и У может случиться, что коэффициент корреляции мал или даже равен нулю. § 44. Нормальное распределение двумерной случайной величины Роль нормального закона распределения Гаусса для двумерных случайных величин так же велика, как и для рассмотренных ранее одномерных случайных величин. Поэтому мы выделили рассмотрение нормального за- кона в отдельный параграф. Начнем с того случая, когда координаты X и У дву- мерной случайной величины независимы и распределены по нормальному закону, каждая со своим математиче- ским ожиданием а и & и дисперсиями соответственно а2 и о2. В силу независимости X и У плотность распре- деления точки (X У) может быть выражена в виде про- изведения (х-а)г 1 2о2 Ф (х, у) = Ф1 (х) ф2 (у) = — е х или ---т=- е Оу У 2л (у-Ы ’ Ч (х—а)2 (y-W / \ 1 2ох Ч Ф (*> У) = е у т v 2лОхОу (1-44) 1
§ 44] НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ДВУМЕРНОЙ ВЕЛИЧИНЫ 315 Формула (1.44) и выражает двумерный нормальный закон распределения в простейшей форме. Точку пло- скости с координатами (а, Ь) обычно называют центром нормального распределения или центром рассеяния. Пример 1.44. Двумерная случайная величина рас- пределена по нормальному закону с а = b = 0. Опреде- лить вероятность ее попадания в прямоугольник R (а<х<р, y<f/<6), изображенный на рис. 42. По формуле (11.42) получаем Р(Ме/?) = Р(а<Х<р, у<У<д) = 3 б *2 у2 1 f Г 2°х 2ои Л Л = ~------ г х у ахай = 2жуаоу J J * а Y 3 __ 1 Г 2ах Л =-----е х ах • 2л J Каждый из полученных интегралов может быть выражен через функцию Лапласа. Положив — = /, получим р х2 1 f 2ах J 1 -----т=г е х ах = - V— р/<хх /2 [ е~ dt = ф(4-)-ф(-^4« J \ &х / \ &х / а/ах Преобразовав аналогичным образом и второй интеграл, получим Р(Ме Л)- [Ф (X) ~Ф (£•)] [ф (£) -Ф (^)]. (2.44) Равенство (2.44) можно было бы получить непосред- ственно, пользуясь формулами § 42 и теоремой умно- жения. Для двумерных случайных величин плотность нор- мального закона распределения вместо (1.44) чаще за- писывают в другой форме, вводя вместо дисперсии о другую числовую характеристику. Пусть одномерная случайная величина X распределе- на по нормальному закону с математическим ожиданием
316 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI вне его. Эту величину У, $ а и дисперсией ох. Найдем такую величину Ех, чтобы вероятность отклонения случайной 'величины X от а не более чем на Ех, т. е. вероятность попадания X в интер- вал (а — Ех,а + Ех), равнялась бы половине (рис. 43). Иначе говоря, с равной вероятностью случайная вели- чина окажется внутри интервала (а — Ех,а + Ех) или Ех называют вероятным или срединным отклонением. Ясно, что величина Ех ха- рактеризует рассеяние X, а по- тому должна быть связана с дисперсией вх. Найдем эту связь. Из определения Ех сле- дует Р (—Ех< X — а< Ех)= 1/2, или Р (а — Ех< X < а + Ех) = 1/2. 7 се fi а Рис. 42. О Пользуясь функцией Лапласа, получаем Р(я-£х<Х<а + £х) = 2Ф (^) = у, откуда Ф = 0,25. Из таблицы значений функции Лапласа (стр. 430) находим Ех = 0,6745 <гж. (3.44): Часто вместо (3.44) пишут также £х = р/2ож, где р = 0,4769. (4.44) Введя в выражение (1.44) срединные ошибки вместо дисперсий, получим выражение для плотности вероят- ности нормального распределения Г (х—а)2 (у-Ь)21 О2 Е2 Е2 L х у • <5-44) Выражение (5.44) часто называют канонической фор- мой закона распределения Гаусса.
§ 44] НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ДВУМЕРНОЙ ВЕЛИЧИНЫ 317 р2 Обозначив для краткости • = А а = b = 0, изучим форму поверхности _р2 Г-^- + н 9 ' о z = Ае L Е'х Еу и приняв (6.44) При любых х и у имеем z>0, так что поверхность расположена всегда над плоскостью хОу. В точке функция г = ф (х, у) достигает максимума, рав- ного А. Для дальнейшего исследования поверхности рассмотрим ее сечения плоскостью уОг (х = 0) и xOz (у = 0). Тогда получим соответственно z = Ле У с, # Е2 г = Ае х (при х = 0), (при у = 0). Эти сечения представляют собой нормальные кривые распределения (рис, 44). Сечение, параллельное плоско- сти хОу, получим, положив z = Н. Тогда _р2 (JL+JL\ Е2 £2 Я = Ае \ х у'. Логарифмируя последнее равенство и обозначив *) 9 Заметим, что А > //, так что А/Н > 1 и In (А/Н) > 0.
318 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ ГГЛ. VI -jp~ln-^-= К2, получим у 2 ..2 -^•+Л- = № или Ех Еу X2 , У2 («Ех? (КБу)2 (7.44) Уравнения (7.44) выражают семейство подобных эл- липсов, полуоси которых возрастают при убывании Н и пропорциональны вероятным отклонениям Ех, Еу. Эти эллипсы называют эллипсами рассеяния. При /<=0, т. е. z при Н^=А, эллипс выро- ждается в точку. Эллипс, получающийся при К = 1, у/ называют единичным, а ПРИ = — полным ЭЛ- /д/ ^v/\ липсом рассеяния. Их У/—'—/С Уравнения имеют вид -4^7 Z jd_=1 /о + 4 *2 + yi = 1 // 1б4 "н 1б4 г я Если, в частности, сре- Рис. 44. динные ошибки одина* ковы, Ех = Еу, то эллип- сы рассеяния обращаются в окружности. В этом случае рассеяние называют круговым. Важно подчеркнуть, что главные оси эллипсов рас- сеяния параллельны координатным осям, как это видно из уравнения (7.44). Пример 2.44. Двумерная случайная величина М нормально распределена на плоскости в соответствии с канонической формой закона Гаусса (5.44). Определим вероятность ее попадания в эллипс рассеяния ак, за- данный уравнением (7.44). Как известно, эта вероятность равна -.Р2 /_£_+JC\ Р(ЛК=аЛ = т^/р И ^'dxdy. (8.44) У “л
§ 44] НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ДВУМЕРНОЙ ВЕЛИЧИНЫ 319 Для вычисления интеграла (8.44) введем новые пере- менные или, иначе, иЕх vEy Х = —~ , У = ——• Р v Р Подставляя полученные значения х, у в уравнение (7.44), находим и2 v2 = №р2; это означает, что эллипс рассеяния ак перешел в круг Ск радиуса Кр. Далее, dx dy du dv t следова- тельно, интеграл (8.44) будет иметь вид Р (/VI <= ак) = -1 J J du dv. П ск Полученный интеграл преобразуем к полярным коорди- натам. Положив u=2cosft, u=2sinO, найдем u2 + t»2=r2 и du dv = г dr dft. Поэтому 2я кр кр Р(Ме=ак) = ^-j d&J e-'7dr = -2| yd(-г2). 0 0 о Вычисляя последний интеграл, получаем формулу для попадания в эллипс рассеяния: Р (М €= <хк) = 1 - (9.44) Формулу (9.44) можно, в частности, использовать для нахождения вероятности попадания в единич- ный эллипс и полный эллипс рассеяния. Как было сказано выше, он характеризуется значениями К, соот- ветственно К = 1 и К = 4. Следовательно, по формуле (9.44) получаем Р(Меа1)=1~^2 = 0,2034, Р (М е а4) = 1 - e~16P2 = 0,9737, так как р = 0,4769.
320 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI Пример 3.44. Рассмотрим двумерную случайную величину, распределенную по нормальному закону с круговым рассеянием (Ех = Еу = Е). Расстояние случайной точки плоскости от центра рассеяния, который можно предположить лежащим в начале коор- динат, есть одномерная случайная величина R = V Х2 + У2 > 0. Определим функцию распределения и плотность вероятности случай- ной величины R, а также ее математическое ожидание. Обозначив через 77(г) = Р(7?<г) функцию распределения слу- чайной величины R, вследствие формулы (9 44) находим P(R<r)= 1 -e-W Из уравнения (7.44) следует, что Е1( = г, т. е. К — r/Е. Таким об- разом, F(r) = P(R<r) = 1 —е Е\ (10.44) Для получения плотности вероятности достаточно продифферен- цировать формулу (10.44) по г. Мы получим г2 Ф (г) = 2г-~2-е Г Е\ (11.44) Тепеоь можно найти математическое ожидание случайной вели- чины 7?, которое равно 4- оо М (7?) = j* гф (г) dr. — со Подставив сюда выражение (11.44) для плотности и учитывая, что при г < 0 плотность вероятности равна нулю, получаем °° г2 Г О2 “Р2 M(R) = 2-^-гге Е dr. о Последний интеграл вычисляем по частям, полагая г = и, q2 -Г2 -Г2 -£L 2г е & dr = dv. Тогда du — dr; v = — e £2 и E* 2 P2 2 P2 M(7?)«-re Г £2 Г+ f E* dr. Io У
§ 44] НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ДВУМЕРНОЙ ВЕЛИЧИНЫ 321 Первое слагаемое обращается в Р t полагаем г , после чего Е /2 нуль. В оставшемся интеграле находим РК2 J __р е 2 dt. Но этот последний интеграл был уже вычислен вами в § 36. Ис- пользуя полученный там результат, а также формулу (4.44), нахо- дим окончательно М(/?) = а j/-j « 1,253а. Для построения графика функции распределения найдем значе- ние г, соответствующее максимальному значению плотности вероят- ности f)- Дифференцируя формулу (11.44), находим Уравнение q/(r)=O имеет корень г=£/(рХ2) (см. формулу (4.44)). Исследование достаточных условий показывает, что плот- ность вероятности имеет максимум при г «= о. График функции <р(г) показан на рис. 45. До сих пор мы ограничивались рассмотрением частного случая двумерного нормального распределения, в котором эллипс рассея- ния имеет осп, параллельные координатным осям. Вообще, двумерная слу- чайная величина называется распределенной по нормально- му закону, если плотность ве- роятности распределения за- дается формулой Ф (*» У) = у\ (12.44) где Q(x, у) есть положительно определенная квадратичная форма относительно переменных и = х — a, v = у — Ь, где а, b означают координаты центра рассеяния. Напомним, что квадратичной формой в алгебре называется од- нородный многочлен второй степени. Квадратичная форма назы- вается положительно определенной, если она при всех значениях ар- гумента принимает только положительные значения. Из высшей ал- гебры известно, что положительно определенная квадратичная форма может быть представлена в виде 0 (х (v-а)2 (х-а)(у-Ъ) (у-Ь)2 V У> 2А2 ЛВ + 2В2 ’ *) Значение случайной величины, соответствующее максимуму ее плотности вероятности, называется модой. 21 Р. С. Гутер, Б. В. Овчинский
322 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI где А, В — некоторые положительные числа, а число г удовлетворяет условию —1 г +1. Предположив, что | г | =/= 1 и вводя вместо А и В новые вели- чины di, Оз по формулам 4 = 04В = ог2/ 1-Л а затем вычислив нормирующий коэффициент R из условия, что интеграл от плотности вероятности равен единице, запишем плот- ность вероятности двумерного нормального распределения в виде 1 " 2 G-Г2) (х-а)2 о- (х-а)(х-Ь) , (у-Ь)2 2 + 2 °| а1а2 °2 (13.44) Приравнивая квадратную скобку в показателе степени положи- тельной постоянной, получим уравнение эллипса рассеяния (х-а)2 _ 2г (х -а) (у- Ь) + (у-b)2 = <4 af по-прежнему с центром в точке а, Ь, но здесь его оси уже не бу- дут параллельны координатным осям, если только Г =/= 0. Вычислив моменты второго порядка для случайной величины, плотность распределения которой задается формулой (13.44), най- дем, что D(X) = 4 D(K) = 4 Тем самым выясняется теоретико-вероятностный смысл коэффициен- тов, входящих в общее выражение плотности вероятности нормаль- ного распределения: и СУТЬ дисперсии случайных величин X и У, а г — коэффициент корреляции между ними. Попутно отметим, что если X и Y независимы, то г = 0, и оси эллипса рассеяния будут параллельны координатным осям. Исклю- чение из рассмотрения значения | г | = 1 соответствует исключению случая, когда Y есть линейная функция от X. § 45. Степень неопределенности дискретного распределения. Понятие об энтропии Рассмотрим дискретную случайную величину и бу- дем понимать под испытанием получение ее очередного значения. Попробуем прогнозировать результат испы- тания, т. е. предсказать значение, которое примет слу- чайная величина. Конечно, в силу случайности рас- сматриваемой величины исход испытания несет в себе
§ 45] ПОНЯТИЕ ОБ ЭНТРОПИИ 323 некоторую неопределенность, но, зная закон рас- пределения, мы можем пытаться в какой-то мере оце- нить надежность прогноза. Естественно пытаться использовать для этой цели уже известные числовые характеристики — математиче- ское ожидание и дисперсию. Однако оказывается, что для прогнозирования значения случайной величины эти характеристики бесполезны. В этом можно убедиться на следующем примере. Пусть заданы две случайные величины, обладающие следующими законами распределения: X 0 1 У 1 3 2 р 0,5 0,5 р 0,9 0,1 Найдем их математические ожидания и дисперсии. По формулам § 41 находим М (х) = 0 • 0,5 + 1 • 0,5 = 0,5, М (у) = 4-0,9 +2-0,1 = 0,5. о Таким образом, математические ожидания этих слу- чайных величин совпадают. То же относится и к диспер- сиям. Действительно, D (х) = М (х2) - [М (х)]2 = О2 • 0,5 + I2 • 0,5 - 0,25 = 0,25, D (у) = М (у2) - [М (у)]2 = (у)2 • 0,9 + 22 • 0,1 - 0,25 = 0,25. Однако интуитивно ясно, что закон распределения у несет в себе значительно меньшую неопреде- ленность и позволяет с довольно большой надеж- ностью предсказать, что результатом испытания будет значение y = -j • Следовательно, ни математическое ожи- дание, ни дисперсия в качестве меры неопреде- ленности распределения использованы быть не могут. 21*
324 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI Числовой характеристикой дискретного распределе- ния, которая может служить его мерой неопределенно- сти, является энтропия закона распределения. Это поня- тие было введено К. Шенноном в 1948—1950 годах, а название возникло вследствие существования глубоких аналогий между введенной характеристикой и исполь- зуемым ранее в статистической физике понятием энтро- пии, как функции состояния системы. Энтропия дискретного распределения определяется формулой H(pl, Pi....Рп) = п = -(P110gpl + p2 10g/72+ ... +p,j0gp„)= - 2 Pi 10g i-1 (1-45) n в предположении, что 2р/=1. Как видно из формулы (1.45), энтропия не зависит от значений, принимаемых случайной величиной, а только от их вероятностей. Рассматривая лишь возможные значения дискретной случайной величины, можно считать, что все pt =# 0, так что функция Н все- гда определена. В тех случаях, когда приходится по тем или иным специальным причинам включать в рассмот- рение значения pi = 0, принимается, что соответствую- щее произведение равно нулю, Pi \ogPi = 0. Основание логарифмов в формуле (1.45) может быть взято совершенно произвольно; нужно только позабо- титься, чтобы для сравнения энтропий различных рас- пределений они вычислялись при одном и том же осно- вании. В теории информации, для которой понятие энтропии является центральным, принято в качестве основания логарифмов брать число 2. Прежде чем пытаться объяснять, почему выбрана именно такая структура формулы (1.45), подсчитаем энтропию приведенных выше распределений. Для удоб- ства подсчета логарифмы будем считать натуральными. Для случайной величины х получаем // (0,5, 0,5) = —2 • 0,5 In 0,5 = 0,6931;
§ 45] ПОНЯТИЕ ОБ ЭНТРОПИИ 325 энтропия распределения у равна 77(0,9, 0,1) = — 0,91п0,9 — 0,11п0,1 = = 0,1054 • 0,9 + 2,3026 • 0,1 = 0,3251, т. е. энтропия распределения х более чем вдвое превос- ходит энтропию распределения у. Это соотношение впол- не согласуется с интуитивным представлением о неопре- деленности имеющихся распределений. Рассмотрим пример, который будет полезен нам в дальнейшем. Пример 1.45. Вероятность наступления события при одном испытании равна р. При каком р результат ис- пытания обладает наибольшей неопределенностью. Если случайная величина есть число наступлений события при данном испытании, то она описывается схемой X 0 1 Р 1-Р Р Согласно формуле (1.45) энтропия этой схемы равна Я = —(1 —p)log(l —р)—plogp. Для удобства вычислений примем, что логарифмы бе- рутся натуральными, т. е. примем Д = —(1—р)1п(1 — /?)—р 1пр и найдем максимум этой функции: dHjdp = In (1 — р)+ I — In р — I = In (1 — р) — !п р. Приравнивая dHfdp нулю, находим 1п(1—р) — In р, откуда р = 1 — р= 1/2. Так как ~7<0’ то ясно, что при р=^1ъ величина Н имеет максимум. Попробуем теперь разобраться в том, почему в ка- честве меры неопределенности распределения выбрана функция (1.45). Степень неопределенности зависит прежде всего от числа возможных исходов испытания, т. е. от числа п
826 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI различных возможных значений случайной величины. При выбранйом п естестЬённо считать, что наибольшая степень неопределенности соответствует такому распре- делению, при котором все исходы испытания равнове- роятны, т. е. вероятности всех возможных значений слу- чайной величины равны между собой, pt = 1/« (i = U 2, ..., п) (см. пример 1.45). Обозначим через L(n) неопределенность такого рас- пределения. Пусть теперь мы имеем две различные слу- чайные величины, из которых первая имеет k, а вто- рая т равновероятных значений. Это означает, что в первом случае возможны k различных равновероятных исходов, а во втором случае т равновероятных исходов. Если эти случайные величины независимы, то, рассмат- ривая всевозможные пары их значений, найдем, что для них существует km различных равновероятных исходов. Естественно считать, что неопределенность новой схе- . мы, образованной для пар, равна сумме неопределенно- стей отдельных схем. В терминах функции L это озна- чает требование L(km) = L(£) + L(m), (2.45) которое сразу же приводит нас к мысли использовать в качестве функции L(n) логарифмическую функцию. Поэтому можно принять L(n)=logn =—log 1/п. По- следняя замена предпринята для того, чтобы перейти к вероятностям различных исходов вместо числа ис- ходов. Итак, мы положили, что общая неопределенность опыта с п равновероятными исходами равна log п. Но тогда естественно считать, что один из исходов вносит ГТ log П 1 1 1 неопределенность, равную Нп = —= — — log — = = — plog р, поскольку 1/п = р и есть вероятность от- дельного исхода в нашем случае. Остается принять условие, что для случайной величины, значения которой не равновероятны, отдельное значение, которое прини- мается с вероятностью р, вносит неопределенность, чис- ленная величина которой равна —рlog р (знак минус нужно, очевидно, сохранить, чтобы получить положи- тельную величину, поскольку р<1 и logp ^O). Сумми-
§ 45] ПОНЯТИЕ ОБ ЭНТРОПИИ 327 руя полученное выражение по всем возможным значе- ниям случайной величины, мы и приходим к формуле (1.45). Приведенные выше рассуждения, разумеется, могут лишь объяснить, почему в качестве меры неопределен- ности распределения выбрано выражение (1.45), но ни- чего не доказывают. На самом деле оказывается, что при некоторых естественных предположениях функция (1.45) является единственной. Это вытекает из следующей теоремы. Теорема единственности. Пусть функция р2, рп) определена при любом п на системе п {р/<}, для которой рк^О «2 р^ = 1, непрерывна по со* вокупности своих аргументов и удовлетворяет условиям! 1. При данном п функция Н(р\, р2, ..., рп) достигает наибольшего значения при pk = \/п (fe = 1,2, ..., п). 2. Если А и В — две независимые дискретные слу* чайные величины, характеризуемые наборами вероятно- стей {pk} и (р'}, то Н(АВ) = И (А) + Н(В). (3.45) 3. Присоединение к значениям случайной величины одного (или любого конечного числа) невозможных зна- чений не изменяет значения функции Н, т. е. Н (Pi, Р2, •.., Рп, 0) - Н (рь р2,..., рп) • (4.45) Тогда п Н (Р1, р2, рп)=-К%рк log pk, (5.45) где X — постоянное положительное число. Очевидно, что значения X можно изменять произвольно за счет осно- вания системы логарифмов или, наоборот, можно выби- рать систему логарифмов с любым основанием, изме- няя значение X. Доказательство этой теоремы, принадлежащее А. Я. Хинчину, мы приводить не будем. Приведем еще один пример вычисления энтропии дискретного распре- деления.
328 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ (ГЛ VI Пример 2.45. Производится стрельба по двум ми- шеням. По нерво-й мишени сделаны два выстрела с ве< « 1 роятностью попадания при одном выстреле, равной -у. По второй мишени сделано три выстрела с вероятностью попадания у. Определим, какой исход стрельбы яв- ляется более определенным. Составим законы распределения числа попаданий при стрельбе по первой и второй мишеням, пользуясь биномиальным законом распределения Р — ____________ птпП-ГП гт,п т\(п-т)\ Р Ч Для первой мишени при р = ^ = у находим р 2! Р 1 г °’ 2 0! 2! \ 2 ) \ 2 ) 4 ’ • 2! Г1V Г1У = 1 ь2“ 1! 1! \ 2/ \ 2 / “ 2 ’ ► - 2! ( 1 ? f 1 V _ 1 2’ 2 ’ 2! О! \ 2 / \ 2 / 4 ‘ 1 2 Для второй мишени имеем p = v> Q — Поэтому 0*0 Таким образом, мы получаем законы распределения X 0 1 2 р 4 2 4 X 0 1 2 3 8 4 2 1 п -- - р 27 9 9 27 Энтропия первого распределения (мы снова рассмат- риваем натуральные логарифмы) будет равна - (т1п т+11п1+т1п4)=41п2^
§ 45) ПОНЯТИЕ ОБ ЭНТРОПИИ 329 Та же величина для второго распределения и ( 1 I 1.2.2, 4. 8. 8 \ \ 27 П 27 ' 9 П 9 ”** 9 27 П 27 / = ~1пЗ~21п2 ~ 1,18. <5 Так как Н2 > Н\, то следует считать, что исход стрель- бы по первой мишени обладает большей определен- ностью, чем стрельба по второй. Наряду с энтропией дискретного распределения ь некоторых случаях рассматривают также и энтропию непрерывной случайной величины. По аналогии с фор- мулой (1.45) энтропией непрерывной случайной вели- чины X называют величину Н(Х), определенную фор- мулой 4- оо Н (X) — — | ф(х) log ф (x)dx> (6.45) где ф(х)—плотность вероятности величины X, а лога- рифм, как и раньше, берется по произвольному основа- нию. Рассмотрим два примера. Пример 3.45. Непрерывная случайная величина равномерно распределена в интервале (а, &). Определим энтропию этой случайной величины. Как известно из § 40, плотность вероятности равно- мерно распределенной случайной величины имеет вид Ф(х) = 0 при х < а, 1 к т---- при а х Ь, b — а г 0 при х > 6. Поэтому, в соответствии с формулой (6.45), энтропия равномерного распределения будет равна ъ Н(Х)= — f-т-J—In-г-!—dx = х I = ln(6 — a). x/ j b — a b — a b ~a |a v ' a Можно доказать, что, по аналогии со дискретного распределения, среди всех случаем законов
330 СЛУЧАЙНЫЕ ВЕЛИЧИНЫ [ГЛ. VI распределения непрерывных случайных величин, прини- мающих значения из интервала (а,Ь), максимальную энтропию имеет равномерное распределение. Как мы уже видели, эта максимальная энтропия равна Hmtx = In (b - а). (7.45) Для случайных величин, которые могут принимать всевозможные действительные значения, такого заклю- чения сделать нельзя. Пример 4.45. Дана случайная величина X, распре- деленная по нормальному закону с математическим ожи- данием х = 0 и дисперсией о2. Вычислим энтропию этого распределения и сравним ее с энтропией равномерного распределения, обладающего той же дисперсией. Плотность вероятности нормального распределения с математическим ожиданием х = 0 равна: <PU) = — а У 2л Отсюда энтропия нормального равна 2й2 распределения будет // = — | ..........!___е J а У 2^ In 1 X2 1 * ---7= Г dx. о У 2л 2о2 J Разбивая последний интеграл на два слагаемых, имеем JT _ Jn •Г7 норм X2 л X2 е 2°2 dx 4----------7=- х2е 2(72 dx. 2о2 У2ло2 J Как уже известно, У 2ла2 ___х^_ е 2°2 dx = х2 - ... е У 2ла2 202 dx = о2. Поэтому //норм = In уг2ло2 + 1/2 или, иначе, •^норм In (o' "|/ 2лв).. (8.45)
ПОНЯТИЕ ОБ ЭНТРОПИИ 331 § 45] Сравним теперь энтропии (7.45) и (8.45), для чего выразим энтропию (7.45) через дисперсию. В § 41 было вычислено, что для равномерного распределения сграви = = (6 — а)/УТ2, откуда b — а = У12 о. Подставляя это значение в формулу (7.45), находим для энтропии рав- номерного распределения с дисперсией о2 /7равн = In (а /12). Так как 2ле ~ 17> 12, то имеет место неравенство Ннорм > 77равгь т. е. нормальный закон распределения является более неопределенным, чем равномерный закон с той же дис- персией.
ЧАСТЬ ТРЕТЬЯ МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА ВВОДНЫЕ ЗАМЕЧАНИЯ Изучая в первой части теорию интерполяции, мы по- знакомились с формулами, дающими возможность по- строить различные интерполяционные многочлены, ко- торые в точности воспроизводят значения данной функ- ции в узлах интерполяции. Однако точное воспроизведение значений функции в узлах интерполяции далеко не всегда является совер- шенно необходимым, и усилия, потраченные на преодо- ление возникающих трудностей, не всегда оправды- ваются в полной мере. Представим себе, что заданные в отдельных точках значения функции являются экспериментальны- ми данными, т. е. получены как результаты на- блюдения или измерения. Эти процессы всегда подвержены некоторым ошибкам. Поэтому ясно, что в данном случае нет никакой нужды стремиться к тому, чтобы интерполяционный многочлен воспроизводил в точ- ности заданное значение функции, поскольку оно само получено с некоторой ошибкой. Возможен и другой случай, когда нет необходимости, чтобы интерполяционный многочлен точно воспроизво- дил значения функции в узлах интерполяции. Пусть имеются точные значения функции в некоторых точках, но число таких точек п весьма велико. Мы можем здесь воспользоваться любым из интерполяционных мно- гочленов, рассмотренных в главе II. Однако для п точек будет получаться многочлен степени п—1, т. е. при большом числе точек этот интерполяционный многочлен будет очень высокой степени1)» что может серьезно за- труднить дальнейшие вычислительные операции. *) Если только разности не будут становиться постоянными.
ВВОДНЫЕ ЗАМЕЧАНИЯ 333 Перед нами встает задача найти многочлен некото- рой вполне определенной степени, но более низкой, чем п— 1, который хотя и не дает точных значений функции в узлах интерполяции, но достаточно близко к ним под* ходит. Необходимо сразу же отметить, что выражение «до- статочно близко подходит» является не совсем опреде- ленным. Выясним прежде всего смысл этого выражения. Что означает, что данный многочлен мало отличается от данной функции в узлах интерполяции? Ответ на этот вопрос можно давать по-разному, придавая словам «мало отличается» различный смысл. В зависимости от этого мы будем получать различные задачи, решениями кото- рых будут являться различные многочлены. Часто требуется, чтобы максимум абсолютной вели- чины разности между значениями данной функции f(x) и значениями многочлена Р(х) не превосходил некото- рой определенной величины, которую можно считать мерой приближения. В этом случае говорят о равномерном приближении. Именно, многочлен Р(х) равномерно приближает функ- цию f(x) в узлах интерполяции х0, , хп с точностью до е, если max |/(Х(.) - р(Хг) е. О < i < п Геометрически это означает, что ординаты графика многочлена у — Р(х) отличаются в узлах интерполяции от ординат графика функции у = f(x) не больше чем на наперед заданную величину е>0 (рис. 46). В ряде случаев оказывается возможным допустить, чтобы отдельные отклонения —P(xt)\ были ве- лики, и требуется лишь, чтобы отклонения Р(х) от f(x) были малы лишь «в среднем». Из дальнейшего будет видно, что наиболее удобная форма требования «близости в среднем» состоит в том, чтобы сумма квадратов отклонений многочлена Р(х) от функции f(x) в узлах интерполяции не превосходила заданной величины. Мерой отклонения многочлена Р(х) от функции f(x) является здесь величина О= S №)-Р(*Л2. (1)
334 ВВОДНЫЕ ЗАМЕЧАНИЯ Отсюда ясно, как следует ставить задачу об отыска- нии многочлена Р(х), дающего наилучшее приближение в среднем. Для этого требуется найти такой многочлен данной степени т (т. е. подобрать коэффициенты этого многочлена так), чтобы величина о из (1) была наи- меньшей. Для лучшего уяснения рассмотренной задачи раз- берем пример. Пример 1. Найти многочлены РДх) и соот- ветственно первой и второй степени, приближающие наи- лучшим образом в среднем функцию, заданную таб* лицей X 0 1 2 3 4 5 6 7 У 1,4 1,3 1,4 1,1 1,3 1,8 1,6 2,3 Положим Р\(х) = до + а^х. Тогда выражение (1)для а примет вид 7 [yi - (оо + ад,)]2. Теперь задача сводится к отысканию значений а0, при которых величина о будет наименьшей, т. е. к отьн
ВВОДНЫЕ ЗАМЕЧАНИЯ 335 сканию минимума а как функции от aQ и a{. Как извест- но, для этого следует приравнять нулю частные произ- водные daldav и д^да^. Находя частные производные по а0 и получаем 7 - у 2 [У1 - («о + ад)] = О, ° i=0 7 - т = S [f/i - («° + «Л')] xi = °- i=0 Переписав уравнения более подробно, приходим к си- стеме 7 7 8а0 + «1 S Xi = 2 Уь 1=0 г=0 7 7 7 «о 2 Xi + а{ s х2 = 2 Xitji. 1=0 1-0 f=0 Производя вычисления, помещенные в левой части таблицы 1, найдем, что система приобретает вид 8ао “Ь 28tZi = 12,2, 28#о -Ь 140#! = 47,3, откуда а0 = 12,2 281 47,3 140 383,6 < -----------^зГ=1’142’ 8 281 28 140) 12,2 I iZzlL = = о но 336 ’ I 8 _ I28 01 336 Итак1), многочлен первой степени, приближающий нашу функцию наилучшим образом в смысле отклоне- ния в среднем, имеет вид Pi(x)= 1,142 + 0,110х. Пусть теперь Лг (*) = «о + aix + Й2*2. Тогда 7 О = 2 \yt - («о + + а2х*)]2. 9 Мы не проверяем выполнения достаточных условий экстре* мума. Легко убедиться, что при найденных значениях Яо и вели- чина а достигает минимума.
336 ВВОДНЫЕ ЗАМЕЧАНИЯ Таблица 1 »l xi«i X1. .3 xi 4 0 1,4 0 0 0 0 0 1 1,3 1,3 1 1,3 1 1 2 1,4 2,8 4 5,6 8 16 3 1,1 3,3 9 9,9 27 81 4 1,3 5,2 16 20,8 64 256 5 1,8 9,0 25 45,0 125 625 6 1,6 9,6 36 57,6 216 1295 7 2,3 16,1 49 112,7 343 2401 28 12,2 47,3 140 252,9 784 4676 Здесь о является уже функцией трех переменных: а$у ах и аг- Частные производные по этим переменным равны 7 ~~ Т 7^7 = X К’ ~ (^0 *" a\Xi + а2Х1)] = 0’ i-0 7 “ Т 7^ = X К - К + <ЧХ1 + Й2Х/)] Xi = °’ / = 0 7 “ ~2 ~да^ = ~ (ао + а1х» + а 2х/)] х/ = 0* /=о Раскрыв суммы и перегруппировав члены, приходим к системе уравнении 7 7 7 8а0 + Я] 2 х,- + а2 2 х| = 2 1=0 i—0 1—0 7 7 7 7 а, 2 х{ + я, 2 х? + «2 2 х] = 2 Х.у., 1=о 1 = 0 i=0 Z=0 1 7 7 7 7 е0 2 X/ + Я/ 2 X- + я2 2 х] = 2 Л';'УГ и,=о 1=0 i = 0 1 i = 0
ВВОДНЫЕ ЗАМЕЧАНИЯ 337 Взяв значения сумм из табл. 1, найдем, что система уравнений будет 8$0 4“ 28$j + 140$2= 12,2, 28$0 + 140$! 4-784$2 = 47,3, 14О$о + 784$! + 4676$2 = 252,9. Решив систему, получим $о = 1,442, $! = —0,190, $2 = 0,043, откуда следует, что многочлен Р2(*) будет иметь вид Р2(х) = 1,442—0,190% + 0,043%2. На рис. 47 показано, как расположены заданные точ- ки и построены графики найденных приближающих мно- гочленов первой и второй степени у — Pi (%) и у = Р2(%)« До сих пор речь шла о приближении функции много- членом в узлах интерполяции. Аналогично этому можно ставить вопрос о приближении данной функции много- членом на некотором отрезке [$, Ь]. При этом для равномерного приближения достаточно вместо рассматриваемой выше величины max 1 < i < п — Р (х,) | рассматривать max (x)-P(x)l'). а < х < b !) Для того чтобы этот максимум существовал, достаточно пред- положить, что функция f(x) непрерывна на [а, Ь]. 22 Р- С. Гутер, Б. В. Овчинский
338 ВВОДНЫЕ ЗАМЕЧАНИЯ Решить задачу о наилучшем равномерном приближении на отрезке [а, Ь] означает найти многочлен Р(х) данной степени, для которого величина указанного максимума будет наименьшей. Если требуется приближение в среднем, то величину о вместо суммы (1) следует определить теперь инте- тралом ь (Г=/[f(x)-P(x)]2dx. (2) а Для нахождения наилучшего приближения в сред- нем требуется так подобрать коэффициенты многочлена Р(х), чтобы величина о, определенная формулой (2), была наименьшей. Рассмотрим пример решения задачи такого рода. Пример 2. Найти многочлен первой степени Pi (х) = а0 + а}х, дающих наилучшее приближение в среднем функции f(x) = V1 + х2 на отрезке [0, 1]. Для этого требуется подобрать коэффициенты «о и ai так, чтобы интеграл 1 / = | + х2 — aQ — а{х]2 dx о имел наименьшее возможное значение. Дифференцируя по параметру под знаком интегра- ла, найдем 1 = — 2 J [/1 + х2 - aQ - aix] dx9 о 1 = — 2 J + х2 — «о ~ * dx. 1 о Это дифференцирование производится на основании следую- щего правила, которое мы приводим без доказательства. Пусть f(x, а) —функция независимого переменного х и параметра а, непре- рывная вместе со своей частной производной при а х b и at а <х2- Тогда для всех значений а из указанного интервала
ВВОДНЫЕ ЗАМЕЧАНИЯ 839 имеет место формула ь ь д Г _ , . , Г df (х, а) , ~ч~ f (х, а) dx = —--------dx, да J 1 J да а а т. е. производная по параметру от интеграла с постоянными пре- делами равна интегралу от производной подынтегральной функции по этому параметру. Если приравнять теперь эти частные производные нулю, то 1 1 J (а0 + Я1*) dx = J У1 + х2 dx, о о 1 1 J (а$х + ахх2) dx= J х У1 + x2dx, о о что дает систему уравнении «о + 4а1 = Т^+1п^ + •Lflo + -l.fll = |(2/2-1). Решая совместно полученную систему, найдем а0 = 2 In (1 + /2) - 2 /2 + 2 « 0,9343, щ = 5 ]/2 - 3 1п(1 + /2)-4 « 0,4269. Таким образом, для наилучшего приближения в сред- нем мы получаем формулу У1 4-х2 ~ 0,9343 4- 0,4269х. Эта формула носит название формулы Понселе. Заметим, что приближение, полученное с помощью формулы Хейлора, будет совсем иным. Именно, если принять а = 0,5, т, е. рассматривать разложение функ- ции в окрестности центра интересующего нас отрезка, то формула Тейлора дает приближенную формулу УТ+~х2 « 0,8944 + 0,4472*. 22*
340 ВВОДНЫЕ ЗАМЕЧАНИЯ Полученные выражения показывают, что многочлены, дающие наилучшие приближения в различных смыслах, являются различными. На рис. 48 приведен график функ- ции f(x) = рЧ + х2 на отрезке [0, 1], ее наилучшее при- ближение в среднем и приближение по формуле Тей- лора. В качестве следующего примера предлагаем чита- телю самостоятельно отыскать линейную функцию, даю- щую наилучшее приближение в среднем для функции f(x) = ~- на отрезке [1, 2]. Эта функция имеет вид у = = 1,4068—0,4758х. Разобранные примеры достаточно хорошо выясняют, какой смысл можно придавать словам о близости между функцией и интерполяционным многочленом, и мы мо- жем вернуться к вопросу о воспроизведении точных зна- чений. Даже в тех случаях, когда зависимость между двумя переменными величинами выражается многочленом не ‘ очень высокой степени, значительно меньшей, чем число наблюденных значений функции, наличие ошибок на- блюдений может весьма осложнить и исказить картину.
ВВОДНЫЕ ЗАМЕЧАНИЯ 341 Чтобы подробнее разъяснить, что мы имеем в виду, рассмотрим следующий пример. Пример 3. Известный из физики закон охлажде- ния состоит в том, что скорость охлаждения тела про- порциональна избытку температуры тела над темпера- турой среды, т. е. выражается формулой v = а$, где v — скорость охлаждения, Ф — избыток температуры и а — коэффициент пропорциональности (закон Нью* тона). Приведенная ниже табл. 2 содержит опытные дан- ные, выражающие зависимость между v и О для некото- рого определенного тела, по которым можно определить значения коэффициента пропорциональности а. Таблица 2 Г 220 200 180 160 140 120 100 V 8,81 7,40 6,10 4,89 3,88 3,02 2,30
342 ВВОДНЫЕ ЗАМЕЧАНИЯ По существу, при отсутствии ошибок измерения, для определения значения а достаточно иметь лишь одно на- блюдение. Однако на самом деле это не так, и, как по- казывает приведенная таблица, каждое из наблюдений дает иное значение а. Например, первое из наблюдений дает Ф = 220, v = 8,81, откуда следует а = 0,040. Анало- гично следующие наблюдения дают а = 0,037; 0,034; 0,031; 0,028; 0,025; 0,023. Смотря по тому, каким из наблюдений мы восполь- зуемся, зависимость между скоростью охлаждения v и избытком температуры О' будет иметь тот или иной ко- эффициент пропорциональности и будет изображаться соответствующей прямой. Все наблюденные значения и соответствующие прямые изображены на рис. 49. Конечно, мы имеем возможность по имеющимся семи наблюдениям построить интерполяционный многочлен шестой степени, который будет в точности совпадать с наблюденными значениями. Но, как ясно из всего пре- дыдущего, это совершенно не нужно, ибо все эти значе- ния содержат ошибки. Требуется по имеющимся наблю- денным данным построить линейную функцию, ко- торая для различных (в том числе и имеющихся в таб- лице) значений Ф давала бы наиболее близкие значе- ния v. О такой функции говорят, что она сглаживает или выравнивает опытные данные. Как мы увидим в дальнейшем, при некоторых пред- положениях эта задача весьма близка рассмотренной выше задаче о наилучшем приближении в среднем.
ГЛАВА VII ТЕОРИЯ ОШИБОК § 46, Случайные ошибки ’) Ошибки измерений делятся на две категории. К си- стематическим ошибкам относятся ошибки, искажаю- щие результат в определенную сторону и имеющие закономерный характер. Сюда относятся инструмен- тальные ошибки, происходящие от несовершенства инструмента, ошибки, вызванные методикой постановки эксперимента, и некоторые другие. Так, например, из- мерение температуры термометром со смещенной нуле- вой точкой будет давать систематически неправильные результаты. Поскольку влияние таких ошибок на результаты на- блюдений может быть более или менее точно заранее установлено, а значит и устранено, мы будем считать имеющиеся в нашем распоряжении результаты опыта свободными от систематических ошибок. Необходимо, впрочем, заметить, что фактическое исклю- чение систематических ошибок часто является не такой уж простой задачей. Тем не менее мы будем считать, что такое исключение уже сделано. Оставшиеся ошибки составляют категорию случай- ных ошибок, рассмотрением которых мы и будем зани- маться в дальнейшем. !) Напомним, что погрешностью или ошибкой называется раз- ность между точным и приближенным значением измеряемой вели- чины. Обычно, когда речь идет об арифметических дей- ствиях с приближенными значениями, употребляют термин по- грешность (см введение к I части), а когда об измере- ниях, то говорят об ошибках.
344 ТЕОРИЯ ОШИБОК [ГЛ. VII Предполагается, что случайные ошибки подчинены следующим условиям: 1) Равные по абсолютной величине ошибки равно- вероятны. 2) Малые по абсолютной величине ошибки более ве- роятны, нежели большие. 3) Вероятность появления ошибок, превосходящих по абсолютной величине некоторое определенное число, практически равна нулю. Это число обычно называют пределом возможных ошибок и обозначают через Е. Пусть F(e)—функция распределения ошибок, т. е. вероятность того, что ошибка а не превосходит вели- чины е, F(e) = P(a<8). (1.46) Естественно считать, что ошибки представляют не- прерывную случайную величину. Тогда вероятность того, что ошибка примет значение, заключенное между 8 и е + Де, с точностью до бесконечно малых более высо- кого порядка, чем Де, выразится формулой (см. § 39 гл. VI) Р(е а 8 + Де) = ср(е) Де, (2.46) где ф(е) = F'(е) — плотность распределения ошибок. Исходя из сделанных предположений, мы можем установить соответствующие свойства функции ср(е). 1°. Функция ф(е)—четная, т. е. ср(е) = <р(—е). Чет- ность следует из того, что равные отклонения в обе сто- роны одинаково вероятны и поэтому плотности распре- деления вероятности в точках 8 и —8 равны между собой. 2°. Функция <р(е) при возрастании |е| убывает, так как малые по абсолютной величине ошибки более ве- роятны, чем большие. Иначе, при 8>0 имеем ф'(8}<0, а при 8<0 производная ф'(е)>0. 3°. Функция ф(е)~ 0 при г^Е. Итак, графиком функции ф(е) будет непрерывная линия, симметричная относительно оси Оу, имеющая максимум при 8 = 0 и монотонно убывающая по обе стороны от нуля. При |е[ > Е график почти сливается с осью абсцисс.
СЛУЧАЙНЫЕ ОШИБКИ 345 § 46] Вероятность того, что ошибка а заключена в неко- торых заранее указанных пределах как уста- новлено в § 39, выражается интегралом ь Р(а<а<6)= J <p(e)de. (3.46) а Согласно основному свойству функции <р(е), оо | <р (е) de — 1. — оо В силу того, что ф(е)«0 вне участка (—Е,Е), послед- нее равенство можно переписать в виде Е Р ср (е) = 1. (4.46) -к Для дальнейшего будет важно следующее простое замечание. Пусть истинное значение измеряемой ве- личины (разумеется, нам неизвестное) равно А, Изме- ренное значение х этой же величины есть величина случайная, закон распределения которой тесно связан с законом распределения ошибок. Действительно, так как А — х = е, то вероятность получения в результате измерения ошибки е и значения х одна и та же. Если обозначить плотность вероятности величины х через ф1(*), то Ф1(х) = ф(е) = ф(Л — х). В силу четности функции ф(е) окончательно получим <Р1(*) = ф(Х —/1). Это показывает, что графики функций ф|(х) иф(х) сдви- нуты друг относительно друга на величину А. Функция ф(х) имеет единственный максимум при х = 0, а функ- ция ф1(х) — при х = А. Заметим, что вообще то значение случайной величины, при котором плотность ее распре- деления достигает максимума, называется модой слу- чайной величины.
346 ТЕОРИЯ ОШИБОК [ГЛ. VII § 47. Формула Гуасса для распределения вероятностей случайных ошибок Вообще говоря, случайные ошибки измерений могут иметь различные законы распределения. Однако прак- тически в подавляющем большинстве случаев прини- мается, что случайная ошибка распределена по нор- мальному закону, который был детально рассмотрен нами в § 40 предыдущей главы. Это обстоятельство может быть строго доказано, если, кроме сделанных предположений о характере слу- чайных ошибок измерений, принять еще один по- стулат. Допустим, что одним и тем же инструментом с оди- наковой тщательностью произведено несколько измере- ний одной и той же физической величины (например, длины стержня при определенной температуре). Резуль- татом этих измерений является некоторый ряд чисел, располагая которым мы хотим определить наиболее ве- роятное значение измеряемой величины, т. е. то ее зна- чение, при котором плотность распределения достигает своего максимума. Упомянутый постулат называется постулатом Гаусса и состоит в том, что наиболее вероятным значением искомой величины является среднее арифметическое на- блюденных значений. Содержанием настоящего параграфа является дока- зательство следующего утверждения. Теорема. Если случайные ошибки удовлетворяют постулату Гаусса *), то законом распределения случай- ных ошибок является нормальный закон. Доказательство. Пусть результатом измерения является ряд чисел Xi, х2, .. ., хп. (1.47) Примем, что неизвестная величина измеряемого предмета равна А. Тогда результаты измерения (1.47) дают ряд ошибок А—Xi — £1, А — х2 == е2, •••, А — хп = £п. (2 47) Обозначим через Ф(е) неизвестную пока плотность рас* пределения ошибок. Тогда вероятность того, чтб ошибка 8 9 И условиям 1—3 § 46, которые, как было указано, всегда предполагаются выполненными.
ФОРМУЛА ГАУССА 347 § 47] будет заключена в интервале [et, 8г 4- d е], приближенно равна (p(8i)Je ’). Результаты измерений, а следовательно и ошибки измерений, следует считать независимыми. Поэтому, в силу теоремы умноже- ния вероятностей (см. § 31 гл. V), вероятность получения ряда из- мерений (1.47), т. е. вероятность получения ошибок, которые одно- временно попадают в интервалы [et, Si + б/е] для i — 1, 2, ..., п, равна произведению <р(81)ф(е2) ... ф(8п) (de)n, (347) или, иначе, ф(Л — Х1)ф(Л — х2).. ,ф(Л — хп) (de) п. До выполнения измерений относительно измеряемой величины можно делать любые предположения. Поэтому для определения вероятности гипотезы того, что после измерений эту величину следует принять равной А, можно воспользоваться следствием из формулы Бейеса* 2) (см. § 32); согласно этому следствию, вероят- ность гипотезы после опыта пропорциональна вероятности наблюден- ного события в предположении соответствующей гипотезы, т. е. Ф (Л — Xj) ф (Л — х2) ... ф (Л — хп) (4.47) (множитель (de)п отнесен к коэффициенту пропорциональности). Наиболее вероятным значением Л будет такое, при котором величина (4.47) станет наибольшей (ясно, что коэффициент пропорционально- сти не влияет на это значение Л). Из свойств функции ф(х) следует, что она имеет один максимум при х = 0; поэтому можно ожидать, что произведение (4.47) будет достигать максимума, когда все раз- ности Л—Xi, Л—х2, ...» Л — хп будут по возможности малы. Со- гласно постулату Гаусса, это будет как раз тогда, когда Л = х, где х — среднее арифметическое значений Xi, х2, ..., хл: . = Xt + X2 ......+ хп^ (5.47) п Поэтому если выражение (4.47) продифференцировать по Л, то про- изводная обратится в нуль при Л = х. Выражение (4.47) представляет произведение, поэтому здесь удобнее рассматривать логарифмиче- скую производную вместо обычной. Так как выражение (4.47) в нуль не обращается, то корни обычной и логарифмической производных совпадают. Находя логарифмическую производную и полагая Л = х !) Так как ошибка е — непрерывная случайная величина, то ве- роятность того, что она принимает данное значение ег, равна нулю (см. § 39). Поэтому и берется интервал [ег-, 8/ + de], где de настоль- ко мало, что имеет место приближенная формула, приведенная в тексте. 2) Теорема Бейеса рассматривалась нами в § 32 лишь для дис- кретного случая. Однако она легко может быть перенесена и на не- прерывные случайные величины.
348 ТЕОРИЯ ОШИБОК [ГЛ. VII получим Ф' (х-х,) + Ф' U - х2) + ф' (х - хп) а= 0 ф(Х“Х0 ф(х~Х2) *” ф(х~Хп) Введем вспомогательную функцию ф(х) = ЦпФ(х)Г = -^-; (7.47) тогда равенство (6.47) запишется в виде ф(х — Х1) + ф(х— х2)+...+ф(х — хп) ~ 0. (8.47) Равенство (8.47), при условии, что х определяется формулой (5.47), должно быть справедливо при любых значениях xi, х2, ...» хп. Рас- сматривая их как независимые переменные, будем из этого равен- ства определять неизвестную функцию ф(х). Дифференцируя равен- ство (8.47) по переменным хь х2, ...» хп и учитывая, что п х* — Хр получим: z = l t4*-*l)(-”l) + M>'(x-X2)y+ ••• t'(*-*i)" + V(x-xt)^~ lj+ ... + q'(x-xn)±- = 0, t' (Х-Х1)4- + 1|>'(*-*2)^-+ ••• + Ф'(•»-««) (-7- l) = 0. fl n \ fl / или ф'(х~х1)«=-^-[ф'(х-х1) + ф'(х-х2) + ... + ф'(х-хл)], Ф' (х - Х2) = [ф' (х - Xj) + Ф' (х - Х2) + ... + ф' (х — Xft)], ф'(х-хл)«-[ф'(х-х1) + ф'(х-х2)+ ... + ф' (х - Хп)]. п Из последней системы следует, что ф'(х —Xi) = ф'(х — х2) = ... = ф'(х— хп). (9.47) Так как наблюденные значения могут быть какими угодно и не все совпадают между собой, то (9.47) означает, что функция ф'(х) сохраняет постоянное значение, т. е. ф'(х) = G. Итак, получено дифференциальное уравнение для функции ф(х).
§ 47] ФОРМУЛА ГАУССА 849 Интегрируя его, получим ф(х) « С1Х + с2. Возвращаясь к функции ф(х), находим ф' (*) , = С1х + С2> ф(х) так что второе интегрирование дает In ф (х) = у ^х2 4- с2х 4- c3f или, иначе, (10.47) 4- ф(х) = е Нам остается определить в выражении (10.47) произвольные постоянные п, с2 и Сз, исходя из рассмотренных в § 46 условий. Из четности функции ср следует с2 = 0, так что л 4" Ф (х) = е 2 = Ge2 , где G = еСэ. Так как функция ф(х) убывает при возрастании |х|, то Ci < 0. Обозначив — —h2, запишем ф(х) в виде Ф (х) = Ge~ftV. (11.47) Величину G можно определить, исходя из основного свойства плотности распределения оо оо J e-ft!jc2 dx = 1. Введем новую переменную t «= hx. Тогда Л/2 Однако, как известно, оо t2 [ е 2 Л = У2л, так что G=-^
350 ТЕОРИЯ ОШИБОК [ГЛ. VII Итак, окончательное выражение для плотности рас- пределения ошибок имеет вид ф(х) = -^=-е-лЧ (12.47) У л Величина й, входящая в выражение (12.47), назы- вается мерой точности. Сравнивая (12.47) с плотностью вероятности нор- мального распределения, которое было приведено в предыдущей главе (см. § 40 гл. VI), ф(х) = -1=е’ , (13.47) а У 2л замечаем, что выражение (12.47) для плотности распре- деления ошибок является частным случаем нормального распределения (13.47) с математическим ожиданием а = 0. Этим полностью доказана наша теорема. Мера точности связана с дисперсией нормального распреде- ления соотношением '‘-„Д (ЧЛ7) которым придется неоднократно пользоваться в даль- нейшем. Таким образом, если принять постулат Гаусса, то случайные ошибки будут распределены по нормальному закону. Можно показать, что справедливо также и об- ратное заключение — если случайные ошибки распреде- лены по нормальному закону, то наиболее вероятным значением измеряемой величины является среднее ариф- метическое наблюденных значений. Доказательство это- го утверждения будет рассмотрено в § 49. Необходимо подчеркнуть, что из доказанной выше теоремы никак не следует, что случайные ошибки все- гда распределены по закону Гаусса. Мы доказали только, что закон Гаусса вытекает из постулата о сред- нем арифметическом. В некоторых типах наблюдений (особенно при ма- лом числе измерений) постулат среднего арифметиче- ского действительно не выполняется и в этом случае
СРЕДНЯЯ И СРЕДНЯЯ КВАДРАТИЧНАЯ ОШИБКИ 351 § 48] приходится рассматривать другие законы распределе- ния ошибок. Тем не менее в подавляющем большинстве случаев принимается, что случайные ошибки распределены имен- но по нормальному закону, что предполагается и нами в дальнейшем изложении1). § 48. Функция ошибок. Вероятная ошибка. Средняя и средняя квадратичная ошибки Как было установлено в § 39 гл. VI, вероятность того; что ошибка заключена между числами а и 6, вы- ft ражается интегралом J <р (е) de. Будем для краткости а эту вероятность обозначать Ра>ь' ь Ра.ь = $ (в) de. а Предполагая, что случайные ошибки распределены по закону Гаусса, и положив а = —а, b = а, найдем ве- роятность того, что ошибка не превзойдет по абсолют- ной величине числа а, т. е. будет заключена между —а и а; вместо Р_а, а будем писать просто Имеем а Pa = -L fe-^dx, 1'Л * —а или, в силу четности функции, стоящей под интегралом, а у31 $ 9 Здесь уместно привести одно шутливое высказывание, касаю- щееся нормального закона: «Каждый верит в экспоненциальный за- кон ошибок: экспериментатор — потому, что думает, что этот за- кон может быть доказан математиком, а математик — потому, что верит, что этот закон установлен наблюдателями».
352 ТЕОРИЯ ОШИБОК (ГЛ. VII Положив в Ра в виде интеграле hx — t, представим вероятность Лх = Функцию йа J e~^dt. о ф,«=й (1.48) (2.48) 2 У л e-^dt, назовем интегралом ошибок или функцией ошибок'). Из (1.48) и (2.48) следует, что Ра = Ф’(йа). (3.48) Легко заметить, что функция ошибок Ф*(х) приво- дится к рассмотренной нами в § 36 гл. V функции Лап- ласа Ф(х), определенной равенством Ф(х) = __1_ /2л f -- J е 2 dt. о (4.48) Действительно, положив в (2.48) t XY2 т> Ф‘(х) = -^| е~ ' ' /я «> У2 ' о г т ТТ’ получим 2ф(х У 2). Пользуясь функцией Лапласа, вместо (3.48) можно на- писать Рв = 2ф(йа]/2), (5.48) или же, учитывая связь меры точности с дисперсией, Рв-2ф(|). (6.48) Так как в приложениях дается таблица функции Лап- ласа (4.48), то мы будем чаще пользоваться формулой (5.48) или (6.48), нежели (3.48). •) Эту функцию обозначают также erf х.
§ 48] СРЕДНЯЯ И СРЕДНЯЯ КВАДРАТИЧНАЯ ОШИБКИ 353 Выразим теперь через функции Ф*(х) и Ф(х) вероят- ность того, что ошибка заключена в пределах от а до bt Имеем ь ь Ра,ъ= ( Ф(е)de = -£=• f e~h'x2dx. J У л J а а а. ь = I e~pdt = 1 [Ф’ (hb) - Ф' (ha)] (7.48) V л J 2 Положив, как и раньше, hx--=t, получаем hb Р r ” ha или, переходя к функции Ф(х), Pa.b = ®(hb yi). (8.48) Выражение (8.48) можно было бы получить и непосред- ственно, применяя в интеграле, определяющем Ра ь, под- становку пх = ~у=? вместо hx = t. Введем теперь некоторые характеристики, с кото- рыми приходится встречаться в теории ошибок. Вероятной ошибкой1) называется такое положитель- ное число Q, что Pq = 4- (9-48) Если Q означает вероятную ошибку, то из определен ния следует, что с одинаковой вероятностью ошибка может быть по абсолютной величине больше Q или меньше Q. Пользуясь определением, легко подсчитать величину вероятной ошибки, считая, что случайные ошибки рас- пределены по нормальному закону и мера точности h из- вестна. Так как вероятность того, что ошибка заключена в интервале (—Q,Q), равна половине, то, пользуясь фор- мулой (5.48), получаем Р<г = 2ф(^/2) = 4) ]) По существу, мы уже ввели вероятную ошибку для нормаль- но распределенной случайной величины в § 45, где она называлась вероятным или срединным отклонением и обозначалась Ех. 23 Р С. Гутер, Б. В. Овчинский
354 ТЕОРИЯ ОШИБОК [ГЛ VH откуда Ф (/zQ 2) = 0,25_. Из таблицы значений функции Ф находим, что hQ У 2 = 0,6745, так что Q = 0,67450 = . (10.48) Средней ошибкой называется средняя величина абсо- лютной ошибки, т. е. математическое ожидание абсо- лютной величины ошибки оо оо ё = J | 8 | (р (е) de = 2 j 8ф (е) de. — оо 0 Если ошибки распределены по нормальному закону, то средняя ошибка равна о и o~h2&2 00 1 e = -|L ee-^de==--f-— = (И.48) } л /г у л 0 h}n Заметим, что если вместо |е| брать просто е, т. е. искать математическое ожидание самой ошибки, а не ее абсолютного значения, то, естественно, получается нуль, ибо функция ее~,г2е2 является нечетной. Наиболее важной характеристикой является средняя квадратичная ошибка. Средней квадратичной ошибкой называется квадрат- ный корень из математического ожидания квадрата ошибки е^. Так как математическое ожидание ошибки, как мы только что заметили, равно нулю, то математи- ческое ожидание квадрата ошибки есть дисперсия ошиб- ки о2. Поэтому среднюю квадратичную ошибку обозна- чают через о. Как было указано в § 47 (см. (14.47)), ве- личина средней квадратичной ошибки связана с мерой точности равенством о = —^=-. (12.48) Л/2 ' В заключение отметим роль величины h как харак- теристики точности произведенных измерений. Уже из связи величины h с дисперсией видно, что при больших h почти вся площадь под кривой ф(х) сосредоточена
§ 49] ОПРЕДЕЛЕНИЕ МЕРЫ ТОЧНОСТИ 355 вблизи оси Оу, т. е. вероятность малых ошибок весьма велика, а вероятность больших ошибок весьма мала. Чем меньше h, тем больше дисперсия, т. е. тем больше рас- сеяние ошибок. Особенно ясно выступает роль величины h как меры точности при рассмотрении выражений для вероятной, средней и средней квадратичной ошибок. Формулы (9.48), (11.4$) и (12.48) показывают, что эти ошибки обратно пропорциональны мере точности И. § 49. Определение меры точности по результатам произведенных наблюдений Как мы убедились в предыдущем параграфе^ знание меры точности h позволяет определить вероятную, сред- нюю и среднюю квадратичную ошибки и Даёт возмож- ность оценить надежность произведенных измерений. Поэтому естественно возникает задача — определить меру точности по результатам измерений. При $том мы будем предполагать, что все измерения произведены с одинаковой тщательностью, т. е. являются равноточными, й что случайные ошибки распреде- лены по закону Гаусса. Пусть результатами измерений некоторой величины А являются числа Х1,х2, ..М (1.49) Рассмотрим гипотезы, состоящие в том, что измеряемая величина равна х, а мера точности произведенных изме- рений равна h. При сделанных допущениях о значениях х и h ве- роятность получения результатов измерений (1.49) равна (см. формулу (3.47)) ф(х— Х1)ф(х — х2)..* ф(х— xn)den или, пользуясь выражением для плотности нормального распределения, [(*-*»)2+(*-*2)2+ ... +(х-хпУ](1е\ (2.49) 23*
356 ТЕОРИЯ ОШИБОК [ГЛ. VII Так как до испытаний все значения х и h следует считать равновероятными, то вследствие теоремы Бейеса вероятность самой гипотезы пропорциональна (2.49), т. е. равна Ghne~h'~ l(x"xi)24-(x-x2)24- +(х-хпУ\ (3.49) где G — постоянный множитель пропорциональности, куда включены также не зависящие от h и от х множи- тели —и den. л ' Прежде всего отметим, что при любой гипотезе от- носительно h величина (3.49) будет наибольшей, если х выбран так, что сумма (х - xj2 + (х - х2)2 + ... + (х ~ Х„)2 = 2 (х - Xi)2 / = 1 будет наименьшей. Таким образом, исходя из того, что ошибки распределены по закону Гаусса, мы пришли к следующему выводу. Наивероятнейшим значением, которое можно полу- чить из ряда измерений одинаковой точности, является такое значение, для которого сумма квадратов разно- стей этого значения и результатов измерений является наименьшей1). Это положение называется принципом наименьших квадратов. Покажем теперь, как, пользуясь этим принципом, найти наивероятнейшее значение величины х. Приравни- вая нулю производную по х от суммы квадратов п 2 (х — X/)2, получим /=1 2 2 (х — Xi) = О, 1 = 1 откуда п х = х = (4.49) ‘) Обычно эти разности называют уклонениями’, они не являются истинными ошибками, которыми служат числа А — Xi, А—х2 и т. д.
§ 49] ОПРЕДЕЛЕНИЕ МЕРЫ ТОЧНОСТИ 357 (легко проверить, что при х — х действительно имеет ме- сто минимум). Мы доказали, таким образом, утверждение, обратное основной теореме § 47: если случайные ошибки распре- делены по закону Гаусса, то наиболее вероятным значе- нием х измеряемой величины является среднее арифме- тическое наблюденных значений. При отыскании наиболее вероятного значения йдело обстоит сложнее. Если бы мы в (3.49) заменили х на х и искали бы максимум относительно й, то получили бы уравнение п ~h> Е (х-хЛ2 / , " \ Ge «=>' ’ \nhn~x— 2hn+i 2(х-х,)2 =0, \ *=1 / откуда h -----........... г-. (5.49) / п Однако это значение h не является наиболее вероятным (хотя и близко к нему), так как вероятность гипотезы h вычислена лишь при одной гипотезе х = х. При этом раз- ности х — Xj не являются истинными ошибками, кото- рые равны А — х^ где А — точное значение измеряемой величины. Вычислим теперь вероятность значения h, по- лагая, что х может принимать любые значения *). Вейлу теоремы сложения вероятностей мы должны просумми- ровать выражения (3.49) по всем х от —оо до оо. Это сведется к вычислению интеграла Т £ (х~хд2 P = Ghn J e dx. (6.49) — oo Для нахождения интеграла (6.49) введем новую пе- ременную и, положив х — х + и, где х определено фор- мулой (4.49). !) Выражение (3.49) при х = х дает условную вероятность гипо- тезы h\ теперь же мы переходим к вычислению полной вероятности этой гипотезы.
358 ТЕОРИЯ ОШИБОК [ГЛ. vir Для дальнейшего заметим, что из этой формулы сле- дует равенство • п п пх - 2 х, = 2 (х - Xj) = 0. (7.49) ( = 1 z=i Производя указанную замену переменных в- интеграле (6.49), получим Р ? ~h2 Е (X+U-X;)2 = Ghn f е du. — оо Возводя скобки в показателе степени в квадрат и ис- пользуя (7.49), запишем [и Е ) (x-xf)2+2« Y^x хЛ+пи2 -I du = п -h2 Е (х-х(.)2 ~ Ghne '=' \e~^du. В последнем интеграле положим hu У п — I e~nh2u2dU = J е 2 — оо —оо- —7=. Тогда V2 pGr W*' так что п п А У~п У~п Равенство (8.49) дает вероятность того, что при дан- ных результатах измерений мера точности равна h. Наи- более вероятным значением h будет такое, при котором выражение (8.49) будет максимальным. Для того чтобы найти интересующий нас максимум, dP приравняем нулю производную-^-: п Гл ~hiy.^-xi)2 — е *=1 п п (п- \)hn~2 ха2 =0.
§ 49] ОПРЕДЕЛЕНИЕ МЕРЫ ТОЧНОСТИ 359 Отсюда следует, что наиболее вероятным значением меры точности h, которое обычно принимают за истин- ное значение Л, является При и достаточно большом выражения (9.49) и (5.49) практически совпадают. Зная величину меры точности, можно теперь, поль- зуясь формулами (9.48), (11.48) и (12.48) предыдущего параграфа, определить величины вероятной, средней и средней квадратичной ошибок. В частности, для средней квадратичной ошибки найдем (10.49) Этой формулой обычно пользуются для определения а. Прежде чем перейти к рассмотрению примера, сде- лаем следующее практическое указание. При наличии большого числа измерений удобно не вычислять среднее арифметическое х непосредственно, а поступать иначе. Выбрав в качестве «условного нуля», произвольное зна- чение Хо, рассмотрим вместо результатов измерений Xi, х2, ... хп их отклонения от х0, равные Axi = — х0, Ах2 = х2— х0,..., Ахп = хп— х0. Найдя среднее арифмети- ческое этих отклонений п п ~ *0) “ Xq, i-1 i = l легко найдем и само среднее арифметическое х: п х = — У} xz = х0 + Ах. z=i Таким образом, для вычисления среднего арифметиче- ского измеренных значений достаточно к произвольно
360 ТЕОРИЯ ОШИБОК [ГЛ УГГ выбранному значению xQ прибавить среднее арифмети- ческое отклонений измеренных значений от х0. Рассмотрим теперь пример обработки ряда равноточ- ных измерений. Пример 1.49. Один и тот же угол был измерен 10 раз. Найти наиболее вероятное значение х угла и среднюю квадратическую ошибку а. Вычисления приве- дены в табл. 1.49. Таблица 1.49 № наблю- дения Угол 1 х~11 (*~Мг 1 85° 42' 12" 12" -9" 81 9 42' 00" 0 4-3" 9 3 41'58" -2" 4-5" 25 4 42' 04" 4-4" -1" 1 5 42' 06" 4-6" -3" 9 6 42' 09'' 4-9" -6" 36 7 4>'0Г 4-3" 0 0 8 42'08" 4-8" -5" 25 9 41'54" -6" 4-9" 81 10 41'56" -4" 4-7" 49 2 >2 Mi = зо" -- Xa'z = 3" 0 а = 316 = 5",9 В качестве условного нуля принято значение /о = = 85°42,00//. В результате обработки получаем наиболее вероятное значение х=85°42'03" и среднее квадратич- ное отклонение а = 5",93. § 50. О функциях величин, полученных из наблюдений Предположим, что для определения площади круга S мы измерили его радиус г. При этом, как и при вся- ком измерении, величина г найдена с некоторой случай- ной ошибкой. Предположим, далее, что в результате из- мерений нами найдено наивероятнейшее значение г и его мера точности h. Спрашивается, каково будет при
§50] О ФУНКЦИЯХ ВЕЛИЧИН, ПОЛУЧЕННЫХ ИЗ НАБЛЮДЕНИЙ 3&1 этом наивероятнейшее значение S площади и ее мера точности /и. В более общем виде эту задачу можно формулиро- вать следующим образом. Пусть дана функция u = f(x, у, z, t) независимых аргументов х, у, z, t. Предполагается, что в резуль- тате многократных измерений определены наивероятней- шие значения х, у, z, ..., t и их меры точности. Тре- буется, исходя из этих значений, определить наивероят- нейшее значение и и ее меры точности. Мы рассмотрим решение этой задачи сначала для не- которых частных случаев, ограничиваясь наиболее про- стыми функциями, а затем и в общем виде, предполагая все время, что случайные ошибки распределены по за- кону Гаусса. I. Функция вида и = ах + где а п b — изве- стные постоянные. Пусть в результате измерений величины х найдено ее наиболее вероятное значение х0 и мера точности про- изведенных измерений /г. Пусть 8 означает ошибку, ко- торую мы допускаем, считая х равным х0: Х~Хд 4- 8. Приняв за и значение Uq — CIXq + b, мы допускаем при этом ошибку т], равную т| = и — Uq = а (х — х0) = аг. (1.50) Найдем теперь плотность распределения величины rj; обозначим его ф1(т]). Вероятность того, что г] будет за- ключено в интервале (т], т] + dx\), равна вероятности того, что 8 заключено в интервале (е, e + de). Поэтому Ф1 (п) = Ф (е) d (е) = ““A e~h2&2 de. У л Заменяя в правой части равенства е = получим Ф1(т])Л]=— е а — dx\y Ул а
862 ТЕОРИЯ ОШИБОК [ГЛ. VII откуда <р1(п) = ^-е"® 11\ (2.50) У л Таким образом, ошибка т] величины и также распреде- лена по нормальному закону. Наиболее вероятным значением т) является нуль. По- этому наивероятнейшим значением и будет Uo = axo + b. Мера точности uQ, как видно из (2.50), равна h\ = Зная меру точности для величины w, легко опреде- лить среднюю квадратичную ошибку оь В силу равен- ства (12.48) получаем Иначе говоря, средняя квадратичная ошибка линей- ной функции от аргумента, полученного из измерений, равна произведению коэффициента при аргументе на среднюю квадратичную ошибку аргумента. Аналогично получаются выражения для остальных характеристик. Пример 1.50. Угол а измерен со средней квадрати- ческой ошибкой 2". Ошибка произведения 4а, как видно из (3.50), равна 8". II. Функция вида и = х 4- у, где к и у — незави- симые величины, получающиеся в результате измерений. Пусть соответственно х0 и у$—наивероятнейшие зна- чения х и у, a fti и h2— меры точности соответствующих измерений. Допустим, что ошибки, которые допускают- ся, если мы примем х = х0, У = i/o, равны соответственно В! И 82, т. е. X = Хо + 81, У — У0 4* 82- Полагая uQ = х0 + t/o, найдем, что разность и — и0- равна и — Uq = (X — Хо) + (у — Уо) = 81 + 82. Обозначая и — = т], найдем закон распределения ве- личины т]. Для этого примем без доказательства следую- щее утверждение. Если две случайные величины распре- делены по нормальному закону, то их сумма также под- чиняется нормальному закону распределения. Характе-
§ 50) О ФУНКЦИЯХ ВЕЛИЧИН, ПОЛУЧЕННЫХ ИЗ НАБЛЮДЕНИЙ 363 ристики этого закона находятся на основании теорем о математическом ожидании и дисперсии суммы случай- ных величин (см. § 41). Так как M(ei) = М(е2) = 0, то и М(л) = 0, следова- тельно, наивероятнейшим значением и является uQ =» = Хо + yQ- Далее 0*2 = G2 + О'* . Л е2 Вместо этого можно написать1) 4 = 4 + 4 (4. so) Для меры точности получаем выражение III. Функция вида и = х + у + z, гд$ все три слагаемые — независимые измеряемые величины. Положим v = х + у. Тогда и = v + z и, по выведен- ной только что формуле, 4 = 4 + 4- Аналогично 4 = 4 + 4 так что окончательно = ах + °2У + °2- (6.50) Таким же образом докажем, что для суммы любого конечного числа независимых слагаемых u = x + y + z + ,..-H средняя квадратичная ошибка равна 4 = 4 + 4 + 4+ ••• +4 (7-50) IV. Линейная ф у н к ц и я, т. е. функция вида и = k^x + 4" • • • + *) Согласно замечанию на стр. 345, дисперсия величины х и ошибка е = А —х — одна и та же, так как кривые их распределения отличаются только сдвигом.
364 ТЕОРИЯ ОШИБОК [ГЛ VIТ Среднюю квадратичную ошибку для и можно полу- чить, комбинируя результаты I и III случаев: < = + • • • + knGl (8‘5°) V. Средняя квадратичная ошибка ариф- метической средней. Пусть произведено п измерений х2, .хп с оди- наковой мерой точности, или, что то же самое, с одина- ковой средней квадратичной ошибкой о, и из наблюден- ных значений составлена средняя арифметическая ДД _ Xi + Х2 + . . . + хп 1 1 2. у М~п ~ н*1 + Л + ••• + пХп- Средняя квадратичная ошибка М может быть полу- чена по формуле (8.50). В самом деле, О2 == “V q2 + “Т G2 + • * • + “V о2 = ~ О'2, Мп2 П2 п2 п 9 откуда ОЛ1 = -^-. (9.50) Уп сред- Таким образом, средняя квадратичная ошибка ней арифметической равноточных измерений обратно пропорциональна квадратному корню из числа измере- ний п. Это показывает, что средняя арифметическая из- мерений имеет среднюю квадратичную ошибку значи- тельно меньшую, чем каждое измерение в отдельности. В примере 1.50 мы получили среднюю квадратичную ошибку отдельного измерения, равную о = 5",9. Поль- зуясь (9.50), можно определить теперь среднюю квадра- тичную ошибку арифметической средней, которая равна 31 “ Уп ~ /То ~ Д Пользуясь «правилом трех сигм» (см. § 40 гл. VI), мы можем заключить, что измеренный угол заключен в пределах от 85°4Г57" до 85°42,09,/. После того как были рассмотрены различные част- ные случаи, мы можем перейти к рассмотрению общего случая.
§ 50] О ФУНКЦИЯХ ВЕЛИЧИН, ПОЛУЧЕННЫХ ИЗ НАБЛЮДЕНИИ 365 Пусть и = f (х, у, z .. ., t) — функция п величин х, у, z, t, получающихся путем измерений, х0, Уо, z0, /о — соответственно их наивероятнейшие значения, a <rx, а2, ..., Qt — соответствующие сред- ние квадратичные ошибки. Требуется определить наибо- лее вероятное значение и и среднюю квадратичную ошиб- ку <5и. ПоЛОЖИхМ х = х0 + еь у = у0 + е2, z = z0 + е3, ..., t = tQ + en. (10.50) Как уже известно, наиболее вероятные значения ошибок ei, е2, суть нули. Кроме того, если средние квад- ратичные ошибки од, од, ..., О’/ невелики, то мы мо- жем считать ошибки 8j, е2, •••, 8П малыми, во всяком случае, настолько, чтобы иметь право пренебречь их квадратами по сравнению с первыми степенями. В силу (10.50) имеем и = f (х, у, z, ..., /) = = f (Хо + 81, Уо + 82, г0 + 8з, . . . , 6 + 8п)е Разлагая последнее выражение по формуле Тейлора по степеням ei, ..., 8П и пренебрегая степенями выше пер- вой, получаем и = f (хо, Уо, Zo, .... to) + +е>Шо+е2Шо+елШо+ ••• +е«Ш)’ (11,50> I df \ {df\ где 1-^Д, .. —значения частных производных в точке (х0> уо, ?о.to) Отсюда на основании рассмотренных случаев вы- водим: 1) Наиболее вероятным значением и является «о = Н*о, Уо, zo, to). (12.50) 2) Средняя квадратичная ошибка и равна (13.50)
366 ТЕОРИЯ ОШИБОК [ГЛ. VII Рассмотрим некоторые примеры, иллюстрирующие формулу (13.50). Пример 2.50. Найти среднюю квадратичную ошиб- ку площади S квадрата, сторона а которого измерена со средней квадратичной ошибкой оа. Здесь S = а2. Отсюда = 2а, так что, в силу (13.50), = 2ава. Пример 3.50. Увеличение зрительной трубы выра- жается формулой v = где f и (р— соответственно фо- кусные расстояния объектива и окуляра. Найти сред- нюю квадратичную ошибку увеличения v, если fn ср даны со средними квадратичными ошибками о/ и аф. Частные производные v равны dv __ _1_, ду __________________f df — ср ’ dqp ~ (р2 * Отсюда 2 1 9 | Р 2
ГЛАВА VIII СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ § 51. Общие замечания Во вводных замечаниях к третьей части книги мы познакомились с примером следующего содержания. Имеется зависимость вида о = а®, причем значения v н Ф получаются из наблюдений. Если бы измерения вели- чины $ и v производились без ошибок, то для определе- ния коэффициента а было бы достаточно одного измере- ния. Если рассматривать более общую зависимость, на- пример v = сг& + &, то здесь имеется два неизвестных коэффициента, для нахождения которых достаточно было бы двух абсолютно точных измерений. На самом деле, абсолютно точные измерения чаще всего невозможны. Для того чтобы исключить влияние ошибок, производится большое число измерений. Ка- ждое измерение дает нам уравнение, связывающее не- известные коэффициенты. При большом числе измерений мы приходим, следовательно, к системе, число уравне- ний в которой значительно больше, нежели число неиз- вестных. Задачей, которая здесь ставится, является отыскание наиболее вероятных значений коэффи^ циентов, которые, вообще говоря, не будут точно удовле- творять ни одному из уравнений системы. Эту задачу можно сформулировать в более общем виде. Пусть дана функция y = f(x;a0, а,.ат) (1.51) независимой переменной к и т + 1 параметра а0» • • • лт. Эти параметры постоянны, но заранее неизвестны и под- лежат определению. Для их отыскания Производится ряд
368 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ. VIII измерений величин х и z/1). Подставляя их в равенство (1.51), мы получаем уравнения между параметрами aQl аь .. ., ат вида tji = f (.Xi, ае, 01, .... а„,) (t = 1,2, ..., n), (2.51) где Xt и tji — соответствующие друг другу измеренные значения, а п — число измерений. Если бы значения х и у находились точно, то для отыскания т 4- 1 параметра достаточно было бы произвести m + 1 измерение. На са- мом деле, значения х и у содержат ошибки, и никакие ш+1 измерений не позволят определить истинные зна- чения параметров. Поэтому обычно производится боль- шее число измерений (n>m+ 1), в результате чего число уравнений (2.51) будет больше, чем число неиз- вестных параметров. В этом случае система (2.51) бу- дет, вообще говоря, несовместной, т. е. точные решения каких-либо (m + 1) из уравнений системы могут не удов- летворять остальным уравнениям2). Наша задача со- стоит в том, чтобы найти такие значения неизвестных параметров, которые будут удовлетворять этим уравне- ниям наилучшим образом (хотя и не точно). Иначе го- воря, требуется найти наиболее вероятные значения не- известных параметров. Эти вероятные значения будут тем более близки к истинным, чем больше число наблю- дений. Так как уравнения (2.51) удовлетворяются неточно, то будем иметь Уг — f(Xi,ab,ax, .... anl)= а (I = 1,2, /г), (3.51) где ег- — отклонения измеренных значений z/; от вычисленных по формуле (1.51). Принцип наимень- ших квадратов (см. § 49) утверждает, что наивероятней- шими значениями параметров будут такие, при которых ’) Разумеется, так поступают тогда, когда константы а0, fli, ..., am не поддаются непосредственным измерениям, а величины х и у измерению доступны. 2) В случае п < m + 1 система (2.51) была бы совместной й всегда имела бы бесчисленное множество решений.
§ 51] ОБЩИЕ ЗАМЕЧАНИЯ 369 сумма квадратов отклонений е, будет наименьшей >), т. е. 2[&-/(хг, «о. «и • ••. aj]* 2 = min. (4.51) i — l Рассматривая здесь aQ,ai,..., am как независимые пе- ременные и приравнивая нулю частные производные от левой части по этим переменным, получим в точности m + 1 уравнение с m + 1 неизвестным. Составление и решение этой системы особенно просто в том случае, ко- гда функция f (х, aQi , am) линейна относитель- но параметров2) (х, а0, ах, ..., ага) = фо(х)ао + <Р1(х)«1+ ... + фт(х)ат. (5.51) Дифференцируя сумму квадратов отклонений [^ — Фо(*»)«о — <Р1 (•*/)«I — ... -фт(х/)ат]2 1=1 по а0, «1, ...» ат и приравнивая нулю производные, получим 2 2 [Pi ~ Фо (xz) ай - ф1 (хг) ах - - ... - ф„г (xf) ат] [- ф0 (х,)] = 0, 2 2 \jJt “ Фо (х;) «о ~ Ф1 (х,) tzi - j—1 ^0 51) - ... - фяг (Xj) а.п] [ - ф( (х;)] = 0, 2 2 \У1 - Фо (х,) а0 - ф! (х,) а, - /=1 ... фт (%/) ат] [ фш 2X2 0* ‘) При этом мы считаем, что отклонения е, подчиняются нор- мальному закону распределения. 2) Если бы в (5.51) было слагаемое ф(х), не зависящее от па- раметров, то мы бы перенесли его в левую часть, рассматривая вместо у функцию у — ф(х). 24 Р. С. Гутер, Б. В Овчинский
370 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ VIII Вводя для краткости обозначения п п 2 У Юг (*i) = [У, Фг 1, 2 ф? (х() = [фг, Фг], п 2 Фг (*,.) ф4 (х() = [фг, фJ, 1 = 1 (7.51) приведем систему (6.51) к так называемой нормальной форме [фо, Фо] а-о + [фо, ф|] й| + • • • + [фи, фт] а,п = 1У, Фо], [фь Фо] ао + [ф„ ф,]+ ... + [фь фт] а,„ = [у, ср,], ]фт, Фо] «о + [фт, Ф1] «1 + • • • + [фга, ф«] ат = [//, фт]. (8.51) Это — линейная система уравнений. Решение таких си- стем рассматривались в §§ 6, 8, 9. Заметим только, что вследствие [cpr, ф>] = [<ps, фг] матрица этой системы сим- метрична относительно главной диагонали. Применим теперь паши общие выводы к определению коэффи- циента а в законе охлаждения по данным наблюдений, приведенных во введении к III части (см. пример 3, стр. 341). Закон Ньютона имеет вид v = а®, (9.51) где v — скорость охлаждения, О— избыток температуры. По данным наблюдений требуется найти наиболее ве- роятное значение коэффициента а. Здесь число измере- ний п = 7. Система (3.51) для отклонений имеет вид Vi — a$i = ег (/ = 1,2, ..., 7); так как имеется только один неизвестный параметр, то система (8.51) приводится к одному уравнению 7 7 а 2 $ = 2 v А> i=l i = l
ОБЩИЕ ЗАМЕЧАНИЯ 371 § 51] откуда 17 Z~1 [aft] [ft, ft] • (10.51) Результаты вычислений удобно объединить в одной таблице с наблюденными данными (табл. 1.51). Подставляя суммы из столбцов (4) и (5) в формулу (10.51), найдем 6433 А АОЛ а 190 400 ~ °’034, В последних столбцах табл. 1.51 ((6) — (8)) дань! значе- ния v, вычисленные по формуле v = aft, где а = 0,034, и отклонения их от наблюденных значений, а также квад* раты этих отклонений. Таблица 1.51 i vi 9lvl ° ВЫ ЧИС л °выч ^набл (ивыч рнабл)2 (О (2) (3) (4) (5) (6) (7) (8) 1 ЙО 8,81 48 400 1 938 7,48 -1,33 1,77 2 200 7,40 40 000 1 480 6,80 -0,60 0,36 3 1?0 6,10 32 400 1 098 6,12 + 0,02 0,00 4 160 4,80 25 600 782 5,44 + 0,55 0,30 5 140 3,88 19 600 543 4,76 + 0,88 0,77 6 120 3,02 14 400 362 4,08 + 1,06 1,12 7 100 2,30 ЮООО 230 3,40 + 1,10 1,21 2 190 400 6 433 + 1,68 5,53 Эти данные позволяют определить сумму квадратов Отклонений 2 (^выч ^набл)^ ~ 5,53. Для всех других значений а величина этой суммы будет больше, чем в нашем случае. Заметим, что полученные отклонения в столбце (7) следует считать довольно большими, так что формула Ньютона является, следовательно, слишком грубым 24*
Таблица 2.51 сс i vi + 273 (Oj + 273)4 zl vizl 4 гвыч °выч ~ гнабл (°выч гнабл)2 1 220 8,81 493 5,907 • 1010 5,35-10’° 4,71 • 10” 2,86- 102’ 8,83 + 0,02 0,0004 2 200 7,40 473 5,005- 1010 4,45 • 1010 3,29-10” 1,98- 102’ 7,34 -0,06 0,0036 3 180 6,10 453 4,211 • 1010 3,66-10’° 2,23- 10” 1,34- 1021 6,04 -0,07 0,0049 4 160 4,89 433 3,515- 1010 2,96-10'° 1,45- 10” 8,76- 102° 4,88 -0,01 0,0001 5 140 3,88 413 2,909-Ю10 2,35-10’° 9,12-10’° 5,52 • 102» 3,88 -0,01 0,0001 6 120 3,02 393 2,385-Ю10 1,83-10’0 5,53 - 10’° 3,35- 102° 3,02 0,00 0,0000 7 100 2,30 373 1,936- Ю10 1,38-10’0 3,17-10’0 1,90- 102° 2,28 -0,02 0,0004 2 1,349-10’= 8,13- 1021 0,0095 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ (ГЛ. VIII
§ 52] ПРИМЕРЫ 373 приближением. Значительно лучше согласуется с дан- ными опыта закон Стефана, согласно которому скорость охлаждения пропорциональна разности четвертых степе- ней абсолютных температур, т. е. при температуре тела $°С и температуре окружающей среды 0°С выражается формулой ц = я[(1Я-273)4 —2734]. (11 51) Обозначив z=(0, + 273)4— 2734, подберем коэффи- циент а для (11.51) по способу наименьших квадратов и, как и в предыдущем случае, сравним вычисленные значения v с данными опыта. Результаты вычислений приведены в табл. 2.51. Так как (11.51) можно записать в виде v — az = 0, то, заменяя в формуле (10.51) 'Of на гг-, получим 7 „ ~ 1,35-10’2 1 1п-ю а = —-------= 813.102, - 1,65- 10 Вычисление v по формуле (11.51) с полученным зна- чением а дает, как показывает табл. 2.51, довольно хоро- шее совпадение с опытными данными. Сумма квадратов отклонений равна здесь 0,0095. Таким образом, закон Стефана дает значительно луч- шее согласие с опытом, чем закон Ньютона. Тем не ме- нее в тех случаях, где не требуется очень большая точ- ность, формула Ньютона предпочтительнее ввиду ее про- стоты. § 52. Примеры применения способа наименьших квадратов В главе II, занимаясь интерполированием функций, мы рассматривали, как говорят, точечную интерполя- цию, т. е. строили интерполяционные многочлены, значе- ния которых точно совпадали со значениями самой функции в узлах интерполяции. Во вводных замечаниях к третьей части книги было указано, что возможна и другая постановка задачи, когда от интерполяционного
374 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ vnr многочлена требуется лишь, чтобы он как-то приближал заданную функцию и не обязательно совпадал с ней в отдельных заданных точках. Говоря о заданной функции, мы будем подразумевать при этом, что нам известны лишь отдельные ее значения в некоторых точках1). Мы предполагаем, следовательно, что зависимость у от х имеет вид многочлена y = aQ + a[x + a2X2-f-.. , + атхт (1.52) с неизвестными коэффициентами. Нашей задачей является нахождение по результатам наблюдений наиболее вероятных значений коэф- фициентов aQl а\, ... , ат. Если бы число наблюдений в точности равнялось числу неизвестных коэффициентов, то мы имели бы дело с задачей, разобранной в первой части книги (см. § 13 гл. II). Значительно более важным является тот случай, когда число наблюдений п много больше степени много- члена. Как мы уже знаем, в этом случае получается обычная задача способа наименьших квадратов2). Тре- буется найти коэффициенты ага, дающие ми- нимум функции п Ф= —(а0 + а|х< + а2х;+ ••• + ятхГ)]2- (2-52) В обозначениях § 51 это означает, что фоСг)=1, Ф1(%)=Х, . .., (рт(х)=хт. Символы (7.51) будут теперь равны: п п п [<Л фг] = S iJixri, [фг, фг] = S х*, [фг, ф5] = 2 (3.52) 9 Можно говорить и о приближении функции, заданных анали- тически (см введение к третьей части). 2) Ясно, что нет смысла применять метод наименьших квадратов при лСш + 1. В этом случае система уравнений для определения коэффициентов пг совместна и сумма квадратов будет равна нулю при любых решениях системы.
§ 52) ПРИМЕРЫ 375 и система (8.51) запишется в виде п п п п па0 + « 2 xt: + а2 2 х? + ... + ат 2 х<п = 2 Уь i=l z = l i=l i=l п п п а0 2 xt + а, 2 х? + я2 2 х?+ ... 1=1 1 = 1 1=1 п п ... + ат 2хГ+1 = 2,х(ур 1=1 £-= 1 (4.52) п П п. а0 2 х? + а, 2 х”+1 + а2 2 х«+2 + ... i = 1 i = 1 i = 1 п п ... + ат 2 х2"1 = 2 х™уг 1=1 £ = 1 Укажем на один прием, позволяющий в некоторых случаях упростить систему (4.52). Предположим, что значения х являются точными и даны с постоянным ша< том Xi+i—Xi = h (i=l, 2, ..., п—1). Введем вместо х новый аргумент и. Если число наблюдений нечетное, н = 2&+1, то полагаем и = -—или х = x*+i + (5.52) когда х последовательно принимает значения Xi,x2, . ..., Xk+ъ .Х2/г+1, то и будет принимать целочислен* ные значения —k, — k + 1, ..., —1,0, 1, ..., k— 1, k. Если искать зависимость у от и, т. е. коэффициенты многочлена t/ = tzo + ^iu + .. . + атит, (6.52) то система (4.52) для определения «0, Дь •••, cim значи- тельно упростится, ибо благодаря выбору значений и суммы нечетных степеней будут равны нулю: 2fe+l 2&+1 2 и. = 2 «’= ... =0- (7.52) 1=1 1=1
376 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ VIII Для случая четного числа наблюдений n = 2k введем переменную и равенством 2(х~х) (u + l)h U =-------' — 1 или х =---а---h Xk. (8.52) Тогда при изменении индекса у х от 1 до 2k величина а последовательно будет равна —2^+1, ..., —3, —1, 1, 3, ..., 2k — 1 и снова сумма нечетных степеней и будет равна нулю. После того как многочлен (6.52) будет построен (т. е. найдены его коэффициенты), можно перейти к старой переменной х по формулам (5.52) или (8.52). Выясним, как будет выглядеть система (4.52) в про- стейших случаях многочленов первой и второй степени. Пусть y = aQ-\-a\U\ тогда, учитывая равенства (7.52), получим (здесь и в дальнейшем суммирование ведется в пределах от 1 до п и индексы суммирования для крат- кости опускаются) па0^^У(, откуда Ъ = (9.52) п ui Для случая многочлена второй степени + +а2и2 система (4.52) запишется в виде HUq 4" 2 2 «oSu?+fl2SMi = SM^- Решая полученную систему, найдем 1 ’ .2‘HW ' (10.52)
§ 52] ПРИМЕРЫ 377 Заметим, что целый ряд множителей в (10.52) имеет вид суммы степеней и, т. е. не зависит от результатов наблюдений и вполне определяется числом наблюденных значений. Для таких множителей можно заранее соста- вить таблицы значений, что весьма облегчит нахожде- ние коэффициентов яг-. Введем обозначения (суммирование ведется в пре- делах от 1 до п) _ 1 _ 1 * “1-п’ а2-Ж’ аз~«2‘4-(М2’ 2*4 п а4""2*4-(2*4Г а5"*2*4-(2*4)2’ (11.52) Пользуясь обозначениями (11.52), можно записать вы- ражения (9.51) и (10.52) для коэффициентов а0, 01, 02 в виде табл. 1.52. Аналогичные формулы можно полу- чить и для коэффициентов многочленов более высоких степеней. Таблица 1.52 Сте- пень урав- нения Со Коэффициент «1 2^’ аз2^“а4 2*4*л- «2 2 2 uiyi Что касается числовых значений коэффициентов а&, то в зависимости от числа наблюденных точек они могут быть вычислены заранее. Эти значения приведены в приложении II (стр. 432). Рассмотрим теперь некоторые примеры. Пример 1.52. Требуется определить зависимость скорости течения v (м/сек) от относительной глубины D по результатам десяти наблюдений, приведенных в табл. 2.52. Для решения вопроса о степени приближающего многочлена в столбцах (3) — (4) таблицы приведены
378 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ. VIH Таблица 2.52 Di vi ui “ivi увыч VBbi4 инабл (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) 0 0,957 0,012 -0,005 -9 -8,613 81 77,517 0,957 0 0,1 0,969 7 -5 —7 -6,783 49 47,481 0,969 0 0,2 0,976 2 -5 -5 — 4,880 25 24,400 0,976 0 0,3 0,978 -3 — 4 -3 -2,934 9 8,802 0,979 0,001 0,4 0,975 — 7 — 7 -1 -0,975 1 0,975 0,976 0,001 0,5 0,968 -14 -1 1 0,968 1 0,968 0,969 0,001 0,6 0,954 -15 -6 3 2,862 9 8,586 0,957 0,003 0,7 0,939 -21 -3 5 4,695 25 23,475 0,940 0,001 0,8 0,918 -24 7 6,426 49 44,982 0,919 0,001 0,9 0,894 9 8,046 81 72,414 0,892 -0,002 2 9,528 0 -1,188 330 309,600 разности Ду и Д2у. Как показывают данные столбца (4), вторые разности являются практически постоянными. На основании рассуждений, приведенных в § 15 гл. II, видим, что следует искать многочлен второй степени. Столбец (5) табл. 2.52 содержит значения а, соот- ветствующие приведенным значениям D. Столбцы (6) — (8) содержат произведения, нужные для определения коэффициентов aQ, а2. Столбцы (9) — (11) содержат вычисления значений v с помощью полученного много- члена и сравнение их с обычными данными. Из таблицы, помещенной в приложении II (стр. 432), находим а2 = 0,0030, аз = 0,2289, а4 = 0,0039, as — 0,000118. Поэтому, согласно таблице 1.52 а0 = 0,2289 • 9,528 - 0,0039 • 309,600 = 0,9735, ^ = 0,0030. (- 1,188) = ~ 0,0036, а2 = 0,000118 • 309,600 - 0,0039 • 9,528 = - 0,0006. Таким образом, приближающий многочлен для v имеет вид v = 0,9735 — 0,0036а — 0,0006а2. Остается возвратиться от переменной а к перемен- ной £>, для чего мы воспользуемся формулами (8.52),
§ 52] ПРИМЕРЫ 379 Так как здесь n=2fe--=10, й = 0,1 и £>5=0,4, то и = 2 - 1 = 20 £) - 9, и искомый многочлен приобретает вид V = 0,9735 — 0,0036 (200 — 9) — 0,0006 (200 — 9)2, или, после алгебраических преобразований, v = 0,9573 + 0,14400 — 0,240002. (12.52) Пример 2.52. Требуется определить ускорение силы тяжести g по данным 14 наблюдений, результаты кото- рых приведены в табл. 3.52. Лабораторные данные были получены с помощью прибора с падающим грузом, в ко- тором отмечались положения груза в концах отрезков времени продолжительностью в 7зо сек. Таблица 3.52 t в еди- ницах 1/30 сек s см ui ч t в еди- ницах 1/30 сек SCM ui su* 1 11,86 -13 2 004 9 72,90 3 656 2 15,67 -11 1 896 10 85,44 5 2 136 3 20,60 — 9 1 669 11 99,08 7 4 855 4 26,69 — 7 1 308 12 113,77 9 9215 5 33,71 -5 843 13 129,54 11 15 674 6 41,93 -3 377 14 146,48 13 24 755 7 51,13 -1 51 8 61,49 1 61 2 910,29 0 65 500 Как известно, закон движения свободно падающего тела выражается формулой s = s0 + u0/ + -^-. (13.52) Так как независимая переменная t дана здесь с постоян- ным шагом, то можно перейти к новой переменной и, пользуясь формулами (8.52). Мы имеем
380 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ. VHT причем здесь h = V30 сек и /& =* 7/г. Отсюда . « . h । h 1 , и t = ** +_2 +"2 U ="4 + 60’ Подставив это значение t в (13.52) и располагая по сте- пеням и, получим 5 = («о + -^'+-^’) + (бо' + ’24о) н + т^о (И.52) Формула (14.52) показывает, что для определения g достаточно в интерполяционном многочлене s = ao + fliW + + a2U2 вычислить по способу наименьших квадратов лишь коэффициент tz2. Из табл. 1.52 находим, что а2 = а52Ф(-а<25р (15.52) поэтому в табл. 3.52 приведены данные лишь для вычис- ления Подставляя в (15.52) взятые из приложения округ- ленные значения а4= 1,395 • 10~3, а5 = 2,146 • 10-5, находим а2 = 2,146- 10~5• 6,550-104 — 1,395-10~3 • 9,103-102 = = 1,358-10~‘. Как видно из (14.45), a2=g/7200, откуда g = 7,2 - 103 - 1,358-10“’ « 977,8 см!сек2, что и являлось целью наших вычислений. Заметим, что большее число значащих цифр для ко- эффициентов а позволяет по тем же данным табл. 3.52 получить более точное значение g = 978,6 см)сек21). В рассмотренных нами примерах 1.52 п 2.52 суще- ственно использовалось то обстоятельство, что значения аргумента были даны с постоянным шагом. Если это условие не выполнено, то использованные нами приемы, облегчавшие вычисления, уже не могут быть применены. 9 Здесь необходимо вести вычисления с большим числом зна- ков, так как формула (15.52) содержит разность довольно близких величин.
§ 52] ПРИМЕРЫ 381 Однако и тогда путем подходящей замены аргумента можно в частных случаях несколько облегчить требуе- мые вычисления. Пусть значения аргумента t не являются равноотстоя- щими. Введем вместо t новую переменную u = t—t, при- няв t равным среднему арифметическому всех значений аргумента J //• При этом i 2«/ = 3^-«? = 3^-2^ = 0. (16.52) Если теперь приближать опытные данные многочле- ном первой степени у^ао + сци, то общая система (4.52) примет тот же вид, что и в слу- чае замены (5.52) па0 = 2 Уп 2 н? = 3 ЩУп т. е. мы получим опять-таки формулы (9.52) Разумеется, теперь числа щ не обязательно являются целыми. Так же ясно, что поскольку равенство (16.52) не распространяется вообще на суммы нечетных степе- ней и, то для коэффициентов приближающих многочле- нов более высоких степеней формулы, подобные (10.52), уже не получатся. Пример 3.52. В «Основах химии» Д. И. Менделеев приводит данные растворимости азотнонатриевой соли NaNO3 на 100 г воды в зависимости от температуры (табл. 4.52) и указывает, что эту зависимость можно выразить формулой у = 67,5 + 0,87/. Произведем вычисления, необходимые для проверки - 234 этого утверждения. Для этого заметим, что t=-g- =26, и введем новую переменную и по формуле u — t — F; то- гда у = + Все дальнейшие вычисления приведены в табл. 4.52.
382 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ VHI Таблица 4.52 i ч yi ui 4 и&1 1 0 65,7 -26 676 -1734,2 2 4 71,0 -22 484 -1562,0 3 10 76,3 -16 256 -1220,8 4 15 80,6 -11 121 -886,6 5 21 85,7 -5 25 -428,5 6 29 92,9 3 9 278,7 7 36 99,4 10 100 994,0 8 51 113,6 25 625 2840,0 ’ 9 68 125,1 42 1764 5254,2 2 234 811,3 0 4060 3534,8 Пользуясь формулами для aQ и аь находим а0 = 3534,8 ------ = 0,87, 4060 >\у. 811,3 ^ = -^- = —^-=90,1. 1 п 9 ’ Таким образом, искомая приближенная формула имеет вид (/ = 90,1 + 0,87и, или, переходя к старому аргументу /, у = 90,1 +0,87 (/-26), откуда у = 67,5 + 0,87/. § 53. Ортогональные многочлены Чебышева Рассмотренный выше способ наименьших квадратов для приближения наблюденных значений имеет следую- щий легко замечаемый недостаток. Предположим, что для полученных экспериментальных данных построен многочлен второй степени y = ao + aix + a2x2i коэффи*
§ 53] ОРТОГОНАЛЬНЫЕ МНОГОЧЛЕНЫ ЧЕБЫШЕВА 383 циенты которого вычислены по способу наименьших квадратов, но оказалось, что вычисленные с его по- мощью значения у сильно отличаются от наблюденных. В этом случае необходимо повысить степень многочлена, скажем, до третьей, т. е. искать уже многочлен вида у=aQ4-a i х 4- а2х2 4- азх3. Однако здесь требуется не только нахождение ко- эффициента а3, но и пересчет коэффициентов а0, аь а2, так как изменяется система уравнений, из которой они определяются. Способ Чебышева, изложению которого посвящены настоящий и следующий параграфы, позволяет значи- тельно упростить этот процесс. Приближающий много- член ищется здесь в виде суммы многочленов повышаю- щихся степеней, причем добавление новых слагаемых не изменяет коэффициентов при предыдущих. Прибавляя таким образом член за членом, можно видеть, как убывает сумма квадратов отклонений вели- чин, вычисленных по найденной формуле, от наблюден- ных значений. Тем самым значительно облегчается так- же и выбор степени приближающего многочлена. Пусть произведено п наблюдений, которые дали ре- зультаты: %п У\ У2 Уз Уп-\ Уп Будем искать’многочлен степени т с т+\ неизвест- ными коэффициентами а0, ..., ат, причем, как обыч- но, предполагается, что степень многочлена значительно меньше числа наблюдений. Суть способа Чебышева состоит в том, что прибли- жающий многочлен ищется не непосредственно в виде суммы степеней х, а в виде комбинации многочленов, которые выбираются специальным образом. Запишем искомый многочлен в виде у = а<№о(х) +«1ф1(х) 4-.. . + агпфт(х), (1.53)
384 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ. VIII где фо(х) = 1, ф1 (х) =х + <Х1, ...» и вообще ф/(х) есть мно- гочлен степени I вида ф/(х) = х/ + а(1)х/-1+ (2.53) со старшим коэффициентом, равным единице. Способ построения многочленов ф/(х) (/ = 0, 1,2»... ..., т) будет указан позже. Сперва, предполагая, что эти многочлены каким-то образом выбраны, займемся вопросом об отыскании наиболее вероятных значений коэффициентов aG, ат. Для этого по способу наименьших квадратов необходимо искать минимум функции п Ф = 2 [yt-ОоФоUi)-«1Ф1 U,)- ... -адр,п(х()]2. i = 1 Это приводит к системе уравнений (8.51), которую мы запишем теперь в развернутом виде. Так как на всем протяжении этого и следующего параграфов знак 2 означает суммирование от i=\ до i = n, то для простоты записи индексы суммирования писаться не будут: во 2 [фо (Xi)]2 + «1 2 Фо (х{) ф, (Xi) + + «2 2 Фо Ui) Фг Ui) + ... + am 2 Фо и>)фти<)= = 2iWoUi). «о 2 Фо U<) Ф1 U<) + «i2 Ui Ui)J2 + + «2 2 Ф1 Ui) Фг Ui) + ... + «т 2 Ф1 Ui^mUi)= = 2«/»Ф1 Ui). ....................................... во2фои()ф<и>)+«12ф1 и<)ф/и,)+ • • • + «г 2 [ф/Ui)]2 + ... +«т2ф;и/)фти1) = = 2 «/,Ф/ (xt), .. .................................... аь2 Фо Ui) Фт + «1 2 Ф1 (Xi) (Xi) + .., • •• + «т 2 [фт Ui)]2 = 2 У 1Фт Ui). (3.53)
§ 53] ОРТОГОНАЛЬНЫЕ МНОГОЧЛЕНЫ ЧЕБЫШЕВА 385 Решения системы (3.53) и будут наиболее вероятными значениями коэффициентов многочлена (1.53). Напомним, что выбор многочленов <р0(х), ...» срт(х) пока еще в нашей власти. Естественно произвести его так, чтобы система (3.53) для нахождения коэффициен- тов «о, ...» ат имела возможно более простой вид. Для этого будем подбирать эти многочлены таким образом, чтобы выполнялись условия 2 <Pz (*.) <Р* (*,) = о (l=£k\ 1 , г. (4.53) 2Ых;)]2^0 (/ = 0, 1, .... т). Последнее означает, что хотя бы в одной из точек х\, х2, Хп многочлен (р/(х) не равен нулю. Такие много- члены называются ортогональными многочленами Чебы- шева. При выполнении условий (4.53) в левой части каж- дого из уравнений системы (3.53) останется лишь по одному члену, так что мы можем сразу написать выра- жения для коэффициентов V f/.ф, (х.) = / = 0> Ь т. (5.53) 2[ф/(л;)]2 Остается убедиться в том, что условия (4.53) выпол- нимы, и найти выражения для ортогональных многочле- нов Чебышева при заданных точках Xi, х2, хп- Мы уже приняли (ро(х) = 1. Отсюда и из условия (4.53), положив в нем 1 = 0, k=l для многочлена cpi(x), получаем 2<Р1(Х;) = 0. (6.53) Так как, согласно (2.53), многочлен <pi(x)=x + ai, то (6.53) можно переписать в виде 2(xi + ai) = 0, откуда Xi + = 0, или си = — 4" S т. е. al противоположно по знаку среднему арифметиче* 25 Р. С. Гутер, Б. В. Овчинский
386 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ. VIH скому значений Xi, х2, ...» хп. Окончательно Ф1 (х) = х - 2 х{. (7.53) Для построения многочлена ф2(х) положим в (4.53) последовательно 1 = 0, k = 2 и затем I = 1, k = 2. Мы получим два уравнения: 2ф2'(х/)=о, /ос_ —, . (8.53) 2 Ф1 (х,) ф2 (Xj) = о. ДАногочлен ф2(х)—второй степени со старшим коэффи- циентом, равным единице. Поэтому его можно записать в виде ф2(х) = Ц + р2)ф1 (х) + у2фо(х). (9.53) Напомним, что фо(х)=1. Подставим выражение (9.53) в систему (8.53). Тогда 2 x&i (Xi) + р2 2 Ф1 (Xi) + пу2 = о, 2 Xi [ф1 (х,)]2 + Рг 2 [ф1 (хг)]2 + у2 2 Ф1 (Xi) = 0, или, учитывая (6.53), 2^Ф1 (х() + яу2 = 0, 2 Xi [ф1 (xz)]2 + р2 2 [Ф1 (X/)]2 = о. (10.53) Система (10.53) дает р2- т2=--5^Ф1(хД (11-53) 2[4>i(W п Тем самым найдены коэффициенты р2 и у2, а с ними и многочлен <р2(х). При вычислениях по формулам (11.53) надо только знать суммы степеней хг*. Действительно (при вычислениях учитывается, что 2ф1 (xz) = 0), 2 х,Ф1 (xz) = 2 Xt (xt + at) = 2 X2 + ai 2 Х(, 2[ф1(х/)]2=2(х/ + а1)ф1(х/) = 2х,ф1(х/), 2 X,. [ф, (xj]2 = 2 (X? + Ф1 (хг) = 2х? + + ctj 2 X? + а, 2 Х.Ф) (х(). Итак, многочлены фо(х), Ф1(х), ф2(х) уже построены.
§ 53] ОРТОГОНАЛЬНЫЕ МНОГОЧЛЕНЫ ЧЕБЫШЕВА 387 Выведем теперь рекуррентною формулу, позволяющую вычислять следующий многочлен по двум предыдущим. Этим и будет доказа- но существование всех многочленов ф(х). Установим прежде всего следующее простое предложение. Сумма 2 (xi) Равна нулю для всех k < г. Предполагая, что все многочлены ф0(х), ф1(х), ...» фг(х) по- строены, запишем их в виде фои)=1, Ф1 (х) = х + аь Ф2 (х) = х2 + а^х + а^, (13.53) <pfe (х) = xk + 1 + ... + \ Фг (х) = хг + а^хг 1 + ... + а^. Отсюда последовательно найдем х==ф1 (x)-a^o (х), X2 = ф2 (х) ~ а21)(Р1 (*) + (а2’«1 - «22))фо <*)> В результате xh выразится в виде линейной комбинации многочле-» нов ф0(х), Ф1(х), •••, Фа(х) с постоянными коэффициентами: xft = ф^(х) + ^-1фА-1(х)+...Ч-6офо(х) (коэффициент при фь(х) всегда равен единице). Но тогда 2 xi4r (xi) = 2 Фа (х.) Фг (Xi) + bk-l 2 ФА-1 (xi) Фг (Xi) + • • • ... +6о2фо(х()Фг(хО = ° в силу определения функций ф(х) (см. 4.53). Отсюда сразу следует, что если ф(х) — произвольный многочлен степени <г, то Зф(Х;)Фг(*г)’О. (14.53) Докажем теперь, что многочлен фг+1(х) можно представить рекуррентной формулой фг+1(х) = (х + рг+1)фг(х) + Уг+1Фг-1 (х), (15.53) и выведем формулы для вычисления коэффициентов pr+i и у г-н- Пре- жде всего ясно, что фг+1(х)—многочлен степени г + 1 со старшим коэффициентом единица. Затем, если k < г— 1, то 2 Фа (х<) Фг+1 (*<) “ 2 (х> + ₽г+1) Фа (х>) Фг (xi) + + Yr+i 2 Фа (х.) Фг-1 (х.)=,° 25*
388 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ VHT в силу (14.53), так как (х + рг+1)фА (х) — многочлен степени не выше г. Поэтому должны выполняться только два условия: 2 Фг-1 (*/) Фг+1 (*/) “ 5 Х/Фг-1 (Xi) Фг (*г) + Yr+1 S [Фг-1 О/)]2 =0> 3 Фг (хг)Фг+1 (х<) = 2 Х1 [Фг (*/)]2 + Рг+1 3 [Фг (X)]2 = °- Отсюда Тем самым найдены коэффициенты р? + 1 и угм» а с ними и много- член срг+1(х). Ясн°, что формулы (1153) являются частным случаем формул (16.53) при г — \. Вычисление по формулам (16.53) опять-таки сводится к вычис- лению сумм степеней хь Учитывая формулы (13 53) и равенство (14.53), найдем 2[Фг(^)]2-2х/Фг(х/)= -2И+<4п2И-' +... + 2 Х<Фг -1 (X) Фг “ S *(Фг (X)' 2 xi [Фг (*<)]2=5 (<+1 + «г1 X) Фг (*<) = Z xir+l + + «2° S + • • • + X 2 <+' + «г ’ 2 Х>г (*,)• | (17.53) Ясно, что формулы (12.53) получают из (17.53) при г == 1. Вычисле- ния особенно упрощаются, если значения х, образуют арифметиче- скую прогрессию (таблица с постоянным шагом). Полагая и =» «= х — Xi, получим П1 = 0, и2 = h, ..., ип = (п — l)h. Тогда Суммы степеней натуральных чисел могут быть заранее вычислены для различных значений п ’)• Если таблица не с постоянным шагом, то удобно выбрать новую переменную и — х—х. Тогда 2 Ui 2 Xi — пх*=®. Кроме того, при этом облегчается вычисление сумм степеней Ui. 9 Подобного рода таблицы приведены в книге: В. Хоти мск и й, Выравнивание статистических рядов по методу наименьших квад- ратов, М., Госстатиздат, 1959.
§ 54] ПРИБЛИЖЕНИЕ ФУНКЦИЙ ПО СПОСОБУ ЧЕБЫШЕВА 389 § 54. Приближение функций по способу Чебышева Итак, мы установили, что при заданных точках хь *2, ...» хп ортогональные многочлены Чебышева могут быть последовательно построены. Если теперь искать приближающий многочлен в виде V^oTo(x) +ai<pi(x) +...4-атфт(х), (1.54) то, как было установлено в предыдущем параграфе, наиболее вероятные значения коэффициентов aQl ... ат находятся по формулам = (г = °, 1, 2, ..(2.54) Вычисление знаменателя этой формулы производится согласно (17.53), числитель же вычисляется с помощью сумм вида 5//,х^ S y^r (xi) = s УМ + а'1* 3 УМ~1 + ... + <> 3 yt. (3.54) Если приближение (1.54) уже построено, т. е. много* члены ф0(х), •••» ф?и(х) и коэффициенты aQl а,\, ..., найдены, но точность его нас не удовлетворяет, то нужно найти следующий член: я,п+1фт-н (х). Для этого по фор* мулам (15.53) и (16.53) строим многочлен фт+1 (х) и по формуле (2.54) вычисляем коэффициент Отметим еще, что сумма квадратов уклонений может быть вычис* лена так: п Г т 12 S У, - 3 аг(?г (х<) = i-1 L /=0 J п tn п т п у&М + 3 сГг 2 [фг (хг)]2. (4.54) ;=0 t = l г = 0 / = 1 Пример 1.54. Рассмотрим теперь пример прибли- жения по способу Чебышева. Будем искать многочлены первой и второй степени, приближенно выражающие за* висимость между х и у по значениям, приведенным в табл. 154. Здесь же мы приводим нужные для вычисле- ний степени х и произведения.
Таблица 1.54 xi У1 z2 4 х1&1 4^ 4 0,15411 19,47 0,02375 0.00366 0,00056 3.00052 0,46241 379,08 0,19516 21,83 0,03809 0,00743 0,00145 4,26034 0,83150 476,55 0,22143 23,11 0,04903 0,01086 0,00240 5,11725 1,13308 534,07 0,28802 26,11 0,08296 0,02389 0,00688 7,52020 2,16609 681,73 0,32808 - 27,60 0,10764 0,03531 0,01159 9,05501 2,97086 761,76 0.38183 28,89 0,14579 0,05567 0,0212.5 11,03107 4.21187 834,63 0,45517 33,17 0,20718 0,09430 0,04292 15,09799 6,87216 1100,25 0,57012 33,38 0,32504 0,18531 0,10565 19,03061 10,84984 1114,22 0,75930 32,31 0,57654 0,43777 0,33240 24,53298 18,62801 1043,94 0,91075 31,88 0,82947 0,75544 0,68802 29,03471 26,44350 1016,33 1,13895 25,46 1,29721 1,47746 1,68275 28,99767 33,02697 648,21 2 5,40292 303,21 3,68270 3,08710 2,89587 156,67835 107,59629 8590,77 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ. VIII
§ 54] ПРИБЛИЖЕНИЕ ФУНКЦИЙ ПО СПОСОБУ ЧЕБЫШЕВА 391 I. Построение многочлена первой стея пени Так как n= 11, то по формуле (7.53) . . 5,40292 п ф! (х) = х---j-j— = х — 0,49117. Значит, <Х1 = — 0,49117. По формуле (2.54) Угл 303,21 aQ = = —и— = 27,5645. ° п 11 Для определения сначала по формуле (12.53) на- ходим 2 [Ф1 (а)]2=2 2 х(= = 3,68270 4-(- 0,49117). 5,40292= 1,02895 и по формуле (3.54) 2 ^Ф1 (xt) = 2 УЛ + сц 2 yi = = 156,67835 + (- 0,49117) • 303,21 = 7,75069. Тогда 7,75069 _ а* 1,02895 7,5326. Таким образом, многочлен первой степени для экспе- риментальных данных табл. 1.54 имеет вид у=27,5645 + 7,5326 <р, (х) = 27,5645 + 7,5326 (х—0,49117), или окончательно у = 23,8647 + 7,5326х. II. Построение многочлена второй степени Перейдем теперь к отысканию приближающего мно- гочлена второй степени. Для этого нужно найти выра- жение для многочлена <рг(^) и коэффициента а2. Сна- чала вычисляем Рг и у2- Для этого по формулам (12.53) находим 2х<Ф1(х1) = 2[ф1 (х,)]2= 1,02895 (эта сумма уже вычислена), 2 Xi [<р, (xz)]2 = 2 -Г? + ctj 2 xf + “1 2 *,Ф1 (а) = 3,08710 + + (- 0,49117) • 3,68270 4- (- 0,49117) • 1,02895 = 0,77288.
392 СПОСОБ НАИМЕНЬШИХ КВАДРАТОВ [ГЛ. VIII Тогда, согласно (11.53) ₽2 = ~ ^02895 ~ 0,75113’ Y2 ------ГГ~ = “ °’09354- Многочлен ф2(х) имеет поэтому вид ф2 (х) = (х — 0,75112) (х — 0,49117)— 0,09354 = = х2 — 1,24230x4-0,27539. Остается определить коэффициент а2 по формуле (2.54). По (3.54) получаем 2^ф2(ч)= 107,59629- 1,24230 • 156,67835 + 4- 0,27539 • 303,21 = - 3,54422. Далее, по формуле (17.53) 2 [ф2 Сч)]2 = 2,89587 - 1,24230 • 3,08710 4- = 0,27539 • 3,68270 = 0,07495. Итак, для а2 находим значение 3,54422 0,07498 = 47,24/67. Таким образом, приближающий многочлен второй сте* пени равен у = 27,5645 4- 7,5326 <рi (х) — 47,28779 ф2 (х). Подставляя сюда вычисленные выражения для Ф1(х) и ф2(х), будем иметь у = 27,5645 + 7,5326 (х — 0,49117) — —47,28779 (х2 — 1,2423x4-0,27539) или, произведя алгебраические преобразования, у = 10,84213 4- 66,27822х — 47,28779х2. Чтобы оценить, насколько хорошо найденные многочле- ны приближают опытные данные, проще всего восполь- зоваться средними квадратичными отклонениями. Под- считав значения многочленов первой и второй степени и определив суммы квадратов отклонений, найдем, что для многочлена первой степени она равна 175, тогда как для многочлена второй степени — всего 7. Если считать точ- ность, достигнутую многочленом второй степени, недо- статочной, то можно подбирать далее многочлен третьей степени и т. д.
ГЛАВА IX ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ УРАВНЕНИЯМИ. ЭМПИРИЧЕСКИЕ ФОРМУЛЫ § 55. Вводные замечания Количественное изучение различных процессов и яв- лений чаще всего приводит к рассмотрению дифферен- циальных уравнений. Их решения, описывающие инте- ресующий нас процесс или явление, содержат постоян- ные, которые могут быть определены по результатам опыта/ Например, изучение закона свободного падения тела (в пустоте) приводит к дифференциальному уравнению d2s решение которого s = so + ^o + -4f- представляет собой закон движения свободно падаю- щего тела. Эта функция содержит постоянную g —-уско- рение силы тяжести, значение которой может быть опре- делено из опытных данных1). Такая задача рассматри- валась уже нами в § 52. Таким образом, мы имеем дело со следующей зада- чей: функциональная зависимость между переменными величинами х и у задана, исходя из тех или иных теоре- тических соображений. Формула, выражающая эту за- висимость, содержит постоянные, которые необходимо определить по результатам наблюдений. По сути дела, предыдущая глава была посвящена решению именно этой задачи лишь в том предположении, j) То же может относиться и к значениям s0 и vq.
394 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ. IX что функциональная зависимость имеет вид много- члена. Поэтому рассмотрение случаев, когда зависи- мость между хну выражается не многочленом, будет представлять для нас особый интерес. Правда, как уже известно из гл. II, любую функцию можно с достаточной степенью точности заменить (ин- терполяционным) многочленом. Однако, чтобы добиться достаточно хорошего совпадения, может потребоваться рассмотрение многочлена сравнительно высокой степени. Не говоря уже о том, что такой многочлен будет не- удобен в обращении ввиду его громоздкости, коэффи- циенты такого многочлена могут и не иметь физического смысла. Мы рассмотрим применение способа наименьших квадратов и некоторых более простых способов (даю- щих, правда, менее точные результаты) для определения постоянных в формулах различных видов. Нередко при обработке результатов наблюдений при- ходится встречаться и с более сложной задачей: в ре- зультате наблюдений получен ряд значений переменных х и у, однако характер функциональной зависимости между ними остается неизвестным. Требуется по наблюденным данным найти аналитическое выражение зависимости между х и у. Такие формулы принято на- зывать эмпирическими формулами. После того, что было сказано в § 12 гл. II, должно быть совершенно ясно, что однозначно восстановить функциональную зависимость между х и у по конеч- ному числу измеренных значений было бы невозможно даже в том случае, если бы они и не обладали ошибками, свойственными наблюденным величинам. Тем более не следует ожидать, что это удастся сде- лать, имея в своем распоряжении экспериментальные данные, наверняка содержащие случайные ошибки из- мерений. Следует поэтому отчетливо представлять, что мате- матическая обработка результатов наблюдений не мо- жет ставить перед собой задачу разгадать истинный ха- рактер зависимости между имеющимися переменными, а занимается задачей значительно более скромной. Речь идет лишь о том, чтобы охватить результаты опыта Наи-
§ 56] ПРЕДСТАВЛЕНИЕ ЛИНЕЙНЫМИ ФУНКЦИЯМИ 395 более простой формулой, которая давала бы возмож- ность производить интерполирование. Это в свою оче- редь позволит применить к наблюденным данным ме- тоды математического анализа. § 56. Представление наблюденных данных линейными функциями В настоящем параграфе мы рассмотрим представле- ние наблюденных данных с помощью линейной функции. В соответствии с сформулированными в § 55 задачами, если наличие именно линейной зависимости следует из теоретических соображений, то для представления по- лученных данных линейной функцией остается лишь определить коэффициенты а и Ь в уравнении у — ах + Ь. Если же заранее вид зависимости неизвестен, то пре- жде всего следует решить вопрос о том, насколько урав- нение вида у = ах + Ь подходит для изображения наблю- денных данных. Самым простым способом убедиться в том, имеет ли смысл подбирать для наблюденных данных линейную функцию, является графический. Нанесем данные опыта на график, который удобнее всего строить на миллимет- ровой бумаге. Расположение точек вблизи прямой пока- жет, что наблюденные опытные данные можно изобра- жать линейной функцией. Если это так, то остается лишь определить коэффициенты а и Ь. Наиболее выгодным и точным способом определения коэффициентов является способ наименьших квадратов. Поскольку он был подробно изложен в предыдущей гла- ве, мы рассмотрим здесь два других способа, дающих несколько менее точные результаты, но значительно бо- лее простых. Способ натянутой нити основан на геометрическом подборе прямой на глаз. Нанеся наблюденные значения на миллиметровку, подбираем графически прямую, ближе всего подходящую к наблюденным точкам. Выбрав две произвольные точки на этой прямой1) (не 1) Ввиду этого способ нередко называют также способом вы- бранных точек.
396 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ. IX обязательно являющиеся наблюденными значениями), определяем их координаты (хь у\), (х2, у2). Тогда для определения коэффициентов а и b получаем два простых уравнения: ах\Л-Ь=у{, ах2 + Ь = у2. (1.56) Способ средней не требует графического изображе- ния экспериментальных данных и состоит в следующем. Пусть наблюденные значения даны в табл. 1.56. Таблица 1.56 X *1 х2 . . . Хп — 1 хп У 1/1 У 2 //з . . . Уп-\ Уп Даже в том случае, если между х и у теоретически установлена линейная зависимость у = ах + Ь, наблюден- ные значения г/г будут отличны от axt + b вследствие на-* личия экспериментальных ошибок. Обозначим через Д2- соответствующую ошибку Дг==£/г — — Ь (l=l, 2, ..., п) . Если выбирать параметры а и b так, чтобы для всех п п наблюдений ошибки уравновешивались, т. е. 2 = О, i = 1 то это привело бы нас к одному уравнению, тогда как для нахождения коэффициентов а и b их требуется два. Поэтому мы предположим, что уравновешивание про- исходит не только для всех произведенных наблюдений в целом, но и для каждой группы, содержащей половину (или почти половину) всех наблюдений, в отдельности. В таком случае мы придем к системе уравнений, которая может быть записана следующим образом; т . п 2 (yt — ах( — Ь) = 0, 2 (у, — aXi — b)= О, x=»I Z«m+l где число т, означающее число наблюдений в первой группе, может быть выбрано произвольно. Обычно его
§56] ПРЕДСТАВЛЕНИЕ ЛИНЕЙНЫМИ ФУНКЦИЯМИ 397 выбирают так, чтобы число наблюдений во второй груп- пе равнялось также т, если п четно, и /и±1, если п не- четно. Полученную систему для определения коэффи- циентов а и Ь запишем в виде т т Л 2 = S yh i = l i=l n n a 2 Xi + (n — tn) b~ 2 y(. i=m+l i^m + 1 (2.56) Рассмотрим теперь некоторые примеры применения этих двух способов. Пример 1.56. В качестве первого примера возьмем уже рассматривавшийся в предыдущей главе пример Менделеева (см. пример 3.52) зависимости растворимо- сти азотнонатриевой соли от температуры. Данные опыта приведены в табл. 2.56. Таблица 2.56 0 4 10 15 21 29 33 51 4 68 У1 66,7 71,0 76,3 80,6 85,7 92,9 99,4 113,6 125,1 Нанеся эти данные на график, получим точки, распо- ложенные довольно близко от прямой (рис. 50). Прове- дем на глаз прямую, как на рис. 50, и выберем на ней точки М и N. Координаты этих точек (15; 80) и (55; 115). Следовательно, система (1.56) примет вид !5а + 6 = 80, 55а + 6=115, 35 откуда a=4Q-=0,88; 6 = 66,8. Уравнение прямой, полу* ценной по способу натянутой нити, будет поэтому у = 0,88/ + 66,8. (3.56) Найдем теперь уравнения этой прямой по способу средней. Для этого разобьем все наблюдения на две группы, отнеся к первой пять и ко второй четыре наблю- дения, т. е. положим т = 5. Система (2.56) в этом случае даст 50а + 56 = 380,3, 184а + 46 = 431,0.
398 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ IX Решая систему, находим I 380,3 5 _ I 431,0 4 50 5 184 4 I 50 380,31 , 184 431,0 „„ о Ь =-----Г720-----=67’3> Таким образом, способ средней дает прямую у = 0,88/ + 67,3. (4.56) Как мы уже видели в примере 3.52, способ наимень- ших квадратов дает для этих данных прямую г/= 0,87/-Ь 67,5. (5.56) Для того, чтобы сравнить полученные данные, опре- делим сумму квадратов отклонений от эксперименталь- ных данных величин у, полученных по формулам (3.56), * (4.56) и (5.56). Вычисления и их результаты приведены в табл. 3.56. При этом у\ есть значение у, полученное по способу натянутой нити (формула (3.56)), у2 получено по способу средней и у$— по способу наименьших квадратов. Как и следовало ожидать, сумма квадратов отклонений бу-
§ 56] ПРЕДСТАВЛЕНИЕ ЛИНЕЙНЫМИ ФУНКЦИЯМИ 399 Таблица 3.56 О* ^набл 1 1 X 55) 1 X 1 со 1 X й'. сч 1 X <N О» 1 сч со 1 X 0 66,7 66,8 67,3 67,5 -0,1 -0,6 -0,8 0,01 0,36 0,64 4 71,0 70,3 70,8 71,0 0,7 0,2 0 0,49 0,04 0 10 76,3 75,6 76,1 76,2 0,7 0,2 0,1 0,49 0,04 0,01 15 80,6 80,0 80,5 80,6 06 0,1 0 0,36 0,01 0 21 85,7 85,3 85,8 85,8 0,4 -0,1 -0,1 0,16 0,01 0,01 29 92,9 92,3 92,8 92,7 0,6 0,1 0,2 0,36 0,01 0,04 36 99,4 98,5 99,0 98,8 0,9 0.4 0,6 0,81 0,16 0,36 51 113,6 111,7 112,2 111,9 1,9 1,4 1,7 3,61 1,96 2,89 68 2 125,1 126,6 127,1 126 7 -1,5 -2,0 -1,6 2,25 8,54 4,00 6,59 2,56 6,51 дет наименьшей для значений у. полученных по способу наименьших квадратов. Пример 2.56. Для изучения зависимости электри* ческого сопротивления меди от температуры производи* лись измерения сопротивления медного стержня диа- метром 0,93 см и длиной 77,60 см. Результаты измерений приведены в табл. 4.56, где С означает температуру в градусах Цельсия, а г — сопротивление в микроомах. Таблица 4.56 С 19,1 25,0 30,1 36,0 40,0 45,1 50,0 г 76,30 77,80 79,75 80,80 82,35 83,90 85,10 Нанесем полученные результаты на график (рис. 51). Для способа натянутой нити выберем точки М (20; 76,5) и W (48; 84,6). Подставляя эти значения в формулу г = аС + &, находим 20а + b = 76,5, 48а + Ь = 84,6. Решение системы а = 0,289, 6 = 70,72 дает уравнение г = 0,289С + 70,72. (6.56)
400 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ. IX Перейдем к рассмотрению способа средних. Отнесем к первой группе 4 наблюдения. Тогда, согласно (2.56), 110,2а+ 46 = 314,65, 135,1а-Ь 36 = 251,35. Решая систему, находим 314,65 4 2а 1,35 3 n QnQ 135,1 3 I 110,2 314,65 . _ I 135,1 251,35 ° “ - 209,8 “ = 70,59, так что способ средних дает уравнение прямой и = 0,293С + 70,59. (7.56) Найдем теперь ли- Рис- нейную функцию по способу наименьших квадратов. Для этого, как указывалось в предыдущей главе, целесообразно вместо С ввести новую переменную п и, связанную с С соотношением = С, — — С{. i = 1 п В нашем случае ~ Ct = 35,04, так что щ = Ci — 35,04. Х = 1 Результаты вычислений приведены в табл. 5.56. Для уравнения г = аи + Ь по формулам § 52 гл. VIII получаем п п 2 uirl j? ri = = 7Ж = 0’288’ b = Чг = = 80>86> 2 u'i
§ 56] ПРЕДСТАВЛЕНИЕ ЛИНЕЙНЫМИ ФУНКЦИЯМИ 401 Таблица 5.56 i Ci ri ui uiri 1 19,1 76,30 -15,95 254,08 -1216,22 2 25,0 77,80 -10,04 100,80 -781,11 3 30,1 79,75 -4,94 24,40 -393,96 4 36,0 80,80 0,96 0,92 77,57 5 40,0 82,35 4,96 24,60 408,46 6 45,1 83,90 10,06 101,20 844,03 7 50,0 85,10 14,95 223,80 1273,10 2 245,3 566,00 0 729,80 211,87 так что г = 0,290^ + 80,86. Подставив сюда и = С — 35,1, найдем г = 0,290С + 70,68. (8.56) Как и для предыдущего примера, произведем сравне- ние опытных данных с полученными по формулам (6.56), (7.56) и (8.56). Относящиеся сюда вычисления приво- дятся в табл. 6.56. Таблица 6.56 C r ri Г — fl G'—Tj)2 Гг r-rz (Г-Г2)2 Гз r — <3 O’ — гэ>» 19,1 76,30 76,24 0,06 0,0036 76,19 0,11 0,0121 76,26 0,04 0,0016 25,0 77,80 77,95 -0,15 0,0225 77,92 -0,12 0,0144 77,96 -0,16 0,0256 30,1 79,75 79,42 0,33 0,1089 79,41 0,34 0,1156 79,43 0,32 0,1024 36,0 80,80 81,12 -0,32 0,1024 81,14 -0,34 0,1156 81,13 -0,33 0,1089 40,0 82,35 82,28 0,07 0,0049 82,31 0,04 0,0016 82,29 0,06 0,0036 45,0 83,90 83,75 0,15 0,0225 83,80 0,10 0,0100 83,75 0,15 0,0225 50,0 2 85,10 85,17 -0,07 0,0049 0,2697 85,24 -0,14 0,0196 0,2889 85,16 -0,06 0,0036 0,2682 При этом, как и раньше, г2, означают сопротив- ления, вычисленные соответственно по формулам (6.56), (7.56) и (8.56), т. е. по способам натянутой нити, сред- ней и наименьших квадратов. Вычисления показывают, что для данного примера все три способа дают почти одинаковое приближение. 26 Р- С. Гутер, Б. В Овчинский
402 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ. IX § 57. Функциональные шкалы и их применение Рассмотрим функцию y=f(x), непрерывную и моно- тонную на некотором замкнутом интервале [я, ft]. Возь- мем ось ОМ, на которой будет строиться шкала, выбе- рем на ней точку отсчета и установим определенный масштаб ц. Функциональная шкала функции f(x) строится теперь следующим образом. Разбив интервал [я, ft] на равные части, вычислим значение функции f(x) в каждой из точек деления, включая начало и конец отрезка, и отложим на оси ОМ отрезок pf(x). Получающаяся при этом точка снаб- жается отметкой х, т. е. откладывается в выбранном масштабе значение функции, а надписывается значение " аргумента (рис. 52). Иногда начало шкалы помещают в точку отсчета, т. е. точку с надписью а совмещают с точкой О. Тогда точка х будет находиться в 7------2---X—"" ""о м конце отРезка Mfw — f(a)]- Полученная шкала по- Рис. 52. зволяет судить о поведении функции на рассматривае- мом участке. Так, если функция возрастает, то надписи на шкале будут возрастать в положительном направле- нии на оси, а если убывает — в противоположном; боль- шие промежутки между отметками укажут, что функция возрастает быстрее, чем там, где эти промежутки малы, и т. п. Если наряду с функциональной шкалой построить также равномерную шкалу с отметками, содержащими истинные длины отложенных отрезков, то такую шкалу Можно использовать для нахождений значений функции или значений обратной функции. Точность этих значе- ний, естественно, определяется выбором масштаба и числа точек деления. Построим для примера функциональную шкалу для функции у = х2 на отрезке [1,2]. Выбрав масштаб ц, мы определим тем самым длину получающейся шкалы. Чаще поступают наоборот: задавшись заранее длиной шкалы /, определяют отсюда масштаб, что оказывается более
§ 57] ФУНКЦИОНАЛЬНЫЕ ШКАЛЫ И ИХ ПРИМЕНЕНИЕ 403 Таблица 1.57 X 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 X2 1,00 1,21 1,44 1,69 1,96 2,25 2,56 2,89 3,24 3,61 4,00 х2 — 1 0,00 0,21 0,44 0,69 0,96 1,25 1,56 1,89 2,24 2,61 3,00 2 (х2 — 1) в см 0,00 0,42 0,88 1,38 1,92 2,50 3,12 3,78 4,48 5,22 6,00 удобным. Длина шкалы I и масштаб р связаны соотно- шением |ы[/(6)—f («)] = /. В нашем случае f(a)=f(l) = lt f(b) =f(2) =4, поэтому, выбрав /=6 см, найдем р, = 2 см* Для построения шкалы разобьем отрезок [1,2] на де- сять частей и вычислим значения функции во всех точках деления, а затем подсчитаем длины отрезков, которые надо откладывать в выбранном масштабе. Все вычисле- ния приведены в табл. 1.57. Перенеся полученные ре- зультаты на чертеж, получим функциональную шкалу для функции у~х2 (рис. 53). Здесь начало шкалы как раз совпадает с точкой отсчета __|_______,--------1---(---,----- /,/ 12 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 Рис. 53. На рис. 54 изображена та же функциональная шкала, дополненная равномерной шкалой (сверху). По ней можно находить значение х2 для 1<Сх<^2. Для этого 1fl 1р 1,6 1,9 2,2 2J5 2JB 3,1 Зр 3,7 h P i И 1 11 11— 1 । L--t 1 ] Ifl р 1,21,3 ip 1,5 ip ip 1 fl ip гр Рис. 54. следует найти х на нижней шкале и прочесть значение на верхней шкале, в случае необходимости интерполируя на глаз. Эта же шкала может быть использована для 26*
404 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ (ГЛ. IX нахождения значений Ух при 1 <х<4. Для этого сле- дует найти х на верхней шкале и прочесть значение на нижней. Хорошо известным примером функциональной шкалы является основная шкала логарифмической линейки. Она представляет шкалу, построенную для функции у = = lgx на участке l^x-^Ю. Масштаб совпадает здесь с Длиной линейки, так как 1g 10 = 1. Чаще всего берет- ся ц = 25 cnz. Иногда встречаются также маленькие ли- нейки с р = 15 см или, наоборот, большие, у которых ц — 50 см. Для нахождения значений логарифмов чисел (лога- рифмирования) линейка снабжена, кроме логарифмиче- ской шкалы, равномерной шкалой, которую обычно по- мещают в самом низу линейки. Логарифмирование и потенцирование производятся с помощью этой пары шкал так же, как возведение в квадрат и извлечений корня по шкале квадратов, описанное выше. Функциональные шкалы находят широкое примене- ние при обработке экспериментальных данных благо- даря тому, что графики многих функций могут быть спе- циальным подбором функциональных шкал преобразо- ваны к прямолинейному виду. Познакомимся сначала с некоторыми примерами. Пример 1.57. Рассмотрим уравнения парабол: а) у = х2, б) у » Зх2 + 25, в) у = —х2/2 + 50. Построим теперь на оси Оу обычную равномерную шка- лу, а на оси Ох — функциональную шкалу квадратов. Тогда получится сетка, изображенная на рис. 55. По- строение такой шкалы эквивалентно замене переменных х2==£. Поэтому в новых координатах уравнения парабол будут иметь следующий вид: а) У = 1 б) «/=3^4-25, в) «/==—у£ + 50, т е. будут уравнениями первой степени, а значит, будут нюбражаться прямыми. Эти прямые изображены на рис. 55. Кооординатные сетки, построенные с помощью функ- циональных шкал, называют функциональными сетками^
§ 57] ФУНКЦИОНАЛЬНЫЕ ШКАЛЫ И ИХ ПРИМЕНЕНИЕ 405 Легко убедиться, что вообще парабола у = ах2 + Ь (1.57)’ путем построения функциональной сетки с нормальной шкалой на оси Оу и шкалой квадратов на оси Ох преоб* разуется в прямую линию с уравнением & = (2.57)’ где g=»x2. Очевидно, что такого рода преобразования возможны в гораздо более общем случае. Именно, всякая неявная функция, заданная соотношением вида аф(х) + &ф(у) + с = 0, (3.57)‘ где а, &, с — постоянные, будет изображаться прямой ли* нией на функциональной сетке, где на оси Ох построена шкала функции ср(х), а на оси Оу — шкала функции ty(y). Разумеется, функции ф(х) и ф(у) должны удовле* творять условиям, нужным для возможности построения функциональных шкал (непрерывность и монотонность). Особенно часто используются различные логарифми- ческие сетки, с помощью которых можно «выпрямлять» графики степенных и показательных функций. Если
406 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ IX зависимость между х и у задается уравнением у = аеЬх, (4.57) то логарифмирование его дает \gy={b\ge)x+\ga. (5.57) Полагая lg//=K, lga=y4, b lge = B, запишем уравнение (5.57) как У=Л+Вх, (6.57) откуда видно, что, оставив равномерную шкалу на оси Ох и построив на оси Оу логарифмическую шкалу, мы изобразим функцию (4.57) прямой линией. Описанная выше сетка называется полулогарифмиче- ской. Логарифмической называется функциональная сет- ка, у которой на каждой из осей Ох и Оу построена лога- рифмическая шкала. На такой сетке графики степенных функций изобразятся прямыми линиями. Действительно, если у = ах\ (7.57) то lg!/ = lga + 6 1g*- (8.57) Полагая теперь 1g у = У, lga = /l, lgx=X, запишем урав- нение (8.57) в виде У = А + ЬХ, откуда и вытекает наше утверждение. Обычно такие сетки бывают заготовлены заранее. Бумага с нанесенными сетками получила название по- лулогарифмической и логарифмической бумаги. Пример 2.57. Построим на полулогарифмической бумаге график функции z/ = 2ex. Вследствие уравнений (5.57) и (6.57) на полулогарифмической бумаге этот график изобразится прямой линией, для проведения ко- торой достаточно двух точек. Найдя значения функции для х = 0 и х=1, построим график, изображенный на рис. 56. Из сказанного вполне ясна роль функциональных сеток при обработке данных наблюдений. Если резуль- таты наблюдений, нанесенные в виде точек на обычных равномерных сетках, достаточно хорошо приближаются прямой линией, то ее коэффициенты легко находятся с
§ 57] ФУНКЦИОНАЛЬНЫЕ ШКАЛЫ И ИХ ПРИМЕНЕНИЕ 407 помощью способов, описанных ранее. Если же эти на- блюдения располагаются вблизи кривой, то по имею- щемуся, обычно ограниченному, участку кривой очень трудно судить, какого ти- па функцией ее лучше всего приближать, сле- дует ли брать параболу у = ах2 + Ьх + с, гипербо- , ь лу , степенную функцию у = ахъ, показа- тельную у = аеЬх или еще какую-либо другую. Переведя полученные экспериментальные дан- ные на ту или иную функ- циональную сетку, мы по- лучаем возможность су- дить, на какой из них эти данные ближе всего под- ходят к прямой, а значит, и о том, какую из формул следует выбирать для приближения. После того как выбран вид форму- Рис. 56. лы, остается найти коэффициенты, что можно сделать уже известными приемами. Приведем некоторые общие соображения о нахож- дении коэффициентов. Предположим, что зависимость имеет вид y = af(x)+b, (9.57) где f(x)—известная функция, а и b — коэффициенты, подлежащие определению по данным опыта. Такой вид зависимости может быть выбран из теоретических сооб- ражений или же тем, что при построении графика на функциональной сетке наблюденные значения близко подходят к прямой линии. Так или иначе, положив f(x)=X и построив соответ- ствующую функциональную сетку (равномерная шкала на оси Оу, шкала /(х) на оси Ох), приведем уравнение
408 ПРЕДСТАВЛЕНИЕ наблюденных данных (ГЛ. IX (9.57) к виду у = аХ + Ь. (10.57) Способ натянутой нити, как и ранее, состоит в том, что на данной сетке проводится на глаз прямая, наилучшим образом приближающая полученные из на- блюдений значения. Возьмем на этой прямой две про- извольные точки, по возможности далеко отстоящие друг от друга и не обязательно относящиеся к наблюденным значениям. Если их координаты будут (Хь у}) и (Х2, у^), то для определения коэффициентов а и Ь получаем два уравнения: у\ = аХ\ + 6, у2 =* аХ2 + Ь. Для применения способа средних нет необхо- димости переходить к переменной X. Разбивая наблю- денные значения на две равные (или почти равные) группы, получим систему уравнений, аналогичную (2.56), т п 2 Жх() +&-//,] = (), 2 [а/ (х<) + b - z/J = 0, Z-l i~m + l или, раскрыв скобки, т т а 2 f(Xi) + mb = 2 Уь / —1 Z=1 п а а 2 f Ui) + (n - m) b = 2 Vi- ЧП.57) Кроме функций вида (9.57), можно рассматривать функции и более общего вида z/=ofi(x)+i>f2(x). (12.57) Разделив обе части равенства (12.57) на /2(х), запишем его в виде _JL_ = a /2 (х) к (*) + °' fl (х) хг У ХГ = Х и = можем пере™- (12.57) как У = аХ + откуда видно, Полагая теперь сать уравнение что в такой функциональной сетке зависимость изобра- зится прямой линией.
§ -81 НАХОЖДЕНИЕ КОЭФФИЦИЕНТОВ СТЕПЕННЬЬХ ФУНКЦИЯ 409 Способ натянутой нити применяется в этом случае без всяких изменений. Что касается способа средней, то ясно, что вместо системы (11.57) для отыскания коэф- фициентов а и b получим систему Высказанные здесь общие соображения будут ис- пользованы и проиллюстрированы в следующих пара- графах применительно к конкретным видам уравнений. § 58. Нахождение коэффициентов для степенных функций Формулу вида у = а + Ьхт (1.58) с заданным показателем степени т можно привести к линейному виду, построив на оси Ох функциональную шкалу для функции X = хт. Рассмотрим примеры оты- скания коэффициентов а и Ь по способу средней. Пример 1.58. Для падения парашюта в воздухе по- лучены следующие результаты наблюдений зависимости между его скоростью v (м/сек) и давлением на поверх- ность парашюта р(кг/см2) (табл. 1.58). Нанеся на гра- фик (рис. 57) полученные данные, заметим, что они су- щественно уклоняются от прямой. Попробуем подобрать Таблица 1.58 V Р V2 ^выч 2,40 0,0141 5,76 0,0131 3,50 0,0281 12,25 0,0280 5,00 0,0562 25,00 0.0572 6,89 0,1125 47,47 0,1086 10,00 0,2250 100,00 0,2289
410 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ. IX для этих точек параболу вида p = a + bv2 (т = 2). При* соединим прежде всего к табл. 1.58 столбец значений и2, нужный для построения. Построив на рис. 58 соот- ветствующую функциональную сетку, убедимся, что в этом случае наблюденные точки достаточно хорошо укладываются на прямой. Определим коэффициенты а и Ь по способу средней. Разбивая наблюдения нй две группы, три члена в пер- вой группе и два — во второй, воспользуемся уравне- ниями системы (11.57).
§58] НАХОЖДЕНИЕ КОЭФФИЦИЕНТОВ СТЕПЕННЫХ ФУНКЦИЙ 4Ц Найдя соответствующие суммы, составим систему За + 43,01 b = 0,0984, 2а + 147,476 = 0,3375, решив которую, получаем а = —0,0001, 6 = 0,00229. Таким образом, зависимость между давлением и ско- ростью выражается формулой р = 0,00229и2 — 0,0001. В последнем столбце табл. 1.58 для сравнения приве- дены значения р, вычисленные по этой формуле» Пример 2.58. Исследуя истечение некоторой жидко- сти через щель, Базен получил данные относительно за- висимости коэффициента истечения ц от набора Н (табл. 2.58). Наблюдения показывают, что при возрастании Н ко- эффициент ц медленно убывает, приближаясь к некоторой постоянной величине порядка 0,41 (рис. 59). Поэтому естественно искать зависимость вида р,= -^-+6, где, по- видимому, должно быть 6 — 0,41. Чтобы судить, насколько такая зависимость подходит для изображения имею-
412 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ (ГЛ. IX Таблица 2.58 н 1* 1 И ^выч 0,164 0,448 6,098 0,452 0,328 0,432 3,049 0,430 0,656 0,421 1,524 0.420 0,984 0.417 1,016 0,416 1,312 0,414 0,762 0,414 1,640 0,412 0,610 0,413 щихся данных, построим их на сетке pj. Если по- лученные точки расположатся достаточно близко от пря- мой, то следует ожидать, что полученные данные до- статочно хороню совпадут с формулой Рис. 60 показывает, что данные наблюдений можно счи- тать расположенными достаточно близко от прямой. Найдем теперь коэффициенты а и b по способу сред- ней. Система (11.57), которой нужно воспользоваться, имеет здесь вид 10,671 а + 3b = 1,301, 2,388fl + 3b = 1,243.
§ 58] НАХОЖДЕНИЕ КОЭФФИЦИЕНТОВ СТЕПЕННЫХ ФУНКЦИЙ 413 Решая ее, найдем а = 0,007, 6 = 0,409, вследствие чего искомая зависимость имеет вид 0,007 । Л ц, = —^— + 0,409. Значения р, вычисленные по этой формуле, приведены в последнем столбце табл. 2.58. Пример 3.58. Для характеристики истечения топ- лива из жиклера Лорэ предложил формулу Н = aQ2 + bQ, где Н есть полное разрежение (в сантиметрах столба бензина), a Q — расход топлива (см3/мин). Опыты над жиклером дали результаты, приведенные в табл. 3.58. Требуется определить коэффициенты а и Ь в формуле Лорэ. Таблица 3.58 Q н н Q Q- 14,0 3,05 0,218 196,00 20,5 4,90 0,239 420,25 35,3 10,4 0,295 1246,09 45,0 15,3 0,340 2025,00 53,8 20,1 0,374 2894,44 62,0 25,4 0,410 3844,00 68,3 29,8 0,436 4661,89 75,2 34,6 0,460 5655,04 82,0 40,0 0,488 6724,00 Формула Лорэ относится к формулам вида (12.57)< Чтобы убедиться в удачности выбора вида формулы, за- пишем формулу в виде ~ = aQ + b и положим Q = X, =У. Тогда формула приведется к линейной Y = aX + b.
414 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ IX Построенная на рис. 61 сетка ^Q, -q-J позволяет убе- диться, что точки, полученные из наблюдений, распо* лагаются достаточно близко к прямой линии. Найдем коэффициенты а и b по способу натянутой нити. Выбрав на проведенной на глаз прямой отмечен* ные на рис. 61 крестиками точки (10; 0,2) и (60; 0,4), получим для нахождения коэффициентов уравнения 10а + 6 = 0,2, 60а+ 6 = 0,4, откуда а = 0,004, 6 = 0,160. Таким образом, способ натя^ нутой нити приводит к уравнению Y=0,004% + 0,160, или, возвращаясь к старым обозначениям /7 = 0,004Q2 + 0,160Q. Применим теперь к вычислению коэффициентов спо* соб средней, отнеся в первую группу первые пять наблю- дений и во вторую — остальные четыре. Для нахожде- ния коэффициентов а и Ь придется уже воспользоваться
§ 58] НАХОЖДЕНИЕ КОЭФФИЦИЕНТОВ СТЕПЕННЫХ ФУНКЦИЙ 415 уравнениями системы (13.57): 5 5 5 а 2 Q? + b 2 Qt = 2 1=1 z=l Z=1 9 9 9 a 2 Q, + b 2 Qi = 2 Hi. i=6 r=6 1=6 Найдя нужные значения сумм из табл. 3.58, получим 6781,78а + 168,66 = 53,75, 20887,93а+ 287,56= 129,8. Решение системы дает а = 0,0041, 6 = 0,155, так что фор- мула Лорэ будет иметь вид # = 0,0041Q2 + O,155Q. В табл. 4.58 приведены для сравнения значения Н, полу* ченные из наблюдений и вычисленные по формулам, ко- эффициенты которых найдены способом натянутой нити (/Л) и способом средней (Н2). Данные табл. 4.58 показывают, что обе формулы дают приблизительно одинаково хорошее совпадение с экс* периментальными данными, хотя определение коэффи* циентов по способу натянутой нити проще, нежели по способу средней. Покажем теперь, каким образом применяется способ наименьших квадратов к отысканию коэффициентов для уравнений вида (1.58). Таблица 4.58 Q ^набл Hl =0.004 Q2 +0,160 Q Я2 = 0,0041 Q2 + + 0,155 Q 14,0 3,05 3,02 2,97 20,5 4,90 4,96 4,90 35,3 10,4 10,6 10,6 45,0 15,3 15,3 15,3 53,8 20,1 20,2 20,2 62,0 25,4 25,3 25,4 68,3 29,8 29,6 29,7 75,2 34,6 34,7 34,8 82,0 40,0 40,0 40,3
416 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ. IX Сумма квадратов отклонений вычисленных значений от наблюденных будет иметь вид v~%{y-(a + bx*}}\ (2.58) где п — число наблюдений. Условие минимума приводит к системе па + b 2 xf = 2 yt, i»l i~l (3-58) а 2 X"1 + Ь 2 х]т = 2 Х™уг Пример 4.58. Зависимость между скоростью судна v (в узлах) и мощностью Н (в лошадиных силах), раз- виваемой его двигателями, выразилась при испытаниях данными, приведенными в табл. 5.58. Таблица 5.58 и 5 7 9 11 12 н 290 560 1144 1810 2300 Предполагая, что зависимость приближенно выра* жается формулой вида Н = a-\-bv2, найдем коэффициенты в этой формуле всеми рассмо- тренными способами. -f Построим (рис. 62) сетку (и2, Я), нанесем на нее J наблюденные значения и проведем на глаз прямую. /. Выбор на этой прямой двух точек с координатами д (25, 200) и (81, 1140) приводит к системе уравнений « + 256 = 200, « + 816=1140, решая которую, находим « = —220, 6=16,8, так что за- висимость между v и Н будет иметь вид /7= 16,8 V2 —220.
§ 58] НАХОЖДЕНИЕ КОЭФФИЦИЕНТОВ СТЕПЕННЫХ ФУНКЦИЙ 447 Для применения способа средней разобьем наблюде- ния на две группы; к одной из них отнесем первые три наблюдения, а ко второй — оставшиеся два. Все вычис- ления, которые требуются по способу средней, а также и по способу наименьших квадратов, приведены в табл. 6.58. Таблица 6.58 vi °* и* Hi 5 290 25 7 250 625 7 560 49 27 440 2 401 9 1144 81 92 664 6 561 11 1810 121 219010 14641 12 2300 144 331 200 20 736 2 6104 420 677 564 44 964 27 Р- С. Гутер, Б. В. Оечинский
418 _ ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ. IX Система уравнений (11.57) приводит в данном слу- чае к системе За + 1556 = 1994, 2а+2656 = 4110, решение которой дает а =—224, 6=17,2, откуда искомая зависимость с коэффициентами, найденными по спо- собу средней, выразится формулой /7= 17,2а2 — 224. Для нахождения коэффициентов по способу наимень- ших квадратов следует обратиться к системе (3.58)* Взяв нужные значения сумм из табл. 6.58, получим 5а + 4206 = 6104, 420а + 44 9646 = 677 564. Решение этой системы приводит к коэффициентам а = —209, 6=17,0 в результате чего получается новая формула /7= 17,0а2 — 209. С целью сравнения полученных формул в табл. 7.58 приведены значения /7, вычисленные по всем трем выве- денным формулам, и подсчитаны отклонения и суммы квадратов отклонений от наблюденных значений. Таблица 7.58 Н набл Н1 выч 1 \о я и II 4 Нч выч £ 1 •=! О Св tq II А2 Д2 выч 1 \о С5 К й: и <Г Аз2 5 290 200 90 8 100 206 84 7 056 261 75 5 476 7 560 603 -43 1 849 619 — 59 3 481 624 -64 4 096 9 1144 1141 3 9 1169 -25 625 1168 -24 576 11 1810 1813 - 3 9 1857 -47 2 209 1848 -38 1 444 12 2 2300 2199 100 10 201 20 168 2253 47 2 209 15 580 2239 61 3 721 15313 Сравнение показывает, что способ средней дает за- метное улучшение по сравнению со способом натянутой
§ 58] НАХОЖДЕНИЕ КОЭФФИЦИЕНТОВ СТЕПЕННЫХ ФУНКЦИЙ 419 нити, тогда как способ наименьших квадратов лишь немного лучше способа средней. Аналогичным образом ищутся коэффициенты для сте- пенных функций вида у = ахь. (4.58) Как уже было отмечено в § 57, функции такого вида изо- бражаются в виде прямой линии на логарифмической бумаге. Действительно, логарифмируя равенство (4.58) и полагая затем lgx = X, lgf/=y, Iga —Л, преходим к уравнению У-Л + й/. (5.58) Итак, для пригодности формулы (4.58) необходимо, чтобы полученные результаты наблюдений располага- лись на логарифмической сетке вблизи прямой линии. Чтобы убедиться в правильности такого предположения, следует воспользоваться логарифмической бумагой. Способ натянутой нити применяется для отыскания коэффициентов в таких уравнениях без всяких видоиз- менений. Для применения способа средней нет надоб- ности переходить к величинам %, У. Предположив, как и в § 57, что все результаты наблюдений разбиты на две группы, в каждой из которых происходит уравновеши- вание погрешностей, мы получим два уравнения; т S {1g У, - (lg а + b 1g /,)} = О, £=1 2 {ig«/i-(ig« + ^ig^)} = o, i — m + 1 что дает систему для неизвестных A =lga и b mA + b s IgAj- 2 igУь Г‘ Ч (6-58) (п-т)А + Ь 2 lg*»= 2 lg*//> t=w+I где n означает общее число наблюдений, а т — число наблюдений в первой группе, 27*
420 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ. .IX Применение метода наименьших квадратов непосред- ственно к уравнению (4.58) приводит к весьма сложным выкладкам. Поэтому обычно ограничиваются примене- нием этого метода к преобразованному уравнению (5.58). Обычным методом приходим к системе уравнений п П | nA + b 2 lgx,= 2 1g| г' 7 (7.58) А 2 lgA.-, + & 2 (lg.rz)2= S Ig’^lgy,. !=1 z-i z=i J Пример 5.58. При обработке металлов резанием устанавливается зависимость скорости резания металла
§ 581 НАХОЖДЕНИЕ КОЭФФИЦИЕНТОВ СТЕПЕННЫХ ФУНКЦИЙ 421 от различных характеристик резца и стружки. В табл. 8.58 приведены опытные данные, показывающие зависимость скорости резания v (м/мин) и площади по- перечного сечения стружки F (мм2) при обработке хро- моникелевой стали. Т а б л и ц а 8.58 F 1,1 1,4 1,7 2,1 2,6 4,7 6,1 7,0 10,0 12,8 16,5 20,8 40,6 V 25,0 22,7 22,1 19,8 17,0 12,3 10,7 10,0 8,2 6,7 5,6 5,0 3,5 В теории резания эту зависимость изображают эмпи- рической формулой v = -±- « cF~'le, Vf которая является формулой вида (4.58). Логарифмируя заданную функцию, получим lgv = Igc--^lgF. Построив точки (рис. 63) на логарифмической бумаге, убеждаемся, что результаты наблюдений можно считать не очень отклоняющимися от прямой линии. Проведем на глаз прямую и выберем на ней точки F = 1, v = 29 и F = 40, v = 3,6. Для нахождения коэф- фициентов получаются два уравнения: Igc-7-Ig 1 = Ig29> ^40= *g3’6- Отсюда находим lgc = lg29, т. е. с = 29 и 1,6020- -Г- 1g29- 1g3,6 = 0,9061; тогда е= 1,77, и формула принимает вид
422 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ IX Найдем теперь коэфифциенты с и е с помощью спо- соба средней и способа наименьших квадратов, приме- ненного к преобразованной формуле. Обратимся к систе- мам (6.58) и (7.58). Для способа средней отнесем к пер- вой группе первые семь наблюдений, а ко второй —- остальные шесть. Нужные суммы и все вычисления по- мещены в табл. 9.58. Таблица 9.58 Fi Vi lg Fi lg Vi lg Fi lg Vi (lg Fi)2 1,1 25,0 0,0414 1,3979 0,0579 0,0017 1,4 22,7 0,1461 1,3560 0,1981 0,0213 1,7 22,1 0,2304 1,3444 0,3097 0,0531 2,1 19,8 0,3222 1,2967 0,4178 0,1038 2,6 17,0 0,4150 1,2304 0,5106 0,1722 4,7 12,3 0,6721 1,0899 0,7325 0,4517 6,1 10,7 0,7853 1,0294 0,8084 0,6167 7,0 10,0 0,8451 1,0000 0,8451 0,7142 10,0 8,2 1,0000 0,9138 0,9138 1,0000 12,8 6,7 1,1072 0,8261 0,9147 1,2259 16,5 5,6 1,2175 0,7482 0,9109 1,4823 20,8 5,0 1,3181 0,6990 0,9214 1,7374 40,6 3,5 1,6085 0,5441 0,8752 2,5873 2 9,7089 13,4759 8,4161 10,1676 Из нее находим, что способ средней дает систему урав- нений 7 1g с - 2,6125 = 8,7447, 6 1g с - 7,0964 => 4,7312. Решая эту систему, получаем 1g с =1,4616, откуда с = 28,95 и е = 1,76. Тогда 28,95 V 1’76_ * Способ наименьших квадратов приводит к системе 13 1g с — 9,7089 — = 13,4759, & ’ е * 9,70981g с- 10,1676 — = 8,4161. , ь 8
§ 58] НАХОЖДЕНИЕ КОЭФФИЦИЕНТОВ СТЕПЕННЫХ ФУНКЦИЙ 423 Отсюда 1g с — 1,4587, т. е. с = 28,75 и 8 = 1,77, вследствие чего формула приобретает вид 28,75 V “ 1,77 Для сравнения в табл. 10.58 приведены, как и в пре- дыдущем примере, значения скорости резания, вычислен- ные по всем трем формулам, и подсчитана сумма ква- дратов отклонений. Таким образом, мы снова видим, что Таблица 10.58 F 5 СО Я Vi D 1 О II Д1 и2 о 1 II < А2 Д2 v3 о 1 о II Л2 А3 1,1 25,0 27,5 -2,5 6,25 27,4 -2,4 5,76 27,3 -2,3 5,29 1,4 22,7 24,0 -1,3 1,69 23,9 “1,2 1,44 23,8 “1,0 1,00 1,7 22,1 21,5 0,6 0,36 21,4 0,7 0,49 21,3 0,8 0,64 2,1 19,8 19,1 0,7 0,49 19,0 0,8 0,64 18,9 0,9 0,81 2,6 17,0 16,9 0,1 0,01 16,8 0,2 0,04 16,8 0,2 0,04 4,7 12,3 12,1 0,2 0,04 12,0 0,2 0,04 12,1 0,2 0,04 6,1 10,7 10,4 0,2 0,04 10,4 0,5 0,25 10,3 0,3 0,09 7,0 10,0 9,7 0,3 0,09 9,6 0,4 0,16 9,6 0,3 0,09 10,0 8,2 7,9 0,3 0,09 7,8 0,4 0,16 7,8 0,3 0,09 12,8 6,7 6,9 -0,2 0,04 6,8 0,2 0,04 6,8 “0,1 0,01 16,5 5,6 5,9 -0,4 0,16 5,9 -0,2 0,04 5,9 -0,3 0,09 20,8 5,0 5,2 -0,2 0,04 5,2 -0,1 0,01 5,2 -0,2 0,04 40,6 2 3,5 3,6 -0,1 0,01 9,31 3,5 0,0 0,00 9,07 3,5 0,0 0,00 8,23 формула с коэффициентами, полученными по способу средней, дает несколько лучшее совпадение с наблюден- ными данными, чем первая, коэффициенты которой най- дены по способу натянутой нити. Самое лучшее совпа-* дение, естественно, дает способ наименьших квадратов.
424 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ § 59. Подбор коэффициентов для показательных функций. Замечания о числе параметров Из наиболее часто встречающихся практически зави- симостей нам осталось рассмотреть зависимость вида у = аеЬх. (1.59) Ясно, что в такой форме можно представить зависимость с любым основанием путем подбора коэффициента Ь, Как уже было указано в § 57, эту зависимость можно изобразить прямой, если воспользоваться полулога- рифмической сеткой. Логарифмируя обе части равенства (1.59), получаем lg*/= Iga + (^lge)x или У = А + Вх, (2.59) где X = |ga, B = &lge, K = lgi/. Таким образом, для нахождения коэффицентов спосо- бом натянутой нити следует нанести результаты наблю- дений на полулогарифмической бумаге и подобрать наи- более подходящую прямую на глаз. Без всякого изменения применяется здесь и способ средней. Предполагая, что погрешности в каждой из двух групп наблюдений уравниваются, получим два уравнения: 2 {igyI-(^ + в.г;)} = о, 2 {Igz/i —(Л + Вхг)} = 0 1 или, иначе, mA + В 2 Xi = 2 lgDi, Г (3.59) (п-т)А + В 2 Xi= 2 lg£/i. Z=/n + l i^m+l
§ 59] ПОДБОР КОЭФФИЦИЕНТОВ ПОКАЗАТЕЛЬНЫХ ФУНКЦИЙ 425 где п — общее число наблюдений, а т — число наблюде- ний в первой группе. Применяя способ наименьших квадратов к преобразо- ванному уравнению (2.59), составим сумму квадратов отклонений, п v = Sto-M + 3,;,)}2. 2г z = ! Дифференцируя по А и В : приравнивая нулю частньн производные, приходим к си стеме уравнений п п nA + В У Xi = lgyit i = l i=l л 2 Xi + в 2 x] = 2 xi ig iji. 1=1 1 = 1 1=1 (4.59 Рассмотрим один пример. Пример 1.59. Наблюде ния зависимости коэффициен та трения в подшипнике ц О' температуры Г дали результа ты, приведенные в табл. 1.59. Построив полученные точкр на полулогарифмической бу маге (рис. 64), заметим, что они достаточно близко рас- положены от прямой, проходящей через точки (60; 0,0148) и (110; 0,0059). Следовательно, для нахождения коэффициентов Л и В по способу натянутой нити полу- чаются два уравнения: 1g0,0148 = А + 60В, 1g0,0059 - А + НОВ. Таблица 1.59 /° 1 60 ; 70 80 90 100 НО 120 и | 0,0148 1 0,0124 0,0102 0,0085 0,0071 0,0059; 0,0051
426 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ. IX Так как 1g 0,0148 = 2,1703 =—1,8297 и 1g = 0,0059 = = 3,7709 = —2,2291, то, вычитая из второго уравнения первое, находим 50В = 0,3994, откуда В = —0,0080. То- гда А =—1,3497. Возвращаясь к коэффициентам а и Ь, получаем 1g а = - 1,3497 = 2,6503, а = 0,043, b 1g е = - 0,0080, Итак, способ натянутой нити дает формулу р. = 0,043е-°-0Ш'. Для способов средней и наименьших квадратов вы- числим нужные суммы. Вычисления приведены в табл. 2.59. Способ средней приводит к системе уравнений (3.59), которая, в данном случае, имеет вид 4Д + 300В = —7,7983, ЗЛ + 330В = —6,6702. Решая систему, находим А = —1,3682, В = —0,0078, от- куда _ 1g а = —1,3646 = 2,63154, а ~ 0,043, b 1gе = —0,0078, 6=-JS = -0,018, V, тчЗпЮ вследствие чего ц = 0,043е-°’0Ш, т. е. та же самая формула, что и по способу натянутой нити. Наконец, по способу наименьших квадратов, поль- зуясь системой (4.59) и суммами из табл. 2.59, получаем 1А + 630В = —14,4685, 630/4 4- 59500В = —1324,0690,
§ 59] ПОДБОР КОЭФФИЦИЕНТОВ ПОКАЗАТЕЛЬНЫХ ФУНКЦИЙ 427 Таблица 2.59 а ц/ 1g м/ 1 । У2 1 a ig и/ 60 0,0148 -1,8297 3 600 - 1С9,782 70 0,0124 -1,9066 4 900 -133,462 80 0,0102 -1,9914 6 400 -159,312 90 0,0085 -2,0706 8 100 -186,354 100 0,0071 -2,1487 ЮООО - 214,870 НО 0,0059 -2,2291 12 100 - 245,201 120 0,0051 -2,2924 14 400 - 275,088 ^630 -1,4685 59 500 -1324,069 Решение этой системы дает значения коэффициентов А = —1,3649, В -—0,0078, благодаря чему Iga = —1,3649 = 2,6351, а = 0,043, b 1g е = —0,0078, b= - - 0,018, так что зависимость между ц и t с коэффициентами, найденными по способу наименьших квадратов, имеет тот же вид ц = 0,043е-°’018'. Итак, мы рассмотрели способы подбора констант для эмпирических формул различных видов, выражающих экспериментальные данные. Остается сделать несколько заключительных замечаний. Если мы не имеем никаких теоретических указаний о виде связи между величинами х и у, то следует искать наиболее простую формулу, ближе всего подходящую к экспериментальному материалу. Здесь открывается ши- рокий простор для выбора той или иной формы зависи- мости. Отметим, что в рассматривавшихся случаях формулы содержали два неизвестных параметра. Увеличивая чис- ло параметров, входящих в формулу, можно достигнуть
428 ПРЕДСТАВЛЕНИЕ НАБЛЮДЕННЫХ ДАННЫХ [ГЛ IX того, чтобы подобранная формула давала почти полное совпадение функции 6 наблюденными значениями. Это можно сделать, например, увеличивая степень прибли- жающего многочлена; построив же интерполяционный многочлен по формуле Лагранжа или любой другой ин- терполяционной формуле, рассмотренной в гл. II, мы по- лучим многочлен, в точности воспроизводящий экспери- ментальные данные. Как было уже сказано во вводных замечаниях к третьей части книги, такое полное совпадение в боль* шинстве случаев не является необходимым. Скорее на- оборот, полное совпадение можно считать даже нежела* тельным, так как интерполяционный многочлен будет # повторять все ошибки наблюдений. < Все, что было сказано об интерполяционном много* члене, полностью относится к любому другому виду при- : ближенных формул. Поэтому если о виде зависимости между х и у из теоретических соображений ничего не известно, то из нескольких эмпирических формул следует выбирать ту, которая ближе всего подходит к экспери- ментальным данным и содержит наименьшее коли- чество параметров.
ПРИЛОЖЕНИЕ I Таблицы плотности вероятности нормального распределения и функции Лапласа , х 1 2 1 г ~т‘ Ф (х) = I е dt. /2л J О X ф (х) Ф (х) X Ф (х) ф (X) X Ф (х) Ф (х) 0,00 0,3989 0,0000 0,20 0,3910 0,0793 0,40 0,3683 0,1554 01 3989 0040 21 3902 0832 41 3668 1591 02 3989 0080 22 3894 0871 42 3653 1628 03 3988 0120 23 3885 0910 43 3637 1664 04 3986 0160 24 3876 0948 44 3621 1700 05 3984 0199 25 3867 0987 45 3605 1736 06 3982 0239 26 3857 1026 46 3589 1772 07 3980 0279 27 3847 1064 47 3572 1808 08 3977 0319 28 3836 1103 48 3555 1844 09 3973 0359 29 3825 1141 49 3538 1879 0,10 0,3970 0,0398 0,30 0,3814 0,1179 0,50 0,3521 0,1915 11 3965 0438 31 3802 1217 51 3503 1950 12 3961 0478 32 3790 1255 52 3485 1985 13 3956 0517 33 3778 1293 53 3467 2019 14 3951 0557 34 3765 1331 54 3448 2054 15 3945 0596 35 3752 1368 55 3429 2088 16 3939 0636 36 3739 1406 56 3410 2123 17 3932 0675 37 3725 1443 57 3391 2157 18 3925 0714 38 3712 1480 58 3372 2190 19 3918 0753 39 3697 1517 59 3352 . 2224
43Э ПРИЛОЖЕНИЯ Продолжение приложения I X <Г (х) Ф (х) X Ф (х) |Ф (X) X ф (х) Ф (X) 0,60 0,3332 0,2257 95 2541 3289 1,30 0,1714 0,4032 61 3312 2291 96 2516 3315 31 1691 4049 62 3292 2324 97 2492 3340 32 1669 4066 63 3271 2357 98 2468 3365 33 1647 4082 64 3251 2389 99 2444 3389 34 1626 4099 65 3230 2422 1,00 0,2420 0,3413 35 J604 4115 66 3209 2454 01 2396 3438 36 1582 4131 67 3187 2486 02 2371 3461 37 1561 4147 68 3166 2517 03 2347 3485 38 1539 4162 69 3144 2549 04 2323 3508 39 1518 4177 0,70 0,3123 0,2580 05 2299' 3531 1,40 0,1497 0,4192 71 3101 2611 06 2275 3554 41 1476 4207 72 3079 2642 07 2251 3577 42 1456 4222 73 3056 2673 08 2227 3599 43 1435 4236 74 3034 2703 09 2203 3621 44 1415 4251 ; 75 ЗОН 2734 1,10 0,2179 0,3643 45 1394 4265 76 2989 2764 11 2155 3665 46 1374 4279 77 2966 2794 12 2131 3686 47 1354 4292 78 2943 2823 13 2107 3708 48 1334 4306 79 2920 2852 14 2083 3729 49 1315 4319 0,80 0,2897 0,2881 15 2059 3749 1,50 0,1295 0,4332 . 81 2874 2910 16 2036 3770 51 1276 4345 82 2850 2939 17 2012 3790 52 1257 4357 83 2827 2967 18 1989 3810 53 1238 4370 84 2803 2995 19 1965 3830 54 1219 4382 85 2780 3023 1,20 0,1942 0,3849 55 1200 4394 86 2756 3051 21 1919 3869 56 1182 4406 87 2732 3078 22 1895 3888 57 1163 4418 88 2709 3106 23 1872 3907 58 1145 4429 89 2685 3133 24 1849 3925 59 1127 4441 0,90 0,2661 0,3159 25 1826 3944 1,60 0,1109 0,4452 91 2637 3186 26 1804 3962 61 1092 4463 . 92 2613 3212 27 1781 3980 62 1074 4474 i 93 2589 3238 28 1758 3997 63 1057 4484 94 2565 3264 29 1736 4015 64 1040 4495
ПРИЛОЖЕНИЯ 431 Продолжение приложения I X Ф (х) Ф(х) X Ф (X) Ф(х) X Ф (х) Ф(х) 65 1023 4505 2,00 0,0540 0,4772 70 0104 4965 66 1006 4515 02 0519 4783 72 0099 4967 67 0989 4525 04 0498 4793 74 0093 4969 68 0973 4535 06 0478 4803 76 0088 4971 69 0957 4545 08 0459 4812 78 0084 4973 1,70 0,0940 0,4554 10 0440 4821 2,80 0,0079 0,4974 71 0925 4564 12 0422 4830 82 0075 4976 72 0909 4573 14 0404 4838 84 0071 4977 73 0898 4582 16 0387 4846 86 0067 4979 74 0878 4591 18 0371 4854 88 0063 4980 75 0863 4599 2,20 0,0355 0,4861 90 0,0060 0,4981 76 0848 4608 22 0339 4868 92 0056 4982 77 0833 4616 24 0325 4875 94 0053 4984 78 0818 4625 26 0310 4881 96 0050 4985 79 0804 4633 28 0297 4887 98 0047 4986 1,80 0,0790 0,4641 30 0283 4893 3,00 0,00443 0,49865 81 0775 4649 32 0270 4898 3,10 00327 49903 82 0761 4656 34 0258 4904 3,20 00238 49931 83 0748 4664 36 0246 4909 3,30 00172 49952 84 0734 4671 38 0235 4913 3,40 00123 49996 85 0721 4678 2,40 0,0224 0,491? 3,50 00087 49977 86 0707 4686 42 0213 4922 3,60 00061 49984 87 0694 4693 44 0203 4927 3,70 OOQ42 49989 88 0681 4699 46 0194 4931 3,80 00029 49993 89 0669 4706 48 0184 4934 3,90 00020 49995 1,90 0,0656 0,4713 50 0175 4938 4,00 0,0001338 0,499968 91 0644 4719 52 0167 4941 4,50 0000160 499997 92 0632 4726 54 015? 4945 5,00 0000015 49999997 93 0620 4732 56 0151 4948 94 0608 4738 58 0143 4951 95 0596 4744 2,60 0,0136 0,4953 96 0584 4750 62 0129 4956 97 0573 4756 64 0122 4959 98 0562 4761 66 0116 4961 99 0551 4767 68 ОНО 4963
432 ПРИЛОЖЕНИЯ ПРИЛОЖЕНИЕ II Значения коэффициентов ап в таблице 1.52 I. При нечетном числе наблюдений п п а. «2 «3 а4 «5 3 333 333 (6) 500000 (6) 100 000 (7) 100 000 (5) 150 000(5) 5 200000 100 000 485 714(8) 142 857 (6) 714 286 (7) 7 142 857 357 143 (7) 333 333 476 190 (7) 119 048 9 111 111 166 667 255 411 216 450 324675 (8) 11 909091 (7) 909 091 (8) 207 459 116 550 1J6 550 13 769231 549 451 174 825 699 301 (8) 499 500 (9) 15 666667 357 143 151 131 452 489 242 405 17 588 235 245 098 133 127 309 598 128 999 19 526 316 175 439 118 973 221 141 737 137(10) 21 476 190 129 870 107 551 163 452 445 778 II. При четном числе наблюдений п «1 аа «3 «4 «5 4 250000(6) 500 000(7) 640 625 (6) 781 250 (7) 156 250 (7) 6 166667 142 857 394 531 195312 167 411 (8) > 8 125000 595 238 (8) 289 062 781 250(8) 372 024 (9) 10 100000 303 030 228 906 390 625 118371 12 833 333 (7) 174 825 189 732 223 214 468 282(10) 14 714286 109 890 162 109 139 509 214 629 16 625000 735 294 (9) 141 555 930 060 (9) 109 419 18 555556 515 996 125 651 651 042 604683(11) 20 500000 375 940 112 973 473 485 356 004 22 454545 282 326 102 628 355 114 220 567 Числа в скобках означают отрицательные степени десяти, на которые нужно умножить стоящие в таблице числа, чтобы полу* чить значения ал. Например, для п = 7 получаем а2 = 357 143-10^7.
79 к.