Текст
                    Т. А. АГЕКЯН
ОСНОВЫ
ТЕОРИИ ОШИБОК
ДЛЯ АСТРОНОМОВ
И ФИЗИКОВ
ИЗДАНИЕ ВТОРОЕ
щ
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
МОС KB A 1972


А 23 522.1 УДК 522.0 Т. А. А г е к я н. Основы теории ошибок для астрономов и физиков. Главная редакция физико-математической литературы издательства «Наука», 1972, 172 стр. В книге изложены основы современной теории ошибок и указаны методы практического ее применения. Для обоснования полученных решений приведены необходимые сведения из теории вероятностей. Книга содержит значительное число задач с решениями. Книга является руководством по применению теории ошибок. Она может также служить учебным пособием к элементарному курсу теории вероятностей для астрономов, физиков и инженеров. 2-6-1 187-72
ОГЛАВЛЕНИЕ Предисловие 6 Глава I. Вероятность события 7 § 1. Понятие случайного события ........ 7 § 2. Понятие вероятности случайного события ... 11 § 3. Классическое определение вероятности события . 12 § 4. Статистическое определение вероятности события 22 § 5. Условная вероятность. Зависимые и независимые события ......... 23 § 6. Теоремы сложения и умножения вероятностей . 25 § 7. Формула полной вероятности 32 § 8. Теорема Байеса 33 § 9. Вероятность сложного события 34 Глава II. Случайная величина 37 § 10. Случайная величина с дискретным распределением 37 § 11. Биномиальное распределение . 41 § 12. Непрерывная случайная величина ...... 43 § 13. Функция случайной величины 47 § 14. Дельта-функция Дирака 49 § 15. Математическое ожидание функции случайной величины • • 52 § 16. Моменты функции распределения 54 § 17. Связь между моментами относительно двух различных начал . 60 § 18. Распределение Пуассона 61 § 19. Вероятностная трактовка некоторых физических понятий .64 § 20. Нормальный закон распределения .66 § 21. Асимметрия и эксцесс распределения 68 § 22. Интеграл вероятностей 70 § 23. Теорема Муавра — Лапласа 71
Глава III. Случайный вектор . . . « « 78 § 24. Понятие случайного вектора. Функции распределения случайного вектора . . 78 § 25. Функция случайного вектора 82 § 26. Статистические коллективы 91 § 27. Случайные выборки из нормальной генеральной совокупности . 94 § 28. Метод максимального правдоподобия .... 99 Глава IV. Основы теории ошибок 101 § 29. Виды ошибок измерений 101 § 30. Гипотеза о функции распределения случайных ошибок ................ 104 § 31. Средняя ошибка; вероятная ошибка измерения . 107 § 32. Метод классической теории ошибок 109 § 33. Дисперсия дисперсии ряда наблюдений .... 113 § 34. Пример обработки ряда измерений классическим методом 114 § 35. Выделение промахов 116 § 36. Закон распространения средней ошибки . . . 118 § 37. Критика классического метода . . .... 121 § 38. Распределение Стьюдента. Метод малых выборок 122 § 39. Пример обработки ряда измерений методом малых выборок 131 § 40. Какой метод следует рекомендовать для обработки ряда измерений 132 § 41. Применение метода малых выборок для величины, равной сумме измеряемых величин . . . 133 § 42. Неравноточный ряд измерений. Веса измерений . 135 § 43. Случайная выборка по одному элементу из п нормальных генеральных совокупностей с одинаковыми средними, но различными дисперсиями . . 138 § 44. Обработка ряда неравноточных измерений . . . 140 § 45. Пример обработки ряда неравноточных измерений 142 § 46. Ряд неравноточных измерений с известными средними ошибками измерений 144 § 47. Пример обработки ряда измерений с известными средними ошибками измерений . 151 Глава V. Косвенные измерения. Метод наименьших квадратов 153 § 48. Система условных уравнений 153 § 49. Избыточная система условных уравнений. Принцип наименьших квадратов. Нормальная система уравнений . ........ 156 4
§ 50. Сумма квадратов остающихся погрешностей для точечных оценок неизвестных 158 §51. Определение средней ошибки измерений у% методом классической теории ошибок 159 § 52. Определение средних ошибок точечных оценок неизвестных . 161 § 53. Запись результатов решения избыточной системы уравнений в классическом методе 163 § 54. Запись результатов в методе малых выборок . . 164 § 55. Избыточная система неравноточных уравнений . 166 § 56. Избыточная система нелинейных уравнений . . 167
ПРЕДИСЛОВИЕ Предлагаемая читателю книга преследует две цели. Первая состоит в изложении обоснований теории ошибок и указании методов ее применения. Во многих астрономических учреждениях, исследовательских и учебных физических (и иных, связанных с измерениями) лабораториях применяются неправильные методы учета ошибок измерений. Часто действуют неверные инструкции по обработке рядов измерений. Автор надеется, что книга поможет внести ясность в этот не очень сложный вопрос и будет способствовать распространению правильных методов. Книга рассчитана на читателя, знакомого с дифференциальным и интегральным исчислением в объеме технического вуза. Для обоснования теории ошибок в книге изложены основы теории вероятностей. Объем изложенного соответствует общему курсу теории вероятностей, предусмотренному на специальностях физики и астрономии в университетах. Вторая цель книги — служить учебным пособием по этому курсу. Из прилагаемых в ходе изложения задач с решениями часть составлена автором, часть заимствована из «Сборника задач по теории вероятностей» Л. Д Мешалкина, изд МГУ, 1963 и «Сборника задач по теории вероятностей, математической статистике и теории случайных функций» под ред. А. А. Свешникова, «Наука», 1970. Новое издание книги дополнено важной для теории ошибок главой «Косвенные измерения. Метод наименьших квадратов». Исправлены неточности, имевшиеся в первом издании. Автор
ГЛАВА I ВЕРОЯТНОСТЬ СОБЫТИЯ § 1. Понятие случайного события В теории вероятностей рассматриваются события, которые при выполнении некоторых условий могут произойти, а могут и не произойти. Такие события называются случайными событиями. Например, событие, состоящее в появлении цифры 1 при выполнении условия — бросания игральной кости, может произойти и может не произойти. Обычно рассматривается событие, которое может произойти или не произойти, когда выполнен ряд условий. Пример: исправный счетчик Гейгера помещен в поле с альфа-частицами и включен в течение промежутка времени At. Рассматривается событие, состоящее в том, что за этот промежуток времени счетчик зарегистрирует не менее п альфа-частиц. Мы будем говорить о событии, которое может произойти или не произойти при выполнении некоторого комплекса условий. Если данный комплекс условий многократно в точности повторяется, то употребляют также более короткий термин — испытание. Можно сказать, что при данном испытании случайное событие состоялось (или не состоялось). То, что заранее нельзя определить, случится или не случится некоторое событие при выполнении данного комплекса условий, не означает принципиальной невозможности познать данное явление. Это означает лишь, что мы не располагаем достаточными сведениями о явлении, чтобы точно определить, произойдет оно или не произойдет. Если бы игральная кость выбрасывалась машиной, сообщающей кости при ее точно заданной начальной ориентации точно заданные вектор скорости и момент вращения, а полет кости, включая его отскоки от стола, был точно исследован средствами теоретической механики, то
можно было бы предсказать, какая цифра появится после остановки кости. Сложность задачи заключается здесь главным образом в том, что незначительные, почти неуловимые изменения в начальных условиях (ориентации кости, векторе ее скорости и моменте вращения) изменяют окончательный результат. Условимся о некоторых обозначениях. Пусть Л — событие, которое может произойти при выполнении определенного комплекса условий. Будем обозначать через А событие, состоящее в том, что при выполнении данного комплекса _условий событие А не произойдет. События А и А называются противоположными событиями. Очевидно, что свойство противоположности у них взаимное, т. е. = А. Пусть А и В — события, которые могут произойти при выполнении некоторого комплекса условий. Условимся обозначать посредством А + В событие, состоящее в том, что случилось хотя бы одно из событий А и В. Например, появление валета при извлечении из колоды игральной карты назовем событием Л, а появление карты масти треф — событием 5. Мы будем считать, что событие А + В случилось, если игральная карта оказалась одной из треф или одним из валетов, в том числе и валетом треф. Аналогично, событие состоит в том, что случилось хотя бы одно из событий Л, В и С. Например, если Л есть появление 1, В — появление 3, С — появление 5 при бросании игральной кости, то Л + В -f С — событие, состоящее в появлении нечетной цифры. Очевидно, что справедлив сочетательный закон Условимся обозначать посредством АВ событие, состоящее в том, что при выполнении комплекса условий случились и событие Л и событие В. 8
В приведенном выше примере с игральными картами событие АВ случается при извлечении трефового валета. Выполняется сочетательный закон (АВ) С = А (ВС) = ABC. Легко также убедиться в справедливости равенств и выполнении распределительного закона (А + В)С = АС + ВС. A,01) Далее заметим, что {АС) (ВС) = ABC. Повторять С в правой части этого равенства нет необходимости. При помощи принятых обозначений можно записать различные события, комбинирующиеся из элементарных событий. Например, событие, состоящее в том, что случилось хотя бы одно из событий Л, В, С, но не случились они все три сразу, может быть обозначено так: (А + В + С) ABC. В некоторых случаях рассматриваемое событие таково, что оно при выполнении данного комплекса условий не может случиться. Такое событие называется невозможным. Если, например, в урне имеются только белые шары, то при извлечении из урны шара событие, состоящее в том, что этот шар окажется черным, является невозможным событием. Условимся обозначать невозможное событие буквой V. Легко убедиться в справедливости следующего равенства: Если при выполнении некоторого комплекса условий рассматриваемое событие обязательно произойдет, то такое событие называется достоверным. Например, если в урне имеются только белые шары, то при извлечении шара событие, состоящее в появлении 9
белого шара, является достоверным событием. Условимся обозначать достоверное событие буквой U. Очевидно, что справедливо следующее равенство: А + А = U. Если при выполнении некоторого комплекса условий появление события А делает невозможным появление события В, то события А и В называются несовместимыми. Очевидно, что свойство несовместимости событий является взаимным. Условие несовместимости событий А и В может быть записано так: Если при выполнении некоторого комплекса условий появление события А не делает невозможным появление события В, то события А и В являются совместимыми событиями. При извлечении из колоды одной игральной карты события появление валета и появление дамы являются несовместимыми. Но события появление валета и появление трефы являются совместимыми событиями. Пусть A,02) т. е. посредством А обозначено событие, состоящее в наступлении хотя бы оцного из событий Си С%, ... ..., Сш. Если события С\9 С2, ..., Ст все попарно несовместимы и справедливо равенство A,02), то говорят, что событие А подразделяется на частные случаи Система несовместимых событий Сь С2, ..., Сп называется полной системой событий, когда известно, что при выполнении заданного комплекса условий одно из событий этой системы должно обязательно произойти. Тогда очевидна справедливость равенства Сх + С2+ ... +Cn=U. A,03) Простейшей полной системой событий является система Л, Л. Если при выполнении некоторого комплекса условий появление события А обеспечивает и появление события В, то мы будем говорить, что событие В 10
содержит в себе событие Л, и обозначать это свойство событий так: Аа В. Например, при бросании игральной кости событие, состоящее в появлении 1, влечет событие, состоящее в появлении нечетной цифры. Следовательно, событие — появление нечетной цифры содержит событие— появление 1. В общем случае, если А а В, обратное утверждение не справедливо, т. е. В не влечет А. В приведенном выше примере появление нечетной цифры не означает обязательного появления единицы. В частном случае может быть справедливым как А а В, так и В с: Л. В таком случае события А и В называются равносильными. Если, например, в урне имеются шары различных диаметров, то событие Л, состоящее в извлечении шара наименьшего радиуса, и событие В, состоящее в извлечении шара наименьшего объема, являются равносильными событиями. По этой причине все достоверные события (при выполнении данного комплекса условий) являются равносильными, и мы можем все достоверные события обозначать одной и той же буквой (?/). Аналогично равносильны все невозможные события (F). § 2. Понятие вероятности случайного события При выполнении соответствующего комплекса условий достоверное событие обязательно произойдет, а невозможное событие обязательно не произойдет. Среди тех событий, которые при выполнении комплекса условий могут произойти и могут не произойти, на появление одних можно рассчитывать с большим основанием, на появление других — с меньшим основанием. Если, например, в урне белых шаров больше, чем черных (шары могут отличаться только цветом, и перед извлечением шара урну встряхивают, чтобы шары хорошо перемешались), то рассчитывать на появление белого шара больше оснований, чем на появление черного шара. Величина, определяющая, насколько значительны объективные основания рассчитывать на появление события, называется вероятностью события. Необходимо 11
подчеркнуть, что вероятность есть объективная величина, существующая независимо от познающего субъекта и обусловливаемая всей совокупностью условий, при которых происходит событие. Объяснение, которое мы дали понятию вероятности, не является математическим определением, так как оно не определяет этого понятия количественно. Исчерпывающей математической формулировки понятия вероятности не существует. Однако важное значение имеют два определения этого понятия, являющиеся частными определениями, приложимыми в некоторых определенных условиях. Это так называемые 1) классическое определение вероятности события и 2) статистическое определение вероятности события. § 3, Классическое определение вероятности события Классическое определение вероятности события сводит это понятие к более элементарному понятию равновозможных событий, которое уже не подлежит определению и предполагается интуитивно ясным. Условимся посредством Р(А) обозначать вероятность события А. Пусть событие А представляет собой реализацию одного из т равновозможных случаев, входящих в состав полной системы п равновозможных событий, т. е. U = d -)- С2 + •.. + Ст -+¦ Cm+i -|- • • • + СЛ, События Си С*2, ..., Ст мы будем называть благоприятными для события Л, так как появление одного из них обеспечивает появление события Л. Тогда вероятность события А равна отношению числа благоприятных случаев к общему числу равно- возможных случаев, т. е. Р(А) = ^; т^п. A,04) Согласно тому же определению вероятности события, получаем />(С,) = Р(С2)= ... =Р(СП)=|, A,05) 12
т. е. равновозможные события имеют одинаковые вероятности. Как следует из определения, вероятность события всегда безразмерная величина. Если, например, находящиеся в урне шары отличаются друг от друга только цветом, то при извлечении шаров вслепую появления каждого из шаров следует считать равновозможными событиями. Пусть в урне имеется 5 белых и 3 черных шара. Тогда полная система событий состоит из 8 равновозможных случаев, а событие, состоящее в появлении белого шара, подразделяется на 5 таких случаев, поэтому вероятность появления белого шара Аналогично, вероятность появления черного шара так как здесь число благоприятных случаев равно 3. Из определения следует, что наибольшую вероятность имеет достоверное событие, а наименьшую — невозможное событие, Следовательно, вероятность любого события А удов летворяет неравенству Если событие В содержит в себе событие Л, то это означает, что случаи, являющиеся благоприятными для события Л, благоприятны и событию В, по не все случаи, благоприятные для В, являются благоприятными для Л, иначе события Л и В были бы равносильными. Следовательно, если А а В, то Р {В). 13
Задача 1. В изданном в 1784 г. каталоге Мессье, содержащем наблюдаемые на небе 108 ярких туманных объектов, имеется 39 галактик, 29 рассеянных скоплений, 29 шаровых скоплений, б диффузных туманностей и 5 планетарных туманностей. Определить вероятность того, что из двух, наугад выбранных в каталоге, объектов а) каждый окажется галактикой, б) один окажется шаровым, а другой рассеянным скоплением. Решение. Выбор любой пары объектов из каталога следует считать одним из равновозможных событий. Общее число равновозможных случаев равно числу сочетаний из всех 108 объектов по 2, т. е. Сюв. В задаче а) число благоприятных случаев равно С3э. Искомая вероятность :С^ 0,128. В задаче б) число благоприятных случаев равно числу шаровых скоплений, помноженному на число рассеянных скоплений 29 X 29. Искомая вероятность ^ 0,146. Задача 2. Найти вероятность того, что при случайном выборе четырех букв из слова «математика» будут получены буквы, из которых можно составить слово «тема». Решение. Общее число равновозможных случаев равно числу сочетаний из 10 букв, составляющих слово «математика», по 4, т. е. Сю. Число благоприятных случаев равно 2-1-2-3=12, так как буква «т» может быть выбрана двумя способами, буква «е» — одним, буква «м» — двумя и буква «а» — тремя способами. Искомая вероятность 1 о • Г1^ _ — \А . Ою — Задача 3. Найти вероятность того, что при извлечении из колоды п игральных карт (в колоде 52 карты) все они окажутся разных значений. Решение. При п > 13 рассматриваемое событие является невозможным, так как в колоде различных значений карт всего 13. Таким образом, при п > 13 вероятность события равна нулю, 14
Найдем Р при п г^Г 13. Число всех равновозмож- ных случаев равно С52. Для нахождения числа благоприятных случаев заметим, что если бы извлеченные карты были одной и той же масти, то все они были бы различных значений. Число различных сочетаний п карт одной определенной масти равно С"з« Однако каждый раз, как будет получено некоторое сочетание карт одной масти, можно путем замены каждой карты на карту того же значения, но другой масти, получить еще одно сочетание тех же значений карт. Произведя все возможные такие замены для каждого сочетания из карт одной масти, получим все благоприятные случаи. Из этого следует, что число благоприятных случаев равно С?з • 4П. Таким образом, при п ^ 13 искомая вероятность Задача 4. Найти вероятность того, что при случайном распределении N частиц в п ячейках (N^n): г) в N определенных ячейках окажется по одной частице, б) в N каких-то ячейках окажется по одной частице. Задачу решить в статистиках: 1) Больцмана, 2) Бозе — Эйнштейна и 3) Ферми — Дирака. В статистике Больцмана, которой подчиняется обычный газ, частицы принципиально различимы между собой, так что перестановка двух частиц, находящихся в разных ячейках, дает новое распределение. Число же частиц в одной ячейке не ограничено. В статистике Бозе — Эйнштейна, которой подчиняется, например, фотонный газ (кванты электромагнитного поля), частицы принципиально неразличимы. Перестановка двух частиц, находящихся в разных ячейках, не дает нового распределения. Число частиц в одной ячейке не ограничено. В статистике Ферми — Дирака, которой подчиняется, например, электронный газ, частицы принципиально неразличимы, и в каждой ячейке может находиться не более одной частицы. Решение. 1) В статистике Больцмана общее число всех равновозможных случаев равно nN, так как каждая частица может расположиться в каждой из п ячеек при любом расположении других частиц. а) Число благоприятных случаев расположения N частиц в N определенных ячейках равно числу 15
перестановок частиц в этих ячейках — N1 Таким образом, искомая вероятность 1L б) Число благоприятных случаев расположения N частиц в каких-то N ячейках равно числу различных сочетаний N ячеек из их общего числа м, помноженному на число перестановок N частиц. Таким образом, искомая вероятность n\ 2) В статистике Бозе — Эйнштейна для нахождения числа всех равновозможных случаев выстроим все ячейки в ряд. Гра- ницы ячейки определя- ются перегородками. Число всех перегоро- Рис- 1- док, очевидно, равно /2+1. Частица считается находящейся в ячейке, если она попадает между перегородками ячейки (рис. 1). Если при некотором данном распределении частиц между перегородками поменять между собой местами любые две или несколько частиц, то, ввиду принципиальной неразличимости частиц в статистике Бозе — Эйнштейна, нового распределения получено не будет. Точно так же не получится новых распределений, если менять между собой местами перегородки. Однако каждый раз, как поменяются местами перегородка (кроме двух крайних перегородок, которые закреплены) и частица, будет получаться новое распределение. Поэтому число всех равновозможных распределений равно т. е. числу перестановок из jV -(- п — 1 элементов (N частиц и п—\ перегородок), деленному на число перестановок между собой iV частиц и число перестановок между собой п — 1 перегородок. а) Число благоприятных случаев распределения частиц по одной в N определенных ячейках равно 1,
так как перестановки частиц между собой не дают новых распределений. Поэтому искомая вероятность б) Число благоприятных случаев распределения частиц по одной в N каких-то ячейках равно Сп, следовательно, искомая вероятность р= п\(п-\)\ {N + n — l)\(n-N)\ # 3) В статистике Ферми — Дирака частицы могут располагаться не более одной в ячейке. Поэтому число всех равновозможных случаев равно С«. Число благоприятных случаев задачи а), как и в статистике Бозе — Эйнштейна, равно 1. Искомая вероятность _ N\ (n - N)\ ~ п\ Число благоприятных случаев задачи б), как и в статистике Бозе — Эйнштейна, равно Сп* Искомая вероятность Р=1. Последний результат очевиден, так как любое распределение в статистике Ферми — Дирака является благоприятным для задачи б). Задача 5. N частиц случайным образом распределяется в п ячейках, а) Найти вероятность того, что в первой ячейке окажется N\ частиц, во второй ячейке N2 частиц и т. д., в /г-й ячейке Nn частиц. Кроме того, должно выполняться равенство Некоторые Л^ могут равняться нулю. б) Найти вероятность того, что в какой-то ячейке будет М\ частиц, в какой-то Nr частиц и т. д., в какой-то Nn частиц. Задача 5 является обобщением задачи 4. Решение. 1) В статистике Больцмана общее число равновозможных случаев распределения, как и в задаче 4, равно nN. Число благоприятных случаев задачи а) получим, выбрав некоторое благоприятно е 17
распределение и производя затем перестановки частиц. Каждая перестановка будет давать новое распределение, за исключением случаев, когда будут переставляться частицы, находящиеся внутри одной и той же ячейки. Поэтому число благоприятных случаев равно NX\N2\ ... Nn\ ' а искомая вероятность т ... Nnl # Чтобы получить число благоприятных случаев в задаче б), необходимо помножить число благоприятных случаев в задаче а) на число возможных различных перестановок чисел N\, N2, ..., Nn среди п ячеек. Если бы все эти числа были различны между собой, то число таких перестановок равнялось бы п\. Однако, если среди этих чисел имеются одинаковые, то их перестановки между собой не дают новых распределений. Поэтому число благоприятных распределений в задаче б) равно произведению A,08) на 1 Т Г-. U'09) где ki — число случаев кратности i среди чисел Nu N2, ..., Nn. Здесь также должно выполняться условие g 2 ki - i — n. /«=1 Искомая вероятность равна Mini nN-Nl\N2i ... ^rt!(ll)fel-B!)*2 ... (g\)k* ' 2) В статистике Бозе — Эйнштейна число равно- возможных случаев, как и в задаче 4, равно A,06). Число благоприятных случаев в задаче а) равно 1, так как частицы принципиально неразличимы и их перестановки новых распределений не дают. Искомая вероятность определяется формулой A,07). В задаче б) число благоприятных случаев дается выражением A,09), представляющим число различ- 18
ных перестановок количеств Nu N2, ..¦, Nn. Следовательно, искомая вероятность р_п\(п~ \)\№ 3) В статистике Ферми — Дирака в каждой ячейке не может быть больше одной частицы. Поэтому если не выполняется хотя бы одно из условий A,10) то искомая вероятность равна нулю. Если же условия A,Ю) выполняются, то задача 5 переходит в задачу 4. Задача 6. В зрительном зале п мест. Билеты нумерованы и все проданы. Зрители садятся на места случайным образом. Найти вероятность того, что ни один зритель не сядет на свое место. Решение. Общее число всех равновозможных распределений зрителей равно п\. Искомая вероятность равна где S(n) — число благоприятных случаев, т. е. таких случаев, когда ни один зритель не сидит на своем месте. Для нахождения S(n) применим метод индукции. Допустим, что п увеличилось на единицу. Каждый раз, как зрители на п местах расположились благоприятным образом, можно, меняя поочередно местами одного из этих зрителей со зрителем, купившим билет на п + 1 место, получать благоприятное распределение на п -J- 1 местах. Таким способом можно получить n-S(n) благоприятных распределений на п + 1 местах. Кроме того, в тех случаях, когда на п местах п — 1 зрителей сидят не на своих местах, а один на своем месте, перестановка местами последнего с п+ 1-м зрителем также будет давать благоприятное распределение на п + 1 местах. Число таких распределений равно nS(n— 1). Итак, - I). Используя A,11), получим (п + 1)! Р(п + 1) = пп\ Р(п) + п{п- 1I Р(п- 1), 19
откуда следует после сокращения на п\ и некоторых преобразований: Р(п) — Р(п — 1) п+ 1 ' Решение этого функционального уравнения легко уга дывается: П и i-\)k Произвольная постоянная с определяется из очевидного условия РB) = у, которое дает с—\. Итак, вероятность того, что ни один зритель не окажется на своем месте, равна Интересно отметить, что при п->оо эта вероятность е Задача 7. Пневматическое ружье вследствие неисправности случайно выстреливает при заряжании. Какова вероятность поражения круглой мишени радиусом 10 см, находящейся на расстоянии 10 ж, если все направления полета пули равновероятны? Решение. Метод, применяемый для решения задач подобного рода, называется геометрическим. Всех равновозможных направлений полета пули бесконечное множество. Бесконечно также число всех благоприятных направлений. Однако отношение числа благоприятных случаев к числу всех равновозможных случаев можно найти, считая, что это отношение равно отношению телесного угла мишени, который приблизительно равен 10 см \2 1Л-4 10 к полному телесному углу 4я. Искомая вероятность 0,000025. 20
Задача 8. Стержень двумя случайными точками делится на три части. Какова вероятность того, что из полученных частей можно составить треугольник? Решение. Примем длину стержня за 1. Обозначим расстояние первой точки деления от начала стержня через х, а расстояние второй точки деления через у. Если рассмотреть прямоугольную систему координат хОу (рис. 2), то все равновозможные согласно условию задачи пары значений х и у заполнят изображенный на рис. 2 квадрат с площадью, равной 1. Найдем область неблагоприятных случаев, т. е. таких пар значений х и у, когда из полученных отрезков нельзя составить треугольник. Треугольник нельзя составить, если один из отрезков больше или равен сумме двух других, т. е. если длина одного из отрезков ^ 0,5. Это будет иметь место, если: 1) х < 0,5 и у < 0,5, или 2) х ^ 0,5 и у > 0,5, или 3) \х — у\ > 0,5. Соответствующие этим трем условиям области на рис. 2 заштрихованы. Незаштрихо- ванные области соответствуют благоприятным случаям. Искомая вероятность равна отношению площади незаштрихован- ных областей к площади всего квадрата, Рис. 2 Рис. 3. Р = Задача 9. В любые моменты промежутка времени Т равновозможны поступления в приемник двух сигналов. Приемник будет забит, если промежуток времени между моментами поступлений сигналов меньше т. Определить вероятность того, что приемник будет забит. Решение. Пусть х и у моменты поступлений сигналов в приемник. На плоскости хОу (рис. 3) 21
область равновозможных значений х и у представлена квадратом площадью Т2. Область благоприятных значений удовлетворяет условию \х — | Эта область заключена между прямыми х у и у — х = т. Площадь области благоприятных значений равна Следовательно, искомая вероятность § 4. Статистическое определение вероятности события Необходимый для классического определения вероятности анализ — рассмотрение полной системы равновозможных событий и выделение тех из них, которые благоприятны для рассматриваемого события,— удается провести далеко не всегда. Например, событие, состоящее в том, что определенный атом радия распадется за время, не превосходящее t, пока не поддается исследованию в такой схеме. Поэтому определить вероятность этого события классическим методом нельзя. Также невозможно при помощи расчета определить вероятность того, что при формировании звезды она окажется двойной или что рожденный ребенок окажется мужского пола. Существует другой способ оценки вероятности случайного события—оценка при помощи опыта. Допустим, что комплекс условий, при котором может происходить рассматриваемое событие, многократно в точности повторяется сам или может быть многократно воспроизведен. Для краткости в таком случае мы условились говорить, что производятся испытания. Если при выполнении N\ испытаний событие А случилось п\ раз, то говорят, что относительная частота события А в этой серии испытаний равна Во второй серии испытаний относительная частота события А равна -jj-, в третьей — -у и т. д. 22
Обычно, если число испытаний в каждой серии достаточно велико, относительные частоты события А мало отличаются друг от друга. Например, относительная частота рождений младенцев мужского пола не отличается заметно от 0,51, если учтено достаточно большое число рождений. Статистика показывает, что относительная частота рождений мальчиков не зависит от местности или этнического состава населения. Она всегда превышает относительную частоту рождений девочек приблизительно на 0,02. Можно сказать, что относительная частота рождений мальчиков есть величина устойчивая. Если определить относительную частоту распада атомов Ra226 за 100 лет, то всегда будет получаться величина 0,04184. Здесь число испытаний в серии равно числу находящихся под наблюдением атомов радия. Это число в опыте огромно, и потому относительная частота распадов в высшей степени устойчива, ее изменения незаметны, так как перекрываются ошибками в определении числа всех атомов и числа распавшихся атомов. Вероятностью события называется величина, около которой группируются относительные частоты этого события. Таково статистическое определение понятия вероятности. Как легко уяснить, по значениям относительных частот можно получить лишь приближенное значение вероятности. Однако в некоторых случаях, например, для вероятности распада Ra226, когда число испытаний огромно, опыт может дать значение вероятности события с весьма высокой точностью. Можно также сказать, что вероятностью события является предел, к которому стремится относительная частота при неограниченном увеличении числа испытаний. § 5. Условная вероятность. Зависимые и независимые события Пусть при выполнении некоторого комплекса условий могут произойти случайные события А и В. Их вероятности соответственно равны Р(А) и Р(В). Допустим, теперь стало известно, что при выполнении Данного комплекса условий событие А произошло. 23
/ Относительно события В данных не получено. Однако теперь, после получения информации о совершении события Л, вероятность события В может стать другой, отличной от Р(В). Если, например, при бросании игральной кости вероятность выпадания единицы равна Ve» то после того, как стало известно, что выпало нечетное число, ве- рятность того, что выпала единица, возросла до Уз. Событие, состоящее в том, что случится событие В, когда известно, что произошло некоторое событие Л, условимся обозначать В/А. Соответствующую вероятность — Р(В/А) называют условной вероятностью — вероятностью события В при условии, что событие Л произошло. Если знание того, что событие Л случилось, не изменяет вероятности события В, о i X Рис. 4. Р (В/А) = Р (В), A,13) то событие В называется независимым от события Л. Независимость является свойством взаимным, т. е,, если справедливо A,13), то выполняется и Р (А/В) = Р (Л), будет доказано в следующем пара- Р{А/В)ФР(А), Р (В/А) Ф Р (Я), Это свойство графе. Если же то события А и В называются зависимыми. Задача 10. В задаче 8 наряду с событием Л — возможностью построения треугольника из частей стержня, рассмотреть событие б, состоящее в том, что хотя бы одна из точек деления находится на расстоянии, меньшем -j" 0T начала стержня. Определить, являются ли события А я В взаимно независимыми?
Решение. Рис. 4 показывает область точек на плоскости хОу, благоприятных событию В. Площадь 7 7 этой области равна у^-. Следовательно, р (?)== —. Для определения Р (А/В) нужно найти отношение площади незаштрихованной области на рис. 4 (сравни с рис. 2) ко всей площади на этом рисунке: Для определения Р(В/А) нужно найти отношение площадей незаштрихованных областей на рис. 4 и 2: Р (В/А) = |. Так как то события А и В зависят друг от друга. Соответственно и § 6. Теоремы сложения и умножения вероятностей Пусть А и В — события, которые могут происходить при выполнении некоторого комплекса условий. Рассмотрим также события АВ, АВ, АВ, А В, \ , } U>14) П2, Согласно принятым в § 1 обозначениям, первое из этих событий состоит в том, что произошли оба события А и 5, второе состоит в том, что событие А произошло, а событие В не произошло и т. д. Очевидно, что события A,14) составляют полную систему событий, так как они несовместимы и при выполнении комплекса условий одно из них обязательно произойдет. Теперь допустим, что удалось рассмотреть полную систему п равновозможных событий, из которыхjco- бытию АВ благоприятны rt\ событий, событию АВ — ^2 событий и т. д., как это соответственно подписано 25
под обозначениями событий в A,14). Поскольку A,14) составляют полную систему событий, то п{ + п2 + п3 + п4 = п. A,15) Соответствующие вероятности рассмотренных событий равны ^, A,16) , A,17) , A,18) %. A,19) Теперь заметим, что в данной полной системе равновозможных событий событию А благоприятны #1 + ^2 равновозможных событий (так как А произойдет, если произойдет АВ или ЛЯ), а событию В благоприятны П\ -\- ^з равновозможных событий. Следовательно, р {А) = 52-. A,21) Далее, рассмотрим событие A -f 5, состоящее в том, что случится хотя бы одно из событий А и В. Ему благоприятны П\ + Я2 + ^з равновозможных событий и, следовательно, *i + *2 + *8b A,22) Сравнивая A,16), A,20), A,21) и A,22), находим Р(А + В) = Р{А) + Р{В) -Р(АВ). A,23) Это и есть теорема сложения вероятностей. В частном случае, если события А и В несовместимы, Р(ЛБ) = 0, A,23) принимает вид Р(А + В) = Р(А) + Р(В). A,24) Справедливо и обратное заключение: если выполняется A,24), то события А и В несовместимы. Найдем теперь вероятность события А/В. Если известно, что произошло событие В, значит, случилось одно из п\ -f пъ равновозможных событий. Следова- 26
тельно, число всех равновозможных событий теперь уже равно П\ + я3. Из них событию А благоприятны П\ событий. Поэтому Р(А/В)= п2 . A,25) Аналогично, Р(В/А)= п2 . A,26) Сравнивая A,16), A,20) и A,26), получим Р(АВ) = Р(А)Р(В/А). A,27) Это есть теорема умножения вероятностей. В частном случае, если событие В независимо от события Л, Р(В/А) = Р{В), A,28) равенство A,27) принимает более простой вид Р(АВ) = Р(А)-Р{В). A,29) Аналогично, сравнивая A,16), A,21) и A,25), можно было бы написать Р(АВ) = Р(В)-Р(А/В). A,30) Сравнение A,27) и A,30) дает равенство Р(А)-Р (В/А) = Р{В)-Р (А/В), которое показывает, что A,28) влечет за собой Р(А/В) = т. е. независимость событий есть свойство взаимное, как это уже утверждалось без доказательства в предыдущем параграфе. Итак, если события А и В независимы, теорема умножения вероятностей принимает вид A,29). Справедливо и обратное заключение, которое в дальнейшем играет важную роль: если выполняется равенство A,29), то события А и В независимы друг от Друга. Теорему умножения вероятностей легко распространить на случай, когда событий больше двух. Например, для трех событий Р (ABC) = Р (АВ) • Р (С/АВ) — • Р(В/А) ¦ Р(С/АВ) 0,31) 27
и, если все события взаимно независимы, Р{АВС) = Р(А) - Р(В) • Р(С). Для п независимых событий А\, А%у ..., Ап имеем A,32) Распространим и теорему сложения A,23) вероятностей на случай большего двух числа событий Р {А + В + С) = Р (А + 5) + Р (С) - Р [(А + В) • С]> Вследствие выполнения распределительного закона A,01) и потому после простых преобразований получаем С) = Р(А) + Р(В) + Р(С)- Р(АВ) -Р{ВС) — Р(СА) + Р(АВС). A,33) Если число рассматриваемых событий больше трех, то правая часть этого равенства имеет еще более сложный вид и ее неудобно применять для вычислений. Проще использовать равенство ) A,34) справедливость которого очевидна и которое в случае взаимной независимости событий Ль А%, .._., Ап (тогда взаимно независимы и события Аи ..., Ап) принимает вид A,35) Если же события Аи Л2, ..., Ап несовместимы, то теорема сложения вероятностей имеет, как и A,29), простейший вид Задача 11. Из двух отдельных хорошо стасованных колод вытаскивается по карте. Определить вероятность того, что: 1) обе карты окажутся масти пик, 2) хотя бы одна из карт окажется масти пик. 28
Решение. 1) Поскольку колоды отдельные, извлечение карты масти пик из одной колоды не влияет на вероятность извлечения карты масти пик из другой колоды, поэтому, согласно теореме умножения в форме A,29): 1LL 2) Согласно теореме сложения A,23) Т + Т— — = —. Задача 12. Из двух стасованных совместно колод извлекаются две карты. Определить вероятность того, что: 1) обе карты масти пик, 2) хотя бы одна из карт масти пик. Решение. 1) В этой задаче, в отличие от предыдущей, появление карты масти пик при извлечении первой карты изменяет вероятность появления карты масти пик при извлечении второй карты, поэтому нужно применять равенство A,27) 2) Согласно теореме сложения A,23) 1 25 4 ' 4 412 412 ' Задача 13. По многолетним наблюдениям известна статистическая вероятность того, что в районе обсерватории ночь будет ясной. В феврале она равна 0,18, в марте — 0,24 и в апреле — 0,36. Наблюдатель будет иметь в своем распоряжении инструмент в ночь с 5-го на 6-е и с 20-го на 21-е каждого из этих месяцев. Найти вероятность того, что программа наблюдений будет выполнена, если для ее выполнения требуются: 1) одна ясная ночь, 2) две ясные ночи. Решение. Так как предоставленные астроному ночи наблюдений отделены друг от друга значительным периодом — 15 дней, можно считать, что вероятность следующей ночи наблюдений быть ясной не зависит от того, была ли ясной предыдущая ночь наблюдений. Рассматриваемые события независимы. 1) Удобно использовать равенство A,35) * V4 ~Ь ^2 ~Ь В\ ~Ь В2 ~Ь Сi -}- C<z) = = 1 — 0,82 • 0,82 • 0,76 • 0,76 • 0,64 • 0,64 s& 0,84. 29
2) И в этом случае искомую вероятность удобнее сосчитать, вычтя из единицы вероятности того, что ни одна ночь не будет ясной и что только одна ночь будет ясной: Р= 1 - 0,16 - 2 • 0,18 • 0,82 • 0,762 • 0,642 - 2 • 0,822 X X 0,24 • 0,76 • 0,642 - 2 • 0,822 • 0,762 • 0,36 • 0,64 ^ 0,49. Задача 14. В некоторой местности вероятность того, что погода в данный день будет такой же, как и в предыдущий, равна р. Вероятность того, что первый день года дождливый, равна Р. Найти вероятность того, что /2-й день — дождливый, и найти предел рп при п—> оо. Решение. Событие, состоящее в том, что п— 1-й день дождливый и п-п день также дождливый, имеет вероятность /?n_i-/?. Вероятность события, состоящего в том, что л—1-й день недождливый, а п-и дождливый, равна A—pn-i) A—р)- Событие <ш-й день дождливый» состоится, если осуществится одно из этих двух несовместимых событий. Следовательно, или —р). Применяя эту рекуррентную формулу п—1 раз, получим рп=Bр-1)п~1-Р + nl\-p), A,37) что и дает решение задачи. Так как \2р—1|< 1, то при п->оо первый член правой части A,37) стремится к нулю, а сумма геометрической прогрессии в квадратной скобке — к on — \ • Таким образом, при n->oo prt->— что и следовало ожидать. Задача 15. При условии, совпадающем с условием задачи 6, найти вероятность того, что ровно т зрителей (т ^ п) будут сидеть на своих местах. Решение. Вероятность того, что определенные т зрителей будут сидеть на своих местах, равна (п — т)\ 7л • 30
Вероятность того, что остальные п — т зрителей при этом окажутся сидящими не на своих местах, согласно задаче 6, равна /2—т ы ' По теореме умножения вероятность того, что определенные т зрителей окажутся на своих местах, а остальные зрители — не на своих местах, равна п—т (л — т)\ п\ 0,38) Но из п зрителей определенные т зрителей могут быть выбраны различными С™ способами. Как бы ни были выбраны эти т зрителей, вероятность того, что они окажутся на своих местах, а остальные зрители— не на своих местах, определяется выражением A,38). Все эти случаи несовместимы. Поэтому вероятность того, что какие-то т зрителей окажутся на своих местах, а остальные п — т зрителей — не на своих местах, равна, согласно теореме сложения вероятностей, произведению A,38) на С%. В результате искомая вероятность п—т (-0* ml jU k\ Задача 16. Вероятность распада радиоактивного атома за время dt равна К dt. Какова вероятность распада атома за время /? Решение. Вероятность того, что атом не распадется за время dt, равна 1 — ЯЛ. A,39) В промежутке времени / промежуток времени dt содержится -7т раз. Вероятность того, что за время t атом не распадется, равна, согласно теореме умножения, произведению -^ множителей A,39): t {l-Xdt)dt. A,40) 31
Считая dt бесконечно малым, получим из A,40) после предельного перехода е-Ч A,41) Искомая вероятность р, таким образом, равна р == 1 е~ . § 7. Формула полной вероятности Рассмотрим полную систему событий Аи Л2, ..., Ak. A,42) Если известны вероятности I, Р(Л2), ..., Р(ЛА) этих событий, то полная система событий считается заданной. Рассмотрим также некоторое событие Я. Если при выполнении данного комплекса условий событие Н не невозможное событие, то оно совместимо хотя бы с одним из событий A,42). Рассмотрим теперь систему событий АХН% А2Н, ..., AkH. A,43) События A,43) несовместимы между собой, но они не составляют полной системы событий, если событие Н не достоверное событие. Чтобы событие Н случилось, необходимо и достаточно, чтобы случилось одно из событий A,43). Поэтому по теореме сложения вероятностей () A,44) Но по теореме умножения Окончательно находим A,45) Задача 17. Среди наблюдаемых спиральных галактик 23% принадлежат подтипу Sa, 31%—подтипу Sb и 46%—подтипу Sc. Вероятность вспышки 32
в течение года сверхновой звезды в галактике Sa составляет 0,0020, в галактике Sb — 0,0035 и в галактике Sc—0,0055. Найти вероятность вспышки в течение года сверхновой в далекой спиральной галактике, подтип которой определить не удается. Решение. Согласно данным о доле каждого подтипа спиральных галактик среди всех наблюдаемых галактик вероятности того, что данная далекая галактика принадлежит к каждому подтипу, соответственно равны Р (Sa) = 0,23, P (Sb) = 0,31, P (Sc) = 0,46. A,46) Поэтому по формуле A,45) р = 0,23 • 0,0020 + 0,31- 0,0035 + 0,46 • 0,0055 = 0,0041. § 8. Теорема Байеса В общем случае вероятности Р(Я/Лг), которые события Ai сообщают событию //, различны. Допустим теперь, что стало известно о случившемся событии Н при выполнении комплекса условий, но неизвестно, какое при этом случилось событие из полной системы A,42). Можно утверждать, что теперь вероятности P(AJH) отличны от прежних Р(А{). Должны возрасти вероятности тех из событий A,42), которые сообщали большие вероятности событию Я, и уменьшиться вероятности событий, сообщавших событию Н малые вероятности. Для решения поставленной задачи напишем, согласно теореме умножения вероятностей P(AtH) =P(At) • P(H/At) = P(H) • P(At/H). A,47) Решим A,47) относительно Р(А(/Н) и используем равенство A,44): Р(А</Н) = PM-PWAi) , (lf48) Полученная формула носит название теоремы Байеса. Она позволяет определить новые вероятности событий Аи если известно, что событие Н случилось. В частном случае, если 33
формула A,48) упрощается: P(At/H)= kP{H/Al) , A,49) Так как знаменатель правой части от значка i не зависит, то A,49) показывает, что если до того, как стало известно о случившемся событии Я, вероятности событий А были равны, то после того как стало известно, что событие Н случилось, вероятности событий становятся пропорциональными тем вероятностям, которые они сообщали событию Н. Задача 18. В соответствии с условиями задачи 17 определилось, что в течение года наблюдений далекой спиральной галактики в ней обнаружена вспышка одной сверхновой звезды. Найти теперь вероятность того, что галактика принадлежит подтипу Sa, Sb, Sc. Решение. Согласно теореме Байеса A,48) 0.23-0,0020 _ 97 >27' 0,0041 (Sc///) = М?$? - 0,62. Как и следовало ожидать, по сравнению с A,46) вероятность Sa уменьшилась, а вероятность Sc возросла. § 9. Вероятность сложного события Рассмотрим полную систему событий A,42). Обозначим вероятности этих событий соответственно Каждый раз, как выполняется необходимый комплекс условий (производится испытание), случается одно из событий A,42). Определим вероятность рп{м>и ni2, ...,mfe) того, что при п испытаниях событие А\ случится ГП] раз, событие Л2 — т2 раз и т. д., событие Ah — fTik раз. При этом безразлично, в какой последовательности происходят события. Так как в каждом 34
испытании одно из событий A,42) неизбежно осуществляется, то должно быть k 2 rrti =n. A,50) Для решения задачи определим сначала вероятность того, что случится одна определенная последовательность событий Ai при п испытаниях, в результате чего каждое из событий Л* произойдет требуемое количество раз. Согласно теореме умножения вероятность такой последовательности равна A,51) Этой же величине равна вероятность любой последовательности событий, дающей требуемые количества событий Aim Поэтому искомая вероятность согласно теореме сложения равна A,51), умноженному на число различных последовательностей событий, дающих события Лг- требуемое число раз. Число удовлетворяющих условию различных последовательностей можно получить, выбрав одну из таких последовательностей и определив в ней число всех перестановок, дающих новые последовательности. Число всех перестановок из п элементов равно п\. Но так как, поменяв местами два одинаковых события, мы не получим новой последовательности событий, число всех различных перестановок равно п\ т{\ т2! ... mk\ Таким образом, A,52) Эта формула называется формулой вероятности сложного события. Если требуется определить вероятность того, что событие А, вероятность которого случиться в одном испытании равна р, при п испытаниях случится т раз, необходимо рассмотреть полную систему событий Л, Л. Тогда согласно A,52) "», A,53) 35 Л
где <7=1-р A,54) есть вероятность события Л случиться в одном испытании. Задача 19. Стрелок целится в яблочко мишени и стреляет. Вероятность для него попасть в яблочко равна 0,2, а в остальную часть мишени — 0,5. Найти вероятность того, что при 10 выстрелах 4 пули окажутся в яблочке и 4 — в остальной части мишени. Решение. Рассмотрим также событие — промах, вместе с которым события — попадание в яблочко и попадание в остальную часть мишени, составят полную систему событий. Вероятность промаха — 0,3. Согласно E1) ЛоD, 4, 2) = -^^ • 0,24 • 0,54 • 0,32~ 0,028. Задача 20. Прибор имеет б ламп, вероятность каждой из которых перегореть при данном повышении напряжения в цепи равна 0,3. При перегорании трех ламп или менее прибор из строя не выходит. При сгорании четырех ламп вероятность выхода прибора из строя равна 0,3, при сгорании пяти ламп — 0,7, при сгорании шести ламп—1. Определить вероятность выхода прибора из строя при повышении напряжения. Решение. Вероятности выхода из строя четырех, пяти и шести ламп соответственно равны: ^г • 0,34 • 0,72 ^ 0,0595, рбF) == |~ • 0,36 ^ 0,0007. По формуле полной вероятности A,45) находим ве роятность выхода из строя прибора: = 0,0595 • 0,3 + 0,0102 ¦ 0,7 + 0,0007 • 1 ?* 0,0257,
ГЛАВА II СЛУЧАЙНАЯ ВЕЛИЧИНА § 10. Случайная величина с дискретным распределением Переменная величина, принимающая различные значения в зависимости от случая, называется случайной величиной. Допустим, что некоторая величина X может принимать значения Каждый раз, как выполняется некоторый комплекс условий, величина X принимает одно из значений B,00). Пусть при этом вероятности для X принять то или иное из значений B,00) соответственно равны Ри р2» ...» Pk Очевидно, должно выполняться B,02) Если вероятности B,01) известны, то говорят, что распределение случайной величины X известно и что случайная величина X задана. Можно сказать, что, как и в случае A,42), задается полная система событий и события состоят в том, что случайная величина принимает то или иное из значений B,00) с вероятностями B,01). Случайная величина называется дискретной, если значения, которые она может принять, можно пронумеровать. Число этих значений может быть и неограниченным, нужно лишь, чтобы мог быть указан метод нумерации, при котором не будет пропущено ни одного возможного значения случайной величины. Иначе говоря, дискретной случайной величиной называется такая случайная величина, которая может 37
принимать значения, образующие счетные множества. Распределение дискретной случайной величины называется дискретным распределением. Примером дискретной случайной величины может, например, быть число фотонов, излучаемых атомом водорода при каскадном переходе из я-го возбужденного состояния в основное состояние. Число фотонов при этом может равняться 1, 2, ..., п и является случайной величиной. Дискретной случайной величиной будет также энергия первого фотона, излученного при каскадном переходе. Другим примером дискретной случайной величины является число солнечных пятен с площадью, большей некоторого заданного значения S, наблюдаемых в течение дня на солнечном диске. Случайной величиной является также число лепестков в цветке сирени. Как известно, вероятность того, что у случайно выбранного цветка сирени имеется четыре лепестка, близка к единице, вероятности наличия трех и пяти лепестков малы, а вероятности наблюдения других значений числа лепестков ничтожно малы. В водородном газе при некоторой заданной температуре атомы могут находиться как в основном состоянии, так и в возбужденных состояниях. Возбужденных состояний бесчисленное множество, но они распределены дискретно и имеют точку сгущения, определяемую потенциалом ионизации. Следовательно, число возбужденных состояний атома водорода счетно. Случайная величина — номер возбужденного состояния (основное состояние будет иметь номер 0) некоторого наудачу выбранного атома является дискретной случайной величиной с бесконечно большим числом значений. Интегральным законом распределения или интегральной функцией распределения случайной величины X называется функция F(x), равная вероятности Р (Х<.х), т. е. вероятность того, что случайная величина X примет значение, меньшее х: = P(X<x). B,03) Очевидно, что S B,04) 38
где суммирование ведется по всем t\ для которых Функция F(x) является монотонно возрастающей функцией, так как при возрастании х к правой части B,03) могут только добавиться положительные члены— вероятности событий. При изменении х от — оо до +°° функция F(x) растет от 0 до +1 и имеет ступенчатый вид, как это для примера показано на о Рис. 5. X рис. 5. Если возможные значения X ограничены снизу величиной Мь то F{Mi) = 0. Если возможные значения X ограничены сверху величиной М2, го F(M2 + A) = 1, где А — положительная величина. Если а < 6, то на основании теоремы сложения вероятностей справедливо равенство Р(Х < а) + Р(а<X < Ь) = Р(Х < 6), откуда на основании B,03) следует F (Ь) - F (а) — Р (а < х < 6), B,05) т. е. вероятность для случайной переменной принять значение, лежащее между а и Ь, равна разности интегральных функций распределения для значений b и а. Задача 21. Электролампа многократно включается и выключается. Вероятность перегорания лампы при одном включении и выключении равна р. Рассмотреть случайную величину — порядковый номер включения и выключения, при которых лампа перегорит, и найти ее распределение. Решение. Эта случайная переменная имеет, очевидно, бесконечно большое число возможных значений. 39
Вероятность того, что лампа перегорит при k-м включении и выключении, равна произведению вероятности того, что она не перегорит при k — 1 первых включениях и выключениях, на вероятность того, что при k-M включении и выключении она перегорит: k{ k=l, 2, ... Следовательно, возможные значения случайной переменной 1 9 k имеют соответственно вероятности р> A — р) • р, ..., A — p)k~x • р, ... Вероятность лампе не перегореть после k включений и выключений равна A — р)к, поэтому интегральный закон распределения =l, 2, ..., что можно получить и суммированием вероятностей значений случайной переменной до k— 1. Задача 22. Известно, что отношение числа кратных систем звезд с кратностью k к числу кратных систем звезд с кратностью k — 1 приблизительно постоянно (не зависит от k) и равно b < 1. В предположении, что этот закон выполняется строго, рассмотреть в качестве случайной переменной кратность системы, которой принадлежит случайно выбранная звезда, и найти ее распределение. Решение. Число систем кратности k согласно условию равно cbk~\ где с — число одиночных звезд. Число звезд в системах кратности k равно ckbk~~l. Вероятность того, что случайно выбранная звезда принадлежит системе кратности k, равна оо k-l Так как знаменатель равен A __ ^ > то что и определяет распределение случайной перемен ной k. 40
§11. Биномиальное распределение Примером дискретной случайной величины является число появлений события А при выполнении п испытаний. Возможными значениями этой случайной величины т являются ) ? , • . . J fly а соответствующие вероятности вычисляются по формуле A,53): Рп Условие B,02) легко проверяется. В самом деле, поскольку A,53) представляет собой выражение для общего члена разложения бинома Ньютона, то, имея в виду, что р + q = 1, находим п п V1 / \ V п]- т п-т I I \п 1 /1Рп\М')'== /,—гт \Г Р Q == (О -4- О) =1. т=0 т—0 Таким образом, выражение A,53) определяет распределение случайной величины — числа появлений события А при п испытаниях. Это распределение, вследствие того, что оно имеет такой же вид, как и общий член разложения бинома Ньютона, называют биномиальным распределением. Если число испытаний п велико, а вероятность р реализации события А в одном испытании не очень близка к нулю и не очень близка к единице, то маловероятно, чтобы событие А при п испытаниях случилось очень малое число раз или число раз, близкое к п. Очевидно, что при т, равном малому числу единиц, вероятность рп{т) растет с увеличением т, а для т, близких к м, она убывает при увеличении т. Можно предположить, что для какого-то значения т вероятность рп{т) достигает максимума. Для определения этого максимума отметим, что если он достигается при значении т, то должны быть справедливы два неравенства: Uм1 III Т 1 I Уп \ III, I
Вычисляя при помощи A,53) левые части B,06), находим m+1 H07) /i —m р ^ ' л-m+l Решая эти неравенства относительно т и учитывая, что р-\-q = 1, получаем для значения т, при котором рп(т) достигает максимума, неравенства — q\ т <пр + р. B,08) Отрезку [/!/? — q,np -\- р] в общем случае может принадлежать только одно целое число, в частном же случае, если концы интервала есть целые числа, то два целых числа. Таким образом, максимум рп{т) достигается в общем случае в одной точке, а в некотором частном случае — в двух точках. Часто вместо случайной величины т целесообразно рассматривать случайную величину т которую удобно назвать относительной частотой события Л. Когда п велико, из неравенств B,08) следует приближенное равенство ~ - Р. B,09) т. е. наивероятнейшим значением относительной частоты является вероятность события случиться в одном испытании. Задача 23. Найти наивероятнейшее число появлений единиц при бросании игральной кости 3000 раз. Решение. Так как в этой задаче р==-^-, то согласно B,09), наивероятнейшим числом появлений единицы является 500. Задача 24. Чтобы узнать число рыб в озере, отлавливают 1000 рыб, метят их и выпускают обратно в озеро. При каком числе рыб в озере будет наибольшей вероятность встретить среди вновь пойманных 150 рыб 10 меченых? Решение. После возвращения меченых рыб в озеро вероятность того, что выловленная рыба бу- 42
1000 гт * дет меченой равна —тт-, где /V —число рыб в озере. Из равенства B,09) -г~- = —тр- находим N = 15 000. Часто также рассматривают случайную величину т которая представляет собой отклонение относительной частоты от наивероятнейшего значения. § 12. Непрерывная случайная величина Допустим, что возможными значениями случайной величины X являются любые значения из некоторого промежутка [а, Ь]. Назовем интегральным законом распределения этой случайной величины, как и для дискретной случайной величины, функцию, определяющую вероятность того, что случайная величина примет значение, меньшее х, F(x) = P(X<x). B,11) Предположим также, что существует такая функция f(x), что для любых значений х выполняется равенство х B,12) — оо из которого также следует B,13) Будем называть случайную величину, отвечающую этому требованию, непрерывной случайной величиной. Функция f(x) называется дифференциальным законом распределения или дифференциальной функцией распределения случайной величины. Для того чтобы понять ее смысл, напишем на основании B,11) и B,12) ь = jf(x)dx. B,14) а 43
Приняв х = а, а х + dx = Ъ, получим x+dx J B,15) Таким образом, произведение f(x) на dx с точностью до бесконечно малых высших порядков равно вероятности того, что случайная переменная примет значение, заключенное между х и x-\-dx. Вследствие этого для функции f(x) наряду с термином дифференциальный закон распределения употребляют также название плотность вероятности. Целесообразность этого названия следует из такой аналогии. Если рассматривается стержень с переменной линейной плотностью (массы) f(x)y то, как известно, выражение B,14) дает массу стержня, заключенную в промежутке [а, Ь], а выражение B,15) —массу стержня в промежутке [х, x-\-dx]. Поэтому, поскольку в нашей задаче левые части равенств B,14) и B,15) определяют вероятности, то функцию f(x) уместно назвать плотностью вероятности. Из того, что вероятность для непрерывной случайной величины принять значение, заключенное между х и х -j- dx, равна f (x) dx, следует, что вероятность для нее принять некоторое фиксированное точное значение всегда равна нулю, так как при этом следует считать, что dx = 0. Вероятность для любого промежутка [х, х -f dx] есть неотрицательная величина, следовательно, и плотность вероятности — неотрицательная функция f(x)>0. Поскольку lim F(x)=l, то J f{x)dx=\. B,16) — оо Плотность вероятности есть функция, нормированная к единице. Если случайная величина может прини- 44
мать значения только в промежутке [а, 6], то условие нормировки можно написать в виде f(x)dx= I. B,17) а вероятности I О Рис. 6. Однако его всегда можно писать и в виде B,16), имея в виду, что вне промежутка [а, Ь] плот- ность f(x)=O. Произведение f(x)dx есть вероятность, т. е. величина безразмерная. Дифференциал dx имеет размерность случайной величины. Следовательно, плотность вероятности имеет размерность случайной величины в степени —1. График функции F(x) для непрерывного распределения имеет примерно вид, приведенный на рис. 6. Непрерывная случайная функция считается заданной, если известна ее функция распределения (F(x) или f(x)). Задача 25. Найти функцию распределения угла между закрепленной полупрямой и полупрямой, все направления которой в пространстве равновероятны. Решение. Понятие равновероятности всех направлений полупрямой в пространстве определяется следующим образом. Пусть полупрямая каждый раз выходит из некоторой точки. Проведем из этой точки произвольным радиусом г сферу. Мы будем говорить, что все направления прямой равновероятны, если вероятность того, что полупрямая пройдет через любую область сферы, пропорциональна площади поверхности этой области и не зависит от ее формы. (Если это условие выполняется, то при многократном испытании точки пересечения полупрямой со сферой будут стремиться равномерно заполнять сферу.) Полупрямую с фиксированным направлением также проведем из центра сферы. Рассматриваемая слу- 45
чайная величина — угол между двумя полупрямыми — может принимать значения из промежутка [О, я]. Вероятность того, что она примет значение, заключенное между а и а + da> равна вероятности попадания подвижной полупрямой в заштрихованное на рис. 7 кольцо f (a) da = c2nr sin а da. Коэффициент с, определяемый из условия нормировки B,16), получается равным -т—, поэтому окончательно / (a) 1 sin а da, а плотность вероятности / (а) = -~ Нетрудно понять, что функция распределения угла между двумя полупрямыми, для каждой из которых все направления в пространстве равновероят- 1 . ны, также равна у sin а. Замечание. Если бы рассматривалась случайная величина — угол между двумя прямыми (не направленными), то промежуток возможных значений был бы 0, -~1 и после нормировки / (a) da = sin а da. Задача 26. Найти функцию распределения угла между фиксированной плоскостью и прямой, все направления которой в пространстве равновероятны. Рис. 7. Решение. Рассматриваемая случайная пере- 3 может принимать значения в промежутке Проведем на рис. 7 фиксированную плоскость перпендикулярно к фиксированной прямой. 46 менная п [о,
Тогда fC) rf|5 = с 2тсг cos и после нормировки / (Р) dp = cos p dp. Легко видеть, что функция распределения угла между фиксированной плоскостью и прямой, все направления которой равновероятны, также равна cos р. Задача 27. В соответствии с условиями задачи 16 найти функцию распределения времени распада радиоактивного атома. Решение. Вероятность того, что распад произойдет в интервале времени (t, t-\-dt\ равна вероятности того, что он не произойдет за время ty умноженной на вероятность того, что атом распадется за следующий промежуток времени dt. Следовательно, § 13. Функция случайной величины Рассмотрим наряду со случайной величиной X некоторую функцию от нее: Y = r\(X). B,18) Каждый раз, как X принимает некоторое значение, в соответствии с B,18) принимает некоторое значение и У. Очевидно, что У также является случайной переменной, причем если X — дискретная случайная величина, то и У — дискретная случайная величина, а если X — непрерывная случайная величина и г] (X) — непрерывная функция, то и У —непрерывная случайная величина. Поставим задачу нахождения функции распределения У, если известна функция распределения X, Ограничимся при этом случаем, когда г\(Х) является монотонно изменяющейся функцией и, следовательно, X и У взаимнооднозначно определяют друг друга. Этот случай имеет основное прикладное значение. Для дискретных случайных величин задача тривиальна. В самом деле, если возможные значения X имеют, соответственно, вероятности Ри Рг* • • •> Рп 47
то, поскольку каждое у\ наступает тогда, когда случается соответствующее хи вычисленные по B,18) возможные значения У У и У2> • • •> Уп имеют, соответственно, те же вероятности. Чтобы решить задачу для непрерывной случайной величины, рассмотрим два случая: 1) Функция ц(Х)—монотонно возрастающая. Тогда, очевидно, если х и у удовлетворяют равенству B,18), то для интегральных функций распределения имеем простое равенство B,19) 2) Функция ц(Х)—монотонно убывающая. Тогда, если х и у удовлетворяют равенству B,18), для интегральных функций распределения справедливо равенство ,B,20) что решает задачу для интегральных функций распределения. Приравняв дифференциалы обеих частей B,19), получим f()d f()d B,21) что дает соотношение между плотностями вероятностей случайных переменных. Приравняв дифференциалы обеих частей B,20), мы снова получим B,21). Знак минус, который при дифференцировании должен был появиться в правой части, заменен знаком плюс, и dy, который был в данном случае отрицательным, берется по абсолютной величине. Таким образом, обе функции и оба дифференциала, фигурирующие в B,21), всегда считаются положительными. Разрешим теперь B,18) относительно X: X = t(Y). B,22) Тогда на основании B,21) и B,22) получаем U (У) dy = \№ (У)\ Г (У) I dy, B,23) что и дает решение задачи. Знак абсолютной величины поставлен, чтобы и при монотонно убывающей ?(У) плотность вероятности случайной величины у была положительной. 48
На практике переход в правой части B,21) от х к у нужно производить каким-нибудь удобным способом, используя равенство B,18). Задача 28. В центре основания кругового цилиндра с радиусом г находится источник излучения. Найти функцию распределения случайной величины — высоты h попадания фотона в стенку цилиндра. Решение. Все направления полета фотона можно считать равновероятными, поэтому (см. задачу 26) функция распределения угла между направлением полета фотона и плоскостью основания цилиндра /(р) = cos |3. Далее, имеем h = rtg$. Поэтому f{ (h) dh = f (p) dp = cos p dp = r2 (r2 + h2) 2 dh. Задача 29. Дифференциальная функция распределения (плотность вероятности) частоты в излучении абсолютно черного тела имеет вид hv * e^ - 1 где h — постоянная Планка, k — постоянная Больц- мана, Т — абсолютная температура, В— постоянная, определяемая условиями нормировки. Найти функцию распределения излучения черного тела по длинам волн. Решение. Длина волны X связана с частотой соотношением v = c/h. Поэтому ekT-\ § 14. Дельта-функция Дирака Определим функцию 8{х) следующим образом. Пусть б (х) = 0, если х ф О, а B,24) ь j6(jic)rfjK:=l, если а < О, Ь > 0. а 49
Эта функция называется дельта-функцией Дирака или просто — дельта-функцией. Очевидно, из условий B,24) следует, что 6@) = оо. Докажем, что Ф (х) 6 (х — х0) dx = ф (х0), —оо если ф(л:) непрерывна в лт = л:0. Для этого, используя свойства B,24), напишем J Ф (#) б (х — xQ) dx — Г ф (х) б (х — х0) dx = —оо ф(*о) | 6{x~xQ)dx+ J [ф(х) — Ф(л:о)]6(л:—xo)dx Xo—h = Ф (xQ) + J [ф (x) — ф (x0)] 6(x — x0) dx. Xo—h Если выбрать h достаточно малым, то во всем интервале интегрирования ф(ЛГ) — ф(лГо)|<8 и, следовательно, xo+h Г [ф (х) — ф (х0)] 6 (л: — х0) dx <е Г 6(х—xo)dx Утверждение доказано. Дельта-функцию можно использовать для введения плотности вероятности в случае дискретной случайной величины X. В самом деле, покажем, что f (*) = 2 Prf (* - *i) B,25) можно рассматривать как плотность вероятности X. 50
Согласно B,12) интегральный закон распределе ния определится равенством X X = f — оо i i — оо Если л: > хи то соответствующая вероятность pi входит в знак суммы в правой части B,26). Если же X < Хи ТО — оо и соответствующее р% в сумму B,26) не входит. Таким образом, получаемая F(x) совпадает с B,04) — интегральным законом распределения для дискретной случайной величины, следовательно, f(x) есть плотность вероятности. Совершенно так же, например, убеждаемся в справедливости равенства ъ ь = \ 2j pib(x—Xi)dx = 2jPi j 6 (я — xt)dx. a i i a Введение при помощи дельта-функции плотности вероятности дискретной случайной величины позволяет применять одну и ту же форму записи операций для дискретных и непрерывных случайных величин. Задача 30. Определить плотность вероятности для случайной величины — числа, появляющегося при бросании игральной кости. Решение. Случайная величина принимает значения 1, 2, ..., б, каждое с вероятностью -jr. Поэтому б Задача 31. Определить плотность вероятности скорости частицы относительно центра инерции системы, состоящей из двух движущихся навстречу друг другу со скоростью а потоков частиц. Частицы, принадлежащие одному потоку, имеют равные скорости, и число частиц в потоках одинаково. 51
Решение, п частиц имеют скорость а и столько же частиц имеют скорость —а, поэтому §15. Математическое ожидание функции случайной величины Если f(x) есть плотность вероятности случайной переменной X, а ц(Х)— некоторая функция этой случайной переменной, то величина Мц(Х), определяемая равенством оо Mr\(X)= J i\(x)f(x)dx, B,27) — оо называется математическим ожиданием функции ц(Х). Прописная буква М, ставящаяся перед обозначением функции, используется как знак математического ожидания. Математическое ожидание функции случайной переменной не есть случайная величина. Это постоянная величина, определяемая согласно B,27) функцией ц и законом распределения случайной величины. Она имеет смысл среднего ожидаемого значения функции ц(Х) при выполнении испытаний. Для дискретной случайной величины X математическое ожидание функции г\(Х) может быть выражено в виде Мч)(Х)= J r\(x)f(x)dx = J — оо —оо i, B,28) •оо если в соответствии с теоремой, доказанной для дельта-функции, предположить, что ц(х) непрерывна в точках Х\, Х2> ... При бросании игральной кости математическим ожиданием куба появляющегося числа является MX* = 13 • | + 23 • | + З3 • | + 43 • | 4- 53 • — + б3 • — = 73 — 52
Поэтому игра, состоящая в том, что бросающий кость игрок делает ставку и получает выигрыш в копейках, равный кубу появляющегося числа, будет справедливой, если уплачиваемая им ставка равна 73 — копеек. В этом случае возможный проигрыш будет только результатом «невезения», а возможный выигрыш только результатом «везения», но не следствием несправедливости условий для играющих сторон. Если бы игральная кость имела неправильную форму, такую, что, например, вероятности появления чисел 1, 2 и 3 были равны а<—, а вероятности появления чисел 4, 5 и 6 были равны b > -г (при этом должно быть За + 36 = 1), то математическое ожидание X3 было бы больше, чем 73-г-, так как стано- вятся более вероятными большие значения случайной величины Хъ. Аналогично, для непрерывной случайной переменной математическое ожидание функции ц (X) больше, когда большие значения этой функции соответствуют областям, где плотность вероятности случайной переменной выше. Если Л (X) = Л1 (X) + т]2 (X), то Мц(Х)= J — оо B,29) Следовательно, математическое ожидание суммы функций равно сумме математических ожиданий этих функций. Точно так же докажем, что, если с — постоянная величина, то Mci\{X) = cMi\{X). B,30) Очевидно, что размерность математического ожидания функции случайной переменной такая же, как у функции случайной переменной. В частном случае, если ц(Х) = Х, равенство B,27) Дает математическое ожидание самой случайной 53
величины = I xf(x)dx. B,31) — оо Математическое ожидание случайной величины является ее важнейшей характеристикой. Как отмечалось выше, оно имеет смысл среднего значения случайной величины. Из B,28) вытекает, что для дискретной случайной величины ее математическое ожидание равно MX = ^XiPi. B,32) i Часто вместо Мг\(Х) для обозначения математического ожидания употребляют горизонтальную черту, которая ставится над функцией, например, х, х3, sin2л:. Равенства B,29) и B,30) можно записать так: % (х) B,33) § 16. Моменты функции распределения Математическое ожидание функции (X - a)k называется моментом &-го порядка относительно начала а случайной величины X. Говорят также, что это момент k-TO порядка функции распределения f(x). Обозначим его Kk, a. Следовательно, = / (х - a)* f (x) dx. B,34) — оо Момент k-vo порядка имеет размерность k-й степени размерности случайной величины. Очевидно, что для любой функции распределения момент нулевого порядка равен 1. Для дискретной случайной величины момент записанный непосредственно через вероятности имеет согласно B,28) вид 54
Если а = О, то момент называется начальным. Будем обозначать начальные моменты &-го порядка Vh'- = J xkf(x)dx = x*. B,35) •оо Очевидно, что математическое ожидание случайной величины есть начальный момент первого порядка Vl = MX = х. Если в B,34) за величину а принять х, то моменты называются центральными. Будем обозначать их = J (x — x)kf(x)dx = {x-x)k. B,36) — оо Центральный момент первого порядка всегда равен нулю. В самом деле, -f-oo = I \Х — X) I \Х) пХ = — оо + оо -{-оо — J xf{x)dx — x J f(x)dx = x — Jc == 0. B,37) — оо —оо Центральный момент второго порядка называется дисперсией случайной величины и обозначается обычно оо J (х - хJ f (x) dx = {x- xf = 7 - х2. B,38) — оо Дисперсия — тоже важнейшая характеристика случайной величины, определяющая математическое ожидание квадрата отклонения случайной величины от ее среднего значения. Если дисперсия мала, это означает, что случайная величина имеет тенденцию принимать значения, близкие к ее средней величине. Большая же дисперсия указывает на большое рассеяние случайной величины, т. е. на то, что вероятности принимать значения, существенно отличающиеся от среднего значения, не малы. 55
Из B,28) следует, что дисперсия дискретной случайной величины равна 13. B,38*) Корень квадратный из дисперсии, называется стандартом случайной величины. Стандарт есть среднее квадратичное отклонение случайной величины от своего среднего значения. Он имеет размерность случайной величины. Отношение стандарта к абсолютному значению среднего арифметического а называется относительным среднеквадратическим отклонением случайной величины от среднего значения. Эта характеристика имеет важное значение в том случае, когда случайная величина может принимать значения только одного знака. Если случайная величина может менять знак, то -рту не представляет Jv интереса, а в том случае, когда х = О, не существует. Очевидно, что y=-j безразмерная величина. Все моменты функции можно рассматривать как некоторые характеристики случайной величины. Если случайная величина может принимать значения из ограниченного промежутка, то все моменты существуют. Если же промежуток значений случайной переменной не ограничен, то могут существовать не все моменты. Например, если у при Х>Ь>0, 2 Р B,39) f(x) = O при Х<Ь, то f{x)dx=\ — оо Все же моменты первого и более высокого порядка не существуют, так как соответствующие интегралы б'б
расходятся. Случайная величина с плотностью вероятности B,39) не имеет ни математического ожидания, ни дисперсии. Математические ожидания абсолютных значений (х — a)h называются абсолютными моментами k-vo порядка. Например, J \х — х013 / (х) dx — оо есть абсолютный центральный момент третьего порядка. Задача 32. Все направления отрезка а прямой равновероятны. Найти среднюю величину, а также дисперсию длины проекции этого отрезка на: 1) заданную прямую, 2) заданную плоскость. Решение. Согласно результатам задач 25 и 26 функция распределения угла а между данным отрезком прямой и фиксированной прямой есть / (а) = у sin а, а функция распределения угла между отрезком и плоскостью f (р) = cos p. Проекция отрезка на прямую равна a cos a, а на плоскость — a cos p. Поэтому средняя величина длины проекции отрезка на прямую я М | a cos a | = а\ cos a | • — sin a da = о я 2 2a • у cos a sin a da = у а, о а средняя величина проекции на плоскость я т М {a cos Р) = а о 57
Дисперсия длин проекций на прямую A \~ | acosa|—yaj =o 1 \2 1 . a" Ml coscci—-I — о а на плоскость Aifacosp ——• а] =а2 = я 2 cosp— П \2 о 2 3 Стандарт длин проекций отрезка на прямую o{=y=r a^ 0,2887a, а стандарт длин проекций отрезка на плоскость as 0,2361a. Задача 33. Вероятность частице на участке пути dl столкнуться с другой частицей равна Xdl. Найти функцию распределений длин свободного (без столкновений) пробега, среднюю величину, дисперсию и стандарт длины свободного пробега. Решение. Вероятность частице испытать на участке [/, l-\-dl\ первое столкновение равна произведению вероятности того, что частица не испытает столкновения на участке пути [0,/], на вероятность того, что она испытает столкновение на участке пути [/, l-\-dl]. Первая величина, аналогично A.41) в задаче 16, равна Второй множитель равен Kdl. Поэтому f (i) dl = е~ыХ dl. Средняя длина свободного пробега частицы оо 1% с/ О 58
Дисперсия длины свободного пробега со о и стандарт Таким образом, фигурирующий в условии задачи параметр К имеет тот смысл, что его обратной величине равны средняя величина свободного пробега и стандарт свободного пробега. Задача 34. Вероятность встретить звезду в объеме dv равна kdv. Для каждой звезды найдется другая звезда — ее ближайший сосед. Найти функцию распределения расстояний до ближайшего соседа, среднее расстояние до ближайшего соседа и дисперсию расстояния. Решение. Вероятность того, что ближайший сосед находится не ближе х, равна \—F(x), где F(x)—интегральный з*акон распределения расстояний до ближайшего соседа. Вероятность того, что ближайший сосед находится на расстоянии, заключенном между х и x-\-dx, есть f(x)dx, и равна, согласно теореме умножения, произведению l—F(x) на вероятность того, что между сферами с радиусами х и x-\-dx имеется звезда. Таким образом, f (Х) dx = [ 1 - F (x)] kAnx2 dx. B,40) Разделив обе части B,40) на k4nx2dx1 продифференцировав по х и учтя, что F/(x) = f(x)i получим П*) = 2 f(x) х и после интегрирования / (л:) = сх2е 3 —-г nkx* Произвольная постоянная с определяется из условия нормирования. Окончательно находим 4 59
Среднее расстояние до ближайшего соседа д, —— О Здесь xf (х) dx ^i-^-Y Г (±)^ 0,554kК оо Г(а)= J ?-хе~* о — известная гамма-функция или эйлеров интеграл второго рода. Дисперсия расстояний до ближайшего соседа оо 1% G2 = (х — хJ f (x) dx о 3 Уз 4nk Г|4)-Г2Dл 0,0405& 3, а стандарт а^ § 17. Связь между моментами относительно двух различных начал Рассмотрим моменты относительно начала b и выразим их через моменты относительно начала а: ,ь= } (x-b)kf(x)dx= J — оо ~оо k +0О + (а - b)]kf (x)dx = ^Clk{a- bI J {x- a)k^f(x)dx. -oo Таким образом, k ICiY ?,e. B,41) Если плотность вероятности /(х) задана в табличной форме, то моменты вычисляются при помощи приближенных формул для определенного интеграла. Центральные и начальные моменты обычно вычислять менее удобно, чем моменты относительно начала а, когда а выбрано удачно. Если а принять це- 60
лым и близким к х (это нетрудно сделать на глаз), то в выражении B,34) множитель, стоящий перед f(x), вычисляется проще, чем аналогичный множитель в B,36), в то же время этот множитель в среднем меньше, чем аналогичный множитель в B,35). Поэтому сначала вычисляют моменты относительно начала а, удобно выбранного, целого и близкого на глаз к х, а затем переходят к начальным и центральным моментам. Нужные формулы содержатся в B,41). Если положить Ъ = О, то Xk,o = v&. Поэтому B,41) принимает вид V& = 2j CkCl h>k—if а* B,42) В частности, г; д, Л I n /О /1О\ л? ———" vj —— /ъ1 п ~|" (Л» ^Z(,t:O^ Если же принять Ь = х> то в левой части B,41) моменты центральные, Kk,x= |i&, поэтому k 1 — VI I Л,) или, учитывая B,43), k И* = 2 (-l)'cUi.aA*-*ifl. B,44) В частности, Ka> B.45) 1*4 = Л а + 6Ч Л. a ~ 3M, a- B-47) Если в B,45) принять а = 0, то, используя другие обозначения, эту формулу можно написать в форме <т2 = ;?-*2, B,48) являющейся весьма употребительной. § 18. Распределение Пуассона Рассмотрим даваемое формулой A,53) Рп (т) = —тт-^—гг pmqn~m\ гп х ' ml (п — т)\ г ^ > биномиальное распределение, определяющее вероятность появления события А кг раз при п испытаниях. 61
Предположим, что число испытаний п очень велико, и обозначим ==а. B,49) Зафиксируем а и будем стремить п к бесконеч а ности. Поскольку р равно ~, оно будет стремиться к нулю. Заменим в A,53) р через —, a q — через 1 — ~ и запишем в виде Рп (^) = п 1 а т П X т\ х 1 — п ¦ям* а п —а —m п Совершим предельный переход, учитывая, что при п—> оо каждое значение m остается конечным. Тогда pirn) т\ B,50) Полученное распределение называется распределением Пуассона для случайной величины — появление т раз события Л. Это распределение является точным, если п бесконечно велико (а /?, соответственно, бесконечно мало). Однако оно может быть с успехом использовано и для конечных, но больших п (при, соответственно, малых /?), так как для больших п точность его весьма велика, а вычислять вероятности по формуле Пуассона проще, чем по формуле биномиального распределения, в особенности в тех случаях, когда а невелико, не превосходит нескольких единиц. Именно в тех случаях, когда а мало, и, кроме того, целесообразно учитывать вероятности только одного, двух или нескольких первых значений т (для остальных значений т вероятности ничтожно малы), распределение Пуассона наиболее употребительно. Распределение Пуассона сохраняет силу и в том случае, когда а бесконечно мало. 62
оо Легко видеть, что условие 2 Рл(я*) = 1 выпол- няется. В самом деле, вспоминая разложение еа в бесконечный ряд, получаем оо оо ml ' \ > ) ... А ... С\ Определим математическое ожидание т оо оо оо так как член в сумме, соответствующий т = 0, равен нулю. Заменим под знаком суммы m — 1 на f, тогда на основании B,51) оо m ==aS-^?"=a- ^2'52^ Таким образом, параметр а, фигурирующий в распределении B,50), равен математическому ожиданию случайной величины. Найдем теперь математическое ожидание т2: оо т(т— 1) + т= \т( оо оо Ш~ ~-(Х (/и- и на основании B,48) дисперсию а2 = т2 — т2 — а2 + а — а2 = а. B,54) Таким образом, дисперсия случайной величины т также равна а. Равенство дисперсии т среднему значению т в данном случае возможно, так как случайная величина т — число появлений события А—есть величина безразмерная. Задача 35. С катода вылетает в среднем g электронов в единицу времени. Какова вероятность того, что за промежуток времени Д/ с катода вылетит ровно т электронов? 63
Решение. Среднее число электронов, вылетающих за время А/, равно g At. Следовательно, вероятность того, что за время Л/ вылетит ровно т электронов, равна § 19. Вероятностная трактовка некоторых физических понятий Введение понятия вероятности события позволяет правильнее определять некоторые физические явления. Например, понятие постоянства плотности газа в пространстве неверно формулировать буквально, считая, что равны между собой все расстояния между соседними молекулами. Так как молекулы газа непрерывно движутся, это условие не может выполняться строго, хотя плотность газа в макроскопическом смысле слова будет оставаться постоянной. Условимся говорить, что плотность газа постоянна в пространстве, если вероятность встретить хотя бы одну молекулу газа в некоторой области пространства зависит только от объема этой области и не зависит от формы области и ее месторасположения. При таком определении тождественность фактически реализуемых положений в различных местах пространства заменяется тождественностью условий, характеризуемых вероятностями. Очевидно, что чем меньше объем рассматриваемой области, тем меньше вероятность встретить в ней хотя бы одну молекулу и когда объем области стремится к нулю, то вероятность встретить в ней хотя бы одну молекулу также стремится к нулю. В пространстве, где плотность газа всюду одинакова, рассмотрим некоторую малую область объема 2v и разделим ее произвольным образом на две части, каждую объема v. Вероятность встретить хотя бы одну молекулу в каждом из объемов v обозначим р. Тогда, согласно теореме сложения, вероятность встретить хотя бы одну молекулу в объеме 2v равна р + р — р\ Если рассматриваемые объемы бесконечно малы, то 64
бесконечно мала и вероятность /?, поэтому квадратом ее можно пренебречь и, следовательно, вероятность встретить хотя бы одну молекулу в объеме 2v равна 2/7. Таким образом, для бесконечно малых объемов увеличение объема вдвое ведет к увеличению вдвое вероятности встретить в объеме хотя бы одну молекулу. Поскольку рассмотренные объемы являются произвольными (при условии их бесконечной малости), то доказанное утверждение равносильно утверждению, что для бесконечно малых объемов вероятность встретить хотя бы одну молекулу пропорциональна величине объема. Следовательно, условие постоянства плотности равносильно условию, что вероятность встретить хотя бы одну молекулу в объеме dv равна Kdvy где коэффициент пропорциональности К характеризует величину плотности. Вероятность встретить хотя бы одну молекулу в объеме dv равна вероятности встретить точно одну молекулу в этом объеме, а также равна математическому ожиданию числа молекул в этом объеме. В самом деле, математическое ожидание числа молекул в бесконечно малом объеме есть бесконечно малая величина. Обозначим ее h. Тогда, согласно формуле распределения Пуассона, вероятность встретить т молекул в этом объеме равна hm т\ ' поскольку erh равна 1. Следовательно, вероятность встретить точно одну молекулу равна h. Очевидно оо также, что V —р есть бесконечно малая второго порядка в сравнении с h. Следовательно, вероятность встретить хотя бы одну молекулу в объеме dv равна вероятности встретить там точно одну молекулу. Если плотность газа в пространстве является некоторой функцией положения точки, то каждая из трех величин: вероятность встретить хотя бы одну молекулу, вероятность встретить точно одну молекулу и математическое ожидание числа частиц в объеме dvy равна Kdv, где X является функцией координат и описывает закон плотности в пространстве. 65
§ 20. Нормальный закон распределения В теории вероятностей и ее приложениях важную роль играет дифференциальный закон распределения случайной величины, имеющий вид к <*~6>2. B,55) Этот закон распределения называется нормальным законом распределения, а соответствующая функция называется нормальной функцией. Из условия нормировки находим B,56) V п Математическое ожидание случайной величины оказывается равным -|-ао ?2b? B,57) — оо а дисперсия — оо Ь-Wyz*-»*'»**-!^- B.58) Равенства B,56) —B,58) позволяют записать нормальный закон распределения в виде (X-. <р (х) = —±= е~^. B,59) Нормальную функцию называют также гауссианой. График нормальной функции приведен на рис. 8. Соответствующий интегральный закон распределения имеет следующий вид: Ф(х)=—-4= e 2«s d\. B,60) а у 2n J — оо Как показывает B,59), нормальная функция симметрична относительно прямой х = х, имеет максимум в точке х = х и монотонно убывает при возрастании \х— х\, асимптотически приближаясь к нулю. 66
Случайную величину, плотность вероятности которой есть нормальная функция, называют нормально распределенной случайной величиной. Если плотность вероятности х имеет вид B,59), а случайная величина z есть то, применяя правило нахождения плотности вероятности функции, получим (х-*J -р 202 dr— 1 l B—ахJ ao dz. Таким образом, плотность вероятности z также есть нормальная функция со стандартом, равным ав> и средней г = ах. Если плотность вероятности х имеет вид B,59), то плотность вероятности случайной величины записывается так: О 1__ — B,61) B,62) т. е. является нормальной функцией со средней, равной нулю, и дисперсией, равной единице. В таблице 1 даны значения функции B,62) для различных значений аргумента. Используя зависимость B,61), можно по таблице 1 найти плотность вероятности и для любого значения х% 67
Таблица 1 1 _?. Значения функции f(t) = ¦,— в 2 У2я t 0,0 од 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 fit) 0,39894 0,39595 0,39104 0,38139 0,36827 0,35207 0,33322 0,31225 0,28969 0,26609 0,24197 0,21785 0,19419 0,17137 0,14973 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 fit) 0,12952 0,11092 0,09405 0,07895 0,06562 0,05399 0,04398 0,03547 0,02833 0,02239 0,01753 0,01358 0,01042 0,007915 0,005953 t 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 fit) 0,004432 0,003267 0,002384 0,001723 0,001232 0,000873 0,000612 0,000425 0,000292 0,000199 0,000134 0,000089 0,000059 0,000039 0,000025 0,000016 § 21. Асимметрия и эксцесс распределения Напишем выражение для центрального момента &-го порядка нормальной функции и применим к интегралу формулу интегрирования по частям: ay 2тс r.\k (х — х) е 202 — оо dx -f-oo а (х-х? 202 dx — оо Это показывает, что для нормального распределения справедлива рекуррентная формула 2. B,63) Если k нечетно, то применение формулы B,63) k- 1 последовательно —— раз приведет правую часть равенства к произведению, содержащему множитель ць который, как было показано в B,37), всегда ра- 68
вен нулю. Следовательно, все нечетные центральные моменты нормальной функции равны нулю. Этот результат очевиден, так как нормальная функция является четной по отношению к аргументу (х — х). У всякого распределения, симметричного по отношению к некоторому значению х, все нечетные центральные моменты равны нулю. Близость нулю нечетных центральных моментов можно рассматривать как критерий симметричности распределения. Обычно используют центральный момент третьего порядка как самый низкий (простой) из нечетных моментов (не считая \хи который равен нулю для любых распределений). Чтобы величина, являющаяся критерием асимметрии, была безразмерной, рассматривают отношение ц3 к ju^2, As = -fe-. B,64) Н2 Чем больше As по абсолютной величине, тем более несимметричным можно считать распределение. Однако этот критерий не является строгим, так как равенство нулю As является необходимым условием для симметричности распределения, но не является достаточным условием. Если k является четным числом, то, применяя формулу B,63) -J Раз> получим справедливое для нормального распределения равенство ок. B,65) В частности, ц4 = За4. B,66) Следовательно, безразмерная величина B,67) для нормального распределения равна нулю. В общем же случае эта величина, называемая эксцессом, отлична от нуля. Нормальная функция в теории вероятностей и математической статистике играет роль некоторой стандартной функции, с которой уместно сравнивать другие функции распределения, определять, насколько 69
эти функции отклоняются от нормальной функции. Асимметрия B,64) и эксцесс B,67) являются двумя показателями отклонения функции распределения от нормальной. § 22. Интеграл вероятностей Определим вероятность того, что нормально распределенная случайная величина х примет значение, заключенное между х — а и х + а, где а — некоторая положительная величина 1 а у 2я —а 2°2 dx. B,68) Перейдя к новой переменной интегрирования X "~~ X t о и учтя свойство интеграла от четной функции, напишем B,68) в виде е 2 dt. B,69) о Правая часть B,69) есть функция верхнего предела интеграла. Эта функция Z 42 = "I/ — e~~2 dt f9 7fft О играет важную роль в теории вероятностей и называется интегралом вероятностей. Мы видим, что если обозначить * = ?, B,71) то i|?(z) дает вероятность того, что отклонение случайной величины, распределенной по нормальному закону, от своего среднего значения по модулю не превзойдет а. Интеграл вероятностей не выражается конечным числом простых операций через элементарные функции. Для него составлены таблицы (см., например, Л. Н. Больше в, Н. В. Смирнов. Таблицы 70
математической статистики, Москва, Вычислительный центр АН СССР, 1968). Прилагаемая краткая таблица 2 интеграла вероятностей показывает, что вероятность случайной величине, распределенной нормально, отклониться от среднего значения не более, чем на а, равна 0,6827; не более, чем на 2а — 0,9545; не более, чем на За — 0,9973; не более, чем на 4а — 0,99994. Таким образом, вероятность отклонений больших 2а уже сравнительно мала, вероятность отклонений больших За очень мала, больших 4а ничтожно мала. Таблица 2 Значения интеграла вероятностей Z л о /: 2 dt Z 0,0 од 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 U 1,2 1,3 1,4 1,5 1,6 Ф(г) 0,00000 0,07966 0,15852 0,23582 0,31084 0,38292 0,45149 0,51607 0,57629 0,63188 0,68269 0,72867 0,76986 0,80640 0,83849 0,86639 0,89040 Z 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 Ф(г) 0,91087 0,92814 0,94257 0,95450 0,96427 0,97219 0,97855 0,98360 0,98758 0,99068 0,99307 0,99489 0,99627 0,99730 0,99806 0,998626 0,999033 г 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4>1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0 Ф(г) 0,999326 0,999535 0,999682 0,999784 0,999855 0,9999038 0,9999367 0,9999587 0,9999733 0,9999829 0,9999892 0,99999320 0,99999578 0,99999740 0,99999841 0,999999042 0,999999427 § 23. Теорема Муавра— Лапласа При рассмотрении числа т появлений события А в п испытаниях обычно бывает нужно найти вероятность того, что это число заключено между некоторыми значениями а и Ь. Если п велико и промежуток [а, Ь] содержит большое число единиц, то 71
непосредственное использование закона биномиального распределения A,53) _ All m п_т ml (п ~ т)\ " Ч требует длительных вычислений; нужно суммировать большое число определенных по этой формуле вероятностей. Поэтому целесообразно получить асимптотическое выражение для биномиального распределения при условии, что р фиксировано, a az—*оо. Теорема Муав- ра — Лапласа утверждает, что таким асимптотическим выражением для биномиального распределения является нормальная функция. Используем для доказательства известную в анализе формулу Стирлинга где При больших s величина Qs очень мала, и формула Стирлинга, записанная в простом виде 5! = Ybus'e-*, B,72) дает малую относительную ошибку, быстро стремящуюся к нулю, когда s-*oo. Нас будут интересовать значения т, не очень сильно отличающиеся от наивероятнейшего. Тогда, при фиксированном /?, условие п —> оо будет также означать т->оо и п — т—> оо B,73) (в отличие от распределения Пуассона, где предполагалось /?->0 и т — конечным). Поэтому использование формулы Стирлинга B,72) для замены факториалов в биномиальном распределении допустимо, и мы получим Используем также введенное ранее формулой B,10) отклонение относительной частоты от наивероятней- 72
шего значения т B,75) Тогда B,74) запишется в виде Рп = 12лп (Р + хт) (Я — -О1 2 " Хщ Я Предположим, что X • B,76) B,77) и, взяв логарифм произведения второго и третьего множителей в правой части B,76), применим разложение в ряд Тэйлора (р + хт) т X т X (q-xm)\- 2р2 хт я т X т х т 2q Расположим члены этого разложения по степеням хт: —- п X т 1 1 [ Р Я т 6 ] 4- B,78) Предположим теперь, что при п-*оо пх т 0. B,79) Это условие означает, как уже было предположено выше, что рассматриваются значения т, не очень далекие от наивероятнейшего. Очевидно, что B,79) обеспечивает и выполнение B,77), а также B,73). Пренебрегая в B,78) вторым и следующими членами, найдем, что логарифм произведения второго 73
и третьего множителей в B,76) равен п 2 Отбрасывая также малые слагаемые хт в скобках первого множителя B,76), получим п * pn(m)^rn==re ^ ™. B,80) У 2nnpq Обозначив а2 = ^-, B,81) напишем B,78) в виде рп (т) ~ - —т=- е № = - ф (хт), B,82) п а у 2л п где ф(#т) — нормальная функция. Поскольку в интервале [т, т-\- 1) имеется только одно целое число —/я, то можно сказать, что pn{jn) есть вероятность того, что т попадет в промежуток [т, т+1). Из B,75) следует, что изменению т на 1 соответствует изменение х на Д*=4, B,83) Поэтому вероятность попадания т в промежуток [m, m+1) равна вероятности попадания х в промежуток [хт, хт + А*), Р (хт < л: < хт + Ал:) = ф (*w) Ал:. B,84) Когда /г—^оо, Дл:->0, и равенство B,84) показывает, что нормальная функция ф(х) является плотностью вероятности случайной переменной х. Итак, если п-*оо и лгл:3 —>- 0, то для отклонения относительной частоты от наивероятнейшего значения справедлива асимптотическая формула B,84), в которой q>(xm)—нормальная функция, хт = 0 и 1 Доказанная теорема позволяет решить задачу, упомянутую в начале этого параграфа. Если требуется определить вероятность того, что при п испытаниях число появлений события А будет заключено 74
между а и Ь, то находим а У 2я а» B,85) где а Ь В частности, если а2 = — щ = а, то Р (p/i — ад < т < рп + а^г) = Р (— а < х < а) = i|) (-^-j, B,86) где \|) (—) — интеграл вероятностей. Задача 36. Наблюдая Солнце в течение 1880— 1896 гг. в Италии, И. Сикора обнаружил на восточном краю Солнца 7024 протуберанцев, а на западном краю 6614 протуберанцев. Какова вероятность того, что преобладание числа протуберанцев на восточном краю Солнца есть случайный результат? Решение. Предположим, что вероятности появления протуберанцев на восточном и западном краях Солнца равны. Следовательно, вероятность того, что появившийся протуберанец окажется на восточном краю Солнца, р= — 9 Общее число появившихся протуберанцев, п= 13 638, нужно рассматривать как число испытаний, а число т = 7024 — как число появлений события Л. Случайная величина х — отклонение относительной частоты от наивероятнейшего значения, оказалась равной 13 638 Стандарт случайной величины х9 определяемый по формуле B,81), равен Л/ У °'5' °'5 ^ 0 00428 13 638 — u»uu^zo- Следовательно, вероятность того, что преобладание числа протуберанцев на восточном краю Солнца над ожидавшимся числом такое, как наблюдалось, или 75
меньше, равна, согласно B,86) и табл.2,Р(—0,0150< < х < 0,0150) = ф(-5Ш&) = °>999543- А вероятность того, что отклонение будет таким, как наблюдалось, или большим, равна 1—0,999543 = 0,000457. Именно эта величина, вероятность того, что отклонение, вызванное случайностью, будет равно наблюдаемому или больше его, показывает, имеются ли основания объяснять наблюдаемое отклонение случайностью. В данной задаче малая величина вероятности 0,000457 показывает, что не случайность, а другое обстоятельство вызвало преобладание числа протуберанцев на восточном краю Солнца. Как впоследствии выяснилось, причиной была личная ошибка Сикоры, который более уверенно обнаруживал слабые протуберанцы на восточном краю Солнца, чем на западном. Задача 37. Электростанция дает ток заводу и используется для электрификации села. Если при работающем конвейере завода в селе окажутся зажженными 350 стандартных электролампочек, то напряжение настолько понизится, что конвейер остановится. Эмпирически установлено, что в наиболее загруженные вечерние часы в среднем за много дней каждая лампочка горит 0,7 всего времени, при значительной длительности одного горения. Сколько стандартных электролампочек можно подключить в домах, чтобы вероятность остановки завода в течение одного вечера не превосходила 10~4? Решение. Обозначим искомую величину — число стандартных электролампочек, которые можно подключить, через п. Тогда, поскольку одновременное горение 350 лампочек уже не допускается, недо- пускаемым положительным отклонением относительной частоты от наивероятнейшего значения является а =*5° -0,7. B,87) Необходимо, чтобы вероятность такого или большего положительного отклонения не превосходила 10~4. Это будет выполнено, если вероятность отклонения, не превосходящего по модулю величины B,87), будет равна 2- 10~4. Следовательно, ф(—) =0,9998. 76
По таблице 2 обратным интерполированием нахо- а дим, что — = 3,72. С другой стороны, согласно а B,81) Л т / 0,7 - 0,3 1 Поэтому получаем квадратное относительно —7=- уравнение 350 - 0,7 п — 3 72 0,21 /г Решение его дает п — 449. Можно подключить 449 лампочек.
ГЛАВА III СЛУЧАЙНЫЙ ВЕКТОР § 24. Понятие случайного вектора. Функции распределения случайного вектора Допустим, что всякий раз, как выполняется определенный комплекс условий, каждая из k случайных величин , Х2, ...» Xk C,01) принимает некоторое значение. Можно рассмотреть fe-мерный вектор Х2, ..., Хь), C,02) компоненты которого равны соответствующим случайным величинам C,01). Мы назовем его случайным вектором. Говорят также, что C,02) есть многомерная случайная величина. Ей можно сопоставлять точку (конец случайного вектора) в ^-мерном пространстве с координатами, определяемыми C,02). Случайный вектор считается заданным, если для любых значений хи х2, ..., Хи известна функция F (x\9 х2, ..., Xk) — P(Xi<iXi) Х2<^х2, ..., а^ < хД C,03) называемая интегральной функцией распределения случайного вектора C,02) F(xuX2>...,Xb) равна вероятности попадания точки (XuX2,...,Xk) в область А-мерного пространства, определяемую неравенствами Xi < Хи ^2 < Функция F(xuX2,...,Xk) есть, очевидно, монотонно возрастающая функция по каждому аргументу. Для нее справедливы свойства: lim F(xu x29 ..., xk) = 0 A</</е), C,04) oo 78
какими бы ни были значения остальных аргументов, и F(+oo, +oof .... + оо)=1. C,05) Если существует такая функция f(xu х2,..., что для любых значений хи х2у ..., xk выполняется равенство х\ Х2 Xk — '"•* I I . . • I / I Si ) fe9> • • • J T>k) ^fel «ЭЙ • • • (""^riky ч^Э^О) J J J — с» — оо —оо то функция f(xu х2,..., я*) называется дифференциальным законом распределения или плотностью вероятности случайного вектора (ХиХ2,..., На основании C,05) заключаем, что J J •'• I ^^!> ^2> "" ^)dlidl2 ... d|^= I, C,07) — со —с» — оо т. е. плотность вероятности нормирована к единице. Из условия выполнения C,06) для всех значений Х\9 *2> ..., xk следует, что вероятность попадания точки (х\,Х2,...,хк) в область G равна j J ... J /(ii, 52» • • • > h) d\x dl2 ... dlk. C,08) (G) Какова бы ни была область G, вероятность C,08) неотрицательна. Из этого следует, что/(хь х2, ..., Хь) есть неотрицательная функция. Если область G является ^-мерным параллелепипедом с ребрами [xl9 Xx + dxx], [x29 x2 + dx2], ..., [xk9 xk + dxk] C,09) и подынтегральная функция непрерывна в точке (хих2,... ,Xk), то интеграл C,08), как известно, с точностью до бесконечно малых высших порядков равен f (*ь*2,... 9Xk) dx\ dx2 ... dxk. Следовательно, последнее выражение равно вероятности того, что случайные величины C,01) примут значения, заключенные, соответственно, в промежутках C,09): ..., xk) dxx dx2 ... dxk = P(x{ < X{ < x{ + dx{9 x2 + dx2, ..., xk<Xh<Xb + dxk). C,10) 79
Если для любых Хи #2, . . ., х% вероятность слу- чайным величинам Хи Х2,..., Х( (i<k) C,П) принять значения, соответственно меньшие хи ..., Хи не зависит от того, приняли ли случайные величины C,12) значения, меньшие соответственно xi+u xi+2, •.., то, согласно теореме умножения вероятностей, 9 Х2 < х2> ..., Xk < Xfz) = = Р(Хг <хи Х2<х2, ..., Х/ X Р Таким образом, если случайные величины C,11) независимы от случайных величин C,12), то интегральная функция распределения F(xux2y...yxk) равна произведению двух функций, из которых одна зависит только от Х\, х2> ..., Хи а вторая только ОТ Г \Х\, Х2, * * * , * C,13) Первая из этих функций представляет собой интегральный закон распределения случайных величин C,11), а вторая — случайных величин C,12). Справедливо и обратное утверждение. Если F(xu x% ..., Xk) можно представить в виде произведения двух функций C,13), одной — зависящей только от хи Х2, ..., хи и другой, зависящей только от Xi+i, лгг+2, .. •, Xk, то случайные величины C,11) не зависят от случайных величин* C,12). Если при этом постоянные коэффициенты выбрать так, чтобы Fi (+ оо, + °о, . . . , + сх>) и F2 (+ со, + оо, . . . > + °°) были равны 1, то эти функции являются соответственно интегральными законами распределения случайных величин C,11) и C,12). Аналогичные рассуждения приводят к тем же утверждениям для плотности вероятности. Если случайные величины C,11) не зависят от C,12), то / (#1> Х2, . . ., Х^) = = /l(*b X2> •••> xi) ' I2\xi + U Xi+2> •••» 80
Если функцию f(xux2,... yXk) можно представить в виде произведения C,14), то случайные величины C,11) независимы от случайных величин C,12). При этом, если между функциями f\ и /г так распределены постоянные коэффициенты, что каждая из этих функций нормирована к единице, то они соответственно являются плотностями вероятности случайных величин C,11) и C,12). Если в интегральном законе распределения F (хи Хг ..., Хи) каждая из величин Хг+ь *t+2, . .., Хь. равна + °°> то эта функция даст вероятность того, что Xi < хи Хг < лс2, ..., Х{ < Х{ при произвольных значениях случайных величин C,12). То есть F(xu х2, ..., xh + оо, + со, • •> +оо) где F\(xuX2,...yXi) есть интегральный закон распределения случайных величин C,11). Аналогично, если f(xu х%, ..., Хи) dxi dx2 ... проинтегрировать по каждой из величин Хг+2, ...? %к от —оо до -{-оо, т. е. по всему пространству, соответствующему этим координатам, го мы получим вероятность того, что случайные величины C,11) попадут соответственно в промежутки [хи Xi -f dxi]y [^2, х2 + dx2]y ..., [^г, Xi -f dxi] при произвольных значениях случайных величин C,12). Таким образом, AX2 . •. 4-00 -f-oo /\ ... / \Х\, ЛГ2, ...» -^ •оо —оо —со / (Х\, х^ч ...) хi) uX\ йХ2 . • • dx^ C,16) где f (*i, *2,..., **) есть плотность вероятности случайного вектора (Хи Х29..., Х{). В частности, для двух случайных величин х и у имеем -f-oo = ] f{x, y)dy. C,17) — 00 81
§ 25. Функция случайного вектора Допустим, что величины / 1, / 2» • • • > * т C,18) являются функциями случайных величин C,01) Yi = Г]] (A j, А 2, ...» А ^), / 2 === Л2 (л 1, Л2, . . ., A/j), . . • • ••> ^/п===<Пт(^1> ^2» •••! ^fc)« C,19) Тогда мы можем сказать, что случайный вектор У2, ..., Ут) C,20) является функцией случайного вектора C,02). Если f(xu Х2>... > ^h) есть плотность вероятности случайного вектора C,02), то вероятность того, что случайный вектор C,20) окажется внутри области Q, равна Р = Г Г ... \ f {хи х2> ..., Хк) dxx dx2 ... dxky C,21) (G) где область G охватывает все точки ^-мерного пространства случайного вектора C,02), отвечающие тому условию, что вычисленный по C,19) случайный вектор C,20) окажется внутри области m-мерного пространства Q. Из C,21) следует, что интегральный закон распределения случайного вектора C,20) находится при помощи равенства F(У\> У2> • • •> Ут) = I • . . I / \Х\у Х^ч • • •» (G) где область /г-мерного пространства G определяется неравенствами u х2, ..., xk)<yj\ /=1, 2, ..., т. C,23) В самом деле, сопоставление равенств C,19) и неравенств C,23) показывает, что попадание конца случайного вектора C,02) в область G эквивалентно выполнению неравенств > • • • ^ ут< Ут* C>24) 82
Поэтому правая часть равенства C,22), равная вероятности попадания конца случайного вектора C,02) в область G, равна левой части этого равенства, представляющей вероятность выполнения условий C,24). Рассмотрим простейший случай, когда Y = Хх + ^2» Найдем функцию распределения У, если функция плотности вероятности f{xx,x2) задана. Согласно C,22) — J J f(xu x2)dxx dx9 = \ dxx \ f(xx,x2)dx2. < у -оо —оо Введем вместо х2 переменную интегрирования и = Х\ + х2. Тогда + С5О = J — ОО —00 # +оо = I rfa J /(atj, u — xx)dx{. C,25) — oo —oo Продифференцировав это равенство по у, найдем плотность вероятности ОО = J f(xl9 tj-xx)dxx. C,26) — оо Если Хх и Х2 взаимно независимы, так что = fl(xl)-f2(x2), то равенство C,26) принимает вид + ОО = J fi(x1)-f2(y-xl)dxl. C,27) —оо Задача 38. Найти функцию распределения суммы Двух независимых нормально распределенных случайных величин. 83
Решение. По условию, функции распределения независимых случайных величин Х\ и Х2 есть (*i-*i,oJ (*2-*2,оJ 9 о M*i) = —i=e 2°] ; f2(x2) = - v—e 2°2 ог у 2п о2 V 2л Согласно C,27) функция распределения величины У = Xi + Х2 равна /з (У) 1 2а? 1 оо 2л Введем обозначения Уо ~ xi,o "г -^2,0» °з ~ °\ • а2 и преобразуем показатель степени 2о\ -Уо) 2 _2 3 2а\ 2o\ol 2 а (У — Уо) Вынося из-под знака интеграла множитель, не зав] сящий от Х\, и вычисляя интеграл, получим (У-УоJ !(Уз) = —77=е 3 а3 У 2я Таким образом, сумма двух независимых нормально распределенных случайных величин есть также нормально распределенная случайная величина, причем ее средняя и дисперсия равны суммам соответствующих характеристик этих случайных величин. Методом индукции можно показать, что сумма любого числа независимых нормально распределенных случайных величин есть нормально распределенная величина. Справедлива также более сильная обратная теорема, доказанная в 1936 г. Крамером: если сумма конечного числа независимых случайных величин есть нормально распределенная случайная величина, то каждое из слагаемых является нормально распределенной случайной величиной. 84
Найдем математическое ожидание К, если У = = Х\ + ^2 и функция распределения f(xux2) произ вольна: -|-оо 4*°° Му= J ydy j f (хи у — хг) dxi = — oo — 00 4-00 J dx, J {x{ + x2)f{xu x2)dx2 — oo —oo + OO +00 г г J l X{ J — oo —oo -f-oo +00 -f- Г rfjCi Г x2f (x{, x2) dx2 = Mxx + Mx2. C,28) —00 —00 Таким образом, математическое ожидание суммы двух произвольных случайных величин равно сумме математических ожиданий этих случайных величин. Определим дисперсию у, если х{ и х2 взаимно независимы: ОО °l= J (y-yfh(y)dy = — 00 + 00 4-00 = J (y — yfdy J f\ — 00 —00 Далее, меняя порядок интегрирования и используя C,28), получаем + оо 4"°° Gl = J f 1 (*i) d*i J [(*i — *i) + (x2 — X2)Y / — oo —00 +00 +00 = J (xi — Xif f, (^1) dx, J / 2 2 — oo —00 -foo +°o f2 (*2) dx — 00 —00 + 00 -|*oo -f J fx(xx)dxx J (x2 — x2Jf2{x2) dx2. — 00 —00 85
Отсюда следует, что <у2 = а? + а», C,29) т. е. дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин. В справедливости равенств C,28) и C,29) мы уже убеждались в частном случае суммы нормально распределенных независимых случайных величин (задача 38). На основании индукции следует, что если Y = Хх + Х2 + ... + то У=== Х\ i %2 i • • • i Если при этом все Хи Х2, ..., Хп взаимно независимы, то а2 = а2 4- а2 4- 4- а2 Комбинируя этот результат с результатом, полученным в § 20 для случайной величины, равной произведению нормально распределенной случайной величины на постоянную величину, мы можем сформулировать следующую теорему: если где Х\, Х2, ..., Xk нормально распределенные независимые случайные величины со средними, соответственно равными *ito, #2,0, ..-, Xk,о, и дисперсиями g2v o\, ..., с?1, то Y также нормально распределенная величина со средней к #0=2 Я***, 0 C>3°) и дисперсией к G2=2а2а2 C,31) Рассмотрим теперь вяжный частный случай общей задачи, когда т = k, а случайные векторы X и У взаимно однозначно задают друг друга, так что наряду с равенствами C,19) мы можем написать ..., Хк — ?>ь(У{, Y2, ,.., К/г). C,32) 86
Тогда на основании C,21) вероятность того, что случайный вектор (YUY2,... yYk) попадет внутрь параллелепипеда [Ун У\ + аУ\]> [У* У2 + ^у2]у ..., [ук9 ук + Лук], C,33) определится равенством h (У\> У2> • > > Ук) аУ\ dy2 ... dyk = ==: / l*^i> *^2> • • • > %k) dXi cix2 • • • где /i—плотность вероятности вектора Y, (xu x2,... , и (*/ь Уг, ..., Уа) связаны равенствами C,32), a dxi, ^2, ..., dXk также определяются равенствами C,32) (когда заданы dyu dy2,..dyk)i но берутся по абсолютной величине. Подставляя в правую часть C,34) выражения C,32) и используя якобиан для перехода к дифференциалам новых переменных, находим (У\> 1Ь • • • > У k) dy{ dy2 ... dyk = » • • •> Ук)\ О I Л, , dy2 ... dykt C,35) Якобиан должен быть взят по абсолютной величине, так как все множители в обеих частях равенства C,35) положительны. Равенство C,35) позволяет найти плотность вероятности случайного вектора У, если заданы плотность вероятности случайного вектора X и взаимно однозначная зависимость X и Y. Задача 39. Плотность вероятности для каждого из прямоугольных компонентов х, у и z скорости молекул есть нормальная функция со средней, равной нулю, и дисперсией, равной а2. Компоненты скорости по трем направлениям независимы друг от друга. Найти плотность вероятности модуля скорости молекул. Определить среднюю величину, среднюю величину квадрата и стандарт модуля скорости. Решение. Согласно условию задачи плотность вероятности компонента х скорости молекулы имеет вид _. i „~~2(F О У 271 87
Таковы же распределения и по компонентам у и z. Так как эти три распределения взаимно независимы, то плотность вероятности вектора скорости равна произведению плотностей вероятностей по каждому из компонентов :, у, z) dx dy dz = f (x) dx f (y) dyf (z) dz = ¦ e 2°2 dx dy dz. Модуль скорости р = Ух2 + у2 + г2- Дополним эту случайную величину двумя — азимутом cp = arctg_— и у широтой 0 = arctg ,. Прямоугольные ко- У х2 + у2 ординаты х, yf z и сферические координаты р, 0, ф взаимно однозначно определяют друг друга. Согласно C,34) f l (p> 6» q>) dp dQ dq> = f {x, у у z)dxdydz = = -.—у.— q e 2°2 dxdydz. Так как якобиан перехода от прямоугольных координат к сферическим равен p2sin0, получаем 2°2 p2sinQdpdQdq, C,36) = 7i==r,e \а у 2я) что определяет плотность вероятности случайного вектора (р, 0,ф), Посла интегрирования C,36) по всем возможным значениям 0 и ф определится плотность вероятности модуля скорости Я Г fl(p)dp = dp J J f(p, 0, ф) dQ dy = — p2e 2a? dp. об nG C,37) Найдем математическое ожидание р: oo P = f Pfi (P) dp = 2 у |- a, C,38)
и математическое ожидание р2: оо Р2 = / 9% (?) dp = За2. C,39) О Последнее равенство позволяет записать fi(p), выраженное через среднее квадратическое модуля скорости f, (р) = ЗУ5-р2в V . C,40) У п(р2)/2 Дисперсия р находится по формуле B,48) р2= C - |-) а2 д* 0,453а2, C,41) так что стандарт — среднее квадратическое отклонение—равен Задача 40. Ротационной скоростью v звезды называется линейная скорость точек экватора звезды, вызываемая вращением звезды вокруг своей оси. Измерение расширения линий в спектре звезды, обусловленное ее вращением, дает не истинную ротационную скорость v, а ее проекцию на луч зрения— видимую ротационную скорость y=v$ini, C,43) где i — угол между осью вращения звезды и лучом зрения. Величины v и r/ = i>sint у различных звезд различны и должны рассматриваться как случайные величины. Из наблюдений можно определить плотность вероятности видимой ротационной скорости f(y)- Требуется, считая ее известной, найти плотность вероятности истинной ротационной скорости v и найти зависимость между математическими ожиданиями и дисперсиями у и v. Предполагается, что все направления осей вращения звезд равновероятны. 89
Решение. Как было определено выше (задача 25), функция распределения угла / есть с sin/. В данной задаче / изменяется от 0 до я/2, поэтому коэффициент с = I. Рассмотрим взаимно однозначно определяющие друг друга случайные векторы (v, у) и (vj). Из физических соображений очевидно, что случайные переменные v и i взаимно независимы. Поэтому равенство C,34) напишется в виде / (v> у) dv dy = f j (v, i) dv di = f2 (v) dv • sin / di9 C,44) где f2(v) — плотность вероятности v. Используя C,43), перейдем в правой части C,44) от i к у. При этом v нужно считать фиксированным и все множители брать по абсолютной величине f {v, у) dv dy = f2 (v) dv У- ' dy. C,45) v V v2 — у2 Плотность вероятности f(y) равна выражению f(v, y)dvy проинтегрированному по всем возможным значениям v. Тогда как всегда v > у, то оо / (у) = у | -^L- dv. C,46) J v y v2 — yz Уравнение C,46) определяет зависимость между плотностями вероятностей случайных величин у и v. Так как из наблюдений определяется f(y), а искомым является /2@), это уравнение — интегральное. Оно легко приводится к уравнению Абеля и имеет решение оо . f(y) П d J f V Использование C,47) для вычислений неудобно. На практике основной задачей обычно является нахождение средней истинной ротационной скорости и ее дисперсии для звезд различных классов. Найдем поэтому при помощи C,46) зависимость между мате- 90
матическими ожиданиями v и у, а также их квадра тами: со оо оо У v О оо (yf(y)dy= \y>dy \-^U J J v V v2 — 0 у О vf2 (v) dv dy= 4 4 ОО ОО У 2 V о U (v у v yv2 — 2_ 3 Отсюда следует: 4 _ я 3 -о 16 п2 Аналогично, используя C,46), можно найти зависимость между моментами любого порядка функций распределения видимой и истинной ротационной скорости звезд. § 26. Статистические коллективы Пусть рассматриваются объекты, которые могут отличаться друг от друга значениями некоторой определенной характеристики. Всякое каким-то образом выделенное множество таких объектов называется статистическим коллективом, а объекты, в него входящие, членами статистического коллектива. Число членов статистического коллектива п называется объемом статистического коллектива, а характеристика X, которая может принимать различные значения у различных членов коллектива, аргументом статистического коллектива. Можно, например, рассматривать как статистический коллектив звездное скопление, считая температуру его членов — звезд аргументом. Можно также мысленно выделить как статистический коллектив множество всех звезд спектрального класса О, 91
входящих в состав Галактики, считая их светимость (количество энергии, излучаемой в единицу времени) аргументом. Примерами статистических коллективов будут также множество частиц плазмы в некотором объеме с аргументом — величиной заряда у частицы, или множество всех молекул кислорода, находящихся в воздухе внутри данного помещения с аргументом — модулем скорости частиц. Если в статистическом коллективе значение аргумента %\ имеют ti\ членов, х2 — п2 членов, ..., ilk членов, то числа называются частотами, соответственно, значений C,48) аргумента X. Если п — объем статистического коллектива, то, очевидно, должно быть к 2 AZj = Л. Величины п п ' п C,49) называются относительными частотами значений аргумента C,48). Очевидно, что если случайным образом извлечь из статистического коллектива один член, затем, после возвращения его обратно, снова случайно извлечь какой-то член и т. д., то значения аргумента извлекаемых членов можно рассматривать как случайную величину. Если объем статистического коллектива ограничен, то эта случайная величина может быть только дискретной. Согласно классическому определению вероятности, вероятность pi случайной величине принять значение хг равна относительной частоте аргумента —¦ Для изучения статистического коллектива можно использовать аппарат, применяемый для исследования случайной величины. 92
Статистический коллектив определяется инте тральным законом распределения аргумента, рас сматриваемого как случайная величина *гч П, 1 F{x) = P(X<x) ? xl<x Легко понять, что произведение (л:) дает число членов коллектива со значениями аргу мента, не превосходящими х. Аналогично, б(л:*> 2т-б(л:-*'>= есть плотность вероятности. Функцию n(x) = n-f(x) C,52) можно рассматривать как дифференциальный закон распределения, нормированный к п. Величина ъ %{x)dx C,53) а даст число членов коллектива, аргумент которых заключен между а и Ь. Статистический коллектив характеризуют также моменты. В частности, является средним значением аргумента статистического коллектива, а ( J есть дисперсия аргумента. Часто их называют также средней статистического коллектива и дисперсией статистического коллектива. Равенства C,54) и C,55) показывают, что если каждому члену статистического коллектива (а не каждому значению аргумента) присваивать свой номер, так что все щ = 1, то эти 93
равенства должны быть переписаны в виде п C,56) П °2 = 7 2{Xi - ~хJ' C'57) Статистический коллектив может иметь и бесконечно большой объем. Рассмотрим, например, статистический коллектив — множество всех мыслимых прямых, различным образом ориентированных в пространстве, в котором аргументом является угол между прямой и некоторой фиксированной плоскостью. Множество членов этого статистического коллектива бесконечно и несчетно. Задать распределение в нем аргумента можно через плотность вероятности, так что величина f (i) di = cos i di имеет смысл доли членов коллектива, аргумент которых заключен между / и i-\-di. Мы будем говорить, что в таком статистическом коллективе аргумент распределен непрерывно. Статистический коллектив может характеризоваться несколькими аргументами, т. е. быть многомерным. Например, в статистическом коллективе, состоящем из звезд некоторого скопления, каждая звезда характеризуется светимостью, температурой, цветом, массой, компонентами скорости, радиусом и другими величинами. Задание и исследование многомерного статистического коллектива можно производить, используя аппарат, применяющийся для изучения случайного вектора. Статистический коллектив бесконечно большого объема называется генеральной совокупностью. § 27. Случайные выборки из нормальной генеральной совокупности Нормальной генеральной совокупностью называется статистический коллектив бесконечно большого объема, в котором аргумент X распределен по нормальному закону. Это означает, что при случайном 94
извлечении одного объекта из статистического коллектива вероятность того, что его аргумент будет заключен в промежутке [xf х + dx], равна f(x)dx= r—e 2°2 dx. C,58) о У 2п Среднее значение х, равное х0, мы будем называть средней нормальной генеральной совокупности, а дисперсию а2 — дисперсией нормальной генеральной совокупности. Случайным образом извлеченную из некоторого статистического коллектива совокупность п членов будем называть случайной выборкой объема п из статистического коллектива. Каждая случайная выборка сама является статистическим коллективом. Перенумеруем члены выборки из нормальной генеральной совокупности, выпишем их аргументы и рассмотрим среднюю выборки п C,60) и дисперсию выборки п '2 — 1 п В общем случае средняя х и стандарт а' случайной выборки будут отличаться от средней л;0 и стандарта о нормальной генеральной совокупности. Каждый раз, когда будет извлекаться новая случайная выборка объема п из нормальной генеральной совокупности, значения х и о' будут, в общем случае, новые. Таким образом, средняя и стандарт выборки из некоторого статистического коллектива являются случайными величинами. Случайный вектор (х, of) является функцией случайного вектора (xi, Хч, ..., хп), определяемой равенствами C,60) и C,61). Рассмотрим случайный вектор C,62) 95
компонентами которого являются члены случайной выборки. Нормальная генеральная совокупность имеет бесконечно большой объем, поэтому распределенные каждая по нормальному закону C,58) случайные величины Хи #2, • • •, хп взаимно независимы и плотность вероятности вектора C,62) равна произведению плотностей вероятности его составляющих 1 ' f{xu х2, ..., хп) = (оу2п) е 1=1 . C,63) Преобразуем сумму, входящую в показатель степени C,63), п п 2 (xi — х0J = 2 [(Xi —x) + (х — х0)]2 = П П i — xf + 2(х — х0) 2 (*i — х) + п{х — х0J = * I = па -\- п (х — хо)г. Следовательно, ( № f{xl,x2,...,xn) = Cl-e ^( № , C,64) где Равенство C,64) показывает, что плотность вероятности случайного вектора — выборки полностью определяется ее средней х и стандартом о'. Различные выборки объема /г, имеющие одинаковые значения х и о', имеют одинаковые плотности вероятности. Определим теперь плотность вероятности случайного вектора (х, of). Величина } ar) dx есть вероятность того, что средняя и стандарт выборки попадут соответственно в промежутки [х, х + dx], [a', a' + do']. C,65) Поэтому, согласно C.21), i (х, о') dx daf = с ... I / \Х\у Л^2> ¦ • * > *^м/ ^«^1 (О) 96
где G — область пространства (хи x%, .-., хп), содержащая все точки, для которых определяемые по C,60) и C,61) хна' попадают в область C,65). Поскольку область G содержит только точки, которым соответствуют одни и те же значения х и a', a f(xu X2, ..., хп), согласно равенству C,64), зависит только от х и с/, то в области G плотность вероятности /(*!, ль, ..., хп) есть постоянная величина и в C,66) ее можно вынести за знак интеграла: f{ (х, о') dx do' = — Се 2°2 2°2 I ... dx{ dx2 ... dxn> C,67) (Q) Интеграл в правой части C,67) равен объему области G. Чтобы найти его, заметим, что согласно C,60) и C,61) для попадания х и а' в область C,65) необходимо, чтобы в n-мерном пространстве точка (хи %2, •. •, хп) была заключена между параллельными гиперплоскостями п 2 xt = /п, C,68) 2 ^ =/г (jf + rfjf) C,69) и между концентрическими гиперсферами п C,70) 2 (х, - хJ = л (^ + da'J. C,71) Центром гиперсфер C,70) и C,71) является точка (х, х, ..., х). Гиперплоскость C,68) проходит через эту точку. Радиус гиперсферы C,70) равен Y_naf. Расстояние между гиперплоскостями равно ]Лг dx, разность радиусов гиперсфер — Yn do'.^ Область G есть кольцо ширины Yndx и толщины Ynde', заключенное между двумя гиперсферами и двумя гиперплоскостями. Сечение n-мерной гиперсферы плоскостью, проходящей через центр, образует 97
п—1-мерную гиперсферу того же радиуса (в трехмерном пространстве сечение трехмерной сферы плоскостью, проходящей через центр, есть круг — двухмерная сфера того же радиуса). Объем п— 1-мерной гиперсферы пропорционален п—1 степени ее радиуса, а площадь ее поверхности пропорциональна п — 2 степени радиуса. Объем области G равен произведению площади поверхности п — 1-мерной гиперсферы (длина окружности кольца), на ширину и толщину кольца. Следовательно, объем J J •.. J dxx dx2 ... dxn = С'о'п~2 dx do', C,72) где все множители, содержащие степени п, включены в коэффициент С. Подставляя C,72) в C,67), находим п ,_ .„ /г U (х, a') dx do' = С{в'п~*е 2°2 (* **? 2°2 °' dx do'. C,73) Как легко видеть, правая часть C,73) разбивается на два множителя, из которых один зависит только от х9 а второй только от о'. Из этого следует, что случайные переменные я и а' не зависят друг от друга. Оказывается, средняя и стандарт случайной выборки из нормальной генеральной совокупности взаимно независимы. Плотности вероятности этих случайных величин имеют вид "^ ° C,74) /3 (а') = Съо'п-2е"^ °'\ C,75) где С2-С3 = С,. C,76) Таким образом, х распределено по нормальному закону с дисперсией, равной —, и средней, равной х0. Согласно нормировке нормальной функции B,59), <3-77> 98
Для нахождения С3 проведем нормировку C,75); о' может принимать значения в промежутке [0, -f- оо); ОО 2 П~3 оо ПО' _—— /. П-3 С3 о'^ё^ do' = t 2 е- 0 л" * Таким образом, п-1 2 » C,78) 2 2 ОО где Г (а) = J tas"le"t dt — интеграл Эйлера второго рода о (гамма-функция). Подставляя C,77) и C,78) в C,73), окончательно получаем f j (Jc, a7) rfjc do' =s nJ ^^ z —s— — 1ч ° 2°2 dxdo'. C,79) § 28. Метод максимального правдоподобия Допустим, что вид закона распределения аргумента в генеральной совокупности известен. Но неизвестны параметры, конкретизирующие этот закон распределения. Например, известно, что аргумент нормально распределен, но неизвестны среднее значение аргумента и его дисперсия. Положим теперь, что из генеральной совокупности извлечена случайная выборка. Очевидно, что по этой выборке можно вынести какие-то суждения о генеральной совокупности, в частности, можно сделать какие-то оценки значений неизвестных параметров, определяющих функцию распределения аргумента. Метод максимального правдоподобия состоит в том, что выбираются такие оценки параметров, конкретизирующих закон распределения аргумента, которые дают максимальные значения плотности вероятности для случайного вектора — полученной выборки. 99
Например, C,64) показывает, что при любом значении дисперсии нормальной генеральной совокупности плотность вероятности случайной выборки имеет максимум при Хо = х. А при этой величине Хо максимум плотности вероятности выборки достигается при о2 = а'2. Оценки неизвестных параметров, получаемые методом максимального правдоподобия, называются точечными оценками этих параметров. Например, как показано выше, точечными оценками среднего значения аргумента и дисперсии нормальной генеральной совокупности являются, соответственно, среднее значение и дисперсия случайной выборки. Конечно, эти оценки не следует понимать как утверждения, что неизвестные параметры точно равны даваемым оценкам. Вероятность того, что неизвестный параметр имеет значение, точно равное какой- нибудь фиксированной величине, всегда равна нулю по той же причине, по которой равна нулю вероятность f(x)dx того, что непрерывная случайная величина примет некоторое точное значение. Это уже отмечалось в § 12. Смысл точечных оценок параметров состоит в том, что около этих оценок группируются оценки параметров, сообщающие плотности вероятности полученной выборки большие значения.
ГЛАВА IV ОСНОВЫ ТЕОРИИ ОШИБОК § 29. Виды ошибок измерений Допустим, что истинное значение некоторой вели* чины есть хо. Измеряя эту величину, как правило, получают результат, отличный от xq. Если измерение выполняется неоднократно, то результаты измерений не только отличаются от х0, но в большинстве слу* чаев различны и между собой. Обозначим результаты измерений Тогда разности 2, ¦ .., п D,01) назовем ошибками измерений величины Отношение ошибки измерения к истинному значению измеряемой величины (если последняя не равна нулю) называется относительной ошибкой измерения. Практика измерений показывает, что нужно различать три вида ошибок: промахи, систематические ошибки и случайные ошибки. Промахи—это ошибки, являющиеся результатом низкой квалификации лица, производящего измерения, его небрежности или неожиданных сильных внешних воздействий на измерения. Промахи приводят обычно к очень большим по абсолютной величине Ошибкам. Необходимо, чтобы при выполнении измерений возможность промахов была полностью исклю- гена. Часто советуют в ряде измерений распознавать *>чмерения, являющиеся следствием промахов, по *|$лыиому их отклонению от других измерений того Же ряда и исключать в дальнейшем эти наблюдения т обработки. Этой рекомендации нужно следовать с большой осторожностью. Недостаточно обоснованное 101
исключение из обработки измерений, показывающих заметное отклонение от других измерений, чаще приводит к переоценке точности измерений, а не к исключению промахов. В дальнейшем мы будем считать, что промахи в рассматриваемых измерениях отсутствуют. Систематические ошибки являются следствием влияющих на измерение эффектов, действие которых не распознано и не устранено (или не учтено). Например, луч света звезды при прохождении сквозь атмосферу Земли преломляется и путь его искривляется. Вследствие этого эффекта, называемого рефракцией, измеряемая высота светил над горизонтом всегда больше истинной высоты. Если рефракцию не учитывать, то в измерения высоты светила вносится систематическая ошибка. Часто систематические ошибки характеризуются постоянством знака. Например, при измерении высоты светил рефракция всегда вызывает положительную ошибку. Эта ошибка может быть различной по величине. Для светил, стоящих низко над горизонтом, она намного больше, чем для светил, близких к зениту. Но знак ошибки, вызываемой рефракцией, всегда положителен. Однако могут быть систематические ошибки, изменяющие знак. Например, если наблюдатель исправляет результаты наблюдений за рефракцию, принимая ее значение равным средней величине для данной высоты над горизонтом за год, и не учитывает того, что величина рефракции зависит от температуры воздуха и атмосферного давления, то систематическая ошибка, вызываемая эффектом температуры, будет зимой преимущественно положительной, а летом — преимущественно отрицательной. Здесь закономерность поведения систематической ошибки будет состоять в изменении ее величины и знака в зависимости от температуры воздуха и атмосферного давления, которые связаны со сменой времен года. Причины, вызывающие систематические ошибки, исследуются в тех разделах физики, астрономии или иной науки, которые разрабатывают методику соответствующих измерений. Определяются правила исключения из результатов наблюдений систехМатиче- ских ошибок. Правда, на практике полное исключение 102
систематических ошибок не является возможным. В дальнейшем об этом необходимо помнить. Случайные ошибки являются следствием причин, влияние которых практически невозможно или очень трудно учесть. Этих причин очень много, а роль каждой из них незначительна и изменчива. Поэтому исследовать каждую из причин, предусмотреть ее влияние при данном измерении оказывается невозможным. Допустим, наблюдатель отмечает момент прохождения звезды через нить в поле зрения телескопа. Вследствие большого числа мелких толчков, испытываемых инструментом от проезжающих в отдалении автомашин, мелких сейсмических толчков, хлопаний дверьми в соседнем здании и т. д., направление оптической оси инструмента и, следовательно, положение нити изменяются, не соответствуют заданным. Точно так же влияют температурные эффекты — изменения температуры у различных частей инструмента, вызываемые движениями воздуха, остыванием ночью различных сторон башни, в которой установлен телескоп, влиянием самого наблюдателя, занимающего неодинаковые положения относительно инструмента и т. д. Случайные движения в атмосфере вызывают видимые смещения, мерцания звезды. Сам наблюдатель в разные моменты времени имеет различную психологическую настроенность на измерения, его реакция на наблюдаемое различна и не поддается учету. Он то фиксирует момент совпадения звезды с нитью несколько раньше, чем он это делает обычно, то, напротив, запаздывает. Каждый из перечисленных для данного вида наблюдений эффектов сам является суммой большого числа мелких эффектов, каждый из которых практически невозможно учесть. Можно лишь утверждать, что каждый мелкий эффект вносит некоторую ошибку, которая меняется от измерения к измерению, является случайной величиной, распределенной по некоторому закону. Например, если бы никакие влияния, вызывающие ошибки, не действовали, кроме одного — сейсмических колебаний почвы, появляющаяся в измерениях ошибка была бы случайной величиной, закон распределения которой определялся бы свойствами сейсмических явлений для данного места Земли и 103
характером установки телескопа — его способности амортизировать толчки. Можно принять меры к уменьшению случайных ошибок. И это играет очень важную роль при организации наблюдений. Можно, например, в рассмотренной выше задаче наблюдений принять меры к тому, чтобы температурные влияния сказывались по возможности меньше: устроить вентиляцию башни (что приводит к выравниванию температур отдельных частей инструмента), покрасить башню так, чтобы она меньше нагревалась днем солнцем, можно строить обсерватории дальше от дорог с сильным движением и вне сейсмических районов, в областях с высокой прозрачностью и малой подвижностью воздуха, чтобы мало сказывались колебания атмосферы и т. д. В результате таких мер случайная ошибка будет уменьшаться. Однако полностью устранить случайные ошибки невозможно. § 30. Гипотеза о функции распределения случайных ошибок Предположим, что в некотором ряде измерений возможность промахов устранена, а систематические ошибки исследованы и полностью исключены из результатов измерений. Тогда б — разность между результатом измерения и истинным значением измеряемой величины х0 равна случайной ошибке измерения О ~—~*Х —~- Xq» Каждый раз, как выполняется измерение из данного ряда, случайная ошибка принимает некоторое значение и потому ее можно рассматривать как случайную величину. Теория ошибок основана на гипотезе, что в заданном процессе измерений случайная ошибка распределена по нормальному закону, причем математическое ожидание случайной ошибки равно нулю. Таким образом, предполагается, что плотность вероятности случайной ошибки б имеет вид 1 D,02) а У 2л 104
следовательно, интегральный закон распределения должен быть записан так: D,03) — со Эта гипотеза имеет некоторые теоретические обоснования. Существует следующая, доказанная А. М. Ляпуновым теорема (мы ее приводим без доказательства). Пусть Z Z D,04) — сумма независимых случайных величин, имеющих математические ожидания Mz. = aiy дисперсии M(Zt — aiy = o2i и абсолютные центральные моменты третьего порядка M\Z\— a*|3 п п Обозначим а= 2 аь а2= 2 аЬ которые согласно C,30) и C,31) равны математическому ожиданию и дисперсии S. Тогда, если выполняется условие п ' Y, з >0 при п->оо, D,05) G то для любого заданного числа S {t-af (У — со dt, D,06) равномерно по S. Таким образом, при выполнении условия D,05) сумма случайных величин асимптотически нормальна. Условие D,05) количественно выражает требование, чтобы никакая конечная сумма слагаемых не доминировала в сумме D,04). Теорема Ляпунова, следовательно, утверждает, что сумма бесконечно большого числа случайных величин распределена нормально, если среди членов суммы нет таких, которые доминируют над всеми остальными. При этом не имеет значения, каковы функции распределения слагаемых. 105
Если число слагаемых в сумме D,04) конечно, но очень велико, то распределение S близко к нормальному. В § 23 было показано, что сумма конечного числа нормально распределенных величин имеет нормальное распределение. На основании этого результата и теоремы Ляпунова можно сделать заключение, что чем больше слагаемых в сумме D,04) и чем ближе распределение каждого слагаемого к нормальному распределению, тем ближе к нормальному и распределение 5. Выше приводились доводы в пользу того, что случайная ошибка складывается в результате действия очень большого числа трудно исследуемых причин, каждая из которых вызывает очень малую ошибку. Число этих причин не бесконечно, но очень велико. С другой стороны, нет оснований считать, что распределение ошибок, вызываемых какой-нибудь одной причиной, сильно отличается от нормального распределения. Можно также считать, что среди суммирующихся ошибок, вызываемых различными причинами, нет доминирующих. Иначе эти ошибки выделялись бы, вызывающие их причины могли бы быть подвергнуты исследованию и влияние их устранено. Иначе говоря, доминирующую ошибку можно исследовать как систематическую и вносить за нее поправку. Таким образом, гипотеза нормального распределения случайных ошибок имеет серьезную теоретическую аргументацию. Но, конечно, нельзя сказать (и никогда нельзя будет сказать), что нормальность распределения случайной ошибки теоретически обоснована строго. Математическое ожидание случайной ошибки должно равняться нулю. Если бы математическое ожидание ошибки отличалось от нуля, то это означало бы, что влияние систематических ошибок еще полностью не исключено (обратное утверждение несправедливо — и при наличии систематических ошибок может быть равно нулю математическое ожидание ошибки). Следовательно, в нормальном распределении величины б величину бо нужно считать равной нулю. Распределение имеет вид D,02). 106
Гипотеза нормальности распределения случайной ошибки опирается также на эмпирическую проверку. Если принять меры к уменьшению случайной ошибки и на основе большого ряда наблюдений получить значение измеряемой величины, то оно должно мало отличаться от истинного значения, — его можно принять за *о. После этого можно производить обычные измерения (без мер, ведущих к уменьшению случайных ошибок), находить х% — #о, почти равные случайным ошибкам, и сравнивать получаемое распределение с нормальным. Такая проверка производилась и показала, что гипотеза нормальности распределения случайных ошибок подтверждается опытом. Таким образом, будем считать, что плотность вероятности случайных ошибок имеет вид D,02). § 31. Средняя ошибка; вероятная ошибка измерения Распределение случайной ошибки D,02) характеризуется одним параметром а. Как было показано в § 20, фигурирующая в D,02) величина а2 есть дисперсия случайной величины. Вспомним, что дисперсия есть (б — боJ. А так как в данном распределении 6о = 0, то <т2 = б2. Таким образом, а2 есть математическое ожидание квадрата средней ошибки, а а, являющееся стандартом распределения D,02), равно корню квадратному из математического ожидания квадрата случайной ошибки. В теории ошибок эту величину о, являющуюся важнейшей характеристикой процесса измерения, принято называть средней квадратической ошибкой измерения, или, кратко, средней ошибкой измерения. Нужно помнить, что средняя ошибка здесь понимается в смысле средней квадратической ошибки. Средняя в буквальном смысле случайная ошибка, т. е. математическое ожидание случайной ошибки, ввиду четности нормальной функции /(б) есть нуль, -f-oo 6= J 6/F)^6 = — оо 107
Отношение средней ошибки к истинному значению измеряемой величины (если последнее не равно нулю) а х0 называют средней относительной ошибкой. Так же как а характеризует распределение случайных ошибок, — характеризует распределение относительных Xq случайных ошибок. Используя интеграл вероятности (см. § 22), найдем, что 7 Л = ij)A)^0,683. D,07) Таким образом, вероятность того, что случайная ошибка по абсолютной величине не превзойдет средней ошибки, приблизительно равна 0,683, а вероятность того, что случайная ошибка по абсолютной величине не превзойдет удвоенной средней ошибки, равна фB) ^0,955. Нужно помнить, что средняя ошибка не есть случайная величина. Это — величина, характеризующая процесс измерений. Как только определились все обстоятельства измерений — объект измерений, инструмент, обстановка измерений, наблюдатель, то тем самым сформировалась и объективная величина — средняя ошибка, которая будет характеризовать распределение случайных ошибок в последующих измерениях. Если условия измерений не изменяются, то средняя ошибка остается постоянной величиной. Иногда вместо средней ошибки в качестве характеристики распределения случайных ошибок употребляют так называемую вероятную ошибку. Если вероятность того, что случайная ошибка не превзойдет по абсолютной величине р, равна —, то величина р называется вероятной ошибкой. Из определения следует, что вероятность для случайной ошибки быть по абсолютной величине меньше вероятной ошибки равна вероятности быть больше вероятной ошибки 108
По таблице 2 посредством обратного интерполирования можно найти, что « @,6745) так что -?- S* 0,6745. G Таким образом, вероятная ошибка составляет при близительно 0,6745 средней ошибки. Случайная величина — результат измерений х — связана со случайной ошибкой равенством и === X — где Хо — истинное значение измеряемой величины. Поэтому согласно правилам находим, что плотность вероятности х есть (Х-ХоJ z-e 2a2 , D,08) где а —средняя ошибка измерения. Таким образом, функция распределения результатов измерений есть нормальная функция, математическое ожидание измерения равно истинному значению измеряемой величины, а стандарт распределения равен средней ошибке измерения. § 32. Метод классической теории ошибок Если полностью определились условия измерений, то представим себе бесконечно большое число измерений, которые могут быть выполнены в этих условиях. Их совокупность образует бесконечно большой статистический коллектив — нормальную генеральную совокупность, в которой аргумент х, результат измерения, распределен по закону D,08). На практике производится не бесконечно большое число измерений, а выполняется некоторый ряд из п измерений, Этот ряд измерений можно рассматривать как случайную выборку из нормальной генеральной совокупности, в которой аргумент распределен по закону 109
D,08). В § 27 было доказано, что среднее арифметическое п DД0) и дисперсия п '2 ряда должны рассматриваться как случайные величины, если представить себе множество рядов измерений— случайных выборок из нормальной генеральной совокупности измерений. Как было найдено, их плотности вероятностей имеют вид e DД2) tt-1 2 ~ ,я—2 пег' U Ю = -„-г- ^т* *•. D,13) I 1 \ G Согласно изложенному в § 28 точечной оценкой является х. Таким образом, средняя арифметическая ряда наблюдений является точечной оценкой измеряемой величины. В то же время равенство D,12) показывает, что математическое ожидание х равно х0. Найдем математическое ожидание а'2 оо Mo'2 = J o'2fз (а7) do'. о Подставляя сюда D,13) и выполняя интегрирование, получим М о'2 = -5^1 а2. D,14) Как отмечалось в § 28, точечной оценкой дисперсии нормальной генеральной совокупности является дисперсия случайной выборки. Но равенство D,14) показывает, что математическое ожидание дисперсии случайной выборки не равно дисперсии нормальной генеральной совокупности, оно всегда меньше ее. НО
Искомой величиной является а — средняя ошибка измерения в нормальной генеральной совокупности. А известно одно из значений о' — значение, полученное для ряда измерений D,09). В классической теории ошибок Мо' в левой 2 части D,14) заменяется значением о' , полученным для ряда измерений. Делается это в том предположении (которое нельзя считать удовлетворительным), что имея только одно из значений некоторой случайной величины, лучшее, что можно предположить о математическом ожидании этой случайной величины, это считать его равным данному значение случайной величины. После такой замены находим и учитывая D,11), п Формула D,16), определяющая среднюю ошибку измерения по данным ряда измерений, называется формулой Бесселя. Равенство D.12) показывает, что х распределена нормально со стандартом D,17) или п п(п~ D,18) Величину в* в теории ошибок называют средней ошибкой среднего арифметического. Это имеет то основание, что согласно D,12) х — Хо, как и случайная ошибка измерения, распределена по нормальному за- 2 G2 кону, но с дисперсией — Так как среднее арифметическое ряда наблюдений есть точечная оценка измеряемой величины, то среднюю ошибку среднего арифметического можно также Ш
называть средней ошибкой точечной оценки измеряемой величины. Согласно § 22 имеем Р {х - kax < хо < х + kax) = ф (k), D,19) где ty(k) есть интеграл вероятностей. Если придать k значение 1, то, согласно таблице 2, находим вх)^ 0,683. D,20) Равенство D,20) показывает, что с вероятностью, равной 0,683, истинное значение измеряемой величины лежит в промежутке [х — вх, х + <?*]• Этот промежуток называется доверительным интервалом, а соответствующая вероятность называется надежностью. Так же можно написать Р(х -2ох<хо<х + 2вя) g* 0,955, Р(х - Звх < хо < х + За*) ^ 0,997. J ( ' } Равенства D,20), D,21) и аналогичные равенства, которые можно написать, используя другие значения интеграла вероятности, называют оценками измеряемой величины при помощи доверительного интервала. Они дают основную информацию об измеряемой величине на основании полученного ряда измерений. В классической теории ошибок совокупность этих результатов принято записывать в краткой символической форме: хо = х ± о*. D,22) Запись D,22) не следует понимать в том смысле, что х0 равно х-\-Ох или х — а*, или что х0 достоверно лежит между х — о* и х + а*. Она представляет собой просто краткое условное обозначение равенств D,19) — D,21), обозначая точечную оценку измеряемой величины, равную среднему арифметическому ряда измерений, и среднюю ошибку среднего арифметического. Чем меньше Ох, тем уже доверительный интервал при данной надежности, тем увереннее локализуется истинное значение измеряемой величины. Формула D,17) показывает, что вх тем меньше, чем меньше средняя ошибка одного измерения а и чем больше число измерений п. Формально из D,17) 112
следует, что сделав п достаточно большим, можно добиться сколь угодно малого о* и, следовательно, сколь угодно точного определения #0. Однако, во- первых, ввиду того, что в знаменателе D,17) п фигурирует в степени у, после того как п уже велико, дальнейшее существенное уменьшение о* может быть достигнуто лишь выполнением очень большого числа дополнительных измерений. Поэтому, начиная с некоторого значения п, дальнейшее увеличение п практически мало целесообразно. Во-вторых, нужно иметь ввиду, что все соотношения в изложенной теории получены в предположении, что систематические ошибки из результатов измерений исключены полностью. В действительности этого добиться невозможно, какая-то систематическая ошибка остается. Как только в результате увеличения п средняя ошибка среднего арифметического о** станет меньше систематической ошибки, дальнейшее увеличение п действительного уточнения оценки Хо практически не даст. § 33. Дисперсия дисперсии ряда наблюдений Для того чтобы оценить, какая ошибка в определении а могла быть допущена при замене в равенстве D,14) Мв'2 через сг'2, нужно найти дисперсию а'2. Согласно определению она равна М (о'2 - Мо'2J = —— I г*' —— I I U .п-2 по'2 UU • При этом использовано равенство D,14). Выполняя вычисление интеграла и учитывая, что г (п~ {\ l \ 2 I9 находим М(а/2 - Мо'У = 2(V° о4. D,23) из
Стандарт случайной величины а'2 равен корню квадратному из D,23): п о». D,24) Величина D,24) представляет собой среднюю квадратическую ошибку квадрата средней ошибки, определенного по формуле D,16). Разделив D,24) на математическое ожидание аг\ равное ^——с2, получим п — 1 D,25) Величина D,25) позволяет оценить относительную ошибку замены Мо'2 через а'2. Если п = 100, то величина, определяемая D,25), приблизительно равна 0,14, а при п =1000 — приблизительно 0,05. Эти результаты показывают, что даже при больших п на* ходимое по формуле D,15) значение о2 не следует писать с числом значащих цифр, большим двух. Также и среднюю ошибку измерения а и среднюю ошибку среднего арифметического сг* не следует писать с более чем двумя значащими цифрами. Вторая значащая цифра у а* определяет и число значащих цифр, которые имеет смысл удержать у J в записи D,22). § 34. Пример обработки ряда измерений классическим методом Требуется обработать ряд из 12 определений коэффициента вязкости воздуха. Результаты определений (в системе CGS) приведены в столбце 2 таблицы 3. Прежде всего необходимо определить х. Оно дается формулой D,10). Но для удобства вычислений формулу D,10) целесообразно написать в виде п n^v. -, . а. D,26) Затем по формуле D,16) следует определить среднюю ошибку измерения. Эту формулу для удобства 114
Таблица 3 1 2 3 4 5 6 7 8 9 10 И 12 Н 18338 10~8 18316 18325 18341 18332 18319 18313 18329 18310 18322 18330 18314 X: ~ п + 18 10"8 —4 +5 +21 + 12 J у +9 -10 +2 + 10 -6 +49- 10~8 (*i - аУ 324 10"6 16 25 441 144 1 49 81 100 4 100 36 1321- 10~16 вычислений также целесообразно написать в ином виде: п аJ — п(х — а)' D,27) Равносильность формул D,10) и D,26), а также D,16) и D,27) вытекает из формул связи между моментами (см. § 17). Она легко проверяется и непосредственно. Величина а произвольна. Для удобства вычислений ее следует брать округленной и на глаз близкой к х. В нашей задаче, например, ее можно принять равной 18320-Ю*8. Тогда, заполняя столбцы 3 и 4 таблицы 3 и суммируя их, по рабочим формулам D,26) и D,27) находим jc= 18324,1 ¦ 10~8, а=10,1 • 1( Г8 Далее, согласно D,17) ^ = 2,92- 10~1 Так как у а* и а не имеет смысла удерживать больше двух значащих цифр, то окончательный результат 115
запишется в виде хо = A8324,1 ± 2,9) • 10~8, D,28) а= Ю- 1(Г8. Представление D,28) есть краткая запись равенств РA8321,3- lCTs<*o< 18327,0- Ю"8)^ 0,683, P(l8318,4- 10"8<л:0< 18328,9- 10~8)^ 0,955, и других, им аналогичных. Если желательно использовать вероятную ошибку среднего арифметического р., то находим х -8 р = 0,6745- а- = 2,0- 10 Тогда можно написать также РA8322,1 • 1О""8<л:о< 18326,1 § 35. Выделение промахов Измерения следует организовать таким образом, чтобы не допустить возможности промахов. Промах должен рассматриваться как событие, имеющее вероятность, очень близкую к нулю. В противном случае промахи были бы измерениями, хотя и дающими мало информации о значении измеряемой величины, но характеризующими дисперсию ряда измерений. Если в ряд измерений все-таки вкрался промах, то, конечно, желательно соответствующее измерение исключить из дальнейшего рассмотрения. В том случае, когда наличие промаха не вызывает сомнения, если, например, все измерения, кроме одного, в какой-то мере соответствуют приближенно известному значению измеряемой величины, а одно измерение явно ему не соответствует, исключение последнего измерения обосновано. Исключение этого измерения из рассмотрения будет еще более обоснованным, если стала ясной причина появления промаха. Часто предлагают исключить из ряда измерений просто такие измерения, которые сильно отклоняются от среднего арифметического ряда. Обычно рекомендуется отбрасывать измерение, если X -— X а 116
причем предлагается принимать k = 3 на том основании, что (см. таблицу 2) вероятность ошибке измерения превысить утроенную среднюю ошибку измерения равна 1 — 0,99307 = 0,00693, т. е. уже весьма мала. Поэтому наличие измерения с ошибкой, большей За, заставляет думать, что мы имеем дело с промахом. То обстоятельство, что х — х есть отклонение измерения от среднего арифметического, а не ошибка измерения, в указанной рекомендации предполагается несущественным. К изложенной рекомендации нужно подходить с большой осторожностью. Прежде всего следует поставить вопрос — как определять первоначальные х и а ряда? С использованием измерения, подозреваемого на промах или без него? Если без него, то, следуя изложенной выше рекомендации, если в ряде, состоящем из трех измерений, два измерения случайно совпадут, третье измерение, пусть очень мало отличающееся от них, должно считаться промахом. Очевидно, что это будет необоснованно. С другой стороны, если первоначальные хна находить, включая в обработку и подозреваемое на промах измерение, то в ряде, состоящем из малого числа измерений и содержащем промах, промах не выявится, как бы груб он ни был. В самом деле, рассмотрев наиболее благоприятный для выделения промаха случай, когда п— 1 измерений дали одинаковые результаты, равные хи а /г-е измерение равно Х\ + &, по формулам D,26) и D,27) находим х = х{-\— и o = —f=r. Таким образом, отношение п У п разности между х\ + Ь и х к а равно —=-. Эта ве- V п личина больше 3, только если п >> 10. Когда число измерений в ряде велико, то принимаемое значение 3 для величины k следует считать недостаточно большим, чтобы опасность появления фиктивных «промахов» была устранена. В самом деле, если, например, ряд содержит 50 измерений, то вероятность того, что хотя бы одно из этих измере- ний х будет удовлетворять условию J L > 3, приблизительно равна 0,00693-50 = 0,346, т. е. вовсе не мала. 117
На основании изложенного можно высказать следующие рекомендации: 1) В ряде из я^б наблюдений метод выявления промахов по отклонениям измерений от х применять не следует. 2) При п > 6 считать, что наблюдение является промахом, если о При этом х и а определяются без использования измерения, подозреваемого на промах, и принимается = 4, если 6<я< 100, = 4,5, если 100 < п < 1000, = 5, если 1000 < п. § 36. Закон распространения средней ошибки Допустим, нам известно, что измеряемые величины х0 и и0 связаны точным равенством и0 = ах0, D,29) причем коэффициент а дан. Измеряется величина х, и по этим измерениям мы судим об и, считая Ui = axt D,30) измерениями величины Плотность вероятности Х\ имеет вид D,08). Как следует из § 20, тогда и плотность вероятности щ есть нормальная функция со стандартом, равным аа, и средней, равной м0. Таким образом, средняя ошибка измерения и равна аа, а средняя ошибка среднего арифметического У п причем и = ах. D,32) Допустим теперь, что величины Хо, Уо и и0 связаны равенством ио = хо + у0. D,33) 118
Измеряются х0 и у0 и по результатам этих измерений на основании равенства Ui = Xi + y{ D,34) мы судим об и0. Если измерения х{ и ух независимы друг от друга, то, поскольку они распределены нормально, согласно результатам задачи 38 и щ распределено нормально, а дисперсии связаны равенством al- D'35) Равенство D,35) определяет соотношение средних ошибок измерения у х, у и ^. Если теперь выполнен ряд из П] измерений х и ряд из /22 измерений у, то средние арифметические этих рядов х и г/ также распределены по нормальному закону с дисперсиями 4f ?• D-36) Но тогда, согласно результату задачи 38, D,37) также распределено по нормальному закону с дисперсией | + о|. D,38) Равенство D,38) дает соотношение между средними ошибками средних арифметических х, у и и. Применяя метод математической индукции к результатам D,31) и D,38), можно заключить, что если и0 = ах0 + by0 + cz0, D,39) непосредственно измеряются х, у и <г, и по этим измерениям судят об а, то средние ошибки измерения связаны соотношением Аналогично, средние ошибки средних арифметических с?а2 D,41) cz. D,42) 119
Для сокращения письма в правой части D,39) приведены три измеряемые величины. Очевидно, что для любого числа измеряемых величин справедливы соотношения, аналогичные D,40) — D,42). В том случае, когда и зависит от х, у \\ z нелинейно, та же задача может решаться приближенно. Допустим, что и связано с лг, у и z равенством общего вида Напишем хо = х — б*; Уо = у — Ьд', zo = z — 6z, D,44) где х, у, z — средние арифметические, полученные из наблюдений, а б*, Ьд, 6г — их ошибки. Обозначим также й = г\(х9 у, г) D,45) и напишем ио=п~дп. D,46) Подставим D,44) в D,43) и разложим в ряд Тэйло- ра, ограничиваясь ввиду малости 6*, дд и 6г членами первого порядка относительно них. Из полученного равенства вычтем D,46), принимая во внимание D,45). Это приводит к приближенному равенству 6п = Ъ'х % У> г) • Ь- + v!y (х> У> г) • б - + х? (х, у, 2) б-. D,47) Если рассматривать различные ряды измерений для х, то 8ху как это показывает D,12), распределено нормально. То же справедливо для б# и б5. Если с., а-, а- малы, а ц' х\' г\' не очень быстро изме- х у z х у z няются в окрестностях точки (хо, уо> zo)r то коэффициенты в правой части D,47) можно считать приближенно постоянными, и тогда, так же как из D,39) следовало D,40), из D,47) будет следовать равенство №]ol, D,48) решающее задачу. Формула D,48) дает, как правило, удовлетворительное приближение. Она тем точнее, чем меньше о*, ад, Oz и чем меньше по абсолютной величине вторые производные функции г\ (х, у, z) в окрестностях точки (х0, уо> го). 120
Приближенным будет в случае нелинейной зависимости и значение среднего арифметического п, вычисляемое при помощи D,45). Задача 41. В результате измерений определены площадь поверхности и температура пластины. Они соответственно равны 5 = B4,844 ± 0,0014) см2 и Т = E02,47 ± 0,22) градусов Кельвина. Определить энергию, излучаемую пластиной в единицу времени. Решение. Энергия излучения в единицу времени определяется формулой Стефана В системе единиц CGS постоянная Стефана = 5,6696-10~5. Согласно формулам D,45) и D,47) находим = #5 Т4 = 8,9788- 107 эрг/сек, aL = (#f4J а2 + D#S"f3J al = = 2,3- 10I0+ 16,0- 10I0=18,3- Ю10^. ' сек2 Таким образом, E = (8,979 ± 0,043) • 107 эрг/сек. Сравнение слагаемых в выражении для aL показывает, что основная часть средней ошибки erg вызвана ошибками в измерении температуры. § 37. Критика классического метода Как было указано в § 31, при выводе формулы Бесселя D,16) производится замена Мв'2 через а/2, что нельзя считать правильным. Ошибочность такого перехода можно показать, например, определив математическое ожидание в' о заменив затем в нем аналогично тому, как это было сделано в D,14), Мв' через о' и решив полученное 121
равенство относительно а. Тогда будет получено г (п-[) определяющее а иначе, чем D,15). Этот результат понятен, так как математическое ожидание квадрата случайной величины больше квадрата математического ожидания случайной величины. Действительно, /f n п Из формул D,15) и D,49) предпочтение следовало бы отдать D,49), так как в оценке надежности классический метод использует стандарт а, а не дисперсию а2. Поэтому неравенство D,50) может служить указанием на то, что надежность, оцениваемая по величине а, находимой из формулы Бесселя, преувеличена. Но формула D,49) тоже не является правильной, так как она получена необоснованной заменой Мо' через о'. Итак, следует сделать вывод, что оценивание измеряемой величины при помощи доверительного интервала по формулам D,19) является нестрогим, неточным. Чем больше п, тем в среднем ближе а7 к а и тем меньше в среднем ошибки, которые допускаются при замене Мо'2 на а'2 или Мв' на о'. Следовательно, хотя метод классической теории ошибок неверен, но он дает тем лучшее приближение оценки надежности, чем больше п. § 38. Распределение Стьюдента. Метод малых выборок Существует строгий метод определения вероятности того, что истинное значение измеряемой величины находится внутри выбранного доверительного интервала. 122
Рассмотрим распределение х и в' в случайных выборках из нормальной генеральной совокупности, даваемое выражением C,79): fx (х, о') dx do' = П 2 ^ а п—2 2 2 е 2*2 dxdo'. Введем вместо х новую безразмерную случайную величину ^=A D,51) и найдем плотность вероятности /2B, а')" /2 (z, о') dz do' == fi (х, о') dx do' = п-2 а _ е 2 o»(I+2'dzdff/# D,52) Для того чтобы найти плотность вероятности г, нужно D,52) проинтегрировать по всем возможным значениям а', т. е. от 0 до + оо. Выполнив это, получим /лг(^) D,53) Распределение D,53), называемое распределением Стьюдента, замечательно тем, что оно не зависит от параметров Хо и а нормальной генеральной совокупности, из которой берутся случайные выборки. Для более удобного использования этого распределения в теории ошибок введем случайную переменную и = z VJ^l = ^А \ГК^\, D,54) которая также безразмерна. 123
Из D,53) определим ее плотность вероятности: ? . D,55) Вероятность того, что и не превзойдет по абсолютной величине числа &, равна P{—k<u<+k)= J s{u)du. D,56) Подставив вместо и его выражение D,54) в неравенства получим равносильные неравенства Ь °Г' *-"* ^ ~ A- h Таким образом, равенство D,56) можно написать в виде р(х - k ,— <xo<x + k r^=) = S (k, n\ D,57) где +fe n 4 Полученный результат определяет вероятность того, что Хо, истинное значение измеряемой величины, находится внутри доверительного интервала, величина которого может быть сделана любой, так как k выбирается произвольно. Мы видим, что в равенствах D,57), так же как это было в равенствах D,19) — D,21), середина доверительного интервала для Хо совпадает с точечной оценкой этой величины. Величина 1 124
фигурирующая в D,57), есть та самая находимая из ряда наблюдений величина, которая в классическом методе принимается равной средней ошибке среднего арифметического и обозначается (см. D,18)) о*. Таким образом, выражения в левых частях D,57) и D,19) совпадают. Правые части этих равенств различаются, так как равенство D,19) не является точным; оно получено в результате использования формулы Бесселя D,16), которая неверна. Равенство же D,57) является строгим. Для его использования необходимо иметь значения интеграла D,58) как функции k и п. Этот интеграл в общем случае не выражается в элементарных функциях. Его значения приведены в таблице 4, имеющей два входа: по k и по п. Положив k = 1 и используя таблицу 4, мы видим, что согласно D,57) вероятность Р(х - -г= < хо<х + тт=) D,60) в случае п = 2 равна 0,500, тогда как согласно классической теории ошибок она, независимо от значения п, равна 0,683. Чем больше значение п, тем больше правильное значение вероятности D,60), и при п — оо оно совпадает со значением 0,683, даваемым классической теорией ошибок. Аналогичным образом можно убедиться, что и для других значений k классическая теория ошибок преувеличивает надежность, и это преувеличение тем больше, чем меньше п. Если п = оо, то классическая теория определяет надежность правильно. Уже для п = 20 даваемая ею надежность лишь незначительно превосходит правильную. Изложенный здесь правильный метод теории ошибок был разработан Стьюдентом и Фишером. Его обычно называют теорией малых выборок, так как именно в случае малых рядов измерений (т. е. малых выборок из нормальной генеральной совокупности) ошибочность оценок классической теории количественно существенна и применение теории Стьюдента — Фишера необходимо. Помимо получаемого при помощи D,57) определения надежности нахождения Хо внутри доверительного интервала, необходимо произвести оценку точности 125
Значения функции S (k, n) = n Таблица 4 — 1 du. \. n 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2 0,063 0,126 0,186 0,242 0,295 0,344 0,389 0,429 0,467 0,500 0,530 0,558 0,583 0,605 0,626 0,644 0,672 0,677 0,692 0,705 0,717 0,728 3 0,071 0,140 0,208 0,272 0,333 0,391 0,444 0,492 0,537 0,577 0,614 0,647 0,677 0,704 0,727 0,749 0,769 0,786 0,802 0,817 0,829 0,841 0,073 0,146 0,216 0,284 0,349 0,409 0,466 0,518 0,566 0,609 0,648 0,684 0,716 0,744 0,769 0,792 0,812 0,830 0,846 0,861 0,873 0,885 5 0,075 0,149 0,221 0,290 0,356 0,419 0,478 0,531 0,581 0,626 0,667 0,704 0,737 0,766 0,792 0,815 0,836 0,854 0,870 0,884 0,896 0,907 6 0,076 0,151 0,224 0,294 0,362 0,425 0,485 0,540 0,591 0,637 0,680 0,716 0,750 0,780 0,806 0,830 0,850 0,868 0,884 0,898 0,910 0,921 7 0,077 0,152 0,226 0,297 0,365 0,429 0,490 0,546 0,597 0,644 0,687 0,725 0,759 0,789 0,816 0,839 0,860 0,878 0,894 0,908 0,920 0,929 8 0,077 0,153 0,227 0,299 0,368 0,433 0,493 0,550 0,602 0,649 0,692 0,731 0,765 0,796 0,823 0,846 0,867 0,885 0,901 0,914 0,926 0,936 9 0,077 0,154 0,228 0,300 0,369 0,435 0,496 0,553 0,605 0,653 0,697 0,736 0,770 0,801 0,828 0,852 0,872 0,890 0,906 0,919 0,931 0,941 10 0,078 0,154 0,229 0,302 0,371 0,437 0,498 0,556 0,608 0,657 0,700 0,739 0,774 0,805 0,836 0,856 0,877 0,895 0,910 0,923 0,935 0,945
to \v П k X^ 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,2 3,4 3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 \^ n k ^^ 0,1 0,2 0,3 2 0,739 0,749 0,758 0,768 0,774 0,782 0,788 0,795 0,807 0,818 0,828 0,836 0,844 0,851 0,857 0,864 0,869 0,874 и 0,078 0,155 0,230 3 0,852 0,862 0,870 0,878 0,886 0,893 0,899 0,905 0,915 0,923 0,931 0,937 0,943 0,947 0,952 0,958 0,960 0,962 12 0,078 0,155 0,230 4 0,895 0,904 0,912 0,920 0,926 0,932 0,937 0,942 0,951 0,958 0,963 0,968 0,972 0,975 0,978 0,981 0,983 0,985 13 0,078 0,155 0,231 14 0,078 0,155 0,231 5 0,917 0,926 0,933 0,940 0,946 0,951 0,956 0,960 0,967 0,973 0,977 0,981 0,984 0,986 0,988 0,990 0,991 0,992 15 0,078 0,156 0,231 6 0,930 0,938 0,946 0,952 0,957 0,962 0,966 0,970 0,976 0,981 0,984 0,987 0,990 0,991 0,992 0,994 0,995 0,996 16 0,078 0,156 0,232 7 17 0,078 0,156 0,232 0,939 0,947 0,953 0,959 0,964 0,969 0,973 0,976 0,981 0,986 0,989 0,991 0,993 0,994 0,995 0,996 0,997 0,998 18 0,078 0,156 0,232 TaC >Л 8 0,945 0,953 0,960 0,965 0,969 0,973 0,977 0,980 0,985 0,989 0,991 0,993 0,995 0,996 0,997 0,997 0,998 0,998 19 0,078 0,156 0,232 иц a i \ (продолжение) 9 0,950 0,957 0,963 0,968 0,973 0,977 0,980 0,983 0,987 0,991 0,993 0,995 0,996 0,997 0,997 0,998 0,999 0,999 20 0,078 0,156 0,232 10 21 0,078 0,156 0,232 0,953 0,960 0,966 0,971 0,976 0,979 0,982 0,985 0,989 0,992 0,994 0,996 0,997 0,998 0 998 0,998 0,999 0,999 oo 0,080 0,159 0,239
с» k \J 0,4 0,5 0,6 0,7 0,8 0,9 7 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 н 0,302 0,372 0,438 0,500 0,558 0,611 0,659 0,703 0,742 0,777 0,808 0,836 0,859 0,880 0,898 0,913 0,927 0,938 0,948 0,956 0,963 0,969 0,974 0,977 0,981 0,984 0,987 12 0,303 0,373 0,439 0,502 0,560 0,613 0,661 0,705 0,745 0,780 0,811 0,838 0,862 0,883 0,901 0,913 0,929 0,940 0,950 0,958 0,965 0,971 0,975 0,979 0,983 0,986 0,988 13 0,304 0,374 0,440 0,503 0,561 0,614 0,663 0,707 0,747 0,782 0,813 0,841 0,864 0,8.85 0,903 0,918 0,931 0,942 0,952 0,960 0,966 0,972 0,977 0,981 0,984 0,987 0,989 и 0,304 0,37-5 0,441 0,504 0,562 0,616 0,664 0,709 0,748 0,784 0,815 0,842 0,866 0,887 0,905 0,920 0,933 0,944 0,953 0,961 0,968 0,973 0,978 0,982 0,985 0,988 0,990 15 0,305 0,375 0,442 0,505 0,563 0,617 0,666 0,710 0,750 0,785 0,817 0,844 0,868 0,889 0,907 0,922 0,935 0,946 0,955 0,963 0,959 0,975 0,979 0,983 0,986 0,988 0,990 16 0,305 0,376 0,443 0,505 0,564 0,618 0,667 0,711 0,751 0,787 0,818 0,845 0,870 0,890 0,908 0,923 0,936 0,947 0,956 0,964 0,970 0,976 0,980 0,984 0,987 0,989 0,991 17 0,306 0,376 0,443 0,506 0,565 0,619 0,668 0,712 0,752 0,788 0,819 0,847 0,871 0,892 0,909 0,924 0,937 0,948 0,957 0,965 0,971 0,976 0,981 0,984 0,987 0,990 0,992 18 0,306 0,377 0,444 0,507 0,565 0,619 0,669 0,713 0,753 0,789 0,820 0,848 0,872 0,893 0,910 0,925 0,938 0,949 0,958 0,966 0,972 0,977 0,981 0,985 0,988 0,990 0,992 Та 19 0,306 0,377 0,444 0,507 0,565 0,620 0,669 0,714 0,754 0,790 0,821 0,849 0,873 0,894 0,911 0,926 0,939 0,950 0,959 0,966 0,973 0,978 0,982 0,985 0,988 0,990 0,992 блица 20 0,306 0,377 0,444 0,508 0,566 0,621 0,670 0,715 0,755 0,791 0,822 0,850 0,874 0,895 0,912 0,927 0,940 0,951 0,960 0,967 0,973 0,978 0,982 0,986 0,989 0,991 0,993 4 (продолжение) 21 0,307 0,377 0,445 0,508 0,567 0,621 0,670 0,716 0,756 0,792 0,823 0,851 0,875 0,895 0,913 0,928 0,941 0,951 0,960 0,968 0,974 9,979 0,983 0,986 0,989 0,991 0,993 оо 0,311 0,383 0,452 0,516 0,576 0,632 0,683 0,729 0,770 0,806 0,838 0,866 0,890 0,911 0,928 0,943 0,955 0,964 0,972 0,979 0,984 0,986 0,991 0,993 0,995 0,993 0,997
выполняемых измерений. В классической теории для этого используется формула Бесселя D,16), при помощи которой определяется средняя ошибка измерения а. Мы уже указывали на необоснованность формулы Бесселя. Очевидно также, что на основании ограниченного числа измерений получить точное значение а невозможно. Необходимо и эту задачу решать, используя понятия доверительного интервала и надежности. Для этого при помощи распределения D,13) находим Oik n~] /2 Z, _л ""—^ П ко п—3 v 2 П— 1 о п- 1 где 0</е< 1. Неравенства ko < а' < -г и к равносильны. Отношение а О оо -xe-1 dt о ?г-3 2 <а < г = /С(а, z) называется неполной гамма-функцией. Поэтому D,61) запишется в виде ' dt, D,61) П 2k2 * n-x\-K(^k\^± 9 D,62) В равенстве D,62) величине k можно придавать различные значения, поэтому оно решает задачу нахождения надежности при различных доверительных интервалах для а. 129
таблице 5 приведены значения функции uVz I(u9 z) = K(u ~1тобы получить требуемое значение /С(а, z), нужно aY f Таблица 5 Значения функции / (и, г) = о Г B) и \ 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 Х^ч г и N. 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 1 0,393 0,632 0,777 0,865 0,918 0,950 0,970 0,982 0,989 0,993 0,996 0,998 0,998 0,999 9 0,000 0,004 0,040 0,153 0,338 0,544 0,721 0,845 0,921 0,963 0,983 0,993 0,997 0,999 2 0,158 0,413 0,626 0,774 0,858 0,925 0,958 0,977 0,987 0,993 0,996 0,998 0,999 0,999 10 0,000 0,002 0,023 0,108 0,272 0,476 0,667 0,810 0,901 0,952 0,979 0,991 0,996 0,999 3 0,057 0,251 0,481 0,673 0,806 0,891 0,941 0,969 0,984 0,992 0,996 0,998 0,999 0,999 11 0,000 0,001 0,013 0,074 0,214 0,411 0,610 0,770 0,878 0,940 0,973 0,989 0,995 0,998 4 0,019 0,143 0,353 0,566 0,735 0,849 0,918 0,958 0,979 0,990 0,995 0,998 0,999 0,999 13 0,000 0,000 0,004 0,033 0,125 0,291 0,494 0,682 0,821 0,909 0,958 0,982 0,993 0,997 5 0,005 0,076 0,247 0,463 0,656 0,799 0,890 0,943 0,972 0,987 0,994 0,997 0,999 0,999 15 0,000 0,000 • 0,001 0,013 0,068 0,195 0,383 0,584 0,752 0,868 0,937 0,972 0,989 0,996 6 0,002 0,039 0,166 0,366 0,574 0,742 0,856 0,925 0,963 0,983 0,992 0,997 0,999 0,999 17 0,000 0,000 0,000 0,005 0,034 0,122 0,282 0,483 0,672 0,816 0,908 0,958 0,983 0,993 7 0,000 0,019 0,107 0,282 0,491 0,679 0,816 0,902 0,952 0,977 0,990 0,996 0,998 0,999 19 0,000 0,000 0,000" 0,002 0,016 0,073 0,199 0,385 0,586 0,754 0,871 0,939 0,974 0,990 8 0,000 0,009 0,067 0,210 0,412 0,612 0,771 0,876 0,938 0,971 0,987 0,994 0,998 0,999 21 0,000 0,000 0,000 0,001 0,007 0,041 0,134 0,296 0,496 0,684 0,825 0,914 0,962 0,985 130
путем интерполяции найти из таблицы 5 значение I(u, z), где а U Вместо функции /С(а, г) табулирована функция I{u,z)y так как последняя лучше представима в виде таблицы значений, заданных в области, являющейся прямоугольником. § 39. Пример обработки ряда измерений методом малых выборок Пусть требуется обработать методом малых выборок ряд измерений, рассмотренный в § 33. Составим, как это сделано в § 33, таблицу 3 и по D,26) вычислим х= 18324,1 • 1(Г8. Затем по формуле п i — аJ — п(х — аJ D,63) вычислим стандарт ряда измерении 9,66- 10~8, D,64) после чего найдем величину а =2,92-10"8, Уп-\ которая в классическом методе названа средней ошибкой среднего арифметического, и по таблице 4 (согласно D,57)), придав k значения 1 и 2, найдем РA8321,3 - 10~8<x0< 18327,0- КГ8)** 0,659, D,65) Р A8318,4- 10~8<х0< 18328,9- 10~8)^ 0,930. D,66) Теперь, придав, например, k значения 0,8 и 0,6, находим согласно D,62) и при помощи таблицы 5 131
надежность для средней ошибки одного измерения: ,38; 5,5)-/f C,84; 5,5) = / D,00; 5,5) - / A,64; 5,5) = 0,933 - 0,261 = 0,672, ^-) = /CA6,7; 5,5) - К B,16; 5,5) = = / G,12; 5,5) - / @,92; 5,5) = 0,999 - 0,050 = 0,949. Итак, РG,73- 10~8<а<12,1 < 10~8) = 0,672, D,67) РE,80- 10~8<а<16,1 • 10~8) = 0,949. D,68) Результаты D,65) — D,68) дают основную информацию об измеряемой величине х0 и средней ошибке одного измерения в ряде измерений. Легко видеть, что если выполнены вычисления по обработке ряда измерений классическим методом, то для получения результатов методом малых выборок нужно проделать совершенно незначительную дополнительную работу. Что касается различия результатов в двух методах, то они не столь малы, как это может показаться на первый взгляд. Например, из выражения D,68) следует, что вероятность для х0 оказаться вне доверительного интервала [18318,4-10"8, 18328,9-10~8] равна 0,070. Классический же метод дал вероятность 0,045—существенно меньшую. § 40. Какой метод следует рекомендовать для обработки ряда измерений Классический метод не может оставаться ведущим методом теории ошибок, так как он неправилен. Основным методом должен стать метод малых выборок. В то же время нужно иметь в виду, что почти во всех работах, выполненных до настоящего времени, применялся классический метод теории ошибок. Поэтому для сравнения старых и новых рядов измерений, старых и новых результатов необходимо выписать даваемые классическим методом среднюю ошибку измерения и среднюю ошибку среднего арифметического. Хотя сопоставления, которые при этом будут сдела- 132
ны, не являются строго обоснованными, они дают общее представление о сравнительной точности рядов наблюдений и сравнительной точности результатов. Поэтому следует рекомендовать параллельную запись результатов, полученных классическим методом и методом малых выборок. Например, для ряда измерений, приведенного в § 33, можно рекомендовать запись результата обработки в виде п= 12, = A8324,1 ±2,9). 1(Г8, or =10- 1(Г8 РA8321,3- КГ8<Хо< 18327,0- 10*"8) = 0,659, РG,73- § 41. Применение метода малых выборок для величины, равной сумме измеряемых величин Если, как и в § 36 Uq = UXq, измеряется л:0, а нас интересует щ, то задача в методе малых выборок решается просто. Очевидно, что п==ах9 и р г. U и <" ц ^ г, 4- b и Я (Ь п\ \ У n — 1 У n-~\ В том случае, когда == ^0 "T ^/o "T ^0 и число измерений пи мг, ^з в рядах для х, у и z неодинаково, при использовании метода малых выборок нельзя предложить строгого и простого решения задачи для определения надежности нахождения щ внутри заданного доверительного интервала. Однако можно рекомендовать следующие формулы для
определения т и °и °х V т— 1 /2 ,2 ,2 ,2 /2 ,2 ' D,Ь9) ZTJ" "T" n — i 'i ITT /2 /2 ,2 "in- D JO) m — 1 azj — 1 И тогда надежность для а0 можно определять при помощи приближенного равенства o r) = S(k, m), D,71) т— 1 У m 1/ где й = ? + ^ + ^. Эта рекомендация не имеет строгого обоснования. Но можно видеть, что равенства D,69), D,70) соответствуют характеру метода теории ошибок. В частности, нахождение значения т по формуле D,70) учитывает то обстоятельство, что в определении т большую роль должны играть те значения щ, для которых отношение дисперсии выборки к щ —1 велико. Получаемое по D,69) значение т в общем случае не будет целым числом, поэтому для оценки D,71) в таблице 4 необходимо произвести интерполяцию. В общем случае, когда uo=v\(xo, yQ, zQ), в соответствии с результатами § 36 для метода малых выборок следует рекомендовать формулы: /2 ,2 Wx (*> У> г)]2 „ * 1 lg пг + [r\'v (х, у, г)]2 °у lg п2 + л П\ — I * ft 2 — *• lg m= о'2 /2 „'2 •Л* •!//— — —\ \А И /2 r = К % д. Щ ^гг + К <*• ^ ZT D'73) 134
и D,71), причем u = i\(x, у, г). D,74) Задача 42. В течение небольшого промежутка времени выполнено пять радиолокационных определений расстояния до Юпитера. Получено г = 6,292- 108 км, а'== 0,006- 108 км. За это же время выполнено десять измерений углового диаметра Юпитера. Полу- чен0 d — 45//,84, в'а = 0",96. Масса Юпитера определена шесть раз по возмущениям в движениях комет. Получено М = 1,904- 1030 г, а;м = 0,062- 1030 г. Определить среднюю плотность Юпитера. Решение. Средняя плотность Юпитера выражается через измеренные величины так: B06265)* поэтому согласно D,74) (J = 1,329. Далее, по D,72) и D,73) находим Ц = 0,034. ' т — Следовательно, интерполируя для т = 9,27 в табли це 4, окончательно получаем 1,363-М== 0,654. см3) ^<po< ,6 см6 ' u см3 § 42. Неравноточный ряд измерений. Веса измерений До сих пор мы считали, что измерения одного и того же ряда производятся в совершенно одинаковых условиях и поэтому нет оснований заранее считать, что степень доверия к различным измерениям этого ряда различна. Однако в действительности часто бывает так, что в одном и том же ряде измерений используются наблюдатели различной квалификации, применяются инструменты различного качества, в моменты измерений условия в различной степени благоприятствуют точности измерений. Тогда можно утверждать заранее, что различные измерения заслу- 13S
живают различной степени доверия, ряд наблюдений является неравноточным. Если игнорировать неравноточность ряда измерений и обрабатывать его как равноточный ряд, то даваемая им информация об измеряемой величине будет использована неправильно. Если же пытаться исправить положение, отбрасывая результаты тех измерений, степень доверия к которым заранее была меньше, чем у других измерений, то часть информации, содержащейся в ряде измерений, будет утеряна. Правильное решение должно использовать все измерения, но учитывать их различную точность. Для этого необходимо считать, что величина, названная нами средней ошибкой одного измерения, которая характеризовала весь ряд равноточных измерений или, лучше сказать, каждое измерение этого ряда, в ряде неравноточных измерений не будет постоянной величиной. Средние ошибки отдельных измерений неравноточного ряда должны быть различны у измерений, заранее внушающих различную степень доверия. Следовательно, теперь каждое измерение ряда имеет свою среднюю ошибку. Подпишем под каждым измерением ряда среднюю ошибку этого измерения: D,76) Средние ошибки измерений ряда до обработки неизвестны. Но будем считать, что, оценивая различные для разных измерений условия измерений, мы умеем как-то определять отношение средних ошибок. Тогда, если написать ^ I, 2, ..., /г, D,77) то числа pi будут величинами заранее известными, а а — величиной, требующей определения. Числа pi называют весами измерений, а теперь будем называть не средней ошибкой одного измерения, как это было в равноточном ряде измерений, а средней ошибкой единицы веса, так как согласно D,77), если Рг = 1, то Ог = а. Если все веса pi и а2 помножить на произвольный множитель k, то значения d не изменятся. 136
Таким образом, веса определяются с точностью до постоянного множителя. При изменении этого постоянного множителя автоматически изменится и средняя ошибка единицы веса. Для того чтобы уяснить смысл понятия «вес», представим себе п равноточных рядов измерений с одинаковыми средними ошибками одного измерения, равными а, но состоящими из различного числа измерений ти т2, .. •, ^п. Тогда, если вычислены средние арифметические этих рядов измерений то согласно формуле D,12) средние ошибки величин D,78), если рассматривать их как отдельные измерения, равны соответственно а ° а D,79) тх V т2 V тп Сравнение D,77) и D,79) показывает, что в том случае, когда за отдельные измерения принимаются средние арифметические из равноточных рядов (с одинаковой средней ошибкой), веса этих измерений пропорциональны числу членов ряда. Таким образом, если, например, в некотором ряде измерений вес первого измерения принят равным 1, а вес второго измерения равным k, то это означает, что средняя арифметическая из k измерений, выполненных в таких условиях, в каких выполнялось первое измерение, имеет такую же среднюю ошибку, как и второе измерение. Иначе говоря, k измерений, выполненных в условиях первого измерения, в отношении ошибки эквивалентны одному второму измерению. Именно из этого соотношения исходят, когда вводят веса измерений. Конечно, трудно определить, скольким измерениям наблюдателя А эквивалентно одно измерение наблюдателя В или скольким измерениям в условиях С эквивалентно одно измерение в условиях D. Сделать это точно обычно и невозможно. Но, как правило, когда наблюдения явно неравноточ- нь1, введение весов, определенных даже просто на глаз, существенно увеличивает информацию об измеряемой величине. 137
Итак, неравноточный ряд определяется заданием результатов измерений и соответствующих им весов • • • p. - - D>80) Чтобы определить метод обработки неравноточного ряда, обобщим понятие случайной выборки. § 43. Случайная выборка по одному элементу из п нормальных генеральных совокупностей с одинаковыми средними, но различными дисперсиями Рассмотрим п нормальных генеральных совокупностей, имеющих одинаковые средние значения аргумента Хо, но различные дисперсии, соответственно равные 2 _О^_ ? _О^_ 2 °2 1 Р\ 2 Р2 П РП Следовательно, функция распределения аргумента в 1-й нормальной генеральной совокупности имеет вид лГ~ Pi (xi~xoJ l\Xi)== -|/T~" ^ Составим случайную выборку х2-> • • • > ^«> D,81) извлекая по одному элегленту соответственно из каждой нормальной генеральной совокупности. Обозначим п D,82) ?=1 п \ D,83) п где р= 2 рг- ii Назовем х взвешенным средним, а а'2 — взвешенной дисперсией выборки. Проводя рассуждения, аналогичные тем, которые были использованы в § 27, найдем плотность 138
вероятности случайного вектора. (хи х2, ..., хп), D,84) х 2, ..., Хп 1 У Pip2 • .. Рп 2о'4 = Схе п о ¦ D,83) Мы видим, что плотность вероятности случайного вектора D,84) определяется взвешенной средней и взвешенной дисперсией соответствующей случайной выборки. Далее, так же как в § 27, находим (x, в') dx do' = р (x-xQJ+po'2 = Схе 2°2 J J ... J dx{ dx2... dxn. D,86) (G) Область G заключена между гиперплоскостями п п iXt = px, D,87) i*i = Р (х + dx) D,88) и одноврехменно между концентрическими подобными гиперэллипсоидами IS P (x х? = рЛ Pi (xt - х? = рЛ D,89) Pi {Xi - xf = p(o' + do'f. D,90) Гиперплоскость D,87) проходит через центр гиперэллипсоидов D,89) и D,90). Объем области п-мер- ного пространства, образованной в пересечении рассматриваемых гиперплоскостей и гиперэллипсоидов, равен dx do', умноженному на объем области ft—2-мерного пространства, являющейся пересечением поверхности гиперэллипсоида D,89) гиперплоскостью D,87). Объем этой области, очевидно, пропорционален a'n-2. 139
Таким образом, fx (*, о') dx do' = С2о'п~2 е 2°2 dx do'. D,91) Убеждаясь в независимости случайных величин х и а', после нормировки находим их плотности вероятностей р (X—XqJ -е 2 , D,92) 2=1 ,2 _ 2 _,и-2 fa (о7) = «57 § 44. Обработка ряда неравноточных измерений Чтобы обобщить метод классической теории (§ 32) ошибок на случай неравноточного ряда измерений, найдем математическое ожидание средневзвешенной дисперсии а'2: оо Mo'2 = J в'% (а') tfа'. о Подставляя D,93) и выполняя интегрирование, находим ^ = ?и!а2# D,94) После этого, заменяя в D,94) математическое ожидание в'2 значением этой величины в рассматриваемом ряде измерений, получаем выражение для средней ошибки единицы веса /=1 Формула D,95) называется формулой Бесселя для неравноточного ряда. Совершаемый переход от D,94) к D,95) должен быть подвергнут критике в той же мере, в какой ей подвергался переход от формулы D,14) к D,15) для равноточного ряда. 140
Согласно D,92) функция распределения взвешенного среднего неравноточного ряда есть нормальная функция со средним значением х0 и стандартом a D,96) или, учитывая D,95), Г л ' D>97) у где вх есть средняя ошибка среднего взвешенного. Теперь, на основании изложенного в § 22, можно определить надежность нахождения х0 в задаваемом доверительном интервале. Получаем равенство того же вида, что и D,19), Р (х - ко* < х0 < х + кая) = ф (k)f D,98) где $(к) — интеграл вероятностей. Таким образом, для обобщения классического метода теории ошибок на случай неравноточного ряда измерений необходимо вместо обычной средней арифметической D,10) рассматривать среднюю взвешенную D,82), вместо средней ошибки одного измерения D,16) рассматривать среднюю ошибку единицы веса D,95) и вместо средней ошибки среднего арифметического D,18)—среднюю ошибку среднего взвешенного D,97). Для обобщения метода малых выборок, являющегося строгим методом теории ошибок, на случай неравноточного ряда наблюдений напишем D,91), используя для определения С2 D,92) и D,93), f(x, o')dxde' = П оо  /«-2 р(х-ХоГ+рО'г п-2 2 dxdo'. D,99) Вводя случайную величину Стьюдента о. , D,100) Найдем, как и в § 36, плотность вероятности 141
t» t» а затем плотность вероятности случайной величины , D,101) а .2/ /, , н2 \ 2^ D>102^ Таким образом, как и в случае равноточных измерений, получаем равенство = S(k9 п\ D,ЮЗ) где, по-прежнему, S(k,n) есть функция D,58). Теперь у Jl ^ ? , DЛ04) т. е. как раз та величина, которая в классическом методе принимается равцой средней ошибке среднего взвешенного и обозначается а*. Следовательно, и для неравноточного ряда измерений в методе малых выборок нужно использовать величину D,104), которая вычисляется при применении метода классической теории ошибок. § 45. Пример обработки ряда неравноточных измерений При использовании классического метода теорий ошибок удобно применять рабочие формулы D,105) П x=±-S\pi(xl — a) + a, D,106) cr=l/ — f Ч — , D,Ю7) . D,108) 142
Равносильность выражений D,106), D,107) и, соответственно, D,82) и D,95) легко проверяется, формулы D,106) и D,107) удобнее для вычислений, чем D,82) и D,95). Нужно только а выбрать круглым числом, на глаз близким к х. Пусть дан ряд неравноточных измерений — значения Х{ и соответствующие им pi, вписанные во второй и третий столбцы таблицы 6. На глаз замечаем, Таблица 6 № п/п 1 2 3 4 5 6 7 8 236,4 241,6 242,0 240,7 237,4 239,5 243,8 242,5 1 3 1 5 3 5 3 5 26 xt-a -3,6 1,6 2,0 0,7 —2,6 -0,5 3,8 2,5 Pt {xt - a) -3,6 4,8 2,0 3,5 -7,8 11,4 12,5 +23,3 12,96 7,68 4,00 2,45 20,28 1,25 43,32 31,25 123,19 что а должно быть близко к 240 и потому принимаем а = 240. Тогда вычисляются столбцыXi —a, Pi{xi —а), Pi {*i ~ af и суммы п п п Pi Pi a)\ Так как р = 26, по D,106) — D,108) находим х = 240,90, а = 3,82, <т* = 0,75. Окончательный результат в классической теории ошибок записывается в виде хо = 240,90 ±0,75. В методе малых выборок, используя таблицу 4, записываем результат в виде Р B40,15 <лго< 241,65) = 0,649. 143
§ 46. Ряд неравноточных измерений с известными средними ошибками измерений Допустим, что для некоторой величины х выполнено п рядов измерений. Сами ряды измерений нам не известны, но даны полученные из каждого ряда средние арифметические и их средние ошибки, определенные классическим методом теории ошибок. Можно рассматривать среднюю арифметическую каждого ряда, как результат некоторого измерения. Тогда получим ряд измерений, состоящий из этих средних арифметических, причем известны и средние ошибки каждого измерения, Хи*2 *"') D,109) , <Т2 , Мы опустили знаки среднего арифметического, так как величины хи %2, ..., хп имеют теперь смысл отдельных измерений. Соответствующие средние ошибки подписаны под каждым измерением. Необходимость рассматривать ряды вида D,109) встречается часто. Такая задача возникает, если при выполнении работы требуется использовать некоторую величину х, которая определялась различными исследователями. Автор работы, просматривая имеющуюся по данному вопросу литературу и выписывая все значения х и соответствующие им а*, определенные различными авторами, получит ряд вида D,109). Задача состоит в том, чтобы, использовав информацию, содержащуюся в этом ряде, получить суждение о величине Хо> Ряды вида D,109) и D,80) не эквивалентны. В равенствах D,77) и вытекающих из них 2, ..., п D,110) веса pi определены с точностью до постоянного множителя (при этом, соответственно, с точностью до постоянного множителя определен а2 — квадрат средней ошибки единицы веса), величины же в{ определены однозначно. Поэтому ряд вида D,109) содержит больше информации, чем ряд вида D,80). 144
Составим из членов ряда D,109) линейную комбинацию I = ai*i + а2*2 + ... + апхп> D,111) где ось «2, ..., ап — некоторые, пока не определенные, коэффициенты. Будем рассматривать | как некоторое, определенное при помощи равенства D,111), измеренное значение величины х. Так как | есть линейная комбинация хи Хг, ..., хп, то, по закону распространения средней ошибки, средняя ошибка g определяется равенством о| = а\в\ + а\в\ + ... + а'сг». D,112) Значение величины | зависит от принимаемых значений коэффициентов а*. Определим, при каких значениях а* измерение \ обладает наименьшей средней ошибкой оъ и, следовательно, наибольшим весом. Заметим, что, каковы бы ни были значения аи стг, ..., ап, если бы при этом все измеренные значения Хи Х2, ..., хп оказались равны между собой, то выводимое по ним измерение ?, естественно, следовало бы принять равным той же самой величине. В этом случае из равенства D,112) следует Щ + <*>2+ ••• +«я=Ь D,ПЗ) Поскольку определяющее о^ выражение D,112) от хи *2, .. •, хп не зависит, а при некотором их соотношении (именно при Xi = х2 = ... = хп) должно выполняться равенство D,113), то это равенство выполняется всегда и оно должно рассматриваться как условие, налагаемое на коэффициенты а* при минимизации выражения D,112). Следовательно, необходимо решать задачу на условный минимум. Для этого, согласно известному методу Лагранжа, составим функцию + + ?* 2 ( + а2 где у — множитель Лагранжа, и приравняем нулю ее частные производные по а*. После сокращения полученных равенств на 2 находим а^а? = y; /== 1, 2, ..., п, D, И 4) 145
или, используя D,110), $'> /=1,2,..., я. D,115) Подставляя D,115) в D,113), получаем г где обозначено t D,117) Поэтому D,115) записывается теперь в виде 4* D,118) Подставляя D,118) в D,111), получаем п 1 Таким образом, из всех линейных комбинаций членов ряда D,109) средневзвешенное обладает наибольшим весом и, следовательно, наименьшей средней ошибкой. Используя D,114) и D,112), находим, что a| = или, в соответствии с D,116), а2 D,120) Следовательно, р есть вес g. Вес средневзвешенного равен сумме весов членов ряда. Каждое дополнительное измерение увеличивает информацию об измеряемой величине; это проявляется в том, что возрастает вес средневзвешенного и, следовательно, уменьшается его средняя ошибка. Предполагается, что хи х2, ..., хп распределены нормально со средней, равной истинному значению измеряемой величины х0. Следовательно, их линейная комбинация распределена нормально с той же средней х0. Используя обозначения классической теории ошибок, имеем Таким образом, имея ряд D,109), можно, задав произвольно а2, вычислить при помощи D,110) веса 146
р{ и сумму р. Тогда определенные при помощи равенств D,119) и D,120) I и в$ позволяют написать р (I - <?1 < х0 < I + оъ) а 0,683. D,122) Однако к ряду D,109) возможен и другой подход. Будем рассматривать его просто как ряд неравноточных измерений с весами D,110). Тогда, согласно результатам § 44, | = х, а D,123) D,124) есть соответственно средняя ошибка единицы веса и средняя ошибка средневзвешенного. Теперь мы будем называть а* средней ошибкой единицы веса после уравнивания, а а^ — средней ошибкой средневзвешенного после уравнивания. В отличие от них, а, произвольно введенное для определения по формулам D,110) весов измерений, называется средней ошибкой единицы веса до уравнивания и, соответственно, о% — средней ошибкой средневзвешенного до уравнивания. Существенно отметить, что aj, вычисляемая по формуле D, 120), учитывает значения средних ошибок измерений ряда D,109), но не учитывает величин отклонений измерений ряда от их средневзвешенного. Величина же <т^, вычисляемая через а* и определяемая по формуле D,123), учитывает и величины отклонения измерений от их средневзвешенного. В общем случае а и а* не равны между собой, а следовательно, не равны между собой а, и at Средняя ошибка средневзвешенного до уравнивания и средняя ошибка средневзвешенного после уравнивания, вычисленные по приведенным выше формулам, являются случайными величинами, так как эти вычисленные значения зависят от того, какие ошибки измерений случались у всех тех исследователей, по данным которых составлен ряд D,109). Если измерения всех этих исследователей были свободны от систематических ошибок (и, разумеется, промахов), то математические ожидания а^ и а! равны; значения 147
средних ошибок средневзвешенного до уравнивания и после уравнивания будут отличаться только вследствие случая. Каковы вероятности тех или иных расхождений этих величин, можно судить по полученному в § 33 отношению стандарта величины <т|, найденной из вычислений, к истинному значению а| Это отношение, имеющее смысл средней относительной ошибки величины а|, для неравноточного ряда измерений такое же, как и для равноточного ряда измерений (предлагаем читателю проверить это). Можно приблизительно считать, что <]/-^—) = i|) A)^0,683. D,125) Эта оценка приблизительна потому, что в' не распределен нормально, а также потому, что а% не равно математическому ожиданию С|. На основании D,125) можно заключить следующее. Если п = 10, то маловероятно, чтобы вследствие случайности одна из величин а|, сг^2 более чем в три раза превзошла другую. Если же п = 100, то маловероятно, чтобы одна из этих величин вследствие случайности превзошла другую более, чем на 30%. Допустим теперь, что фигурирующие в D,109) значения среднеарифметических х^ Хг, ..., хп, полученные разными авторами, отягощены систематическими ошибками. Систематическая ошибка в измерениях у каждого автора не влияет (или почти не влияет) на полученное им значение средней случайной ошибки Оъ фигурирующей в ряде D,109). Но систематические ошибки, различные у различных исследователей, вызывают дополнительный разброс значений х\ в ряде D,109). Можно считать, что разнохарактерные систематические ошибки в рядах измерений различных исследователей в сводном ряде D,109) уже проявляют себя как случайные ошибки. В результате расхождения между значениями х\ в ряде D,109) оказываются больше тех, которые должны были бы соответствовать приведенным в этом же ряде 148
значениям а. Легко понять, что это должно приводить к тому, что средняя ошибка после уравнивания должна систематически превосходить среднюю ошибку до уравнивания. Тот же эффект будет получен, если авторы исследований, по результатам которых строился ряд D,109), искусственно уменьшали среднюю ошибку своего ряда, отбрасывая, например, измерения, более других отклоняющиеся от среднего значения. Обработка ряда D,109) состоит из следующих операций. Сначала по формулам i=U 2, ..., п D,126) вводятся веса и определяется их сумма D,127) являющаяся весом средневзвешенного. Произвольную величину а — среднюю ошибку единицы веса до уравнивания, удобно выбирать такой, чтобы значения весов были порядка единиц или десятков единиц. По рабочей формуле п D,128) вычисляется средневзвешенное значение измеряемой величины и по формуле D>I29) — средняя ошибка средневзвешенного до уравни вания. Затем по рабочей формуле D,130) вычисляется средняя ошибка единицы веса после уравнивания и по формуле D,131) 149
—средняя ошибка средневзвешенного после уравнивания. Если окажется or, > aj, D,132) то, очевидно, причина расхождения случайная и целесообразно за окончательное значение средней ошибки средневзвешенного принять среднее арифметическое этих средних ошибок ( + » D,133) так что результат записывается в виде xo = i±^-(a6+a'). D,134) Если аъ<а' D,135) то за окончательное значение средней ошибки средневзвешенного нужно принять at, так как неравенство D,135), возможно, вызвано наличием систематических ошибок внутри рядов отдельных исследователей и потому о% преуменьшает среднюю ошибку средневзвешенного. Результат записывается в виде <г: D,136) или, соответственно, при использовании метода малых выборок 0 o\) = S(l, n). D,137) Далее, отношение И - 42 г~т~ 2 \Л/-±-=*k D,138) Op f П покажет, можно ли утверждать, что различие между о\ и of не является случайным. Если k > 2, то можно утверждать, что обработка ряда D,109) обнаружила либо наличие существенных систематических ошибок внутри рядов, по данным которых был составлен сводный ряд D,109), либо наличие у авторов исследований тенденции преуменьшать зачение средней ошибки своих результатов. 150
§ 47. Пример обработки ряда измерений с известными средними ошибками измерений В 1957 г. Берден (J. A. Bearden) и Томсен (J. S. Thomsen) опубликовали сводку выполненных различными авторами определений скорости света различными методами. Таблица 7 п/п 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Н 299784 782 798 774 786 771 771 776 775 793,1 776 789,8 792 792 792,5 789,5 792,6 793,0 795,1 792,4 794,2 h 10 30 15 4 10 10 10 6 9 0,2 15 3 6 3 1 0,3 0,7 0,3 3,1 2,4 1,4 Pi 0,1 0,01 0,04 0,62 0,1 0,1 0,1 0,27 0,12 250 0,04 1,11 0,27 1,11 10 111,1 20,2 111,1 1,04 1,74 5,10 514,3 xi ~~a -6 -8 +8 — 16 -4 -19 -19 -14 -15 +3,1 -14 -0,2 +2 +2 +2,5 -0,5 +2,6 +3,0 +5,1 +2,4 +4,2 4*1 ~ а) -0,6 -0,1 +0,3 -9,8 -0,4 -1,9 -1,9 -3,8 -1,8 +775 -0,5 -0,2 +0,5 +2,2 +25 +52,5 +333,3 +5,3 +4,2 +21,4 + 1143 Pi(xi - aY 3,6 0,8 2,4 156,8 1,6 36,1 36,1 53,2 27,0 2400 7,0 0,0 1,0 4,4 62,5 27,8 136,5 1000 27 10,1 89,7 4083 Данные, выраженные в км/сек, приведены в таблице 7, В этой сводке приведены не средние ошибки, а вероятные ошибки рг. Так как Pi = О,6745(ть то нужно обработку ряда проводить совершенно так, как если бы были приведены средние ошибки, а полученные результаты для ошибок поделить на 0,6745. Веса будем находить из равенств р2 Pi — ~> Pi приняв произвольную величину р2 равной 10. 151
Выполнив вычисления согласно изложенной выше схеме и совершив путем деления на 0,6745 переход от вероятных ошибок к средним, находим х =299792,22 км/сек, 0g ==0,21 км/сек, а* = 13 км/се к, а* = 0,58 км/сек. Средняя ошибка средневзвешенного после уравнивания больше средней ошибки до уравнивания. Поэтому окончательный результат следует записать в виде хо = B99792,22 ± 0,58) км/сек или, согласно методике теории малых выборок, Я B99791,64 км/сек < х0 < 299792,80 км/сек) = 0,670. Находим, что of _ о\ Г~Т~ 2 • 1/ -=6,6. at V n—l Следовательно, можно уверенно утверждать, что различие между <7| и <7| не является случайным. Оно вызвано либо наличием не исключенных систематических ошибок в рядах, по результатам которых составлена сводная таблица 6, либо наличием тенденции у авторов исследований преуменьшать значение вероятной ошибки своего результата.
ГЛАВА V КОСВЕННЫЕ ИЗМЕРЕНИЯ. МЕТОД НАИМЕНЬШИХ КВАДРАТОВ § 48. Система условных уравнений Во многих наблюдательных и экспериментальных исследованиях встречается такое положение, когда величины Хи Хг, .. ¦, *т, которые требуется определить, непосредственно измерить невозможно. Однако можно измерить величины у и у% ..., Уп, являющиеся известными функциями величин Хи *2, ..., *т, r\t(xu х2% • ¦•, xm) = yh /=1, 2, ..., п. E,01) Необходимо по полученным измерениям величин Уи #2, ..., Уп вынести суждения о значении величин *Ь #2» • • • > Хт» Мы будем считать, что вид функций %• и значения входящих в них параметров известны точно. Но измерения величин ух содержат, как обычно, случайные ошибки. Рассмотрим важный частный случай, когда все функции г)* являются линейными однородными: т i—U 2, ..., п. E,02) Тогда в развернутом виде система равенств E.01) за пишется так: "Ь #12*2 "Ь в • • 4" а\тхт — УU I #22*2 "Т • • • Т" ••••••••#••«••0 Т" #«2*2 "Г • • • "Г #«m*m === Уп > E,03) причем все коэффициенты ац известны точно. Отдельные уравнения в системе E,03) называются условными уравнениями. 153
Величины уи у2у ..., уп есть результаты измерений величин, истинные значения которых равны , о, Уг, о, . . ., уп$ о- Поэтому -•»«, E,04) где бг есть случайная ошибка измерения величины Ух, о. Как и обычно, следует считать, что случайные ошибки бг распределены по нормальному закону с математическим ожиданием, равным 0. Будем также временно считать, что измерения уи У2, ..., Уп равноточны, т. е. средние квадратичные ошибки а измерений величин уи \)ъ, ..., Уп одинаковы. Тогда случайная величина у г — измерение величины y%t о — определяется плотностью вероятности f(yt) = 1 2о2 E,05) Рассмотрим матрицу коэффициентов системы E,03) i • • • • • ... a nm E,06) Рангом R матрицы называется максимальное число линейно независимых ее строк (или столбцов), рассматриваемых как векторы. Из теории линейных алгебраических уравнений известно, что если ранг R матрицы коэффициентов II пц || меньше т, то система E,03) либо не имеет решений либо имеет бесчисленное множество решений. Если бы величины уи Уг, ..., Уп измерялись без ошибок, то число независимых уравнений в системе E,03) равнялось бы R, остальные уравнения (если они есть) были бы следствием R независимых уравнений. В этом случае система E,03) имела бы бесчисленное множество решений. Никакого суждения о значении величин хи #2, ..., хт нельзя было бы вынести. Если R < т, но уи \)г, ..., Уп измеряются с ошибками, то, очевидно, наличие ошибок в измерениях не увеличивает информации в сравнении со случаем, когда ошибок нет, поэтому вывод о невозможности 154
вынести суждение относительно неизвестных остается в силе. Будем считать, что ранг R матрицы || а\$ || равен т (больше т он быть не может). Необходимым (но не достаточным) условием для этого является условие п > т. E,07) Если R = т и п = т (число уравнений в системе E.03) равно числу неизвестных, матрица квадратная), то при любых значениях уи у2, ..., ут система E,03) имеет единственное решение (хи х2, ..,, хт), даваемое формулами Крамера: т = "дг2 где D — определитель системы E,03), неравный нулю, так как ранг матрицы равен m, a D2j — алгебраическое дополнение элемента а^. Так как Х) являются линейными функциями уи то, следуя классической теории ошибок, по закону распространения средней ошибки (§ 36) находим т S?Df E>09) где а—средняя ошибка измерений Равенства E,08) и E,09) определяют, соответственно, точечную оценку (среднее арифметическое) и среднюю ошибку измеряемой величины Xj9o, причем для вычисления Oj нужно знать среднюю ошибку а измерений величин у{. Величина а из самой системы E,03) в случае п = т определяться не может и должна быть дополнительно известна. Случай п = т косвенных измерений соответствует случаю одного- единственного измерения при измерении некоторой величины х. Полученное измерение должно быть принято за точечную оценку измеряемой величины, но судить о средней ошибке точечной оценки невозможно. Если величина о известна из каких-то данных, то, согласно классической теории ошибок, определяется оценка величин Xj, о лг/,0== х}± а/, E,10) где х^ и Oj находятся по формулам E,08) и E,09). 155
§ 49. Избыточная система условных уравнений. Принцип наименьших квадратов. Нормальная система уравнений Основной интерес представляет случай, когда число уравнений в системе E,03) превосходит число неизвестных, п > т. В этом случае система E,03) называется избыточной системой. При этом по-прежнему считаем, что ранг R (прямоугольной) матрицы || aij I! равен т. Если бы величины у\ измерялись точно, их случайные ошибки были бы равны нулю, то в системе E,03) какие-то п — т уравнений были бы следствием остальных т уравнений, а избыточная система E,03) решалась бы точно. Существовала бы такая совокупность значений (хь х2, ... хт), которая точно удовлетворяла бы всем уравнениям избыточной системы. На самом деле измерения величин у\ содержат случайные ошибки и уравнения избыточной системы в какой-то мере противоречат друг другу. В общем случае не существует такой совокупности значений (хи #2, ..., Хт), которая при подстановке в уравнения E,03) обратила бы эти уравнения в тождества. Для любой совокупности значений (хи х2, •. ¦, %т) определятся величины т /=1, 2, ...,п, E,П) равные разностям правых и левых частей уравнений E,03). Величины е* называются остаточными погрешностями. Имеется возможность при данном измеренном ряде значений уи Уг, ..., уп найти такую совокупность значений хи х2, ..., хт, которая удовлетворяла бы принципу максимального правдоподобия. Для этого в представлении E,02), поскольку коэффициенты а^ точно известны, будем рассматривать хи хг, ... , хт как параметры функций yi и определим точечные оценки этих параметров. При помощи закона распределения E,05) найдем плотность вероятности случайной выборки (уи у2, ..., ) . E,12) 156
Согласно принципу максимального правдоподобия точечными оценками хи Хч, ..., хт являются те значения, которые обращают в максимум плотность вероятности E,12). Очевидно, что максимум E,12) достигается, когда функция п I m \2 , х2, ..., хт) = 2 \i/i — 2 CLijXj — min. E,13) Функция E,13) имеет минимум при значениях *2, . • •, хт, обращающих в нуль все ее частные производные: 1 дФ / п т п — 2^ xi Если обозначить = 1, 2, ... E,14) = 2 alkau 1 E,15) то система уравнений E,13) в развернутом виде запишется так: п С\\Х\ "Ь ^12-^2 г • • • 4~ С\тХт— п \ i • • • "Т } E,16) П i i • • • "г === ^—i ^ш Система уравнений E,16) называется нормальной системой избыточной системы E,03). Матрица ее коэффициентов, очевидно, квадратная и симметричная. В высшей алгебре доказывается следующая теорема: если матрица E,06) имеет ранг т, то и матрица (квадратная) коэффициентов, построенных по правилу E,15), имеет ранг т. Поскольку ранг матрицы II Ckj || равен пг, то определитель нормальной системы 157
E,16) отличен от нуля и система имеет единственное решение. Согласно формулам Крамера п ii E,17) где т ^ E,18) ? D — определитель системы E,16), Dhj — алгебраическое дополнение элемента сь$. Таким образом, чтобы получить точечные оценки величин хи Х2, ..., хт, необходимо по коэффициентам избыточной системы E,03) построить нормальную систему E,16) и решить ее при помощи формул E,17), E,18). Отметим важное свойство найденного решения. Сравнение E,13) и E,11) показывает, что сумма квадратов остающихся погрешностей условных уравнений минимальна, когда Хи %2, ..., хт равны своим точечным оценкам. Требование к совокупности неизвестных, чтобы она обращала в минимум сумму квадратов остающихся погрешностей для избыточной системы E,03), называется принципом наименьших квадратов или принципом Лежандра. Мы видим, что совокупность значений хи лг2, ..., хту полученных при решении нормальной системы E,16), отвечает не только принципу максимального правдоподобия, но и принципу наименьших квадратов. § 50. Сумма квадратов остающихся погрешностей для точечных оценок неизвестных Рассмотрим систему равенств E,11). Помножим каждое из равенств на а^ и полученные равенства просуммируем. После изменения порядка суммирования в двойной сумме и использования E,15) находим п п п т /i /i /i n m — 2 cktx,. E,19) /1 158
Так как точечные оценки хи *г, ... > Хт удовлетворяют нормальной системе E,16), то из E,19) следуют соотношения п 2 ciikZi = О, k = 1, 2, . •., m, E,20) которые справедливы для остаточных погрешностей, когда в условные уравнения подставлены точечные оценки неизвестных. Помножим теперь каждое из равенств E,11) на 8г, полученные равенства просуммируем и изменим порядок суммирования в двойной сумме п п п т 2 ej = 2 yfii — 2 е. 2 ацх = /г т п = S г/ге. - 2 Jf, 2 а,/вГ E,21) l 1 J 1 Согласно E,20) двойная сумма в E,21) равна нулю и, следовательно, п п г\ = Д] tjtzt. E,22) /=1 /==1 Помножим каждое из равенств E,11) на уг и просуммируем п п п т 2 Урх == 2 У\ — S ^ 2 аи*г E,23) Изменив порядок суммирования в двойной сумме и использовав E.22), находим п п т п j= 2 у? — 2 *у 2 ед. E,24) Равенства E,22) и E,24) справедливы, если в них фигурируют точечные оценки xi, х2, ..., хт и соответствующие им остающиеся погрешности. § 51. Определение средней ошибки измерений у г методом классической теории ошибок Когда система уравнений избыточная, условные уравнения, вследствие случайных ошибок в измерениях уи противоречат друг другу и минимальная сумма квадратов остаточных погрешностей отлична 159
от нуля. Это дает возможность судить о средней ошибке измерений у\. Используя E,17), напишем равенство E,24) в виде п п т п п 2 е» = 2 У\ - 2 2 bsjys 2 ЗД, E,25) где коэффициенты bSj определяются выражениями E,18). В равенстве E,25) правая часть представлена непосредственно через измеренные величины у% и коэффициенты избыточной системы. Измерения у\ являются случайными величинами, поэтому определяемая ими сумма квадратов остающихся погрешностей также является случайной величиной. Чтобы отчетливее это показать, подставим в E,25) равенства E,04) и выполним простейшие преобразования: 2 е? = 2 у% + 2 2 у Л + 2 6* - т п п т п п — 2 2bsfys0 2ciijijio-S 2 bsjys02 /=1 5 = 1 t=l /=1 Ss==l i~ m n n m n n bsibs 2 ацУ(о — 2 2 bsj6s 2 ацЬь. E,26) iJ /1 l l Как уже отмечалось выше, если бы в измерениях величин ух случайные ошибки были равны нулю, то избыточная система E,03) решалась бы точно, минимальная величина суммы квадратов остающихся погрешностей была бы равна нулю, правая часть равенства E,25) равна нулю. Следовательно, первый и четвертый члены правой части E,26) взаимно уничтожаются. Найдем теперь математическое ожидание случай п ной величины 2 &2г Так как измерения различных Ух взаимно независимы, если s^L E,2 Следовательно, в последней сумме правой части E,26) отличны от нуля математические ожидания лишь тех слагаемых, у которых s = L Очевидно 160
также, что Мб,- = 0, E,28) М6/ = а2 для всех значений L E,29) а—средняя ошибка измерений у{. Итак, получаем п т п 1 м ^КГ1 о —9 9 ^.^ ^^1 / /г? ОА\ /=1 ' /=1 5=1 При помощи равенств E,18) и E,15) находим п п т т. хм т. хм # ¦ m n m 5=1 независимо от значения /. Поэтому получаем а2. E,31) В формуле E,31) фигурирует математическое ожидание суммы квадратов остающихся погрешностей. Следуя методу классической теории ошибок, уже примененному в § 32 (как было отмечено, этот метод не является вполне корректным), заменим математическое ожидание суммы квадратов остающихся погрешностей значением этой величины, вычисляемым по формуле E,24). Тогда определяется выражение для средней ошибки измерений ус ~~ E,32) Формула E.32) является обобщением формулы Бесселя D,16). 52. Определение средних ошибок ?очечных оценок неизвестных Измерения величин у\ мы считали равноточными. Из этого, однако, не следует, что одинаковы и средние ошибки Gj неизвестных величин Ху В общем случае средние ошибки Xj отличны от а и различны 161
между собой. Их величины определяются соотношениями коэффициентов избыточной системы условных уравнений. Точечные оценки неизвестных Xj выражаются через измеряемые величины у\ при помощи линейных соотношений E,17). Поэтому согласно закону распространения средней ошибки п E,33) Используя E,18), находим п 2 mm n mm 2 2?DD 2?aihaik = Рассмотрим выражение m 2 Dhtchk. E,34) Если k Ф /, то E,34) представляет собой сумму произведений алгебраических дополнений элементов /-го столбца определителя на соответствующие элементы другого столбца и, как известно из теории определителей, равно нулю. Для значений же k = j выражение E,34) равно определителю ?>. Поэтому получаем и искомые выражения средних ошибок точечных оценок неизвестных = oy ?-, /= U 2, ..,, /п. E,36) 162
§ 53. Запись результатов решения избыточной системы уравнений в классическом методе Подведем итоги применения метода наименьших квадратов к решению избыточной системы п условных уравнений с т неизвестными. Для решения системы E,03) необходимо вычислить по формулам п ъ ¦¦|—¦ 1 E,15) коэффициенты нормальной системы. Решение нормальной системы дает точечные оценки неизвестных п — 1 > 2, ,.., E,17) где m E,18) Сц С i2 • • • C\m C2\ ^22 • • • C2m 'mm E,37) — алгебраическое дополнение элемента Сумма квадратов остающихся погрешностей для точечных оценок неизвестных минимальна и определяется формулой п п т п f = 2 У\ — 2 х. 2 at/yt. E,24) Для контроля правильности решения следует сумму квадратов^ остающихся погрешностей вычислить также по формуле п п т E,38) вытекающей из E,11). 163
В методе классической теории ошибок средняя ошибка одного измерения уг дается выражением (обобщенная формула Бесселя) п — т E,32) а средняя ошибка точечных оценок неизвестных формулой ^, /=1, 2, ...,m. E,36) Вычисления выполняются на электронно-вычислительных машинах при помощи специальных программ. Окончательный результат в методе классической теории записывается в виде /=1, 2, ...,/л, E,39) кратко обозначающем оценивание неизвестных при помощи доверительного интервала: Р {xj — kOj < xjQ < xt + koj) = г|) (й), E,40) где ty(k) — интеграл вероятностей. § 54. Запись результатов в методе малых выборок Классический метод оценивания неизвестных при помощи доверительного интервала в способе наименьших квадратов некорректен в той же мере, в какой он некорректен (как было показано в § 37) при непосредственных измерениях одной величины. Некорректность состоит в замене в равенстве E,31) математического ожидания величины случайным значением этой величины и в использовании затем получаемого выражения для определения средней ошибки измерения. Как уже отмечалось, формула E,32) является обобщением D,16). В самом деле, ряд наблюдений величины х можно представить в виде избыточной системы уравнений 2, ..., п, E,41) где tji — результаты измерения величины х, 164
Решение избыточной системы методом наименьших квадратов даст точечную оценку х, равную средней арифметической измерений. Поэтому остающиеся погрешности Е{ в условных уравнениях E,41) равны разности измеренных значений х и среднего их арифметического. Число же неизвестных т в системе E,41) равно 1. Таким образом, формула D,16) является точным частным случаем формулы E,41). Однако в избыточной системе E,03) с числом неизвестных т > 1 средние ошибки неизвестных, в общем случае не равные средней ошибке измерения, определяются по формулам E,36). Эти формулы являются аналогом формулы D,17), дающей среднюю ошибку среднего арифметического при непосредственных измерениях одной величины. Строгие оценки неизвестных в избыточной системе уравнений при помощи доверительных интервалов даются теорией малых выборок. Вывод соответствующих формул не содержит ничего принципиально нового в сравнении с тем, что изложено в § 27 и 38. Мы не будем их воспроизводить. Укажем на основной результат, который следует из отмеченной выше аналогии. Оценка неизвестных избыточной системы уравнений при помощи доверительного интервала в теории малых выборок должна производиться согласно формуле D,57). В этой формуле вместо х, что было то* чечной оценкой одной измеряемой величины, должна стоять точечная оценка х^ получаемая методом наименьших квадратов. Вместо Vn~\ (средней ошибки среднего арифметического в классическом методе) должна фигурировать Oj (средняя ошибка неизвестного в классическом методе), даваемая формулой E,36), и вместо п — 1 в функции S(ky п) должно фигурировать п — т. Таким образом, справедлива оценка P{xj — koj < Xjq < Xj + koj) = 5 (k, n — m + 1), E,42) 165
где Г (-) V Ы |(^) 2 ГТ) г _) 2 du, E,43) — m Значения надежности S(k,n — m + 1) находятся при помощи таблицы 4. § 55. Избыточная система неравноточных уравнений До сих пор мы считали, что в системе E,03) измерения величин У и У 2> •••! Ул E,44) являются равноточными. В общем случае это будет не так. Рассмотрим общий случай. Допустим, что веса измерений равны соответственно ри рг, ..., рп, избыточная система E,03) неравноточная. Если среднюю ошибку единицы веса обозначить а, то средние ошибки измерений E,44) равны, соответственно, E,45) Плотность вероятности для выборки E,44) определяется выражением п ( т Применяя, как это было сделано в § 49, метод максимального правдоподобия, т. е. находя совокупность X], при которых E,46) имеет минимум, получаем систему условий п I m \ п т п *= 2 Р&1кУ1 — 2 */ 2 Л^а^/ = 0, /г == 1, 2, ..., т, E,47) 166
являющуюся нормальной системой уравнении для неравноточной избыточной системы. Решение нормальной системы определит точечные значения неизвестных. Сравнение E.47), 5,14), E,15) и E.16) показывает, что если уравнения неравноточной системы E,03) умножить на соответствующие им Y Pi и с полученной избыточной системой действовать как с равноточной, то построенная для нее нормальная система совпадает с системой E,47). Обычно так и поступают. Строят избыточную систему xm = VpiVu E,48) /=12 п и решают ее как равноточную, обычным образом, описанным в § 52 и 53. Отметим, что если остаточные погрешности уравнений системы E,03), равны ег-, то для тех же точечных оценок неизвестных остаточные погрешности уравнений системы E,48) равны Vpfii- Так как решалась нормальная система для избыточной системы E,48), то минимум достигается для суммы квадратов ее остаточных погрешностей, т. е. п / = rain. E,49) Следовательно, для неравноточной системы E,03), при точечных оценках неизвестных минимум имеет сумма квадратов остаточных погрешностей, умноженных на веса измерений. Это требование E,49) называется обобщенным принципом Лежандра. § 56. Избыточная система нелинейных уравнений В общем случае избыточная система является нелинейной, имеет вид E,01), где ц%{хи х2, ..., хт) — некоторые точно известные функции искомых величин хи х2, ..., хт. По-прежнему измеряются у и Уъ, ..., Уп. Будем считать, что измерения равноточные, средняя ошибка одного измерения равна о. 167
Плотность вероятности случайной выборки (Уи Уг, • • •, Уп) f \УU У 2* • • •» Уп) — п 1 —.-п -253 [tWvr)] 2) % /el . E,50) Принцип максимального правдоподобия приводит к условию минимума для суммы квадратов остаточных погрешностей п п 2 8? = S [^ - Л Приравнивая нулю частные производные по Xj} нахо дим нормальную систему Для того чтобы успешно решать нормальную систему E,52), необходимо знать приближенные значения неизвестных хи #2, ..., хт- Пусть такие приближенные значения равны х\1\ х^\ ..*,х^. Если подставить эти значения неизвестных в выражения E,51), то им в общем случае не будет соответствовать минимальная величина суммы квадратов остающихся погрешностей. Минимальное значение этой величины достигается при точечных оценках неизвестных, удовлетворяющих системе E,52). Представив точечные оценки неизвестных в виде Х{ = xf + ду>, / = 1, 2, . „9 т, E,53) можем написать т E,54) где в частных производных аргументы равны х\1\ Х2}> •••» хт' Пренебрегая в правой части E,54) членами второго и более высокого порядка относительно 168
малых величин Д(Д подставляя E,54) в E,52) и со аершая элементарные преобразования, получим ли нейную систему уравнений относительно ДУ*. Запи шем эту систему в развернутом виде: п E,55) где Коэффициенты системы известны, так как и функции i и их производные должны вычисляться для точки A) Y(\) vdA Мы будем предполагать, что матрица дх. имеет ранг т. Тогда, в соответствии с заключением, которое было сделано для системы E,16), отличен от нуля и определитель системы E,55). Система имеет единственное решение. Вычислив по формулам Крамера Д 1!) .. ..., Дм, найдем второе приближение для значений неизвестных xf = х{,1) + Д(Д / = 1, 2, ..., т. E,57) Вторые приближения для Xj не совпадают с точечными оценками, фигурирующими в E,53), вследствие того, что в равенствах E,54) были отброшены члены второго и более высокого порядка малости и потому Д/!) в системе E,55) не равны точно величинам Д(/Пв E,53). 169
Величины xf] нужно принять за значения неизвестных в следующем приближении, найти с ними новые значения коэффициентов в системе E,55) и получить новые поправки Л/2). Каждая новая совокупность значений неизвестных в последующем приближении лучше совокупности значений в предыдущем приближении, если соответствующая ей сумма квадратов остающихся погрешностей, вычисляемая по фомуле E,51), стала меньше. Может случиться, что для какого-то g + 1-го приближения величина E,51) возросла. Это может произойти из-за особенностей функций щ и их частных производных, фигурирующих в системе E,55), и будет показывать, что какие-то приращения А^ вывели соответствующие #<?+1) за линейные окрестности функций r\i для точек, определяемых неизвестными в g-м приближении. В таком случае полученные при- ращения А) используются, но не на полную величину, т. е. g+ 1-е приближение следует принять согласно равенствам xf+1) = xf + xAf, /= 1, 2, ..., m, E,58) причем 0<Я<1—одно и то же для всех значений /. Нужно испробовать несколько значений К и выбрать то, при котором вычисленная величина E,51) становится меньше, чем в g-м приближении. п Когда поведение 2 г\ покажет, что процесс при- ближений можно считать законченным, оценки средней ошибки измерений и доверительные оценки неизвестных выполняются по формулам, приведеным в § 53 и 54.
Татеос Артемьевич Агекян Основы теории ошибок для астрономов и физиков М., 1972 г. 172 стр. с илл. Редактор Я. М. Овчинникова Техн. редактор /С. Ф. Брудно Корректор Л. Л\ Ипатова Сдано в набор 14/XI 1971 г. Подписано к печати 7/VIII 1972 г. Бумага 84ХЮ87з«. Тип. № \. физ. печ. л. 5,375. Условн. печ. л. 9,03. Уч.-изд. л. 8,22. Тираж 15 000 экз. Т-03352. Цена книги 30 коп. Заказ Кя 1397 Издательство «Наука» Главная редакция физико-математической литературы 117071, Москва, В-71, Ленинский проспект, 15 Ордена Трудового Красного Знамени Ленинградская типография № 2 имени Евгении Соколовой Главполиграфпрома Комитета по печати при Совете Министров СССР Измайловский проспект, 29.