Текст
                    Т. А. АГЕКЯН
ТЕОРИЯ
ВЕРОЯТНОСТЕЙ
АЛЯ АСТРОНОМОВ
и Физиков


Т. А. Агепян ТЕОРИЯ ВЕРОЯТНОСТЕЙ ДЛЯ АСТРОНОМОВ И ФИЗИКОВ Допущено Министерством высшего и среднего специального образования СССР в качестве учебного пособия для студентов университетов, обучающихся по специальности «Астрономия» и «Физика» ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ Москва 1974
Теория вероятностей для астрономов и физиков, Т. Л. А г е- кян, Главная редакция физико-математической литературы издательства «Наука», 1974, 264 стр. В книге изложены элементы теории вероятностей в том виде, в каком они должны в первую очередь находить применение в астрономии и физике. Предназначение книги требовало удобства использования излагаемого материала для исследований в области астрономии и физики. Приведено значительное число примеров, главным образом астрономических и физических. Книга может быть использована в качестве учебного пособия при чтении курса теории вероятностей для студентов университетов, специализирующихся по астрономии и физике. Объем материала в ней несколько превышает объем, предусмотренный действующими ныне учебными планами. Рисунков 17, таблиц 9. Издательство «Наука», 1974. Татеос Артемьевич Агскян ТЕОРИЯ ВЕРОЯТНОСТЕЙ ДЛЯ АСТРОНОМОВ И ФИЗИКОВ М , 1974 , 264 стр с илл. Редактор М. П. Ершов Техн. редактор Н. В. Кпшелева Корректор А. Л. Иптнова Сдано в набор 1М 1974 г. Подписано к печати 9/1V 1974 г. Бумага 8'|Х108узя. Физ. печ. л. 8,25. Условн. прч. л. 13,86. Уч.-изд. л. 12,46. Тираж 13 000 якэ. Т-05589. Цена книги 45 к. Заказ № 87 Издательство «Наука». Главная редакция физико-математической литературы 117071, Москва, В-71, Ленинский проспект, 15 2-я типография издательства «Наука», Москва, Шубинский пер., 10 20203 — 060 053 @1)-74 181-74
ОГЛАВЛЕНИЕ Предисловие •. . 6 Глава 1. Случайное событие 7 § 1. Понятие случайного события 7 § 2. Поле случайных событий 8 § 3. Полная система событий 10 § 4. Понятие вероятности случайного события .... 12 § 5. Классическое определение вероятности события . 13 § 6. Статистическое определение вероятности события 27 § 7. Условная вероятность. Зависимые и независимые события 29 § 8. Теоремы сложения и умножения вероятностей ... 31 § 9. Аксиоматическое построение теории вероятностей 42 § 10. Формула полной вероятности 45 § И. Теорема Байеса 46 § 12. Вероятность сложного события 47 Глава 2. Случайная величина 54 § 13. Случайная величина с дискретным распределением 54 § 14. Биномиальное распределение 58 § 15. Гипергеометрическое распределение 60 § 16. Распределение Пуассона 62 § 17. Непрерывная случайная величина 63 § 18. Функции от случайной величины 69 § 19. Дельта-функция 73 § 20. Математическое ожидание функции от случайной величины 75 § 21. Моменты' функций распределения 78 § 22. Связь между моментами относительно различных начал 84 § 23. Моменты распределения Пуассона 85 § 24. Вероятностная трактовка некоторых физических понятий 90 § 25. Флуктуации физических величин 92 § 26. Нормальный закон распределения 96 § 27. Асимметрия и эксцесс распределения 99 § 28. Характеристическая функция случайной величины 103 § 29. Интегральное представление дельта-функции . 105
ОГЛАВЛЕНИЕ § 30. Интеграл вероятностей 1<>7 § 31. Теорема Муавра — Лапласа 108 § 32. Мера неопределенности полной системы событий 115 § 33. Количество информации 118 § 34. Мера неопределенности случайной величины . . . 124 Глава 3. Случайный вектор 129 § 35. Понятие случайного вектора. Функция распределения случайного вектора 129 § 36. Функция от случайного вектора 132 § 37. Математическое ожидание и дисперсия суммы случайных величин 136 § 38. Математическое ожидание функции от случайного вектора 149 § 39. Неравенство Шварца 149 § 40. Характеристическая функция суммы случайных величин 150 § 41. Суммирование большого числа случайных величин. Метод А. А. Маркова 152 § 42. Случай, когда сумма одинаково распределенных взаимно независимых случайных величин при л—>оо имеет математическое ожидание и дисперсию ... 154 § 43. Распределение Хольцмарка 155 § 44. Центральная предельная теорема 160 § 45. Функция распределения случайных ошибок наблюдений 161 § 46. Случайная величина %п 165 § 47. Обобщенная теорема Муавра — Лапласа 167 § 48. Моменты случайного вектора. Коэффициент корреляции 170 Глава 4. Оценивание параметров распределений и статистические гипотезы 174 § 49. Статистические коллективы 174 § 50. Случайная выборка из статистического коллектива 180 § 51. Принцип наибольшего правдоподобия. Точечные оценки параметров 183 § 52. Принцип наибольшего правдоподобия в статистическом коллективе с дискретным аргументом. Точечные оценки вероятностей 184 § 53. Принцип наибольшего правдоподобия в статистическом коллективе с нормально распределенным аргументом. Точечные оценки математического ожидания и дисперсии аргумента 186 § 54. Распределение выборочного среднего значения и стандарта в выборках из нормальной генеральной совокупности 187 § 55. Распределение Стьюдента. Оценивание параметров при помощи доверительного интервала . . . 191
ОГЛАВЛЕНИЕ § 56. Косвенные измерения. Метод наименьших квадратов 197 § 57. Сумма квадратов остающихся погрешностей для точечных оценок неизвестных 201 § 58. Оценивание неизвестных в способе наименьших квадратов при помощи доверительного интервала 203 § 59. Проверка гипотез о функции распределения аргумента. Критерий согласия 206 Глава 5. Случайная функция 212 § 60. Понятие случайной функции 212 § 61. Классификация случайных функций 215 § 62. Математическое ожидание функциих\ (Х(^), X (г*),... ..., ХAп)). Моментные функции случайных функций. Математическое ожидание; дисперсия 222 § 63. Корреляционная функция 224 § 64. Случайная функция с некоррелированными приращениями. Пуассоновский процесс. Взаимная корреляционная функция двух случайных функций . 228 § 65. Переходные вероятности 229 § 66. Задачи о выбросах 235 § 67. Стохастический интеграл 239 § 68. Комплексная случайная величина. Комплексная случайная функция 242 § 69. Спектральное представление случайной функции . 243 § 70. Марковские процессы 248 § 71. Уравнения Колмогорова для непрерывного процесса 250 § 72. Обобщение для случайной функции-вектора . . . 258 § 73. Уравнения Колмогорова — Феллера для чдсто разрывного марковского процесса 261
ПРЕДИСЛОВИЕ Цель настоящей книги — служить основой систематического университетского курса теории вероятностей для астрономов и физиков. Она строилась так, чтобы вызвать у читателя интерес к использованию современных вероятностных методов в научных исследованиях и привить необходимые для этого навыки. Излагаемый теоретический курс иллюстрируется задачами с приведенными решениями, часть которых является извлечениями из научных работ по астрономии и физике. Основой книги послужил курс, который автор в течение ряда лет читал в Ленинградском университете. Автор понимал трудности, которые ставит сочетание необходимого в данной книге физического подхода к теме исследования с математической строгостью изложения. Он сознает, что возможно существенное улучшение книги и будет благодарен всем, кто сообщит о замеченных недостатках и внесет пожелания.
Глава 1 СЛУЧАЙНОЕ СОБЫТИЕ § 1. Понятие случайного события В повседневной жизни часто приходится иметь дело с событиями, которые при выполнении некоторых условий могут произойти, а могут и не произойти Например, при трении о намазку спичечной коробки спичка может зажечься, а может и не зажечься. При выстреле в мишень событие — попадание пули в яблочко — может произойти, но может и не произойти. При бросании игральной кости цифра 1 может появиться, а может и не появиться. Условимся называть такие события случайными событиями. Совокупность условий, при которых рассматривается появление случайного события, будем называть комплексом условий. Если данный комплекс условий многократно в точности повторяется, то употребляют также более короткий термин — испытание. Можно сказать, что при данном испытании случайное событие состоялось (или не состоялось). То, что нельзя заранее определить, случится или не случится рассматриваемое событие при выполнении данного комплекса условий, не означает принципиальной невозможности познать данное явление. Это означает лишь, что мы не располагаем достаточными сведениями о явлении, о механизмах, которые им управляют, для того чтобы точно предсказать, произойдет событие или не произойдет. Если бы игральная кость выбрасывалась машиной, сообщающей кости при ее точно заданной начальной ориентации точно заданные вектор скорости и момент вращения, а полет кости, включая ее отскоки от стола, был точно исследован средствами теоретической механики, то можно было бы предсказать, какая цифра появится после остановки кости. Сложность задачи здесь состоит в том, что совершенно незначительные, почти неуловимые изменения в начальных условиях (ориентация кости, ее расстояние от стола, вектор ее скорости, момент вращения) изменяют окончательный результат.
СЛУЧАЙНОЕ СОБЫТИЕ СГЛ. 1 § 2. Поле случайных событий Введем систему обозначений. Пусть А — некоторое событие, которое может произойти при выполнении некоторого комплекса условий. Обозначим А A.1) событие, состоящее в том, что при выполнении данного комплекса условий событие А не произошло. А называется дополнением, А. События А и А называются противоположными событиями. Очевидно, что Пусть А и В — события, каждое из которых может случиться при выполнении некоторого комплекса условий. Условимся обозначать А + В A.2) событие, состоящее в том, что произошло хотя Гы одно из событий А и В. Событие A.2) называется суммой или объединением А и В. Например, назовем событием А появление валета при извлечении из колоды игральной карты, а событием В — появление карты масти треф. Событие А -\- В происходит, если извлеченная игральная карта оказалась одним из валетов либо любой картой масти треф, в том числе и трефовым валетом. Аналогично, событие А + В + С состоит в том, что произошло хотя бы одно из событий Л,5иС. Например, если А есть появление 1, В — появление 3, С — появление 5 при бросании игральной кости, то А + В + С есть событие, состоящее в появлении нечетной цифры. Легко убедиться, что справедлив сочетательный закон (А + В) + С = А + (В + С) = А + В + С. Условимся обозначать АВ A.3)
§ 21 ПОЛЕ СЛУЧАЙНЫХ СОБЫТИЙ Й событие, состоящее в том, что при выполйеййй Комплекса условий случилось и событие А и событие В. Событие A.3) называется произведением или пересечением А и В. В приведенном выше примере с игральными картами событие АВ произошло, если извлечен трефовый валет. Выполняется сочетательный закон (АВ)С = А(ВС) = АВС. Легко также убедиться в справедливости равенств А +В = Л-Л, А + В = ~АВ A.4) и выполнении распределительного закона (А + В)С = АС + ВС. A.5) В некоторых случаях рассматриваемое событие таково, что при выполнении данного комплекса условий оно не может случиться. Такое событие называется невозможным. Если, например, в урне имеются только белые шары, то извлечение из нее черного шара является невозможным событием. Условимся обозначать невозможное событие буквой V. Легко убедиться в справедливости равенства АЛ = У. A.6) Если при выполнении некоторого комплекса условий рассматриваемое событие обязательно произойдет, то такое событие называется достоверным. Например, если в урне имеются только белые шары, то при извлечении шара событие, состоящее в том, что он белый, является достоверным событием Условимся обозначать достоверное событие буквой V. Очевидна справедливость равенства А + А = И. A.7) Нетрудно убедиться в справедливости равенств О = У, А + 1Г = А, А*Т]=1], A.8) А + У =7, АУ = А.
10 СЛУЧАЙНОЕ СОБЫТИЕ (ГЛ. 1 Рассмотрим случайные события А и В. Выше было показано, что при помощи операций A.1) — A.3), можно ввести в рассмотрение ряд новых событий. Казалось бы, выполняя эти операции многократно, можно ввести в рассмотрение бесчисленное множество событий. Однако, как показывают, например, равенства A.4) и A.8), повторное применение рассмотренных операций может приводить к повторению одних и тех же событий. Совокупность событий называется полем событий, если выполнение операций A.1) — A.3) над событиями поля приводит снова к событиям, принадлежащим полю. Наряду с событием А поле событий содержит событие А. Наряду с событиями ,4, В оно содержит события А -\- В и АВ. Вследствие равенств A.6) и A.7) поле событий всегда включает невозможное и достоверное события. Например, после случайных событий, порожденное случайным событием А, включает А, Ж, 17, V. A.9) Равенства A.6) — A.8) показывают, что A.9) действительно является полем случайных событий. Поле случайных событий, порожденное случайными событиями А и В, состоит из А, В, А, В, А+В, А+В, А + В, Ж+Б, A.10) АВ, АВ, АВ, АВ, АВ + АВ, АВ + ЖВ, V, V. Любая из операций A.1) — A.3), выполненная над событиями A.10), снова приводит к одному из событий A.10). Например, 'АВ = Ж + В, (АВ + АВ) + АВ = Ш= А + В, (А + В) (Ж + В) = АВ + ЖВ. § 3. Полная система событий Если при выполнении некоторого комплекса условий появление события А делает достоверным событие В, то мы будем говорить, что событие В содержит в себе событие А, и обозначать это свойство событий так; А (Ц В.
§ 3] ПОЛНАЯ СИСТЕМА СОБЫТИЙ Ц Например, при бросании игральной кости событие, состоящее в появлении 1, делает достоверным событие, состоящее в появлении нечетной цифры, следовательно, событие {появление нечетной цифры} содержит событие {появление 1}. В общем случае, если А а В, обратное утверждение не справедливо, т. е. появление В не делает достоверным А. В приведенном выше примере появление нечетной цифры не делает достоверным появление единицы. В частном случае могут быть справедливыми как соотношение А а В, так и соотношение В СИ А. В таком случае события А и В называются равносильными, т. е. А = В. Если, например, в урне имеются шары различных диаметров, то событие А, состоящее в извлечении шара наименьшего радиуса, и событие В, состоящее в извлечении шара наименьшего объема, являются равносильными событиями. По этой причине все достоверные события (при выполнении данного комплекса условий) являются равносильными, и мы можем все достоверные события обозначать одной и той же буквой (II). Аналогично равносильны все невозможные события (V). Если при выполнении некоторого комплекса условий появление события А не делает невозможным появление события В, то события А и В называются совместимыми событиями. В противном случае события называются несовместимыми. При извлечении из колоды одной игральной карты события {появление валета} и {появление дамы} являются несовместимыми событиями. Но события {появление валета} и {появление карты масти треф} — совместимы. Пусть А ^Сг + С2 + . . . + Ст, A.11) т. е. А обозначает событие, состоящее в наступлении хотя бы одного из событий Сц С2, . . ., Ст. Если все события Сг, С2, . . ., Ст попарно несовместимы и справедливо равенство A.11), то говорят, чтобы событие А подразделяется на частные случаи Сг, Сг, . . .
12 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 Система несовместимых событий Си С,, . . ., Ст A.12) называется полной системой событий, когда известно, что при выполнении комплекса условий одно из событий этой системы должно с достоверностью произойти. Для полной системы Сг, С2, . . ., Ст очевидно равенство» Сг + С2 + . . . + Ст = *7. A.13) Простейшей полной системой событий является система А, А. § 4. Понятие вероятности случайного события При выполнении соответствующего комплекса условий достоверное событие обязательно произойдет, а невозможное событие обязательно не произойдет. Среди тех событий, которые при выполнении комплекса условий могут и произойти и не произойти, на появление одних можно рассчитывать с большим основанием, на появление других — с меньшим. Если, например, в урне белых шаров больше, чем черных (шары отличаются только цветом, и перед извлечением шара урну встряхивают, чтобы шары хорошо перемешались), то рассчитывать при извлечении шара на появление белого шара больше оснований, чем на появление черного. Мы скажем, что вероятность появления белого шара больше вероятности появления черного шара. Таким образом, вероятность события есть величина, определяющая, насколько значительны объективные основания рассчитывать на появление этого события. Необходимо подчеркнуть, что вероятность события есть объективная величина, существующая независимо от познающего субъекта и определяемая всей совокупностью условий, при которых может произойти событие. Объяснение, которое мы дали понятию вероятности, не является математическим определением, так как оно не определяет это понятие количественно. Исчерпывающей математической формулировки понятия вероятности не существует. Однако важное значение имеют два определения этого понятия, являющиеся част-
§ 5] КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 13 ными определениями, применимыми в некоторых определенных условиях. Это так называемые: 1) классическое определение вероятности события и 2) статистическое определение вероятности события. § 5. Классическое определение вероятности события Классическое определение вероятности события сводит это понятие к более элементарному понятию равно- возможных событий, которое уже не подлежит определению и предполагается интуитивно ясным. Например, при бросании игральной кости, имеющей правильную форму (куб), все шесть событий появления цифр 1, 2, 3, 4, 5, 6 являются равновозможными событиями. Условимся посредством Р (А) обозначать вероятность события А. Пусть событие А представляет собой реализацию одного из равновозможных случаев, входящих в состав полной системы равновозможных событий, т. е. А =Сг + С2 + .. . +Ст, A.14) V = С, + С2 + . . . + Ст + Ст+1 + . . . + Сп. A.15) События Си С2, . . ., Ст мы будем называть благоприятными для события А, так как появление одного из них делает достоверным появление события А. События Ст+и Ст+2> . . ., Сп неблагоприятны для события А. Появление одного из них делает невозможным появление события А. Тогда вероятность события А равна отношению числа благоприятных событий к общему числу равновозможных событий, т. е. Р(Л) = -^-, т<#*. A.16) Согласно этому определению вероятности события получаем = 4-. A.17)
14 СЛУЧАЙНОЕ СОБЫТИЕ 1ГЛ. 1 т. е. равновозможные события имеют одинаковую вероятность. Если, например, находящиеся в урне шары отличаются друг от друга только цветом, то при извлечении шаров вслепую появление каждого из шаров следует считать равновозможным. Пусть в урне имеется 5 белых и 3 черных шара. Тогда полная система событий состоит из 8 равновозможных событий, а событие, состоящее в появлении белого шара, подразделяется на 5 таких событий. Поэтому вероятность появления белого шара Аналогично, вероятность появления черного шара так как здесь число благоприятных событий равно 3. Из определения следует, что наибольшую вероятность имеет достоверное событие, Р(Щ = 1, а наименьшую — невозможное событие, Р (V) - 0. Вероятность любого события А удовлетворяет неравенству 0<Р(Л)<1. A.18) Если событие В содержит в себе событие А, то это означает, что события, являющиеся благоприятными для А, благоприятны.и для 5, но не все события, благоприятные для 5, являются благоприятными для А, иначе события А и В были бы равносильными. Следовательно, если А а В, то Р(А)<Р(В). Задача 1. В изданном в 1781 г. каталоге Мессье, содержащем наблюдаемые на небе 108 ярких туманных
§5] КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 15 объекта, имеется ЗУ галактик, 29 рассеянных скоплений, 29 шаровых скоплений, 6 диффузных туманностей и 5 планетарных туманностей. Определить вероятность того, что из двух наугад выбранных в каталоге объектов а) каждый окажется галактикой, б) один окажется рассеянным, а другой шаровым скоплением. Решение. Выбор любой пары объектов из каталога следует считать одним из равновозможных событий. Общее число равновозможных событий равно числу сочетаний из 108 объектов по 2, т. е. С%9. В задаче а) число благоприятных событий равно С%. Искомая вероятность Р = С%/С2т ^ 0,128. В задаче б) число благоприятных событий равно числу рассеянных скоплений, помноженному на число шаровых скоплений 29 X 29. Искомая вероятность р = 292/С?08 ^ 0,146. Задача 2. Найти вероятность того, что при случайном выборе четырех букв из слова «математика» будут получены буквы, из которых можно составить слово «тема». Решение. Общее число равновозможных событий равно числу сочетаний из 10 букв, составляющих слово «математика», по 4, а число благоприятных событий равно 2x1 X 2 X 3 = 12, так как буква V может быть выбрана двумя способами, буква V — одним, буква 'м* — двумя и буква 'а* — тремя способами. Искомая вероятность 3 а д а ч а 3. Найти вероятность того, что при извлечении из колоды п игральных карт (в колоде 52 карты) все они окажутся разных значений. Решение. При п > 13 рассматриваемое событие является невозможным, так как в колоде различных значений карт всего 13. Следовательно, при п > 13 вероятность события равна нулю. Найдем Р при /г^ 13. Число всех равновозможных случаев равно Си» Для нахождения числа благоприятных
16 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 событий заметим, что если бы извлеченные карты были одной и той же масти, то все они были бы различных значений. Число различных сочетаний п карт одной определенной масти равно С- Однако каждый раз, как будет получено некоторое сочетание карт одной масти, можно путем замены каждой карты на карту того же значения, но другой масти, получить еще одно сочетание тех же значений карт. Произведя все возможные такие замены для каждого сочетания из карт одной масти, получим все благоприятные события. Из этого следует, что число благоприятных событий равно С13-4П. Таким образом, при п <^ 13 искомая вероятность Р =4"<з/С. Задача 4. Найти вероятность того, что при случайном распределении к частиц в п ячейках (к <С п): а) в к определенных ячейках окажется по одной частице, б) в к каких-то ячейках окажется по одной частице. Задачу решить в статистиках: 1) Больцмана, 2) Бозе — Эйнштейна, 3) Линден-Белла и 4) Ферми — Дирака. В статистике Больцмана, которой подчиняется обычный газ, частицы принципиально различны между собой, так что перестановка двух частиц, находящихся в разных ячейках, дает новое распределение. Число же частиц в одной ячейке не ограничено. В статистике Бозе — Эйнштейна которой подчиняется, например, фотонный газ, частицы принципиально не различимы. Перестановка двух частиц, находящихся в разных ячейках, не дает нового распределения. Число частиц в одной ячейке не ограничено. В статистике Линден-Белла, которой подчиняются элементарные объемы фазового пространства звездных систем, частицы принципиально различимы, но в каждой ячейке может находиться не более одной частицы. В статистике Ферми — Дирака, которой подчиняется, например, электронный газ, частицы принципиально не различимы и в каждой ячейке может находиться не более одной частицы. Решение. 1) В статистике Больцмана общее число всех равновозможных событий равно пк, так как каждая частица может расположиться в каждой из п ячеек при любом расположении других частиц.
§ 5] КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 17 а) Число благоприятных событий расположения к частиц в к определенных ячейках равно числу перестановок частиц в этих ячейках — /с!. Таким образом, искомая вероятность Р AЛ9) б) Число благоприятных событий расположения к частиц в каких-то к ячейках равно числу различных сочетаний к ячеек из общего числа п, помноженному на число перестановок к частиц. Таким образом, искомая вероятность ^ п±-7. A.20) 2) В статистике Бозе — Эйнштейна для нахождения числа всех равновозможных событий выстроим все ячейки в ряд. Границы ячеек определяются перегородками. Число всех перегородок, очевидно, равно п + 1. Частица считается находящейся в ячейке, если она оказалась Рис. 1. между перегородками ячейки (рис. 1). Если при некотором данном распределении частиц в ячейках поменять между собой местами любые две или несколько частиц, то ввиду принципиальной неразличимости частиц в статистике Бозе — Эйнштейна нового распределения не получится. Точно так же не будет получено новых распределений, если поменять между собой местами перегородки. Однако каждый раз, как поменяются местами частица и перегородка (две крайние перегородки закреплены и перемещаться не должны), будет получаться новое распределение. Поэтому число всех равновозможных распределений равно (л-1I*1 ' [1'*1}
18 СЛУЧАЙНОЕ СОБЫТИЕ 1ГЛ. 1 т. е. числу перестановок из к -{- п — 1 элементов (к частиц и п — 1 перегородок), деленному на произведение числа перестановок между собой к частиц и числа перестановок между собой п •— 1 перегородок. а) Число благоприятных событий распределения частиц по одной в к определенных ячейках равно ровно 1, так как перестановки частиц между собой новых распределений не дают. Поэтому искомая вероятность б) Число благоприятных событий распределения частиц по одной в каких-то к ячейках равно Сп, следовательно, искомая вероятность Р - п\(п-1)\ ( 2о. г — (к + п- 1)! (п -/с)! * \*-*°' 3) В статистике Линден-Белла частицы могут располагаться не более одной в ячейке. Но они принципиально различимы. Поэтому число всех равновозможных событий равно , *' . A.24) (л — к) I ч 7 Число благоприятных событий в задаче а) равно к\. Поэтому искомая вероятность *!(*)! . A.25) Число благоприятных событий в задаче б) равно A.24) — числу равновозможных событий. Искомая вероятность Р = 1, A.26) что естественно, так как при любом распределении в статистике Линден-Белла выполняется требование задачи б). 4) В статистике Ферми — Дирака, в отличие от статистики Линден-Белла, частицы принципально не различимы. Поэтому число всех равновозможных событий
§ 5] КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 19 равно Сп* Число благоприятных событий в задаче а) равно 1, а искомая вероятность Р= *'(»-*>' • A.27) Число благоприятных случаев в задаче б) равно Сп» а искомая вероятность Р=1. A.28) Таким образом, статистики Линден-Белла и Ферми — Дирака приводят к одинаковым вероятностям распределения. Задача 5. к частиц случайным образом распределяются в п ячейках, кип — любые (целые положительные) числа. а) Найти вероятность того, что в первой ячейке окажется кг частиц, во второй ячейке к2 частиц и т. д., в п-й ячейке — кп частиц. При этом, очевидно, должно выполняться 1=1 Некоторые кг могут равняться нулю. б) Найти вероятность, что в какой-то ячейке будет кг частиц, в какой-то — к2 частиц и т. д., в какой-то — кп частиц. Задача 5 является обобщением задачи 4. Решение. Очевидно, что для всех четырех статистик число всех равновозможных случаев будет таким же, как и в задаче 4. 1) В статистике Больцмана число благоприятных событий в задаче а) получим, выбрав некоторое благоприятное распределение и производя затем перестановки частиц. Каждая перестановка будет давать новое распределение, за исключением случаев, когда будут переставляться частицы, находящиеся внутри одной и той же ячейки. Поэтому число благоприятных событий равно /%-Г, (!-29)
20 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. I а искомая вероятность Р = — . A.30) Чтобы получить число благоприятных событий в задаче б), необходимо помножить число благоприятных событий в задаче а) на число возможных различных перестановок чисел /с1? /с2, . . ., кп среди п ячеек. Если бы все эти числа были различны между собой, то число таких перестановок равнялось бы п\. Однако если среди этих чисел имеются одинаковые, то их перестановки между собой не дают новых распределений. Поэтому число благоприятных распределений в задаче б) равно произведению A.29) на —:—т ;г. A-31) где ^^ — число случаев кратности г среди чисел /сь /с2, . . . . . ., кп. Здесь также должно выполняться условие 8 2 Ч\ =п- г=1 Искомая вероятность равна Р = — — т • A.32) 2) В статистике Бозе — Эйнштейна число благоприятных событий в задаче а) равно 1, так как частицы принципиально неразличимы и их перестановки новых распределений не дают. Искомая вероятность определяется формулой A.22). В задаче б) число благоприятных событий дается выражением A.31), представляющим число различных перестановок количеств ки к2, . . ., кп. Следовательно, искомая вероятность а* (А: + п —
$ 5] КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 21 3) и 4). В статистиках Линден-Белла и Ферми — Дирака в каждой ячейке не может быть больше одной частицы. Поэтому если не выполняется хотя бы одно из условий Ах<1, Аг,<1, ..., *„<1, A.34) то искомая вероятность равна нулю. Если же все условия A.34) выполняются, то задача 5 переходит в задачу 4. Задача 6. Имеется п + т последовательно расположенных на оси Ох ячеек, в которых случайным образом, по одной в ячейке, располагаются п положительно заряженных и т отрицательно заряженных частиц (п > т). Положительные и отрицательные заряды частиц одинаковы по величине. Найти вероятность такого распределения, при котором суммарный заряд частиц, находящихся слева от любой точки оси Ох, неотрицателен. Решение. Так как в каждой ячейке может расположиться только одна частица, то задача должна решаться в статистике Линден-Белла или статистике Ферми — Дирака. В задаче 4 было показано, что. эти статистики приводят к одним и тем же вероятностям распределений. В данной задаче, как легко видеть, и число равновозмож- ных событий и число благоприятных событий в статистике Линден-Белла равно соответствующим числам событий в статистике Ферми — Дирака, помноженным на п\т\. Это подтверждает совпадение вероятностей распределений в обеих статистиках. Будем решать задачу в статистике Ферми — Дирака, т. е. будем считать, что положительно заряженные частицы между собой неразличимы, и то же верно для отрицательно заряженных частиц. Предположим, что на плоскости хОу (рис. 2) ячейки расположены в точках абсцисс с координатами 1, 2, ... ..., п + т. Рассмотрим некоторое расположение частиц. Будем суммировать слева направо заряды частиц (с учетом их знаков) и откладывать в каждой точке ординату, численно равную накопившейся сумме единиц заряда. Соединим после этого соседние вершины ординат прямолинейными отрезками, а также начало координат с вершиной соседней ординаты. Получившуюся ломаную назовем траекторией. Очевидно, что в точке п -\- т траектория
22 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 личных У 6 4 г п и -г -4 -6 - траекторий) равно С ' Л/ /у \ \ \ Рис. 2. должна прийти к ординате п — т. Одна из возможных траекторий на рис. 2 изображена сплошной линией. В статистике Ферми — Дирака каждому распределению частиц взаимно однозначно соответствует некоторая траектория. Общее число равновозможных событий (раз— числу различных размещений п подъемов, соответствующих положительно заряженным частицам, среди п -\- т подъемов и спусков. Благоприятным собы- х тиям соответствуют траектории, которые ни в одной точке не спускаются ниже оси абсцисс, так как это означало бы, что суммарный заряд слева от следующей ячейки оказался отрицательным. Сосчитаем общее число неблагоприятных событий — число траекторий, хотя бы в одной точке достигающих прямой у = — 1 или пересекающих ее; такой неблагоприятной траекторией является, например, одна из изображенных на рис. 2 сплошной линией. Для этого каждой неблагоприятной траектории сопоставим некоторую фиктивную траекторию, построенную по следующему правилу: до первого соприкосновения с прямой у — — 1 фиктивная траектория совпадает с неблагоприятной траекторией, а от точки соприкосновения фиктивная траектория является зеркальным отражением неблагоприятной траектории относительно прямой у = —1. На рис. 2 фиктивная траектория от точки соприкосновения с прямой у = —1 изображена пунктиром. Легко видеть, что фиктивная траектория, начинаясь в точке @,0), всегда заканчивается в точке (п + т, —п -\- т — 2) ив ней будет т — 1 подъемов и п + 1 спусков. Также легко видеть, что любой (фиктивной) траектории, заканчивающейся в точке (п + т, —п -\- т — 2), взаимно однозначно соответствует реальная неблагоприятная траектория. Поэтому нужно сосчитать число всех таких (фиктивных)
§ 51 Классическое определение вероятности 23 траекторий. Каждая из них содержит п + 1 спусков среди общего числа п + т подъемов и спусков. Поэтому число фиктивных траекторий равно Сп+1п» Число реальных благоприятных траекторий, следовательно, равно Сп+т — С а искомая вероятность гш рп+1 р^п+т ^п+т п -Ь 1 — т Задача 7. В зрительном зале п мест. Билеты нумерованы и все проданы. Зрители садятся на места случайным образом. Найти вероятность того, что ни один зритель не сядет на свое место. Решение. Общее число всех равновозможных распределений зрителей равно п\. Искомая вероятность равна РН = ^Г« A-35) где 5 (п) — число благоприятных событий, т. е. таких событий, когда ни один зритель не сидит на своем месте. Для нахождения 5 (п) применим метод индукции. Допустим, что п увеличилось на единицу. Каждый раз как зрители на п местах расположились благоприятным образом, можно, меняя поочередно местами одного из этих зрителей со зрителем, купившим билет на (п -\- 1)-© место, получать благоприятное распределение на п -\- 1 местах. Таким образом, можно получить п8 (п) благоприятных распределений на п + 1 местах. Кроме того, в тех случаях, когда на п местах п — 1 зрителей сидят не на своих местах, а один на своем месте, перестановка местами последнего с (п -\- 1)-м зрителем также будет давать благоприятное распределение на п -\- 1 местах. Число таких распределений равно п8 (п — 1). Итак, 5 (п + 1) = п8 {п) + п8 (п — I). Используя A.35), получим (п + 1)\Р(п + 1) = п-п\Р(п) + #*.(п
24 СЛУЧАЙНОЕ СОБЫТИЕ 1ГЛ. откуда, после сокращения на п\ и некоторых преобразований, следует Р(п)-Р(п-\) - Т+Т* ^- ' Решение функционального уравнения A.36) легко угадывается: Произвольная постоянная с определяется из очевидного условия Р B) = -к-, которое дает с = 1. Итак, вероятность того, что ни один зритель не окажется на своем месте, равна При п -> сх> эта вероятность стремится к 1/е. Задача 8. Пневматическое ружье вследствие неисправности случайно выстреливает при заряжении. Какова вероятность поражения круглой мишени радиусом 10 см, находящейся на расстоянии 10 м, если все направления полета пули равновероятны? Решение. Метод, применяемый для решения подобных задач, называется геометрическим. Всех равно- возможных направлений полета пули бесконечное множество. Бесконечно также число всех благоприятных направлений. Однако отношение числа благоприятных событий к числу всех равновозможных событий можно найти, считая, что это отношение равно отношению телесного угла мишени, который приблизительно равен к полному телесному углу 4я. Искомая вероятность Р = 2^1. = 0,000025. Задача 9. На полупрямой случайно ставятся три точки. Найти вероятность того, что из трех отрезков, рав-
§5] КЛАССИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 25 ных расстояниям этих точек от начала полупрямой, можно составить треугольник. Решение. При случайном нанесении точек одна из точек всегда будет оказываться не ближе от начала полупрямой, чем две другие точки. Будем каждый раз принимать расстояние этой точки от начала полупрямой Рис. 3. Рис. 4. за единицу расстояния. Тогда расстояния х и у двух других точек от начала полупрямой заключены в промежутке [О, 1]. Рассмотрим плоскость хОу. Общее число равно- возможных событий — значений чисел х и у — соответствует площади квадрата со стороной 1 на рис. 3. Треугольник из полученных трех отрезков можно составить при выполнении условия х + у ;> 1. Этому неравенству отвечают точки, расположенные в области, которая на рис. 3 заштрихована. Площадь заштрихованной области равна 1/2. Следовательно, искомая вероятность '-4- Задача 10. Определить вероятность, что корни квадратного уравнения х2 + 2ах + 6 = 0 вещественны, если значения коэффициентов а и Ъ равновозможны в квадрате | а | < 1, |6|<!1. Решение. Общему числу равновозможных значений коэффициентов а и Ъ соответствует площадь квадрата (рис. 4), равная 4. Корни уравнения вещественны, если
26 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 дискриминант трехчлена неотрицателен, а2 — Ь > 0. Условию неравенства отвечают точки, расположенные в области между нижней стороной квадрата и параболой Ъ = а2. Площадь этой области, соответствующей числу благоприятных событий, равна — 1 Следовательно, искомая вероятность р _ 8 _ 2 Задача 11. В любые моменты промежутка времени Т равновозможны поступления в приемник двух сигналов. Приемник будет забит, если промежуток времени между моментами поступления сигналов меньше т. Определить вероятность того, что приемник будет забит. Решение. Обозначим через х я у моменты поступления сигналов в приемник. На плоскости хОу (рис. 5) область равновозможных значений х я у представлена квадратом площадью Т2. Область благоприятных значений удовлетворяет условию \ х — у \ <^ т. Эта область (заштрихованная на рис. 5) заключена между прямыми ос — г/ = т и у — ж = т. Площадь области благоприятных значений равна Т2 /у* ^\2 Следовательно, искомая вероятность Рис. 5.
§ 6] СТАТИСТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ВЕРОЯТНОСТИ 27 § 6. Статистическое определение вероятности события Необходимый для классического определения вероятности анализ — рассмотрение полной системы равно- возможных событий и выделение тех из них, которые благоприятны для рассматриваемого события,— удается провести далеко не всегда. Например, событие, состоящее в том, что определенный атом радия распадается за время, не превосходящее г, пока не поддается исследованию в такой схеме. Поэтому определить вероятность этого события классическим методом нельзя. Также невозможно при помощи теоретического расчета определить верол г- ность того, что при формировании звезды она окажется двойной или что рожденный ребенок окажется мужского пола. Существует другой способ оценки вероятности случайного события — оценка при помощи опыта. Допустим, что комплекс условий, при котором может происходить рассматриваемое событие, многократно в точности повторяется сам или может быть многократно в точности воспроизведен. Мы условились в таком случае 'говорить, что производятся испытания. Если при выполнении п± испытаний событие А произошло тх раз, то говорят, что относительная частота события А в этой серии испытаний равна Шх/щ. Во второй серии испытаний относительная частота события А равна т2/п1У в третьей — т3/п3, и т. д. На основании длительных наблюдений над результатами большого числа различного рода испытаний подмечено, что для широкого круга явлений относительная частота появлений рассматриваемого события в различных сериях испытаний обнаруживает устойчивость. Относительные частоты в сериях испытаний мало отличаются друг от друга. Эти отличия тем меньше, чем больше число испытаний в данных сериях испытаний. Например, относительная частота рождений младенцев мужского пола не отличается заметно от 0,515, если учтено достаточно большое число рождений. Статистика показывает, что относительная частота рождений мальчиков не зависит от местности или этнического состава населения. Она всегда превышает
28 СЛУЧАЙНОЕ СОБЫТИЕ 1ГЛ. 1 относительную частоту рождений девочек приблизительно на 0,03. Можно сказать, что относительная частота рождений мальчиков есть величина устойчивая. Если определять относительную частоту распада атома Ка226 за 100 лет, то всегда будет получаться величина 0,04184. Здесь число испытаний в серии равно числу находящиеся под наблюдением атомов радия. Это число в опыте огромно и потому относительная частота распадов в сериях испытаний в высшей степени устойчива, ее изменения незаметны, так как перекрываются ошибками в определении числа всех атомов и числа распавшихся атомов. Вероятностью события называется объективно существующая величина, около которой группируются относительные частоты этого события. Таково статистическое определение понятия вероятности. Как легко уяснить, по значениям относительных частот можно получить лишь приближенное значение вероятности. Поэтому формально математик скажет, что статистическое определение понятия вероятности нельзя считать определением. Однако в некоторых физических и астроно*мических задачах число выполняемых испытаний так велико, что опыт может дать значение вероятности события с весьма высокой точностью. Например, для распада Ка226, где число учтенных испытаний огромно— равно числу атомов в испытуемом образце (т. е. порядка 1023—1024),— опыт может дать значение вероятности события с весьма высокой точностью. Можно утверждать, что с точностью до пятой цифры после запятой вероятность распада атома радия за 100 лет равна 0,04184. Существенно то, что ограничение точности указания значения вероятности пятой цифрой после запятой связано не с тем, что в опыте с радием относительная частота отклоняется от вероятности события. Это отклонение заведомо на много порядков меньше, чем ошибки измерений в выполненном опыте. Можно утверждать, что наблюдаемая относительная частота распада атомов радия (в пределах ошибок измерения) равна вероятности распада атома. Этот пример показывает, что для астронома и физика статистическое определение понятия вероятности является содержательным определением.
§ 7] УСЛОВНАЯ ВЕРОЯТНОСТЬ 29 Можно сказать, что вероятностью события является предел, к которому стремится относительная частота появления события при неограниченном увеличении числа испытаний. При статистической оценке вероятности события необходимо, чтобы соблюдалось точное воспроизводство комплекса условий, т. е. чтобы условия испытаний не менялись. Если условия испытаний меняются, то в общем случае меняется и вероятность появления события. Если, например, вероятность выдачи конвейером бракованной детали определяется при помощи определений относительной частоты бракованных изделий на протяжении ряда лет, то нужно иметь в виду, что, несмотря на кажущееся точное воспроизводство комплекса условий, оно на самом деле не будет точным, так как отдельные части конвейера с течением времени изнашиваются, условия обработки детали изменяются. В этом случае относительная частота события не будет изменяться устойчиво, так как вероятность события — появление бракованной детали — будет изменяться со временем. § 7. Условная вероятность. Зависимые и независимые события Пусть при выполнении некоторого комплекса условий могут произойти случайные события А и В. Их вероятности соответственно равны Р (А) и Р (В). Допустим, стало известно, что при выполнении данного комплекса условий событие А произошло. Относительно события В данных не получено. Однако теперь, после получения информации о совершении события А, вероятность события В может стать другой, отличной от Р (В). Если, например, при бросании игральной кости вероятность появления единицы равна х/6, то после того как стало известно, что выпало нечетное число, вероятность того, что выпала единица, возросла до 1/3- Вероятность события В при условии, что событие А произошло, будем обозначать Р (В\А). Если знание, что событие А произошло, не изменяет вероятности события В, Р(В\А) = Р(В), A.38)
30 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 то событие В называют независимым от события А. Например, события {извлечение из колоды карты масти треф} и {извлечение валета} являются независимыми событиями. Информация, что извлечен валет, не меняет вероятности появления трефы; она остается равной 1и. Точно так же не изменяется вероятность, равная 1/13> что извлеченная карта — валет, когда стало известно, что карта трефовая. Независимость событий является свойством взаимным, т. е. если справедливо A.38), то выполняется й равенство Р (А\В) = Р (А). A.39) Это свойство будет доказано в следующем параграфе. Если же Р{А\В)фР{А), Р(В\А)фР(В), то события А и В называются зависимыми. Полная система событий Л (будем обозначать так для краткости всю систему событий) Аи А2, ...,Ап A.40) и полная система событий 33 Ви В» ...,Вк A.41) называются взаимно независимыми, если справедливы равенства Р (В} \Аг) = Р (В}) A.42) для любых I и /. В этом случае справедливы, очевидно, и равенства Р(А,\В,) = Р (Аг). A.43) Если хотя бы для какой-нибудь пары значений I и / равенство A.42) не выполняется, то полные системы событий A.40) и A.41) являются взаимно зависимыми системами событий. Система событий, составленная из всех попарных произведений событий системы Л на события системы 53, А А, АгВг, ..., АпВк, A.44) является полной системой событий, так как ее события несовместимы и при выполнении комплекса условий од-
§ 8] ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 31 но из событий системы A.44) должно произойти. Эту полную систему событий будем обозначать ЛЗЗ. Отметим также, что Р(В1\А1) +Р(В2\Аг) +. .. +Р(Вк\Ай) = 1 A.45) при любом значении г. § 8. Теоремы сложения и умножения вероятностей Пусть А я В — события, которые могут происходить при выполнении некоторого комплекса условий. Рассмотрим также события АВ, АВ, АВ, АВ. A.46) Согласны принятым в § 2 обозначениям, первое из этих событий состоит в том, что произошли оба события, А и В; второе состоит в том, что событие А произошло, а событие В не произошло и т. д. События A.46) составляют полную систему событий, так как они несовместимы и при выполнении комплекса условий одно из них обязательно произойдет. Теперь допустим, что удалось рассмотреть полную систему п равновозможных событий такую, что каждое из событий A.46) равно объединению некоторых событий системы, причем событию АВ благоприятны Пг событий, событию А В — п2 событий и т. д. Поскольку A.46) составляет полную систему событий, т. е. то АВ +АВ +АВ +АВ = 17, A.47) Соответствующие вероятности рассмотренных событий равны ^-, A.49) -%, A.50) ^, A.51) -^-. A.52)
32 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. \ В данной полной системе п равновозможных событий событию А благоприятны пх -\- п2 равновозможных событий (так как А произойдет, если произойдет АВ или АЕ), а событию В благоприятны п^ -\- пз равновозможных событий. Следовательно, = 7ь ' A.Ьо) = —:—• (!-54) Рассмотрим событие А -\- В, состоящее в том, что случится хотя бы одно из событий А я В. Ему благоприятны ^1+^2+ пз равновозможных событий и, следовательно, Р (А + В) - П1 + тп + т . A.55) Сравнивая A.52), A.53), A.54) и A.55), находим р (А +В) = Р(А) +Р (В) - Р (АВ), A.56) Равенство A.56) выражает теорему сложения вероятно стей. В частном случае, если события А я В несовместимы, Р (АВ) = 0, A.56) принимает вид Р(А +В) =Р(А) +Р(В). A.57) Справедливо и обратное утверждение: если выполняется A.57), то события А и В несовместимы. Найдем вероятность Р (А \ В). Если известно, что произошло событие В, значит, произошло одно из пх -\- п3 равновозможных событий. Следовательно, число всех равновозможных событий теперь уже равно п1 -)- п3. Из них событию А благоприятны пг событий. Поэтому Аналогично, Сравнивая A.49), A.53) и A.59), получим Р (АВ) = Р (А)Р (В | А). A.60)
§ 8] ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 33 Равенство A.60) выражает теорему умножения вероятностей. В частном случае, если событие В не зависит от собы- ия А, Р(В\А) = Р(В), A.61) равенство A.60) принимает вид Р{АВ) = Р(А) Р (В). A.62) Аналогично, сравнивая A.49), A.54) и A.58), можно написать Р (АВ) = Р (В)Р (А | В). A.63) Сравнение A.59) и A.62) дает равенство Р(А)Р(В\А) = Р (В) Р (А | Я), A.64) которое показывает, что из равенства A.62) следует Р(А\В) = Р(А), A.65) т. е. независимость событий есть свойство взаимное, как это уже утверждалось без доказательства в предыдущем параграфе. Итак, если события А ж В независимы, теорема умножения вероятностей принимает вид A.62). Справедливо и обратное заключение, играющее в дальнейшем важную роль: если выполняется равенство A.62), то события А и В взаимно независимы. Теорему умножения вероятностей A.59) легко распространить на случай, когда число событий больше двух. Например, для трех событий Р (АВС) = Р {АВ) Р {С | АВ) = = Р (А) Р (В \А)Р(С\ АВ). A.66) Методом индукции находим общую формулу для п событий: Р (АХАШ . . .Ап) = Р (А,)Р (А2 | Аг)Р (А, | А,А2) . . . ...Р(Ап\ А,А, . . . Ап.х). A.67) 2 Т. А. Агекян
34 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 Для п независимых событий эта формула упрощается: =1 ' 1=1 Распространим и теорему сложения A.56) на случай числа событий, большего двух. Для трех событий находим Р {А + В + С) = = Р (А + В) + Р (С) - Р[(А + В)С\. A.69) Вследствие выполнения распределительного закона A.5) после простых преобразований находим Р(А +В +С) = = Р{А) +Р(В) +Р (С) - - Р (АВ) — Р (ВС) - Р (СА) + Р (АВС). A.70) Применяя метод индукции, можно установить теорему сложения вероятностей для п событий: Р(Аг +А2 +.. . +Ап) = = [Р{АД +^(Л2) +... +Р(Ап)]- - [Р (А,А2) + Р + [Р(А1А2А3) +Р( ... + (-1)^-1 р (АгАг ... Ап). A.71) Часто при больших п вместо равенства A.71) удобнее использовать равенство () A.72) справедливость которого очевидна и которое в случае взаимной независимости событий Аъ А^ . . .,_^4П (тогда взаимно независимы и события Л19А2, . . ., Лп) принимает вид п п ( Л A-73)
§ 81 ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 35 Если же события Аъ А2, . . ., Ап несовместимы, то теорема сложения вероятностей A.71) принимает простейший вид =2 A-74) Задача 12. Из двух колод вынимается наугад по карте. Определить вероятность того, что: 1) обе карты окажутся масти пик, 2) хотя бы одна из карт окажется масти пик. Решение. 1) Очевидно, что извлечение карты масти пик из одной колоды (-4) не влияет на вероятность извлечения карты масти пик из другой колоды (В), поэтому согласно теореме умножения вероятностей в форме A.62) 2) Согласно теореме сложения A.56) Задача 13. Из двух перетасованных совместно колод извлекаются две карты. Определить вероятность того, что 1) обе карты масти пик, 2) хотя бы одна карта масти пик. Решение. 1) В этой задаче, в отличие от предыдущей, появление карты масти пик при извлечении первой карты изменяет вероятность появления карты масти пик при извлечении второй карты, поэтому нужно применять равенство A.60): р (АВ) = — ' 1оз" = 412" * 2) Согласно теореме сложения A.56) Задача 14. Найти вероятность выпадения хотя бы раз двух шестерок при 24 бросаниях пары игральных костей («задача шевалье де Мере»). 2*
36 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 Решение. Вероятность выпадения двух шестерок при одном бросании равна 1/36. Вероятность, что это событие не случится ни разу при 24 бросаниях, равна __^у; = о,5О86. Следовательно, вероятность, что две шестерки выпадут хотя бы один раз Р ^ 1 - 0,5086 = 0,4914. Задача 15. А — событие: правильное предсказание погоды первым лицом. В — то же — вторым лицом, Р (А) = ри Р (В) = р2. Первое лицо предсказало хорошую погоду, а второе — плохую. Какова вероятность наступления хорошей (плохой) погоды. Решение. Будем считать, что вероятность второму лицу правильно предсказать погоду не зависит от того, правильно ли ее предсказал первый. Так как предсказания погоды двумя лицами разошлись, то случилось событие АВ +АВ. Вероятность его Р (АВ + ЛВ) = Р (АВ) + Р (АВ) = Р (А)Р (В) + + Р (А)Р (В) = Р1A- Л) + A ~ Л)Л- Хорошая погода будет, если случилось событие АВ. Следовательно, вероятность наступления хорошей погоды равна Р1 A — Р*) Р1 A — Р*) + A — Р\) Р* 3 а д а ч а 16. В игре покер каждому играющему сдается пять карт. Различают различные комбинации из пяти карт. Эти комбинации в порядке убывания их значения следующие А: пять карт последовательных значений одной масти, начиная от туза; В: пять карт последовательных значений одной масти, начиная не от туза; С: четыре карты одинаковых значений и пятая произвольная карта; 2): три карты одинаковых значений и две карты одинаковых значений; Е: пять карт не последовательных значений одной масти; Р: пять карт последовательных значений, но произвольных мастей; О\ три карты
§ 8] ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 37 одинаковых значений и две неодинаковых значений; Н: две пары карт одинаковых значений и одна произвольная; /: одна пара карт одинаковых значений и три неравных значений; /: случай, когда сочетание карт не является ни одной из девяти перечисленных комбинаций. Найти вероятность каждой из комбинаций. (Разумность последовательности комбинаций должна состоять в том, что с уменьшением значения комбинации ее вероятность должна возрастать.) Решение. Общее число всех равновозможных сочетаний карт у одного игрока равно С&. Для комбинации А имеется всего четыре благоприятных случая, поэтому ее вероятность Р (А) = 4 / С\% *=г 0,000001539. У комбинации 532 благоприятных случая, поэтому Р{В) = 32/С^ 0,00001231. Найдем вероятность при последовательном извлечении карт из колоды извлечения сначала четырех одинаковых, а затем произвольной карты. Первая карта может быть любой. Вероятность, что вторая будет того же значения, что и первая, равна 3/51. Если это событие произошло, то вероятность, что и третья карта будет того же значения, равна 2/50. Вероятность того, что и четвертая карта будет того же значения, равна 1/49. Пятая карта произвольная из оставшихся. Поэтому вероятность данной последовательности карт согласно теореме умножения вероятностей равна ,321 Могут быть пять различных последовательностей (произвольная карта на любом из пяти мест), при которых четыре карты окажутся одинаковых значений, а пятая карта иная. Все эти пять последовательностей имеют одинаковую вероятность, и они несовместимы. Следовательно, согласно теореме сложения вероятностей Р(С) = 1- -^ . -А- • ± -1-5^0,0002401.
38 СЛУЧАЙНОЕ СОБЫТИЕ 1ГЛ. 1 Рассуждая, как в предыдущем случае, найдем вероятность одной последовательности, дающей комбинацию!): , _3^ 2 48 3 1# 51 * 50 ' 49 * 48 * Число различных последовательностей, дающих событие 2), равно С?. Поэтому Число равновозможных случаев, когда все пять карт одной масти, равно С1гЛ. Это событие подразделяется на частные случаи — события А, В и Е. Поэтому Р (Е) = 4.С?3/С552 — Р(А) — Р {В) ^ 0,001967. Число равновозможных случаев пяти карт последовательных значений равно 9»4б. Это событие подразделяется на частные случаи — события А, В и Р. Поэтому Р {Р) - 9-4* / С\% -Р{А)-Р (В) ^ 0,003701. Вероятности комбинаций 6?, Я, / определяются способом, использованным для комбинаций С и Б: 3 51 48 * 50 * 3 49 44 * 48 • 2! 5! 2!1! — 0 00292 Вероятность комбинации / получается вычитанием из 1 суммы вероятностей всех предыдущих комбинаций: Р (/) ^ 1 - 0,5439 = 0,4561. Таким образом, действительно, с уменьшением значений комбинаций их вероятность возрастает. Задача 17. Из многолетних наблюдений известна статистическая вероятность того, что в районе обсерватории дочь будет ясной. Влфеврале она равна Р (А)ш= 0,18, в марте Р (В) = 0,244и в апреле Р (С) = 0,36. Наблюдатель будет иметь в своем распоряжении телескоп в ночь с 5-го на 6-е и с 20-го на 21-е каждого из этих месяцев. Найти вероятность того, что программа наблюдений
§ 83 ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 39 будет выполнена, если для ее выполнения требуется: 1) одна ясная ночь, 2) две ясные ночи. Решение. Так как представленные астроному ночи наблюдений отделены друг от друга значительным периодом — 15 дней, можно считать, что вероятность следующей ночи" быть ясной не зависит от того, была ли ясной предыдущая ночь наблюдений. Рассматриваемые события взаимно независимы. 1) Удобно использовать равенство A.73); искомая вероятность равна 1 - @,82J?@,76J@,64J ^0,84. 2) И в этом случае искомую вероятность удобнее сосчитать, вычтя из единицы вероятность того, что ни одна ночь не будет ясной, и вероятность того, что только одна ночь будет ясной: Р = 1-0,16-2.0,18.0,82-@,76J.@,64J - - 2-@,82J.0,24.0,76.@,64J - - 2.@,82J.@,76J.0,36.0,64 ^ 0,49. 3 а д а ч а 18. В некоторой местности вероятность того, что погода в данный день будет такой же, как и в предыдущий, равна р, если день был дождливый, и д, если день был не дождливый. Вероятность того, что первый день года дождливый, равна рг. Найти вероятность того, что лг-й день дождливый, и найти предел рп при п -> оо. Решение. Событие, состоящее в том, что (п — 1)-й день дождливый и лг-й день также дождливый, имеет вероятность рп-1р. Вероятность события, состоящего в том, что (п — 1)-й день не дождливый, а п-ш — дождливый, равна A — /?п_1)A — д). Событие {п-и день дождливый} состоится, если произойдет одно из этих двух несовместимых событий. Следовательно, рп = рп^р +A — рп-1)A — ?) = = рп^(р + д - 1) + A - д). Применяя эту рекуррентную формулу п — 1 раз, получим Рп = (р + Я - 1)п/>1 + II + (Р + 9 - 1) + 1)*-Ч A - д), A.75) что и дает решение задачи.
40 СЛУЧАЙНОЕ СОБЫТИЕ ИГЛ. 1 Так как | р + д — 1 | < 1, то при п -*■ оо первый член правой части A.75) стремится к нулю, а сумма геометрической прогрессии в квадратных скобках стремится к-~— . Таким обраом, при п-^оо Задача 19. Рассмотренную в § 5 задачу 7 решить при помощи теоремы сложения вероятностей. Решение. Обозначим Аъ А29 . . ., Ап события, состоящие в том, что, соответственно, первый, второй, . . . ..., л-й зрители оказались на своих местах. Вычислим при помощи формулы A.72) вероятность Р (А1 + А2+ . . . ... + Ап) того, что хотя бы один зритель окажется на своем месте. Очевидно, Поэтому величина в т-х квадратных скобках (с учетом ее знака) в правой части A.71) равна ^ 1) п\ т\{п — т)\ Следовательно, т=1 и искомая вероятность г=1 4г тп=1 тп=0
6 8] ТЕОРЕМЫ СЛОЖЕНИЯ И УМНОЖЕНИЯ 41 3 а д а ч а 20. В условии задачи 7 найти вероятность того, что ровно т зрителей (т <; п) будут сидеть на своих местах. Решение. Вероятность того, что определенные т зрителей будут сидеть на своих местах, равна (п — т)\ п\ * Вероятность того, что остальные п — т зрителей при этом окажутся сидящими не на своих местах, согласно задаче 7 равна По теореме умножения вероятность того, что определенные т зрителей окажутся на своих местах, а остальные врите ли — не на своих местах, равна Но из п зрителей определенные т зрителей могут быть выбраны Сп различными способами. Как бы ни были выбраны эти т зрителей, вероятность того, что они окажутся на своих местах, а остальные зрители — не на своих местах, определяется выражением A.76). Все эти случаи несовместимы. Поэтому вероятность того, что какие-то т зрителей окажутся на своих местах, а остальные п — т зрителей — не на своих местах, равна, согласно теореме сложения вероятностей, произведению A.76) и С 1 VI (-1)* Задача 21. Вероятность распада радиоактивного атома за время ЛЬ равна 'КдЛ. Вероятность распада атома не зависит от того, как долго атом уже существует, не распадаясь. Поэтому X не зависит от времени. Какова вероятность распада атома за время I? Найти зависимость между коэффициентом А, и временем полураспада Т.
42 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 Решение. Вероятность того, что атом не распадается за время 61, равна 1 — Ш. A.77) В промежутке времени I промежуток времени 61 содержится 6,16,1 раз. Вероятность того, что за время I атом не распадается, равна, согласно теореме умножения, произведению Ц61 множителей A.77): A -Я&)'/л- A.78) Считая 61 бесконечно малым, получим из A.78) после предельного перехода е'Х1. Искомая вероятность, таким образом, равна Р = 1 - <гЧ A.79) Если вероятность того, что атом не распадется за время Г, равна ровно 1/2, то Т называется временем полураспада атома. Приравнивая A.79) числу 1/2, находим \ — 1п2 К ' ГГ\ * § 9. Аксиоматической построение теории вероятностей Введенные выше классическое и статистическое определения понятия вероятности не являются достаточными для построения общей теории. Классическое определение не может быть использовано в общем случае, когда нельзя определить полную систему конечного числа равновоз- можных случаев, часть которых благоприятна для события А, а остальная часть для него неблагоприятна. С другой стороны, относительная частота появления события А может служить лишь приближенным значением, некоторой оценкой верэятлости события А. Только в тех случаях, когда частота появлений события А настолько велика, что ошибки измерения относительной частоты в физических опытах и в астрономических наблюдениях заведомо превосходят ее случайные отклонения от вероятности события А, можно на данном этапе развития науки рассматривать наблюденную относительную частоту как вероятность события А.
§ 9] АКСИОМАТИЧЕСКОЕ ПОСТРОЕНИЕ ТЕОРИИ 43 Чтобы построить теорию вероятностей, непротиворечивую и свободную от ограничений, в основу ее следует положить систему аксиом. Эти аксиомы, так же как, например, аксиомы евклидовой геометрии, формулируются как результат жизненного опыта, практической деятельности человека. Ввиду того, что относительная частота в обширных сериях испытаний приближенно равна вероятности события, аксиомы теории вероятностей должны формулироваться так, чтобы правила действий с вероятностями и относительными частотами совпадали. Принятая в теории вероятностей система аксиом сформулирована А. Н. Колмогоровым. Аксиома I. С каждым событием А данного поля событий связывается число Р {А), называемое его вероятностью и удовлетворяющее условию 0<Р(Л)<1.| A.80) Отметим, что относительная частота также удовлетворяет условию A.80). Аксиома II. Вероятность достоверного события равна 1, Р (Ц) = 1. A.81) Аксиома III. Если событие А подразделяется на несовместимые события Сь С2, . . ., Ст того же поля, т. е. А = Сг +С2 +. . . +Ст, A.82) то Р(А) = Р (С,) + Р (С2) +... +Р (Ст). A.83) Эта аксиома сложения вероятностей несовместимых событий соответствует очевидному правилу сложения относительных частот. В самом деле, если в данной серии из п испытаний относительные частоты событий Сь С2, ... ..., Ст равны соответственно—, —,... , -^Ц то относитель- 71 I 71 71 ная частота события будет равна Аксиома IV. Бели событие А может быть представлено как сумма бесконечной последовательности
44 СЛУЧАЙНОЕ СОБЫТИЕ ИГЛ. 1 Съ С2, . . ., Ст, . . . несовместимых событий, то Р(А) = Р (С,) + Р (О +... +Р (Ст) + . . ., A.85) причем бесконечный ряд в правой части A.85) предполагается сходящимся. Эта аксиома, называемая расширенной аксиомой сложения, необходима, так как часто приходится рассматривать события, подразделяющиеся на бесконечное число частных случаев. Из сформулированных аксиом вытекает ряд уже знакомых нам элементарных следствий. 1) Из очевидного равенства V +7= \] и аксиомы II следует, что и, следовательно, вероятность невозможного события Р (V) = 0. A.86) 2) Так как А + А = С/, то Р(Л) +Р(Л) = 1, A.87) сумма вероятностей противоположных событий равна единице. 3) Из очевидных равенств А +В = А +АВ, В = АВ + АВ, в которых слагаемые правых частей несовместимы, согласно аксиоме II получаем Р (А + В) = Р (А) + Р (АВ), A.88) Р (В) = Р {АВ) + Р (АВ). A.89) Вычитая A.88) из A.89), получаем Р (А +В) = Р(А) +Р(В)-Р (АВ). Таким образом, теорема сложения вероятностей есть следствие аксиомы П.
§ 10] ФОРМУЛА ПОЛНОЙ ВЕРОЯТНОСТИ 45 Вероятностью Р (В \ А) события В при условии, что событие А произошло, называется отношение Р (АВ) I ]Р {А). Поэтому теорема умножения вероятностей: Р (АВ) = Р (А)Р (В | А) есть просто следствие этого определения. § 10. Формула полной вероятности Рассмотрим полную систему событий Аи Аг, . . .,Ак. A.90) Если известны вероятности Р(АХ), Р(А2), ...9Р(Ак) этих событий, то полная система событий считается заданной. Рассмотрим также некоторое событие Н. Если при выполнении данного комплекса условий событие Н не невозможное событие, то оно совместимо хотя бы с одним из событий A.90). Рассмотрим теперь систему событий АгН, А2Н, . . ., АкН. A.91) События A.91) несовместимы между собой, но они не составляют полной системы событий. Чтобы событие Н произошло, необходимо и достаточно, чтобы произошло одно из событий A.91). Поэтому, по теореме сложения вероятностей, к к Р(Н) = Р B АН) = 2 Р(АКН). A.92) Чг=1 ' г=1 Но по теореме умножения Р(АгН) = Р(Аг)Р(Н\Аг). Окончательно находим ^{). A.93) 1=1
46 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 Соотношение A.93) носит название формулы полной вероятности. Задача 22. Среди наблюдаемых спиральных галактик 23% принадлежат подтипу 5а, 31% —подтипу 8Ь и 46% — подтипу 8с. Вероятность вспышки в течение года сверхновой звезды в галактике 8а составляет 0,0020, в галактике 8Ь — 0,0035 и в галактике 8с — 0,0055. Найти вероятность вспышки в течение года сверхновой звезды в далекой спиральной галактике, подтип которой определить не удается. Решение. Согласно данным о доле каждого подтипа спиральных галактик среди всех наблюдаемых галактик вероятности того, что данная далекая галактика принадлежит к указанным подтипам, соответственно равны Р(8а) = 0,23, Р {8Ь) = 0,31, Р (8с) = 0,46. A.94) Поэтому по формуле A.93) Р = 0,23-0,0020 +0,31-0,0035 +0,46-0,0055 =?= 0,0041. § 11. Теорема Байеса В общем случае вероятности Р (Я \ Аг), которые события Аг «сообщают» событию Я, различны. Допустим, что стало известно о происшедшем событии Я, но неизвестно, какое при этом произошло событие из полной системы A.90). Можно утверждать, что вероятности Р (Аг | Я) отличны от Р (Аг). Должны возрасти вероятности тех из событий A.90), которые «сообщали» большие вероятности событию Я, и — уменьшиться вероятности событий, «сообщавших» событию Я малые вероятности. Напишем согласно теореме умножения вероятностей: Р (АгН) = Р (Аг)Р (Я | Аг) = Р (Н)Р (Л, | Я). A.95) Решим A.95) относительно Р (Аь \ Я) и используем равенство A.92): Р (А.) Р (Н \ А.) п ( '' ( -'-^ . A.96) 2 Р(Аг)Р(П\Аг) 1=1
§ 12] ВЕРОЯТНОСТЬ СЛОЖНОГО СОБЫТИЯ 47 Полученная формула носит название теоремы Байеса. Она позволяет найти новые вероятности событий А 1у если известно, что событие Н произошло. В частном случае, если формула A.96) упрощается: Р(Н\ 4.) г=1 Так как знаменатель правой части от I не зависит, то A.97) показывает, что если до того, как стало известно о происшедшем событии Н, вероятности событий Аг были равны, то после того как стало известно, что событие Н произошло, вероятности событий Аг становятся пропорциональными тем вероятностям, которые они «сообщали» событию Н. Задача 23. В условиях задачи 22 определилось, что в течение года наблюдений далекой спиральной галактики в ней обнаружена вспышка одной сверхновой звезды. Найти теперь вероятность того, что галактика принадлежит подтипу 8а, 8Ъ, 8с. Решение. Согласно теореме Байеса __ 0,31-0,0035 ==0 9? "" 0,0041 ~ ' ' _ 0,46-0,0055 ==0Яо "" 0,0041 ~ ' Как и следовало ожидать, по сравнению с A.94) вероятность 8а уменьшилась, а вероятность 8с возросла. § 12. Вероятность сложного события Рассмотрим полную систему событий A.90). Обозначим вероятности этих событий соответственно Ри Р2> • • •» Рк- Каждый раз, как выполняется необходимый комплекс
48 СЛУЧАЙНОЕ СОБЫТИЕ 1ГЛ. 1 условий (производится испытание), происходит одно из событий A.90). Определим вероятность рп {тъ т2, . . . ,тк) того, что при п испытаниях событие Ах произойдет тх раз, событие А2 — т2 раз, . . ., событие Ак — тк раз. При этом безразлично, в какой последовательности происходят события. Так как в каждом испытании осуществляется одно из событий A.90), то к 2 щ = п. A.98) г=1 Определим сначала вероятность того, что осуществится одна определенная последовательность событий Аг при п испытаниях, в результате чего каждое из событий Аг произойдет требуемое количество раз. Согласно теореме умножения вероятность такой последовательности равна Этой же величине равна вероятность любой последовательности событий, содержащей требуемое число событий Аг. Поэтому искомая вероятность согласно теореме сложения равна величине A.99), умноженной на число различных последовательностей событий, содержащих события Аг требуемое число раз. Число удовлетворяющих условию различных последовательностей можно получить, выбрав одну из таких последовательностей и определив в ней число всех перестановок, дающих новые последовательности. Число всех перестановок из п элементов равно Аг!. Но так как, поменяв местами два одинаковых события, мы не получим новой последовательности событий, число всех различных перестановок равно Таким образом, Рп Эта формула называется формулой вероятности сложного события.
§ 12] ВЕРОЯТНОСТЬ СЛОЖНОГО СОБЫТИЯ 49 Если требуется определить вероятность того, что событие А, вероятность осуществления которого в одном испытании равна р, при п испытаниях произойдет т раз, необходимо рассмотреть полную систему событий А, А. Тогда согласно A.100) РпМ=тНпп1тIР-Г-^ A.101) где д = 1 - р A.102) есть вероятность осуществления события А в одном испытании. 3 а д а ч а 24. Вероятность того, что стрелок при одном выстреле попадет в яблочко мишени, равна 0,2, а в остальную часть мишени — 0,5. Найти вероятность того, что при 10 выстрелах четыре пули окажутся в яблочке и 4 — в остальной части мишени. Решение. Рассмотрим также событие {промах}, вместе с которым события {попадание в яблочко} и {попадание в остальную часть мишени} составляют полную систему событий. Вероятность промаха равна 0,3. Согласно A.100) , 2) = Задача 25. Прибор имеет шесть ламп, вероятность выхода из строя каждой из которых при данном повышении напряжения в цепи равна 0,3. При перегорании трех или меньшего числа ламп прибор из строя не выходит. При перегорании четырех ламп вероятность выхода прибора из строя равна 0,3, при перегорании пяти ламп 0,7, при перегорании шести ламп — 1. Определить вероятность выхода прибора ив строя при повышении напряжения. Решение. Вероятности выхода из строя четырех, пяти и шести ламп соответственно равны: Й3*-0,72^ 0,0595, °3507 Ре F) = |-0,3е ^0,0007.
50 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 По формуле полной вероятности A.93) находим вероятность выхода из строя прибора: Р^5 0,0595-0,3 +0,0102-0,7 + 0,0007-1^0,0257. Задача 26. В первых 20 партиях матча на первенство мира по шахматам четыре партии выиграл чемпион мира, шесть партий выиграл претендент и 10 партий закончились вничью. Чтобы сохранить свое звание, чемпиону мира в оставшихся четырех партиях нужно набрать не меньше трех очков. Какова вероятность того, что чемпион мира сохранит свое звание (выигрыш приносит 1 очко, ничья — 1/2 очка, проигрыш — 0 очков). Решение. В сыгранных 20 партиях относительная частота выигрышей у чемпиона мира равна 0,2, проигрышей — 0,3 и ничьих — 0,5. Предположим, что эти относительные частоты равны вероятностям соответствующих событий. Чтобы чемпион мира набрал не менее трех очков, необходимо осуществление одного из следующих событий: 1) все четыре партии выиграл чемпион, 2) три партии чемпион выиграл и одну свел вничью, 3) три партии чемпион выиграл и одну проиграл, 4) две партии чемпион выиграл и две свел вничью. Вероятности этих событий согласно формуле A.100) соответственно равны Л = А D,0,0) = ± -°'24 = 0,0016, Р2 - ЛC,0,1) = ~|-0,23.0,5 = 0,0160, ^з = лC,1,0) = ^0,23-0,3 - 0,0096, РА = рА B,0,2) = -^ 0,22 • 0,52 = 0,06. Так как эти события несовместимы, то искомая вероятность Р = Рг + Р2 + Р3 + Ра = 0,0872. Полученное решение не является строгим, так как за вероятности событий приняты относительные частоты этих событий. Его можно считать приближенным. Если бы
§ 121 ВЕРОЯТНОСТЬ СЛОЖНОГО СОБЫТИЯ 51 число сыгранных партий было бы большим, то приближение было бы лучшим. В выполненном решении предполагается также, что вероятности исходов партий в ходе матча не изменяются, не сказываются, например, утомление или какие-нибудь иные психологические факторы, зависящие от времени. Задача 27. Система состоит из большого числа (п) частиц. Объем Г фазового пространства (шестимерного пространства, координатами которого являются три координаты положения и три компонента скорости), в котором могут находиться частицы, ограничен. Найти наиве- роятнейшее распределение частиц в элементах фазового объема. Решение. Разобьем объем Г фазового пространства на элементы объема у1у Тг> • • •> 7ь* Вероятность попадания частицы в 1-й элемент фазового пространства р{ = -=?-. Следовательно, вероятность попадания в объемы уъ у2, ... . . . , ук соответственно пъ /г2, . . ., /г* частиц равна Рп (пъ я2, • • •» пп)- Нужно найти максимум этого*распре- к деления при условии постоянства числа частиц 2 Щ = п- г=1 Согласно правилу нахождения условного экстремума составим функцию Лагранжа г=) где а — неопределенный коэффициент Лагранжа. Беря частные производные Ь и приравнивая их нулю, находим а = 0, * = 1, 2/..., к. Так как п очень велико, то первый член с высокой точностью равен приращению 1п п{\, когда пг возрастает на единицу. Имеем -~^- ^ 1п (п + 1)! — 1п п\ = 1п (п + 1)»1п п.
52 СЛУЧАЙНОЕ СОБЫТИЕ [ГЛ. 1 Таким образом, получаем п. 1п —- = а == соп§1, г == 1, 2,..., й, откуда следует, что к к Так как 2 щ = п, 2 Рь — 1» то из этого вытекает, что 1—1 г=1 т. е. при наивероятнеишем распределении число частиц в фазовых элементах пропорционально объему этих элементов. 3 а д а ч а 28. Предыдущую задачу решить при условии, что п етоянная полная энергия системы равна сумме энергий яастиц. Энергия чаотиц определяется тем, в каком фазовом элементе они находятся. Решение. К условию постоянства числа частиц в предыдущей задаче теперь прибавляется условие постоянства полной энергии системы 2 ЩЕ, = Е. Функция Лагранжа дополняется членом и после приравнивания частных производных нулю получаем —1п пг + 1п рг + а — $Ег = 0. Отсюда следует, что Полученное распределение называется распределением Максвелла — Болъцмана.
§ 12] ВЕРОЯТНОСТЬ СЛОЖНОГО СОБЫТИЯ 53 Отличие полученного результата от результата предыдущей задачи объясняется тем, что учет постоянства полной энергии системы фактически означает, что учитывается взаимодействие частиц между собой. Именно при взаимодействии частиц между собой существенно соблюдение закона сохранения энергии. Следовательно, закон распределения Максвелла — Больцмана получа1- ется тогда, когда в результате состоявшегося взаимодействия частиц между собой установилось равновесное состояние системы. В задаче 27 постоянство энергии системы не учитывалось; это фактически означало, что рассматривалась система не взаимодействующих частиц.
Глава 2 СЛУЧАЙНАЯ ВЕЛИЧИНА § 13. Случайная величина с дискретным распределением Переменная величина, принимающая различные значения в зависимости от случая, называется случайной величиной. Допустим, что некоторая величина X может принимать значения /о ,ч хъ я2, . . ., хк. B.1) Каждый раз, как выполняется некоторый комплекс условий, величина X принимает одно из значений B.1). Пусть при этом вероятности того, что X примет то или иное из^значений B.1), соответственно равны Ръ V* • • ., Рь- B.2) Очевидно, должно выполняться равенство п 2а=1. B-3) г=1 Если вероятности B.2) известны, то говорят, что распределение случайной величины] X известно, и что случайная величина X задана. Можно сказать, что, как и в случае A.90), задается полная система событий, и события состоят в том, что случайная величина принимает то или иное из][значений B.1) с вероятностями B.2). Случайная величина называется дискретной, если значения, которые она может принимать, можно пронумеровать. Число этих значений может быть и неограниченным, нужно лишь, чтобы мог быть указан метод нумерации, при котором не будет пропущено ни одного возможного значения случайной величины. Иначе говоря, дискретной случайной величиной называется такая случайная величина, которая может принимать значения,
§ 13] СЛУЧАЙНАЯ ВЕЛИЧИНА 55 образующие счетное множество. Распределение дискретной случайной величины называется дискретным распределением. Примером дискретной случайной величины может быть, например, число фотонов, излучаемых атомом водорода при каскадном переходе из 1-го возбужденного состояния в основное состояние. Число фотонов при этом может равняться 1,2,..., I — 1 и является случайной величиной. Дискретной случайной величиной будет также энергия первого фотона, излученного при каскадном переходе. Другим примером дискретной случайной величины является число солнечных пятен с площадью, большей некоторого заданного значения 5, наблюдаемых в течение дня на солнечном диске. Дискретной случайной величиной является также число лепестков в цветке сирени. Как известно, вероятность того, что у случайно выбранного цветка сирени имеется четыре лепестка, близка к единице, вероятности трех или пяти лепестков малы, а вероятности встретить другие значения числа лепестков еще намного меньше. В водородном газе при некоторой заданной температуре атомы могут находиться как в основном состоянии, так и в возбужденных состояниях. Возбужденных состояний бесчисленное множество, но они распределены дискретно и имеют точку сгущения, определяемую потенциалом ионизации. Следовательно, множество возбужденных состояний атома водорода счетно. Случайная величина- номер возбужденного состояния (основное состояние будет иметь номер 0) некоторого наудачу выбранного атома — является дискретной случайной величиной с бесконечно большим числом значений. Интегральным законом распределения или интегральной функцией распределения случайной величины X называется функция Р \х)у равная вероятности того, что случайная величина X примет значение, меньшее ж, Очевидно, что 5) = Р (X <х). Рь B.4) B.5) где суммирование ведется по всем г, для которых х^ <С х.
56 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 Функция Р (х) является монотонно возрастающей функцией, так как при возрастании х к правой части B.5) могут только добавиться положительные члены — вероятности событий. При изменении а; от — оодо ос функция Р (х) растет от 0 до 1 и имеет ступенчатый вид, как это для примера|показано на рис. 6,а. Если возможные значения X ограничены снизу величиной Ми то Р (Мг) = 0. Если возможные значения X ограничены сверху величиной Л/2, то Р (М2 + А) = 0, где А— любая положительная величина. Если а < &, то на основании теоремы сложения вероятностей справедливо равенство р (X < а) + Р{а<\Х <Ь)щ= =Р (X < Ъ), откуда на основании B.4) следует, что Р (а < X < 6) = = Р(Ь)-Р (а), B.6) т. е. вероятность для случайной величины принять значение, лежащее между а и Ь, равна разности интегральных функций распределения для аргументов Ъ и а. {Задача 29. Электролампа многократно включается и выключается. Вероятность перегорания лампы при одном включении и выключении равна р. Рассмотреть случайную величину — порядковый номер включения и выключения, при которых лампа перегорит,— и найти ее распределение. Решение. Эта дискретная случайная переменная имеет бесконечно большое число возможных значений. Вероятность того, что лампа перегорит при Л-м включении и выключении, равна произведению вероятности того, что она не перегорит при к — 1 первых включениях и выключениях, на вероятность того, что в следующем, 0 б) Рис. 6.
§ 13] СЛУЧАЙНАЯ ВЕЛИЧИНА 57 к-м включении, она перегорит: A - р)*-1 р. Следовательно, возможные значения случайной переменной 1, 2, . . ., * имеют соответственно вероятности Р> С1 - Р)Р> • • ., A — р)*-гр, . . • Вероятность того, что лампа не перегорит после к включений и выключений, равна A — р)к, поэтому интегральный закон распределения что можно получить и суммированием вероятностей значений случайной переменной до к — 1. Задача 30. Известно, что отношение числа кратных систем звезд с кратностью к к числу кратных систем звезд с кратностью к — 1 приблизительно постоянно (не зависит от к) и равно Ь. В предположении, что этот закон выполняется строго, рассмотреть в качестве случайной переменной кратность4 системы, которой принадлежит случайно выбранная звезда, и найти ее распределение. Решение. Число систем кратности к согласно условию равно сЬк~г, где с—число одиночных звезд. Число звезд в системах кратности к равно скЪк~г. Вероятность того, что случайно выбранная звезда принадлежит системе кратности к, равна кЪк'г л= — • ^ кЬ*'1 Так как знаменатель дроби равен A_м2 , то рк = A - б)»»*-* что и определяет искомое распределение.
58 СЛУЧАЙНАЯ ВЕЛИЧИНА ЕГЛ. 2 § 14. Биномиальное распределение Примером дискретной случайной величины является число появлений т событий А при выполнении а испытаний. Возможными значениями т этой случайной величины являются т = О, 1,2, . . ., п, а соответствующие вероятности вычисляются по формуле A.101): Р (т) = гу-^ гт- рП. ^пк ' т\(п — т)\ г * Условие B.3) легко проверяется. В самом деле, поскольку A.101) представляет собой выражение для общего члена бинома Ньютона, то, имея в виду, что р + Ч = 1, находим п п \ 2 А И = 2 т|(»"!-М), Рт9п-т - (Р + & = 1 • B-7) Таким образом, выражение A.101) определяет распределение случайной величины — числа появлений события А при п испытаниях. Это распределение, вследствие того, что оно имеет такой же вид, как и общий член разложения бинома Ньютона, называют биномиальным распределением. Если число испытаний п велико, а вероятность р реализации события А не очень близка к нулю и не очень близка к единице, то маловероятно, чтобы событие А при п испытаниях случилось очень малое число раз или число раз, близкое к п. Очевидно, что при малых т вероятность Рп (т) растет с увеличением ту а для т, близких к пу она убывает при увеличении т. Можно предположить, что для какого-то значения т вероятность рп (т) достигает максимума. Для определения этого максимума отметим, что если он достигается при значении т, то должны быть справедливы два неравенства р (т — 1)! р (т) Рп{ "<1 >*• B-8) , , <1, Вычисляя при помощи A.101) величины в левых частях
§ 14] БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ B.8), находим т Решая эти неравенства относительно т и учитывая, что р + д = 1, получаем для значения т, при котором рп (т) достигает максимума, неравенства т < пр + р, т > пр — д. B.10) Интервалу [тгр — д, /гр + р] в общем случае принадлежит только одно целое число, в частном же случае, когда концы интервала целые числа,— два целых числа. Таким образом, максимум рп (т) достигается в общем случае при одном значении т, а в некотором частном случае при двух последовательных значениях т. Часто вместо случайной величины ш целесообразно рассматривать относительную частоту события А ш п Когда п велико, из неравенства B.10) следует приближенное равенство «Р. B.И) т. е. наивероятнейшим значением относительной частоты является вероятность того, что событие произойдет в одном испытании. Часто также рассматривают случайную величину Хш = ^—р, B.12) которая представляет собой отклонение относительной частоты от наивероятнейшего значения. Задача 31. В сфере радиуса г находится п молекул газа. Найти вероятность того, что из них ровно т молекул будут находиться на расстоянии, меньшем р = Хг от центра этой сферы (т <^ п, X <^ 1). Решение. Так как отношение объема сферы с радиусом р к объему всей сферы равно X3, то вероятность р того, что какая-то одна молекула окажется на расстоя-
60 СЛУЧАЙНАЯ ВЕЛИЧИНА 1ГЛ. 2 нии, меньшем р, от центра сферы, равна А,3. Следовательно, искомая вероятность р (т) = ——-—~ т\ (п — т)\ Задача 32. Найти наивероятнейшее число появлений единиц при бросании игральной кости 3000 раз. Решение. Так как в этой задаче р = 1/6, п = 3000, то согласно B.11) наивероятнейшим числом т появлений единицы будет 500. Это не означает, что вероятность появления 1 при 3000 бросаниях игральной кости велика. При помощи формулы B.7) легко подсчитать (для этого надо использовать формулу (Стирлинга), что ^зооо E00) « 0,01954, т. е. эта вероятность мала. Она мала потому, что имеется большое число других возможных частот появления 1 при 3000 бросаниях игральной кости. Но вероятность любого другого количества появления 1 меньше, чем рЗОоо E00). § 15. Гипергеометрическое распределение Из урны, в которой имеется 5 шаров, в том числе N белых, случайным образом последовательно извлекается п шаров. Чему равна вероятность того, что среди них окажется ровно т белых шаров. Должны, очевидно, выполняться неравенства N < 5, п < 5, т ^ ^, т < п. Вероятность достать белый шар при первом извлечении N Если каждый раз, как извлечен шар, записывать его цвет и возвращать шар в урну, то вероятность события А — получить белый шар при каждом извлечении — будет одна и та же, равная р. Эта задача была рассмотрена в § 12 и привела к биномиальному распределению A.101). Иногда ее называют задачей на извлечение с возвращениями. Предположим теперь, что извлеченные шары не возвращаются в урну. Тогда формула A.101) неприменима,
§ 15] ГИПЕРГЕОМЕТРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ 61 так как вероятность события А будет все время меняться в зависимости от того, произошло или не произошло оно в предыдущем испытании. Найдем вероятность того, что при п испытаниях событие А произойдет т раз в схеме извлечений без возвращений. Рассмотрим различные последовательности из п извлекаемых шаров. Число таких равновозможных последовательностей равно Число благоприятных событий (когда получено т белых шаров) равно числу сочетаний из N белых шаров по т, умноженному на число сочетаний из 8—И не белых шаров по п — т. Таким образом, ~" ^! т!(ЛГ — т)\(п — т)\{8 — И — п + т)\ ' B.13) Распределение B.13) называют гипергеометрическим. Как и в биномиальном распределении, найдем значение т9 при котором вероятность достигает максимального значения. Должны выполняться неравенства Лг (т " *) __ т (б1 — ТУ — п + т) . рп(т) - ^-т+1)(п ^а *■• Решая эти неравенства относительно т, получим Гели 5 и п велики, то приближенно максимум вероятности достигается при т=^-п. B.15)
62 СЛУЧАЙНАЯ ВЕЛИЧИНА И\П. 2 § 16. Распределение Пуассона Рассмотрим даваемое формулой A.101) Рп(Щ- _гп[(п_т)[ Р Я. » биномиальное распределение, определяющее вероятность появления события А т раз при п испытаниях. Предположим, что число испытаний п очень велико, и пусть пр - а. B.16) Зафиксируем а и устремим п к бесконечности. Поскольку р равно а/п, оно будет стремиться к нулю. Заменим в A.101) р на а/тг, ад — на 1 — а/п: — Л п~~{ п~т + \ о^_ Г /1 ___ а_\-т/аГа ' ___ <х\-т п п п т!|_\ п ) ^\ п ) Совершим предельный переход, учитывая, что при п -> оо каждое значение т остается конечным. Тогда Полученное распределение называется распределением Пуассона для случайной величины — числа наступлений события А. Это распределение является точным, если п бесконечно велико (а р соответственно бесконечно мало). Однако оно может быть с успехом использовано и для конечных, но больших /г, так как для больших п точность его весьма велика, а вычислять вероятности по формуле Пуассона проще, чем по формуле биномиального распределения, в особенности в тех случаях, когда а невелико, не превосходит нескольких единиц. Именно в тех случаях, когда а мало, и, кроме того, требуется учитывать вероятности только небольшого числа первых значений т (для больших значений т вероятности очень малы), распределение Пуассона наиболее употребительно.
§ 17] НЕПРЕРЫВНАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА 63 Легко видеть, что условие 2 Р(т) — выполняется. ш=0 В самом деле, используя разложение ел в бесконечный ряд, получаем т Определим, при каком значении т вероятность р (т) принимает наибольшее значение. Аналогично тому, как это было сделано в § 14 для биномиального распределения, используя A.101), находим р(т — 1) _ т , р(т) _ т +1 . р(т) а ^ А' р(гп + 1) ""а ^ х' откуда следует, что вероятность максимальна при а — 1<т<а. B.19) Таким образом, в общем случае, когда а не есть целое число, максимум вероятности достигается при т, равном ближайшему меньшему а целому числу. Если а < 1, то р (т) наибольшее при т = 0. В частном сучае, если а — целое число, то наибольшая вероятность достигается при двух значениях: т = а — 1 и т = а. § 17. Непрерывная случайная величина Допустим, что возможными значениями случайной величины X являются любые значения из некоторого промежутка [а, Ь]. Назовем интегральным законом распределения этой случайной величины, как и для дискретной случайной величины, функцию Р{х) = Р(Х <х). B.20) Предположим, что существует такая функция / (х), что для любых значений х выполняется равенство B-21)
64 СЛУЧАЙНАЯ ВЕЛИЧИНА |ГЛ, 2 из которого также следует, что П*) = Р'(*) B-22) всюду, за исключением, быть может, множества точек х лебеговой меры 0. Будем называть случайную величину, отвечающую этому требованию, непрерывной. Функция / (х) называется дифференциальным законом распределения случайной величины. Для того чтобы понять ее смысл, напишем на основании B.20) и B.21): ь Р (а < X < Ъ) = ^ / (х) их. B.23) а Предположим, что функция / (я), непрерывна. Положив в B.23) а = х, аЬ = ж + их, получим х+йх ^ B.24) Аналогично, положив а = х ^- их, Ъ — х -\- -^- их, получим Р (х— -^-Жг < X <х + \-йх\ =1(х)Aх + о (Ах). B.24*) Таким образом, произведение / (х) на их с точностью до бесконечно малых высших порядков равно вероятности того, что случайная переменная примет значение, заключенное между х и х + Ах (или, что то же самое, между 1 1 х ^- <гхих-\- -х- их). Вследствие этого для функции / (х) наряду с термином дифференциальный закон распределения употребляют также термин плотность вероятности. Целесообразность этого термина следует из такой аналогии. Если рассматривается линейный стержень с переменной линейной плотностью (массы) /(ж), то, как известно, выражение в правой части B.23) дает массу стержня, заключенную в промежутке [а, Ь], а выражение в правой части B.24) — массу стержня в промежутке [ж, х + их]. Поэтому, поскольку в нашей задаче левые части равенств B.23) и B.24) определяют вероятности, то функцию / (х) уместно назвать плотностью вероятности.
§ 171 НЕПРЕРЫВНАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА 65 Вероятность того, что случайная величина примет значение из промежутка [х, х + еЫ, есть всегда неотрицательная величина, следовательно, и плотность вероятности — неотрицательная функция, / (х) > 0. Поскольку то оо 5 }(х)йх = 1. B.25) Если случайная величина может принимать значения только из промежутка [а, Ь], то условие нормировки можно записать в виде ь х)Aх= 1. B.26) Однако его всегда можно писать и в виде B.25), имея в виду, что вне промежутка [а, Ь] плотность вероятности / (х) = 0. Произведение / (х) их есть вероятность, т. е. величина безразмерная. Дифференциал их имеет размерность случайной величины. Следовательно, плотность вероятности имеет размерность случайной величины в степени минус 1. Типичный график функции Р (х) для непрерывного распределения показан на рис. 6, б. Непрерывная случайная величина считается заданной, если известна ее функция распределения Р (х) или / (х). Задача 33. Найти функ- Рис 7. цию распределения угла между двумя полупрямыми на плоскости, из которых одна закреплена, а у другой все ориентации в данной плоскости равновероятны. Решен и е. Понятие] равновероятности всех направлений в плоскости определяется следующим образом. Пусть полупрямая каждый раз выходит из некоторой точки. Проведем из этой точки на плоскости окружность произвольного радиуса (рис. 7). Все направления полу- 3 Т. А. Агекян
66 СЛУЧАЙНАЯ ВЕЛИЧИНА ГГЛ. 2 прямой равновероятны, если вероятность, что полупрямая пройдет через любой отрезок дуги проведенной окружности, пропорциональна длине отрезка и не зависит от его положения. Пусть радиус окружности равен 1. Вероятность того, что рассматриваемый угол будет заключен в промежутке [а, а + сЫ» пропорциональна соответствующему дифференциалу дуги, который равен да. Следовательно, / (а) да = еда. Постоянная с находится из условия нормировки. Если угол отсчитывается в определенном направлении, то он может принимать значения в промежутке [0, 2я]. Следовательно, еда = 2пс = 1 о и / (а) да = -7Г- да. Задача 34. Найти функцию распределения угла между закрепленной полупрямой и полупрямой, все направления которой в пространстве равновероятны. Решение. Понятие равновероятности всех направлений полупрямой в пространстве определяется следующим образом. Пусть полупрямая каждый раз выходит из некоторой точки. Проведем из этой точки произвольным радиусом сферу. Мы будем говорить, что все направления полупрямой равновероятны, если вероятность того, что полупрямая пройдет через любую область сферы, пропорциональна площади поверхности этой области и не зависит от ее формы. (Если это условие выполняется, то при многократном испытании точки пересечения полупрямой со сферой будут стремиться равномерно заполнить сферу.) Полупрямую с фиксированным направлением также проведем из центра сферы; пусть это будет вертикальная полуось (рис. 8). Пусть радиус сферы равен 1. Рассматриваемая случайная величина — угол между двумя полупрямыми — может принимать значения из промежутка [О, я]. Вероятность того, что она примет значение из промежутка [а -Ь с!а], равна вероятности попадания под-
17] НЕПРЕРЫВНАЯ СЛУЧАЙНАЯ ВЕЛИЧИНА вижной полупрямой в заштрихованное на рис. 8 кольцо. Но эта вероятность пропорциональная площади кольца, / (а) йа = с-2я зт айа. Коэффициент с, определяемый из условия нормировки B.26), получается равным 1/4я, поэтому окончательно / (а) йа == -х- 81П айа, B.27) а плотность вероятности да) = -о-зш а. Замечание. Если бы рассматривалась случайная величина — угол между двумя прямыми (не направленными),— то промежуток возможных значений был бы 0, т ис учетом нормировки мы получили бы / (а) 6а = зт а 6а. Задача 35. Найти функцию распределения угла между фиксированной плоскостью и прямой, все направления которой в пространстве равновероятны. Решение. Рассматриваемая случайная величина Р может принимать значения в промежутке К), ~ . Проведем на рис. 8 фиксированную плоскость перпендикулярно к фиксированной прямой. Тогда Рис. 8. и с учетом нормировки получим /(Р)йр = соз рйр. B.28) Легко видеть, что функция распределения угла между фиксированной прямой и плоскостью, все положения которой равновероятны, также равна соз р. Задача 36. В условиях задачи 21 найти функцию распределения времени распада радиоактивного атома. Решение. Вероятность того, что распад произойдет в интервале времени [I + А], равна вероятности того, 3*
68 СЛУЧАЙНАЯ ВЕЛИЧИНА 1ГЛ. 2 что атом не распадается за время I, умноженной на вероятность того, что он распадается за следующий промежуток времени д,Ь. Следовательно, / (I) <И = е-^Мг. Задача 37. Пространство заполняет газ. Вероятность встретить молекулу газа внутри бесконечно малого объема д,у равна а йу. Для любой молекулы в любой момент времени найдется какая-то молекула — ближайший сосед. Расстояние до ближайшего соседа есть случайная величина. В разные моментывремени она различна. Найти функцию распределения расстояния до ближайшего соседа. Решение. Для того чтобы ближайший сосед находился на расстоянии, заключенном между г и г + йг, необходимо, 1) чтобы расстояние до ближайшего соседа было не меньше г — вероятность этого события равна 1 — — Р (г); 2) чтобы внутри сферического слоя 4яг2йг была молекула — вероятность этого события равна а4яг2йг. Так как эти два события взаимно независимы, то вероятность, что произойдет и то, и другое, равна произведению их вероятностей. Следовательно, / (г) дг = [1 - Р (г)ЫпгЧг. B.29) Деля обе части B.28) на г2с1г, дифференцируя по г и имея в виду B.22), получаем Деля обе части на —/ (г) и интегрируя, находим лаг3 / (г) == сг2е Произвольная постоянная находится из условия нормировки B.26). Окончательно получаем 4 паг / (г) = Апаг2 е з . B.30) Как показывает B.30), при возрастании г плотность вероятности расстояния до ближайшего соседа растет от нуля, достигает максимума при г = Bяа)""^ а затем убывает, стремясь к нулю.
§ 18] ФУНКЦИИ ОТ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 69 § 18. Функции от случайной величины Рассмотрим наряду со случайной величиной X некоторую функцию от нее: У = т, (X). B.31) Очевидно, что V также является случайной переменной, причем если X — дискретная случайная величина, то и У — дискретная случайная величина. Поставим задачу нахождения функции распределения У, если известна функция распределения X. Ограничимся при этом случаем, когда т) (х) является строго монотонной функцией и, следовательно, ХиУ однозначно определяют друг друга. Этот случай имеет основное прикладное значение. Для дискретных случайных величин задача тривиальна. В самом деле, если возможные значения X имеют соответственно вероятности Рп Рг, • • м Рп, то вычисленные по формуле B.31) возможные значения V Уи 2/2, • • ., Уп имеют соответственно те же вероятности. Чтобы решить задачу для непрерывной случайной величины, рассмотрим два случая. 1. Функция т) (х) монотонно возрастающая. Тогда, очевидно, если у = т) (х), то для интегральных функций распределения имеем простое равенство Рг (У) = Р (х). B.32) 2. Функция т) (х) монотонно убывающая. Тогда, если у = т) (х), то для интегральных функций распределения справедливо равенство 1-Г1(у) = Р (х). B.33) Приравняем дифференциалы обеих частей B.32): /. (у) *у = 1 (*) *•; B.34)
70 СЛУЧАЙНАЯ ВЕЛИЧИНА ГГЛ. 2 это дает соотношение между плотностями вероятностей случайных переменных. Приравняв дифференциалы обеих частей B.33), мы снова получим B.34). Знак минус, который при дифференцировании должен был появиться в левой части равенства, заменен знаком плюс, и это компенсируется тем, что йу, который был бы отрицательным, когда Ах положительно, берется по абсолютной величине. Таким образом, обе функции и оба дифференциала, фигурирующие в B.34), всегда считаются положительными. Разрешим теперь B.31) относительно X: X = I (У). B.35) Тогда на основании B.34) и B.35) получаем ' (у) I ^У» B.36) что и дает решение задачи. Знак абсолютной величины поставлен, чтобы и при монотонно убывающей I, (у) плотность вероятности случайной величины У была положительной. На практике переход в правой части B.34) от х к у нужно производить каким-нибудь удобным способом, используя равенство B.31). Задача 38. В центре основания кругового цилиндра радиуса г находится источник излучения. Найти функцию распределения случайной величины — высоты попадания фотона в стенку цилиндра. Решение. Все направления полета фотона можно считать равновероятными, поэтому (см. задачу 35) функция распределения угла между направлениями полета фотона и плоскостью основания цилиндра / (р) = со$р. Далее, имеем к =■ г 1^р. Поэтому к = / (р) йр = соз рйр = г2 (г2 + к2)-3/* дН. Задача 39. Дифференциальная функция распределения (плотность вероятности) частоты в излучении абсолютно черного тела имеет вид где К — постоянная Планка, к — постоянная Больцма- на, Т — абсолютная температура, В — постоянная, опре-
§ 18] ФУНКЦИИ ОТ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 71 деляемая условиями нормировки. Найти функцию распределения излучения черного тела по длинам волн. Решение. Длина волны X связана с частотой соотношением Поэтому 3 а д а ч а 40. Источник излучения находится над поверхностью прозрачного вещества. Найти функцию распределения углов преломления лучей в прозрачном веществе. (Отношение показателей преломления в прозрачной среде и воздухе равно х.) Решение. Углы падения а и преломления X связаны равенством 81П а = X 81П %. Согласно задаче 35 плотность вероятности / (а) = с 81П а. Поэтому /(х)а% =с81 2 У 1 — и2з1п2х Необходимо учесть явление полного внутреннего отражения, накладывающего ограничения на возможные значения а и Х- Если х < 1, то преломление имеет место только для 0 < а < агсзт и. Поэтому, используя условие нормировки, находим с = A - /Г^Г2)-1- Итак, если х < 1, то их) = *2з[п2х 2 A — |/ - х2) VI - х2 зш2Х ' причем ^ принимает значения в промежутке 0, ^ .
72 СЛУЧАЙНАЯ ВЕЛИЧИНА |ГЛ. 2 Если х> 1, то преломление происходит при значениях О < а < 2.. Постоянная с = 1, 4» 2 /1-х*зт«Х ' причем X принимает значения в промежутке [0, агсзт -1. Задача 41 (опыт Резерфорда). Параллельный пучок а-частиц, придя сквозь тонкий лист золота, в результате взаимодействия с ядрами атомов золота рассеивается. Угол V — отклонение от первоначального направления — определяется равенством где М — масса а-частицы, е — ее заряд, ке — заряд ядра атома, V — скорость а-частицы, р — прицельное расстояние, т. е. то наименьшее расстояние между а-части- цей и ядром атома, которое было бы, если бы взаимодействие отсутствовало и а-частица летела все время по прямой линии. Найти распределение углов V после прохождения а-частицами листа золота. Решение. Скорости а-частиц потока одинаковы. Но различны их прицельные расстояния. Доля прицельных расстояний, заключенных в интервале [ру р + йр1, пропорциональна 2пр Ар. Поэтому / (Р) йр = С\Р Ар. Используя зависимость между р и V, находим V СО5 -гр 31П3 — Если ввести в рассмотрение элементарный телесный угол йп = 2Я 81П V дп И. УЧТЯ, ЧТО УГЛЫ V МаЛЫ, ПОЛОЖИТЬ СО8-^-=^1,ТО
§ 19] Дельта-функция Та окончательно получим 81П' 2 § 19. Дельта-функция С физической точки зрения дельта-функция — это плотность единичной массы, сосредоточенной в нуле. Такому пониманию соответствуют формальные равенства б (х) = 0 при х Ф О, >. B.37) Для любой обычной функции, однако, эти равенства противоречат друг другу: интеграл от функции, удовлетворяющей первому из них, равен нулю. Предположим, что 6 (х) — функция, равная нулю вне малой окрестности точки 0 и принимающая настолько большие положительные значения вблизи нуля, что выполняется второе из соотношений B.37). Тогда, как показывают несложные вычисления, для любой непрерывной функции т) (х) значение интеграла § т) (#) б (х) их близко —00 к т) @). Эти соображения приводят к определению дельта- функции как операции, ставящей в соответетвие каждой непрерывной функции г\ (х) ее значение в нуле, что символически записывается в виде равенства Непосредственно из определения вытекает соотношение г] {х + х0) б (х) их = х\ (х0), где х0 — произвольная фиксированная точка. Если бы в последнем соотношении б (х) было обычной функцией,
?4 СЛУЧАЙНАЯ ВЕЛИЧИНА (ГЛ. 2 ею можно было бы переписать в виде B.38) Оказывается, что во многих случаях, формально считая б обычной функцией, приходят к правильному результату в выкладках, разумеется, не забывая о том, что «зашифровано» в записи B.38). Дельта-функцию можно использовать для введения плотности вероятности в случае дискретной случайной величины. В самом деле, покажем, что /И=2Аб(*-*г) B.39) г можно рассматривать как плотность вероятности X. Согласно B.21) интегральный закон распределения определится равенством - *») «• B-40) г —оо Если х ^> XI, то соответствующая вероятность рг входит в знак суммы в правой части B.40). Если же х <С хи то и соответствующее Р1 в сумму B.40) не входит. Таким образом, Р (х) совпадает с B.5) — интегральным законом распределения для дискретной случайной величины; следовательно, / (х) есть плотность вероятности. Совершенно так же убеждаемся, например, в справедливости равенства ь ь Р (а <; х <^ Ъ) = ^ 2 Р$ (х ~~ хг) их = 2 Р* \й {х — хг) Ах. Введение при помощи дельта-функции плотности вероятности дискретной случайной величины позволяет
§ 20] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ 75 применять одну и ту же форму записи операций для дискретных и непрерывных случайных величин. Задача 42. Определить плотность вероятности для случайной величины — количества очков при бросании игральной кости. Решение. Случайная величина принимает значения 1, 2, 3, 4, 5. 6, каждое с вероятностью 1/6. Поэтому (*) = 4-2 8 (*-*)• Задача 43. Определить плотность распределения скоростей частиц относительно центра инерции системы, состоящей из двух движущихся навстречу друг другу со скоростью а потоков частиц. Частицы, принадлежащие одному потоку, имеют равные скорости, и число частиц в потоках одинаково. Решение, п частиц имеют скорость а и столько же частиц имеют скорость —а, поэтому § 20. Математическое ожидание функции от случайной величины Если / (х) есть плотность вероятности случайной величины X, а к] (X) — некоторая функция от этой случайной величины, то величина Мг\ (X), определяемая равенством --= \ г\(хI(х)ах, B.41) называется математическим ожиданием г\ (^.^Прописная буква М, ставящаяся перед обозначением функции, используется как знак математического ожидания. Математическое ожидание случайной величины не есть случайная величина. Это постоянная величина, определяемая согласно B.41) функцией т) (х) и законом распределения случайной величины. Она имеет смысл среднего ожидаемого значения ц (X) при выполнении испытаний.
76 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 Для дискретной случайной величины X математическое ожидание х\ (X) может быть записано в виде Л (*) г —оо если т) (х) непрерывна в точках ♦) хх, х2, . . . При бросании игральной кости математическим ожиданием куба появляющегося количества очков является = I3- -1- + 23- 4"+ • • • + 63- 4" в 73'5' Поэтому игра, состоящая в том, что бросающий кость игрок делает ставку и получает выигрыш в копейках, равный кубу появляющегося количества очков, будет справедливой, если уплачиваемая им ставка равна 73,5 копейки. В этом случае возможный проигрыш будет только результатом «невезения», а возможный выигрыш только результатом «везения», но не следствием несправедливости условий для одной из играющих сторон. Если бы игральная кость имела не вполне правильную форму, такую, например, что вероятности появлений чисел 1,2, 3 были бы равны а <С "с" > а вероятности появления чисел 4, 5, 6 были бы равны Ь ^>-^-(при этом должно выполняться равенство За + ЗЬ = 1), то математическое ожидание X3 было бы больше, чем 73,5, так как становятся более вероятными большие значения случайной величины X3. Если г) (X) = гI (X) + т] *) Чтобы применение к т) (х) операции б было законно, мы, не ограничивая общности, можем считать, что функция ц (х) непрерывная всюду (иначе ее можно заменить непрерывной, совпадающей с ией в точках х\ функцией).
201 МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ 77 ТО B.43) Следовательно, математическое ожидание суммы функций равно сумме математических ожиданий этих функций. Точно так же доказывается, что если с — постоянная величина, то Мсх\ {X) = сМу]{Х). B.44) Очевидно, что размерность математического ожидания функции случайной величины такая же, как у функции случайной величины. В частном случав, если т) (X) = X, равенство B.41) дает математическое ожидание самой случайной величины /(*)**• B-45) Математическое ожидание случайной величины является ее важнейшей характеристикой. Как отмечалось выше, она имеет смысл среднего значения случайной величины. Из B.42) следует, что для дискретной случайной величины ее математическое ожидание равно МХ = 2РЛ- B.46) Часто вместо Мг\ (X) для обозначения математического ожидания употребляют горизонтальную черту, которую ставят над функцией, например, X5, X3, 8\п2Х* Равенства B.43) и B.44) можно записать так: B.47) В последнее время входит в употребление также следующее обозначение математического ожидания: (X) - <т, (Х)>.
78 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 § 21. Моменты функций распределения Математическое ожидание функции (X - а)" называется моментом к-то порядка относительно начала а случайной величины X. Говорят также, что это момент к-то порядка функции распределения/^). Обозначим его B.48) Момент к-то порядка имеет размерность к-й степени раз мерности случайной величины. Очевидно, что для любой функции распределения мо мент нулевого порядка равен 1. Для дискретной случайной величины момент Хй>а, записанный непосредственно через вероятности /?,-, имеет согласно B.42) вид V ___ ]у[ /у у\к __ \^ /^. о\к р. /о 49^ г Если а = 0, то момент называется начальным. Будем обозначать начальные моменты к-то порядка ч^: = ^ а*/(я) ** = !* = <Х*>. B.50) Для дискретной случайной величины выражение начального момента запишется в виде V,, =: Л/Х* = 2^А ■= Х» = <Хк>. B.51) г Очевидно, что математическое ожидание случайной величины есть начальный момент первого порядка, У1 = МХ = X. B.52)
§ 21] МОМЕНТЫ ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ 79 Если в B.48) за величину а принять X, то моменты называются центральными. Будем обозначать их \1к: х — Х)к](х)<1х. B.53) Центральный момент первого порядка всегда равен нулю. В самом деле, = ^ хЦх)йх-Х~ \ /(*)(& = X — Х = 0. B.54) —оо —оо Центральный момент второго порядка называется дисперсией случайной величины и обозначается обычно БХ\ = щ = М (X - XJ = \ (х — XJ / (ж) да. B.55) — оо Дисперсия — также важнейшая характеристика случайной величины, определяющая математическое ожидание квадрата отклонения случайной величины от ее среднего значения. Если дисперсия мала, то это означает, что случайная величина имеет тенденцию принимать значения, близкие к ее среднему значению (математическому ожиданию). Если дисперсия равна нулю, то это означает, что случайная величина с вероятностью_1 принимает некоторое значение (оно равно, конечно, X). Плотность вероятности ее согласно B.39) есть дельта-функция, / (х) = б (х - X). Большая же дисперсия указывает на большое рассеяние случайной величины, т. е. на то, что вероятности принимать значения, существенно отличающиеся от среднего значения, не малы. Из B.42) следует, что для дискретной случайной величины ш: = 1х2 = 2 (** - ХУ а- B-5Г))
80 СЛУЧАЙНАЯ ВЕЛИЧИНА 1ГЛ. 2 Выведем важную для практики формулу: — 21 § х}(х)<1х + Х2 ^ 1(х)йх, —оо —оо откуда следует; ВХ = (X - XJ = Г2 - X2 = МХ2 — (МХ)\ B.57) т. е. дисперсия случайной величины равна разности между математическим ожиданием квадрата и квадратом математического ожидания случайной величины. Корень квадратный из дисперсии о = УШ = /й B.58) называется стандартом случайной величины. Стандарт есть среднее квадратичное отклонение случайной величины от ее среднего значения. Он имеет размерность случайной величины. Отношение стандарта к абсолютному значению среднего арифметического 1ТГ B-59) называется относительным среднеквадратичным отклонением случайной величины от среднего значения или вариацией случайной величины. Эта характеристика имеет важное значение в том случае, когда случайная величина может принимать значения только одного знака. Если случайная величина может менять знак, тот-^уне представляет интереса, а в том случае, когда X" = 0, не существует. Очевидно, г-=у — безразмерная величина. Все моменты функции распределения можно рассматривать как некоторые характеристики случайной величины. Если случайная величина может принимать значения из ограниченного промежутка, то все ее моменты существуют. Если же промежуток значений случайной величины не ограничен, то могут существовать не все моменты.
21] МОМЕНТЫ ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ 81 Например, если 1(х)=~ при *>Ь>0, B.60) /(*) = 0 при <Ь то ь оо Ь Все же моменты второго и более высокого порядков не существуют, так как соответствующие интегралы расходятся. Дисперсия случайной величины с плотностью вероятности B.60) бесконечна. Математические ожидания абсолютных значений (X — а)к называются абсолютными моментами /с-го порядка. Например, есть соответственно абсолютные центральные моменты первого и третьего порядка. 3 а д а ч а 44. Все направления отрезка прямой а равновероятны. Найти среднее значение, а также дисперсию длины проекции X этого отрезка на: 1) заданную прямую, 2) заданную плоскость. Решение. Согласно решениям задачи 33 и 34 функция распределения угла а между данным отрезком прямой и фиксированной прямой есть /(а) = узша, а функция распределения угла между отрезком и плоскостью /(Р) = С08р.
82 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 Проекция отрезка на прямую равна а соз а, а на плоскость — а соз р. Поэтому средняя длина проекции отрезка на прямую п Г 1 МХ = \ а I соз а I • -^- зт а йа = о я/2 1С 1 = 2а • -^- \ соз а зт а йа = -^~ а, о а средняя длина проекции на плоскость соз 2 В Ли = -I О Дисперсия длины проекций на прямую п Г / 1 \2 1 2)Х = вг = а2 \ I соз а I ~- • -^- 81 О ^ 7 С / 1 = а2 ^ (соза ^ а на плоскость я/2 Стандарт длины проекции отрезка на прямую а стандарт длины проекций отрезка на плоскость --1^а ^0,2361 а. Задача 45. Вероятность того, что частица на участке пути [/, I + Л1] столкнется с другой частицей, равна X А1. Найти функцию распределения длины свободного (без столкновений) пробега I, а также ее среднюю величину, дисперсию и стандарт. Решение. Вероятность того, что частица испытывает на участке [/, / + Л1] первое столкновение, равна про-
§ 21] МОМЕНТЫ ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ 83 изведению вероятности того, что частица не испытает столкновения на участке пути [О, Л, на вероятность того, что она испытает столкновение на участке пути [/, I + + ей]. Первая величина, по аналогии с A.79) в задаче 21, равна е~и. Второй множитель равен Ы/. Поэтому / (/) дХ = е' Средняя длина свободного пробега частицы оо М\ = { =\ 1ег1*Ш = 4" • о Дисперсия длины свободного пробега Ъ = (I ~ О1 = \[1 ~ х О ^ и стандарт -х- Таким образом, фигурирующий в условии задачи параметр X имеет тот смысл, что его обратной величине равны средняя величина свободного пробега и стандарт свободного пробега. Задача 46. В условиях задачи 38 найти математическое ожидание, дисперсию и стандарт расстояния г до молекулы—ближайшего соседа. Решение. Используя найденную в решении задачи плотность вероятности расстояния для ближайшего соседа, находим математическое ожидание со со 4 с г* паг* г = )( г/ (г) $г = \, 4яаг3е 3 йг = __ 4 "" [Ала) 1 [ Здесь Г(а) = О -(еГ "-D-)-»■«*-*•
84 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 есть известная гамма-функция или эйлеров интеграл второго рода. (Существуют таблицы этой функции, например, Б. И. С е г а л, К. А. С е м е н д я е*в, Пятизначные математические таблицы, Физматгиз, М., 1962.) Дисперсия расстояния до ближайшего соседа а стандарт а 555 0,201. а/,. § 22. Связь между моментами относительно различных начал Рассмотрим моменты относительно начала Ъ и выразим их через моменты относительно начала а: = \ [(х- а) + (а - 6)]*/(*)<& = —оо к Таким образом, к 1 \^ /"»* г ~ гл\ \ /о ел \ ™&,Ь — /I к/к\и — О) А/с—1,а« \а,\)х) Если плотность вероятности / (х) задана в табличной форме, то моменты вычисляются при помощи приближенных формул для определенного интеграла. Центральный и начальные моменты обычно вычислять менее удобно, чем моменты относительно начала а, когда а выбрано удачно. Если а принять целым и близким к X (это нетрудно сделать на глаз), то в выражении B.48) множитель, стоящий перед / (х), вычисляется проще, чем аналогичный множитель в B.53); в то же время этот множитель в среднем меньше, чем аналогичный множитель в B.50). Поэтому сначала вычисляют моменты относительно начала а, удобно выбранного, целого и близкого на глаз к X, а затем перехо-
§ 23] МОМЕНТЫ РАСПРЕДЕЛЕНИЯ ПУАССОНА 85 дят к начальным и центральным моментам. Нужные формулы содержатся в B.61). Если положить Ь = 0, то ЯЛH = ук. Поэтому к V, = 2 Си***-4,а. B.62) г=0 В частности, X = уг = К,а + а. B.63) Если же принять Ъ = X, то в левой части B.61) моменты центральные, поэтому к и, учитывая B.63), находим к И* = 2 (-1IС*Д41,Лм,а. B.64) В частности, 1*2 = ^2,а - М,в, B.65) М^з = ^з,а — 3^1>а?12>а + 2Х»?>а» B.66) Ш = Ч« - ^1,Л.а + 6*1Л,а - ЗЛ-1.«' B'67) Если в B.65) принять а = 0, то получим уже ранее выведенную формулу B.57): |А2 = V2 - V!2. B.68) § 23. Моменты распределения Пуассона Пусть случайная величина т имеет распределение Пуассона B.17). Определим математическое ожидание функции 1)...(ш —5), 5<т; г]5 = 0, Согласно B.42) оо 1_1)...(|Я_,I_^ ш=0 в<тп
86 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 Первые 5+1 слагаемых в сумме обращаются в нуль, поэтому ТП —а — а8+1 (т __я 4-1)! ' 771=5+1 Ч ' ' Введем новый индекс слагаемых в сумме /с, связанный со старым индексом равенством к — ш — 5+1. Тогда получаем Мч\,= В частности, при 5=0 т]0 = т, и согласно B.69) Мт = а. B.70) Таким образом, параметр а, фигурирующий в распределении Пуассона, есть математическое ожидание случайной величины. При 5=1 г]! = т (т — 1) и согласно B.69) М [т (т — 1)] - М (т2 - т) = Мт2 — Мт - а2. B.71) Из B.71) и B.70) находим Мт2 - а2 + а B.72) и, используя выражение B.57) для дисперсии, получаем Дт - а2 + а — а2 = а. B.73) Таким образом, дисперсия распределения Пуассона равна математическому ожиданию этого распределения. Задача 47.С катода вылетает в среднем § электронов в единицу времени. Какова вероятность того, что за промежуток времени Д* с катода вылетит ровно т электронов? Решение. Среднее число электронов, вылетающих за время Д2, равно #Д^. Следовательно, вероятность того,
$ 23] МОМЕНТЫ РАСПРЕДЕЛЕНИЙ ПУАССОНА 8? что за время А^ вылетит ровно т электронов, равна Задача 48. Как известно, среднее число звезд до т-й видимой величины, т. е. ярче тп-й видимой величины (меньшим звездным величинам соответствует больший блеск), приходящихся на квадратный градус неба, зависит от галактической широты. Считая, что для некоторого значения галактической широты среднее число звезд до данной величины N (т) известно, найти вероятность того, что в некоторой площадке размером в 1 кв. градус, расположенной на этой широте: 1) не будет звезд с видимыми величинами, заключенными между т,\ и т2 (гпх <тп2)\ 2) ярчайшая звезда будет иметь видимую величину т, заключенную в промежутке [т, т + Лт\\ 3) найти математическое ожидание и дисперсию видимой величины ярчайшей звезды. Решение. Среднее число звезд с видимой величи- чиной, меньшей т, равно N (т). Поэтому среднее число звезд с видимыми величинами, заключенными в промежутке [тх, т2], равно N (т2) — N (/Пх). Вероятность встретить ровно к звезд с видимыми величинами, заключенными в промежутке [ти т2], согласно распределению Пуассона равна р (к) = -1- [М (т2) — N (тих)!* е-ртс^О-адто]. Вероятность не иметь ни одной звезды в этом промежутке (к = 0), следовательно, равна е-[ЛГ(т,ЬЛГ(т1)]в B.74) Вероятность того, что не встретится звезда в промежутке [т, т + йт), равна -[ЛГ(тп+Дт)-#(т)] -]У'(т)йг»г е — е , а вероятность встретить звезду с видимой величиной в этом промежутке есть м> (т) &т% B.75)
88 СЛУЧАЙНАЯ ВЕЛИЧИНА СГЛ. 2 Функция N (т) — математическое ожидание числа звезд до видимой величины т непрерывна и дифференцируема. Так же как было найдено B.74), найдем, что вероятность не встретить ни одной звезды с видимой величиной меньшей т равняется е-пы. B.76) Для того чтобы ярчайшая звезда имела видимую величину, заключенную в промежутке [т, т + йтп], необходимо, во-первых, чтобы в площадке не было звезды с видимой величиной, меньшей т и, во-вторых, чтобы была звезда с видимой величиной, заключенной в промежутке [т, т + Агп\> Эти два события взаимно независимы, поэтому искомая вероятность равна произведению B.76) на B.75): / (т) йт = *-"<"> ЛГ (го) йт. B.77) Мы нашли плотность распределения случайной величины т — видимой величины ярчайшей звезды в площадке площадью 1 кв. градус, расположенный на определенной галактической широте. Для определения математического ожидания видимой величины ярчайшей звезды необходимо B.77) помножить на т и проинтегрировать по всему промежутку значений видимых величин. Можно принять, что видимые величины всех звезд расположены в промежутке @, оо] и, следовательно, N @) = 0. На самом деле три звезды (Сириус, Ка- нопус и а Центавра) имеют отрицательную видимую величину, но этим можно пренебречь, так как вероятность попадания одной из этих трех звезд в рассматриваемую площадку очень мала. Таким образом, средняя величина ярчайшей звезды Мха = \ те-^Ш' (т) йт = о так как N (оо) = оо.
$ 231 МОМЕНТЫ РАСПРЕДЕЛЕНИЯ ПУАССОНА 89 Математическое ожидание квадрата видимой величины ярчайшей звезды Мт2 = ^ т2е-"(тт' (т) йт = 2 о о и, следовательно, дисперсия го со оо б2 = 25 те-"(тЫт — К е- Задача 49. В области полностью ионизованного водорода начинает происходить рекомбинация электронов с ионами, в результате чего газ постепенно деионизуется. Вероятность того, что электрон рекомбинируется за время д,1, в начальный момент равна х й1. Найти плотность вероятности для случайной величины — времени, прошедшего до момента рекомбинации электрона. Решение. Вероятность того, что электрон рекомбинируется за промежуток времени ей, если к моменту I он оставался свободным, пропорциональна й1, концентрации ионов р и постоянному коэффициенту р, характеризующему акт рекомбинации. Согласно условию задачи где р0 — концентрация ионов в начальный момент. Концентрация ионов убывает вследствие рекомбинаций. Этот процесс описывается уравнением решение которого Следовательно, вероятность того, что электрон рекомбинируется за время ей, если в момент I он был свободным, равна 1 +х* Проинтегрировав это выражение от 0 до г, получим <* = 1п A + х/),
90 СЛУЧАЙНАЯ ВЕЛИЧИНА !ГЛ. 2 что есть математическое ожидание числа рекомбинаций за время *. Хотя каждый электрон может рекомбиниро- ваться только один раз, это не значит, что а должно быть меньше единицы, а имеет смысл математического ожидания числа возможностей рекомбинироваться за время I. В таком случае, согласно распределению Пуассона, вероятность того, что за время I электрон не рекомбини- руется, * = -! 1 + хГ Искомая вероятность / {I) 6,1 того, что рекомбинация электрона произойдет в промежутке времени \1, I + Л], равна произведению вероятности того, что рекомбинация не произойдет за время I, на вероятность того, что после этого она произойдет за время 6,1. Таким образом, 1 + хИ + х* A § 24. Вероятностная трактовка некоторых физических понятий Введение понятия вероятности события позволяет правильнее определять некоторые физические явления. Например, понятие постоянства плотности газа в пространстве неверно формулировать буквально, считая, что молекулы расположены как солдаты в строю и все расстояния между соседними молекулами равны между собой. Так как молекулы газа непрерывно движутся, эти условия не могут выполняться строго, хотя плотность газа в макроскопическом смысле слова будет оставаться постоянной. Условимся говорить, что плотность газа постоянна в пространстве, если вероятность встретить хотя бы одну молекулу газа в некоторой области пространства зависит только от объема этой области и не зависит от формы области и ее месторасположения. При таком определении тождественность фактически реализуемых положений в различных местах пространства заменяется тождественностью условий, характеризуемых вероятностями. Очевидно, чем меньше объем рассматриваемой области, тем меньше вероятность встретить в дей хотя бы одну мо-
§ 24] ВЕРОЯТНОСТНАЯ ТРАКТОВКА НЕКОТОРЫХ ПОНЯТИЙ 91 лекулу и когда объем области стремится к нулю, то вероятность встретить в ней хотя бы одну молекулу также стремиться к нулю. В пространстве, где плотность газа всюду одинакова, рассмотрим некоторую малую область объема 2г>, состоящую из двух частей, каждую объемом V. Вероятность встретить хотя бы одну молекулу в каждом из объемов V обозначим р. Тогда согласно теореме сложения вероятность встретить хотя бы одну молекулу в объеме 2г; равна р + р — Р2- Если рассматриваемые объемы бесконечно малы, то бесконечно мала и вероятность р, поэтому квадратом ее можно пренебречь и, следовательно, вероятность встретить хотя бы одну молекулу в объеме 2г; равна 2р. Таким образом, для бесконечно малых объемов увеличение объемов вдвое ведет к увеличению вдвое вероятности встретить в объеме хотя бы одну молекулу. Поскольку рассмотренные объемы являются произвольными (при условии их бесконечной малости), то доказанное утверждение равносильно утверждению, что для бесконечно малых объемов вероятность встретить хотя бы одну молекулу пропорциональна величине объема. Следовательно, условие постоянства плотности равносильно уело- вию, что вероятность встретить хотя бы одну молекулу в объеме йг; равна X д,у, где постоянный коэффициент пропорциональности К характеризует величину плотности. Вероятность встретить хотя бы одну молекулу в объеме д,у равна вероятности встретить точно одну молекулу в этом объеме, а также равна математическому ожиданию числа молекул в этом объеме. В самом деле, математическое ожидание числа молекул в бесконечно малом объеме есть бесконечно малая величина. Обозначим ее к. Тогда согласно формуле распределения Пуассона вероятность встретить ровно т молекул в этом объеме равна кт/т\, поскольку е~н = 1. Следовательно, вероятность встретить точно одну молекулу равна к. Очевидно также, что вероятность встретить в этом объеме две молекулы или больше, равная 2 ТйТ ' есть бесконечно малая второго га=2 порядка в сравнении с к. Следовательно, вероятность встретить точно одну молекулу в объеме йу равна вероятности встретить там хотя бы одну молекулу.
92 СЛУЧАЙНАЯ ВЕЛИЧИНА СГЛ. 2 Если плотность газа в пространстве является некоторой функцией положения точки, то каждая из трех величин: вероятность встретить хотя бы одну молекулу, вероятность встретить точно одну молекулу и математическое ожидание числа молекул в объеме йу равны Я йг?, где X является фукцией координат и описывает закон распределения молекул в пространстве. § 25. Флуктуации физических величин В заполняющем пространство газе мысленно выделим некоторый объем. Пусть математическое ожидание числа молекул в нем равно а. Действительное число молекул в объеме будет вследствие случайности непрерывно изменяться. Поэтому, хотя условия неизменны и макроскопически плотность газа все время постоянна, точно определяемая плотность, равная числу частиц, деленному на объем, все время меняется. Непрерывно меняется, следовательно, и давление. Температура газа в объеме зависит от скорости молекул. Скорости молекул не одинаковы, они распределены по максвелловскому закону. В данный объем вследствие случайностей могут залетать преимущественно более быстрые или преимущественно менее быстрые молекулы, из-за чего средняя квадратическая скорость молекул, определяющая температуру газа, непрерывно меняется. Отклонения физических величин от своего среднего значения, вызываемые случайностью, называются флук- туациями этих величин. Если число частиц в некотором объеме равно т, то флуктуацией числа частиц мы назовем величину т — т, где т — математическое ожидание числа частиц в этом объеме. Согласно закону Пуассона с ростом по абсолютной величине (при том же знаке) т — т вероятность данного значения т и, следовательно, данного значения флуктуации уменьшается. Таким образом, чем больше по абсолютной величине (при том же знаке) флуктуация, тем меньше вероятность ее появления. Для того чтобы оценить среднюю величину флуктуации, нужно определить среднюю квадратичную величину флуктуации. Если рассматривается число частиц в некотором объеме, то средняя
§ 23] ФЛУКТУАЦИИ ФИЗИЧЕСКИХ ВЕЛИЧИН 93 квадратичная флуктуация числа частиц есть стандарт случайной величины — числа частиц в объеме. Как было показано в § 23, стандарт этой случайной величины, задаваемой распределением Пуассона, равен У т, где т — математическое ожидание числа частиц. Таким образом, средняя квадратичная флуктуация равна корню квадратному из среднего числа частиц. Основной интерес представляет относительная средняя квадратичная флуктуация, т. е. отношение средней квадратичной флуктуации к среднему значению физической величины. В § 21 мы назвали эту характеристику вариацией. Из предыдущего следует, что относительная средняя квадратичная флуктуация равна г_ш __ *_ B.78) т Кт Таким образом, средняя квадратичная флуктуация тем меньше, чем больше число рассматриваемых частиц. Именно вследствие того, что на практике обычно имеют дело с объемами газа, среднее число частиц в которых очень велико, происходящие относительные случайные флуктуации плотности, давления, температуры и других характеристик ничтожно малы, почти не наблюдаемы. Задача 50. В заполняющем пространстве газе, находящемся в нормальных условиях, мысленно выделены два кубических объема со сторонами 1 см и 10 миллимикрон. Определить относительные средние квадратичные случайные флуктуации плотности в этих объемах. Решение. Среднее число молекул газа в 1 см3 при нормальных условиях (р = 760 мм рт. ст. Т = 0 °С) равно 2,687 *1019, а в кубе со стороной 10 миллимикрон — 26,87. Следовательно, согласно B.78) относительные средние квадратичные флуктуации чисел молекул в этих объемах соответственно равны /2,687- 101У --4=^0,1929. У 26,87
94 СЛУЧАЙНАЯ ВЕЛИЧИНА {ГЛ. 2 Так как плотность в данном объеме пропорциональна числу молекул в этом объеме, то относительные среднеквадратичные флуктуации плотности в рассмотренных объемах равны соответственно тем же числам 1,929-100 и 0,1929. Задача 51. Бесконечное пространство равномерно заполнено непрерывно распределенной светящейся материей, единица объема которой излучает г\ единиц энергии в единичном телесном угле в единицу времени. В этом же пространств равномерно с естественными флуктуациями распределены темные облака с коэффициентом прозрачности д (коэффициентом прозрачности облака называется отношение энергии вышедшего из блока излучения к энергии вошедшего излучения). Вероятность встретить темное облако на пути й$ равна к Аз. Определить распределение поверхностной яркости X, наблюдаемое из произвольной точки О пространства. Решение (метод В. А. Амбарцумяна). Рассмотрим некоторое произвольное направление из точки наблюдения О (рис. 9). Вероятность пронаблюдать в этом направлении поверхностную яркость, не превышающую х, равна Р (х). Рассмотрим точку О', отстоящую от точки О на Аз Рис. 9. Д$ в направлении наблюдения. Так как физические условия в точке О' совершенно такие же, как и в точке О, то вероятность пронаблюдать из точки О' в том же направлении поверхностную яркость, не превосходящую х, также равна Р (х). Наблюдения из точек О и О' не независимы. Для того чтобы поверхностная яркость при наблюдении из точки О не превосходила х, необходимо, чтобы произошло одно их двух следующих не совместных событий. 1) Наблюдаемая поверхностная яркость из точки О' не превосходит х — т]Д$, а между точками О и О' нет темной туманности. Тогда яркость к точке О возрастет на г|Д$ и не будет превосходить х. Согласно теореме
§ 25] ФЛУКТУАЦИИ ФИЗИЧЕСКИХ ВЕЛИЧИН 95 умножения вероятность этого события равна Р (х — т)Д$) A — хД$). 2) Наблюдаемая из точки О' поверхностная яркость не превосходит х/д, а между точками О и О' имеется темная туманность. Тогда на пути Д$ поверхностная яркость ослабеет в д раз и при наблюдении из точки О не будет превосходить х. Вероятность события 2) равна 1т) События 1) и 2) несовместны, вероятность, что произойдет одно из них, равна сумме их вероятностей, и это равно вероятности того, что поверхностная яркость, наблюдаемая из точки О, не превзойдет х. Следовательно, можно написать уравнение Р(х- т|Д*)A - хД$) + Р — X Считая Д$ сколько угодно малым, разлагая Р (х — т]Д$) в ряд Тэйлора и пренебрегая членами второго и более высокого порядка малости относительно Д$ (мы это уже делали, пренебрегая увеличением излучения за счет светлой материи в вероятности события 2)), находим после элементарных упрощений уравнение для искомой функции Р (х) ч\Р' (х) + хР (х) — кР (—) = 0. Решать это функционально-дифференциальное уравнение сложно. Если продифференцировать его по х, то получим уравнение для плотности вероятностей / (х), которое решать также сложно. Покажем, что легко найти, используя это уравнение, соотношение между моментами функции распределения Р (х). Помножим для этого каждый член уравнения на хп Ах и проинтегрируем по всем возможным поверхностным яркостям, т. е. от 0 до -)0'
96 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 Так как о пу (х) их = х71} (х) °° — п \ хп~Ч (х) их = — п»п„и ° о ^ я \ я то получаем рекуррентное соотношение между начальными моментами V -- В частности, положив я = 1 и п = 2, находим 2Т) VI откуда получаем что дает зависимость между дисперсией и математическим ожиданием случайной величины с функцией распределения Р (х). § 26. Нормальный закон распределения В теории вероятностей и ее приложениях важную роль играет дифференциальный закон распределения случайной величины X, имеющий вид Ф(*) = Ае-ь**-ъ\ B.79) Этот закон распределения называется нормальным, а соответствующая плотность — нормальной функцией. Из условия нормировки оо с» 1 = [ ц>{х)<1х = ~ [ е~1гй1 B.80)
26] НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ 97 находим А = B.81) так как интеграл в правой части B.80) есть интеграл Пуассона, равный У п. Рис. 10. Математическое ожидание случайной величины X с плотностью ср (х) оказывается равным оо B.82) а дисперсия Ь)'^=^г- B-83) Равенства B.81) — B.83) позволяют записать нормальный закон распределения в каноническом виде (х) = т=- е К } а 1^2я B.84) Нормальную функцию называют также гауссианой. График нормальной функции'приведен на рис. 10. Соответствующий интегральный закон распределения имеет следующий вид: = =. ^ с B.85) 4 Т. А. Агекян
98 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 Как показывает B.84), нормальная функция симметрична относительно прямой х = X, имеет максимум в точке х = X и монотонно убывает при возрастании | х — X |, асимптотически приближаясь к нулю. Случайную величину, плотность вероятности которой есть нормальная функция, называют нормально распределенной случайной величиной. Если плотность вероятности X имеет вид B.84), а случайная величина Ъ есть Ъ = аХ, то, применяя правило нахождения плотности вероятности функции, получим = ср (х) их — — е (г-аХ)* 2а8°2 йг. Таким образом, плотность вероятности Ъ также есть нормальная функция со стандартом, равным ав, и средним значением Ъ = аХ. Если плотность вероятности X имеет вид B.84), то плотность вероятности случайной величины л. Х-Х B.86) Таблица 1 1 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1|2 1,3 1,4 /@ 0,39894 0,39695 0,39104 0,38139 0,36827 0,35207 0,33322 0,31225 0,28969 0,26609 0,24197 0,21785 0,19419 0,17137 0,14973 1 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 /@ 0,12952 0,11092 0,09405 0,07895 0,06562 0,05399 0,04398 0,03547 0,02833 0,02239 0,01753 0,01358 0,01042 0,007915 0,095953 г 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 АО 0,004432 0,003267 0,002384 0,001723 0,001232 0,000873 0,000612 0,000425 0,000292 0,000199 0,000134 0,000089 0,000059 0,000039 0,000025
27] АСИММЕТРИЯ И ЭКСЦЕСС РАСПРЕДЕЛЕНИЙ 99 записывается так: Л. B.87) т. е. является нормальной функцией со средним, равным нулю, и дисперсией, равной единице. В таблице 1 даны значения функции B.87) для различных значений аргумента. Используя зависимость B.86), можно по таблице 1 найти плотность вероятности и для любого значения х, когда известны его среднее X и дисперсия а. § 27. Асимметрия и эксцесс распределения Напишем выражение для центрального момента к-то порядка нормальной функции и применим к интегралу формулу интегрирования по частям: (х-Х)* Результат показывает, что для нормального распределения справедлива рекуррентная формула \1к = (к-1)а*\1к-2. B.88) Если к нечетно, то применение формулы B.88) после- к — 1 довательно —~— раз приведет правую часть равенства к произведению, содержащему множитель \1Х, который, как было показано, (B.54)) всегда равен нулю. Следовательно, все нечетные центральные моменты нормальной функции равны нулю. Этот результат очевиден, так как нормальная функция является четной по отношению к аргументу (х — X). У всякого распределения, симметричного по отношению к некоторому значению х (это значение х равно X), все нечетные центральные моменты равны нулю. 4*
100 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 Близость к нулю нечетных центральных моментов можно рассматривать как критерий симметричности распределения. Обычно используют центральный момент третьего порядка как самый низкий (простой) из нечетных моментов (не считая |лх, который равен нулю для любых распределений). Чтобы величина, являющаяся критерием асимметрии, была безразмерной, рассматривают отношение И'з к ц2': Аз = -^. B.89) Чем больше Аз по абсолютной величине, тем более несимметричным можно считать распределение. Однако этот Рис. 11. критерий не является строгим, так как равенство нулю Аз является необходимым для симметричности распределения, но не является достаточным условием. ОС Значение Хт, при котором плотность вероятности X имеет максимум, называется модой случайной величины X. Основное значение для практики имеют случайные величины с одной модой. Такие распределения случайных величин называются одновершинными.
§ 27] АСИММЕТРИЯ Й ЭКСЦЕСС РАСПРЕДЕЛЕНИЯ Ш Если плотность вероятности случайной величины симметрична относительно некоторого значения случайной величины, то это значение случайной величины совпадает с ее математическим ожиданием и, у одновершинного распределения, с модой. Если же распределение не симметрично, то в общем случае мода Хт и математическое ожидание X случайной величины различны (рис. 11 и рис. 12). Если асимметрия распределения случайной величины (и, следовательно, центральный момент третьего порядка) положительна, то мода случайной величины меньше ее математического ожидания (см. рис. 11). При* отрицательной асимметрии мода случайной величины больше ее математического ожидания. Мерой асимметрии может также служить отношение Если к является четным числом, то, применяя формулу B.88) к/2 раз, получим для нормального распределения соотношение 1лк = (к - 1)!! аК B.90) В частности, \ц = За4. B.91) Следовательно, безразмерная величина Ех = -^ - 3 B.92) для нормального распределения равна нулю. В общем же случае эта величина, называемая эксцессом, отлична от нуля. Нормальная функция в теории вероятностей и математической статистике играет роль некоторой стандартной функции, с которой уместно сравнивать другие функции распределения, определять, насколько эти функции отличаются от нормальной функции. Асимметрия B.89) и эксцесс B.92) являются двумя важнейшими показателями отличия функции распределения от нормальной. Задача 52. Определить асимметрию и эксцесс распределения Пуассона.
102 СЛУЧАЙНАЯ ВЕЛИЧИНА 1ГЛ. 2 Решение. Напишем полученное для распределения Пуассона равенство B.69) при значениях $ = 1, 2, 3, 4: Мха == а, М(т2 —ш) = аа, B.93) М (т3 - Зт2 + 2т) = а3, М (т4 — 6т3 + 11т2 — 6т) = а4. Используя обозначение ук = Мгпк для начальных моментов и решая систему B.93) относительно них, получаем VI = а, ^2 = а2 + а, Vз = а^+ За2 + а, B.94) V* = а4 + 6а8.+ 7а2 + а. Применяя теперь формулы B.65) — B.67) связи между моментами относительно разных начал (которые, разумеется, верны и для начальных моментов), получаем ^2 = а, B.95) 1х3 = а, B.96) |14 = а + За2. B.97) Выражение B.95) было уже получено ранее. Равенство B.96) позволяет получить асимметрию распределения Пуассона А8=4г = ^. B-98) а равенство B.97) — его эксцесс Ех =.- а+23а2 - 3 = ±-. B.99) Таким образом, если математическое ожидание случайной величины, распределенной согласно закону Пуассона, мало, то асимметрия и эксцесс распределения велики, распределение сильно отличается от нормального. Если математическое ожидание случайной величины велико, то асимметрия и эксцесс распределения Пуассона малы, оно
§ 28] ХАРАКТЕРИСТИЧЕСКАЯ ФУНКЦИЯ ЮЗ близко к нормальному распределению. Так как асимметрия положительна, то в распределении Пуассона мода случайной величины всегда меньше ее математического ожидания. § 28. Характеристическая функция случайной величины Характеристической функцией случайной величины X называется математическое ожидание случайной величины еих: B.100) Выполняемая согласно B.100) операция с функцией / (х), в результате чего получается функция Ф (г), называется преобразованием Фурье функции / (#). Таким образом, характеристическая функция есть результат преобразования Фурье плотности вероятности случайной величины. В теории функций комплексного переменного доказывается, что функция Ф (*) также однозначно определяет функцию / (х) при помощи преобразования B.101) которое называется обратным преобразованием Фурье. Рассмотрим к-ю производную характеристической функции «Vх/(*)<&• B.102) Для того чтобы выполненное дифференцирование к раз интеграла по параметру I было законным, достаточно, чтобы "несобственный интеграл в B.102)^был ограничен. А для этого достаточно, чтобы у случайной величины существовал абсолютный начальный момент /с-го порядка: М\Хк\ = \ |х\к((х)их. B.103)
104 СЛУЧАЙНАЯ ВЕЛИЧИНА ГЛ. 2 В самом деле, тогда и интеграл B.102) ограничен. Положим теперь в равенстве B.102) I = 0: оо ф№) @) = г* ^ **/ (х) йх = 1*ук. B.104) —со Таким образом, ук = МХ* = Г*Ф<*> @). B.105) Чтобы получить начальный момент к-то порядка случайной величины, достаточно помножить на ъ~к к-ю производную характеристической функцшэГпри значении аргумента, равном нулю. ' Г^Г"'.'" Задача 53. Найти- характеристическую^, функцию нормально распределенной случайной величины. Решение. Согласно определению характеристическая функция равна с У 2л О ФО Выполняя подстановку г = -^ Ив и используя интеграл Пуассона, получаем фA) = е ~~т°\ B.106) Согласно правилу B.105) найдем, например, начальный момент третьего порядка: г3 = Г8 {{A1 — б203 — 3 (г! — б^) б2] б 2 }/=0 = Это соотношение можно получить и непосредственным вычислением момента. Задача 54. Найти характеристическую функцию распределения Пуассона.
29] ИНТЕГРАЛЬНОЕ ПРЕДСТАВЛЕНИЕ ДЕЛЬТА-ФУНКЦИИ Ю5 Р е ш е_н и е. Находим т=«0 е-ае*°и 2 -1-(ае1()те-««<' = <*<«"-!>. B.107) т=о Определим начальный момент второго порядка, для чего используем B.105): г2 *= Г2 [— си?1' (аеа + 1) &**{г~%=о = а2 г2 *= Г2 [— си?1' (аеа + 1) &**{~%=о = а2 + а. Этот результат уже встречался (B.94)). 3 ад а ч а 55. Найти, ^характеристическую функцию биномиального распределения. Решение. Согласно определению Ф(I) = 2 ^'\|(ВП1И)| Ртодга-т = (/*" + 9)п. B.108) т=о ^ ' Начальный момент второго порядка равен у2 = Г2 [(ре« + дПЕо = (прJ + прд. Согласно B.68) дисперсия биномиального распределения 02 = (прJ + прд _ (л/?J = прь B.109) § 29. Интегральное представление дельта-функции Используя метод характеристических функций, найдем интегральное представление дельта-функции. Подставим B.100) в B.101): оо {^\ ]$. B.110)
106 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 Сравнивая B.38) и B.110), приходим к формальному равенству оо Щх) I т. е. Выражение B.111) является интегральным представлением дельта-функции. Рассмотрим теперь интеграл Ь{х-хй)йх, B.112) который, очевидно, равен 1, если | х0 \ <а, и равен 0 в противоположном случае. Используя интегральное представление дельта-функции, этот интеграл можно написать в виде О ОС -^-\ их \ *«( —а — оо оо и, = у- \ е11х* й1 \ (соз 1х + г 8Ш 1х) их = с-их. $ Я ) I — ОО Таким образом, интеграл Щ^-е-^осН B.113) —оо равен 1, если | я0 | <а, и равен 0 в противоположном случае.
§ 30] ИНТЕГРАЛ ВЕРОЯТНОСТЕЙ 107 § 30. Интеграл вероятностей Определим вероятность того, что нормально распределенная случайная величина X примет значение, заключенное между X —а и 1+а, где а — некоторая положительная величина, (х—Х)* е 2а' Ох. B.114) 2я = С : а у 2я Х-а Перейдем к новой переменной интегрирования и учтя свойство интеграла от четной функции, напишем B.114) в виде а/о 1 Р(^-а<Х<Х + а)= у — ^ е~~ <И. B.115 О Правая часть B.115) есть функция верхнего предела интеграла. Эта функция в 2 йь B.116) о играет важную роль в теории вероятностей и называется интегралом вероятностей. Мы видим, что если *--?-, B-117) то 1|) {г) дает вероятность того, что отклонение случайной величины, распределенной по нормальному закону, от своего среднего значения по модулю не превзойдет а. Интеграл вероятностей не выражается в конечном виде через элементарные функции. Для него составлены таблицы (см., например, Л. Н. Большев, Н. В. Смирнов, Таблицы математической статистики, Москва, Вычислительный центр АН СССР, 1968). Прилагаемая крат-
108 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 кая таблица 2 интеграла вероятностей показывает, что вероятность того, что случайная величина, распределенная нормально, отклонится от своего среднего значения не более чем на а, равна 0,68269; не более чем на 2а — 0,95450; не более чем на За — 0,99730; ге более чем на Таблица 2 Значение интеграла вероятностей 2 .-т' д.% 2 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 12 1,3 1,4 1,5 1,6 ф(г) 0,00000 0,07966 0,15852 0,23582 0,31084 0,38292 0,45149 0,51607 0,57629 0,63188 0,68269 0,72867 0,76986 0,80640 0,83849 0,86639 0,89040 2 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2> 2,8 2,9 3,0 3,1 3,2 3,3 ФB) 0,91087 0,92814 0,94257 0,95450 0,96427 0,97219 0,97855 0,98360 0,98758 0,99068 0,99307 0,99489 0,99627 0,99730 0,99806 0,998626 0,999033 2 3,4:" 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 •4,8 4,9 5,0 фB) 0,,999326 0,999535 0,999682 0,999784 0,999855 0,9999038 0,9999367 0,9999587 0,9999733 0,9999829 0,9999892 0,99999320 0,99999578 0,99999740 0,99999841 0,999999042 0,999999427 4а — 0,9999367. Таким образом, вероятность отклонений, больших 2а, уже сравнительно мала, вероятность отклонений, больших За, очень мала, больших 4а — ничтожно мала, порядка 7 • 10~5. § 31. Теорема Муавра — Лапласа При рассмотрении числа т появлений события А в п испытаниях обычно бывает нужно найти вероятность того, что это число заключено между некоторыми значениями а и Ъ. Если п велико и промежуток [а, Ъ] содержит
§ 31] ТКОРБМА МУАВРА - ЛАПЛАСА 109 большое число единиц, то непосредственное использование биномиального распределения. рп (т) = —Т7^ где 0 <С 68 <С Т9~ • 1^РИ больших 5 величина 08 очень мала, и 1 А8 требует громоздких вычислений; нужно суммировать большое число определенных по этой формуле вероятностей. Поэтому целесообразно получить асимптотическое выражение для биномиального распределения при условии, что р фиксировано, а/г->оо. Теорема Муавра — Лапласа утверждает, что таким асимптотическим выражением для биномиального распределения является нормальная функция Используем для доказательства известную в анализе формулу Стирлинга 1 А8 приближенная формула Стирлинга, записанная в простом виде, 5!= /2зйЛ-*, B.119) дает малую относительную ошибку, быстро стремящуюся к нулю, когда $->оа. Нас будут интересовать значения т, не очень сильно отличающиеся от наивероятнейшего. Тогда, при фиксированном р, условие п ->• оо будет также означать, что т-> оо, п — т -> оо B.120) (в отличие от распределения Пуассона, где предполагалось, что р -> 0, а т конечно). Поэтому использование формулы Стирлинга B.119) для замены факториалов в биномиальном распределении допустимо, и мы получим Используем также введенное ранее (B.12)) отклонение относительной частоты от наивероятнейшего значения хт = ^-р B.122)
НО СЛУЧАЙНАЯ ВЕЛИЧИНА |ГЛ. 2 и запишем B.121) в виде рп (т) = [2лп (р + хт) (д - хт)]~^ х +^) \1-т) ■ BЛ23) Предположим, что хш <рд, B.124) и, взяв логарифм произведения второго и третьего множителей в правой части B.123), применим разложение в ряд Тэйлора: Расположим члены этого разложения по степеням х Предположим теперь, что при п -> оо пх3т-+0. B.126) Это условие означает, как уже было предположено выше, что рассматриваются значения т, не очень далекие от на- ивероятнейшего. Очевидно, что B.126) обеспечивает и выполнение B.124), а также B.120). Пренебрегая в B.125) вторым и следующим членами, найдем, что логарифм произведения второго и третьего множителей в B.123) равен - -А- Х2т. Отбрасывая также малые слагаемые в скобках первого множителя B.123), получим _ /_„\ ___ * _ 2Р<7 /О Л О*7\ рп (т) ^^— д . (^.1^/) ■ у2ппрд
§31] ТЕОРЕМА МУАВРА — ЛАПЛАСА Ш напишем B.123) в виде B.128) где ф (х) — нормальная функция. Поскольку в интервале [тп, т + 1) имеется только одно целое число —т, то можно сказать, что рп (т) есть вероятность того, что т попадает в промежуток [т, т + 1)- Из B.122) следует, что изменению т на единицу соответствует изменение хт на А*=~. B.130) Поэтому вероятность попадания т в интервал [т, т + I) равна вероятности попадания хт в промежуток [хт, хт + Ах): Р (хт < *т <хт + Ах) = у {хт) Ах. B.131) Когда п -> оо, Ах-*-0, и равенство B.131) показывает, что нормальная функция ф (х) является плотностью вероятности случайной переменной хт. Итак, если п -*~ оо п пх3 -> 0, то для отклонения относительной частоты от наивероятнейшего значения справедлива асимптотическая формула B.131), в которой ф (х) — нормальная функция с Хт = 0 и б2 = — . Доказанная теорема позволяет решить задачу, упомянутую в начале этого параграфа. Если требуется определить вероятность того, что при п испытаниях число появлений т события А будет заключено между а и 6, то находим <х2 Р(а<т<Ь) = Р(а1<Схт <си) = С ГАс, у АТС B.132)
112 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 где 1 П г' 2 п Р* В частности, если а2 = —а\ = а, то Р (рп — ап < т < рп + агг) = = ?(-а<«т< + а) = ^у) , B.133) где г|) (•) — интеграл вероятностей. В заключение раскроем смысл условия B.126). Оно гарантирует, что полученное представление B.127) является достаточно точным, если рассматриваются значения "' 7Г. B.134) где а достаточно мало в сравнении с единицей. Разделив B.134) на B.128), получим 1 3 Если, например р = —, ^ — —, а а = 0,01, то при п = 106 получаем: -2- <^ 4,97. Это показывает, что условие B.134) не выполняется только для тех значений хт, для которых плотность вероятности очень мала. Задача 56. Наблюдая Солнце в период 1880— 1896 гг., И. Сикора обнаружил на восточном краю Солнца 7024 протуберанцев, а на западном краю 6614 протуберанцев. Какова вероятность того, что преобладание числа протуберанцев на восточном краю Солнца есть дело случая? Решение. Предположим, что вероятности появления протуберанцев на восточном и западном краях Солнца равны. Следовательно, вероятность того, что появившийся протуберанец окажется на восточном краю Солнца, р = 1/2. Общее число наблюденных протуберанцев следует рассматривать как число испытаний, а число т = = 7024 — как число появлений события А. Случайная
§Л31] ТЕОРЕМА МУАВРА — ЛАПЛАСА ИЗ величины х — отклонение относительной частоты от наи- вероятнейшего значения,— оказалась равной Стандарт случайной величины, определяемой по формуле B.128), равен - 1/ _2__2_ = 0 3638 Следовательно, вероятность того, что преобладание числа протуберанцев на восточном краю Солнца над ожидавшимся числом такое, как наблюдалось, или меньше, согласно B.133) и таблице 2, равна А вероятность того, что отклонение будет таким, какое наблюдалось, или большим, равна 1—0,999543 = 0,000457. Именно эта величина, вероятность того, что отклонение, вызванное случайностью, будет равно наблюдаемому или больше его, показывает, имеются ли основания объяснять наблюдаемое явление как случайное отклонение. В данной задаче малая величина вероятности 0,000457 показывает, что не случайность, а другое обстоятельство вызвало преобладание числа протуберанцев на восточном краю Солнца. Как впоследствии выяснилось, причиной была личная ошибка Сикоры, который более уверенно обнаруживал протуберанцы на восточном краю диска Солнца, чем на западном. 3 а д а ч а 57. Частица совершает случайные блуждания в одном измерении. С вероятностью р она совершает шаг в положительном направлении и с вероятностью д = 1 — р — шаг в отрицательном направлении. Найти вероятность того, что после п шагов (/г^>1) частица будет обнаружена в промежутке [у, у -\- йу]. Длина каждого шага равна /. Решение. Вероятность того, что частица сделает т шагов в положительном направлении, дается выражением B.118). Так как п велико, для отклонения относи-
114 СЛУЧАЙНАЯ ВЕЛИЧИНА 1ГЛ. 2 тельной частоты хт — р можно использовать нормальное распределение. Величина V (положение частицы после п шагов) определяется равенством У = Bт - п) I Поэтому находим Р(У < У <'У + *У) х* 1 ( 1 1 \2 = е йх= в а У 2л 2п1а У 2п где а2 = — . Задача 58. Электростанция дает ток заводу и используется для электрификации села. Если при работающем конвейере завода в селе окажутся зажженными 350 стандартных электролампочек, то напряжение настолько понизится, что конвейер остановится. Эмпирически установлено, что в наиболее загруженные вечерние часы в среднем за много дней каждая лампочка горит 0,7 всего времени, при значительной длительности одного горения. Сколько стандартных электролампочек можно подключить в домах, чтобы вероятность остановки завода в течение одного вечера не превосходила 10~4? Решение. Обозначим искомую величину — число стандартных лампочек, которые можно подключить,— через п. Тогда, поскольку одновременное горение 350 лампочек уже не допускается, границей допустимого положительного отклонения относительной частоты от наи- вероятнейшего значения является а==^_0,7. B.136) Необходимо, чтобы вероятность такого или большего положительного отклонения не превосходила 10~4. Это будет выполнено, если вероятность того, что модуль отклонения больше или равен а, будет равна 2-10. Следова-
32] МЕРА НЕОПРЕДЕЛЕННОСТИ СИСТЕМЫ СОБЫТИЙ Ц5 тзльно, ^(-~) =0,9998. В таблице 2 отсюда находим, что — = 3,72 С другой стороны, согласно B.128) у Получаем квадратное относительно п~^2 уравнение: Решение его л = 449. Итак, можно подключить 449 лампочек. § 32. Мера неопределенности полной системы событий Пусть задана полная система событий Л Аи А2, . . ., Ап. B.137) Соответствующие этим событиям вероятности Р(А1)9 Р(А2), ..., Р(Ап). B.138) Полагая, что /г > 2, рассмотрим три частных случая: 1) Р {Ах) = 0,99 и, следовательно, вероятность каждого из остальных событий мала. 2) Р (А^ = 0,49, Р (А2) = 0,49 и, следовательно, вероятность каждого из остальных событий мала. 3) Вероятности всех событий сравнимы между собой. В случае 1) можно достаточно уверенно предсказать, что, по-видимому, произойдет событие Ах. В случае 2) предсказание будет менее определенным — произойдет, по-видимому, либо событие Аг либо событие А2. В случае 3) предсказать что-либо трудно. Можно сказать, что в случае 2) система событий более неопределенна, чем в случае 1), а в случае 3) более неопределенна, чем в случае 2). Чтобы ввести количественную меру неопределенности полной системы событий, естественно считать, что каждое событие вносит вклад в эту величину; при этом событие, вероятность которого близка к единице, должно вносить
116 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 малый вклад в меру неопределенности системы, так как относительно этого события с большой степенью уверенности можно считать, что оно случится. Точно**так же малый вклад в меру неопределенности должно вносить событие, вероятность которого очень мала, так как с большой степенью уверенности можно предсказать, что это событие не случится. Наоборот, вклад в меру неопределенности события, вероятность которого заметно отлична и от 0 и "от 1, существенна, так как трудно предвидеть, произойдет это событие или не произойдет. Основываясь на этих соображениях, уместно за меру неопределенности системы событий Л принять величину =-2' (Аг) Ьг Р D) B.139) (о выборе основания логарифма будет сказано чуть позднее). Тогда 1-е событие системы вносит в меру неопределенности вклад, равный члену -Р(АгIошР(Аг). B.140) Этот член всегда положителен. Он стремится к нулю, когда Р (Аг) ->•1 и когда Р (Аг) -»■ 0. Следовательно, равна нулю мера неопределенности системы событий, у которой вероятность какого-то события равна 1, а вероятности всех остальных событий равны 0. Только при таком распределении вероятностей событий мера неопределенности системы событий равна нулю. И это есть минимальное значение меры неопределенности, так как при любом ином распределении вероятностей событий мера неопределенности,^складывающаяся]Гиз положительных слагаемых, положительна. ' "* Щч#*;<- Выясним, при каком распределении вероятностей мера неопределенности полной системы событий, состоящей из п событий, максимальна. Необходимо найти максимум выражения B.139) при очевидном условии 2^(Л) = 1- B-141) 1=1
§ 32] МЕРА НЕОПРЕДЕЛЕННОСТИ СИСТЕМЫ СОБЫТИЙ Ц7 Согласно правилу нахождения условного экстремума составим функцию Лагранжа, п п I* = - 2 Р Ш Ьг Р D) +1^Р (Д), B.142) г=1 1=1 где X — неопределенный коэффициент, и приравняем нулю все ее частные производные по Р (Аг). - 1о? Р( Аг) - 1 + * = 0, * = 1, 2, . . ., п. B.143) Равенства B.143) показывают, что значения Р {Аг) не зависят от г, т. е. все Р (Аг) равны между собой и, следовательно, 4~' * = 1.2,...,п. B.144) Таким образом, при фиксированном п наибольшую меру неопределенности имеет система событий, в которой вероятности всех событий одинаковы. Поставляя B.144) в B.139), находим, что мера неопределенности полной системы событий в этом случае равна Я (.4) = 1<>8 п. B.145) Чем больше число событий в системе, тем больше мера неопределенности этой системы при ее максимальном значении, когда все события равновероятны. Выберем единицу меры неопределенности полной системы событий. Наименьшее число событий в полной системе событий — 2. Целесообразно за единицу меры неопределенности принять максимальную меру неопределенности, которую может иметь полная система событий, состоящая из двух событий. Равенство B.145) показывает, что когда основанием логарифмов в выражении B.139) принято число 2, Я {Л) в этом случае равно 1. Таким образом, хотя в принципе основанием логарифмов в выражении B.139) можно взять любое число, большее 1, целесообразно в связи с выбором единицы меры неопределенности принять его равным 2. Задача 59. В первой урне находится 2 белых, 3 черных и 4 красных1 шара, а во второй урне — 8 белых, 2 черных, 1 красный и 1 зеленый шар. Событие состоит в извлечении шара данного цвета из урны. Определить,
118 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 какая из полных систем событий имеет большую меру неопределенности. Решение. Для полной системы событий при извлечении шаров из первой урны находим Для второй полной системы событий Таким образом, хотя в первой системе число событий меньше, мера неопределенности ее оказалась больше. Выражение B.139) для меры неопределенности полной системы событий по структуре совпадает с выражением для энтропии физических систем. Если объем физической системы мысленно разбит на элементарные объемы и вероятность состояния, в котором находится г-й элементарный объем, равна р (Аг), то выражение B.139) определяет энтропию физической системы. Энтропия характеризует меру хаоса, меру неупорядоченности физической системы. В этом понятии можно усмотреть определенную аналогию с мерой неопределенности полной системы событий. Поэтому часто наряду с выражаением «мера неоопределенности» употребляю выражение «энтропия полной системы событий». § 33. Количество информации Пусть Л и & — две полные системы событий Л Л Л Л1» Л2| • • '• лп И 2?ь В2, . . ., Вт. Их меры неопределенности соответственно равны {=1 т ЯC3)=- %Р(В,)]оВР(В}). 3=1
§ :*3] КОЛИЧЕСТВО ИНФОРМАЦИИ 119 Рассмотрим полную систему событий, составленную из попарных произведений событий систем А и 33 АгВъ АгВ2, . . ., АпВт. B.146) Ее энтропия равна т п = - 2 2 р ИАIо? Р(А1В>У B-147) *=1 1=1 Используя теорему умножения вероятностей и оче- видное равенство 2 Р № I ^г) = 1» напишем 7=1 т п Н (АЩ =-22^ (^0 Р № I 4) 1о* [Р Ш Р (В, | А,)] - п т = - 2 РШ1оё Р (А{) 2 Р(ВАА) - г=1 5=1 п т - 2 г=1 = Н (А) + 2 г=1 | Аг) будем называть условной энтропией системы А /г/?и условии Положим Я (Ж | Л) = 2 р (л0 я (^ | ^), B.149) и назовем эту величину условной энтропией системы В относительно системы А. Равенство B.149) показывает, что Н C3 \ А) имеет смысл математического ожидания условной энтропии системы 33 при условии осуществления событий из системы А. Из B.148) вытекает, что Я (АЗЗ) = Н (А) + Я E9 | А), B.150) и аналогично можно получить Я {.А®) = Н C3) + Я (.А | 33). B.151)
120 СЛУЧАЙНАЯ ВЕЛИЧИНА 1ГЛ. 2 Пусть полные системы событий Л и ЗИ заданы. Определим условие для полной системы событий </Ш, при котором Н (А3$) максимально. Для этого, имея в виду справедливость равенств ) = Р (Аг), 2 Р №,) = Р (В,), напишем B.147) в форме = - 2 2Р{А&) 1о8 рР.^р}в)+Н(Л) + Н(Д). B.152) В выражении B.152) переменными являются величины Р (АгВ^9 для которых должно удовлетворяться условие т п 2 2^ №)) = 1. B.153) 3=1 г=1 Число этих переменных равно пт. Для того чтобы найти максимум Н (АШ), нужно составить функцию Лагранжа Р(АВ) Ш П д=1 г=1 ^^ *; ^^ У ;=1 г=1 B.154) и приравнять нулю все ее частные производные по {^ имея при этом в виду, что Р (Аг) и Р (В;) фиксированы. Находим, что г = 1, 2,..., /г, ;= 1, 2,..., т. Уравнений в B.155) будет всего пт. Они показывают, что величина фигурирующей в них под знаком логарифма дроби не зависит от значков ъ и /. Следовательно, максимум Н (е/Ш) достигается, когда выполняется условие = сР (А() Р (БД. B.156)
§ 331 КОЛИЧЕСТВО ИНФОРМАЦИИ 121 Просуммировав B.156) по всем ъ и /, найдем, что с = 1. Итак, Р (АгВ}) = Р(А{)Р (В,), B.157) т. е. Н (АЗЗ) максимально, когда системы ^иЖ взаимно независимы. В этом случае, как показывает B.152), Я (ЛЗЗ) = Я (.Л) + Я C3) B.158) и, следовательно, согласно B.150) Я C3 \Л) = Я (Ж). B.159) В общем же случае, когда не известно, являются ли системы Л и 33 взаимно независимыми, справедливо неравенство Н C3 \Л)^Н C3). B.160) Если полные системы событий Л и 53 однозначно определяют друг друга, т. е. если условная вероятность события В$ при условии Аг равна 1, а все Р (В; \ Аг) = 0 при / Ф г, то Н{ЗВ\А) =- %Р(В!\Ай1оеР(В5\А{) = 0. B.161) На основании B.149), в этом случае и Я C3 | Л) = 0, B.162) и, следовательно, Я (./ЙВ) = Я (Л!). B.163) Таким образом, поскольку Н C3 \ А) отрицательным быть не может, в общем случае 0 < Я E3 М)< Я C3). B.164) Информацией называется изменение меры неопределенности (энтропии) системы событий. Если, например, стало известно, что произошло событие А^ то количество информации?для системы 33 равно / C3, Аг) = Я C3) - Я C3 | Аг). B.165) Как показывает B.165), информация считается положительной, если мера неопределенности системы уменьшилась.
122 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 В общем случае, когда становится известным, что произошло событие А{, энтропия системы 52 может и уменьшиться, и увеличиться, следовательно, количество информации при этом может быть и положительным, и отрицательным. Математическое ожидание количества информации для системы 53, когда становится известным, что произошло какое-то событие системы Л, равно аг)- B.166) / E3, А) называют также средним количеством информации, содержащимся в системе А, о системе 53. Докажем, что всегда / E3, А) > 0. B.167) Подставив B.165) в B.166) и учитывая B.149), находим, что / E3, Л) = Я E3) - Я E3 | А). B.168) Сложив B.150) и B.168), напишем выражение для среднего количество информации в виде / E3, Л) = Н(Л) + Я E3) - Я (^53). B.169) Как было показано выше, максимальное значение Я (АШ) равно Я (Л) -\-Н C8). Таким образом, утверждение B.167) доказано, среднее количество информации, содержащейся в одной полной системе событий о другой полной системе событий, всегда неотрицательно. Если системы событий взаимно независимы, количество информации, содержащейся в одной из них о другой, равно нулю. Если же системы зависимы, то это количество информации положительно. Симметричность выражения B.169) относительно А и 53 показывает, что среднее количество информации, содержащейся в А о 53, равно среднему количеству информации, содержащейся в 53 о А. Задача 60. Среди слабых голубых звездообразных объектов, наблюдаемых в высоких галактических широтах, 47% являются звездами — белыми карликами, 23% — звездами — субкарликами и 30% — звездопо- добными галактиками. Для выяснения природы объектов
33] КОЛИЧЕСТВО ИНФОРМАЦИИ 123 измеряют их собственное движение или измеряют ультрафиолетовый избыток излучения в спектре. Если объект — белый карлик, то после измерения его собственного движения он с вероятностью 0,68 отождествляется с белым карликом, с вероятностью 0,24 — с субкарликом и с вероятностью 0,08 — с галактикой. Ошибочные отождествления могут происходить из-за ошибок измерений и наличия дисперсии характеристик у объектов данного типа. Если объект — субкарлик, то после измерения собственного движения соответствующие вероятности отождеств- влений равны 0,3, 0,64, 0,06, а если объект — галактика,- 0,13, 0,11, 0,86. После измерения избытка ультрафиолетового излучения, если объект — белый карлик, соответствующие вероятности отождествлений равны 0,6, 0,12, 0,28, если объект — субкарлик,— 0,15, 0,74, 0,11, если галактика, - 0,13, 0,25, 0,62. Определить, какое измерение — собственного движения или ультрафиолетового избытка — содержит в среднем больше информации о природе слабых голубых объектов. Решение. Вычисления удобно производить при помощи формулы B.169). Обозначим Аи А2, А3 события, состоящие в том, что до выполнения измерений слабый голубой объект есть соответственно белый карлик, субкарлик, звездоподобная галактика, а Въ В%, В3 — соответствующие гипотезы после выполнения измерения собственного движения. Тогда Р (Аг) = 0,47, Р (А2) = 0,23, Р (А3) = 0,30. Согласно условиям задачи Р (Вг \ Аг) = = 0,68, Р (В2 | Аг) = 0,24, Р (В, | Аг) = 0,08. Р (Вг | А2) = 0,30 и т. д. Поэтому можно вычислить все Р (АгВ]) = Р (Аг) Р (В; \Аг). Запишем их в таблице: #1 #2 #3 Я(.4*) 0 0 0 0 Ах ,32 ,11 ,04 ,47 0 0 0 0 л. ,07 ,15 ,01 ,23 А, 0,04 0,03 0,23 0,30 Ж-,, 0,43 0,29 0,28 1,00
124 СЛУЧАЙНАЯ ВЕЛИЧИНА 1ГЛ. 2 Сумма вероятностей в строке дает соответствующее Р а сумма в столбце — соответствующее Р (А^). По формуле B.139) находим Н (Я) = 1,521, Н (Ж) = 1,556, Н (Я@) = 2,632. Следовательно, согласно B.169), среднее количество информации, даваемое измерением собственного движения голубого объекта, равно I (А, В) = 0,445. Если измеряются не собственные движения, а ультрафиолетовые избытки объектов, то таблица значений Р (А1 В;) имеет вид: Р(А{Вр Вг в2 Ва А, 0,28 0,06 0,13 0,47 0,03 0,17 0,03 0,23 Аз 0,04 0,08 0,18 0,30 0,35 0,31 0,34 1,00 Соответственно Н {Л) = 1,521, Н (ЯЗЬ) = 2,802 Н E8) = 1,583, и / (Я, 33) = 0,302. Таким образом, измерение собственного движения дает в среднем больше информации для отождествления слабого голубого объекта, чем измерение ультрафиолетового избытка. § 34. Мера неопределенности случайной величины Понятие меры неопределенности для дискретной случайной величины вводится обычным образом, так как совокупность значений, которые может принимать случайная величина, является полной системой событий. Таким образом, если случайная величина X принимает значения
§ 34] МЕРА НЕОПРЕДЕЛЕННОСТИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 125 с вероятностями, соответственно Ри Ръ> • • •> Рп> то ее мера неопределенности равна п Н(Х)=- 2а1о8Л. B.170) Чтобы ввести понятие меры неопределенности для непрерывной величины X, принимающей значения в промежутке [а, Ь], разобьем промежуток [а, Ь] на п частей, определим вероятность попадания /?* случайной величины X в каждую из этих частей, напишем выражение B.170) для этих вероятностей и будем стремить п к оо так, чтобы длина наибольшего промежутка Я -> 0. Тогда Так как вероятность попадания случайной величины в бесконечно малый промежуток (х, х + их) равна / (ж) йху то, казалось бы, при определении Н (X) следует исходить из чисто формального соотношения ъ а Ъ - 5 / И 1ов (Ох) их. B.172) Первый член в B.172) в общем случае ограниченная величина. Второй же член, поскольку их бесконечно мало, бесконечно большая положительная величина, поэтому и Н (X) — бесконечно большая положительная величина. Этот результат понятен, так как мы задались целью предсказать положение случайной величины внутри бесконечно малого промежутка. Очевидно, что мера неопределенности для такого предсказания должна быть неограниченно велика. Точно так же мера неопределенности будет бесконечно велика, если по выражению B.170)
126 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 вычислять ее для дискретной величины, имеющей бесконечно большое число значений, и при п -> оо считать, например, рг = —. В выражении B.172) только первый член зависит от плотности вероятности случайной величины (второй равен оо!). Поэтому естественно, не определяя абсолютной величины меры неопределенности, сравнивать меры неопределенности различных распределений, путем сравнения первых членов в выражении B.172). Для этого введем понятие дифференциальной меры неопределенности (дифференциальной энтропии) к (X) = - ^ / (.г) 1о8 [/ (*)] их. B.173) —-ос Пусть У = X +1, B.174) тогда I = У — X. Так как при любой /(х) B.175) то [это показывает, что дифференциальная энтропия не зависит от математического ожидания случайной величины. Покажем, что если случайная величина задана в промежутке [а, Ь], то наибольшей дифференциальной энтропией обладает равнораспределенная случайная величина. Так как всегда должно удовлетворяться условие Ь' $|/(*)Д* = 1, B.176) то для нахождения максимума энтропии нужно составить функцию Лагранжа B.177)
§ 341 МЕРА НЕОПРЕДЕЛЕННОСТИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ 127 и, рассматривая вариацию плотности вероятностей, приравнять нулю вариацию Ь. Находим + 1ов е — X) Ь^Ах = 0. B.178) Равенство B.178) должно выполняться при произвольной вариации 8/. Из этого следует, что 1о& / = Я — 1о& е9 т. е. / = сопз! в промежутке [а, 6]. Таким образом, утверждение доказано. Оно полностью соответствует введенному понятию меры неопределенности, так как при равнораспределении в промежутке [а, Ъ] предсказание, в какую из частей промежутка попадает случайная величина, наиболее затруднительно. Согласно равенству B,176), раз / = сопз!, то / = Ъ^а • <2-179> Это дает и неопределенный множитель Я. Значение дифференциальной энтропии для равнораспределеннои в промежутке [а, Ъ] случайной величины равно Определим, при каком распределении случайной величины в промежутке [—оо, оо] дифференциальная энтропия максимальна при фиксированной дисперсии случайной величины Так как, кроме условия нормировки B.176), теперь введено условие фиксированной дисперсии, (х)йх, B.180) то функция Лагранжа имеет вид оо $ (ж —Х)»/<&.
128 СЛУЧАЙНАЯ ВЕЛИЧИНА [ГЛ. 2 Рассматривая вариацию / и учитывая, что энтропия не зависит от X, приравняем вариацию Ь нулю: [1ов/ + 1оге — К + М* —XJ]й/Ас = 0. B.181) Так как равенство B.181) должно быть справедливо при любой вариации б/, то из него следует, что 1од / = — 1ов е + Я* — Я2 (х — XJ. B.182) Это показывает, что при фиксированной дисперсии максимальную энтропию имеет нормальная функция. Ее можно записать в каноническом виде У 2я *- B.183) где а — заданная дисперсия, а X может быть любым. Условия нормировки и B.180) определяют также Ях и Х2. Значение дифференциальной энтропии нормальной функции находится путем подстановки B.183) в B.173): к'(Х) = 1о8'(<5/2яв)- BЛ84)
Глава 3 СЛУЧАЙНЫЙ ВЕКТОР § 35. Понятие случайного вектора. Функция распределения случайного вектора Пусть -^ь Х29 . . ., Хк C.1) — случайные величины; можно рассмотреть А-мерный вектор X = (Х19 Х%, . . ., Хк). C.2) Мы назовем его случайным вектором. Говорят также, что X есть многомерная случайная величина. Ей можно сопоставить точку (конец случайного вектора) в /с-мерном пространстве с координатами C.1). Случайный вектор считается заданным, если для любых значений хъ х2У . . ., хк известна функция Р (хъ х2,. . ., хк) = = Р (Хг < хи Х2 <х2, . . ., Хк < хк), C.3) называемая интегральной функцией распределения случайного вектора C.2). Р (хъ х2, . . ., хк) есть, очевидно, неубывающая функция по каждому аргументу. Она обладает свойствами 11т Р (хъ х21 ...,хк) = 0 A < ^ к), C.4) какими бы ни были значения остальных аргументов, и Р(+ оо, + оо, . . ., + оо) = 1. C.5) Если существует такая функция / (хъ х2у . . ., хк), что для любых значений х1у х2, . . ., хк выполняется равенство —ОО —00 —00 C.6) 5 Т. А. Агекян
130 СЛУЧАЙНЫЙ ВЕКТОР 1ГЛ. а то / (х1у х2, . . , хк) называется дифференциальным законом распределения или плотностью вероятности случайного вектора C.2). На основании C.5) заключаем, что &...<& = !, C.7) —оо —оо т. е. плотность вероятности нормирована. Из равенства C.6) для всех значений х1у х2У.. . , хъ следует, что вероятность попадания точки (Х19 Х2, . . . . . ., Хк) в борелевское множество *) О ^-мерного пространства равна 5/F 5C.8) о Каково бы ни было (?, вероятность C.8) неотрицательна. Из этого следует, что / (х1у х2, . . ., хк) есть неотрицательная функция. Если О является ^-мерным параллелепипедом с ребрами [х1у хг + йхг]у 1х2У х2 + Лх2]у . . ., [хку хк +Лхк] C.9) и подынтегральная функция непрерывна в точке (хъ х2, . . ., хк), то интеграл C.8), как известно, с точностью до бесконечно малых высших порядков равен / (жь #2> • • •» хк) их! Лх2 . . . <1хк. Следовательно, последнее выражение равно вероятности того, что случайные величины C.1) примут значения, заключенные] соответственно, в промежутках C.9): . . , хк) йхх . . . &хк = Р (хг < Хх < хх + Ахъ . . . . . ., хк<Хк<хк +йхн). C.10) В некоторых случаях удобно использовать обозначение / (х19 . . ., хк) йхг... Лхк = / (х) их. C.11) Если для каких-то хъ . . ., х% событие, состоящее в том, что случайные величины Хъ . . ., Хг (г< к) C.12) *) То есть множество, получаемое из параллелепипедов с помощью счетного числа операций объединения и дополнения.
35) ПОНЯТИЕ СЛУЧАЙНОГО ВЕКТОРА 131 примут значения соответственно меньше хи х2, . .., х%, не зависит от того, приняли ли случайные величины Х{+1, . . ., Хк C.13) значения, меньшие соответственно х^1у жм-2, . • ., хк9 или нет, то согласно теореме умножения вероятностей Р (Хг <хи . . ., Хк < хк) = =Р (Хг < хи ..., Хг <хг) Р (Хи1 < Ж|+ь . . . Хк<хк). Таким образом, если случайные величины C.12) независимы от случайных величин C.13), то интегральная функция распределения Р (хх, х2, . . ., хк) равна произведению двух функций, из которых одна зависит только ОТ Х19 #2, • • •» %1> а ВТОрая ТОЛЬКО ОТ Х1+и Х(+2 у • • •» #Ь> C.14) Первая из этих функций представляет собой интегральный закон распределения случайных величин C.12), а вторая — случайных величин C.13). Справедливо и обратное утверждение. Если функцию Р(хих2, . . ., хк) можно представить в виде произведения двух функций C.14), одной, — зависящей только от #ь #2> • • •» Х1> — и ДРУг°й, зависящей только от Я|+ь #*+2> • • •» хк> то случайные величины C.12) не зависят от случайных величин C.13). Если при этом постоянные коэффициенты выбрать так, чтобы ^1 (+<*>,+ ОО, . . ., + ОО) И ^2(+ ОО, + ОО , . . ., +ОО) были равны 1, то эти функции будут интегральными законами распределения случайных величин C.12) и C.13) соответственно. Аналогичные рассуждения приводят к тем же утверждениям для плотности вероятности. Если случайные величины C.12) не зависят от C.13), то х1+2, . . ., хк). C.15) Если плотность распределения / (хи Х2> • • •, хъ) можно представить в виде произведения C.15), то случайные 5*
132 СЛУЧАЙНЫЙ ВЕКТОР ЬГД. 3 величины C.12) независимы от случайных величин C.13)» При этом, если функции Д и /2 нормированы в смысле C.7), то они соответственно являются плотностями вероятности случайных величин C.12) и C.13). Функция Р (хъ х29 . . ., хк) обладает еще таким свойством: Р (хъ х2, . . ., хи + оо, + оо, . . ., + °°) = - Рг (хг, х2, . . ., хг), C.16) где Рг (хъ х2, . . ., хг) есть интегральный закон распределения случайных величин C.12). Аналогично, х2... Лх{ \ \ ^ — оо —оо —оо %... йхи C.17) где Д {хъ х2, . . ., хг) — плотность вероятности случайного вектора (Х1у Х2, . . ., Хг). В частности, для двух случайных величин X и У имеем оо ^ (х, у)Лу. C.18) Пусть случайная величина У является функцией случайной величины X Г = т] (X). В этом случае, очевидно, / (ж, у) их <1у == б [у — ц (х)] Цх)йх^Ь[у — х\ (х)]/ (у) Луу т. е. / (х, у) = 0, если у ^= т) (ж), и / (ж, у) йж йу = = /х (ж) Лх = /2 (у) йу, если у = т) (ж). § 36. Функция от случайного вектора Допустим, что величины являются функциями от случайных величин C.1): ^2 ^Яг (^1»^2> • • • » -Х"й)» • • • (^ь Х2, . . ., Хя) C.19)
36] ФУНКЦИЯ ОТ СЛУЧАЙНОГО ВЕКТОРА 133 и, следовательно, являются сами случайными величинами. Тогда случайный вектор У = (Ух, У2 Ут) C.20) является функцией случайного вектора C.2). Если / (х) = / (хъ х2У . . ., хк) есть плотность вероятности случайного вектора C.2), то вероятность того, что случайный вектор C.20) окажется внутри области О, равна $ \..Лхк, C.21) где область () охватывает все точки (хъ . . ., хк) й-мерного пространства такие, что (уи . .., ут) принадлежит О, где уз = т); («1, . . ., хк). Из C.21) следует, что интегральный закон распределения случайного вектора C.20) находится при помощи равенства Рг(Уи Уг,..., Ут) = §•••§/ (*ь • •., Ч) Лхх... йхк, C.22) где область /с-мерного пространства () определяется неравенствами Л/ (яь х2, . '. ., хк) < уз, /=1,2, . . ., т. C.23) В самом деле, сопоставление равенств C.19) и неравенств C.23) показывает, что попадание случайного вектора C.2) в область (} эквивалентно выполнению неравенств Уг<Уи ?*<У* • • ., Ут<Ут. C.24) Поэтому правая часть равенства C.22), равная вероятности попадания случайного вектора C.2) в область (), равна левой части этого равенства, представляющей вероятность выполнения условий C.24). Точно так же плотность вероятности случайного вектора C.20) находится при помощи равенства C.25)
134 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 где «область» /с-мерного пространства (? определяется неравенствами *(хъ х2, . . ., хк)<щ + йу}, / = 1,2,.. ., т. C.26) Рассмотрим простейший случай, когда У = Хг + Х2. Найдем функцию распределения У, если плотность вероятности / (хи х2) задана. Согласно C.22) оо у—ХХ Рг {У) = $ / (хь *ъ) йх\ йх2 = ^ Лхх \ / (хи х2) дяг. Х1+Хг<у —с» —оо Введем вместо х2 переменную интегрирования и = хг +х2. Тогда оо у у Ръ (У) = 5 ЙХ1 5 ^ (жь и — хх)йи= } йи —с» —оо C.27) Продифференцировав это равенство по у, найдем плотность вероятности Ш= ^ 1{хиУ-Х1)йх1. C.28) Если Хг и Х2 взаимно независимы, так что / (х19 х2) = Л (жх) /2 то равенство C.28) принимает вид C.29) Равенство C.29) можно трактовать как определенную операцию, выполняемую с функциями /х и /2, в результате чего получается функция /3. Эту операцию называют сверткой двух функций. Рассмотрим важный частный случай общей задачи, когда т = к и случайные векторы ХиУ взаимно одно-
§ 36] ФУНКЦИЯ ОТ СЛУЧАЙНОГО ВЕКТОРА 135 значно определяют друг друга, так что наряду с равенствами C.19) мы можем написать -Х\ = &1 (У и Уъ> • • •» ^к)> Х2 = С2 (У и ^2» • • •» ^ь)> /д 30\ хк=ък<уи у%9 ..., го- Тогда на основании C.21) вероятность того, что случайный вектор У = (Уи У*, --->Ук) попадает внутрь параллелепипеда 1уи У1 + йуг], 1у2, у2 +йу2], . . . , 1уь, Ун + Лук]9 C.31) определится равенством 11 (У и Уъ • • м У к) Луг &Уг • • -йук = ж2, . . ., хк) йхх йх2 . . . йхк9 C.32) где и — плотность вероятности вектора У, (хи х2у . . ., хк) и (у и Уъ> • • •» У к) связаны с помощью функций ^, а Лхи йх2У ..., д,хк также определяются этими функциями (когда заданы Луъ йу2, . . ., Дук)у но берутся со знаком плюс. Подставляя в правую часть C.32) выражения хъ ... . . ., хк через уъ . . ., ук и используя якобиан для перехода к дифференциалам новых переменных, находим к (У и У 2,..., Ун) Лу1 йуъ. ..йук = 0 Е ( )! X X *У1Aу*...Лук. C.33) Якобиан должен быть взят по абсолютной величине, так как все множители в обеих частях равенства C.37) положительны. Равенство C.33) позволяет найти плотность вероятности случайного вектора У, если заданы плотность вероятности случайного вектора X и взаимно однозначная зависимость X и У,
136 СЛУЧАЙНЫЙ ВЕКТОР 1ГЛ. 3 § 37. Математическое ожидание и дисперсия суммы случайных величин Найдем математическое ожидание У, если У = Хг + + Х2 и плотность вероятности / (хи х2) произвольна. Воспользуемся для этого равенством C.29): МУ = —оо —оо —оо —оо —оо —оо оо оо {(хъ х2)д,х2+ . C.34) —оо —оо Таким образом, математическое ожидание суммы двух произвольных случайных величин равно сумме математических ожиданий этих случайных величин. Определим дисперсию У, если Хг и Х2 взаимно независимы: (У- Далее, меняя порядок интегрирования и используя C.34), получаем оо = 5 («1 2
§ 37] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 137 Второе слагаемое справа равно нулю, поэтому о2 = о1+ с2, C.35) т. е. дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин. По индукции получаем, что если Г = Хг + Х2 + . . . + Хп, C.36) ТО У = 1, + Х2 + . . . + Хп. C.37) Если при этом Хи Х2, . . ., Хп взаимно независимы, то <т2 - от? + о\ + . . . + а2. C.38) Задача 61. Найти плотность вероятности суммы двух независимых нормально распределенных случайных величин. Решение. По условию плотности вероятности случайных величин Хх и Х2 имеют вид Согласно C.29) функция распределения величины У •= = Хх + Х2 равна Введем обозначения Уо = Х1,0 + ^2.0' <*3 = СТ1 и преобразуем показатель экспоненты: (п— г,,.J _ [(У-У 2в|
13$ СЛУЧАЙНЫЙ ВЕКТОР 1РЛ. 3 Вынося из-под знака интеграла множитель, не зависящий от хг и вычисляя интеграл, получим 2а? ^•6 \#/ — УьТ Таким образом, сумма двух независимых нормально распределенных случайных величин есть также нормально распределенная случайная величина. Ее среднее и дисперсия равны суммам соответствующих характеристик этих случайных величин, что следовало из общих соотношений C.34) и C.35). Применяя индукцию, можно доказать, что сумма любого числа независимых нормально распределенных случайных величин есть нормально распределенная случайная величина. Справедлива также обратная теорема, доказанная в 1936 г. Крамером: если сумма конечного числа независимых случайных величин есть нормально распределенная случайная величина, то каждое из слагаемых является нормально распределенной случайной величиной. Задача 62. Плотность вероятности для каждого из прямоугольных компонентов X, У, Ъ скорости молекул есть нормальная функция со средним, равным нулю, и дисперсией, равной а2. Компоненты скорости по трем направлениям независимы друг от друга. Найти плотность вероятности модуля скорости молекул; Определить среднюю величину, среднюю величину квадрата и стандарт модуля скорости. Решение. Согласно условию плотность вероятности компонента X скорости имеет вид Таковы же распределения и компонентов У и 2. Так как эти три распределения взаимно независимы, то плотность вероятности вектора скорости равна произведению плотностей вероятности каждого из компонентов: 1 ^Ь (+2/+) / (*, */, ъ) = /о (х) /о (у) /о (г) = * е 2°2 . C.39) E У АЛ)
§ 37] МАТЕМАТИЧЕСЖОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 139 Распределение C.39) называется максвелловским распределением скоростей. Оно является сферическим распределением. Это означает, что в пространстве скоростей плотность вероятности в точках сферы х* + у* + г? = с2 C.40) произвольного радиуса с постоянна (как это видно из C.39)). Общий вид сферического распределения таков: / (х, у,ъ) = г, (х2 + г/2 + г2). C.41) Модуль скорости р = УХ2 + У2 + Ъ2. Дополним эту случайную величину двумя — широтой 0 = Ъ У = агс1§ -у==г и азимутомср = агс1§^. Прямоугольные координаты х, у и ъ и сферические координаты р, 0, ф взаимно однозначно определяют друг друга. Согласно C.32) (Р> 9» ф) Ф й0 йф = / (х, у, т) Ах йу в,?, = 1 ^ (Ч?уЧ) =- е йхйуйг. Так как якобиан перехода от прямоугольных координат к сферическим равен р2 зт 0, получаем /A) (р, 0, ф) ар ав Лр = ^_з е 2а2р2 З1п е ар авау. C.42) После интегрирования C.42) по всем возможным значениям 0 и ф определится плотность вероятности модуля скорости Л(р)= ^/A)(р'е'ф)й0йф=:т&рг^г~2- (З-43) 0 0 Найдем математическое ожидание р: а C.44)
140 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 и математическое ожидание р2: Р2/1(р)Ф = Зз2. C.45) о Последнее равенство позволяет выразить }г (р) через среднее квадратическое модуля скорости: ЗР2 Р^-Г* C.46) р2)'2 Дисперсия р находится по формуле B.68), с2, = р - (рJ = (з - 1) б2 ^ 0,454з2, C.47) так что стандарт — среднее квадратическое отклонение модуля скорости от своего среднего значения — равен ор == у^З — -| а = 0,674^. C.48) Задача 63. Найти плотность вероятности видимой величины /с-й по яркости звезды. Решение. Для того чтобы найти плотность вероятности видимой величины второй по яркости звезды, найдем сначала, применяя теорему умножения вероятностей, вероятность того, что видимая величина ярчайшей звезды находится в промежутке [ть тх + йтх], в промежутке [гпи иг] звезд нет, а в промежутке [т, ш -\- Лиг] звезда есть [см. задачу 48]: йт = = е-*™ № (т) йт И' (т1) йтх. Проинтегрировав это выражение по /ггх от 0 до т, получим искомую плотность вероятности /2(т) = М{т)е-"(™)М'(т). Применяя индукцию, найдем также плотность вероятности видимой величины к-й по яркости звезды:
§ 37] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 141 Задача 64. Плотность вероятности каждого из прямоугольных компонентов X, У и Ъ скорости звезд есть нормальная функция со средним, равным нулю, и дисперсиями, соответственно равными а\, в\ и а\. Найти плотность вероятности вектора скорости звезды. Решение. Отличие этой задачи от задачи 62 заключается только в том, что дисперсии компонентов скоростей по трем направлениям различны. Находим Распределение C.49) называется распределением Шварц- шильда. Оно является эллипсоидальным распределением. Это означает, что в пространстве скоростей плотность вероятности в точках поверхности эллипсоида ^1 + ^1 + ^ = с2 (з.5О) (при произвольном с) постоянна. Общий вид эллипсоидального распределения таков: = Л D+ 4+ 4) \ °1 а2 аЗ / C-51) Задача 65. Все направления трехмерного случайного вектора равновероятны. Функция распределения длины проекции X вектора на произвольное направление, Д (х), известна. Определить функцию распределения /2 (р) модуля р случайного вектора. Решение. Если а — угол между случайным вектором и заданным направлением, то X = р соз а, причем 0<;«<^я. Рассматривая случайные вектор*! (р, X) и (р, а) с плотностями § и §ъ можно написать 8 (р, х) Ор их =г 8г (р, а) йр йа =
142 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 Интегрируя по р и учитывая, что р > #, находим C-52) Продифференцировав уравнение C.52) по х, окончательно получаем /, (р) = - 2рЛ'(р). C.53) 3 а д а ч а 66. Ротационной скоростью V звезды называется линейная скорость точек экватора звезды, вызываемая вращением звезды вокруг своей оси. Измерение расширения линий в спектре звезды, обусловленное ее вращением, дает не истинную ротационную скорость, а ее проекцию на луч зрения — видимую ротационную скорость у = V 81п г, C.54) где г — угол между осью вращения звезды и лучом зрения. Величина V и у = V зш г у различных звезд различны и при случайном выборе звезды могут рассматриваться как случайные величины. Из наблюдений можно определить плотность вероятности видимой ротационной скорости / (у). Требуется, считая ее известной, найти плотность вероятности истинной ротационной скорости Д (г;) и найти зависимость между математическими ожиданиями и дисперсиями у и V. Предполагается, что все направления осей вращения звезд равновероятны. Решение. Как было определено выше, функция распределения угла г есть с зш и Поскольку г изменяется от 0 до я/2, коэффициент с = 1. Рассмотрим взаимно однозначно определяющие друг друга случайные векторы (V, у) и (V, г) с плотностями § и §г. Из физическихсоображений очевидно, что случайные переменные V и г взаимно независимы. Поэтому равенство C.32) можно записать в виде § (г;, у) (IV ду = & (г;, г) йг; йг = Д (г?) йг; зш г 6,1, C.55) где Д (г;) — плотность вероятности V. Используя C.54), перейдем в правой части C.55) от г к у (при этом V нужно считать фиксированным и все множители брать по
§ 37] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 143 абсолютной величине): Плотность вероятности / (у) равна интегралу от # (у, у) по всем возможным значениям г;. Так как всегда V > г/, то C'56) Уравнение C.56) определяет зависимость между плотно стями вероятностей случайных величин у и V. Так как из наблюдений определяется / (у), а искомым является Д (г;), это уравнение — интегральное. Оно легко приводится к уравнению Абеля и имеет решение C-57) Использование C.57) для вычислений неудобно. На практике основной задачей обычно является нахождение средней истинной ротационной скорости и ее дисперсии для звезд различных классов. Найдем поэтому при помощи C.56) зависимость между математическими ожиданиями V и у, а также их квадратов: ^5 О V V о С» ОО Отсюда ~ С 0 следует: о 7 V 11 A11 \ V 1? —( ) V У V*- ~п 1 3 " Т -у У* ■ дл) --(
144 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 Рассматривая совокупность звезд, у которых измерены видимые ротационные скорости, как статистический коллектив, и вычисляя в них у и у2 по формулам п 1 у = — г=1 п г=1 найдем затем при помощи равенств C.58) и C.59) среднее значение и дисперсию истинных ротационных скоростей в этой совокупности звезд. Аналогично, используя C.56), можно найти зависимость между моментами любого порядка функций распределения видимой и истинной ротационной скорости звезд. Задача 67. Найти зависимость между функциями распределений квадратов истинных и видимых сферичностей галактик, считая, что галактики являются сжатыми эллипсо- рис 13. идами вращения и все ориентации их плоскостей симметрии равновероятны. Решение. Истинной сферичностью сжатого эллипсоида вращения называется отношение его малой полуоси к большой. Обозначим квадрат истинной сферичности |. Один и тот же сжатый эллипсоид вращения при наблюдении его по различным направлениям представляется в виде эллипса с различной по величине малой полуосью и постоянной большой полуосью. Назовем видимой сферичностью галактики отношение малой полуоси к большой полуоси ее видимого эллипса. Квадрат видимой сферичности обозначим т|. Рис. 13 показывает, как зависит величина малой полуоси видимого эллипса, равная Уц (большая полуось принята за 1), от угла г между направлением луча зрения и плоскостью симметрии галактики.
§ 371 МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 145 Найдем зависимость между т), § и г. Уравнение касательной к эллипсу имеет вид Находя расстояние этой касательной от начала координат, получаем откуда находим 81пЧ = ^|. C.60) Рассмотрим два взаимно однозначно определяющих друг друга случайных вектора (§, т]) и (§, г). Так как | и г взаимно независимы, на основании C.32) находим 8 ({■, т)) <*Ь ЙГ1 = 8г (Б, 0 &1 Лъ = Л {%) й1 соз I <И. C.61) Используя C.60), получаем е (?, ч) = „. и® . C.62) Интегрируя C.62) по ^ (^ ^ т]), приходим к искомому соотношению •О , /1(^ -*% C-63) Это интегральное уравнение относительно функции распределения истинных квадратов сферичностей галактик принадлежит к типу Абеля и разрешается. Однако удобнее использовать решение в моментах. Помножим обе части C.63) на У]п и проинтегрируем по всем значениям т), т. е. от 0 до 1: 1 2 Л л /A-1;)(л-*)
146 СЛУЧАЙНЫЙ ВЕКТОР 1ГЛ. 3 Вычисляя интеграл и используя выражения для моментов случайных величин, получаем C.64) Для п = 1 и п = 2 равенство C.64) принимает вид Ч = т+т1» C-65) ?"=й+А1+А^. (з-66) 1010 10 откуда получаем !=ТЧ-Т. C.67) Находим также дисперсию о\ = I72 - (IJ - ^ ^ - |- (ЛJ -1. C.69) Рассматривая скопление галактик как статистический коллектив, измеряя в нем видимые сферичности галактик и вычисляя ц и тJ, найдем затем при помощи равенств C.67) и C.69) среднюю величину и дисперсию квадратов истинных сферичностей. 3 а д а ч а 68. Определить в скоплении галактик функцию распределения угла между видимым направлением от галактики на центр скопления и видимым направлением большой оси галактики. Рассмотреть два предположения: 1) все ориентации плоскости симметрии галактик равновероятны; 2) все плоскости симметрии галактик проходят через центр скопления. Решение. Направление видимой большой оси галактики есть направление прямой, по которой плоскость симметрии галактики пересекает картинную плоскость (плоскость, перпендикулярную к лучу зрения). Если выполняется предположение 1), то все ориентации видимой большой оси на картинной плоскости равновероятны и плотность вероятности острого угла между направле-
C7] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ И ДИСПЕРСИЯ 147 нием на центр скопления и большой осью галактики дается равенством /(Р)= ~. C.70) Пусть теперь выполняется предположение 2). Рассмотрим рис. 14, на котором центр сферы () совпадает с центром скопления галактик. Сфера проведена через галактику, находящуюся в точке В. Наблюдатель смотрит в направлении АО, угол между лучом зрения и направлением из центра скопления на галактику равен г. Картинная * плоскость проходит через центр скопления перпендикулярно к лучу зрения. Большие круги, образуемые пересечением сферы с плоскостью АОВ и картинной плоскостью, пересекаются в точке И. В этой точке картинной плоскости наблюдатель видит галактику В. Проходящую через центр скопления плоскость симметрии галактики пересекает картинную плоскость по прямой ОС Направление ОС есть направление видимой большой оси галактики и, следовательно, интересующий нас угол Р есть угол СОВ. Из сферического треугольника ВСВ находим Рис. 14. СО5 I C.71) Угол х есть случайная величина с плотностью вероятности Л(я) = \ . C.72) Рассмотрим зависимость между функциями распределения случайных векторов (р, I) и (х, г): I C, 0 <2р Л = §1 («I 0 4с Л = -|- Лх зш г йи C.73)
148 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 Заменяя при помощи C.71) Ах в C.73) ц выполняя интегрирование по г, находим я/2 ^ 1 (* СО5 Е51П 16,1 2 1п ЗШ 3 ,« „/^ 6*) ~гГсоз2(В ^ соз2 I +1#2 (В ~" "" "я" соз2 р ' \6''*) о Для того чтобы выяснить, какое из предположений 1) и 2) имеет место в скоплениях галактик, нужно сравнивать распределения C.70) и C.74) с наблюдаемым распределением. Это часто бывает весьма неудобно, в особенности, если число галактик в скоплении не очень велико. Есть другая возможность — сравнивать моменты теоретических распределений с моментами наблюденного распределения в статистическом коллективе. Можно также сравнивать математические ожидания (для каждого распределения) какой-нибудь удачно подобранной функции. Заметим, что в нашей задаче в случае предположения 2) углы р должны ожидаться в среднем меньшими, чем при предположении 1). Поэтому можно рассматривать, например, математическое ожидание соз2 0, тем более, что оно просто находится. В предположении 1) ^оз2 р-^-йр = 0,5. В предположении 2) 2* Л СОЗ В зависимости от того, какое из чисел, 0,5 и 0,693, окажется ближе к найденному из наблюдений, г=1 можно судить о предпочтительности гипотез 1) или 2).
§ 39] НЕРАВЕНСТВО ШВАРЦА 149 § 38. Математическое ожидание функции от случайного вектора Если / (жь #2, . . ., хп) есть плотность вероятности случайного вектора (Хь Х2, . . ., Хп), а т] (Хь Х2, . . . . . ., Хп) — некоторая функция от этого случайного вектора, то величина <х> оо Ъ Х2, . ..,ХП) = 5 $••'•$ 4(^1^2, •• м*п) X —оо —оо —оо X / (яь яа,..., хп) Лхх Ах2... йхп C.75) называется математическим ожиданием т] (Хь Х2, . . ., Хп). Аналогично тому, как это было сделано для случайной величины в § 20, легко доказать, что математическое ожидание суммы функций случайного вектора равно сумме математических ожиданий этих функций, т. е. М [тц (Хи Х2, . . ., Хп) + гJ (X,, Х2, . . ., Хп)] = = Мх\х (Хг, Х2, . . ., Хп) + Мг]2 (Хи Х2, . . ., Хп). C.76) Точно так же очевидно, что М [СТ] (Хь Х2, . . ., Хп)] = СМГ) (Хг, Х2, . . ., Хп). C.77) Если Хх и Х2 взаимно независимы, то М [ Г|Х (Хг) Г]2 (Х2)] = 5 5 «Млх^ЛЛ^Х,). C.78) § 39. Неравенство Шварца Докажем неравенство [М (Х,Х2)]2 < М (Х\)М (XI), C.79) называемое неравенством Шварца *). ♦) Неравенство Шварца есть не что иное, как известное неравенство Коши — Буняковского, если Х\ рассматривать как элементы гильбертова пространства со скалярным произведением (Х Х) МХХ
150 СЛУЧАЙНЫЙ ВЕКТОР ГГЛ. 3 Допустим сначала, что МХ\ = 0. Это означает, что Хг с вероятностью 1 принимает значение 0. Тогда и ХгХ2 с вероятностью 1 принимает значение 0 и, следовательно, М (Х±Х2) = 0. Таким образом, в рассмотренном частном случае неравенство C.79) справедливо. Рассмотрим теперь общий случай МХг2 ^> 0. Каково бы ни было7 произвольное число х, справедливо неравенство М (Х2 - кХгJ > 0, т. е. МХ\ - 2хМ (ХгХг) + %2МХ1 > 0. C.80) Поскольку C.80) справедливо при любом х, положим в нем М (ХхХъ) х = ■ МХ\ что возможно, так как МХ\ > 0, и после приведения подобных членов получим требуемое неравенство C.79). § 40. Характеристическая функция суммы случайных величин Рассмотрим характеристическую функцию суммы двух независимых случайных величин У = Хг + Х2- Тогда на основании C.78) Х*) = М (ег1Х*е11Х*) = Меих*Меих>, C.81) т. е. характеристическая функция суммы двух независимых случайных величин равна произведению характеристических функций этих случайных величин. Этот результат находит важное практическое применение в том случае, когда наблюдения дают функцию распределения суммы двух независимых случайных величин и функцию распределения одной из них, а требуется определить функцию распределения второй случайной величины. Задача 69. Видимая величина т, абсолютная величина ЗК и модуль расстояния звезды р ='5:1* г - 5, C.82)
§ 40] ХАРАКТЕРИСТИЧЕСКАЯ ФУНКЦИЯ СУММЫ ВЕЛИЧИН 151 где г — расстояние до звезды, связаны соотношением ю = Ж + р. C.83) Функции распределения случайных величин т и 9К известны. Найти функцию распределения р. Решение. Видимая величина ш звезды зависит от ее абсолютной величины и модуля расстояния. Но абсолютная величина, определяющая мощность излучения звезды, и модуль расстояния, определяющий расстояние звезды, взаимно независимые случайные величины. Функцию распределения ф (М) (функция светимости) можно для окрестностей Солнца считать известной, функция распределения звезд по видимым величинам А (т) (функция блеска) в данном направлении определяется из наблюдений. Обычно требуется найти функцию распределения г|) (р) в данном направлении, что определит распределение звезд в этом направлении по расстояниям. Характеристические функции фш (*) = § еитА (т) йт, —<х> <х> Ф»(*)- $ в»шф(М)йМ, C.84) — оо оо ФР@= $ ^г|)(р)ф —оо на основании C.81) и C.79) связаны соотношением ('). C.85) Находя из C.85) Фр (I) и возвращаясь при помощи обратного преобразования Фурье к функции я|э (р), получаем Равенство C.86) вместе с первыми двумя равенствами C.84) дает решение задачи. На практике полученное решение нельзя использовать, так как функция блеска из наблюдений определяется не на всем бесконечном интерва-
152 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 ле, а до некоторой, предельной для телескопов, видимой величины т1. После того как найдено г|) (р), функция распределения по расстояниям определяется из соотношения, выводимого при помощи C.82): / (г) йг = г|) (р) Лр = чр E1§ г - 5) -у- 1п 10 йг. C.87) § 41. Суммирование большого числа случайных величин. Метод А. А. Маркова Пусть (Хи Х%, . . ., Хп) C.88) — случайный вектор. Рассмотрим случайную величину, равную сумме компонентов этого случайного вектора: п 2=2 х*- C-89) /С=1 Требуется найти распределение 2, если плотность вероятности / (хъ х2, . . ., хп) случайного вектора задана. Согласно общему правилу C.90) где интегрирование распространено на область (? в /г-мер- ном пространстве, удовлетворяющую условию 4 Используем рассмотренное в § 28 интегральное выражение ^^е<11, C.92) —с»
§ 41] СУММИРОВАНИЕ СЛУЧАЙНЫХ ВЕЛИЧИН 153 равное 1, если | х0 \ <Са и равное 0 в противоположном случае. Из свойств интегрального выражения C.92) еледу- п ет, что если положить в C.91) а = -«г^я, ахо = 2 — 2 хы то равенство C.90) можно написать в виде /С=1 — оо —оо -и («- 2 .*) е *=1 х . Лгп, C.93) где интегрирование распространено уже на все /г-мерное пространство. Так как Аъ бесконечно мало, то п — ОО —ОО X / (хъ ...,хп)Лхг... йхп. C.94) Равенство C.94) дает общее решение задачи суммирования случайных величин. Оно показывает, что 5 н е н=1 /(«!, ...,хп)йх!... йхп —оо является характеристической функцией для ^ {г). Если все случайные величины C.88) взаимно независимы и одинаково распределены, то равенство C.94) принимает вид Равенство C.95) можно было бы написать сразу, используя свойства характеристической функции.
154 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 § 42. Случай, когда сумма одинаково распределенных взаимно независимых сучайных величин при п —> эо имеет математическое ожидание и дисперсию Пусть 2п = Хг + Х2 + . . . + Хп, C.96) где Хх, Х2, . . ., Хп — независимые случайные величины с одинаковым распределением с плотностью / (х). Пусть /г-> оо. Так как согласно C.96) C.97) то для того, чтобы существовали Ит 2п = 2 и Пт а|п = а1, необходимо не только существование I и ах, но при п -> оо должны выполняться соотношения X -> О, Ох ->■ 0, как /г-соп81. Допустим, что 2 и о% существуют. Тогда можно написать @ < 0 < 1): т Г С е1(х/ (х) Ас]» = Вт ]м (л + «X — -у. Выражение в правой части C.98) является характеристической функцией для Д (г). Сравнение ее с решением B.106) задачи 52 показывает, что функция /х (ъ) является нормальной функцией с математическим ожиданием и дисперсией, определяемыми равенствами C.97). Итак, если существуют Нт пК. и Пта^, сумма гсодина- П-+ОО 71-ХЭО ково распределенных взаимно независимых случайных величин при п -> со имеет асимптотически нормальное распределение.
§ 431 РАСПРЕДЕЛЕНИЕ ХОЛЬЦМАРКА 155 § 43. Распределение Хольцмарка Пусть частицы некоторой природы равномерно заполняют бесконечное пространство. Допустим также, что каждая частица отталкивает (притягивает) некоторую контрольную частицу с силой, обратно пропорциональной квадрату расстояния ^г- C.99) На контрольную частицу действуют силы отталкивания (притяжения) всей совокупности частиц, заполняющих бесконечное пространство. Так как частицы не располагаются строго симметрично по отношению к контрольной частице и равномерность их распределения в пространстве означает лишь, что математическое ожидание числа частиц в объеме V пропорционально величине этого объема и не зависит от его формы и места расположения в пространстве, то суммарная сила отталкивания (притяжения) в общем случае нулю не равна. Она принимает различную величину и имеет различные направления в зависимости от случайных флуктуации в распределении частиц. Поэтому вектор суммарной силы является случайным. Найдем его распределение. Рассматриваемая задача была впервые решена Хольц- марком для газа, состоящего из положительно заряженных ионов. На контрольную положительно заряженную частицу при этом действует кулонова сила отталкивания C.99) для каждого иона, где х равно помноженному на постоянную кулона произведению электрических зарядов иона и частицы. Ту же самую задачу для сил притяжения представляет бесконечно протяженное звездное поле. Звезды в нем распределены равномерно. На контрольную звезду действует ньютоновская сила C.99), где х равна произведению масс контрольной звезды и звезды поля на постоянную тяготения. Нужно определить случайный вектор — вектор силы тяготения, прилагаемый всем бесконечным полем к контрольной звезде. Для простоты будем считать, что массы всех звезд поля одинаковы. Определим сначала плотность вероятности случайной величины — проекции вектора результирую-
156 случайный вектор 1гл. з щей силы на произвольное заданное направление. Эта случайная величина равна алгебраической сумме случайных величин X — проекций векторов сил притяжения отдельных звезд на заданное направление. Каждая из X дается равенством Х = ^соз?, (З.ЮО) где ф — угол между заданным направлением и направлением на звезду. Допустим, временно, что звездное поле ограничивается сферой радиуса г0. Бесконечное поле будет построено, если положить г0 -^ оо. Так как все положения отдельной звезды поля внутри сферы равновероятны, то функция распределения г определяется равенством 4 Используя C.100), можно написать 3 1 8 (х, г) их д,г = #х (ф, г) йф йг = — г2 Аг- — зт ф йф = г го C.102) Чтобы получить / (х), необходимо C.102) проинтегрировать по всем значениям г. Нужно при этом иметь в виду, что должно выполняться условие г <; г0, и в то же время, согласно C.100), Поэтому для имеем плотность вероятности
143] Распределение холышарка 157 Для плотность вероятности Из физических соображений очевидно, что X равно нулю. Это следует и из того, что X принимает значения в промежутке [—оо, оа], а его плотность вероятности — функция четная. Но центральный момент второго порядка, как это следует из C.103), равен оо, дисперсия X не существует. Поэтому результаты § 41 к рассматриваемой задаче неприложимы. Нельзя утверждать, что при о -> оо и числе звезд поля п = -1~пт& C.105) (V — среднее число звезд поля в единице объема), также п стремящемся к оо, 2 = 2 ^гимеет асимптотически нор- г=1 мальное распределение. Для решения задачи рассмотрим полученное в § 41 выражение C.95) для плотности вероятности: C>95) Значение внутреннего интеграла в C.95) можно найти, используя плотность вероятности, задаваемую выражениями C.103) и C.104). Его можно получить также, заметив, что математическое ожидание Ме11Х= 5 еих]{х)йх C.106) —оо можно вычислить, используя определение C.100) случайной величины X как функции случайного вектора (г, ср).
158 СЛУЧАЙНЫЙ ВЕКТОР ИГЛ. 3 Поэтому, используя также C.101), находим Г С е«*/ (х) Ат]" = ГС С в*!'!»»- <=оз ф _2_ 0 0 ° 0 0 С Г О а где а =- | г | пс"*ггг1\ с = — ЯV. Применив в полученном выражении формулу интегрирования по частям, находим Ит Г С еих1 (х) йхТ = Пт {^- A1 \ х)"/« [-|- а-8/' з1п а + оо / О О I» + ^ а~8/2С08 а "" 5" а/8 81П а "" 5" \ У~Чг г С08 ^ Поэтому согласно C.95) находим плотность вероятности случайной величины 7, — проекции на произвольное заданное направление силы, прилагаемой бесконечным звездным полем к контрольной звезде: к \ C.107) —оо где 1р C.108) Если для еш использовать формулу Эйлера, то ввиду четности относительно г второго множителя под знаком интеграла интеграл от мнимой части равен нулю и можно
43 РАСПРЕДЕЛЕНИЕ ХОЛЬЦМАРКА 159 окончательно написать C.109) Все направления силы, прилагаемой бесконечным звездным полем к контрольной звезде, равновероятны. Выражение C.109) определяет плотность вероятности проекции этой силы на произвольное направление. Поэтому согласно задаче 65 плотность вероятности для модуля силы р определится равенством /2(р)=-2р/1(р), т. е. оо /2 (р) = -1С 9г 8ш о (ЗЛЮ) C.111) Распределение C.111) называется распределением Хольцмарка. Пусть и = ра/». Введем также новую переменную интегрирования г' = р1, но затем штрих отбросим. Равенство C.111) примет вид /2(р) = а-'/'-^Ц гзШе+т'Ыи C.112) о оо Значения функции Н (и) = \ г зт 1егШиУгй1 приведены о в таблице 3. и 0,0 0,2 0,4 0,6 0,8 1,0 1,2 Щи) 0,000000 0,016666 0,063084 0,129598 0,203270 0,271322 0,324020 и 1,4 1,6 1,8 2,0 2,5 3,0 . 5,0 Н(и) 0,35620 0,36726 0,36004 0,33918 0,25667 0,17600 0,04310 Та и 10,0 15,0 20,0 30,0 40,0 50,0 блица 3 Щи) 0,00556 0,00188 0,00089 0,00031 0,00015 0,00009
160 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 Таблица показывает, что очень малые и очень большие модули силы маловероятны. Наибольшее значение плотность вероятности имеет около значения р, равного 1,6. оо Интеграл \р/2(р)^р сходится, следовательно, мате- о матическое ожидание модуля силы существует. Но инте- грал ^ р2/2 (р) Лр расходится, поэтому дисперсия модуля о силы бесконечна. Это вызвано тем, что, как показывает таблица 3, при больших значениях и (и следовательно, р) плотность вероятности убывает медленно. § 44. Центральная предельная теорема В задаче 61 было доказано, что сумма любого числа нормально распределенных случайных величин есть нормально распределенная случайная величина. В § 42 установлено, что сумма п одинаково распределенных случайных величин при п -> оо имеет асимптотически нормальное распределение. Центральная предельная теорема обобщает этот результат. В ее условии не требуется, чтобы слагаемые случайные величины были одинаково распределены. Распределения слагаемых случайных величин могут быть произвольными, если не считать некоторого условия, которое обеспечивает, чтобы при п -> оо никакая ограниченная группа слагаемых не доминировала в общей сумме. Центральная предельная теорема, доказанная А. М. Ляпуновым, формулируется так (мы ее приводим без доказательства). Пусть 2 = Хг + Х2 + . . . + Хп C.113) — сумма независимых случайных величин, имеющих математические ожидания МХг = аи дисперсии М (Хг — а,J = а2, а абсолютные центральные моменты п третьего порядка М\Х% — а* |3 = у{. Величины а— 2 <*<ь г=1
§ 45] ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ОШИБОК 161 а2 = 2 бг соответственно равны математическому Ожидать нию и дисперсии 2,. Тогда, если выполняется условие при /г->оо, C.114) то для любого заданного 2 интегральный закон распределения 1=. V е *" И C.115) у 2п ч) п К ' а У 2: равномерно по г. Таким образом, при выполнении условия C.114) сумма случайных величин асимптотически нормальна. Если число слагаемых в C.113) конечно, но велико, то распределение Ъ близко к нормальному. На основании центральной предельной теоремы и результатов, изложенных в предыдущих параграфах, можно утверждать, что чем больше слагаемых в сумме C.113) и чем ближе распределение каждого слагаемого к нормальному распределению, тем ближе к нормальному распределению и распределение 2. Этот вывод подчеркивает важную роль нормального распределения в теории вероятностей. § 45. Функция распределения случайных ошибок наблюдений Допустим, что истинное значение некоторой величины есть х0. Измеряя эту величину, как правило, получают результат, отличный от х0. Если измерение выполняется многократно, то результаты измерений не только отличаются от х0, но й большинстве случаев различны и между собой. Обозначим результаты измерений: Разности 6* = хг — #0, г = 1, 2, . . ., п, C.116) назовем ошибками измерений величины х0. ^ Т. А, Агекяц
162 случайный вектор Сгл. з Отношение ошибки измерения к истинному значению измеряемой величины (если последняя не равна нулю) называется относительной ошибкой измерения. Практика измерений показывает, что нужно различать три вида ошибок: промахи, систематические ошибки и случайные ошибки. Промахи — это ошибки, являющиеся результатом низкой квалификации лица, выполняющего опыт, производящего измерения, его небрежности или неожиданных сильных внешних воздействий на процесс измерений. Промахи обычно приводят к очень большим по абсолютной величине ошибкам. Необходимо, чтобы при выполнении измерений возможность промахов была полностью исключена. Систематические ошибки являются следствием влияющих на измерения эффектов, действие которых не распознано и не устранено (или не учтено). Например, луч света звезды при прохождении сквозь атмосферу Земли преломляется и путь его искривляется. Вследствие этого эффекта, называемого рефракцией, измеряемая высота светил над горизонтом всегда больше истинной высоты. Если рефракцию не учитывать, то в измерения высоты светила вносится систематическая ошибка. Причины, вызывающие систематические ошибки, исследуются в тех разделах физики, астрономии или иной науки, которые разрабатывают методику соответствующих измерений. Определяются правила исключения из результатов наблюдений систематических ошибок. Однако полное исключение систематических ошибок на практике не является возможным. Случайные ошибки являются следствием причин, влияние которых на практике невозможно или очень трудно учесть. Этих причин очень много, а роль каждой из них незначительна и изменчива. Поэтому исследовать каждую из причин, предусмотреть ее влияние при данном измерении невозможно. Допустим, наблюдатель отмечает момент прохождения звезды через нить в поле зрения телескопа. Вследствие большого числа очець слабых толчков, испытываемых
§ 45] ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ОШИБОК 163 инструментом от проезжающих в отдалении автомашин, мелких сейсмических толчков, хлопаний дверьми в соседнем здании и т. д., направление оптической оси инструмента и, следовательно, положение нити изменяются, не соответствуют заданным. Точно так же влияют температурные эффекты — изменения температуры у различных частей инструмента, вызываемые движениями воздуха, остыванием ночью различных сторон башни, в которой установлен телескоп, влиянием самого наблюдателя, занимающего в разные моменты различные положения относительно инструмента и т. д. Случайные движения в атмосфере вызывают видимые смещения, мерцание звезды. Сам наблюдатель в разные моменты имеет различную психологическую настроенность на измерения, его реакция на наблюдаемое различна, ее изменения не поддаются учету. Он то фиксирует момент совпадения звезды с нитью несколько раньше, чем он это делает обычно, то запаздывает. Каждый из перечисленных для данного вида наблюдений эффектов сам является суммой большого числа мелких эффектов, которые невозможно учесть. Можно лишь утверждать, что каждый мелкий эффект вносит некоторую ошибку, которая меняется от измерения к измерению, является случайной величиной, распределенной по некоторому закону. Например, если бы никакие влияния, вызывающие ошибки, не действовали, кроме одного — сейсмических колебаций почвы, появляющаяся в измерениях ошибка была бы случайной величиной, закон распределения которой определялся бы свойствами сейсмических явлений для данного места Земли и характером установки телескопа — его способности амортизировать толчки. Можно принимать меры к уменьшению случайных ошибок. И это играет важную роль при организации измерений. Можно, например, в рассмотренной выше задаче наблюдений принять меры к тому, чтобы температурные влияния сказывались по возможности меньше: устроить вентиляцию башни (что приводит к выравниванию температуры отдельных частей инструмента), покрасить башню так, чтобы она меньше нагревалась днем солнцем, можно строить обсерватории дальше от дорог с сильным движением и вне сейсмических районов, в б*
164 СЛУЧАЙНЫЙ ВЕК^О*» 1ГЛ. 3 областях с высокой прозрачностью и малой подвижностью воздуха, чтобы мало сказывались колебания атмоферы, и т. д. В результате таких мер случайная ошибка будет уменьшаться. Однако полностью устранить случайные ошибки невозможно. Случайная ошибка слагается из суммы большого числа случайных величин — ошибок, вызываемых различными трудно исследуемыми причинами. Эти случайные величины сравнимы по величине в смысле выполнения условия C.114) теоремы Ляпунова; среди них нет доминирующих. Иначе доминирующие над другими слагаемые — ошибки—выделялись бы, вызывающие их причины могли бы быть подвергнуты исследованию и влияние этих причин устранено. Доминирующую ошибку можно исследовать как систематическую и вносить соответствующую поправку. Часто можно предполагать, что распределения случайных величин, из которых слагается случайная ошибка, мало^ отличаются от нормальных распределений. Поэтому на основании результатов, сформулированных в § 44 относительно суммирования случайных величин, можно утверждать, что распределение случайной ошибки должно быть очень близко к нормальному. В теории ошибок это принимается за постулат, случайная ошибка измерений считается нормально распределенной случайной величиной. Математическое ожидание случайной ошибки должно быть равно нулю. Если математическое ожидание ошибки отлично от нуля, это означает, что наряду со случайной ошибкой она содержит и систематическую ошибку. Таким образом, плотность вероятности случайной ошибки имеет вид Так как Мб2 = а2, C.118) то стандарт распределения, а, имеет смысл средней квад- ратической ошибки. На основании C.117) и C.116) плотность вероятности случайной величины — результата измерения — имеет
| 46] СЛУЧАЙНАЯ ВЕЛИЧИНА X* 165 ВИД / (х) = —\— е-^-^^\ C.119) с У 2л где #0 — истинное значение измеряемой величины, о—средняя квадратическая случайная ошибка измерения. § 46. Случайная величина %2Щ Пусть Хи Х21 . . ., Хп — взаимно независимые нормально распределенные случайные величины с Хг = О иа^ = 1 ($=1, 2, . . ., п). Рассмотрим сумму их квадратов C-120) 2=1 которая тоже есть случайная величина, и найдем ее плотность вероятности. Согласно общему правилу -5-5 Ш"^Л,,..^, C.12,, п 2 < 2 XI < г + Bг г=1 Так как интегрирование в гс-мерном пространстве выпол- п няется в области, где 2 х\ постоянна, равна 2, то под- 1=1 интегральный, множитель можно вынести за знак интеграла: \ ... ^ (&!... ЛгП1 C.122) < 2 х\ < 2 + B2 2=1 Интеграл в правой части C.122) равен объему области /г-мерного пространства, в которой выполняется условие п *< 2 *?<*+**• C-123)
166 случайный вектор 1гл. з Чтобы определить этот объем, рассмотрим равенства п 2 4 = 2, C.124) г=1 п ^ х\ = г + *г, C.125) г=1 являющиеся уравнениями концентрических с центром в точке @, 0, . . ., 0) гиперсфер в /г-мерном пространстве. Радиус гиперсферы C.124) равен У г, а радиус с гиперсферы C.125) равен У г -\- Аг = У г + -о—г=" • Если тг-мер- ^ У 2 ный вектор (яь #2, . . ., хп) попадает в область гс-мерного пространства, заключенную между гиперсферами C.124) и C.125), то условие C.123) будет удовлетворено, в противном случае условие C.123) удовлетворено не будет. Следовательно, интеграл в правой части C.122) равен объему, заключенному между концентрическими гиперсферами C.124) и C.125). Объем гиперсферы п-то порядка пропорционален гс-й степени ее радиуса. Например, объем трехмерной сферы пропорционален кубу радиуса. А объем области, заключенной между двумя концентрическими гиперсферами, если разность их радиусов бесконечно мала, пропорционален (п — 1)-й степени радиуса, помноженной на толщину слоя между гиперсферами, т. е. на разность радиусов гиперсфер. Таким образом, искомый объем равен съ 2 —•?■=• и, следовательно, У 2 2 ^. C.126) %п может принимать значения от 0 до +оо. Выполняя нормировку, получим окончательное выражение для плотности вероятности случайной величины %1: \-"Г \ C.127) где Г (а) = ^ 1а-Ч~Ч1 — интеграл Эйлера второго рода.
§ 47] ОБОБЩЕННАЯ ТЕОРЕМА МУАВРА — ЛАПЛАСА 167 § 47. Обобщенная теорема Муавра — Лапласа Возвратимся к теореме Муавра — Лапласа (§ 30). В ней рассматривалась полная система событий А, Л, C.128) и было доказано, что случайная величина Х=—-р, где р — вероятность события А, т — число появлений события А при п испытаниях, имеет асимптотическое распределение Г^' C429) если п ->- оо и пх3 -> 0. При этом В системе событий C.128) события А и А равноправны, но в распределении C.129) фигурирует только X — отклонение относительной частоты события А от наиве- роятнейшего значения. В этом смысле распределение C.125) не симметрично относительно событий А и Л. Чтобы устранить эту особенность, введем симметричные обозначения: /?1 и Шх для вероятности и частоты^ события А и соответственно р2 и ш2 — для события Л. Очевидно, что рх + р2 = 1, пч + го2 = п, Ш1 — пр1= — (т2 — пр2), о2 = ,р1р2 . Рассмотрим случайные величины уг = ™-^у* = х у _"_ ^ C.131) у2 = Ш2Т^2 = — X ]/-^-. C.132) Справедливо равенство
168 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 в чем можно убедиться непосредственной проверкой. Поэтому И {Уъ У2) ЛугАу* = / (х) их = -^~=, е~ Т (У^%У1йу2. C.134) При этом принятое в теореме Муавра — Лапласа условие пх3 ->■ 0 заменяется условием п"х^у\ -> 0, п~Ч*у1 —>- О- Распределение C.134) симметрично относительно случайных величин Уг и У2. Следует, однако, иметь в виду, что, как это вытекает из C.131) и C.128), задание одной из этих случайных величин с достоверностью определяет другую. Рассмотрим теперь полную систему событий (Аг, А2, . . ., Ак), определяемую соответствующими вероятностями ри р2, . . ., ръ, и мультиномиальное распределение Рп К, иц,..., щ) = в| р*р?... Рр, К дающее вероятность того, что при п испытаниях события Аи А2, . . •». Ак происходят соответственно ти тп^ . . .,тд раз. При этом к к 2а = 1, 2^ = л- C-135) г=1 1=1 Введем переменные уг = Ш{7^ , г-1,2,..., Л. C.136) Основываясь на C.134), методом математической индукции можно показать, что при п ~> оо и п~11*у\ -> О, г = 1,2, . . ., А, справедливо асимптотическое равенство нг --2 у? 2 е 2^ *. C.137) Это и есть обобщенная теорема Муавра — Лапласа*
| 471 ОБОБЩЕННАЯ ТЕОРЕМА МУАВРА — ЛАПЛАСА 169 Из условия C.135) следует, что любая из случайных величин _ Щ-пр, определяется, если заданы остальные к — 1 случайных величин. Поэтому в распределении C.137) можно число переменных понизить на единицу, получив, таким образом, аналог распределения C.129). Рассмотрим для этого наряду со случайным вектором У = (Уи У2, . . ., Ун) случайный вектор V = GЬ 72, ..., Ук), определяемый равенством V = #У, C.138) где В — ортогональная матрица. Вследствие ортогональности В к к 2 V! = 2 К C.139) г=1 г=1 Ортогональных матриц бесчисленное множество, и мы можем задать еще одно равенство, связывающее какие- либо компоненты случайных векторов У и V. Примем в качестве такого равенства условие Ук = 2 /А Уг- C-140) На основании C.136) из условия C.140) следует, что к Ун = -57=" 2 № - »А) = -А~(п-п)= 0. C.141) Таким образом, существует ортогональное преобразование вектора У в вектор V, обеспечивающее условие Теперь можно написать ёк (^ »ъ..., ик) бяфь ...<1иК = ) е 21=1 %йУ1йУ*—йУь= к-1 —-1 У г? = Се 2 *-1 'йу! йу2 ... й^-х. C.142)
170 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 Из C.142) следует, что 7Ь 72, . . ., У^г являются взаимно независимыми нормально распределенными случайными величинами с математическим ожиданием, равным нулю, и дисперсией, равной единице. На основании результатов § 46 заключаем, что случайная величина %и - ^ = 2 я = з {Щ~ПР1Т =  ^ ( г=1 г=1 ^ г=1 при п -> оо, /г/! (гп1 — пр1У(пр1)~32 -> 0, 1 = 1,2,... ..., к, имеет асимптотическое распределение = 2 ^ [Г(А^1)] и * е >\ C.144) § 48. Моменты случайного вектора. Коэффициент корреляции Математическое ожидание функции п Д№-<Ч)к| C145) г=1 называется моментом порядка 2 ^г относительно начал г=1 (аь а2, . . ., ап) случайного вектора (Хи Х2, . . ., Хп). Если все а% = 0, то моменты называются начальными, если все а/ = МХ^ то моменты называются центральными. Математическое ожидание X/ равно —оо —оо —оо а дисперсия X^—
§ 48] МОМЕНТЫ СЛУЧАЙНОГО ВЕКТОРА 171 Эти определения совпадают, очевидно, с определениями, данными ранее, так как — оо —сю Моменты являются информативными характеристиками случайного вектора. Для двумерного случайного вектора (X, У) важной характеристикой является смешанный центральный момент второго порядка: оо оо 1*1,1=5 \{х-1){у-У)Цх,у)дхйу. C.146) —оо —оо Рассмотрим смысл этой характеристики. Подынтегральное выражение в C.146) положительно, когда отклонения х и у от математических ожиданий имеют одинаковый знак, и отрицательно, когда они имеют разный знак. Если отклонениям одного знака соответствуют, в общем, большие значения функции / (#, г/), чем отклонениям разного знака, то интеграл C.146) оказывается положительной величиной. В противоположном случае он отрицателен. Если X и У взаимно независимы, то , х = 5 (х - X) П (*) Ах \ (у - У) и (У) Ау = 0, C.147) И1, так как центральные моменты первого порядка всегда равны нулю. Обратное утверждение неверно. Из равенства нулю [1^1 не следует, что X и У взаимно независимы. Оно указывает лишь, что в среднем положительные отклонения одной из случайных величин X, У компенсируются отклонениями определенного знака у другой из них. Можно сказать, что равенство нулю \\,ху1 означает отсутствие линейной статистической зависимости между X и Г. Если |1М ]> 0, то между X и У существует положительная, а при \11у1 <0 — отрицательная линейная статистическая зависимость. |лм имеет размерность произведения размерностей случайных величин X и У. Удобно ввести в рассмотрение
172 СЛУЧАЙНЫЙ ВЕКТОР [ГЛ. 3 безразмерную характеристику где Охч о г соответственно стандарты X и У. Характеристику г называют коэффициентом линейной корреляции или просто коэффициентом корреляции случайных величин X и У. Как это следует из неравенства Шварца, всегда —1 < г< 1. C.148) Если X и У взаимно независимы, то согласно C.147) их коэффициент корреляции равен нулю. Определим коэффициент корреляции в том случае, когда У является линейной функцией X: У = аХ + Ъ. C.149) В этом случае У = а% + Ь, у — У = а (X — X) и / (ж, у)йх <1у= б (у — ах — Ь)/г (х)йх = = б {у — ах — Ь)/2 (у)йу. Поэтому находим оо оо 1*1,1= $ $ (х-Х)(у-7I{х,у)йхйу = —оо —оо — оо —эо бу = \а\вх, C.150) так как стандарт всегда положителен. Следовательно, когда У есть линейная функция X, то г =^_ = 818п а. C.151)
§ 48] МОМЕНТЫ СЛУЧАЙНОГО ВЕКТОРА 173 Коэффициент корреляции равен 1, если а ^> О, и равен —1, если а <0. Отсутствие линейной статистической зависимости и функциональная линейная зависимость между X и У — это крайние частные случаи. В общем случае между X и У существует линейная статистическая зависимость и их коэффициент корреляции отличен от 0 и от +1: он заключен в промежутке (—1, 1). Чем больше | г |, тем сильнее линейная статистическая зависимость между X и У. Она положительная, если г ^> 0, и отрицательная, если г<0. Задача 70. Найти параметры двумерного нормального распределения: /<*,„) = - *=.-7«<-« C.152) 2яс1Сг У 1 — р2 где C.153) Решение. Находим (лг-?)» оо — и (х) = ( / (х, у) с1у = —1=- е 2°1 , C.154) щ) а1 У 2я оо • (ЗЛ55) Таким образом, каждая из случайных величин X и У распределена нормально, Найдем смешанный центральный момент второго порядка: ^9зх0г. C.156) — оо —оо Равенство C.156) показывает, что р есть коэффициент корреляции X и У*
Глава 4 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ И СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ § 49. Статистические коллективы Пусть рассматриваются объекты, которые могут отличаться друг от друга значением некоторой определенной характеристики, Всякое каким-то образом выделенное множество таких объектов называется статистическим коллективом (или генеральной совокупностью), а объекты, в него входящие,— членами этого статистического коллектива. Число членов статистического коллектива т называется объемом статистического коллектива. Характеристика X, которая может принимать различные значения у различных членов коллектива, называется аргументом статистического коллектива. Можно, например, рассматривать как статистический коллектив звездное скопление, считая аргументом массу (или температуру, или показатель цвета и т. д.) его членов-звезд. Можно также мысленно выделить как статистический коллектив множество всех звезд спектрального класса В, входящих в состав Галактики, считая их светимость (количество энергии, излучаемой в единицу времени) аргументом. Примерами статистических коллективов будут множество частиц плазмы в некотором объеме с аргументом,— величиной заряда у частицы,— или множество всех молекул кислорода, находящихся в воздухе внутри данного помещения, с аргументом,— модулем скорости молекулы. Пусть в статистическом коллективе значение аргумента хх имеют т1 членов, х2 — т2 членов и т. д., хк — тк членов. Числа ти лг2, . . ., тк D.1) называются частотами соответственно значений хи #2, . . ., хк D.2) аргумента X.
§ 49] СТАТИСТИЧЕСКИЕ КОЛЛЕКТИВЫ 175 Если т — объем статистического коллектива, то, очевидно, что к 2 тп1 = т. D.3) г—1 Величины называются относительными частотами значений аргумента D.2). Очевидно, что если случайным образом извлечь из статистического коллектива один член, затем, после возвращения его обратно, снова случайно извлечь какой- то член и т. д., то значения аргумента извлекаемых членов можно рассматривать как значения случайной величины. Если объем статистического коллектива ограничен, то эта случайная величина может быть только дискретной. Согласно классическому определению вероятность рг того, что случайная величина примет значение Х(, равна относительной частоте аргумента . Для изучения статистического коллектива используется аппарат, применяемый при исследовании случайных величин. Статистический коллектив определяется интегральным законом распределения аргумента, рассматриваемого как случайная величина: ' ^ т т *-* * ч ' хг<х х{<х Произведение тР {х) дает число членов коллектива со значениями аргументов, не превосходящими х. Аналогично, 4 / \ ^> ^ X / \ ^0 X /^ \ // ^\ / (Л/) ;— >^I ^~~^~~ О \Х ~~~~ ЭСа ) — "—~~ /1 ТПаО (оС- ~~~~ X]) I т.О) ^ \ / ЪшшЛ Ъу) \ *■/ /у) ^ш1 I \ I/ \ /
176 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 1ГЛ. 4 есть плотность вероятности. Функцию х (х) = т/ (х) = 2 М (ж — хг) D.7) можно рассматривать как дифференциальный закон распределения аргумента с полной массой т. Величина ь к (х) их D.8) дает число членов коллектива, аргумент которых заключен между а и Ъ. Статистический коллектив характеризуется моментами распределения. В частности, *о = Ь — Х[ = ~^Г 21 тЛ D-9) г г является средним значением аргумента статистического коллектива, а со = 2 % (^ - ^оJ = -^ 2 »Ч (*4 - ^оJ D.10) г г есть дисперсия аргумента. Часто их называют также средним и дисперсией статистического коллектива. Равенства D.9) и D.10) показывают, что если каждому члену статистического коллектива (а не каждому значению аргумента) присваивать свой номер, так что все т* = 1, то эти равенства должны быть записаны в виде 1/1- ^ = 4-2*». D-И) -*э)«. D.12) 4 г=1 т л-»1 г=1 При такой записи среди значений Х{ могут быть и повторяющиеся. Статистический коллектив может иметь и бесконечно большой объем. Такой статистический коллектив счита-
Ц49] СТАТИСТИЧЕСКИЕ КОЛЛЕКТИВЫ 177 ется заданным, если заданы функции распределения аргумента — плотность вероятности или интегральный закон распределения. Рассмотрим, например, статистический коллектив — множество всех прямых, различным образом ориентированных в пространстве, в котором аргументом является угол между прямой и некоторой фиксированной плоскостью. Объем этого статистического коллектива бесконечен и даже несчетен. Аргумент в нем может принимать любые значения в промежутке 0, -^ . Задать распределение аргумента в нем можно через плотность вероятности. Выше мы показали, что если у рассматриваемых прямых все ориентации равновероятны, то = со8 а йа. D.13) D.13) имеет смысл доли членов коллектива, аргумент которых заключен между а и а + йа. Если полностью определены все условия выполнения измерения некоторой величины — инструмент, лицо, производящее измерения, обстановка, то тем самым можно считать, что образовался статистический коллектив бесконечного объема, аргументом которого является результат производимого измерения. Как отмечалось выше, плотность вероятности аргумента будет нормальной функцией C.119) с математическим ожиданием, равным истинному значению измеряемой величины, и стандартом, равным средней квдратической ошибке измерения. Мы будем говорить, что в таких статистических коллективах аргумент распределен непрерывно. Статистический коллектив можно описывать также следующим способом. Допустим, что все значения, принимаемые аргументом статистического коллектива, заключены в промежутке [а, 6]. Разобьем этот промежуток на к равных частей, выбрав к так, чтобы в каждую часть попало достаточно много значений аргумента. Положим а Ъ— а Если Ах мало, то / (х)Ах приближенно (тем точнее, чем меньше Ах) равно вероятности попадания случайной
178 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4 величины в промежуток \х 2~ Ах, х + -у- Ах\ . D.14) Когда Ах конечно, приближение в общем случае будет лучшим, когда х совпадает с серединой промежутка. В таком случае плотность вероятности определяется из приближенного равенства /(х)Ах = ^, D.15) где ГП( — частота значений агрумента в данном интервале. Положив в равенстве D.15) Ах = 1, мы видим, что плотность вероятности / (х) приближенно равна вероятности того, что случайная величина примет значение в интервале Для примера рассмотрим статистический коллектив звезд в окрестности Солнца, если аргументом служит абсолютная величина звезды М. Так как абсолютная величина звезды однозначно определяет ее светимость, то функцию распределения абсолютных величин звезд кратко называют функцией светимости. Из многих определений функции светимости приведем те, которые были получены П. П. Паренаго (табл. 4) и В. Ж. Лейтеном (табл. 5). Таблица 4 Функция светимости Паренаго м -6 -5 -4 —3 -2 —1 +0 + 1 +2 +3 ИМ) 0,00000013 0,00000126 0,0000048 0,000019 0,000060 0,000126 0,00051 0,0023 0,0063 0,0078 м + 4 + 5 + 6 + 7 + 8 + 9 +10 +11 +12 КМ) 0,017 0,024 0,033 0,036 0,031 0,033 0,047 0,069 0,100 м +13 +14 +15 +16 +17 +18 +19 +20 +21 ИМ) 0,107 0,118 0,018 0,102 0,079 0,049 0,020 0,0041 0,0008
49] СТАТИСТИЧЕСКИЕ КОЛЛЕКТИВЫ 179 Таблица 5 Функция светимости Лейтена м -0,5 +0,5 1,5 2,5 3,5 4,5 5,5 6,5 75 /(ЛО-ЮО 0,009 0,094 0,23 0,58 0,86 1,26 1,7 2,3 2,9 м 8,5 9,5 10,5 11,5 12,5 13,5 14,5 15,5 16,5 /(ЛО-ИЮ 3,6 4,4 5,4 6,3 7,6 9,7 12,1 14,4 10,8 м 17,5 18,5 19,5 20,5 21,5 22,5 23,5 24,5 /(М).ЮО 6,7 4,1 2,3 1,4 0,7 0,4 0,05 0,005 Как отмечалось выше, в таблицах4и5 плотность вероятности / (М) приближенно равна доле звезд с абсолютной величиной, заключенной в промежутке \М — у, М + -^ . Допустим, что табл. 4 и 5 дают истинное распределение по абсолютным величинам в двух каких-то статистических коллективах звезд. (На самом деле они являются двумя приближенными распределениями абсолютных величин звезд в окрестности Солнца.) Тогда имеется возможность при помощи моментов выполнить сравнения этих двух статистических коллективов. Нужно вычислить средние (Мо), стандарты (а0), асимметрии (Аз) и эксцессы (Ех). Моменты относительно начала а {а удобно принять равными 14 или 15) вычисляются по формуле D.17) м которая отвечает и равенству B.48) и B.49). Затем по формулам B.63) и B.65) — B.67) определяются Мо, \ь2, \13 и [д,4, и при помощи B.89) и B.92) асимметрия и эксцесс. Результаты вычислений для функций светимости Па- ренаго и Лейтена имеют вид Функция Паренаго Функция Лейтена Мо ао Аз Ех + 12,73 +13,55 3,850 3,873 — 0,708 — 0,610 0,0059 + 0,230
180 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4 Стандарты обеих функций практически одинаковы. У функции Паренаго меньше средняя абсолютная величина (больше средняя светимость), больше по абсолютной величине асимметрия и меньше эксцесс. Если члены статистического коллектива могут отличаться друг от друга значениями двух или более характеристик, то такой статистический коллектив называется многомерным. Многомерный статистический коллектив может изучаться при помощи аппарата, применяемого для исследования случайных векторов. § 50. Случайная выборка из статистического коллектива Если из статистического коллек'щва объема т случайным образом извлечь один член, затем, не возвращая его, второй член и т. д., то полученная таким образом совокупность значений Хи X» ...,Хп D.18) называется случайной безвозвратной выборкой объема п. Очевидно, что п ^ т. Если каждый раз после извлечения члена статистического коллектива записывать значение аргумента и возвращать член коллектива обратно, то совокупность D.18) называется случайной возвратной выборкой объема п. В этом случае значение п не ограничено. Если статистический коллектив имеет бесконечно большой объем, то понятия безвозвратной и возвратной выборки совпадают. В дальнейшем нас будут интересовать случайные выборки из статистического коллектива бесконечно большого объема. Пусть плотность вероятности аргумента в нем есть / {х). Случайную выборку D.18) можно рассматривать как случайный тг-мерный вектор. Все компоненты этого вектора имеют одну и ту же плотность вероятности и взаимно независимы. Поэтому плотность вероятности случайного вектора D.18) определяется равенством 1=1
§ 50] СЛУЧАЙНАЯ ВЫБОРКА 181 Можно рассматривать различные характеристики случайной выборки, например, выборочную сумму п V = 2 хь D.20) г=1 выборочное среднее *) п * = 4" 2 Хь D-21) выборочную дисперсию 4 наименьший элемент выборки — пап (Хи Х2, . . ., Хп), наибольший элемент выборки — шах (Хь Х2, . . ., Хп) и другие. Эти характеристики сами являются случайными величинами. Любая функция выборки 1] (Хи Х2, . . ., Хп) есть случайная величина. Пусть х0 — математическое ожидание аргумента в статистическом коллективе. Определим математическое ожидание выборочного среднего: М! = М D- 2 -*«) = 4" 2 МХг = 4-пжо = «о. D.23) ^ 1 ' 1 ) г=1 ' г=1 Таким образом, математическое ожидание выборочного среднего равно математическому ожиданию аргумента статистического коллектива. Пусть ао — дисперсия аргумента в статистическом коллективе. Найдем дисперсию выборочного среднего г=1 п = -5Г 2 *) Отметим, что, в отличие от предыдущих глав, X здесь обо* значает не математическое ожидание аргумента X, а среднее по индивидуальной выборке, т. е. случайную величину.
182 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 1ГЛ. 4 Так как Х^ и X^ взаимно независимы, то М1(Х( — хо)х X (X^ — х0)] = О, если г ф /. Следовательно, 4 = ^ =-И- <4-24> Дисперсия выборочного среднего равна дисперсии аргумента статистического коллектива, деленной на п. Найдем математическое ожидание выборочной дисперсии п г=1 г=1 1 V ^ (V г \ I V —2~" /1 /I VI "'О/ \ у = Л [из2. - 2а? + оЛ] = -1^1 о^. D.25) Таким образом, математическое ожидание дисперсии случайной выборки меньше дисперсии аргумента статистического коллектива. Поэтому дисперсию D.22) случайной выборки называют смещенной дисперсией и наряду с ней рассматривают величину п $* = -^-г»2 = -^гг 2 № - ^J' D-26) г=1 для которой согласно D.25) справедливо равенство М82 = а*. D.27) 82 называется несмещенной выборочной дисперсией. Введем также случайную величину п ^1 & 1 (X, - %)\ D.28) = п—\ п(п — 1) ~
§ 51] ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ 183 математическое ожидание которой 2 V ' 1=1 = 4 равно дисперсии выборочного среднего. Т2 называется приведенной несмещенной выборочной дисперсией, а Г — приведенным несмещенным выборочным стандартом. § 51. Принцип наибольшего правдоподобия. Точечные оценки параметров На практике функция распределения аргумента (одномерного или многомерного) в статистическом коллективе обычно является неизвестной. Известна лишь случайная выборка из статистического коллектива. Такой случайной выборкой является ряд наблюденных значений аргумента статистического коллектива. Задача состоит в том, чтобы по данным случайной выборки вынести суждение о распределении аргумента в статистическом коллективе. При этом возможны два случая. В первом случае вид функции распределения аргумента в статистическом коллективе известен с точностью до одного или нескольких параметров. Необходимо по данным случайной выборки произвести оценку неизвестных параметров. Во втором случае неизвестен сам вид функции распределения аргумента в статистическом коллективе. Необходимо по случайной выборке произвести проверку гипотез о виде функции распределения аргумента в статистическом коллективе. Сначала рассмотрим первую задачу. Пусть плотность вероятности одномерного аргумента X в статистическом коллективе есть / (х; аи а2, . • ., ак), где аи а2, . . ., ак — неизвестные параметры. Допустим, что получена случайная выборка значений аргумента Хи Ха, . . ., Хп. D.30)
184 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 1ГЛ. 4 Как отмечалось выше (см. D.19)), плотность вероятности, отвечающая данной выборке, равна \Л^\у Л2, . . ., ЛП5 #1, а2, . . ., п^) == /^} I \^Ь &Ъ ®21 • • •> ^Л/« D.31) Функция Ь называется функцией правдоподобия. Принцип наибольшего правдоподобия состоит в том, что выбираются такие значения параметров аи а2, . . ., ак, при которых функция D.31) достигает максимума. Эти значения называют точечными оценками параметров аи а2, . . ., ак. Для практического решения задачи вместо Ь удобно рассматривать 1п Ь, и тогда согласно правилу одределе- ния максимума функции многих переменных для нахождения точечных оценок параметров а;- нужно решить систему уравнений — V, ] — 1, ^, . . ., /С. да, D.32) § 52. Принцип наибольшего правдоподобия в статистическом коллективе с дискретным аргументом. Точечные оценки вероятностей Пусть аргумент статистического коллектива может принимать к значений хи х2, . . ., хк. D.33) Соответствующие вероятности равны Ри Ръ, • • -,Рл» D-34) к /71. ^-1 причем р. = —1- и 2л Рг = 1- г=1 Допустим теперь, что вероятности D.34) неизвестны, но из статистического коллектива извлечена случайная (возвратная, если он ограниченного объема) выборка,
§ 52] ТОЧЕЧНЫЕ ОЦЕНКИ ВЕРОЯТНОСТЕЙ 185 давшая соответствующие частоты к пъ п2, ...,щ ( 2 Щ = п). D.35) 4=1 ' Нужно определить наиболее вероятные значения D.34). Вероятность случайной выборки D.35) равна Ь (п19 тг2,. .., щ; ръ Л, •. •, Рь) = Пг1 „2Г РР? Рк „2Г п { РхР? Рк D.36) Значения рг, р2, . . ., рк можно рассматривать как параметры распределения статистического коллектива. Принцип наибольшего правдоподобия для статистических коллективов с дискретным аргументом состоит в том, что выбираются такие значения параметров Ри Р2у • • •» Рк) ПРИ которых вероятность случайной выборки D.33) максимальна. Вследствие того, что величины к D.34) должны удовлетворять условию 2 Рь = 1,дляполу- г=1 чения максимума D.36) необходимо решить систему уравнений к За! =0' /=1.2,...,*, D.37) г=1 Л где 7 — неопределенный коэффициент Лагранжа. Выполняя дифференцирование и умножая полученные уравнения на Щ , придем к системе уравнений D.38) Из D.38) следует, что ^ от / не зависит и, следовательно, щ Рз = с/гу, D.39) т. е. согласно принципу наибольшего правдоподобия вероятности р^ пропорциональны соответствующим частотам выборки.
186 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4 Подставляя D.39) в равенство 2 Р\ = 1 находим, что г=1 точечные оценки вероятностей р; нужно принять равными относительным частотам выборки, т. е. Р; = -±, /=1,2,...,*. D.40) Этот результат представляется естественным. § 53. Принцип наибольшего правдоподобия в статистическом коллективе с нормально распределенным аргументом. Точечные оценки математического ожидания и дисперсии аргумента Статистический коллектив с нормально распределенным аргументом называется нормальным (или нормальной генеральной совокупностью). Он характеризуется двумя параметрами: математическим ожиданием аргумента х0 и дисперсией аргумента а\. Пусть получена случайная выборка Хи Хъ . . ., Хп; D.41) ее выборочное среднее п * = 4" 2 *1 D-42) г=1 и выборочная дисперсия п °2=4-2№-ГJ- D.43) г=1 Функция правдоподобия имеет вид 1п Ь (х0, б0) = — п 1п (<з0 У 2я) — ^ (Х$ — х0J. D.44) 0 г=1 Находим значение х0, при котором 1п Ь максимален, полагая п -з— = г 2| (^г — хо) = 0, D.45)
§ 54] РАСПРЕДЕЛЕНИЕ ВЫБОРОЧНОГО СРЕДНЕГО 187 поэтому точечная оценка математического ожидания аргумента есть п т. е. равна выборочному среднему значению. Далее, п = -±. + ±. 2 (х{ - хJ = - ±. + -4-оа = о, 1 ° D.46) откуда находим о? = о\ D.47) т. е. выборочная дисперсия есть точечная оценка дисперсии нормальной генеральной совокупности. § 54. Распределение выборочного среднего значения и стандарта в выборках из нормальной генеральной совокупности Плотность вероятности выборки D.41) из нормальной генеральной совокупности при хг = X*, I = 1, . . ., пу равна' п /(Ах, А2, . . ., Ап) = (б0 у АП) пе ° . D.4о) Преобразуем сумму, входящую в показатель экспоненты D.48), г=1 г=1 = /га2 + ^ (X1 — я0J, D.49) где согласно D.42) и D.43) X — среднее значение аргумента, а а — стандарт выборки. Следовательно, Хг,...,Хп)=е 2°° 2°° , D.50) где с=(ао/2Н)-п.
188 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4 Равенство D.50) показывает, что плотность вероятности случайного вектора-выборки с подставленными вместо переменных соответствующими значениями этой выборки определяется его средним X и стандартом а. Различные выборки объема /г, имеющие одинаковые значения 1иа, имеют одинаковые плотности вероятности. Определим плотность вероятности случайного вектора (Х\ а). Величина /х (х, о)йх йо есть вероятность того, что среднее значение и стандарт выборки попадут соответственно в промежутки [я, х + их], [а, а + *у], D.51) *ь ..., хп)Лхг.. .Ахп, D.52) где С — область пространства (хг, х2, . . ., .гп), содержащая все точки, для которых определяемые по формулам, соответствующим D.42) и D.43), х и а попадают в область D.51). Согласно D.50) плотность вероятности / (х±, х2, . . . . . ., хп) постоянна в области С Ее можно вынести из- под знака интеграла в D.52) х... йхп. D.53) Интеграл в правой части D.53) равен объему области С Чтобы найти его, заметим, что согласно D.42) и D.43) для попадания X и а в область D.51) необходимо, чтобы в тг-мерном пространстве точка (хг, х2, . . ., хп) была заключена между параллельными гиперплоскостями 2} Хг 1=1 п У1х1 = п%, D.54) D.55) г=1
& 541 РАСЙРЁДБЛЁЙИЕ ВЫБОРОЧНОГО СРЕДНЕГО 189 и между концентрическими гиперсферами п 2//*. лЛ2 п^2 /А с:Д\ \Х^ — X) :== 7ЪО , уЧ.ОО) 1=1 п 2 (х{ — хJ = п(в + йбJ. D.57) г=1 Гиперплоскость D.54) проходит через точку (х, х, . . . . . ., %), являющуюся центром гиперсфер D.56) и D.57). Радиус гиперсферы D.56) равен а]/ п> Расстояние между гиперплоскостями равно Уп йхь разность радиусов гиперсфер — У п Ла. Область С есть кольцо ширины Уп Лх и толщины У~п Ла, заключенное между двумя гиперсферами и двумя гиперплоскостями. Сечение /г-мерной гиперсферы плоскостью, проходящей через центр, образует (п — 1)-мерную гиперсферу того же радиуса. Объем (п — 1)-мерной гиперсферы пропорционален (п — 1)-й степени ее радиуса, а площадь ее поверхности пропорциональна (п — 2)-й степени радиуса. Объем области С равен произведению площади поверхности (п — 1)-мерной гиперсферы (длина окружности кольца) на ширину и толщину кольца. Следовательно, объем д,хх... йхп = Схв"^ их Да, D.58) где все множители, содержащие степени /г, включены в коэффициент Ск. Подставляя D.58) в D.53), находим 2°° 2°° их Ли. D.59) Правая часть D.59) разбивается на два множителя, из которых один зависит только от X, а второй только от а. Из этого следует, что случайные переменные X и а не зависят друг от друга. Выборочное среднее и стандарт
190 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4 нормальной генеральной совокупности взаимно независимы. Плотности вероятностей этих случайных величин имеют вид /2 (х) = Съе ° , D.60) /з(<з) = С4з*-»е ^ , D.61) где С3СА = С2. D.62> Таким образом х распредлено по нормальному закону с дисперсией, равной о1/п, и средним, равным х0. Согласно нормировке нормальной функции D.63) во У'1л Так как а может принимать значения в промежутке [0, оо], нормировка С4 дает па* п—з оо П—3 2° ^ 2°о да = С^^г Таким образом, п—1 Подставляя D.63) и D.64) в D.59), окончательно получаем
§ 55] РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА 191 § 55. Распределение Стьюдента. Оценивание параметров при помощи доверительного интервала Рассмотрим новую случайную величину X = Х~Хо , D.66) характеризующую случайную выборку, и найдем плотность вероятности случайного вектора B, а): / (я, б) йт, йо = Д (х, б) их йо = п па* • D.67) ° Чтобы найти плотность вероятности 2, проинтегрируем D.67) по всем возможным значениям а: г И Распределение D.68), называемое распределением Стьюдента, примечательно тем, что оно не зависит от параметров х0 и б0 нормальной генеральной совокупности. Введем случайную величину V = 2/^Г^Т = ^^^ /5^^; D.69) ее распределение определяется плотностью Вероятность того, что ?7 до абсолютной величине не
192 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4 превзойдет некоторого числа х>0, равна х Р(-и<С/<х)= ^ в (и) Аи. D.71) —X Подставив вместо V его выражение D.69) в неравенства —к < V < х, получим равносильные им неравенства + 'Ч^т- D72) Следовательно, D.71) можно записать в виде р (X - кТ < х0 < X + хТ) = 8 (х, п), D.73) где Т согласно D.28) есть приведенный несмещенный выборочный стандарт, Равенство D.74) дает оценку параметра распределения #0 при помощи доверительного интервала. Доверительным интервалом является [^ — хГ, X + иП. Середина доверительного интервала совпадает с точечной оценкой параметра х0. Длина доверительного интервала, равная 2х7\ может быть сделана любой, так как к произвольно. При этом соответственно изменяется надежность 8 (%, п). Значения этой функции приведены в таблице 6. Можно, очевидно, решать и обратную задачу — задавать надежность (часто ее задают равной 0,95, 0,99 или 0,999) и находить доверительный интервал, в котором с данной надежностью заключен параметр распределения. Для оценки параметра а0 нормальной генеральной совокупности используем распределение D.61). Для
55] РАСПРЕДЕЛЕНИЕ СТЬЮДЕНТА 193 Таблица 6 Значения функции п 10 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,2 3,4 3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 0,063 0,126 0,186 0,242 0,295 0,344 0,389 0,429 0,467 0,500 0,530 0,558 0,583 0,605 0,626 0,644 0,672 0,677 0,692 0,705 0,717 0,728 0,739 0,749 0,758 0,768 0,774 0,782 0,788 0,795 0,807 0,818 0,828 0,836 0,844 0,851 0,857 0,864 0,869 0,874 0,071 0,140 0,208 0,272 0,333 0,391 0,444 0,492 0,537 0,577 0,614 0,647 0,677 0,704 0,727 0,749 0,769 0,786 0,802 0,817 0,829 0,841 0,852 0,862 0,870 0,878 0,886 0,893 0,899 0,905 0,915 0,923 0,931 0,937 0,943 0,947 0,952 0,958 0,960 0,962 0,073 0,146 0,216 0,284 0,349 0,409 0,466 0,518 0,566 0,609 0,648 0,684 0,716 0,744 0,769 0,792 0,812 0,830 0,846 0,861 0,873 0,885 0,895 0,904 0,912 0,920 0,926 0,932 0,937 0,942 0,951 0,958 0,963 0,968 0,972 0,975 0,978 0,981 0,983 0,985 0,075 0,149 0,221 0,290 0,356 0,419 0,478 0,531 0,581 0,626 0,667 0,704 0,737 0,766 0,792 0,815 0,836 0,854 0,870 0,884 0,896 0,907 0,917 0,926 0,933 0,940 0,946 0,951 0,956 0,960 0,967 0,973 0,977 0,981 0,984 0,986 0,988 0,990 0,991 0,992 0,076 0,151 0,224 0,294 0,362 0,425 0,485 0,540 0,591 0,637 0,680 0,716 0,750 0,780 0,806 0,830 0,850 0,868 0,884 0,898 0,910 0,921 0,930 0,938 0,946 0,952 0,957 0,962 0,966 0,970 0,976 0,981 0,984 0,987 0,990 0,991 0,992 0,994 0,995 0,996 0,077 0,152 0,226 0,297 0,365 0,429 0,490 0,546 0,597 0,644 0,678 0,725 0,759 0,789 0,816 0,839 0,860 0,878 0,894 0,908 0,920 0,929 0,939 0,947 0,953 0,959 0,964 0,969 0,973 0,976 0,981 0,986 0,989 0,991 0,993 0,994 0,995 0,996 0,997 0,998 0,077 0,153 0,227 0,299 0,368 0,433 0,493 0,550 0,602 0,649 0,692 0,731 0,765 0,796 0,823 0,846 0,867 0,885 0,901 0,914 0,926 0,936 0,945 0,953 0,960 0,965 0,969 0,973 0,977 0,980 0,985 0,989 0,у91 0,993 0,995 0,996 0,997 0,997 0,998 0,998 0,077 0,154 0,228 0,300 0,369 0,435 0,493 0,553 0,605 0,653 0,697 0,736 0,770 0,801 0,828 0,852 0,872 0,890 0,906 0,919 0,931 0,941 0,950 0,957 0,963 0,968 0,973 0,977 0,980 0,983 0,987 0,991 0,993 0,995 0,996 0,997 0,997 0,998 0,999 0,999 0,078 0,154 0,229 0,302 0,371 0,437 0,498 0,556 0,608 0,657 0,700 0,739 0,774 0,805 0,836 0,856 0,877 0,895 0,910 0,923 0,935 0,945 0,953 0,960 0,966 0,971 0,976 0,979 0,982 0,985 0,989 0,992 0,994 0,996 0,997 0,998 0,998 0,998 0,999 0,999 7 Т, А, Агекян
к ф со ее ю СС ОЮ0005 чтЧ<Г<1СО^ О5 О5 О5 О5 1>05чтЧ<Г1СО^ЮС01^Г000000005 ОО 00 О5 О5 О5 О5 О5 О5 О5 О5 О5 О5 О5 О5 О5 5 О5 О5 О5 О5 00С0С>11ОС0С01О<^00С>""гН'гн1>-001ООО00С0С0^^ „ ^ ^ - — .. ^ЮС0О1>^ОС0тНС0«пЮ00тн>^[>.СЛОМс0"^ЮС0^1>С10000000С5 О-чИ(^С0С0<^Ю1-0СОСО1>-1>-1>-00000000О5О5О5О5О5О5О5СЛО5О5О5О505 ^(МСО^ЮСОСО^ГОО ) О5 О5 О5 О5 О5 О5 О5 О5 О5 0СО^ГОООСОООСМЮООО ><МСО^ьОСОСО1^1^000000О5 5 О5 О5 О5 О5 О5 О5 О5 О5 О5 О5 О5 О5 )ЮСОСО/1>-1>-1>-0000С ^(ГООО ЭО5О5 ^СО^ЮСОСОО^ О5О5О5О5О5О5О5О5 5 О5 О5 О5 О5 О5 О5 А ев о И а И о О О ю 2 СО 7 V о V ° О V/ в V/ V о У V/ V оЗ Н О М Ф о о ю ев р.
551 1>АСПРЕДЕЛЕНИЕ Г.ТЬЮДЕНТА 195 Отношение = К(а,х) называется неполной гамма-функцией. Теперь D.76) можно записать в виде D.77) Равенство D.77) решает задачу нахождения надежности при различных доверительных интервалах для а0. В то же время, очевидно, можно задавать надежность и, используя D.77), определять доверительный интервал. В таблице 7 приведены значения функции Чтобы получить требуемое значение К (а, г), нужно путем интерполяции найти из таблицы значение / (и, г), где и = —ттг-. Функция / (и, г) является более удобной для У ъ табулирования, чем К (а, г). Изложенный метод оценивания параметров при помощи доверительных интервалов используется в теории ошибок. Если постоянны определенные условия измерений, то вся совокупность возможных значений измерений есть нормальная генеральная совокупность. Плотность вероятности распределения в ней аргумента,— результаты измерения,— есть нормальная функция: - "'° • D-78) где х0 — истинное значение измеряемой величины, а а0 — средняя квадратическая ошибка одного наблюдения. 7*
196 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 1ГЛ. 4 Значения функции 1(и, ь) — - Таблица 7 ^^ 2 и ^\ 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 ^Ч. г и >,. 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 1 0,393 0,632 0,777 0,865 0,918 0,950 0,970 0,982 0,989 0,993 0,996 0,998 0,998 0,999 9 0,000 0,004 0,040 0,153 0,338 0,544 0,721 0,845 0,921 0,963 0,983 0,993 0,997 0,999 2 0,158 0,413 0,626 0,774 0,868 0,925 0,958 0,977 0,987 0,993 0,996 0,998 0,999 0,999 10 0,000 0,002 0,023 0,108 0,272 0,476 0,667 0,810 0,901 0,952 0,979 0,991 0,996 0,999 3 0,057 0,251 0,481 0,673 0,806 0,891 0,941 0,969 0,984 0,992 0,996 0,998 0,999 0,999 11 0,000 0,001 0,013 0,074 0,214 0,411 0,610 0,770 0,878 0,940 0,973 0,989 0,995 0,998 4 0,019 0,143 0,353 0,566 0,735 0,849 0,918 0,958 0,979 0,990 0,995 0,998 0,999 0,999 13 0,000 0,000 0,004 0,033 0,125 0,291 0,494 0,682 0,821 0,909 0,958 0,982 0,993 0,997 5 0,006 0,076 0,247 0,463 0,656 0,799 0,890 0,943 0,972 0,987 0,994 0,997 0,999 0,999 15 0,000 0,000 0,001 0,013 0,068 0,195 0,383 0,584 0,752 0,868 0,937 0,972 0,989 0,996 6 0,002 0,039 0,166 0,366 0,574 0,742 0,856 0,925 0,963 0,983 0,992 0,997 0,999 0,999 17 0,000 0,000 0,000 0,005 0,034 0,122 0,282 0,483 0,672 0,816 0,908 0,958 0,983 0,993 7 0,000 0,019 0,107 0,282 0,491 0,679 0,816 0,902 0,952 0,977 0,990 0,996 0,998 0,999 19 0,000 0,000 0,000 0,002 0,016 0,073 0,199 0,385 0,586 0,754 0,871 0,939 0,974 0,990 8 0,000 0,009 0,067 0,210 0,412 0,612 0,771 0,876 0,938 0,971 0,987 0,994 0,998 0,999 21 0,000 0,000 0,000 0,001 0,007 0,041 0,134 0,296 0,496 0,684 0,825 0,914 0,962 0,985 После того как выполнен ряд измерений D.41), который должен рассматриваться как случайная выборка из нормальной генеральной совокупности, и по формулам
§ 56] МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 197 D.42) и D.74) вычислены Ж и Г, равенства D.73) и D.77) используются для оценок истинного значения измеряемой величины х0 и средней квадратической ошибки наблюдения а0 методом доверительных интервалов. § 56. Косвенные измерения. Метод наименьших квадратов Во многих наблюдательных и экспериментальных исследованиях встречается такое положение, когда величины хг, х2, . . ., хт, которые требуется определить, непосредственно измерить невозможно. Однако можно измерить величины ух, у2, . . ., уп, являющиеся известными функциями величины хг, х2, . . ., хт, г\г (хг, х2, . . ., хт) = уг, 1 = 1,2,.. ., /г. D.79) Необходимо по полученным измерениям величин Ун У^ • • •» Уп вынести суждения о значениях величин Будем считать, что вид функций г], и значения входящих в них параметров известны точно. Но измерения величин уг содержат, как обычно, случайные ошибки. Рассмотрим сначала важный частный случай, когда все функции х\г являются линейными однородными, т % (*1, *2, ...,хм)= 2 аахз = Уп * = 1,2,..., п. D.80) Тогда в развернутом виде система равенств D.79) запишется так: а12х2 + ... + а1тхт = уъ D.81) причем все коэффициенты ац известны точно. Отдельные уравнения в системе D.81) называются условными уравнениями. У1? У2, . . ., Уп есть результаты измерений величин, истинные значения которых равны у1У г/2, . . ., уп.
198 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4 Поэтому У г = + I = 1, 2, . . ., /г, D.82) где бI есть случайная ошибка измерения величины у(. Как и обычно, будем считать, что случайные ошибки б* распределены по нормальному закону с математическим ожиданием, равным 0. Тогда случайная величина У* — измерение величины уг — имеет плотность вероятности = —1-е во У 2я D.83) Рассмотрим матрицу коэффициентов системы D.81): И #12 • • • а1т #21 #22 • • • #2тп ап1 ап2 - • • апп D.84) Рангом ^? матрицы называется максимальное число линейно независимых ее строк (или столбцов), рассматриваемых как векторы. Если бы ошибки в измерении величины уг равнялись нулю, то уравнения D.81) с Уг вместо уь должны были бы удовлетворяться точно, и для того чтобы система D.81) имела единственное решение, было бы необходимо и достаточно, чтобы ранг матрицы D.84) был равен т. Для этого, очевидно, необходимо, чтобы выполнялось условие п !> т. Отметим, что при п = т система D.81) имеет единственное решение, даваемое формулами Крамера: D.85) г=1 где И — определитель системы D.81), неравный нулю, так как ранг матрицы Я = т, а В^- алгебраическое дополнение элемента а^. Будем считать, что В = т, п^> т. В этом случае система D.81) называется избыточной системой.
§ 56] МЕТОД НАИМЕНЬШИХ КВАДРАТОВ 199 Если бы величины уг измерялись точно, т. е. случайные ошибки 8* были бы равны нулю, то, по предположению, в системе D.81) с Уг вместо у-ъ какие-то п — т уравнений были бы следствием остальных т уравнений, избыточная система D.81) решалась бы однозначно, т. е. существовала бы такая, притом единственная совокупность значений (хг, х2, . . ., хт), которая точно удовлетворяла бы всем уравнениям избыточной системы. На самом деле измерения величин уг содержат случайные ошибки, и уравнения избыточной системы с У\ вместо уг в какой-то мере противоречат друг другу. В общем случае не существует такой совокупности значений (хг, а?2, . . ., хт), которая при подстановке в уравнения D.81) с Уг вместо уг обратила бы эти уравнения в тождества. Для любой совокупности значений (х1У х2, . . ., хт) определим величины т *1 = Уг— 2 о«*л * = 1, 2, ..., л. D.86) Величины гг называются невязками. Имеется возможность при данном измеренном ряде значений У1? У2, . . ., Уп найти такую совокупность значений^, х2, . . ., хт1 которая удовлетворяла бы принципу наибольшего правдоподобия. Для этого в представлении D.80), поскольку коэффициенты а^ точно известны, будем рассматривать хх, х2, . . ., хт как параметры функций уг, и определим точечные оценки этих параметров. Исходя из распределений D.83), найдем плотность вероятности случайной выборки (У1, У2, . . ., Уп): п т. 2 2я)-*в 2О° г=1 ;=1 . D.87) Согласно принципу максимального правдоподобия точечными оценками хг, х2, . . ., хт являются те значения, которые обращают в максимум плотность вероятности D.87). Очевидно, что максимум D.87) достигается, когда
200 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ СГЛ. 4 функция г=1 - 2 = т1п- D- Функция D.88) имеет минимум при значениях хг, х2, . . ., хт, обращающих в нуль все ее частные производные: г=1 = 2 атг1 — т п -2 «гл^ = О» Л = 1,2,..., т. D.89) г=1 ;=1 г=1 Если обозначить = 2 аШаИ г=1 D.90) и заменить 2г на г/^, то система уравнений D.89) в развернутом виде запишется так: п с1шх = 2 г=1 п г=1 D.91) . . . + СтпХт = 2 агт#г г=1 Система уравнений D.91) называется нормальной системой избыточной системы D.81). Матрица ее коэффициентов, очевидно, квадратная и симметричная. В высшей алгебре доказывается следующая теорема: если матрица D.84) имеет ранг т, то матрица (квадратная) коэффициентов, построенных по правилу D.90), имеет ранг т. Раз ранг матрицы || ск$ || равен т, то определитель цормальной системы D.91) отличец от нуля и систему
§ 57] СУММА КВАДРАТОВ ОСТАЮЩИХСЯ ПОГРЕШНОСТЕЙ 201 имеет единственное решение. Согласно формулам Крамера п *; = 2 ь*Уи (^.92) где т ъм = тг 2 ***>& D-93) I) — определитель системы D.91), Б^ — алгебраическое дополнение элемента с^. Таким образом, чтобы получить точечные оценки величин хг, х2, . . ., х„1, необходимо по коэффициентам избыточной системы построить нормальную систему D.91) и решить ее при помощи формул D.92) и D.93), где вместо уг подставлены результаты измерений У*. Отметим важное свойство найденного решения. Сравнение D.88) и D.86) показывает, что сумма квадратов невязок условных уравнений минимальна, когда вместо х19 х2, . . ., хт подставлены их точечные оценки. В этом случае невязки называются остающимися погрешностями. Требование к совокупности неизвестных, чтобы она обращала в минимум сумму квадратов невязок для избыточной системы D.81), называется принципом наименьших квадратов или принципом Лежандра. Мы видим, что совокупность значений х19 х2, . . ., хт, полученных при решении нормальной системы D.91), отвечает не только принципу максимального правдоподобия, но и принципу наменыпих квадратов. § 57. Сумма квадратов остающихся погрешностей для точечных оценок неизвестных Рассмотрим систему равенств D.86). Помножим каждое из равенств на а^ и полученные равенства просуммируем. После изменения порядка суммирования в двойной сумме и использования D.90) находим п т 2 а«л = 2 пиУг — 2 агк 2 аихз== 2 аи?г — 2 1=1 1=1 1«1 ;=1 1=1 ;=1 D.94)
202 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4 Так как точечные оценки я,, х2, . . ., хт удовлетворяют нормальной системе D.91), то из D.94) следуют соотношения п 2<ЧА = 0, /с=1,2,...,т, D.95) которые справедливы для остаточных погрешностей, т. е. когда в условные уравнения подставлены точечные оценки неизвестных. Помножим каждое из равенств D.86) на е*; полученные равенства просуммируем и изменим порядок суммирования в двойной сумме: п п п т ^2 \^У ^ X* =1 1=1 г=1 ;"=1 п т п г=1 ;=1 г=1 Согласно D.95) двойная сумма в D.96) равна нулю и, следовательно, п п Щ — 7\ *■ гЩ» V***'*/ г=1 г=1 Помножим каждое из равенств D.86) на Уг и просуммируем: п п п т 2 Угч = 2 ^ - 2 г« 2 «л- D-98) г=1 г==1 г=1 ;=1 Изменив порядок суммирования в двойной сумме и использовав D.97), находим п п т п б! = 2л у* — 2л хд 2л аи^г- D.99) г=1 г=1 ;=1 г=1 Равенства D.97) и D.99) справедливы, если в них фигурируют точечные оценки хг, х2, . . ., хт и соответствующие им остающиеся погрешности.
§ 58] ОЦЕНИВАНИЕ НЕИЗВЕСТНЫХ 203 § 58. Оценивание неизвестных в способе наименьших квадратов при помощи доверительного интервала Когда система уравнений избыточная, условные уравнения вследствие случайных ошибок в измерениях уг противоречат друг другу, и сумма квадратов остаточных погрешностей отлична от нуля. Используя D.92), напишем равенство D.99) в виде 2 «* = 2 у? - 2 2 № 2 <*у<, ( 1=1 г=1 ;=1 8=1 г=1 где коэффициенты Ь87- определяются выражениями D.93). В равенстве D.100) правая часть представлена непосредственно через измеренные величины Уг и коэффициенты избыточной системы. Измерения У* являются случайными величинами, поэтому определяемая ими сумма квадратов остающихся погрешностей также является случайной величиной. Подставим в D.100) равенства D.82) и выполним простейшие преобразования: г=1 г=1 г=1 г=1 т п п т п п ~ 2 2 ЪязУ* 2 аг;Уг ~ 2 2 ^Ув 2 аг^1 ~ ;=1 8=1 г=1 ;=1 8=1 г=1 т п п т п п - 2 2 м* 2 ад -22 ьл 2 «л- D.Ю1) Э^\ 8=1 г=1 ;"=1 8=1 г=1 Как уже отмечалось выше, если бы в измерениях величин уг случайные ошибки были равны нулю, то избыточная система D.81) с Уг вместо уь решалась бы точно, сумма квадратов остающихся погрешностей была бы равна нулю. Правая часть равенства D.100) при б^О равна нулю. Следовательно, первый и четвертый члены правой части D.101) взаимно уничтожаются.
204 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИИ [ГЛ. 4 Найдем математическое ожидание случайной вели- п чины 2 е?- Так как измерения различных уг взаимно г=1 независимы, М688* = 0, если 5 ф I. D.102) Следовательно, в последней сумме правой части D.101) отличны от нуля математические ожидания лишь тех слагаемых, у которых N = I. Очевидно также, что МЬг = 0, D.103) Мб? = а20 D.104) для всех значений г; а0 — средняя квадратическая ошибка измерений уг. Итак, получаем п т п М^г\ = т1^ б20 2 2 аЛг D.105) г=1 ;=1 8=1 При помощи равенств D.93) и D.90) находим п п т 2а«ь«= "о" 2 а«- 2 а*/А? = 8=1 8=1 к=1 т п т 22 42 = 1 D-106) Й=1 8=1 /С=1 независимо от значения ;'. Поэтому получаем п М 2 е? = (л - т) б?. D.107) г=1 В общем случае средние квадратические ошибки измерений уг отличны от а0 и различны между собой. Их величины определяются соотношением коэффициентов избыточной системы условных уравнений. Точечные оценки неизвестных х$ выражаются через измеряемые величины Уг при помощи линейных соотношений D.92). Поэтому согласно закону распространения средней ошибки п о? = з20 2 Ъ%. D.108) г=1
58] ОЦЕНИВАНИЕ НЕИЗВЕСТНЫХ 205 Используя D.93), находим ( 1=1 4=1 т т п т га -яг 2 2 АЛ 2 <Ч/А* = 4г 2 Аа 2 Аа***- D.Ю9) - -яг 2 2 АЛ 2 <Ч/А* = 4 Рассмотрим выражение 2 Л/Л*- D.110) /1=1 Если /с ^= /, то D.110) представляет собой сумму произведений алгебраических дополнений элементов /-го столбца определителя на соответствующие элементы другого столбца, что, как известно из теории определителей, равно нулю. Для значений же к = / выражение D.110) равно определителю Б. Поэтому получаем 2»Ь=Зг. D.114) 1=1 и искомые соотношения для средних квадратических ошибок таковы: ^-, 7 = 1, 2,..., т. D.112) Сравнивая D.107) и D.112), находим п М %$ = (п-т)±<$. D.113) г=1 "Я Напишем это равенство в виде М^^-^^о) D.114) и сравним его с равенством D.29). В обоих этих равенствах случайная величина, стоящая под знаком математического ожидания, есть цроизведение
200 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4 постоянного коэффициента на случайную величину, являющуюся суммой квадратов отклонений от значений выражений, которые получаются, если в эти выражения вместо измеряемых величин подставить их точечные оценки. Что касается постоянных коэффициентов, то множителю (п — 1) в равенстве D.29), которое относится к задаче с одной измеряемой величиной, в равенстве D.114), относящемся к задаче с т измеряемыми величинами, соответствует множитель (п — т). Множителю п в равенстве D.29) соответствует множитель В1Вц в равенстве D.114). § 59. Проверка гипотез о функции распределения аргумента. Критерий согласия Одной из задач математической статистики является вынесение суждения о функции распределения аргумента в статистическом коллективе по полученной случайной выборке. До сих пор предполагалось, что закон рапределения аргумента известен с точностью до параметров, которые нужно было оценить. Рассмотрим теперь задачу, состоящую в том, чтобы проверить некоторую гипотезу о функции распределения аргумента в статистическом коллективе, определив, совместима ли она с данными полученной случайной выборки из статистического коллектива. Предположим, что следует проверить гипотезу состоящую в том, что плотность вероятности аргемента в статистическом коллективе есть / (х). Разобьем промежуток возможных значений х на к интервалов [*г-ъ **Ь « = 1, 2, ..., А. D.115) Тогда вероятность того, что аргумент статистического коллектива примет значение внутри 1-го интервала, равна Л = $ !(х)Ах1 4 = 1,2,...,*. D.116) 4-1 Допустим, что в полученной случайной выборке объема п частоты, соответствующие интервалам аргумента D.115),
§ 59] ПРОВЕРКА ГИПОТЕЗ О ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 20? оказались равными ти т2, . . ., тк. D.117) Не противоречит ли этот результат принятой гипотезе? Если объем случайной выборки равен п, то при справедливости гипотезы математические ожидания соответствующих интервалам D.115) частот равны прг, пр2, . . ., прк. D.118) Совокупность отклонений полученных частот от их математических ожиданий должна показать, можно ли их объяснять случайностью или же следует считать, что принятая гипотеза неверна. Для решения задачи используем результаты §47, в котором было показано, что случайная величина при п 2 -> °> D 12()\ I = 1, 2, . . ., *, имеет асимптотическое распределение, такое же, как и случайная величина %2, рассмотренная в § 46 и соответствующая числу слагаемых в сумме C.120), равном /с—1, т- е- Хк-1- Как показывает ход доказательства в § 47, уменьшение на 1 номера при %2 вызвано тем, что среди слагаемых в сумме D.119) независимых всего к — 1, так как должно выполняться условие нормировки к к 2 *« = 2 "А = п- D.121) г=1 г=1 Если принятая в гипотезе функция распределения / {х) определяется / параметрами, то, чтобы вычислить вероятности D.116), нужно сначала определить значения параметров. Для этого можно применить метод наибольшего правдоподобия. Как было показано в § 51, при этом определяется / соотношений D.32), связывающих функцию распределения со значениями аргумента в случайной
208 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ 1ГЛ. 4 выборке. Это равносильно тому, что в сумме D.119) еще / слагаемых будут зависимыми от других, число независимых слагаемых станет равным к — 1—1. Соответственно рассуждения, аналогичные проведенным в § 47, покажут, что функция распредления величины [7, определяемой равенством D.119), совпадает с функцией распределения 3& где х = к — I — 1. Таким образом, если функция / (х) описывается I па* раметрами, которые вычислены методом наибольшего правдоподобия по случайной выборке, определяемой числами D.117), то случайная величина D.119), где р1 задаются равенствами D.116), при выполнении условий D.120) имеет асимптотическое распределение с плотностью / (и, х) = *т-т и»* 1 Г "", D.122) где и = к — I — 1. Если гипотеза верна, то отличие величины II от нуля вызывается случайными отклонениями частот ш* от их математических ожиданий прг- Интеграл 1 ? -±-« Р(м,х) = 7-гт\'х/2-1е 2 л D-123) равен, следовательно, вероятности того, что при справедливости проверяемой гипотезы величина D.119) примет значение, не меньшее и. Если при подстановке вместо и вычисленного по случайной выборке значения V эта величина будет мала, то едва ли можно допустить, что соответствующее событие произошло: будет больше оснований считать, что значительные отклонения т^ от пр^ вызваны неверностью гипотезы о функции распределения аргумента в статистическом коллективе. В противном случае можно сделать вывод о возможности объяснения отклонений тг от прг случайностью и заключить, что данные наблюденной случайной выборки не противоречат гипотезе. Как бы близка к единице полученная величина ни была, нельзя утверждать, что доказана справедливость гипотезы. Можно лишь
§ 59] ПРОВЕРКА ГИПОТЕЗ О ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 209 Таблица 8 Значения и, отвечающие к и оо 1 1 Г */2~1 ~ ~2 X х X 1 2 3 4 5 6 7 8 9 10 И 12 13 14 15 16 17 18 19 20 X х X 1 2 3 4 5 6 7 8 9 10 И 12 13 14 0,99 0,00016 0,020 0,115 0,30 0,55 0,87 1,24 1,65 2,09 2,56 3,1 3,6 4,1 4,7 5,2 5,8 6,4 7,0 7,6 8,3 0,20 1,64 3,22 4,64 6,0 7,3 8,6 9,8 11,0 12,2 13,4 14,6 15,8 17,0 18,2 0,98 0,0006 0,040 0,185 0,43 0,75 1,13 1,56 2,03 2,53 3,06 3,6 4,2 4,8 5,4 6,0 6,6 7,3 7,9 8,6 9,2 0,10 2,7 4,6 6,3 7,8 9,2 10,6 12,0 13,4 14,7 16,0 17,3 18,5 19,8 21,1 0,95 0,0039 0,103 0,352 0,71 1,14 1,63 2,17 2,73 3,32 3,94 4,6 5,2 5,9 6,6 7,3 8,0 8,7 9,4 10,1 10,9 0,05 3,8 6,0 7,8 9,5 11,1 12,6 14,1 15,5 16,9 18,3 19,7 21,0 22,4 23,7 О.90 0,016 0,211 0,584 1,06 1,61 2,20 2,83 3,49 4,17 4,86 5,6 6,3 7,0 7,8 8,5 9,3 10,1 10,9 11,7 12,4 0,02 5,4 7,8 9,8 11,7 13,4 15,0 16,6 18,2 19,7 21,2 22,6 24,1 25,5 26,9 0,80 0,064 0,446 1,005 1,65 2,34 3,07 3,82 4,59 5,38 6,18 7,0 7,8 8,6 9,5 10,3 11,2 12,0 12,9 13,7 14,6 0,01 6,6 9,2 11,3 13,3 15,1 16,8 18,5 20,1 21,7 23,3 24,7 26,2 27,7 29,1 0,70 0,148 0,713 1,424 2,19 3,00 3,83 4,67 5,53 6,39 7,27 8,1 9,0 9/9 10,8 11,7 12,6 13,5 14,4 15,4 16,3 0,005 7,9 11,6 12,8 14,9 16,3 18,6 20,3 21,9 23,6 25,2 26,8 28,3 29,8 31 0,50 0,455 1,386 2,266 3,36 4,35 5,35 6,35 7,34 8,34 9,34 10,3 11,3 12,3 13,3 14,3 15,3 16,3 17,3 18,3 19,3 0,002 9,5 12,4 14,8 16,9 18,9 20,7 22,6 24,3 26,1 27,7 29,4 31 32,5 34 0,30 ) 1,07 ) 2,41 > 3,66 4,9 6,1 7,2 8,4 9,5 10,7 11,8 12,9 14,0 15,1 16,2 17,3 18,4 19,5 20,6 21,7 22,8 0,001 10,83 13,8 16,3 18,5 20,5 22,5 24,3 26,1 27,9 29,6 31,3 32,9 34,5 36,1
210 ОЦЕНИВАНИЕ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЙ [ГЛ. 4 .\ 15 16 17 18 19 20 0,20 19,3 20,5 21,6 22,8 23,9 25,0 0,10 22,3 23,5 24,8 26,0 27,2 28,4 0,05 25,0 26,3 27,6 28,9 30,1 31,4 0,02 28,3 29,6 31,0 32,3 33,7 35,0 Табли ца < 0,01 30,6 32,0 33,4 34,8 36,2 37,6 0,005 32,5 34 35,5 37 38,5 40 э (продолжение) 0,002 35,5 37 38,5 40 41,5 43 0,001 37,7 39,2 40,8 42,3 43,8 45,3 сказать, что гипотеза не отвергается. Однако, если объем выборки п достаточно велик (необходимо при этом, чтобы каждое из тпх было достаточно велико) и вычисленная величина Р (и, х) оказалась немалой в сравнении с единицей, то естественно считать, что истинная функция распределения аргумента в статистическом коллективе близка к гипотетической. В таблице 8 приведены значения и, соответствующие значениям Р (и, х) и числу степеней свободы х. Можно считать, например, что если при данных значениях и и х Р (и, х) ]> 0,05, то результаты случайной выборки не противоречат принятой гипотезе. Задача 71. Измерение лучевых скоростей 300 галактик в скоплении галактик дало следующие результаты: Таблица 9 Интервал скоростей, км/сек 2170—2200 2200—2230 2230—2260 2260—2290 2290—2320 2320—2350 2350—2380 2380-2410 Число галактик, т^ И ) 18 29 28 36 39 30 Интервал скоростей, км/сек 2410—2440 2440—2470 2470—2500 2500—2530 2530—2560 2560—2590 2590—2620 Число галактик, тп. 27 20 20 14 10 12 1 2 / Опредить, противоречат ли эти данные предположению о максвелловском распределении скоростей галактик в скоплениях.
§ 59] ПРОВЕРКА ГИПОТЕЗ О ФУНКЦИИ РАСПРЕДЕЛЕНИЯ 211 Решение. При максвелловском распределении скоростей (см. задачу 62) распределение проекций скоростей на любое направление является нормальным. Следовательно, рассматриваемая гипотеза состоит в том, что функция распределения лучевых скоростей X имеет вид Как было показано в § 53, в нормальной генеральной совокупности точечная оценка среднего значения аргумента, даваемая принципом наибольшего правдоподобия, равна выборочному среднему, а точечная оценка дисперсии статистического коллектива равна выборочной дисперсии. Таким образом, точечные оценки к Хо = X = -^- 2л щХг = 2378, к б0 = б = Г 2 тг (хг — %)\ г = 122,7. "- П г=1 * С этими значениями Хо и <т0, используя таблицу 1 значений нормальной функции, можно вычислить по формуле D.116) вероятности рг. После этого при помощи D.119) вычисляем: V = 29,6. Таблица 8 показывает, что при х = 13—2—1 = 10 к у-у (ПЬ — пр.J вероятность того, что случайная величина 2л — г=1 г примет значение, равное 29,6 или большее, равна 0,001. Таким образом, полученная выборка лучевых скоростей противоречит гипотезе о максвелловском распределении скоростей галактик в скоплениях.
Глава 5 СЛУЧАЙНАЯ ФУНКЦИЯ § 60. Понятие случайной функции Случайной функцией X (I) называется такая функция, которая для любого значения своего аргумента является случайной величиной. Таким образом, если мы выберем какие-то п произвольных значений аргумента *1, *,, • • ., *п, E.1) то им будет соответствовать п случайных величин Хг = X (^), Х2 = X (*а), . . . , Хп = X (*п). E.2) Каждая из этих случайных величин характеризуется некоторой плотностью вероятности, В общем случае задания плотностей вероятности к (*1), /1 (*.), • • ., /1 (*») E.3) случайных величин E.2) при любом выборе совокупно - стей значений аргумента E.1) недостаточно для задания случайной функции X (г). Необходимо (и достаточно)» чтобы были заданы все многомерные (конечномерные) плотности вероятности 1п 0*1. Х2> • • •. *п) E.4) для любых совокупностей E.1) значений аргумента. Вместо употребления записи E.1) и E.4) удобнее многомерную плотность вероятности записывать сразу в виде ]п (^1? #1» ^2» Хч\ • • •> ^п» Хп). E.5) Если п — 1, то соответствующая плотность вероятности E.5) называется одномерной, если п = 2, то двумерной и т. д. Случайная функция определяется своими плотностями вероятности всех порядков. Если пространство заполнено движущимися частицами, то число частиц внутри некоторого фиксированного объема есть случайная функция времени. В каждый момент времени число частиц в объеме является случа иной
§ 60] ПОНЯТИЕ СЛУЧАЙНОЙ ФУНКЦИИ 213 величиной, подчиняющейся распределению Пуассона. Но эти случайные величины для различных моментов времени взаимно зависимы. Если, например, в некоторый момент времени число частиц в объеме превышает среднее число частиц для этого объема, то через промежуток времени, малый в сравнении со средним временем пересечения частицей объема, условные вероятности больших чисел частиц в объеме больше, чем в том случае, если число частиц в первый момент было ниже среднего. Рассматривая в том же примере в некоторый фиксированный момент времени число частиц внутри объема, который может занимать различные положения вдоль некоторой координаты, мы получим случайную функцию, аргументом которой является координата центра объема. В этих примерах аргумент изменяется непрерывно, случайная же функция принимает дискретные, только целочисленные, значения. Последний из приведенных примеров показывает, что термин «случайный процесс» не следует понимать в том смысле, что аргументом случайной функции должно быть обязательно время. Однако в дальнейшем для краткости мы будем рассуждать так, как если бы аргументом случайной функции являлось время. Примером случайной функции может служить видимая величина ярчайшей (или к-й по яркости) звезды в перемещаемой площадке неба, как функция координаты. Случайной функцией является высота точки поверхности моря, как функция координаты в некоторый фиксированный момент времени. Другой случайной функцией, характеризующей волновые явления на море, является высота поверхности моря при фиксированных координатах, как функция времени. Примером случайной функции также является скорость движения молекулы в газе как функция времени. Скорость молекулы все время изменяется в результате случайных столкновений с другими молекулами. Также и скорость звезды в звездном поле, изменяющаяся при случайных сближениях с другими звездами, есть случайная функция. Толщина нити, вырабатываемой прядильным станком, также пример случайной функции аргумента — длины нити, отсчитываемой от некоторого начала. Случайные функции можно изучать и теоретически и при помощи поставленных наблюдений или опытов.
214 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. 5 Если опыт над случайной функцией поставлен один раз, то будет получена одна реализация случайной функции для некоторого промежутка [а, Ь] изменения аргумента и Если, добиваясь точного вопроизводства условий, опыт а.) Рис. 15. повторять многократно, 'то будет получен ряд реализаций случайнои"функции. Построенные графики результатов, примеры которых приведены на рисунках 15 а, б, в, позволяют вынести некоторые суждения о характере случайных функций.
§ 61] КЛАССИФИКАЦИЯ СЛУЧАЙНЫХ ФУНКЦИЙ 215 § 61. Классификация случайных функций У некоторых случайных функций аргумент I может принимать лишь дискретные значения. В этом случае случайная функция называется случайной последовательностью. Основное значение в физике и астрономии имеют случайные функции с непрерывно изменяющимся аргументом. Такие случайные функции называются случайными процессами. Все приведенные выше примеры случайных функций есть случайные процессы. Значения самой случайной функции также могут быть дискретными величинами. В этом случае процесс называют процессом с дискретным пространством состояний. В приведенных примерах такова случайная функция — число частиц внутри некоторого объема как функция координаты или функция времени. Очевидно, что эта случайная функция может принимать лишь целые неотрицательные значения. Во всех других приведенных примерах случайная функция может принимать любые значения из некоторого промежутка. Если случайная величина может принимать лишь дискретные значения, то вместо совокупности всех конечномерных плотностей вероятностей она может характеризоваться всеми соответствующими конечномерными вероятностями Рп (*ь *и *2> *ъ\ • • •'» «п. «п)- E.6) E.6) есть вероятность того, что при значениях аргумента E.1) случайная функция примет соответственно значения E.2). Можно, конечно, в этом случае рассматривать и плотности вероятностей при помощи изложенного в § 19 приема, основанного на использовании дельта- функции. Если распределение случайной функции не зависят от начала отсчета аргумента, то она называется стационарной. Необходимым и достаточным условием стационарности случайной функции является выполнение равенства = /п (*1 + *о, хи к + *о, я2; . . .; 1п + *0, *п) E.7)
216 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. 5 при любом выборе E.1) и любом 10. Таким образом, многомерные плотности вероятности, определяющие случайную функцию, у стационарной случайной функции зависят только от разностей значений аргументов 1и 22,. . . . . ., ^, а не от самих значений этих аргументов. Это становится очевидным, если, положив 10 равным —1и мы напишем E.7) в виде /п (^1? ^1? ^21 ^2? • • •? ^П? Хп) ~ = /п @, хг\ г2 — ги х2; . . .; 1п — 1и хп). E.8) Одномерная плотность вероятности при этом не зависит от аргумента, так как К (*, х) = Л (* - *, х) = и @, х) = !г (х). Физически стационарность случайного процесса означает неизменность условий при изменении аргумента I. В упомянутом выше примере с заполняющими пространство движущимися частицами случайные функции будут стационарными, если частицы заполняют пространство равномерно, а закон распределения компонентов скоростей сферически-симметричен и во всех точках пространства одинаков. Видимая величина ярчайшей звезды в перемещающейся площадке является стационарной случайной функцией, если площадка перемещается вдоль параллели галактической широты, так как распределение звезд по видимым величинам в площадках с одинаковой галактической широтой можно считать неизменным. Но если площадка перемещается так, что ее галактическая широта изменяется, то рассматриваемый случайный процесс будет нестационарным, условия перестают быть неизменными, с уменьшением галактической широты число звезд в площадке возрастает и изменяется их распределение по видимым величинам. В примере, в котором случайной функцией является высота точки поверхности моря, при аргументе — координате точки, стационарность будет в том случае, когда вся рассматриваемая область моря находится в одинаковых усовиях, она не содержит бухт, где волны слабее, чем в открытом море, и не настолько обширна, чтобы условия на периферии из-за иного микроклимата отличались от
§ 61] КЛАССИФИКАЦИЯ СЛУЧАЙНЫХ ФУНКЦИЙ 217 условий в центральной части области. Если же для тай же случайной функции аргументом является время, то для стационарности нужно, чтобы в течение рассматриваемого промежутка времени соотношение между высотой волн и силой и направлением ветра было таким, чтобы волны не возрастали и не ослабевали, общее состояние поверхности моря оставалось неизменным во времени. Для того чтобы случайная функция — толщина нити была стационарной, необходимо, чтобы в течение рассматриваемого промежутка времени был неизменен режим работы станка. Случайные процессы, изображенные графиками нескольких их реализаций на рис. 15, а, имеют черты стационарного процесса. На рис. 15, б приведены реализации, характерные для нестационарных процессов. Категорично утверждать это на основании графика, разумеется, нельзя. Процесс X (I) называется стохастически непрерывным, если при любом е ^> О Ит Р{\ХA + М) — X @1 > е} - 0. E.9) А1-+0 Случайный процесс X (*) называется чисто разрывным, если для любого промежутка аргумента [*, г + А^] функция X с вероятностью 1 — р {I, х) А* — о (А^) остается неизменной, равной X (г), и лишь с вероятностью р B, х) А^ + о (А^) • может претерпеть изменение. Таким образом, при чисто разрывном случайном процессе случайная функция может изменяться только скачкообразно. Пример чисто разрывного процесса приведен на рис. 16. В приведенных выше примерах случайные функции — число частиц в некотором объеме как функция времени или координаты, а также видимая величина ярчайшей (или &-й по яркости) звезды в площадке как функция координаты, являются чисто разрывными случайными процессами. Допустим, что для любых значений аргумента E.1), удовлетворяющих условиям ^ <22 < • • • <*п» и любых чисел х1} я?, . . . , хц, E.10)
218 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. 5 которые в некоторой реализации приняла случайная функция, условная вероятность того, что для значения аргумента 2п+1 ]> 1п случайная функция примет значение в промежутке [хп+1, хп+1 + й#п+1] при условии, что X (^) попало в промежуток [хг, хг + д,хг] A = 1, . . ., п), зависит только от хп, и не зависит от х±, х2, . . ., хп^г. Тогда ^случайный процесс называется марковским или процессом без последействия. Рис. 16. Из приведенных выше примеров марковским является процесс изменения скорости молекулы при столкновениях с другими молекулами и изменение скорости звезды в результате сближений с другими звездами. Вероятность того, что молекула будет иметь скорость в заданном промежутке в некоторый последующий момент, при условии, что в момент I ее скорость была равна х, зависит от х, но не зависит от того, какие скорости имела молекула в течение времени, предшествующего моменту I. Остальные приведенные примеры случайных процессов являются немарковскими. Определение марковского процесса показывает, что он полностью задается двумерными плотностями вероятностей, так как для марковского процесса =/2 (*ъ хи *2, я2)/2 (*2, х2; *3, х3)... /2 (*п_1, хп^; *п, хп). E.11) Задача 72. Плотность числа частиц в пространстве постоянна, составляет п частиц в единице объема. Найти конечномерные распределения случайной функции — чи-
§ 611 КЛАССИФИКАЦИЯ СЛУЧАЙНЫХ ФУНКЦИЙ 219 ела частиц в фиксированный момент времени внутри цилиндра, который может занимать различные положения, так что ось его при этом совпадает с некоторой фиксированной прямой. Объем цилиндра равен 1, площадь его основания равна 1. Решение. Вследствие того, что плотность заполнения пространства частицами во всей области постоянна, рассматриваемый случайный процесс стационарный. Случайная функция — число частиц — может принимать I Рис. 17. только целые неотрицательные значения. Аргументом является расстояние центра цилиндра от некоторой точки на фиксированной прямой (рис. 17). Одномерное распределение является законом Пуассона и не зависит от значения аргумента, E.12) х\ Для нахождения двумерного распределения рассмотрим два значения аргумента 1Х и *2 и сдвиг цилиндра обозначим т = *2 — *1- Высота цилиндра равна 1. Если сдвиг цилиндра т > 1, то число частиц внутри цилиндра при I — *2 не зависит от числа частиц при I = 1и и (х± -п ^1г Пусть теперь т <;1. Числа частиц в трех цилиндрических областях высотою т, 1 — т и т, изображенных на рис. 17 и обозначенных римскими цифрами /, // Щ III, независимы друг от друга. Поэтому, найдя вероятности того, что в области / число частиц равно хх — х, в области // — х, в области /// — х2 — х, и просуммировав по
220 Случайная функция [гл. 5 всем возможным значениям х, т. е. от 0 до меньшего из чисел хх и :г2, найдем искомую вероятность: Р (*ь хх; *2, х2) = [A -х)п]хе-^-^п (хп)х^ е~™ (хп)х*~* е~™ __ ^ К\ (XI — И)! Т \* E.14) *еЬУ 2 ,/ !,/ Г,- ^-» К\ (XI — К)\ (Х2 — К)\ Рассуждая таким же образом, можно найти распределения всех размерностей. Получаемые выражения, однако, становятся все более сложными. Задача 73. Среднее число звезд до видимой величины тп в одном квадратном градусе поверхности неба на галактической широте Ъ равно N (т). Найти распределение случайной функции — видимой величины ярчайшей звезды в квадратной площадке площадью 1 кв. градус при перемещении площадки вдоль галактической параллели. Решение. Так как при перемещении площадки галактическая широта Ъ остается постоянной, процесс можно считать стационарным. Аргументом случайной функции является расстояние центра площадки от некоторой точки на галактической параллели. Согласно решению задачи 49 вероятность того, что видимая величина ярчайшей звезды в площадке заключена в промежутке [т, т + йт], равна А (*, т) йт = А @, т)йт = *-*< № (т) йт. E.15) Для нахождения двумерной плотности вероятности снова воспользуемся рис. 17. Обозначим сдвиг площадки т = г2 — *1. Если т ^> 1, то видимые величины ярчайших звезд в площадке при I = 1Х и I = 12 независимы друг от друга; следовательно, в этом случае /2 @, тх; т, го2) йтгйтъ = = б-*(пч> дг' {т^йтг-е-*^ ЛГ' (т^йтг. E.16) Пусть теперь т<1. Предположим, что т1^>т2. Тогда вероятность того, что до сдвига видимая величина
§ 61] КЛАССИФИКАЦИЯ СЛУЧАЙНЫХ ФУНКЦИЙ 221 ярчайшей звезды заключена в [т1, т1 -\- йт^, а после сдвига — в промежутке [т2, т2 -\- йт2], равна вероятности первого события, помноженной на вероятность того, что в области /// на рис. 17 видимая величина ярчайшей звезды находится в промежутке [т2, т2 + йт2]. Таким образом, при т1 ^> т2 = е-ттг) Я' (тг) йщег^^хМ' (т2) йтг. E.17) В случае т1<С.т2 индексы 1 и 2 в правой части E.17) нужно поменять местами. Случай тх = т2 следует рассмотреть особо. Вероятность того, что до и после сдвига видимая величина ярчайшей звезды площадки находится в промежутке [т1? тх + йгпх], равна произведению вероятности, что видимая величина ярчайшей звезды в области // находится в промежутке [ть тп1 + йтпх], и вероятности того, что и в области / и в области /// видимая величина ярчайшей звезды больше тх. Таким образом, /2 @, тх\ т, тг) йтг = = в-A-т^(то A - г) ЛГ (тг) им*-**"™. E.18) Условие тг = т2 будет выполнено и в том случае, когда в области /ив области 77/ видимая величина ярчайшей звезды заключена в промежутке [ти ш1 + йтх], а в области // видимая величина ярчайшей звезды больше тг. Но вероятность этого события — бесконечно малая более высокого порядка, чем E.18). Аналогично рассуждая, можно получить плотности вероятностей любых размерностей для случайной функции. Например, если *8 — *1 < 1 и тг > т2 > ^з» то /з @, тг; хи т2; т2, т3) = = е-"^№ (т^е-^^ТгЩтг) гт^(т») т2#(т3), E.19) где тг = 1% — ги т2 = *3 — ^1.
222 СЛУЧАЙНАЯ ФУНКЦИЯ 1ГЛ. 6 § 62. Математическое ожидание функции «|BГ(е1>, Х(г2),..., Х(Ьп)). Моментные функции случайных функций. Математическое ожидание; дисперсия Если случайный процесс задан своими плотностями вероятности E.5), то математическое ожидание функции г) (X &), X (*,), . . ., X Aп)) —оо —оо —оо X /п (*ь хг; *а, х2;...; *п, хп) йхх йх2... йхп. E.20) Это определение соответствует определению математического ожидания функции случайного вектора. Математическое ожидание E.20) является, очевидно, функцией При г] (х) = х выражение E.20) даст математическое ожидание самой случайной функции: E.21) В общем случае, если случайная функция нестационарна, ее математическое ожидание изменяется вместе с аргументом. Начальной /г-мерной моментной функцией случайной функции называется К, *.,..., кп (*ь и,.... *п) = м [х^Aг) хка(ь)... х*»(у] = —оо —оо —оо X /п(*ь хг; 12, х2;...; (п, хп) д,ххйх2... Ахп. E.22) Сумма п 2*{ = ^ E-23) г=1
§ 62] МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ ФУНКЦИИ 223 называется порядком моментной функции. Математическое ожидание E.21) самой случайной функции есть ее одномерная начальная моментная функция порядка 1. Центральной /г-мерной моментной функцией случайной функции называется = М[{ХХ - Хх)^{Хг - Х2)*\.. (Хп - Хп)Ц = *1 - *!)*' {хг - Хг)кг ...(*» - Хп)к" X —оо —оо —оо X /п (*ь хг] г2, х2;...; гп, Хп) йххйх2... йхп1 E.24) где Хг = X (*г), Хг = Х (Ц). Одномерная центральная моментная функция первого порядка случайной функции очевидно тождественно равна нулю: оо М<)= 5 [*-^@1/1 («.*)** = Я @ —-^@ = 0. E.25) Дисперсией случайной функции называется ее центральная одномерная моментная функция второго порядка, л @ = МО = оо = $ (х-Х-Ц1)I1Ц,х)йх. E.26) Если случайная функция стационарная, то ее одномерная вероятность не зависит от значения аргумента. Следовательно, все ее одномерные моментные функции также не зависят от аргумента. В частности, у стационарной функции ее математическое ожидание и дисперсия (если они существуют) являются постоянными величинами, не зависящими от значения аргумента: МХ @ = X, E.27) М (X @ - XJ = Я. E.28) Наряду со случайной функцией X {I) рассмотрим случайную функцию У (г), отличающуюся от X (I) на
224 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. 5 неслучайную функцию X (г): У{1) = Х (I) - X (г). E.29) Математическое ожидание случайной функции У (I), как легко видеть, равно нулю М [У (*)] = МХ @ - X (*) = X @ - X (I) = 0. E.30) Случайные функции, обладающие тем свойством, что их математическое ожидание при любых значениях аргумента равно нулю, называются центрированными. У центрированных случайных функций центральные момент- ные функции совпадают с начальными моментными функциями. Это обстоятельство упрощает запись многих выражений. В дальнейшем мы во многих случаях будем считать, что переход E.29) у стационарной случайной функции уже совершен, и рассматривать центрированные случайные функции. § 63. Корреляционная функция Двумерная центральная моментная функция второго порядка случайной функции называется корреляционной функцией, к (*ь *а) = м {[х м - х &)] [х (и) - х (ад = —оо —оо Непосредственно видно, что корреляционная функция симметрична относительно своих аргументов, К &, 12) = К (^2, 1г). Корреляционная функция — важная характеристика случайной функции. Она является простейшей неодномерной моментной функцией случайной функции и характеризует степень зависимости между значениями, которые может принимать случайная функция для двух различных значений аргумента. Добавление к случайной функции неслучайной функции не изменяет корреляционной функции. В самом деле, если
| 63 КОРРЕЛЯЦИОННАЯ ФУНКЦИЯ 225 то поэтому = М {[X &) — Очевидно, что Г(*) = *™ к а, [Х(, *)- ) + у а (а) — X )• E E .32) .33) корреляционная функция положительна и равна дисперсии случайной функции при значении аргумента г. Если 12 — *1 -*" °°» т0 часто зависимость между значениями, которые может принимать случайная функция при значениях аргумента 1Х и 22» ослабевает, становится справедливым соотношение К (*ь х\\ *2> ^г) ~Л (^1» ^0 Л (*2> ^)> E.34) корреляционная функция стремится к нулю, так как она согласно E.31) превращается в произведение двух одномерных центральных моментов первого порядка. Конечно, если значения случайной функции взаимно независимы при значениях аргументов гг, 12, разность которых конечна, то уже для этих значений аргументов корреляционная функция равна нулю. Для стационарной функции К {гъ г2) = —оо —оо = К0(г2 — 1г). E.35) т. е. корреляционная функция зависит только от разности значений аргументов. Из симметричности К (гг, 1г) относительно своих аргументов ги 12 следует, что корреляционная функция Ко есть четная функция своего аргумента: Ко (- т) = Ко (т). E.36) В общем случае с увеличением разности 1г — 1г корреляционная функция убывает не обязательно монотонно. Однако в большинстве астрономических и физических приложений случайной функции, в особенности для 1[%Ъ Т, Л, Агекян
226 СЛУЧАЙНАЯ ФУНКЦИЯ 1.ГЛ. 5 стационарных процессов, корреляционная функция есть монотонно убывающая функция *2 — Ь1ш Для стационарного процесса корреляционную функцию можно приближенно определять по реализациям случайной функции. Для этого интеграл в E.35) заменяется суммой || . I + *)- *81> E-37) ;=1 ; г=1 где Здесь Х7- (^) — значения случайной функции в ;-й реализации при значениях аргумента I = г^г. Эти величины получаются из измерений. Для приближенного вычисления корреляционной функции нестационарного процесса нужно иметь большое число реализаций случайной функции, чтобы иметь основание для замены в E.35) интеграла суммой К (*ь *,)« 4~ 2 [X, (*0 - X* (Ь)] {Х> (*а) - Xя (к)], E.38) где 8 У*8 //\ _ ^ ^ У /Л /К 0О\ Если при возрастании т корреляционная функция, найденная по ее практическим реализациям, убывает монотонно, то ее часто удобно аппроксимировать выражением ИЛИ Итак, если случайная функция стационарна, то ее математическое ожидание постоянно, а корреляционная функция есть функция только разности аргументов. Обратное утверждение неверно, т. е. из постоянства мате-
§ 63] КОРРЕЛЯЦИОННАЯ ФУНКЦИЯ 227 матического ожидания и зависимости корреляционной функции только от разности аргументов не следует, что случайный процесс стационарен. Однако эти условия накладывают сильные ограничения на распределения. Случайные процессы, им удовлетворяющие, называют стационарными в широком смысле. Задача 74. Определить корреляционную функцию для случайного процесса рассмотренного в задаче 72. Решение. Если при первом положении цилиндр содержал хг частиц и при мысленном его смещении на расстояние т <^ 1 цилиндр с одной стороны оставили к частиц, а с другой стороны цилиндр вобрал 5 частиц, то число частиц в цилиндре при втором положении окажется равным Х2 = X, — А, + *?. Поэтому для т < 1 Ко (т) = М [{Хг - п) (Ха - п)] - оо Хг оо = 2 2 2 (*1 —») (*1 —х +■5—п)х ^=0 Х=о 3=0 х —г- и/ 1ч» т A — хI 1—п— • E-40) Распределение X! в E.40) пуассоновское со средним п. Распределение * биномиальное, так как оно определяет вероятность попадания X частиц в часть цилиндра, если число частиц во всем цилиндре равно хг. Распределение 5 пуассоновское со средним /гт. оо Так как 25° \— равно 1 при с = 0 и равно /гт при з=о с = 1, а 2 ^° г| Х1_ \\\ тХ A — т)Х1"х равно 1 при с = 0 и х=о равно ххх при с = 1, то, суммируя в E.40) сначала по 5, затем по % и хи и приводя подобные члены, находим, что для т <; 1 Ко (т) = и A - т). E.41) Если т > 1, то числа частиц в двух возможных положениях цилиндра взаимно независимы, и, следовательно, при т > 1 Ко (х) = 0. При т = 0 корреляционная функция должна равняться дисперсии случайного процесса. Действительно, 8*
228 СЛУЧАЙНАЯ ФУНКЦИЯ ИГЛ. 5 дисперсия распределения Пуассона равна математическому ожиданию, т. е. п. При т = 1 корреляционная функция равна 0. Задача 75. Найти корреляционную функцию для случайного процесса рассмотренного в задаче 73. Решение. Будем считать, что видимые величины звезд заключены в промежутке [0, оо]. Воспользовавшись решением задачи 73, находим для т <^ 1 Ко (т) = 2 § ^ (ян — т) (т2 — т) х о о х егщпчущтл др (тх) хИ' {т2) йт1 {тг - тJ егЬ+^ш A - т) ТУ' (го) дтг. E.42) о При т > 1, как и в предыдущей задаче, Ко (т) = 0. Коэффициент 2 при первом члене E.42) поставлен, чтобы наряду со случаями т1^>т2 учесть симметричные им случаи § 64. Случайная функция с некоррелированными приращениями. Пуассоновский процесс. Взаимная корреляционная функция двух случайных функций Случайная функция X (I) называется функцией с некоррелированными приращениями, если при любых < < М {[X (*2) - X &)] -М[Х (*2) - X &)]} х X {IX (I,) - X (*3)] - М [X (^ - X (*8)]} = 0. E.43) Достаточным условием некоррелированности приращений является взаимная независимость приращений. (Но это условие не является, конечно, необходимым.) Примером случайной функции с некоррелированным приращением является пуассоновский процесс. В этом процессе случайная функция монотонно возрастает, принимая целочисленные значения; условная вероятность ее приращения в промежутке 1г — 1г на число т не зави-
§ 66] ПЕРЕХОДНЫЕ ВЕРОЯТНОСТИ 229 сит от предыдущего поведения функции, задается распределением Пуассона со средним X (^2 — ^)- Параметром, определяющим пуассоновский процесс, является величина X. Если пространство равномерно заполнено газом, то число молекул в цилиндрической области, которую мы мысленно непрерывно удлиняем, есть пуассоновский процесс. Очевидно, что в пуассоновском процессе приращения случайной функции являются взаимно независимыми. Пуассоновский процесс является нестационарным процессом. Рассмотрим две случайные функции одного и того же аргумента X (I) и У (г). Взаимной корреляционной функцией этих двух функций называется функция Вху Иг, У = М {IX (*2) - МХ (У - Х(*2) + МХ (^)]х X [У (У - МУ (*2) - У Aг) + МУ {I,)]}. E.44) Если КХу Bц У равняется нулю при любв1Х значениях *, и г2, то говорят, что X A)иУ (I) являются некоррелированными случайными функциями. § 65. Переходные вероятности Пусть случайная функция X (I) может принимать лишь дискретные значения хи #2,..., хп. Обозначим посредством р (*и #ь *2> #/) E.45) вероятность того, что в момент г2 она примет значение ог^ при условии, что X (^) — Х(. Вероятности E.45) называют переходными вероятностями. Если случайный процесс стационарный, то вероятность E.45) зависит только от разности значений аргументов х = 1% — 1г. Марковский процесс полностью определяется заданием матрицы переходных вероятностей и распределением случайной функции при некотором значении аргумента 11л Если случайная функция имеет непрерывное пространство состояний, то переходной вероятностью ф (*1, х; *а, У) йу E.46) называется вероятность того, что случайная функция X (г) при значении аргумента *2 окажется внутри промежутка [г/, у + д,у] при условии, что X (гг) = х.
230 СЛУЧАЙНАЯ ФУНКЦИЯ ЕГЛ. 8 Если процесс стационарный, то E.46) зависит только от разности аргументов т = 12 — 11л Задача 76. Найти переходную вероятность р B1? хп ^2> X]) Для пуассоновского процесса {12 > 1г). Решение. Так как пуассоновская случайная функция может только возрастать, то при х; <С#ь очевидно, р (*!, Хи 1г, Х3) = 0. ЕСЛИ X) — Хг = X ^> 0, ТО, используя пуассоновское распределение, находим, что »Г<-™ ■ E.47) Задача 77. Найти, как ведет себя р (^, :гг; *2, х^ = — Р @, Хи т, д:;) для случайной функции задачи 72, если т = 12 — 1± бесконечно мало. Решение. Процесс, рассмотренный в задаче 72, стационарный. Пусть число частиц в цилиндре при некотором значении аргумента г равно к. Тогда условная вероятность того, что при смещении цилиндра на т число частиц в нем уменьшится на 1, равна Агг. Вероятность того, что число частиц увеличится на 1, равна /гт, а вероятность того, что число частиц не изменится, равна 1—кх — пх. События, состоящие во входе в цилиндр и выходе из него двух и более частиц, рассматривать не следует, так как их вероятности второго и более высокого порядка малости относительно т. Итак, р @, к] т, к - 1) - Ат, р @, к; т, к + 1) = пх, E.48) р @, к; т, к) = 1 — кх — пх. Из E.48) видно, что рассмотренный процесс чисто разрывный. Задача 78. Найти р @, т; й1, т') для случайной функции — видимой величины /с-й по яркости звезды в квадратной площадке, площадью 1 кв градус, перемещающейся вдоль галактической параллели. Среднее число звезд до видимой величины т в 1 кв градусе поверхности неба на данной широте равно N (т). Для решения задачи использовать решение задачи 73. Решение. Пусть при значении аргумента I видимая величина к-ж по яркости звезды в площадке равна т.
§ 65] ПЕРЕХОДНЫЕ ВЕРОЯТНОСТИ 231 При смещении площадки на 61, если из площадки выйдет одна из к звезд с видимой величиной <^ т, то видимая величина к-й по яркости звезды увеличится, станет равной видимой величине (к + 1)-й по яркости звезды площадки. Вероятность этого события равна кб1. Если видимая величина к-й звезды равна т, то вероятность того, что видимая величина (к + 1)-й звезды заключена в промежутке [т\ т' + йт'Ъ равна е-л<т'>+л<т> № (т') Лт'. Таким образом, если пь 5> ^> то Ф @, т; Л, т') = ЛаЙ-И^о+лмЛГ (т). E.49) Видимая величина к-й по яркости звезды в площадке уменьшится, если в площадку войдет звезда с видимой величиной < т. Вероятность этого события —ТУ (т) 61. Если видимая величина вошедшей звезды больше видимой величины (к — 1)-й по яркости звезды, то /с-й по яркости звездой станет вошедшая в площадку звезда. Используя решение задачи 63, найдем вероятность того, что видимая величина к-й по яркости звезды окажется в этом случае в промежутке [т\ т! + йт]\ эта вероятность равна 1ри' E-50) Если видимая величина вошедшей звезды меньше видимой величины (к — 1)-й по яркости звезды, то последняя после этого станет к-й по яркости. Используя решение задачи 63, найдем, что вероятность того, что в этом случае видимая величина к-й по яркости звезды окажется в промежутке [т\ т + йт'], равна (А - 1) ^^- Л' ("О Лт'М (т') Л. E.51) Складывая E.50) и E.51), найдем для случая т <Ст Ф @, т\ Л, т') йт! = к ^[^ ЛГ (т') 6т! Ли E.52) Если при сдвиге площадки на 61 из нее не выйдет ни одна из к звезд с видимой величиной < т и не войдет ни одна звезда с видимой величиной <.т, то видимая
232 СЛУЧАЙНАЯ ФУНКЦИЯ ЕГЛ. I величина к-ж по яркости звезды останется неизменной. Вероятность этого события равна 1 — квХ — N (т) иг. Следовательно, при т' = т Ф @, т\ Л, т) = 1 — Ш — N (т) Л. E.53) Выражения E.49), E.52) и E.53) полностью определяют переходные вероятности рассмотренной случайной функции. Рассматриваемый процесс, очевидно, является чисто разрывным. Задача 79. Требуется найти переходную вероятность Ь (О, Р;*&, C + /ф) й/г, описывающую случайный процесс — изменение квадрата скорости звезды в звездном поле вследствие случайных двойных сближений со звез- дамиполя. р= — отношение квадрата скорости звезды к квадрату средней квадратичной скорости звезд поля. Ь (О, Р; <Й, Р + Ар) дк есть вероятность того, что за время дл изменение р будет заключено в промежутке [/гр, (к + й/г)р] при условии, что в начальный момент Р= =р. Воспользоваться соотношением 21 полученным С. Чандрасекаром для случая, когда массы всех звезд одинаковы. Здесь % — прицельное расстояние между сближающимися звездами, т. е. то наименьшее расстояние между ними, которое было бы достигнуто в случае движения без взаимодействия по прямым линиям. |1 — произведение массы звезды на постоянную тяготения, к = иг/и — отношение скорости звезды поля, с которой происходит сближение, к скорости рассматриваемой звезды, а — угол между векторами скоростей этих звезд, 5 = соз 0 — косинус угла между плоскостью орбиты при сближении и плоскостью, проходящей через вектора скорости звезд (если бы они выходили из одной точки), ш — относительная скорость звезд, определяемая равенством и? = A + А2 - 2к сое а) РгЛ E.55) Функция распределения скоростей звезд поля / (к) известна.
§ 65] ПЕРЕХОДНЫЕ ВЕРОЯТНОСТИ 233 Решение. При двойном сближении звезд Н, 8, К, ос, С являются случайными величинами (как и раньше, чтобы отличать случайные величины от значений, которые они принимают, обозначаемых в рассматриваемом случае /г, 5, к, а, %, использованы прописные буквы или полужирный шрифт). Четыре последние из них взаимно независимы и полностью характеризуют сближение. Математическое ожидание числа сближений за время 6,1 бесконечно мало. Оно равно вероятности, что за время дХ произойдет одно сближение. Рассмотрим случайные векторы (Я, р, К, а, О) и E, р, К, а, С). Справедливо равенство /A) (к, р, Л, а, §) й/гйр йк йа A$ (И = =/B>(*. Р. к% а, $) из A$Aк йа й% Л, E.56) каждая часть которого равна вероятности сближения с заданными характеристиками за время й1. Математическое ожидание числа сближений за время йг с прицельными расстояниями, заключенными в промежутке [ равно Б & (И; E.57) функция распределения угла а есть 81П а, а функция распределения 5 >8<*>=4т1=7- E-58) Таким образом, /A)(й, р, к, а, = !к(Л)йк —• ** ^Л-я\паЛа.П9.пед,%и>Л1. E.59) Чтобы получить плотность вероятности перехода, нужно в E.59) заменить 5 и & при помощи равенства E.54) и затем проинтегрировать E.59) по всем возможным значениям #, а и к: 1т (О, Р;Л, р ТО /к (Л) =^- X У—р— X &\паю%дк да ив. E.60) Т. Д. Агекян
234 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. 5 Величина ц? дается равенством E.60). Область интегрирования С определяется неравенствами е > 0, E.61) -1<соза<+1, E.62) к > 0, E.63) - 1 < к < /с2. E.65) Неравенства E.61) — E.64) очевидны. E.64) вытекает из условия |$| = | соз 6 |<^ 1 и E.54). Неравенство E.65) показывает, что квадрат скорости звезды не может уменьшиться на величину, большую, чем сам квадрат скорости, и не может увеличиться больше, чем на квадрат скорости звезды, с которой произошло сближение. Выполняя интегрирование по области О (предлагаем это проверить читателю), находим для случая к ]> 0, т. е. когда скорость звезды после сближения возрастает, • E-66) Если распределение скоростей звезд поля максвелловское, то после подстановки его в E.66) и использования формулы интегрирования по частям получаем для случая к ]> 0
§ 66] ЗАДАЧИ О ВЫБРОСАХ 235 Для случая к ^ 0 аналогично находим (при максвел- ловском распределении скоростей звезд поля) Ь (О, Р; ей, Р + Щ = ^ D/с2 — к)е~~^дк. E.68) § 66. Задачи о выбросах Во многих приложениях теории случайных процессов необходимо исследовать вероятностные характеристики пересечения случайной функции некоторого заданного уровня. Если при некотором значении аргумента случайная функция пересекает снизу вверх (или, если так условиться, сверху вниз) некоторый фиксированный уровень х = = а, то говорят, что произошел выброс. Как только после этого при некотором значении аргумента случайная функция пересечет уровень х = а в обратном направлении, говорят, что выброс закончился. Очевидно, что выброс в рассматриваемой задаче есть явление случайное. Его можно описывать при помощи различных характеристик, например, вероятностью, что в промежутке и, г -\-й1] произойдет выброс, распределением выбросов в промежутке [^, 12], средней длиной выбросов в промежутке [*!, *21 и т. д. Для того чтобы выброс произошел в промежутке [2, *+<Й], необходимо, чтобы в момент I значение случайной функции X (г) было меньше а, а в момент I -\- д& стало больше а. Используя теорему умножения вероятностей, можно определить вероятность этого события: к (*, х) их \ ф (г, х\ I + ей, х') Ах'. E.69) Если случайный процесс стационарный, то E.69) от I не зависит: Р [Х(г)^а<Х(* + Л)] = с Л, E.70) 9*
236 СЛУЧАЙНАЯ ФУНКЦИЯ 1ГЛ. 5 где величина (I ОО с = -±- ^ Д @, *) их ^ ф @, х; ей, х') их' E.71) вычисляется, если заданы одномерная плотность вероятности случайного процесса и функция переходных вероятностей. Для стационарного случайного процесса с дрскрет- ным пространством значений сЛ1 - 2 Р @, х{) 2 р @, ад Л, х,). E.72) Если вероятность выброса в промежутке длиной 6,1 равна сд,1, то математическое ожидание числа выбросов в промежутке длиной Т равно сТ. E.73) Вероятность того, что в промежутке длиной Т не произойдет ни одного выброса, равна е~сТ, E.74) а вероятность того, что в этом промежутке произойдет хотя бы один выброс, равна 1 - е~сТ. E.75) Математическое ожидание времени пребывания стационарной случайной функции над уровнем а в промежутке длиной Т равно 01 = 1 \ ]\ [V), X) (IX (О. / ОI а или, для дискретной случайной функции, ЪТ = Т 2 Р @, а*). E.77) Поэтому математическое ожидание продолжительности
$ бб] Задачи о выбросах 237 одного выброса равно оо Л| /1@, х)с1х E-78) а ^ П @, Л1\ а хHз и С» ; I а @, ф х)йх @, .т; Л, х')йх* а для дискретной случайной функции Ъ х.>а с Задача 80. Для случайной функции — числа частиц внутри цилиндра, который может занимать различные положения,— решить задачу о выбросах для уровня а, где а — целое число. Решение. Так как при смещении цилиндра на д,1 следует учитывать возможность увеличения числа частиц только на единицу, то выброс за уровень х = а возможен только с самого уровня. Поэтому суммы, фигурирующие в E.72), содержат только одно слагаемое: пае~п сй1 = г— пА1. а\ Математическое ожидание числа выбросов на промежутке длиной Т равно а\ 1 в Средняя длина пребывания случайной функции над уровнем а в промежутке длиной Т равна Средняя длина одного выброса равна оо с „а+1 ^—-1 А-!
238 СЛУЧАЙНАЯ ФУНКЦИЯ |ГЛ. 5 Когда а -> оо, то выражение E.79) ведет себя как ——р . Это физически понятно, так как очень большое а означает очень большую положительную флуктуацию числа частиц в цилиндре. В среднем на участке пути 1/а должен будет произойти выход одной частицы, поэтому средняя длина выброса становится близкой к 1/а. Задача 81. Для ориентации космического корабля необходимо, чтобы в полосе неба длиной Ь единиц (Ь ^> 1) и шириной в 1 единицу оказалась хотя бы одна квадратная со стороной в 1 единицу площадка с к звездами ярче т-й видимой величины. Математическое ожидание числа звезд до т-й величины в площадке в 1 кв. единицу вдоль всей полосы одинаково, равно Л^ (т). Найти вероятность того, что космический корабль сможет произвести ориентировку. Воспользоваться решением задачи 78. Решение. Расположим мысленно квадратную площадку на краю рассматриваемой полосы, а затем будем перемещать ее до противоположного края полосы. Путь, который она при этом пройдет, равен Ь — 1. Космический корабль сможет произвести ориентировку при одном из двух несовместимых событий, если 1) уже в начальном положении видимая величина /с-й по яркости звезды меньше т; 2) видимая величина /с-й по яркости звезды в начальный момент больше т, но при перемещении площадки происходит хотя бы один раз выброс видимой величины к-й звезды ниже уровня т. Вероятность события 1) равна ТИТ е'Щт" М> Ю ^1 = 1" ^(т) 2 *$$- ■ E-80) о 1==1 Для вычисления вероятности события 2) определим сначала вероятность выброса рассматриваемой случайной функции ниже т за время 6,1. Для этого вероятность того, что в точке со значением аргумента, равным *, видимая величина /с-й по яркости звезды заключена в промежутке [ть гпх + йгпг], помножим на даваемую выражением E.52) вероятность перехода в точке со значением аргумента I + № к видимой величине /с-й по яркости
§ 67] СТОХАСТИЧЕСКИЙ ИНТЕГРАЛ 239 звезды в промежутке [т', т + Лт'] при условии т < т1 и проинтегрируем по т' от 0 до т, а по т! — от т до оо: = Сй<. E.81) Следовательно, математическое ожидание числа выбросов при изменении аргумента на Ь — 1 равно E.82) -_1_Л^(т)е(Ь-1), а вероятность события 2) равна 1 - ехр [-^Г & И е'Щт) (Ь ~ Итак, вероятность того, что космический корабль сможет произвести ориентировку, равна 2 _ е-щт\ 2 |1|1 _ ехр [^ 7УЙ И ^(т) Ф ~ 1)] . E.84) § 67. Стохастический интеграл В теории вероятностей часто приходится сталкиваться со стохастическим интегралом вида ь где г] (г) есть некоторая (не случайная) функция ^,аХ (*) есть случайная функция аргумента I. Для каждой реализации х {I) случайной функции X (*) интеграл E.85) равен обычному интегралу Римана E.86)
240 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. 5 и случайная величина р при данной реализации х (I) принимает значение E.86). В соответствии с обычным пониманием определенного интеграла стохастический интеграл также есть предел сумм, ь \ г\A)ХA)й1 = Нт 2 г\(%)Х С") (*? -#-1), E.87) П->оо . г=Х причем выполняется условие: при п -> оо длина наибольшего из интервалов # — #-1 стремится к 0. Множество возможных реализаций случайной функции X (г) определяет множество значений случайной величины р. Если верхний предел стохатического интеграла E.85) есть переменная величина т, то этот интеграл является случайной функцией аргумента т, E-88) Точно так же случайной функцией является стохастический интеграл ь [ E.89) Другой тип стохастического интеграла определяется как интеграл Стилтьеса X Р(т)= \ц{1)йУ{1). E.90) В этом интеграле каждой реализации у (г) случайной функции У (г) соответствует интеграл Стилтьеса E.91)
$ 67] СТОХАСТИЧЕСКИЙ ИНТЕГРАЛ 241 который отличается от интеграла Римана тем, что под знаком интеграла стоит не дифференциал ей, а *У С) = У(* + М)-У @. соответствующее дифференциалу (Л. Аналогично, может рассматриваться случайная функция аргумента — параметра, от которого зависит стохастический интеграл Стилтьеса ь р(т)= ^цA,т)<1УA). E.92) Интеграл E.92), как и предыдущие примеры стохастических интегралов, является пределом сумм = Пт П-ЮО . а г=1 причем должно выполняться условие: тах (/? — ^_х) стре- г мится к 0, когда п -> оо. Определим дисперсию стохастического интеграла E.85). Будем при этом для простоты считать, что случайная функция X (*) центрированная, X (/) = 0. Тогда при некоторых широких условиях и Мр = 0 п п = Ит 2 2 Г](^1)Г1(^) (^— %-!){!% — $-^М[Х{$)Х{(ь)\ = п~*со 2=1 к=1 Ь Ь ^2)^1^2- E.93) Таким образом, дисперсия стохастического интеграла E.93) выражается через корреляционную функцию.
242 СЛУЧАЙНАЯ ФУНКЦИЙ 1ГЛ. 5 § 68. Комплексная случайная величина. Комплексная случайная функция В § 28 мы уже рассматривали случайные величины вида еих, принимающие комплексные значения. Остановимся на некоторых вопросах, относящихся к случайным величинам X = V + IV, E.94) где X] и V — обычные вещественные случайные величины. По определению МХ = МТ] + ШУ, поэтому для того чтобы комплексная случайная величина X была центрированной, необходимо а достаточно, чтобы были центрированными обе вещественные случайные величины \] и V. Две комплексные случайные величины Хг = 11г + + ъУ^ Х2 = 112 + *^2» называются некоррелированными, если МХ?Х2 = 0, E.95) где X* = Их —■ IV\ есть сопряженная к Хх комплексная случайная величина. Смешанный момент второго порядка целесообразно вводить в форме МХХ Х2 с тем, чтобы при Х2 = Хх начальный момент второго порядка МХг Хг = М B7Х - «70 (#1 + 1^) = М?7? + МУ\ E.96) получался вещественным. Аналогично вводится понятие случайной функции с комплексными значениями X @ = V (I) + IV @, E.97) где ?7 @ и V {I) — обычные вещественные случайные функции. Математическое ожидание для X B) определяется обычным образом: X @ = О @ + *7 (О- E.98) Корреляционная функцря дается выражением К &, *2) - АГ [X* («0 - X* &)] [X (*2) - X (*2)], E.99)
§ 69] ПРЕДСТАВЛЕНИЕ СЛУЧАЙНОЙ ФУНКЦИИ 243 где Х*@ = 17 @ — IV (I) E.100) есть сопряженная комплексная функция. Дисперсия случайной функции равна корреляционной функции при значениях 1г = 1г = I а\ @ = К(Ы) = М [X* @ - X* @1 [X @ - X {г)) = - [СГ2 @ + Т2 @1 - Ю (г)]2 - [7 (*)]2 = <т2с/ @ + °у (О E.101) и является, следовательно, вещественной функцией. Корреляционная функция E.89) в общем случае не является вещественной. Из E.93) и E.94) следует, что комплексная случайная функция X (*) является центрированной, если центрированы обе случайные функции Ь (I) и V (*). Корреляционная функция комплексной стационарной центрированной случайной функции имеет вид К0 (т) = М [Х*(г) X {г + т)]. E.102) § 69. Спектральное представление случайной функции Спектральным представлением стационарной комплексной центрированной случайной функции называется представление ее в виде п ХA) = 2 [#* С08 КО + У к Вт (<М)], E.103) где со^ — некоторые (неслучайные) вещественные числа, а ^/л Ук (к = 1, 2,..., п) —центрированные некоррелированные случайные величины с попарно равными дисперсиями БЦ, =оук = ок. E.104) Представление E.103) имеет такую физическую интерпретацию. Каждое из слагаемых Ь) = V* соз (©к0 + VI 31П (сол0, E.105)
244 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. 5 также являющееся случайной функцией, можно интерпретировать как гармоническое колебание, имеющее определенную частоту со &, случайную амплитуду]/ 11к + V* и для значения аргумента I — случайную фазу агс1^ .-=— + -\-сокг. В каждой реализации случайной функции E.105) амплитуда гармонического колебания постоянна и для каждого значения I определена фаза колебания. Таким образом, E.103) есть сумма гармонических колебаний разных частот со случайными амплитудами и фазами. Для каждой реализации E.103) есть сумма гармонических колебаний с определенными амплитудами и определенными (зависящими от I) фазами. Использовав формулы Эйлера, перепишем E.103) в виде 2 Ф***»*'. E.106) где СО_ь = — СОь, При этом случайные величины Фк также обладают свойствами центрированности и некоррелированности. В частности, благодаря условию E.104) некоррелированы Фк и Ф.к: Жк = М [1 A/к + 1Ук) • 1 (С/, 4- IVк)] - 1 - МУ\) + \гМ17кУк = \ №к - ИУк) - 0. Корреляционная функция случайной функции E.106) равна / ч'к е E.107)
69] ПРЕДСТАВЛЕНИЕ СЛУЧАЙНОЙ ФУНКЦИИ 245 Так как при к ф / 1 у. = 0, E.108) а при к = ] МФ*кФк = а2к = 8к, E.109) причем все 8к вещественны и положительны, то получаем п К (М.) = 2 8ке™«A>-11) = Яо (*. - «0. E.110) —П Таким образом, корреляционная функция зависит от разности аргументов. Дисперсия случайной функции 6^ = ^@)= 2 $*= 2 МФ>к E.111) к=—п от аргумента ^ не зависит, а математическое ожидание случайной функции равно нулю: п п ) = М 2 Ф*е*"к'= 2 е{1с'МФй = 0, E.112) так как Ф& — центрированные случайные величины и, следовательно, также от аргумента не зависят. Соотношения E.110) — E.112) показывают, что если справедливо представление E.103), то X {I) есть стационарная (в широком смысле) случайная функция. Энергия гармонического колебания, как известно, пропорциональна квадрату амплитуды колебания. Следовательно, для некоторой реализации случайной величины энергия колебания пропорциональна значению, которое приняла случайная величина Ф1Ф/С. А величина E.109), следовательно, пропорциональна математическому ожиданию энергии случайного колебания. Таким образом, согласно E.96) дисперсия случайной функции X (I) пропорциональна математическому
246 СЛУЧАЙНАЯ ФУНКЦИЯ ГЛ. 5 ожиданию суммарной энергии случайных гармонических колебаний, на которые функция X (^) разложена. Совокупность частот со& гармонических колебаний, на которые разложена случайная функция X (^), причем каждой частоте соответствует некоторая ненулевая средняя энергия, образует как бы спектр, характеризующий случайную функцию. Отсюда выражение — спектральное представление случайной функции. Предположим теперь, что в представлении E.91) нумерация выполнена в соответствии с возрастанием сол (с учетом знака). Кроме того, предположим, что п —>- оо, так что при этом наибольшее из | о)й+1 — со& | -> 0. Для того чтобы энергия суммы случайных гармонических колебаний при п -> оо оставалась конечной, потребуем, чтобы каждое слагаемое в сумме E.111) стремилось при этом к нулю. Совершая в сумме E.106) при п ->■ оо формальный предельный переход, получим стохастический интеграл Стилтьеса Х@= $ <?*">'йФ (со). E.113) —оо В этом интеграле йФ (со) обозначает «случайную величину», определяющую амплитуду и фазу колебания, соответствующие «интервалу» частот йсо. Условию центрированности случайных величин Фк в сумме E.106) соответствует в стохастическом интеграле E.113) условие центрированности «случайных величин» йФ (со) при любом значении со. Можно показать, что из этого следует условие центрированности и самой случайной функции Ф (со) МФ (со) = 0. E.114) Условию некоррелированности случайных величин Фк и Фу в сумме E.106) соответствует в интеграле E.113) условие некоррелированности приращений функции Ф (со), которое можно при помощи дельта-функции записать так: М[АФ* (со)-йФ ((Ог)] = 8 (со)8 (сог — со) йсо *©!. E.115) 5 (со) называется спектральной плотностью случайной функции X (г). Так как ДФ* (со) ДФ (со) веществен-
69] ПРЕДСТАВЛЕНИЕ СЛУЧАЙНОЙ ФУНКЦИЙ 24? но и положительно, то и спектральная плотность, определяемая равенством 5 (со) До *о = АГ [йФ* (со)-йФ ((оI вещественна и положительна. Поскольку согласно E.109) 8ъ пропорционально энергии к-то гармонического колебания, то и 5 (со) йсо пропорционально энергии, приходящейся на интервал частот й(о в интегральном представлении E.113). Таким образом, спектральная плотность характеризует распределение по частотам энергии рассматриваемого случайного процесса. Определим, используя спектральное разложение E.113), корреляционную функцию случайной функции Х{) К» (т) = М [X' @ X (I + тI = М [X* @) X (тI = = М Меняя местами операцию интегрирования и операцию математического ожидания, находим, используя E.115), К0(х)= 5 § —оо —оо оо оо = 5 5(©)йю $ е{^Ь (сох — со) й(оь E.Ц6) —оо -оо На основании свойства б-функции B.38) получаем оо Ко (т) = $ 5 (со) е^йсо. E.117) Таким образом, корреляционная функция есть преобразование Фурье спектральной плотности. Выполняя обратное преобразование Фурье, находим E.118)
248 СЛУЧАЙНАЯ ФУНКЦИЯ 1ГЛ. 5 Задача 82. Найти спектральную плотность для случайного процесса, определенного в задаче 74. Решение. Согласно решению задачи 74 корреляционная функция этого процесса для значений т <^ 1 имеет вид а Ко (т) = п A - т), а для всех т ^> 1 равна нулю. Подставляя эти данные в E.108), находим 1 5 (со) =— V п A — т) соз (сот) их = — зт2 -^- . о § 70. Марковские процессы Если условная вероятность того, что случайная функция примет в момент 12 }> 1Х значение в промежутке [х2, х2 + йх2] при условии, что поведение при I <^ 1Х не зависит от того, какие значения случайная функция принимала в моменты, предшествующие ^, то такая случайная функция называется процессом без последействия или марковским процессом. Обозначим фп (*и Хи *2> х2; . . . ; 1П1 хп) йхг Лх3 . . . йхп E.119) условную вероятность события, состоящего в том, что случайная величина в моменты 22<*з<--- <*п примет значения внутри промежутков [х2, х2 + с1х2], [х3, х3 + + <1х3], . . ., [хп, хп -\- йхп] соответственно при условии, ЧТО X (*х) = Хг. Функция фд Aи х^, 12, х2\ . . .; 1п, хп) есть условная (п — 1)-мерная плотность вероятностей для моментов *2> *з,- • • » *п при условии, что в момент 1Х случайная функция приняла значение хг. На основании теоремы умножения вероятностей справедливо равенство и (^. хх; 1ъ х2; ...; 1п, хп) йхг йх2 ... йхп = = А (*1? жО Ас^д (^, хг; 12, х2; ...; ^„, хп) йх2 йхъ ... Лсп, E.120) где /„ Aи хх\ 12, х2\. . .; 1ПУ хп) есть /г-мерная плотность вероятности для моментов 1и 1г, . . ., *п.
§ 70] МАРКОВСКИЕ ПРОЦЕССЫ 249 Условная плотность вероятности обладает очевидным свойством: Фп \}ъ ХЪ ^21 ХЪ-> • • •? 1'х-Ъ Хг-Ъ ^гч хг'ч ^г+1^1+1» • • • » ^т Хп) ^хг ~ ОО == фп-1 \$11 ХЪ ^2? ХЪ • • •'•> ^г-11 хг-\1 ^г+Ъ хг+1ч • • •'•> ^пч Хп)' E.121) Для марковского случайного процесса на основании теоремы умножения вероятностей справедливо равенство фп (^1> хи ^2» Х21- • •» ^П1 хп) = ~ ф2 (^1» ^1» ^2» ^2) ф2 \^21 ХЪч ^З1) Хз)- • • ф2 (^д-1? жп-1? ^п? Жл) E.122) (ф2 здесь, очевидно, есть переходная плотность, в обозначении которой индекс 2 мы ранее опускали). Действительно, согласно свойству марковского процесса, например, условная вероятность того, что случайная функция в момент г3 примет значение в промежутке [#з> хз + ^хз\ пРи условии, что в момент *2 она приняла значение х2, а в момент 11 — значение хи уже не зависит от значения хи которое она приняла в момент 11л Аналогичное рассуждение для последующих моментов показывает справедливость разбиения E.122) на произведение. Таким образом, при помощи E.120) и E.122) все многомерные плотности вероятностей выражаются через двумерные плотности вероятностей и, следовательно, марковский процесс, как уже отмечалось в § 61, полностью определяется семейством двумерных плотностей вероятностей. Напишем равенство E.122) для п = 3: фз (^1» Х11 ^2» Х2ч ^Зч Х3) ~ — ф2 \^1-> «^1» ^21 Х2/ ф2 \^21 Х2ч ^3"> ХЗп (оЛАо) где ^1<^2<^з- Проинтегрируем обе части E.123) по всем возможным значениям х2. На основании E.121) получаем Ф2 (*1, ХЪ ^З^з) =\ Ъ (*П ХЪ ^2, X*) ф2 (*2» Х2, Ч, Хз) ^2- E.124)
250 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. б Равенство E.124), справедливое для переходной плотности процесса без последействия, называется уравнением Колмогорова — Чепмена. Если марковский процесс стационарный, то Фг (*1> ъ; *2, я2) = ф2 @, хг; *2 — ги ж2), E.125) и уравнение E.124) может быть записано в виде ф2 @, Х-±\ 1$ — ^1> %з) — = § Фг @, ад и — *ъ х2) ф2 @, х2; *3 — г* хв) 4р2. E.126) § 71. Уравнения Колмогорова для непрерывного процесса Положим в уравнении E.124) 1г = г, 12 = I + Дг, 1Ъ = т, ф2 = ф: . E.127) Напишем также равенство А«, ж; т, 2) $ ф (*, ж; < + Ы, у) йу, E.128) —оо очевидное, так как интеграл в его правой части равен 1. Вычтем E.127) из E.128) и разность поделим на А*: Ф (* + А*, а?; т, *) — х X Ф(*,я;* + Д*,у)йр. E.129) Применим к выражению в квадратных скобках под знаком интеграла формулу Тэйлора и заменим интеграл
§ 71] УРАВНЕНИЯ КОЛМОГОРОВА 251 суммы суммой интегралов: ф (I + А*, к; Т, г) — ф (<, х\ Т, г) _ Д* 6 М \ дэ? (у-ж);т'г)х —оо , E.130) где 0<6 <1. Теперь предположим, что существуют пределы 00 11т --П (у-х)у(г,х\1+М,у)аУ=а(г,х), E.131) А1 а1 ) А1 ->0 -со оо Ит 4г^1 (у-х)*уЦ,х;г+ М,у)йу = Ъ{1,х),{Ь. -00 а также, что 00 )-\-М,Х + Ъ(у-х)\Х,2] - р^ = 0. E.133) Разберем сделанные предположения при помощи рассуждений, не являющихся строгими, но способствующими правильному пониманию сути этих предположений. Рассматриваемый случайный процесс является непрерывным, поэтому когда А^ -> 0, плотность условной вероятности ф (I, х; I + А^, у) стремится к нулю для значений \у — х | ]> 0. Поэтому интеграл в E.131) при Д^ -^ О будет стремиться к 0. Порядок малости интеграла усиливается тем, что у — х в подынтегральном выражении внутри промежутка интегрирования меняет знак. Можно, ожидать, что при достаточно широких условиях отноше-
252 СЛУЧАЙНАЯ ФУНКЦИЯ 1ГЛ. 5 ние интеграла к Д^ при Д^ -> О будет стремиться к конечной величине а {г, х). В частном случае а (^, х) может тождественно равняться нулю. Функция а {I, х), как показывает E.131), имеет размерность отношения размерности случайной функции к размерности аргумента. Под знаком интеграла в E.132) стоит квадрат разности (у — х), а не ее первая степень, как в E.131), что усиливает порядок малости подынтегрального выражения. Но это существенно компенсируется тем, что подынтегральное выражение в промежутке интегрирования не меняет знака, положительно. Поэтому при широких условиях отношение интеграла к Д2, когда Д^ -> 0, также стремится к конечной величине Ъ {I, х). Ее размерность, как показывает E.132), совпадает с размерностью отношения квадрата размерности случайной функции к размерности аргумента. Подынтегральное выражение в E.133) содержит множителем третью степень у — х. Поэтому естественно ввиду сделанных только что предположений считать, что интеграл в E.133) при Д* -> 0 окажется бесконечно малой более высокого порядка, чем Д^, и, следовательно,выполняется E.133). Сделав допущения E.131) — E.133) и соверщив в E.130) предельный переход при Д^ -> 0, получим первое уравнение Колмогорова: E.134) Для вывода второго уравнения Колмогорова обозначим [рс, р] промежуток изменений у. В частном случае этот промежуток есть [—оо, оо]. Если а и C конечны, то для значений у вне промежутка [а, |3] справедливо равенство ф (г, х\ т, у) = 0 при любых г, х и т. Введем в рассмотрение некоторую вспомогательную (не случайную) функцию Л (х), неотрицательную и дважды непрерывно дифференцируемую в промежутке [а, |3] и удовлетворяющую условиям Я (а) = Я (р) = Я' (а) = Я' (р) = К" (а) = Я" (р) - 0. E.135) В остальном функция Я (х) произвольна.
§ 711 УРАВНЕНИЯ КОЛМОГОРОВА 253 Напишем очевидное равенство: з з ГН() С — ф (I, х\ Т, г)] Я (г)йг. E.136) Первый член подынтегрального выражения правой части этого равенства заменим, используя уравнение Колмогорова — Чепмена, написанное в виде Ф (г, х; х + Дт, г) = ^ ф (*, х; т, у) ф (т, у; х + Дт, г) йу. E.137) Получим 3 3 = Нт -^г [ \ Д (г) йг ^ Ф (*, ж; т, у) ф (т, у; г + Дт, г) йг/ — а а 3 -Д Ф (*, ж; х, г) Я (г) *г]. E.138) а Изменим в первом члене правой части порядок интегрирования, а затем заменим в нем обозначения переменных интегрирования у на г, а ъ на у: Дт, а а 3 ' 3 Я (г)йг\ = Иш-т- \ф(^,х; т,^)Й2 X 3 X \^у(х,г;х+ ^x,у)Я(у)<^у-Я{2)]. E.139) а В квадратных скобках правой части E.139) применим для Я (у) формулу Тэйлора, а затем используем равенства
254 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. 5 E.131) — E.133): Нт -гг а Р а 1 (у - гJ Л" (г) + о (у - гJ] й</ - Д (г) = 1 ? т т=Д(у — 2)ср(тг,2;т 1 1 Г | Л" B) Нт ^- ^ - гJ Ф (т, г; т + Дт, у) йу + а 3 + Нт -г^г ^ о (г/ — гJ <р (г, г; г + Лт, г/) йу = = а (т, т) Я' (г) + у ъ С*. *) Я" (г). E.140) Подставим E.140) в E.139) и применим формулу интегрирования по частям, чтобы вместо производных Я' {ъ) и Я" (г) под интегралом фигурировала сама функция Я (г). Вследствие выполнения условий E.135) внеин- тегральные члены обращаются в нуль, и мы получаем ,а?;т,г) . д , (г)& = 0. E.141) Из того, что интеграл E.141) равен нулю при произвольной внутри промежутка [&, |3] функции Н {%), следует, что выражение в фигурных скобках под знаком интеграла равно нулю: +[а(т дх +д7[а(т -1^[6(т,1)Ф(<,1;мI = 0. E.142) Это есть второе уравнение Колмогорова.
§ 71] УРАВНЕНИЯ КОЛМОГОРОВА 255 Уравнения Колмогорова являются линейными однородными уравнениями в частных производных второго порядка. Второе уравнение Колмогорова в ряде конкретных задач использовалось физиками и называется также уравнением Фоккера — Планка. Если процесс является стационарным, Ф (*, х\ т, у) = Ф @, х\ х — I, у), то дф @, х\ X — I, у) __ дф (О, Х\ Т — *, у) дх — ы Если, кроме того, функция ф зависит только от разности (у — х), а не от х и у отдельно, то, во-первых, как показывают равенства E.131) и E.132), функции а и Ь становятся константами и, во-вторых, справедливы равенства ду (О, 0; т — *, у — а?) __ Зф @, 0; т — г, у - а?) Ъу ~ дх' 3*Ф @, 0; т - г, у - а?) * = В этом случае сравнение E.134) и E.142) показывает, что первое и второе уравнения Колмогорова совпадают. Задача 83. Функция ф (г, х\ г + А*, г/), определяющая случайный процесс при А* ->• 0, есть E.146) Написать уравнение Колмогорова. Решение. Так как функция ф зависит только от разностей аргументов {I + А^) — I = Дг (процесс стационарный) и разности (у — х), то первое и второе уравнения Колмогорова совпадают. Поскольку E.146) — нормальная относительно (у — х) функция с равным нулю математическим ожиданием, то -со
256 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. Ь Дисперсия, отвечающая ей, равна В Д2; следовательно, Ъ(х, I) =дШп -^\{У- *Jф@,0; М, у-х)й{у-х) = -оо - 11т ~ВМ = В. Легко проверяется условие E.133). Оба уравнения Колмогорова сводятся к уравнению ^фА + ^вЩ^И-^о, E.147) где фо (т, У) = Ф @, 0; т, у). E.148) Уравнение E.147) называют одномерным уравнением диффузии или уравнением теплопроводности. Если принять начальное условие, что в момент I — 0 случайная функция была равна х, т. е. принять граничное условие Фо @, г/) = б (г/ — х), то решение уравнения E.147) позволит получить ф0 (т, у) йу, вероятность того, что в момент т случайная функция примет значение в промежут- ке [у, У + &у\- Физическими примерами такой случайной функции являются координата частицы при одномерном случайном блуждании (например, при одномерном броуновском движении) или координата кванта тепловой энергии в процессе диффузии тепла в одномерном стержне. Так как уравнение E.147) является линейным однородным, то, написав произвольное число таких уравнений для соответственного числа частиц, совершающих одномерное броуновское движение, или квантов тепловой энергии, диффундирующих в одномерном стержне, и сложив эти уравнения, мы снова получим уравнение вида E.147). Но в этом уравнении граничные условия будут определяться функцией распределения блуждающих частиц на оси движения в начальный момент или, во втором примере, функцией распределения температуры в одномерном стержне в начальный момент (так как температура в щка- ле Кельвина в однородном стержне пропорциональна плотности распределения в нем квантов тепловой энергии). Решение уравнения E.147) даст функцию распределения блуждающих частиц на оси движения в произ-
§ 71] УРАВНЕНИЯ КОЛМОГОРОВА 257 вольный момент т, а во втором примере — функцию распределения температуры в стержне в момент т. В процессе одномерного броуновского движения (при отсутствии силового поля) и процессе диффузии тепла вероятность того, что частица сместится на величину у — х, не зависит от занимаемого ею положения х; вероятности положительных смещений равны вероятностям отрицательных смещений при одинаковых модулях смещений, и при А* -^ 0 величина АХ (*) —> 0. Поэтому эти случайные процессы задаются функцией E.146). Задача 84. Функция ср B, х; I + Д2, г/), определяющая случайный процесс при А г -> 0, есть 1 [(у-х)+АхА1J Ф (*, х; I + М, у) = %(х\ Ы, у) = у2^в~КГ е" 2ВЛ< E.149) Написать уравнение Колмогорова. Решение. Так как функция ср зависит только от разности аргументов (а не от самих аргументов), то процесс стационарный. Математическое ожидание АХ (г) равно — Ах Дг, а дисперсия равна В А*. Следовательно, 1 а (г, х) — Нт -г- (— АхЫ) = — Л# , Ь (^, ж) = Нт -1 5А^ = 5 . м Проверка показывает, что выполняется условие E.133). Первое уравнение Колмогорова принимает вид зг, т, у) А дфо(:к; т, у) 1 р агф0(х; г, у) тт ^Ф ^Ф При этом учтено, что -~ = — -у- . Второе уравнение Колмогорова приобретает такой вид: д<р(х\ху) д _ . ч_ 1 г, д2®(х\тчу) А E.151)
258 СЛУЧАЙНАЯ ФУНКЦИЯ ИГЛ. 5 Физическим примером случайной функции, удовлетворяющей уравнению E.131), является скорость частицы в одномерном броуновском движении. Вероятность данного изменения скорости в этом процессе зависит от величины самой скорости. Чем больше скорость, тем, вследствие вязкости среды, в которой движется броуновская частица, более вероятны приращения скорости противоположного знака. Это показывает и функция E.146). Второй член уравнения E.131) учитывает изменение случайной функции — скорости броуновской частицы вследствие вязкости среды. Третий член, как и аналогичный член в уравнении E.142), учитывает диффузию, но теперь это диффузия в одномерном пространстве скоростей. § 72. Обобщение для случайной функции-вектора Если случайная функция аргумента I есть вектор X (*) = [Хг (*), Х2 (*), . . . , Хп (*)], составляющими которого являются случайные функции-скаляры, то процесс называется стохастически непрерывным, если выполняется условие: для любого е ^> О }-*0. E.152) Величина Ф (*, х; т, ъ) йъ E.153) есть вероятность того, что случайная функция-вектор, имевшая в момент I значение х, в момент т примет значение внутри [я, ъ + йг], т. е. окажется внутри /г-мерного параллелепипеда [ги ъх + д&Л X Ь2, 22 + йя2] X ... ... х К, ъп + йъп\. Если процесс является марковским, то справедливо уравнение Ф (г, х; т, ъ) = ^ Ф (*, х; г + А*, у) <р (г + А*, у, т, ъ) йу , E.154) получаемое совершенно так же, как и для одномерной случайной функции. Интегрирование в E.154) выполняется по всему /г-мерному пространству компонентов уиу2,..., г/п- Уравнения Колмогорова выводятся тем же методом, что и для одномерной случайной функции. Необходимо
§ 72] ОБОБЩЕНИЕ ДЛЯ СЛУЧАЙНОЙ ФУНКЦИИ-ВЕКТОРА 259 лишь учесть, что формула Тэйлора, применявшаяся к выражению в квадратных скобках в E.129), теперь должна применяться к функции от вектора или, что то же, к функции от п переменных хх, х2,. . . , хп. Поэтому нужно ввести обозначения Нш -±г[(Уг - хг)ф (*, х; г + А*, у)йу - а{{1, х), E.155) Пш 4г[(Уг- *г)\(*, х; I + А*, у)йу = Ъ{A, х) , E.156) 1 = 1,2,. .. ,/г, Иш 4г[(У*- Ъ) (Уз — *;)ф(*, х; < + А^, у)йу = = с«(*,х). E.157) Выражения, содержащие члены третьего порядка малости в формуле Тэйлора, по-прежнему обращаются в нуль, когда Д* -> 0. Если все приращения Хг (г + Д*) — —Хг (г), г = 1 , . . ., /г, взаимно независимы, то все сц = = 0. Если все компоненты равноправны, гс-мерное пространство изотропно относительно распределений случайной функции-вектора, то все аг (I, х) = а (г, х); Ъг (*, х) = = Ъ (г, х); I = 1,2,. . . , /г. Первое уравнение Колмогорова приобретает вид +а(<,хJУ + + 4-Ь(«,»)|Уф(<^;Т'')^0. E.158) Аналогично, второе уравнение Колмогорова будет записано так: + 2А[а( п -Т 2^[ЬAГ,2)ф(«,х;тJI = 0. E.159) Задача 85. Рассмотреть обобщение задач 83 и 84 на случай, когда случайная функция есть трехмерный
260 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. 5 вектор X B) = [Хг (г), Х2 @? Х3 @1 с взаимно независимыми компонентами. Решение. Функция E.146) при заданном обобщении имеет вид ф0 (М, у - х) == BпВМ)-№ е Ш *=1 Щ . E.166) Находим по формулам E.155) и E.156): ах (*, х) - 0, Ьг {I, х) - Вь, г = 1, 2, 3. Эти результаты можно было и сразу усмотреть по значению параметров трехмерной нормальной функции E.160). Таким образом, первое и второе уравнения Колмогорова совпадают и имеют вид дфо(Т,у) д д2фо(Т,у) „ д2ф0(Т,у) + д8 а ( ду3 Полученное уравнение есть уравнение диффузии в пространстве. Если Вх, В2 и В3, называемые коэффициентами диффузии, различны, то диффузия в направлениях #ъ %2, х3 происходит с различной скоростью. В изотропном пространстве Вг = В2 = Въ = В. Уравнение в частности, описывает диффузию (распространение вследствие теплопроводности) тепла в однородном материале. Коэффициент В есть коэффициент теплопроводности. Функция E.149) при заданном обобщении запишется так: фо(х,Дг,у — х) = \- ^ 2 №-хй + А*х*'г\. E.162) 1 г )
§ 73] УРАВНЕНИЯ КОЛМОГОРОВА — ФЕЛЛЕРА 201 Первое и второе уравнения Колмогорова принимают соответственно вид з дфо (х; т, у) VI, дфо(х;т.у) + ~ А ^ 3 1 \Л л (/"фо (Х^ Т, У) /ч /г л (? О\ Г 2л В1 \ 2 = °» E.1ЬЗ) 3 2 |=1 ' ^1 При равноправности компонентов случайной функции- вектора коэффициенты Аг = А и Вг = В, г = 1, 2, . . . ..., д. Уравнения E.163) и E.164) описывают тогда, например, случайную функцию-вектор скорости броуновской частицы в изотропном трехмерном пространстве. Второй член уравнения E.164) учитывает вязкость, а третий член — диффузию в пространстве скоростей. Соответственно коэффициенты А и В называются коэффициентами трения и диффузии. § 73. Уравнения Колмогорова —- Феллера для чисто разрывного марковского процесса Чисто разрывный случайный процесс был определен как такой процесс, в котором случайная функция, принявшая в момент I значение х, в течение времени А^ с вероятностью 1 — р (г, х) А* + о (Дг) остается неизменной и лишь с вероятностью р (I, х) А* + о (А^) претерпевает изменение. Вероятность того, что при этом она примет значение, заключенное в промежутке [г/, у + йу] обозначим ^ (I, х] у) йу. Пусть, как обычно, ф (*, х; т, у) йу есть вероятность того, что случайная функция, принявшая в момент I значение х, в момент т примет значение в промежутке [г/, у + йу]. Тогда, на основании теоремы сложения и умножения вероятностей, справедливо
262 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ. 5 равенство Ф (*, х; I + Ы, у) йу=11-рA, х)М + о (Ы)] б (у - х)йу + + [р (*, х) М + о (А*)] С (*, х; у) йу. E.165) Напишем уравнение Колмогорова — Чепмена: Ф(*, д;;т,2)= ^ ф(*,ж; * + А*, »)ф(* + А*, у; т,2)йг/ E.166) —оо и подставим в него выражение E.165). Получим оо Ф(<,*;*,*)= $ {[1-р(«,ж)А« + о(А0]*(» —*) + —оо М, у; х,г)Лу. E.167) Так как Ф {I + М, у; т, г) б (у — ж) йу = <р (« + А«, ж; т, г), то E.167) можно переписать в виде ^ , о{М)"] V1» ^ "т-"дГ] х X *; т,2)- [р(*,х) + ^р-] X $ Шх;у)чA + Ы,у,х,г)Ау. E.168) —оо Совершая предельный переход при Д^ -> 0, получим оо -5 Ы,х;у)у({,у,т,1)ау]. E.169) Это есть первое уравнение Колмогорова — Феллера. Напишем теперь уравнение Колмогорова — Чепмена в виде E.170)
§ 73] УРАВНЕНИЯ КОЛМОГОРОВА «• ФЕЛЛЕРА 263 и подставим в него равенство Ф (т, у\ х + Дт, г) йъ = И—р (т, г/) Дт+о (Ат)] б {г —г/) + + \р (т, у) Ат + о (Ат)] с (т, у\ ъ) Аъ. E.171) Тогда, используя свойство 8-фуыкции, получим Ф (*, х; х + Ат, т.) = = ф (^, ж; т, *) — <р («, х; т, г) [р (т, 2) Ат + о (Ат)] + <рA,х;х,уIр{х,у)Ьт+о{Ьт)]1(х,у,г)ау. E.172) Перенося ф (^, х; т, г) в левую часть равенства, деля на Ат и совершая предельный переход при Ат -> 0, получим второе уравнение Колмогорова — Феллера ,р(Т + $р(т,1/)?(т,1/;2)ф(г,х;т,1/)^. E.173) —оо Уравнения Колмогорова — Феллера являются линейными однородными интегро-дифференциальными уравнениями относительно искомой функции ф (*, х; т, г). Обозначим Ь B, х; г) АЫг вероятность того, |что случайная функция, принявшая в момент I значение х, в течение промежутка времени дЛ, претерпит скачок и примет при этом значение, заключенное в промежутке [г, ъ + &]. Легко видеть, что Ь {I, х\ т) <И Лг = р (^, х) I (*, х\ ъ) &1 д,ъ. E.174) Так как независимо от значений I и х, то Ь (г, х\ 2)Аг = р (I, х). E.175) о Следовательно, уравнения Колмогорова — Феллера для чисто разрывного случайного процесса могут быть
264 СЛУЧАЙНАЯ ФУНКЦИЯ [ГЛ 5 написаны в виде Эф(^;Т'г) =Ф («,*;*, г) $ Ь{1,х;у)йу- —оо оо -\Ь{1, х; у) ф (I, у; х, г) йу, E.176) E.177) Таким образом, для решения уравнений Колмогорова — Феллера необходимо знать одну функцию Ь B, х; у). Примером чисто разрывного марковского процесса можно считать процесс изменения скорости звезды в звездном поле. Скорость звезды изменяется в результате происходящих время от времени сближений со звездами поля. Расстояние между звездами очень велики, промежуток времени, в течение которого происходит сближение и интенсивное взаимодействие, очень мал в сравнении со средним промежутком времени между сближениями. Но за время сближения происходит существенное изменение скорости звезды. Поэтому процесс при некоторой идеализации можно считать чисто разрывным. Функция Ь (I, х\ у) для чисто разрывного процесса — изменения скорости звезды в результате двойных сближений со звездами поля — была определена при решении задачи 79.