Текст
                    НАЦИОНАЛЬНОЕ ЭКОНОМИЧЕСКОЕ ОБРАЗОВАНИЕ
Л. Н. Фадеева, А. В. Лебедев
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКАЯ
СТАТИСТИКА
КОМБИНАТОРИКА
СЛУЧАЙНЫЕ ВЕЛИЧИНЫ
ЗАКОН БОЛЬШИХ ЧИСЕЛ
И ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА
ЦЕПИ МАРКОВА
СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ
ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ
ВРЕМЕННЫЕ РЯДЫ
РЕГРЕССИОННЫЙ, КОРРЕЛЯЦИОННЫЙ
И ДИСПЕРСИОННЫЙ АНАЛИЗ
ЧИТАЙ

НАЦИОНАЛЬНОЕ ЭКОНОМИЧЕСКОЕ ОБРАЗОВАНИЕ Л. Н. Фадеева, А. В. Лебедев ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Под редакцией доктора экономических наук, профессора Л. Н. Фадеевой 3-е издание, переработанное и дополненное Допущено УМО по классическому университетскому образованию в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению 080100 «Экономика* МОСКВА ЧИТАЙ! Рид Групп 2011
УДК 519.2(075.8) ББК 22.17я73 Ф 15 Фадеева Л. Н. Ф 15 Теория вероятностей и математическая статистика: учеб, по- собие / Л. Н. Фадеева, А. В. Лебедев; под ред. д-ра экон, наук, проф. Л. Н. Фадеевой. — М. : Рид Групп, 2011. — 496 с. — (Национальное экономическое образование). ISBN 978-5-4252-0390-8 Книга представляет собой учебно-методический комплекс, объеди- няющий теоретический материал, задачи и краткое руководство к раз- работке методов принятия решения в условиях неопределенности, реко- мендации и выводы на основе анализа статистических данных, научно обоснованного прогнозирования случайных явлений и их взаимосвязи, построения математических моделей реальных экономических ситуаций. Книга входит в состав учебного комплекса «Математика для экономи- стов», специально созданного для экономических вузов страны эконо- мическим факультетом МГУ имени М. В. Ломоносова. Цель данного издания — в удобной для восприятия форме дать студенту-экономисту весь объем математических знаний в части теории вероятностей и мате- матической статистики. Для студентов и преподавателей экономических специальностей ву- зов, слушателей послевузовского образования. УДК 519.2(075.8) ББК 22.17я73 © Л. Н. Фадеева, А. В. Лебедев, 2011 ISBN 978-5-4252-0390-8 © ООО «Рид Групп», 2011
Оглавление Предисловие....................................................7 Часть I ТЕОРИЯ ВЕРОЯТНОСТЕЙ ГЛАВА 1. Элементы комбинаторного анализа......................11 1.1. Основные понятия и теоремы комбинаторики.............11 1.2. Разбиение множества на группы........................18 Задачи для самостоятельного решения.......................19 ГЛАВА 2. Классическая вероятностная модель. Геометрическая вероятность ................................................. 23 2.1. Частотная интерпретация вероятности. Свойство устойчивости частот.......................................23 2.2. Пространство элементарных исходов. Событие и его вероятность.........................................25 2.3. Статистики Бозе-Эйнштейна, Ферми—Дирака, Максвелла—Больцмана.......................................32 2.4. Геометрическая вероятность...........................33 Зада чи для самостоятельного решения.....................37 ГЛАВА 3. Основные формулы теории вероятностей.................41 3.1. Операции над событиями...............................41 3.2. Теоремы сложения вероятностей........................43 3.3. Условная вероятность и теорема умножения.............46 3.4. Независимость событий................................48 3.5. Формула полной вероятности...........................50 3.6. Формула Байеса.......................................53 3.7. Аксиоматическое построение теории вероятностей.......54 Зада чи для самостоятельного решения.....................58 ГЛАВА 4. Повторные независимые испытания......................65 4.1. Испытания Бернулли...................................65 4.2. Наивероятнейшее число успехов........................67 4.3. Предельные теоремы и приближенные формулы............70 4.5. Полиномиальные испытания.............................74 Задачи для самостоятельного решения.......................76 ГЛАВА 5. Дискретные случайные величины........................82 5.1. Случайная величина и ее закон распределения..........82 5.2. Функция распределения случайной величины.............84 5.3. Случайный вектор в дискретном вероятностном пространстве . . 86 5.4. Совместная функция распределения случайного вектора. ... 90
4 Оглавление 5.5. Числовые характеристики дискретных случайных величин... 93 5.6. Основные дискретные распределения и их характеристики . . 96 5.7. Ковариация. Коэффициент корреляции...................97 5.8. Условные распределения и математические ожидания (дискретный случай).............................102 Задачи для самостоятельного решения......................105 ГЛАВА 6. Непрерывные случайные величины......................115 6.1. Плотность и функция распределения непрерывной случайной величины.......................................115 6.2. Числовые характеристики непрерывной случайной величины . .118 6.3. Производящая функция моментов.......................121 6.4. Примеры непрерывных случайных величин...............122 Задачи для самостоятельного решения......................135 ГЛАВА 7. Функции от случайных величин. Непрерывный случайный вектор.............................................140 7.1. Функции от случайных величин........................140 7.2. Совместный закон распределения непрерывных случайных величин........................................142 7.3. Плотность суммы двух непрерывных случайных величин . . 147 7.4. Условные распределения и условные математические ожидания непрерывной случайной величины..................149 Задачи для самостоятельного решения......................152 ГЛАВА 8. Закон больших чисел. Центральная предельная теорема ... 159 8.1. Неравенство Чебышева................................159 8.2. Закон больших чисел.................................161 8.3. Центральная предельная теорема (ЦПТ)................164 Задачи для самостоятельного решения......................167 ГЛАВА 9. Цепи Маркова........................................172 9.1. Основные определения................................172 9.2. Цепи Маркова с конечным числом состояний и дискретным временем....................................173 9.3. Цепи Маркова с непрерывным временем. Системы массового обслуживания...................................177 Задачи для самостоятельного решения......................181 Часть II МАТЕМАТИЧЕСКАЯ СТАТИСТИКА ГЛАВА 10. Основные понятия и задачи математической статистики . . 187 10.1 Генеральная и выборочная совокупность...............187 10.2. Графическое представление статистических рядов....191 10.3. Эмпирические законы распределения..................195 Задачи для самостоятельного решения......................200
Оглавление 5 ГЛАВА 11. Точечные оценки параметров законов распределения .... 205 11.1. Выборочные характеристики и точечные оценки..............205 11.2. Статистическая устойчивость основных выборочных характеристик.............................................207 11.3. Асимптотически нормальный характер основных выборочных характеристик..................................213 11.4. Эффективность оценок. Неравенство Рао—Фреше—Крамера.........................................214 11.5. Оценка математического ожидания по неравноточным наблюдениям...............................................220 Задачи для самостоятельного решения............................222 ГЛАВА 12. Функции и распределения в математической статистике . . 230 12.1. Бета- и гамма-функции....................................230 12.2. Квантили, процентные и критические точки.................234 12.3. Распределения хи-квадрат (закон Пирсона).237 12.4. Распределения Стьюдента..................................240 12.5. Распределение Фишера.....................................242 12.6. Гамма-распределение......................................244 12.7. Бета-распределение.......................................250 12.8. Приложения распределений в математической статистике. Теорема Фишера............................................252 Задачи для самостоятельного решения............................257 ГЛАВА 13. Методы построения оценок.................................260 13.1. Метод моментов...........................................260 13.2. Метод максимального правдоподобия........................265 13.3. Метод наименьших квадратов. Линейная регрессия......273 Задачи для самостоятельного решения...........................280 Глава 14. Доверительные интервалы..................................292 14.1. Основные понятия.........................................292 14.2. Точные доверительные интервалы...........................293 14.3. Асимптотические доверительные интервалы..................298 14.4. Интервальная оценка коэффициента корреляции..............302 Задачи для самостоятельного решения............................304 Глава 15. Проверка статистических гипотез..........................312 15.1. Основные определения.....................................312 15.2. Критерий отношения правдоподобия.........................315 15.3. Проверка гипотез для одной выборки.......................319 15.4. Проверка гипотез для двух выборок. Зависимые выборки: парные наблюдения.........................................327 15.5. Проверка гипотез для двух выборок. Независимые выборки . .328 15.6. Проверка гипотез о равенстве дисперсий для нескольких выборок. Критерий Бартлетта и Кокрена.....................336 Задачи для самостоятельного решения............................338
6 Оглавление Глава 16. Критерии согласия..................................352 16.6. Критерии согласия Пирсона и Фишера (хи-квадрат) .... 352 16.2. Критерий согласия Колмогорова......................362 Задачи для самостоятельного решения......................367 Глава 17. Элементы анализа временных рядов...................372 17.1. Основные понятия в анализе временных рядов.........372 17.2. Простые методы анализа и прогнозирование временных рядов....................................................374 17.3. Стационарность. Автокорреляция. Периодограмма......378 17.4. Модели авторегрессии и скользящего среднего........381 Задачи для самостоятельного решения......................384 Глава 18. Элементы линейного регрессионного и корреляционного анализа......................................................388 18.1. Функциональная, статистическая и корреляционная зависимости..............................................388 18.2. Регрессионные модели как инструмент анализа и прогнозирования экономических моделей..................391 18.3. Выборочные коэффициенты корреляции.................392 Задачи для самостоятельного решения......................396 Глава 19. Элементы дисперсионного анализа....................399 19.1. Основные понятия и определения.....................399 Задачи для самостоятельного решения......................402 ПРИЛОЖЕНИЯ Приложение 1. Примеры контрольных и экзаменационных работ.................................................404 Приложение 2. Таблицы....................................447 Ответы и указания............................................459 Литература...................................................494
Предисловие Одна из важнейших сфер приложения теории вероятностей и математической статистики — экономика. В настоящее время для прогнозирования экономических явлений и принятия пра- вильных управленческих решений необходимо хорошо разби- раться в вопросах эконометрического моделирования, регрес- сионного анализа, трендовых и сглаживающих моделей и др. Курс теории вероятностей и математической статистики входит в цикл фундаментальных дисциплин, изучение которых является обязательным для студентов экономических вузов и факультетов. Основное достоинство данного издания, подготовленного на основе цикла лекций, читаемых авторами на экономическом факультете Московского государственного университета имени М.В. Ломоносова, состоит в том, что оно соответствует об- разовательным стандартам третьего поколения и представляет собой учебно-методический комплекс, включающий теорети- ческий материал и большое количество практических заданий, упражнений и задач. Книга состоит из двух частей: «Теория вероятностей» и «Математическая статистика», каждая из которых разбита на главы, состоящие из отдельных параграфов. Для лучшего восприятия и усвоения достаточно сложного теоретического материала все определения, утверждения и до-
8 Предисловие казательства сопровождаются многочисленными практически- ми примерами. Для закрепления полученных знаний к каждой главе разработаны задачи, большинство из которых построе- ны на конкретном экономическом материале. Упражнения, предлагаемые для самостоятельного решения, дают возмож- ность студенту овладеть основными методами обработки и анализа статистических данных, получить навыки построения экономических моделей вероятностно-статистическими мето- дами, научиться пользоваться статистическими пакетами при- кладных программ для проведения необходимых вычислений, уметь интерпретировать результаты анализа и строить на их основе научные прогнозы. Издание содержит варианты кон- трольных и экзаменационных работ, а также теоретические тесты для самоконтроля полученных знаний.
Часть I ТЕОРИЯ ВЕРОЯТНОСТЕЙ
Глава i ЭЛЕМЕНТЫ КОМБИНАТОРНОГО АНАЛИЗА Одной из основных задач комбинаторного анализа (ком- бинаторики) является подсчет числа элементов конеч- ных множеств, заданных каким-либо описательным условием. Для этого разработаны различные формулы и пра- вила. i.i. Основные понятия и теоремы комбинаторики Пусть имеется к групп Av Av ..., Ак , причем /-я группа со- держит nt элементов. Тогда справедливы следующие правила. Правило умножения (основная формула комбинаторики). Общее число N способов, которыми можно выбрать по одному элементу из каждой группы и расставить их в определенном порядке (т.е. получить упорядоченную совокупность (at, а2, ..., ак), где а. е А), равно Это правило распространяется и на ситуации, когда новые группы образуются в процессе выбора элементов, если числен- ности этих групп не зависят от того, какие именно элементы были выбраны.
12 ЧАСТЬ I. Теория вероятностей Правило сложения. Если любые две группы А. и Л не имеют общих элементов, то выбор одного элемента или из А]9 или из А2, ..., или из Ак можно осуществить N = п^ + п, + ... + Л* способами. Задача 1. В группе 30 студентов. Необходимо выбрать ста- росту, заместителя старосты и профорга. Сколько существует способов это сделать? Решение. Старостой может быть выбран любой из 30 студен- тов, заместителем — любой из оставшихся 29, а профоргом — любой из оставшихся 28 студентов, т.е. пх — 30, п2 = 29, п3 = 28. По правилу умножения общее число N способов выбора ста- росты, его заместителя и профорга равно N — пх • п2 • п3 = = 30 • 29 • 28 = 24 360. Задача 2. Два почтальона должны разнести 10 писем по 10 адресам. Сколькими способами они могут распределить ра- боту? Решение. Первое письмо имеет пх = 2 альтернативы: либо его относит к адресату первый почтальон, либо второй. Для второго письма также есть п2 = 2 альтернативы и т.д., т.е. пх = п2 = ... = = л10 = 2. Следовательно, в силу правила умножения общее число способов распределений писем между двумя почтальонами # = ^...^=2 • 2 ... 2 = 210 = 1024. io ' Задача 3. В ящике 100 деталей, из них 30 деталей 1-го со- рта, 50 — 2-го, остальные — 3-го. Сколько существует способов извлечения из ящика одной детали 1-го или 2-го сорта? Решение. Деталь 1-го сорта может быть извлечена пх = 30 спо- собами, 2-го сорта — п2 = 50 способами. По правилу суммы существует N = п{ + п2 = 30 + 50 = 80 способов извлечения одной детали 1-го или 2-го сорта. Рассмотрим следующие типовые ситуации, которые явля- ются частными случаями общей схемы. Пусть имеется некото- рая конечная совокупность элементов {ар а2, ..., ап}, называемая генеральной совокупностью, и п — объем этой совокупности. Пусть эксперимент состоит в том, что из генеральной совокуп- ности последовательно выбирают к элементов и располагают их в порядке выбора. Возможны следующие ситуации.
Глава 1. Элементы комбинаторного анализа 13 Размещение без повторений, когда отобранный элемент пе- ред отбором следующего не возвращается в генеральную сово- купность. Такой выбор называется последовательным выбором без возвращения, а его результат — размещением без повторений из п элементов по к. Размещения — это упорядоченные совокупности элементов, отличающиеся друг от друга либо составом, либо порядком элементов. Теорема 1. Число различных способов, которыми можно про- извести последовательный выбор без возвращения к элементов из генеральной совокупности объема п, равно (П-Ц! Доказательство. Очевидно, что первый элемент можно вы- брать пх = п способами, и поскольку отобранный элемент не возвращается в генеральную совокупность, то следующий эле- мент выбирается из совокупности, объем которой на один эле- мент меньше, т.е. п2 = п, - 1, и т.д., так что пк = п — (к — 1). Тогда по правилу умножения общее число способов равно N = п(п - 1) ... (п - (к - 1)) = п\/(п - к)\ Пример 1. Все размещения без повторений двух элементов из множества {a, b, с}: ab, Ьа, ас, са, be, cb. В частном случае, когда выбирают все элементы генераль- ной совокупности, т.е. когда к = п, размещения называются перестановками. Перестановки — это упорядоченные совокупности, отлича- ющиеся друг от друга только порядком элементов. Число всех перестановок множества из п элементов равно Рп=п\ Пример 2. Все перестановки множества {a, b, с}: abc, bac, cba, acb, cab, bca. Размещения с повторениями, когда отобранный элемент перед отбором следующего возвращается в генеральную сово- купность. Такой выбор называется последовательным выбором с
14 ЧАСТЬ I. Теория вероятностей возвращением, а его результат — размещением с повторениями из п элементов по к. Теорема 2. Общее число различных способов, которыми можно произвести выбор с возвращением к элементов из генеральной со- вокупности объема п, равно Ак =пк. Доказательство. Так как каждый раз отобранный элемент перед отбором следующего возвращается в генеральную сово- купность, то выбор на каждом шаге производится из совокуп- ности объема п, и можно считать, что выбор производится из к групп и все группы состоят из одинакового числа элементов л, = п2 = ... — пк = п. Тогда, в силу основной формулы комби- наторики, число таких способов выбора равно N = пк. Пример 3. Все размещения с повторениями двух элементов из множества {a, b, с}: аа, ab, ас, ba, bb, be, са, cb, сс. Задача 4. Расписание одного дня состоит из 5 различных уроков. Определите число вариантов расписания при выборе из 11 дисциплин. Решение. Каждый вариант расписания представля- ет набор 5 дисциплин из 11, отличающихся от других ва- риантов как составом, так и порядком следования, поэтому Л = Д5, = 11! =_ = 7-8-9-1О-11 = 5544О. " (11-5)! 6! Задача 5. Порядок выступления 7 участников конкурса определяется жребием. Сколько различных вариантов жере- бьевки при этом возможно? Решение. Каждый вариант жеребьевки отличается только порядком участников конкурса, т.е. является перестановкой из 7 элементов. Их число равно Р7 = 7! = 1-2-3-4-5-6-7 = 5040. Задача 6. В конкурсе по 5 номинациям участвуют 10 кино- фильмов. Сколько существует вариантов распределения призов, если по каждой номинации установлены различные премии?
(лава 1. Элементы комбинаторного анализа 15 Решение. Каждый из вариантов распределения призов пред- ставляет собой комбинацию 5 фильмов из 10, отличающую- ся от других комбинаций как составом, так и их порядком. Так как каждый фильм может получить призы как по одной, так и по нескольким номинациям, то одни и те же фильмы могут повторяться. Поэтому число таких комбинаций рав- но числу размещений с повторениями из 10 элементов по 5: N = Л,о = 1О5 = 100000. Сочетания без повторений. Пусть из генеральной совокуп- ности берется сразу несколько элементов (либо элементы берут последовательно, но порядок их появления не учитывается). В результате такого одновременного неупорядоченного выбора к элементов из генеральной совокупности объема п получаются комбинации, которые называются сочетаниями без повторений из п элементов по к. Сочетаниями С* из л элементов по к называются неупоря- доченные совокупности, отличающиеся друг от друга хотя бы одним элементом. Теорема 3. Число сочетаний из п элементов по к равно: " (п-к)\к\ Доказательство. Среди Ак размещений без повторений имеется по к\ наборов каждого состава, представляющих со- бой всевозможные перестановки из к элементов этого состава. Поэтому С* -Ак/к\ Пример 4. Все сочетания без повторений двух элементов из множества {л, Ь, с}: {а, Ь}, {а, с}, {Ь, с}. Отметим некоторые полезные свойства числа сочетаний без повторений:
16 ЧАСТЬ I. Теория вероятностей С°=С"=1; Ск = Сп~к\ п п ’ fik i/^k + 1 _fik + 1. Vn Vn ~ Сл+1 ’ C„°+C:+C„2+... + C: = 2"; 4=дск. Числа Ck называют также биномиальными коэффициентами, поскольку они участвуют в разложении бинома Ньютона: (а + ЬУ = ^СкакЬп~к , к=0 Сочетания с повторениями. Пусть из генеральной совокуп- ности объема п выбирается к элементов, один за другим, при- чем каждый отобранный элемент перед отбором следующего возвращается в генеральную совокупность. При этом ведется запись, какие элементы появились и сколько раз, однако поря- док их появления не учитывается. Получившиеся совокупности называются сочетаниями с повторениями из п элементов по к. ► Теорема 4. Число сочетаний с повторениями из п элементов по к равно: гк — ск — Ч+*-г Пример 5. Все сочетания с повторениями двух элементов из множества {а, Ь, с}: {а, а}, {а, Ь}, {а, с}, {Ь, Ь}, {Ь, с}, {с, с}. Задача 7. В шахматном турнире участвуют 16 человек. Сколько партий должно быть сыграно в турнире, если между любыми участниками должна быть сыграна одна партия? Решение. Каждая партия играется двумя участниками из 16 и отличается от других только составом пар участников, т.е. представляет собой сочетания без повторений из 16 элементов -> ъг 16! 1516 ,ЛЛ по 2. Их число равно: С, =-----=------=120. 16 14!2! 1-2
Глава 1. Злементы комбинаторного анализа 17 Задача 8. В условиях задачи 1.6 определите, сколько суще- ствует вариантов распределения призов, если по каждой номи- нации установлены одинаковые призы. Решение. Если по каждой номинации установлены одинако- вые призы, то порядок фильмов в комбинации 5 призов зна- чения не имеет, и число вариантов представляет собой число сочетаний с повторениями из 10 элементов по 5, определяемое по формуле Сю = С^^, = С]54 = = 2002. 1-2-3-4-5 Задача 9. Садовник должен в течение 3 дней посадить 6 де- ревьев. Сколькими способами он может распределить по дням работу, если будет сажать не менее одного дерева в день? Решение. Предположим, что садовник сажает деревья в ряд и может принимать различные решения относительно того, после какого по счету дерева остановиться в первый день и после какого — во второй. Таким образом, можно предста- вить себе, что деревья разделены двумя перегородками, каждая из которых может стоять на одном из 5 мест (между дере- вьями). Перегородки должны стоять там по одной, поскольку иначе в какой-то день не будет посажено ни одного дерева. Таким образом, надо выбрать 2 элемента из 5 (без повторений). Следовательно, число способов С2 =10. Задача 10. Сколько существует четырехзначных чисел (воз- можно, начинающихся с нуля), сумма цифр которых равна 5? Решение. Представим число 5 в виде суммы последователь- ных единиц, разделенных на группы перегородками (каждая группа в сумме образует очередную цифру числа). Понятно, что таких перегородок понадобится 3. Мест для перегородок имеется 6 (до всех единиц, между ними и после). Каждое ме- сто может занимать одна или несколько перегородок (в по- следнем случае между ними нет единиц, и соответствующая сумма равна нулю). Рассмотрим эти места в качестве элемен- тов множества. Таким образом, надо выбрать 3 элемента из 6 (с повторениями). Следовательно, искомое количество чисел с:_с. ' 1-2-6
18 ЧАСТЬ I. Теория вероятностей 1.2. Разбиение множества на группы Пусть множество из п различных элементов разбивается на к групп так, что в первую группу попадают пх элементов, во вторую — п2 элементов, в к-ю группу — пк элементов, причем п\ + п2 + ••• + пк = п- Такую ситуацию называют разбиением множества на группы, ► Теорема 5. Число разбиений на к групп, когда в первую группу попадают nt элементов, во вторую — п2 элементов, в к-ю группу — пк элементов равно: КТ , ч п\ пк) = — л1!л2!...!л4! Доказательство. В первую группу могут попасть любые пх элементов из имеющихся л элементов первоначально, что мож- но сделать способами. Вторую группу надо заполнить л2 элементами из оставшихся л — пх элементов. Это можно сде- лать С^_п различными способами. Продолжая эту процедуру и используя основную формулу комбинаторики, получаем, что число способов разбиения л элементов по к групп так, что в первую группу попадают пх элементов, во вторую — л2 элемен- тов, в к-к> группу — пк элементов, равно: с"1 с"1 сПк______________И' . (п~п1У- П П—rtj П— X ...X лДп-л,)! л2!(л-л,-л2)! (л-л1-...-л,._1)!_ и! пк !0! ’ т.е. если множество из п элементов разбивается на т групп так, что в первую группу попадает пх элементов, во вторую — п2 элементов, в т-ю группу — п элементов, то число таких разбиений равно: ” , х л! Пример 6. Перечислим разбиения множества из 4 элемен- тов а, Ь, с, d на 2 группы по 2 элемента (6 штук): [{а, Ь}, {с, d}], [{а, с}, {b, d}], [{а, d}, {b, с}], [{с, d}, {а, b}]9 [{ft, d}, {а, с}], [{Ь, с}, {a, d}]. Задача 11. Сколькими способами можно разбить группу из 25 студентов на три подгруппы А, В и С по 6, 9 и 10 человек соответственно?
Глава 1. Элементы комбинаторного анализа 19 Решение. Здесь п = 25, к = 3, п{ = 6, пг = 9, л3 = 10. Согласно формуле число таких разбиений TV25(6,9,10) = 25! 6!9!10! Задача 12. Сколько существует семизначных чисел, состоя- щих из цифр 4, 5 и 6, в которых цифра 4 повторяется 3 раза, а цифры 5 и 6 — по 2 раза? Решение. Каждое семизначное число отличается от другого порядком следования цифр, при этом фактически все семь мест в этом числе делятся на три группы: на одни места ставится цифра 4, на другие места — цифра 5, а на третьи места — циф- ра 6. Таким образом множество состоит из 7 элементов (п = 7), причем л1 = 3, пг = 2, л3 = 2, и, следовательно, количество таких чисел равно: ЛГ7(3;2;2) = —— = 210. 7 3!2!2! Заметим, что порядок элементов при разбиении на группы не важен, а вот порядок групп (какая из них считается первой, какая — второй и т.д.) существен. Задачи для самостоятельного решения 1. Монету подбросили 3 раза. Сколько различных результатов бро- саний можно ожидать? 2. Доступ к файлу открывается, только если введен правильный пароль — определенный трехзначный номер из нечетных цифр. Каково максимальное число возможных попыток угадать пароль? 3. Группу из 10 человек требуется разбить на две непустые под- группы А и В. Сколькими способами это можно сделать? 4. Два наборщика должны набрать 16 текстов. Сколькими спосо- бами они могут распределить эту работу между собой? 5. Поезд метро делает 16 остановок, на которых выходят пассажи- ры. Сколькими способами могут распределиться между этими остановками 100 пассажиров, вошедших в поезд на конечной остановке? 6. Шесть студентов-переводников нужно распределить по трем группам. Сколькими способами это можно сделать? 7. Лифт останавливается на 7 этажах. Сколькими способами могут выйти на этих этажах 6 пассажиров, находящихся в кабине лифта?
20 ЧАСТЬ I. Теория вероятностей 8. Сколько существует пятизначных чисел, в которых есть цифры 1 и 2 (считаем, что число может начинаться с нуля)? 9. Байт — это машинное слово, состоящее из восьми бит. Каждый бит равен либо 0, либо 1. Сколько символов можно закодиро- вать с помощью байта? 10. Автомобильный номер состоит из трех букв и трех цифр. Сколько различных номеров можно составить, используя 30 букв и 10 цифр? 11. Сколько четырехзначных чисел, составленных из неповторяю- щихся нечетных цифр, содержит цифру 3? 12. Из цифр от 1 до 9 составляются всевозможные пятизначные числа, не содержащие одинаковых цифр. Определить количе- ство чисел, в которых есть цифры 2, 4 и 5 одновременно. 13. Есть 3 билета в различные театры. Сколькими способами они могут быть распределены среди 25 студентов группы, если каж- дый студент может получить только один билет? 14. Сколькими способами можно расположить на полке 10 томов энциклопедии? 15. Сколькими способами можно расположить на полке 10 томов энциклопедии так, чтобы девятый и десятый тома не стояли рядом? 16. Шесть групп занимаются в шести расположенных подряд ау- диториях. Сколько существует вариантов расписания, при ко- торых группы 1 и 2 находились бы в соседних аудиториях? 17. Сколькими способами можно расставить группу из 10 человек в очередь так, чтобы между двумя студентами А и Б было два человека? 18. Из бригады в 14 врачей ежедневно в течение 7 дней назначают двух дежурных врачей. Определить количество различных рас- писаний дежурства, если каждый врач дежурит ровно один раз в неделю. 19. Слово «ЭКОНОМИКА» разрезали на буквы, перемешали и выбирают их по одной, без возвращения. Сколько различных последовательностей букв может получиться? 20. Слово «МЕНЕДЖМЕНТ» разрезали на буквы, перемешали и выбирают их по одной, без возвращения. Сколько различных последовательностей букв может получиться? 21. В ящике 5 красных и 4 зеленых яблока. Сколькими способами можно выбрать 3 яблока из ящика?
Глава 1. Элементы комбинаторного анализа 21 22. Из ящика, в котором лежат 10 красных и 5 зеленых яблок, выбирают одно красное и два зеленых яблока. Сколькими спо- собами это можно сделать? 23. Десять человек при встрече обмениваются рукопожатиями (каж- дый с каждым). Сколько всего рукопожатий будет сделано? 24. В группе из 25 студентов нужно выбрать старосту и 3 членов сту- денческого комитета. Сколькими способами это можно сделать? 25. Акционерное собрание компании выбирает из 50 человек пре- зидента компании, председателя совета директоров и 10 членов совета директоров. Сколькими способами это можно сделать? 26. Из фирмы, в которой работают 10 человек, 5 сотрудников должны уехать в командировку. Сколько может быть составов этой группы, если директор фирмы, его заместитель и главный бухгалтер одновременно уезжать не должны? 27. В телевизионной студии работают 3 режиссера, 4 звукорежис- сера, 5 операторов, 7 корреспондентов и 2 музыкальных ре- дактора. Сколькими способами можно составить съемочную группу, состоящую из одного режиссера, двух операторов, од- ного звукорежиссера и двух корреспондентов? 28. Студенческая группа из 27 человек пишет контрольную работу из трех вариантов (по 9 человек в каждом). Сколькими спо- собами можно выбрать 5 человек из группы так, чтобы среди них оказались писавшие все три варианта? 29. На группу из 25 человек выделены 3 пригласительных билета на вечер. Сколькими способами они могут быть распределены (не более одного билета в руки)? 30. Имеются 7 билетов: 3 — в один театр и 4 — в другой. Сколькими способами они могут быть распределены между студентами группы из 25 человек? 31. Садовник должен в течение трех дней посадить 10 одинако- вых деревьев. Сколькими способами он может распределить по дням работу, если будет сажать не менее одного дерева в день? 32. Инвестор намеревается купить 12 акций 4 компаний (не менее чем по одной акции каждой). Сколькими способами он может распределить свой капитал? 33. Инвестор намеревается купить И акций 5 компаний (причем от покупки акций одной или более из этих компаний он мо- жет отказаться). Сколькими способами он может распределить свой капитал? 34. Сколько существует трехзначных чисел (возможно, начинаю- щихся с нуля), сумма цифр которых равна 6?
22 ЧАСТЬ I. Теория вероятностей 35. Сколько существует четырехзначных чисел (возможно, начи- нающихся с нуля), сумма цифр которых равна 9? 36. Группу из 10 человек требуется разбить на две подгруппы так, чтобы в первой группе было 6 человек, а во второй — 4 чело- века. Сколькими способами это можно сделать? 37. Группу из 16 человек требуется разбить на 3 подгруппы, в первой из которых должно быть 5 человек, во второй — 7 человек, в третьей — 4 человека. Сколькими способами это можно сделать? 38. Студенческую группу из 24 человек (12 девушек и 12 юношей) разбивают на две равные подгруппы так, чтобы в каждой под- группе юношей и девушек было поровну. Сколькими способа- ми это можно сделать? 39. Семь яблок и три апельсина надо положить в два пакета так, чтобы в каждом пакете был хотя бы один апельсин и чтобы количество фруктов в них было одинаковым. Сколькими спо- собами это можно сделать? Пакеты считаем различными. 40. Лифт, в котором находятся 9 пассажиров, может останавли- ваться на 10 этажах. На одном этаже выходят 2 человека, на другом — 3 и еще на одном — 4. Сколькими способами пас- сажиры могут выйти из лифта? 41. Восемь авторов должны написать книгу из 16 глав. Сколькими способами можно распределить материал между авторами, если первые два автора напишут по три главы, следующие четыре — по две и последние два — по одной главе книги? 42. Сколькими способами можно расположить на шахматной до- ске две ладьи так, чтобы одна не могла взять другую? (Одна ладья может взять другую, если она находится с ней на одной горизонтали или на одной вертикали шахматной доски). 43. Сколько существует двузначных чисел, кратных либо 2, либо 5, либо тому и другому числу одновременно? 44. Десяти ученикам выданы два варианта контрольной работы. Сколькими способами можно посадить учеников в два ряда, чтобы у сидящих рядом не было одинаковых вариантов, а у сидящих друг за другом был один и тот же вариант? 45. Три машины № 1, 2, 3 должны доставить товар в шесть мага- зинов. Сколькими способами можно использовать машины, если грузоподъемность каждой из них позволяет взять товар сразу для всех магазинов и если две машины в один и тот же магазин не направляются? Сколько вариантов маршрута воз- можно, если решено использовать только машину № 1?
Глава 2 КЛАССИЧЕСКАЯ ВЕРОЯТНОСТНАЯ МОДЕЛЬ. ГЕОМЕТРИЧЕСКАЯ ВЕРОЯТНОСТЬ 2.1. Частотная интерпретация вероятности. Свойство устойчивости частот Теория вероятностей — это наука о закономерностях случай- ных событий. Под случайным событием в теории вероятностей понимается всякое явление, которое может произойти или не произойти при осуществлении определенного комплекса ус- ловий. Каждое такое осуществление называется испытанием, опытом или экспериментом. События можно подразделить на достоверные, невозмож- ные и случайные. Достоверным называется событие, которое обязательно про- изойдет при испытании. Невозможным называется событие, которое заведомо не произойдет при испытании. Случайным называется событие, которое в результате экс- перимента может либо произойти, либо не произойти (в зави- симости от случайных обстоятельств). Такое определение событий можно назвать эмпирическим. Более строгие, математические (теоретико-множественные) определения будут даны позже.
24 ЧАСТЬ I. Теория вероятностей Предметом теории вероятностей являются закономерности массовых случайных событий, где под массовостью мы пони- маем многократную повторяемость. Рассмотрим несколько событий: 1. А — появление герба при бросании монеты; 2. В — появление трех гербов при трехкратном бросании монеты; 3. С — попадание в цель при выстреле; 4. D — выигрыш по билету денежно-вещевой лотереи. Очевидно, что каждое из этих событий обладает какой-то степенью возможности. Для того чтобы количественно сравни- вать между собой события по степени их возможности, нужно с каждым событием связать определенное число. Вероятность события есть численная мера степени объек- тивной возможности этого события. В качестве единицы изме- рения вероятности принята вероятность достоверного события. Вероятность невозможного события равна нулю. Вероятность любого случайного события обозначается Р(А) и изменяется в диапазоне от нуля до единицы: 0 < Р(А) < 1. Пусть проведена серия из п испытаний (п называют длиной серии), в каждом из которых может произойти или не произойти событие А. Подсчитаем, сколько раз в этой серии эксперимент заканчивался наступлением события А, и обозначим это число через п(А). Поделив его на общее число п всех повторений экс- л(Л) перимента, получим величину Р(А) = которая называется п п относительной частотой события А. При небольшом числе экспе- риментов относительная частота события носит случайный харак- тер и может заметно меняться от одной группы опытов к другой. При увеличении числа экспериментов случайные обстоятельства, свойственные каждому отдельному эксперименту, в массе взаим- но погашаются, и частота Рп(А) проявляет тенденцию стабилизи- роваться, приближаясь к некоторой средней величине. Этот эмпирический факт называется свойством статисти- ческой устойчивости частот: по мере неограниченного увеличения числа однородных и независимых испытаний относительная ча- стота события А стремится к некоторой постоянной величине. Число, к которому приближается относительная частота со- бытия при неограниченном увеличении числа экспериментов, можно принять за вероятность события Л, т.е. частотная интер- претация вероятности состоит в том, что относительную часто-
Глава 2. Классическая вероятностная модель. Геометрическая вероятность 25 ту события принимают за приближенное значение вероятности этого же события. Математически данное свойство записывается в виде предела: НтРл(Л) = Р(Л). Однако приближение частоты события к его вероятности не является обычной сходимостью к пределу. Для описания схо- димости частоты события к его вероятности вводится понятие сходимости по вероятности: последовательность Хп сходится по вероятности к величине а, если при любом сколь угодно малом е > 0 вероятность неравенства |Х - а| < е с увеличением п не- ограниченно приближается к единице, т.е. 1йпР(|Хя -д|<е) = 1 и обозначается Хп—^—>а. Тогда справедлива Теорема Бернулли. При неограниченном увеличении числа од- нородных и независимых испытаний частота события сходится по вероятности к вероятности появления события в отдельном испытании. Частота события А отличается от вероятности этого со- бытия тем, что вероятность величина детерминированная, а частота — величина случайная и до опыта неизвестная. В качестве примера укажем на опыт Бюффона, в котором симметричная монета подбрасывалась 4040 раз, а герб выпадал 2048 раз. Частота появления герба в данной серии наблюдений равна 2048/4040 = 0,507, что близко к интуитивно ожидаемому значению вероятности 0,5. К сожалению, частотная интерпретация вероятности несовер- шенна как с логической, так и с практической точки зрения. Далеко не всегда возможно или желательно провести большое ко- личество экспериментов, а кроме того, существует необходимость в предсказании вероятностей событий, которые еще не происхо- дили. Поэтому далее мы рассмотрим другие определения. 2.2. Пространство элементарных исходов. Событие и его вероятность Для того чтобы формально описать некоторый экспери- мент1, нужно указать все возможные варианты результатов, ко- 1 Под экспериментом имеем в виду не обязательно научный экспери- мент, а любое действие или наблюдение либо их последовательность.
26 ЧАСТЬ I. Теория вероятностей торыми этот эксперимент может закончиться. Предполагается, что эксперимент может закончиться одним и только одним ис- ходом. Множество Q всех возможных исходов эксперимента на- зывают пространством элементарных исходов, а каждый элемент пространства называется элементарным событием. Если все возможные исходы можно перечислить, то про- странство элементарных исходов называют дискретным (конеч- ным или счетным): Q = {со., со-, ..., со }, или Q = {со., со-, ...}. ' 1' Z л' ' 1 Z' 9 Пример 1. При бросании симметричной монеты возможны два исхода: выпадение решки или герба. Они удовлетворяют всем трем указанным выше условиям, поэтому в этом случае простран- ство элементарных исходов представляется в виде Q = {Р, Г}, где буквами Р и Г обозначены решка и герб соответственно. Пример 2. При одновременном бросании двух монет исходы представляют собой упорядоченные пары, состоящих из симво- лов Р и Г. Первый элемент этой пары — результат, выпавший на первой монете, второй элемент — результат на второй мо- нете. Очевидно, что таких пар — четыре: Q = {РР, РГ, ГР, ГГ}. Пример 3. В случае бросания игральной кости может вы- пасть любое из чисел 1, 2, 3, 4, 5, 6. Поэтому пространство элементарных исходов Q = {1, 2, 3, 4, 5, 6}. Пример 4. При одновременном бросании двух игральных костей элементарные исходы представляют собой пары (х, у), где х — число очков, выпавшее на первой кости, а у - число очков на второй кости. Всего таких пар — 36: Q = {(х, у): х = 1, ..., 6, у = 1, ..., 6}. Событием в случае дискретного пространства элементарных исходов называется любое его подмножество Лей. Говорят, что «событие А произошло», если эксперимент закончился одним из элементарных исходов со Е А. Простым событием называется множество, состоящее из од- ного элементарного исхода. Сложным событием называется мно- жество, состоящее из двух или более элементарных исходов.
Глава 2. Классическая вероятностная модель. Геометрическая вероятность 27 Введем определение вероятности. Говорят, что в дискретном пространстве элементарных событий Q = {<вр со2, ...} задана ве- роятность, если каждому элементарному событию со, поставле- но в соответствие неотрицательное число > 0, называемое его вероятностью, такое, что сумма (конечная или бесконечная) вероятностей всех элементарных исходов равна единице: (или Jp(=l). /=1 /=1 Вероятностью события А называется сумма вероятностей всех элементарных исходов, входящих в Л, т.е. Р(А) = Из этого определения вероятности события следует, что всегда вы- полняется неравенство 0 < Р(А) < 1. Таким образом, вероятность события — это числовая функ- ция, определенная на подмножествах пространства элементар- ных исходов. Из определения вероятности события следует, что: 1. P(Q) = 1, где Q — пространство элементарных исходов; 2. Р(0) = 0, если 0 - пустое множество. Простейшим пространством элементарных исхдов является так называемая «классическая модель», в которой пространство конечно и все исходы эксперимента: 1) равновозможны; 2) взаимно несовместны (никакие исходы не могут про- изойти одновременно); 3) все исходы образуют полную группу событий, т.е. ника- кие другие исходы, кроме перечисленных, не могут произойти. Такое пространство называют симметричным. Если Q = {со13 со2, ..., сол} — симметричное пространство, то вероятности элементарных исходов равны между собой: Лео,) = pt = р для любого i = 1,2, ..., п и ^Р(ш.) = ^А = рл = 1, j=i <=i 1 так что вероятность элементарного исхода равна Р, = Р=— для любого / = 1, 2, ..., п. Отсюда по определению вероятность события А = {сор со2, ..., coj равна Р(Л)= £ P(co,) = -m = j4’ где (Oft А М |И|
28 ЧАСТЬ I. Теория вероятностей п = |Q| — число элементов во множестве Q, которое обычно называют общим числом исходов, а т = |Я| — число элементов во множестве А, называемое числом исходов, благоприятствующих событию А. Итак, в случае симметричного пространства вероятность со- бытия А определяется как отношение числа случаев, благопри- ятствующих событию А, к общему числу случаев: Р(А) = — . п Это классическое определение вероятности события. Событие Л, состоящее из всех элементарных исходов, не входящих в А, называется противоположным событием к собы- тию А. Оно происходит тогда и только тогда, когда событие А не произошло. Очевидно, что Р(Л) + Р(Л) = 1. Это равенство используется для вычисления вероятности со- бытия А в случае, когда вероятность противоположного события известна или легко может быть найдена. Тогда Р(Л) = 1-Р(Л). Таким образом, для вычисления вероятности в каждой за- даче важно определить, в чем состоит эксперимент, правильно построить соответствующее пространство элементарных исхо- дов Q и выделить в нем требуемое событие А. Затем, используя методы комбинаторики, подсчитать число элементов в Q и А. Задача 1. В ящике 5 апельсинов и 4 яблока. Наудачу вы- бираются 3 фрукта. Какова вероятность, что все три фрукта — апельсины? Решение. Элементарными исходами здесь являются выборки, включающие 3 фрукта. Поскольку порядок здесь безразличен, будем считать выборки неупорядоченными (и разумеется, бес- повторными). Общее число элементарных исходов п = |Q| равно числу способов выбрать 3 элемента из 9, т.е. числу сочетаний С3. Число благоприятствующих исходов т = |Л| будет равно числу способов выбора трех апельсинов из имеющихся 5, т.е. числу со- четаний трех элементов из 5, или С53. Тогда искомая вероятность 5! P(A^ = ^ = W- 3!6!
Глава 2. Классическая вероятностная модель. Геометрическая вероятность 29 ~= ====^===== ............................. — Задача 2. Преподаватель предлагает каждому из трех сту- дентов задумать любое число от 1 до 10. Считая, что выбор каждым из студентов любого числа из заданных равновозмо- жен, найти вероятность того, что у какой-то пары из них за- думанные числа совпадут. Решение. Вначале подсчитаем общее количество исходов. Первый из студентов выбирает одно из 10 чисел и имеет л, = 10 возможностей, второй тоже имеет п2 = 10 возможностей, на- конец, третий также имеет л3 = 10 возможностей. В силу ос- новной формулы комбинаторики общее число способов будет равно: п = • п2 • л3 = 103 = 1000, т.е. все пространство содер- жит 1000 элементарных исходов. Подсчет количества благоприятствующих исходов более сло- жен. Заметим, что совпадение задуманных чисел может произой- ти у любой пары студентов (или даже одновременно у всех троих). Чтобы не разбирать отдельно все эти случаи, удобно перейти к противоположному событию, т.е. подсчитать количество тех слу- чаев, когда все три студента задумывают разные числа. Первый из них по-прежнему имеет т1 = 10 способов выбора числа. Второй студент имеет теперь лишь т2 = 9 возможностей, поскольку ему приходится заботиться о том, чтобы его число не совпало с за- думанным числом первого студента т2 * /и,. Третий студент еще более ограничен в выборе — у него всего /п3 = 8 возможностей. Из 10 возможных для т3 исключаются два числа: т3^т1, т3* т2. Поэтому общее количество комбинаций задуманных чисел, в ко- торых нет совпадений, равно в силу той же основной формулы т = 10 • 9 • 8 = 720. Остальные 280 случаев характеризуются наличием хотя бы одного совпадения. Следовательно, искомая вероятность совпадения равна Р = 280/1000 = 0,28. Задача 3. Найти вероятность того, что в 8-значном числе ровно 4 цифры совпадают, а остальные различны. Решение. Событие А = {восьмизначное число содержит 4 одинаковые цифры}. Из условия задачи следует, что в числе пять различных цифр, одна из них повторяется. Число спо- собов ее выбора равно числу способов выбора одной цифры из 10 цифр. Эта цифра занимает любые 4 места в числе, что возможно сделать С84 способами, так как порядок здесь не ва- жен. Оставшиеся 4 места занимают различные цифры из не-
30 ЧАСТЬ I. Теория вероятностей использованных девяти, и так как число зависит от порядка расположения цифр, то число способов выбора четырех цифр равно числу размещений А^. Тогда число благоприятствующих исходов \А | = 10С84Л,4. Всего же способов составления 8-значных чисел |Q| = 108. Искомая вероятность р |Л|^10С8Ц4= 8! 9! 1 |Я| 108 4!4! 5! 10' = 0,021168. Задача 4. Шесть клиентов случайным образом обращаются в 5 фирм. Найти вероятность того, что хотя бы в одну фирму никто не обратится. Решение. Рассмотрим противоположное событие А, состоящее в том, что в каждую из 5 фирм обратился клиент, тогда в какую-то из них обратились два человека, а в остальные 4 фирмы — по од- — 5-6* ному клиенту. Таких возможностей | А| = 5-N6(2,1,1,1,1) = . Всего же способов распределить 6 клиентов по 5 фирмам — 5-6* 1 |Q| = 56. Отсюда Р(А)= = 03152, следовательно, Р(Л) = 1-Р(Л) = 0,8848. Задача 5. Среди 25 экзаменационных билетов имеется 5 «счастливых» и 20 «несчастливых». Студенты подходят за би- летами один за другим по очереди. У кого больше вероятность вытащить «счастливый» билет: у того, кто подошел первым, или у того, кто подошел вторым? Решение. Пусть «счастливые» билеты имеют номера 1, 2, 3, 4, 5. Обозначим через ix номер билета, взятого первым сту- дентом, через /2 — номер билета, взятого вторым студентом, тогда элементарным исходом будет пара (i},i2), а пространство элементарных исходов f 2 = {(Z,, /2): z, = 1,..., 25, /2 = 1,..., 25, = /2}, где все элементарные исходы равновероятны. Событие А = {пер- вый студент взял «счастливый» билет} имеет вид 3 = {(А, «2)ц =1, ...,5, i2 = 1,..., 25, i} *i2},
(лава 2. Классическая вероятностная модель. Геометрическая вероятность 31 а событие В = {второй студент взял «счастливый» билет} имеет вид В = {('i> ‘г) Ц = 1, 25< t •••» 5> h *h}• Каждое из событий Аи В содержит | А |=| В |= С5‘с]4 = 120 эле- ментов, а все пространство Q имеет | Q | = С25С24 — 600 элемен- тов. Следовательно, Р(А) = Р(В) = 1/5. Вероятность не зависит от того, кто подошел первым, кто вторым и т.п. Задача 2.6. Пусть в урне имеется N шаров, из них М белых и N - М черных. Из урны извлекается п шаров. Найти вероятность того, что среди них окажется ровно т белых шаров. Решение. Так как порядок элементов здесь несуществен, чис- ло всех возможных наборов объема п из N элементов равно чис- лу сочетаний CnN. Число испытаний, которые благоприятствуют событию А — «т белых шаров, п — т черных», равно С^С"^”М , (jm (jn-m и, следовательно, искомая вероятность равна Р(А) = м . Cn Описанная ситуация представляет собой пример «урновой мо- дели». Говорят также, что случайное число белых шаров в вы- борке имеет гипергеометрическое распределение. В общем случае предположим, что имеется N = и, + п2 + ...+ пк различных частиц, причем nt частиц первого типа, п2 — второго типа, ..., пк — к-го типа. Случайным образом из этих Участии выбирается т частиц. Найдем вероятность события А, состоя- щего в том, что среди выбранных окажется ровно < пх частиц первого типа, т2 < п2 — второго типа, ..., тк < пк — к-го типа, так что т = т] + т2 + ... + тк. Поскольку порядок выбора несуществен, то при опреде- лении общего числа исходов и числа благоприятных исходов необходимо пользоваться числом сочетаний. Общее число эле- ментарных исходов равно С%. Далее, частиц первого типа можно выбрать С"1 способами, т2 частиц второго типа — С”1 способами, ..., тк частиц к-го типа — С”‘ способами. При этом любой выбор частиц определенного типа комбинируют с лю- быми выборами частиц остальных типов и, следовательно, чис- ло благоприятствующих событию А исходов равно . Поэтому вероятность равна:
32 ЧАСТЬ I. Теория вероятностей z-T/Wj Р(А) = Р(тх,т2,...,тк)= ''N Таким образом, подсчет вероятностей событий сводится к комбинаторным задачам определения числа элементов во мно- жествах А и Q. 2.3. Статистики Бозе—Эйнштейна, Ферми—Дирака, Максвелла—Больцмана Предположим, что п неразличимых частиц распределяются по т ячейкам. Различными и равновозможными считаются распре- деления частиц по ячейкам, отличающиеся только числом частиц, попавших в каждую ячейку. Такое распределение носит название статистики Бозе—Эйнштейна. Найдем общее число элементарных исходов в статистике Бозе—Эйнштейна. Если считать «белый» элемент частицей, а «черный» — перегородкой, то существу- ет взаимно однозначное соответствие между способами выбора т — 1 «черного» элемента и размещениями частиц в статистике Бозе—Эйнштейна. Для этого рассмотрим последовательность из п + т - 1 элементов и выберем из них т — 1 «черный» элемент. 1 2 3 т -1 о • О о о • • о ... ° • 12 3 4 5 6 7 л + тл —1 Рис. 2.1 Так, на рис. 2.1 в первую ячейку попала одна частица, во вторую — три, третья оказалась пустой и т.д., последняя, т-я ячейка также оказалась пустой. Поэтому общее число размеще- ний равно C”+"JLi. Найдем вероятность того, что в фиксирован- ную ячейку попало ровно к частиц (событие А). Заметим, что если в этой фиксированной ячейке уже находится к частиц, то остальные п — к частиц должны быть распределены по остав- шимся т — 1 ячейкам, а это можно сделать , способами. Следовательно, искомая вероятность Р(А)= .
(лава 2. Классическая вероятностная модель. Геометрическая вероятность 33 В статистике Ферми—Дирака п неразличимых частиц рас- пределяются по т ячейкам (л < т), однако в каждой ячейке не может находиться более одной частицы. Число различных элементарных исходов совпадает с числом способов, которыми можно выбрать л занятых ячеек из общего числа ячеек т, и так как порядок выбора несуществен, то число способов равно С”. Найдем вероятность того, что заняты к фиксированных яче- ек. Пусть событие А — заняты фиксированные к ячеек {к < п). Тогда оставшиеся т — к ячеек должны быть заполнены л — к частицами, а это можно сделать С^~кк способами. Поэтому ис- комая вероятность равна: f^n—k Р(А)=-*=*-. Предполагая, что п различных частиц распределяются по т ячейкам без ограничений на число попавших в каждую ячейку частиц, получаем статистику Максвелла—Больцмана. Поскольку каждая из п частиц может попасть в любую из т ячеек, то общее число элементарных исходов равно пГ. Событие А за- ключается в том, что в первую ячейку попало пх частиц, во вторую — п2, ..., в т-ю — пт частиц (пх + п2 + ... + пт = л). Число благоприятных для события А исходов равно числу раз- биений множества из п элементов на т групп так, что в первую группу попадает пх элементов, во вторую — п2 элементов, в т-ю группу — пт элементов, т.е. числу Лл(Л1,Л2,...,Лл,) = — л1!л2!...ля! Таким образом, искомая вероятность Р(Л) =------------. л,^!..^! т" Статистика Максвелла—Больцмана представляет собой частный случай так называемой полиномиальной схемы. 2.4. Геометрическая вероятность Рассмотрим «-мерное вещественное пространство Л". Пусть в какую-то ограниченную область Q с А" наудачу бросили точ- ку. Слово «наудачу» означает, что в таком эксперименте все 2- Теория вероятностей
34 ЧАСТЬ I. Теория вероятностей точки области Q «равновозможны». В этом случае вероятность попадания этой точки в какую-то подобласть Л с Q определя- ется формулой K(Q) где И(Я) и K(Q) — «-мерные объемы областей А и Q соответ- ственно. Здесь элементарными исходами называются точки мно- жества Q (которое играет роль пространства элементарных ис- ходов), а благоприятствующими исходами — точки множества А. Задача 7. Точку наудачу бросили на отрезок [0; 2]. Какова вероятность попадания этой точки на отрезок [0,5; 1,4]? Решение. Здесь пространство элементарных исходов — весь отрезок Q = [0; 2], а множество благоприятствующих исходов А = [0,5; 1,4], при этом длины этих отрезков равны /(Q) = 2 и 1(A) = 0,9. Поэтому вероятность попадания брошенной точки в о/ лх '(Л) °>9 п указанный отрезок Р(Л) = ^щ=—=0,45. Задача 8. На отрезок [0; 2] бросили наудачу и поочередно две точки. Какова вероятность, что первая точка лежит правее второй точки? Решение. Обозначим получившиеся координаты точек через х и у. Элементарным исходом в таком бросании двух точек бу- дет пара (х, у), а пространством элементарных исходов — ква- драт Q = {(x, у):х,уе[0; 2]}. Событие А = {первая точка лежит правее второй точки} равносильно условию х > у, следователь- но, Л = {(х, у):х, уе[0; 2],х> у}, т.е. представляет собой треу- гольник (рис. 2.2). Площади квадрата и треугольника равны соответственно 5(Q) = 4 и 5(Л) = 2, а потому вероятность Р(А) = ^- = - = 0,5. 5(0) 4 Задача 9. Стержень (рис. 2.3) разламывается на две части в случайной точке, равномерно распределенной по длине стерж- ня. Найти вероятность того, что меньший обломок имеет дли- ну, не превосходящую одной трети длины стержня. Решение. Обозначим длину стержня £, а расстояние точки разлома от одного (например, левого) конца стержня — х.
Глава 2. Классическая вероятностная модель. Геометрическая вероятность 35 у X Рис. 2.2 Тогда описанное событие произойдет при условии, если либо L 2L ТА х<—, либо х>—. Искомая вероятность равна отношению Р(А) = 3 + 3 L 3 Рис. 2.3 Задача 10 (задача о встрече). Два лица А и В условились встретиться в определенном месте между 12 и 13 часами. При- шедший первым ждет другого в течение 20 минут, после чего уходит. Чему равна вероятность встречи лиц А и В, если приход каждого из них может произойти наудачу в течение указанного часа и моменты прихода независимы? Решение. Обозначим моменты прихода лица А через х и лица В через у. Для того чтобы встреча произошла, необхо- димо и достаточно, чтобы | х - у I <20. Изобразим х и у как координаты на плоскости, в качестве единицы масштаба вы- берем минуту. Всевозможные исходы представляются точками квадрата со стороной 60, а благоприятствующие встрече рас- полагаются в заштрихованной области. Искомая вероятность равна отношению площади заштрихованной фигуры (рис. 2.4) к площади всего квадрата: р = (602 — 402)/602 = 5/9.
36 ЧАСТЬ I. Теория вероятностей Задача 11 (задача Бюффона). Плоскость разграфлена парал- лельными прямыми, отстоящими одна от другой на расстоянии 2а. На плоскость наудачу бросается игла длиной 21 (/ < а). Найти вероятность того, что игла пересечет какую-нибудь прямую. Решение. Если игла бросается с достаточной высоты и ее на- чальное положение случайно, то под словом «наудачу» подраз- умевается, во-первых, что центр иглы наудачу попадет на от- резок длиной 2а, во-вторых, что угол <р между прямой и иглой равномерно распределен на отрезке [0; л], и в-третьих, что на величину угла не влияет расстояние от центра до прямой. Поэтому изобразим результат бросания точкой с координатами (ср, х), лежащей внутри прямоугольника со сторонами а и л, где х — расстояние от центра иглы до ближайшей прямой. Из рис. 2.5,а видно, что пересечение иглы с прямой происходит тогда и только тогда, когда х < /зтф. Искомая вероятность рав- на отношению площади заштрихованной области А к площади прямоугольника на рис. 2.5,6: Р(Л) = — f/БШфЛр = — . ла ла Отметим, что полученную формулу можно применить для приближенного вычисления числа л. Действительно, получаем: л = 21/(аР(А)). Проводя многократные эксперименты (броса- ния иглы), можно приблизить вероятность Р(Л) относительной частотой Рп(А) и соответственно найти приближенное значение лп = 21/(аРп(А)). Подобное вычисление детерминированных ве-
Глава 2. Классическая вероятностная модель. Геометрическая вероятность 37 Рис. 2.5 личин с помощью последовательности испытаний со случайны- ми исходами называется методом Монте-Карло. Разумеется, в современных исследованиях для этого используется компьютер. Задачи для самостоятельного решения 1. Бросают две игральные кости. Чему равна вероятность того, что сумма очков, выпавших на обеих костях, не превзойдет 5? 2. Какова вероятность того, что в 4 бросаниях кости хотя бы один раз выпадет «единица»? 3. Четыре человека вошли в лифт на первом этаже шестиэтажного дома. Найти вероятности следующих событий: а) все пассажиры выйдут на шестом этаже; б) все пассажиры выйдут на одном и том же этаже; в) все пассажиры выйдут на разных этажах. 4. Семь человек вошли в лифт на первом этаже восьмиэтажного дома. Какова вероятность, что хотя бы на одном этаже вышли по крайней мере два человека? 5. Лифт начинает движение с 7 пассажирами и останавливается на 10 этажах. Найти вероятность того, что три пассажира вышли на одном этаже, два — на другом этаже и еще два — на еще одном этаже. 6. Пять яблок раскладываются в четыре ящика. Какова вероят- ность, что в двух ящиках будет по два яблока, в одном — одно яблоко и один ящик будет пустой? Шесть шаров случайным образом раскладываются по 3 ящикам. Найти вероятность того, что в первом ящике лежит 4 шара.
38 ЧАСТЬ I. Теория вероятностей 8. Пять клиентов случайным образом обращаются в 5 фирм. Найти вероятность того, что ровно в одну фирму никто не обратится. 9. Шесть клиентов обращаются в 3 фирмы равновероятно. Найти вероятность того, что ровно в одну фирму обратятся 2 клиента. 10. Шесть клиентов обращаются в 4 фирмы равновероятно. Найти вероятность того, что в какие-то две фирмы обратятся по два клиента и в какие-то две — по одному. 11. У клиентов обращается в М фирм равновероятно. Найти веро- ятность того, что хотя бы в одну фирму никто не обратится, если: a) N = 5, М = 4; б) N = 6, М = 4; в) N = 7, М = 5. 12. N клиентов обращаются в М фирм равновероятно. Найти веро- ятность того, что во все фирмы обратятся разное число клиен- тов (включая, возможно, ноль), если a) N = 6, М = 3; б) У = 7, Л/= 3; в) У = 7, М = 4. 13. В каждой упаковке товара фирмы «Икс» имеется одна из букв «И», «К», «С» (равновероятно). Какова вероятность собрать все буквы, купив 5 упаковок товара? 14. В каждой из упаковок товара равновероятно встречаются бук- вы «П», «Р», «И», «3». Найти вероятность того, что можно будет собрать слово «ПРИЗ», купив а) 6 упаковок товара; б) 7 упаковок товара. 15. В каждой упаковке имеется одна из 5 различных наклеек (рав- новероятно). Какова вероятность собрать их все, купив 7 упа- ковок товара? 16. Найти вероятность того, что в шестизначном номере три циф- ры совпадают, а остальные различны (считаем, что номера мо- гут начинаться с нуля). 17. Найти вероятность того, что в восьмизначном числе ровно три цифры совпадают, а остальные различные (считаем, что числа могут начинаться с нуля). 18. Найти вероятность того, что в пятизначном числе имеются 2 четные цифры и 3 нечетные, при условии, что все они раз- личны (считаем, что число может начинаться с нуля). 19. Семь человек становятся случайным образом в очередь один за другим. Какова вероятность того, что два определенных че- ловека, А и В, встанут рядом? 20. В очередь в булочную случайным образом встали восемь жен- щин и двое мужчин. Какова вероятность того, что между муж- чинами будут стоять две женщины? 21. В очередь в кассу стоят 9 человек (трое мужчин, четыре жен- щины и двое детей). Какова вероятность, что между некоторы- ми двумя мужчинами будут стоять двое детей и одна женщина?
Глава 2. Классическая вероятностная модель. Геометрическая вероятность 39 22 В очереди стоят 4 женщины и 3 мужчины. Какова вероятность, что все мужчины стоят рядом? 23. В урне 5 белых и 4 черных шара. Из урны наугад вынимают два шара. Какова вероятность того, что это будут: а) два белых шара; б) два черных шара; в) один черный и один белый. 24. В партии из 8 изделий имеется 3 изделия высшего качества. Найти вероятность того, что среди отобранных (без возвраще- ния) 4 изделий — ровно одно изделие высшего качества. 25. В лотерее из 50 билетов 5 выигрышных. Какова вероятность того, что среди 5 купленных выбранных билетов ровно 2 будут выигрышными? 26. В лотерее из N билетов имеется М выигрышных. Найти вероят- ность того, что среди К купленных билетов окажется хотя бы один выигрышный, если: а) #= 50, М = 4, К= 10; б) N = 60, М= 5, К= 10. 27. Из N проданных за неделю телевизоров М имеют скрытые де- фекты. Найти вероятность того, что среди случайно выбран- ных К телевизоров (из числа проданных за неделю) окажется ровно L без скрытых дефектов, если: a) N = 10, М - 4, К = 5, L = 2; б) N = 16, М = 4, К = 6, L = 4. 28. Из N проданных за неделю автомобилей М имеют скрытые дефекты. Найти вероятность того, что среди случайно выбран- ных К автомобилей (из числа проданных за неделю) окажется не более L со скрытыми дефектами, если: a) N = 12, М = 4, = 7, £ = 1; б) # = 15, Л/= 3, = 5, £ = 1; в) #= 11, Л/ = 5, К = 7, L = 2; г) N = 13, М = 4, К = 7, L = 2. 29. Группа из N студентов пишет контрольную работу из М вариантов (одинаковое число студентов в каждом варианте). Найти вероят- ность того, что среди случайно выбранных К студентов есть пи- савшие каждый вариант, если a) N = 18, Л/= 3, 5; б) 20, М= 4, К= 5; в) # = 24, М= 4, К= 5; г) # = 32, М = 4, К= 6. 30. В трех студенческих группах 72 человека (по 24 человека в группе: 12 юношей и 12 девушек). Наудачу выбраны 5 человек. Какова вероятность, что среди них будут девушки из всех трех групп? 31. На группу из 10 человек предоставлено для производственной практики 6 мест в лаборатории № 1 и 4 места — в лаборатории № 2. Какова вероятность того, что при случайном распределе- нии мест двое неразлучных друзей из этой группы попадут на практику в одну лабораторию? 32. Работа каждого из четырех студентов заочного отделения мо- жет проверяться одним из четырех преподавателей. Какова вероятность, что все четыре работы проверены разными пре- подавателями?
40 ЧАСТЬ I. Теория вероятностей 33. В пакете с леденцами лежит 4 красных, 6 желтых и 10 зеленых конфет. Найти вероятность вынуть наудачу подряд 3 конфеты одного цвета. 34. В урне К белых шаров, L красных и М черных. Найти вероят- ность достать (без возвращения) три шара, не все цвета которых одинаковы, если а) К = 9, L = 7, М = 4; б) К = 10, L = 8, М = 6. 35. В ящике находятся 5 белых, 3 красных и 2 черных шара. Наудачу выбирают 6 шаров. Найти вероятность того, что выборка будет содержать 3 белых, 2 красных и 1 черный шар, если: а) выборка производится без возвращения (все 6 шаров отбираются сразу); б) выборка производится с возвращением (фиксируется цвет выбранного шара, после чего он возвращается в ящик). 36. В точке С, любое положение которой на телефонной линии АВ длиной 10 км равновозможно, произошел разрыв. Определить вероятность того, что точка С удалена от точки А, где нахо- дится ремонтная станция, на расстояние, не меньшее 1 км. 37. Какова вероятность, что дуэль состоится, если каждый из дуэ- лянтов приходит на место дуэли в случайный момент времени между 5 и 6 часами и ждет противника в течение 5 минут? 38. Две подруги договорились встретиться в условленном месте в про- межутке от 17 до 19 часов. Пришедшая первой ждет другую не более 15 минут. Какова вероятность, что подруги не встретятся? 39. На отрезок [2, 5] наудачу бросаются две точки. Какова вероят- ность, что расстояние между ними меньше 2? 40. На отрезок [-1, 2] наудачу брошены две точки. Какова вероят- ность, что расстояние между ними больше 1? 41. Два теплохода должны подойти к одному и тому же причалу. Время прихода обоих теплоходов независимо и равновозможно в течение данных суток. Найти вероятность того, что ни одному из теплоходов не придется ожидать освобождения причала, если время стоянки первого теплохода 1 час, а второго — 2 часа. 42. Студент может добраться до факультета либо на автобусе, ин- тервал движения которого составляет 7 минут, либо на троллей- бусе, интервал движения которого составляет 10 минут. Найти вероятность того, что студенту, пришедшему на остановку в слу- чайный момент времени, придется ждать не более трех минут. 43. На шахматную доску случайным образом поставлены две ладьи. Какова вероятность того, что они не будут бить друг друга? 44. Наудачу взяты два положительных числа X и К, каждое из кото- рых не превышает единицы. Найти вероятность того, что сумма X + Y не превышает 1, а произведение XY не меньше 0,09. 45. Найти вероятность того, что из трех наудачу взятых отрезков длиной не более L можно построить треугольник.
Глава з ОСНОВНЫЕ ФОРМУЛЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ 3.1. Операции над событиями Одной из основных задач теории вероятностей является вы- числение вероятностей сложных событий, когда известны ве- роятности каких-то других событий. Это возможно, если эти новые события можно выразить через исходные с помощью различных операций. Суммой (или объединением) двух событий А и В называется событие АиВ (А + В), заключающееся в том, что произойдет хотя бы одно из событий А или В (либо событие А, либо со- бытие В, либо А и В одновременно). Произведением (или пересечением) двух событий А и В на- зывается событие АгуВ (или АВ), состоящее в одновременном появлении и события А, и события В. Отрицанием (или противоположным событием) для события А называется событие А, которое происходит тогда и только тогда, когда не просходит событие А. Симметрической разностью событий А и В называется со- бытие С = HV5, в которое входят те элементарные события, которые входят или в А, или в В, но не входят в их пересечение: AVB = (Л\5) и (5\Я). Поскольку все события рассматриваются как подмноже- ства пространства элементарных исходов Q, то и операции над ними — это соответствующие операции над множествами (объ- единение, пересечение, дополнение). Все пространство Q соот- ветствует достоверному событию (поскольку эксперимент всегда
42 ЧАСТЬ I. Теория вероятностей заканчивается каким-то элементарным исходом), а пустое мно- жество 0 — невозможному событию (поскольку в нем нет ни одного возможного исхода). Справедливы следующие соотношения: 1. HuQ = Q, Ли0 = А, АиА = А. 2. HnQ = А, Лп0 = 0, Аг\А = А. 3. А = А, Q = 0, 0 = Q. 4. (принцип двойственности, или формулы де Моргана). 5. AvjB = BvjA, Ar\B = Вс\А (коммутативность операций объединения и пересечения). 6. Аи(ВиС) = (Ли2?)иС, Лп(5пС) = (Лп5)пС (ассоциатив- ность операций объединения и пересечения). 7. Ли(5пС) = (Ли5)п(ЛиС) (дистрибутивность операции объединения относительно пересечения). 8. Ап(ВиС) — (АпВ)и(АпС) (дистрибутивность операции пересечения относительно объединения). Для наглядности соотношений между событиями используют графическую модель, называемую диаграммой Вьенна (рис. 3.1). Пример 1. Бросают две игральные кости. Пусть А — собы- тие, состоящее в том, что сумма очков нечетная, В — событие, заключающееся в том, что хотя бы на одной из костей выпала двойка. Опишем события А и В и А п В. Пространство элементарных исходов может быть представ- лено в виде: Q = {(1, 1), (1, 2), ..., (2, 1),..., (6, 6)}; |Q| = 36. AVB
[лава 3. Основные формулы теории вероятностей 43 Согласно условию задачи события А и В состоят из следу- ющих элементарных исходов: А = {(1, 2), (1, 4), (1, 6), (2, 1), (2, 3), .... (6, 1), (6, 3), (6, 5)}; В = {(1, 2), (2, 1), (2, 3), (3, 2), (2, 4), (4, 2), (5, 2), (2, 5), (2, 6), (6, 2), (2, 2)}. Объединение А и В представляет собой событие, состоящее в наступлении хотя бы одного из событий А и В, т.е. событие А о В означает, что либо сумма выпавших очков нечетна, либо на одной из костей выпала двойка: А и В = {(1, 2), (1, 4), (1, 6), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), ..., (6, 1), (6, 3), (6, 5)}. Пересечение А п В представляет собой событие, состоящее в одновременном наступлений событий А и В, т.е. в том, что на одной из костей выпала двойка, а сумма очков — нечетное число: А п В = {(1, 2), (2, 1), (2, 3), (3, 2), (2, 5), (5, 2)}. События А и В называются несовместными (непересекающи- мися), если они не могут произойти одновременно: АгуВ = 0. События Лр А2, ..., Ал образуют полную группу событий, если они несовместны и в сумме образуют все пространство Q, т.е. £д.=П, ДПЛ,.=0, /=1 Это означает, что в результате эксперимента обязательно произойдет одно из данных событий, и только одно. Пример 2. События А и А несовместны и образуют полную группу. 3*2. Теоремы сложения вероятностей Пусть заданы вероятности некоторых событий и требуется найти вероятности их объединения. ► Теорема 1 (теорема сложения вероятностей несовместных событий). Вероятность объединения двух несовместных событий равна сумме их вероятностей, т.е. если АпВ = 0, то Р(АиВ) = Р(А) + Р(В).
44 ЧАСТЬ I. Теория вероятностей Доказательство проведем для случая конечного числа исходов. Пусть пространство элементарных событий Q = {сор со2, <ол} содержит п элементарных исходов, из них пх благоприятствуют событию А и п2 благоприятствуют событию В и нет исходов, благоприятствующих одновременно А и В, так как события не- совместны, тогда Р(Л) = Р(щ) и Р(В) = Отсюда ЁсОубЛ k:(okeA следует, что событию АиВ благоприятствуют л, + л2 исходов и вероятность этого события вычисляется по формуле Р(АиВ) = 52 Р(^) = £?(«>,) + 52?((о*) = Р(А) + Р(В). (ц€А а>к€В Доказательство без труда переносится на случай счетного пространства Q — {<ор со2, со3, ...}, когда вместо конечных сумм рассматриваются суммы со счетным числом слагаемых — схо- дящиеся ряды. Следствия 1. Методом математической индукции эту теорему можно распространить на любое конечное число слагаемых, т.е. если все события А. несовместны, то P(U Л.) = Р(Л,) + Р(Л2) + ... + Р(Ля). 1=1 2. Если события Лр А2, Ая образуют полную груп- пу событий, то сумма их вероятностей равна единице. В частности, поскольку противоположные события несо- вместны и в сумме образуют Q, отсюда следует формула Р(Я) = 1-Р(Я). 3. Если А с В , то Р(А) < Р(В). ► Теорема 2 (теорема сложения вероятностей произвольных со- бытий). Для любых событий А и В верно равенство Р(А и В) = Р(А) + Р(В) - Р(А п В). Доказательство. Для любых событий А и В событие А и В наступит тогда, когда наступит одно из несовместных событий А п В, А п В или А п В. По теореме сложения для несовмест- ных событий: Р(А и В) = Р(А п В) + Р(А гГВ)+ Р(А п В).
Глава 3. Основные формулы теории вероятностей 45 Событие А наступит, если наступит хотя бы одно из двух несовместных событий: А п В или А п В. Тогда вероятность со- бытия А по теореме сложения для несовместных событий равна Р(А) = Р(А п В) + Р(А п В). Аналогично событие В наступит, если наступит хотя бы одно из несовместных событий А г» В или Я п В, и вероятность события В равна Р(В) = Р(А п В) + + Р(А п В). Отсюда получаем: Р(А и В) = ЛЯ) + ЛЯ“п В) + Р(А п В) - Р(А п В) = = ЛЯ) + Л Я) - ЛЯ п В). Следствия 1. Вероятность пересечения двух событий А и В вычисляется по формуле Р(А В) = Р(А) + Р(В) — Р(А и В). 2. Вероятность суммы любого числа событий вычисляется по формуле включения-исключения'. ЛЯ1и...иЛ) = £р(Д)-£Р(ДЛу)+...+(-1Г,/’(4...Л)- /=1 3. Из теорем 1 и 2 для любых событий А и В следует, что Р(А и В) < Р(Я) + Р(В). Задача 1. В ящике 10 красных и 5 синих пуговиц. Вынима- ются наудачу две пуговицы. Какова вероятность, что пуговицы будут одноцветными? Решение. Событие А = {вынуты пуговицы одного цвета} мож- но представить в виде суммы А = At + А1, где события Я, и Аг означают выбор пуговиц красного и синего цвета соответствен- С2 но. Вероятность вытащить две красные пуговицы ЛЯ.) = —у, С|5 С2 а вероятность вытащить две синие пуговицы Р(А2) = —у. Так ^15 как события Я1 и А7 не могут произойти одновременно, то в силу теоремы сложения 10! 5! Р(А) = С'о+С;2 = 2!8Г 2!3! = 0>524. С|5 2'13!
46 ЧАСТЬ I. Теория вероятностей Задача 2. Среди сотрудников фирмы 28% знают английский язык, 30% — немецкий, 42% — французский; английский и не- мецкий — 8%, английский и французский — 10%, немецкий и французский — 5%, все три языка — 3%. Найти вероятность того, что случайно выбранный сотрудник фирмы: а) знает ан- глийский или немецкий; б) знает английский, немецкий или французский; в) не знает ни один из перечисленных языков. Решение. Обозначим через А, В и С события, заключающи- еся в том, что случайно выбранный сотрудник фирмы владе- ет английским, немецким или французским соответственно. Очевидно, доли сотрудников фирмы, владеющих теми или ины- ми языками, определяют вероятности этих событий. Получаем: а) Р(А и В) = Р(А) + Р(В) - Р(АВ) = 0,28 + 0,3. - 0,08 = 0,5; б) Р[А и В u Q = Р(А) + Р(В) + Л О - (Р(АВ) + ЛАС) + + Л#О) + Р(АВС) = 0,28 + 0,3 + 0,42 - (0,08 + 0,1 + 0,05) + + 0,03 = 0,8; в) 1 - Р(А и В и С) = 0,2. 3.3. Условная вероятность и теорема умножения Говорить о вероятности Р(А) как о мере возможности по- явления случайного события А имеет смысл только при осу- ществлении определенного комплекса условий эксперимента, в рамках которого событие может произойти. При изменении ус- ловий эксперимента, вообще говоря, изменится и вероятность события А. Поэтому помимо обычной (безусловной) вероятно- сти события А рассматривают так называемую условную вероят- ность события А, вычисляемую при условии, что произошло некоторое событие В. Условной вероятностью события А при условии, что про- изошло событие В (Р(В) > 0), называется число Р(А\В), которое вычисляется по формуле Р(А\В) = Р{АВ) Р(В) ‘ Аналогично определяется условная вероятность события В: Р(В\А) = ^^-, Р(А)>0.
Глава 3. Основные формулы теории вероятностей 47 Из определения условной вероятности вытекает следующая теорема. Теорема 3 (теорема умножения). Вероятность произведения двух событий равна произведению вероятности одного из них на условную вероятность другого при условии, что первое имело ме- сто: Р(АВ) = Р(В)Р(А\В), или Р(АВ) = Р(А)Р(В|А). Несмотря на тривиальность доказательства этой теоремы, она имеет огромное практическое значение, так как использу- ется для построения сложных вероятностных моделей. Следствие. Вероятность пересечения нескольких событий равна произведению вероятностей этих событий, причем веро- ятность каждого последующего вычисляется при условии, что имели место все предыдущие, т.е. верно равенство 7=1 Для условной вероятности выполняются следующие свой- ства: 1) О <_Р(А | В) < 1; 2) Р(А | В) = 1 - Р(А | 5); 3) Р(А I А) = 1; 4) Р((4 и А2) | В) = Р(Л, | В) + Р(А21 В) - Р(А, п А21 By, 5) если А п В = 0, то Р(А | В) = 0; 6) если А с В, то Р(В | А) = 1. В случае, когда имеем дело с пространством равновозмож- ных исходов, условную вероятность можно найти по формуле Р(А\В) = ^. I" I Задача 3. В семье двое детей. Какова вероятность того, что старший ребенок — мальчик, если известно, что в семье есть дети обоего пола? Решение. Пусть А = {старший ребенок — мальчик}, В = {в се- мье есть дети обоего пола}. Будем считать, что рождение маль- чика и рождение девочки — равновероятные события. Если рождение мальчика обозначить буквой М, а рождение девоч-
48 ЧАСТЬ I. Теория вероятностей ки — Д, то пространство всех элементарных исходов состоит из четырех пар: Q = {ММ, МД, ДМ, ДД}. В этом пространстве лишь два исхода {МД и ДМ) отвечают событию В. Событие АВ означает, что в семье есть дети обоего пола. Старший ребе- нок — мальчик, следовательно, второй (младший) ребенок — девочка. Этому событию АВ отвечает один исход — МД. Таким образом, [Л5| = 1, |Д| = 2 и Р(Л|2?) = Ц^ = | = 0,5. |Я| 2 Задача 4. Мастер, имея 10 деталей, из которых 3 — нестан- дартные, берет и проверяет детали одну за другой, пока ему не попадется стандартная. Какова вероятность, что он проверит ровно две детали? Решение. Событие А = {мастер проверил ровно две детали} означает, что при такой проверке первая деталь оказалась не- стандартной, а вторая — стандартная. Значит, А = АХА^ где Л1 = {первая деталь оказалась нестандартной} и А^ = {вторая деталь — стандартная}. Очевидно, что вероятность события Ах равна Р(Д) = 3/10, кроме того, Р(А21 Д) = 7/9, так как перед взятием второй детали у мастера осталось 9 деталей, из ко- торых только 2 нестандартные и 7 стандартных. По теореме умножения 3 7 Р(Л) = Р(ДД) = Р(Д)Р(Л2|Д) = ^| = 7/30. 3.4. Независимость событий Событие А не зависит от события В, если появление В не меняет значения вероятности события А, т.е. условная веро- ятность равна безусловной: Р(А\В) = Р(А). Тогда из теоремы умножения Р(А\В) = Р(А)Р(В\А) = Р(В)Р(А\В) в предполо- жении, что Р(А) > 0, получим, что условная вероятность со- бытия В равна его безусловной вероятности Р(В/А) = Р(В). Следовательно, события А и В независимы, если появление од- ного из них не меняет вероятности появления другого. Из определения независимости двух событий следует:
Глава 3. Основные формулы теории вероятностей 49 Теорема 4. Два события А и В независимы, если справедливо равенство Р(АВ) = Р(А)Р(В), Это равенство используется как критерий при практической проверке независимости двух событий. Понятие независимости обобщается на любое конечное число событий. События Аг А2, Ап называются независимыми в совокуп- ности, если для любого их набора 4,- имеет место ра- венство P(4i4i...4J = P(4i)P(42)...P(44) для любых к от 1 до п и любых несовпадающих номеров iv iv События Av ..., Ап называются попарно независимыми, если для любых / * j, i, j g {1, ..., n} события 4 и А независимы. Из данных определений следует, что из независимости в совокупности следует попарная независимость, но из попарной независимости не следует независимости в совокупности. Пример Бернштейна. На плоскость бросается правильный тетраэдр, три грани которого покрашены в цвета: красный, си- ний и зеленый, а на четвертую грань нанесены все три цвета. Событие А — при бросании выпала красная грань, событие В — синяя грань, событие С — зеленая грань. Вероятности этих событий равны между собой: Р(А) = Р(В) = P(Q = 2/4 = 1/2. Найдем вероятности их попарных произведений: Р(АВ) = 1/4 = 1/2 • 1/2 = Р(А)Р(В); Р(АС) = Р(А)Р(С) = 1/4 = 1/2- 1/2; Р(ВС) = 1/4 = 1/2- 1/2 = Р(В)Р(С). Отсюда следует, что они попарно независимы. Однако ве- роятность появления всех трех цветов равна: Р(АВС) = 1/4 * Р(А)Р(В)Р(С) = 1/2 - 1/2 • 1/2 = 1/8, т.е. вероятность произведения всех трех событий не равна про- изведению вероятностей этих событий и, следовательно, они зависимы в совокупности.
50 ЧАСТЬ I. Теория вероятностей Задача 5. В одном ящике 3 белых и 5 черных шаров, в другом ящике — 6 белых и 4 черных шара. Найти вероятность того, что хотя бы из одного ящика будет вынут один белый шар, если из каждого ящика вынуто по одному шару. Решение. Событие А = {хотя бы из одного ящика вынут белый шар} можно представить в виде суммы А = Ах + А2, где события Ах и А} означают появление белого шара из первого и второго ящика соответственно. Вероятность вытащить белый шар из первого ящика равна Р(АХ) = 3/8, а вероятность вы- тащить белый шар из второго ящика Р(А2) = 6/10. Кроме того, в силу независимости Ах и имеем: Р(ДЛ2)=Л4)Л4)=| ^=9/40. о 1U По теореме сложения получаем: Р(А) = Р{А, + 4) = Р(Л,) + Р(Аг) - Р(Д А^) = 3/8 + 6/10 - 9/40 = 3/4. 3.5. Формула полной вероятности Пусть событие А может быть реализовано только при усло- вии появления одного из событий Ht, i = 1,п. Предположим, что события Н. образуют полную группу, и вероятности их до опыта известны. Такие события Н. называются гипотезами. ► Теорема 5 (формула полной вероятности). Вероятность со- бытия А вычисляется по формуле PU)=£P(^)P(X|^)_ /=1 Доказательство. Поскольку гипотезы Н., i= 1,2, ... к, несо- вместны, то несовместны и их пересечения с событием А, т.е. несовместны комбинациии A n Ht и A n Н. при i * j. Обозначим Н = ия,. Так как Hv ..., Нк образуют полную группу событий, /=1 уоН-О.1лАс\Н = А. Р(А) = Р Ап 0Я, =Р
Глава 3. Основные формулы теории вероятностей 51 Применяя теорему умножения вероятностей для каждого слагаемого, получаем окончательный результат: Р(А) = £Р(ЛПЯ,) = ^Р(Я,)Р(Л|Я,.). /=1 /=1 Задача 6. Три экзаменатора принимают экзамен по некото- рому предмету у группы в 30 человек, причем первый опраши- вает 6 студентов, второй — 3 студентов, а третий — 21 студента (выбор студентов производится случайным образом из списка). Отношение трех экзаменаторов к слабо подготовившимся раз- личное: шансы таких студентов сдать экзамен у первого пре- подавателя равны 40%, у второго — только 10%, у третьего — 70%. Найти вероятность того, что слабо подготовившийся сту- дент сдаст экзамен. Решение. Обозначим через Hv Н2, Н3 гипотезы, состоящие в том, что слабо подготовившийся студент отвечал первому, второму и третьему экзаменатору соответственно. По условию задачи Р(НХ) = 6/30 = 0,2; Р(Я2) = 3/30 = 0,1; Р(Я3) = 21/30 = 0,7. Пусть событие А = {слабо подготовившийся студент сдал экзамен}. Тогда в силу условия задачи Р(Л|Я,) = 0,4, Р(Л|Я2) = 0,1, Р(Л|Я3) = 0,7. По формуле полной вероятности получаем Р(А) = 0,4-0,2 + 0,1-0,1 + 0,7-0,7 = 0,58. Для решения задач такого типа удобно использовать так называемое «дерево» вероятностей. Из формулы полной веро- ятности следует, что для вычисления вероятности события А необходимо осуществить перебор всех путей, ведущих к ре- зультирующему событию Л; вычислить и расставить на соот- ветствующих путях вероятности P(Ht) того, что движение будет происходить по данному пути, и условные вероятности Р(А\Н) того, что на данном пути будет достигнуто конечное событие А. Затем вероятности, стоящие на одном пути, перемножаются, а результаты, полученные для различных путей, складываются. Каждое из условий может, в свою очередь, делиться на не- сколько дополнительных условий или гипотез, т.е. на каждом
52 ЧАСТЬ I. Теория вероятностей этапе оно допускает неограниченное число ветвлений схемы. Поэтому при решении задач удобнее пользоваться не самой формулой полной вероятности, а графической схемой пол- ной вероятности, которую называют «деревом» вероятностей (см. рис. 3.2 для задачи 6). Рис. 3.2 Задача 7. Фирма имеет три источника поставки комплек- тующих — фирмы А, В, С. На долю фирмы А приходится 50% общего объема поставок, В — 30% и С — 20%. Из практики известно, что среди поставляемых фирмой А деталей 10% бра- кованных, фирмой В — 5% и фирмой С — 6%. Какова вероят- ность, что взятая наугад деталь окажется годной? Решение. Пусть событие G — появление годной детали. Вероятности гипотез о том, что деталь поставлена фирмами А, В, С, равны сответственно Р(А) = 0,5; Р(В) = 0,3; Р(С) = 0,2 (рис. 3.3). Условные вероятности появления прь этом годной детали равны P(G | А) = 0,9, P(G | В) = 0,95, P(G | С) = 0,94 (как вероятности противоположных событий к появлению брако- ванной). По формуле полной вероятности, используя «дерево» вероятностей, получаем: P(G) = 0,5-0,9 + 0,3-0,95 + 0,2-0,94 = 0,923.
Глава 3. Основные формулы теории вероятностей 53 Рис. 3.3 3.6. Формула Байеса Предположим другую ситуацию: пусть известно, что собы- тие А произошло. Требуется найти вероятность того, что собы- тие А произошло именно путем Нк. Эти условные вероятности вычисляются с помощью следующей теоремы. ► Теорема 6 (формула Байеса): ^Р<Я,)Р(Л|Я,) /=1 Отметим, что в знаменателе этой формулы записана вероят- ность Р(Л), вычисленная по формуле полной вероятности. Доказательство. По определению условной вероятности Р(Н \A} --P(AnHk) Р<НЖА\Н^ * ' Р(А) Р(А) где вероятность Р(А п Нк) найдена с помощью теоремы умно- жения.
54 ЧАСТЬ I. Теория вероятностей Задача 8 (см. задачу 6). Пусть известно, что студент не сдал экзамен, т.е. получил оценку «неудовлетворительно». Кому из трех преподавателей вероятнее всего он отвечал? Решение. Вероятность получить «неуд» равна Р(А) = 1 — — Р(А) — 1 — 0,58 = 0,42. Требуется вычислить условные ве- роятности Р(Н( | A), i = 1, 2, 3. По формуле Байеса получаем: p(7/,i^=^2m»=^=0,285, ПЛ) 0.42 аналогично Р(Н21 А) = 0,1 0,9 =0,214, Р(Я31 А) = °’7'0’3 = 0,5 . 2 0.42 3 0,42 Отсюда следует, что, вероятнее всего, слабо подготовив- шийся студент сдавал экзамен третьему экзаменатору. 3.7. Аксиоматическое построение теории вероятностей Ограниченность «классического» определения вероятностей заложена в предположении равной возможности исходов. Многие реальные случайные эксперименты не укладываются также в рам- ки дискретной модели с конечным или счетным пространством Q. Не всегда может помочь и геометрическая интерпретация. Кроме того, возникают различные парадоксы. Например, можно построить так называемые неизмеримые множества, при попытке определить вероятность которых мы приходим к противоречию. Пример Вители. Пусть точку наудачу бросают на окруж- ность. Положение точки на окружности определяется углом (от 0 до 2л). Выберем иррациональное число а > 0 и поставим в соответствие каждой точке х класс точек Ах, получаемых из нее поворотами на угол 2лал, п = 0, 1,2, ... Поскольку а ирра- ционально, у нас никогда не получится целое число оборотов, а значит, все точки класса различны. Для различных точек х классы Ах могут либо совпадать (ког- да одна точка переходит в другую поворотом вида 2лаи), либо не пересекаться нигде. Возьмем все непересекающиеся классы, выберем из каждого по одной точке и объединим эти точки в одно множество Z?o. Обозначим через Вп множество, получающе-
Глава 3. Основные формулы теории вероятностей 55 еся из BQ поворотом на угол 2лаи. Тогда множества Вп, п = 0, 1, 2, ..., не пересекаются, а их объединение дает всю окружность. Следовательно, они образуют полную группу событий. Понятно, что вероятности Вп равны между собой. Если предположить, что они равны нулю, то в сумме получается нуль, хотя должна быть единица. Если предположить, что они больше нуля, в сумме получается бесконечность, что также неверно. Поэтому в случае бесконечного пространства Q построение современной теории вероятностей базируется на подходе, пред- ложенном великим русским математиком А.Н. Колмогоровым. Его основная идея заключается в том, что не все подмножества пространства Q рассматриваются как события. Предполагается, что события — это некоторые подмножества из пространства элементарных событий, совокупность которых замкнута отно- сительно операций конечного или счетного числа объединений и пересечений. Пусть Q — произвольное пространство элементарных ис- ходов, а 3 — некоторый класс подмножеств множества Q. Алгеброй событий 3 называется любая непустая система подмножеств пространства Q, удовлетворяющая следующим аксиомам: 1) если подмножество А принадлежит 3 (является событи- ем), то его дополнение А также принадлежит 3 (также является событием); 2) если подмножества А и В принадлежат 3 (являются со- бытиями), то и их объединение А и В принадлежит 3 (также является событием). Поскольку любую из операций над подмножествами можно получить, используя формулы де Моргана, с помощью только двух операций дополнения и объединения АГ\В = АиВ, А\В = АпВ = АиВ, пересечение и разность двух событий также будут событиями: А п В е 3, А\В е 3 при любых А е 3, В е 3. Отсюда следует, что Q е 3 и 0 = Q\Q е 3 тоже события. Алгебра событий 3 называется e-алгеброй, если объединение счетного числа элементов из 3 также является элементом 3, т.е. из того, что Ап е 3, п = 1, 2, ... , следует |J Ап е 3. Таким образом, о-алгебру событий 3 можно определить как систему подмножеств пространства элементарных исходов
56 ЧАСТЬ I. Теория вероятностей Q, замкнутую относительно счетного числа теоретико-множе- ственных операций. Тривиальная ст-алгебра событий состоит из полного и пустого множеств: 3 = {0, Q}. Любая о-алгебра со- бытий является одновременно и алгеброй событий. Обратное, вообще говоря, неверно, т.е. существуют алгебры событий, не являющиеся а-алгебрами. Теперь согласно аксиоматике Колмогорова можно ввести общее понятие вероятности события. Вероятностью события, или вероятностной мерой, называется числовая функция, заданная на о-алгебре событий 3, которая каждому событию А е 3 ставит в соответствие число Р(А) так, что выполняются следующие четыре аксиомы: 1. Аксиома неотрицательности: Р(А) > 0 для всех А е 3. 2. Аксиома нормированности: P(Q) = 1. л л 3. Аксиома конечной аддитивности: Р |J4 = для i=l /=1 любых А.Г\А= 0, i *j\ и Ле 3 Для любого i = 1,2, ..., п, 4. Аксиома счетной аддитивности: Р [J4 = ^Р(Д), если события А. в последовательности Av Av ..., Ап, ... несовместны, т.е. для любых = z *•/’ Л е 3 для любого i = 1, 2, ... Очевидно, что вероятность, определенная в дискретном ве- роятностном пространстве условием Р(Я) = P(a)z) , является счетно-аддитивной. '“'€Л Заметим также, что введенные аксиомы в случае дискрет- ного пространства превращаются в доказуемые утверждения. Конечно-аддитивная вероятность Л4)’ заданная на о-ал- гебре множеств 3, называется непрерывной, если для любой убывающей последовательности множеств Ап<^ 3, п = 1, 2, ..., такой, что Ап+1 с Ап, имеющих пустое пересечение Q4»= Л = 1 имеет место равенство lim Р(Ап) = 0. Аксиома непрерывности Если последовательность событий А„ Л,,..., А . ... такова, Р 2 ’ f п> ’ что каждое последующее вложено в предыдущее, а пересечение всех событий Ап пусто, то Р(АJ -> 0 при п оо.
Глава 3. Основные формулы теории вероятностей 57 Теорема 7. Аксиома счетной аддитивности равносильна акси- оме непрерывности. Доказательство. Докажем сначала, что из непрерывности следует счетная аддитивность. Рассмотрим последовательность несовместных событий Вп, и пусть = Введем события ос /=1 вида 4,= U Д’ тогда они удовлетворяют условиям аксиомы /=л+1 непрерывности и Р(Ап) -► 0 при п -* оо. По теореме сложения получаем Р(В) = Р |JB, +Р U Д =£р(Д)+Р(4,), откуда ^P(Bi) = P(B)-P(An)^P(B) = P ид , л^оо, что и означает счетную аддитивность. Докажем теперь, что из счетной аддитивности следует непре- рывность. Пусть последовательность Ап удовлетворяет условиям аксиомы непрерывности. Введем события Ся = Ля\Ля+1. Тогда эти события несовместны, причем допустимы представления: 4\4, = Uco 4-0е- 1=1 ;=1 По теореме сложения получаем Р(4)=Р(4\4,)+Р(4,)=Р Uc/ +Л41) = ЕЖ)+/’(4Л откуда /’(4) = P(4)-£p(Cz) = p[Jcj -£р(С,.)^о, П так что аксиома непрерывности выполняется. Тройка (Q, 3, Р), где Q — пространство элементарных со- бытий, 3 — ст-алгебра подмножеств Q, называемых событиями, Р — вероятностная мера, определенная на событиях, называет- ся вероятностным пространством. Далее будем всюду неявно предполагать, что любые рас- сматриваемые множества относятся к некоторой о-алгебре 3, а вероятность удовлетворяет всем необходимым аксиомам.
58 ЧАСТЬ I. Теория вероятностей > Задачи для самостоятельного решения 1. Рабочий обслуживает три независимо работающих станка. Событие А. ={/-й станок в течение часа потребует наладки}, Р(А) = 0,2; i = 1, 2, 3. Выразить события: а) ровно два станка потребуют наладки; б) не более двух потребуют наладки; в) хотя бы один потребует наладки. Найти вероятность события в). 2. Стрелок делает три выстрела, при этом он поражает цель с ве- роятностью 0,6 при одном выстреле. Событие А. = {i-я пуля попала в цель}, i = 1, 2, 3. Выразить события: а) было хотя бы одно попадание; б) ровно одно попадание; в) не более двух по- паданий. Найти вероятность события в). 3. В коробке четыре детали. Мастер извлекает детали до тех пор, пока не вытащит годную (или пока они не кончатся). Событие А. = {/-я извлеченная деталь является годной}, Р(А.) = 0,9, i = 1, 2, 3, 4. Выразить события, состоящие в том, что мастер сделал: а) ровно одно извлечение; б) ровно два извлечения; в) не менее двух извлечений. Найти вероятность б). 4. Сколько раз надо бросить игральную кость, чтобы не менее чем на 95% быть уверенным в том, что хотя бы при одном бросании появится «шестерка»? 5. Бросают три кубика. Какова вероятность того, что хотя бы на одном из них выпадет «шестерка», если известно, что на всех кубиках выпали разные грани? 6. В пакете с леденцами лежат 4 красных, 5 желтых и 6 зеленых конфет. Найти вероятность вынуть наудачу подряд 3 конфеты одного цвета. 7. В партии из 20 изделий 4 бракованных. Найти вероятность того, что в выборке из 5 изделий не более одного бракованного. 8. Известно, что в пятизначном числе все цифры разные. Какова вероятность при этом условии, что среди них ровно одна цифра четная (считаем, что номер может начинаться с нуля)? 9. Известно, что в пятизначном числе все цифры разные. Найти вероятность того, что среди них есть цифры 1 и 2 (считаем, что число может начинаться с нуля). 10. На обувной фабрике в отдельных цехах производят подметки, каблуки и верхи ботинок. При изготовлении каждого ботинка соединяют подметку, каблук и верх, выбирая их случайным об- разом. Дефекты имеют 1% каблуков, 2% подметок и 3% верхов. С какой вероятностью случайно выбранная пара обуви будет иметь дефекты? 11. Среди клиентов туристической фирмы 32% ездили в Турцию, 18% — в Египет, 10% — в Турцию и Египет. Найти вероят-
Глава 3. Основные формулы теории вероятностей 59 ность того, что случайно выбранный клиент ездил в Турцию или Египет. 12. Среди клиентов туристической фирмы 30% ездили в Турцию, 20% — в Египет, 10% — в Грецию; в Турцию и Египет — 12%, в Египет и Грецию — 5%, в Турцию и Грецию — 6%, во все три страны — 4%. Найти вероятность того, что случайно вы- бранный клиент: а) ездил в Турцию или Египет, б) ездил в Египет или Грецию, в) ездил в Турцию. Египет или Грецию, г) не ездил ни в одну из перечисленных стран. 13. В продукции птицефабрики 70% яиц стандартных, 20% боль- шего объема и 10% двухжелтковых. С какой вероятностью сре- ди 5 случайно выбранных яиц найдутся хотя бы одно большего объема и хотя бы одно двухжелтковое (вместе)? 14. Среди покупателей магазина 60% женщин, 30% мужчин, 10% детей. Найти вероятность того, что среди 4 случайно выбран- ных покупателей найдется хотя бы один мужчина и хотя бы один ребенок. 15. Студент в состоянии решить 20 задач из 25 в первом туре экзамена и 15 из 20 во втором. Найти вероятность сдачи им экзамена, если в каждом туре дается 3 задачи и достаточно решить хотя бы 2 из них. 16. Студент в состоянии решить 25 задач из 30 в первом туре эк- замена и 18 из 24 во втором. Найти вероятность сдачи им эк- замена, если в каждом туре дается четыре задачи и достаточно решить три из них. 17. В лифт девятиэтажного дома на первом этаже входят 6 чело- век. Для каждого человека равновероятен выход на любом из остальных 8 этажей. Известно, что все вышли на разных эта- жах. При этом условии найти вероятность, что на первых трех этажах (из восьми) вышли два человека. 18. В лифт на цокольном этаже входят 5 человек. Считая для каж- дого человека равновероятным выход на любом из 9 этажей, найти вероятность того, что двое из них выйдут на одном эта- же, а остальные на разных. 19. Три пассажира садятся в поезд, случайно выбирая любой из 6 вагонов. Какова вероятность, что хотя бы один из них сядет в первый вагон, если известно, что все они сели в разные вагоны? 20. Семь пассажиров случайным образом выбирают один из 9 ва- гонов поезда. Известно, что они сели в разные вагоны. При этом условии найти вероятность того, что в первых трех ваго- нах поезда будут ехать два человека.
60 ЧАСТЬ I. Теория вероятностей 21. Пять человек случайным образом (независимо друг от друга) выбирают любой из 7 вагонов поезда. Известно, что ровно 2 вагона остались пустыми. При этом условии найти вероят- ность того, что первый и второй вагоны заняты. 22. Двое шахматистов равной силы играют 4 партии (без ничьих). Найти вероятность, что в результате победил первый, если из- вестно, что в процессе игры каждый выиграл хотя бы один раз. 23. В ящике 12 красных, 8 зеленых и 10 синих шаров. Наудачу вынимаются два шара. Какова вероятность, что вынутые шары разного цвета, если известно, что не вынут синий шар? 24. Шесть шаров случайным образом раскладывают в три ящика. Найти вероятность, что во всех ящиках разное число шаров при условии, что все ящики не пустые. 25. Пять шаров распределены по трем ящикам. Известно, что нет пустых ящиков. При этом условии найти вероятность, что в первом ящике лежит один шар. 26. В урне 5 белых и 10 черных шаров. Извлечены 6 шаров (с воз- вращением). Известно, что среди них есть белые шары. При этом условии найти вероятность того, что среди них будут так- же не менее двух черных шаров. 27. В магазине было проведено исследование продаж некоторого товара. Выяснилось, что этот товар покупают 25% женщин, 10% мужчин и 20% детей. Среди покупателей магазина 60% женщин, 30% мужчин и 10% детей. Найти вероятность того, что случайный покупатель приобретет этот товар. 28. В центральную бухгалтерию корпорации поступили пачки на- кладных для проверки и обработки. 90% пачек были признаны удовлетворительными: они содержали 1% неправильно оформ- ленных накладных. Остальные 10% накладных были признаны неудовлетворительными, так как они содержали 5% непра- вильно оформленных накладных. Какова вероятность того, что взятая наугад накладная окажется неправильно оформленной? 29. Фирма занимается строительством домов по одному из двух типовых проектов. При строительстве по первому проекту нарушение технологий происходит с вероятностью 0,3, а по второму — 0,2. При этом дома первого и второго типа состав- ляют соответственно 40% и 60% общего объема строительства. Какова вероятность того, что случайно выбранный дом по- строен с нарушением технологии? 30. Фирма имеет трех поставщиков, каждый из которых надежен с вероятностью 0,8. В случае отказа одного поставщика фирма разоряется с вероятностью rv двух — г2, трех — гу Найти ве-
Глава 3. Основные формулы теории вероятностей 61 роятность разорения фирмы, если: а) гх - 0,2, г2 = 0,6, r3 = 1; б) гх = 0,25, г2 = 0,75, г3 = 0,95. 31. Фирма участвует в четырех проектах, каждый из которых мо- жет закончиться неудачей с вероятностью 0,1. В случае неуда- чи одного проекта вероятность разорения фирмы равна 20%, двух — 50%, трех — 70%, четырех — 90%. Найти вероятность разорения фирмы. 32. Два аудитора проверяют N фирм (равное число каждый), у М из которых имеются нарушения. Вероятность обнаружения нарушений первым аудитором равна pv вторым — рг Найти вероятность того, что все фирмы-нарушители будут выявлены, если: a) N = 6, М = 2, рх = 0,7, р2 = 0,8; б) N = 6, М = 3, рх = 0,7, р2 = 0,9; в) N= 8, М = 3, рх = 0,6, р2 = 0,8; г) # = 10, М = 2, рх = 0,8, р2 = 0,9. 33. В прибор входит комплект из двух независимых деталей, ве- роятность для которых выйти из строя в течение года соот- ветственно равна 0,1 и 0,2. Если детали исправны, то прибор работает в течение года с вероятностью 0,99. Если выходит из строя только первая деталь, то прибор работает с вероятностью 0,7, а если только вторая, то с вероятностью 0,8. Если выходят из строя обе детали, прибор будет работать с вероятностью 0,1. Какова вероятность, что прибор будет работать в течение года? 34. Электроэнергия поступает в город через три электролинии, каж- дая из которых может быть отключена с вероятностью 0,1. Если отключена одна электролиния, город испытывает недостаток электроэнергии с вероятностью 0,2. Если отключены две элек- тролинии, недостаток электроэнергии ощущается с вероятностью 0,5. Если же отключены все три электролинии, то недостаток электроэнергии наступает с вероятностью 1. В случае, когда рабо- тают все электролинии, недостатка энергии нет. Какова вероят- ность того, что город испытывает недостаток электроэнергии? 35. Из 10 лотерейных билетов 3 выигрышных. При подготовке ве- чера 2 билета потеряли, и было решено добавить 1 выигрыш- ный. Какой стала вероятность вытянуть выигрышный билет? 36. В урне 8 красных шаров и 10 зеленых. Извлекли три шара (без возвращения), затем положили их обратно и добавили в урну два шара того цвета, который оказался в меньшинстве среди извлеченных. С какой вероятностью два шара, извлеченных после этого, будут зелеными? 37. В урне 7 красных шаров и 9 синих. Извлекли три шара (без возвращения), затем положили их обратно и добавили в урну два шара того цвета, который оказался в большинстве среди
62 ЧАСТЬ I. Теория вероятностей извлеченных. С какой вероятностью два шара, вынутых после этого, окажутся синими? 38. В одной коробке 4 красных шара и 6 синих, а во второй 8 красных и 2 синих. Из первой во вторую переложили два шара, а затем извлекли из второй два шара без возвращения. Найти вероятность, что последние оказались одного цвета. 39. В первой урне лежат 1 белый и 3 черных шара, а во второй урне — 2 белых и 1 черный шар. Из первой урны во вторую перекладывается, не глядя, один шар, а затем один шар пере- кладывается из второй урны в первую. После этого из первой урны вынули один шар. Найти вероятность, что он белый. 40. В первой урне лежат 4 белых и 6 черных шаров, во второй — 2 белых и 8 черных. Из первой урны во вторую перекладыва- ется, не глядя, один шар, а затем один шар перекладывается из второй урны в первую. После этого из первой урны вынули один шар. Найти вероятность, что он черный. 41. Есть две упаковки орешков, в каждой из которых 5 орехов с белой глазурью и 4 с черной. Из первой упаковки достали два орешка, после чего ее смешали со второй упаковкой. Какой стала вероятность достать орех с белой глазурью? 42. Фирма нарушает закон с вероятностью р. Аудитор обнаружи- вает нарушения с вероятностью г (если они есть). Проведенная им проверка не выявила нарушений. Найти вероятность, что на самом деле они есть, при: а) р = 0,25, г = 0,75; б) р = 0,1, г = 0,8; в) р = 0,2, г = 0,9. 43. Известно, что проверяемая фирма может уходить от налогов с вероятностью 40% и выбрать для этого одну из трех схем укло- нения (равновероятно). Найти вероятность, что фирма уходит от налогов по третьей схеме, если при проверке по первым двум схемам нарушений не обнаружено. 44. Изделие имеет скрытые дефекты с вероятностью d. В течение года выходит из строя доля р изделий со скрытыми дефектами и г изделий без дефектов. Найти вероятность, что изделие имело скрытые дефекты, если оно вышло из строя в течение года, при: a) d = 0,2, р = 0,75, г = 0,15; б) d = 0,1, р = 0,6, г = 0,15. 45. В цехе работают N мастеров и М учеников (каждый работ- ник изготовляет одинаковое количество изделий). Вероятность брака мастера — pv вероятность брака ученика — р2. Изделие оказалось бракованным. Найти вероятность, что его изготовил ученик, если: a) N = 7, М = 3, рх = 0,01, р2 = 0,05; б) W = 10, М = 4, рх = 0,01, р2 = 0,04.
Глава 3. Основные формулы теории вероятностей 63 46. Производственный брак составляет 4%. Каждое изделие равно- вероятным образом поступает к одному из двух контролеров, первый из которых обнаруживает брак с вероятностью 0,92, второй — 0,98. Какова вероятность, что признанное годным изделие является бракованным? 47. Имеются три партии по 20 деталей в каждой. Число стандарт- ных деталей в первой, второй и третьей партиях соответствен- но равно 20, 15 и 10. Из наудачу выбранной партии извлечена деталь, оказавшаяся стандартной. Деталь вернули в партию и вторично из той же партии наугад извлекли деталь, которая оказалась стандартной. Найти вероятность того, что детали были извлечены из третьей партии. 48. На заводе установлена аварийная сигнализация, которая при наличии аварии срабатывает с вероятностью р. Однако с веро- ятностью г сигнал также может возникнуть, когда аварии нет. Вероятность аварии равна s. Найти вероятность того, что слу- чилась авария, если сигнализация сработала, при: а) р = 0,99, г = 0,001, 5 = 0,005; б) р = 0,99, г = 0,002, 5 = 0,007. 49. К системному администратору обращаются пользователи. Среди них доля начинающих — р, опытных — q. Вероятность того, что начинающий пользователь обратится за помощью — г, что обратится опытный — s. Найти вероятность того, что очеред- ной пользователь, обратившийся за помощью, окажется начи- нающим, если: а) р = 0,6, q = 0,4, г = 0,8, s = 0,1; б) р = 0,6, q = 0,4, г = 0,85, 5 = 0,15; в) р = 0,7, q = 0,3, г = 0,8, 5 = 0,1. 50. Мимо бензоколонки проезжают легковые и грузовые машины. Среди них доля грузовых машин — р. Вероятность того, что проезжающая машина подъедет заправиться, для грузовой ма- шины равна 0,1; для легковой — 0,2. Найти вероятность того, что очередная машина, подъехавшая на заправку, окажется грузовой, если: а) р = 0,75; б) р = 0,7. 51. Фирма А занимает 20% рынка электронной техники, фирма Б — 50%, фирма В — 30%. Доля мобильных телефонов в поставках фирмы А составляет 20%, в поставках фирмы Б — 40%, в постав- ках фирмы В — 70%. Покупатель приобрел мобильный телефон. Какова вероятность того, что этот телефон произведен фирмой Л? 52. В город поступают товары трех фирм в соотношении 2:3:5. В поставках первой фирмы 60% товара высшего качества, вто- рой — 40%, а третьей — 20%. Куплен товар высшего качества. Найти вероятность, что он изготовлен второй фирмой. 53. В город поступают товары трех фирм в количественном соот- ношении 3:4:6. В поставках первой фирмы 30% товара высшего
64 ЧАСТЬ I. Теория вероятностей^ — ' ............ ' ------------ ------------------—-----—- w качества, второй — 20%, а третьей — 25%. Куплен товар выс- шего качества. Найти вероятность, что он изготовлен второй или третьей фирмой. 54. В компании 70% менеджеров работают в центральном офисе, 30% — в региональных. Вероятность того, что менеджеру цен- трального офиса потребуется консультация специалиста, равна 0,3, менеджеру регионального офиса — 0,5. Одному из менед- жеров потребовалась консультация. Какова вероятность того, что он работает в центральном офисе? 55. Стрелок А поражает мишень с вероятностью 0,6, стрелок Б — с вероятностью 0,5 и стрелок В — с вероятностью 0,4. Стрелки дали залп по мишени, и две пули попали в цель. Что вероят- нее: попал стрелок В в мишень или нет? 56. Из урны, где было 4 белых и 6 черных шаров, вынут один шар неизвестного цвета. После этого из урны извлечены (без воз- вращения) два шара, оказавшиеся белыми. При этом условии найти вероятность, что сначала вынут был черный шар. 57. Из урны, где было 11 красных, 5 белых и 10 черных шаров, вынут один шар. После этого из урны извлечены (без возвраще- ния) 2 шара, оказавшиеся красным и белым. При этом условии найти вероятность, что сначала был вынут черный шар. 58. Из урны, где было 10 красных, 6 желтых и 4 синих шара, вынут один шар. После этого из урны извлечены (без воз- вращения) 2 шара, оказавшиеся красным и желтым. При этом условии найти вероятность, что сначала был вынут синий шар. 59. Из урны, где было 6 белых и 4 черных шара, переложен вынутый наудачу шар в урну, содержащую 7 белых и 2 черных шара. После этого из второй урны был вынут шар, оказавшийся белым. Найти вероятность, что сначала был переложен белый шар. 60. Из урны, где было 5 белых и 3 черных шара, переложен вынутый наудачу шар в урну, содержащую 4 белых и 2 черных шара. После этого из второй урны был вынут шар, оказавшийся белым. Найти вероятность, что сначала был переложен черный шар.
Глава 4 ПОВТОРНЫЕ НЕЗАВИСИМЫЕ ИСПЫТАНИЯ. ТЕОРЕМА БЕРНУЛЛИ 4.1. Испытания Бернулли Теория вероятностей имеет дело с такими экспериментами, которые можно повторять (по крайней мере теоретически) не- ограниченное число раз. Пусть некоторый эксперимент повто- ряется п раз, причем результаты каждого повторения не зависят от исходов предыдущих повторений. Такие серии повторений называют независимыми испытаниями. Частным случаем таких испытаний являются независимые испытания Бернулли, кото- рые характеризуются двумя условиями: 1) результатом каждого испытания является один из двух возможных исходов, называемых соответственно «успехом» или «неудачей»; 2) вероятность «успеха» в каждом последующем испытании не зависит от результатов предыдущих испытаний и остается постоянной. ► Теорема Бернулли. Если производится серия из п независимых испытаний Бернулли, в каждом из которых «успех» появляется с вероятностью р, то вероятность того, что «успех» в п испыта- ниях появится ровно т раз, выражается формулой W = C:Pmqn~m , где q = 1 — р — вероятность «неудачи». Эта формула называется формулой Бернулли. 3-Теория вероятностей
66 ЧАСТЬ I. Теория вероятностей --- . . ------—......... .. . ' . . .. ... я-...... Схему испытаний Бернулли называют также биномиальной схемой, а соответствующие вероятности — биномиальными, что связано с использованием биномиальных коэффициентов С". Доказательство. Каждое испытание Бернулли описывается пространством элементарных исходов Q = {У, Н}, состоящим из двух элементов: У (успех) и Н (неудача), а также их вероят- ностями Р(У) = р, Р(Н) = q, р + q = 1. Успехом в испытании будем считать появление события А. Составной эксперимент (серия из п испытаний) задается пространством Qn, каждый элемент которого представляет со- бой упорядоченный «-мерный набор конкретных результатов этих испытаний. Обозначим через Вт событие, состоящее в том, что в п опытах событие А появилось ровно т раз. Разложим событие Вт в сумму произведений событий, состоящих в по- явлении и непоявлении события А в отдельных опытах, при этом обозначим через А. появление события А в /-м опыте и А, — непоявление А в /-м опыте. Тогда каждый вариант собы- тия Вт состоит из т появлений события А и п — т непоявлений события А, т.е. = AiA2... Ля_] Ап + Ai А2... Ап_1Ап +...+ AtA2... Ап_}Ап. Число всех комбинаций такого рода равно числу способов, какими можно из п элементов одновременно выбрать т эле- ментов, соответствующих т появлениям события А, т.е. числу сочетаний С". Вероятность каждой такой комбинации (каждо- го слагаемого) по теореме умножения независимых событий равна pmq"~m, а так как составляющие событие Вт являются несовместными событиями, то согласно теореме сложения не- совместных событий Р(Вя) = Рп(т) = С™ pmqn~m. Задача 1. Игральная кость брошена 6 раз. Найти вероят- ность того, что ровно 3 раза выпадет «шестерка». Решение. Шестикратное бросание кости можно рассматри- вать как последовательность независимых испытаний с веро- ятностью успеха («шестерки»), равной 1/6, и вероятностью не- удачи — 5/6. Искомую вероятность вычисляем по формуле 1 )3 (5? Л(3) = С63 - - = 0,053. 6 (бЦб]
Глава 4. Повторные независимые испытания. Теорема Бернулли 67 Задача 2. Монета бросается 6 раз. Найти вероятность того, что герб выпадет не более чем 2 раза. Решение. Искомая вероятность равна сумме вероятностей трех событий, состоящих в том, что герб не выпадет ни разу, либо один раз, либо два раза: ЛЛ) = Р6(0) + Р6(1) + Р6(2) = ’оЩ ill ы +c-UB 2 2 Задача 3. Аудитор обнаруживает финансовые нарушения у проверяемой фирмы с вероятностью 0,9. Найти вероятность того, что среди 4 фирм-нарушителей будет выявлено больше половины. Решение. Событие состоит в том, что из 4 фирм-нарушителей будет выявлено три или четыре, т.е. Р(А) = Р4(3) 4- />(4) =С430,93 • 0,14-С4 0,94 = 0,93(0,4 4- 0,9) = 0,9477 д.2. Наивероятнейшее число успехов Число т, при котором биномиальные вероятности Рп(т) достигают своего максимального значения (при фиксирован- ном числе испытаний л), называют обычно наиболее вероятным (наивероятнейшим) числом успехов. Справедливо следующее ут- верждение. ► Теорема 2. Наивероятнейшее число успехов т* в серии из п не- зависимых испытаний Бернулли (с вероятностью успеха р в одном испытании) определяется соотношением пр — q < т* < пр + р, причем: 1) если число пр — q — дробное, то существует одно наиве- роятнейшее число т *; 2) если число пр — q — целое, то существует два наивероят- нейших числа: т* = пр — q, т* = пр + р\ 3) если пр — целое число, то наивероятнейшее число т* = пр.
68 ЧАСТЬ I. Теория вероятностей Доказательство. Рассмотрим отношение двух соседних с ЛС'и + О (п-т)р г вероятностей. Если отношение —----------=-------— больше Р„(т) (m + V)q единицы, то последующая вероятность Ря(т + 1) превыша- ет предыдущую Р„{т). Если же Рп(т + 1) < Р„{т), то отно- Р„(т + 1) (п-т)р п шение —--------=------— меньше единицы. Для нахождения Р„(т) (m + l)q наивероятнейшего числа т* надо уловить тот момент, когда отношение, большее единицы, станет меньше единицы, т.е. найти такое т*, для которого одновременно выполняются не- Р(/п + 1) Р(т) _ равенства —--------<1, ——------>1. Тогда из неравенства Рп(т) ~ Р„(т-Г)~ Рл(т* + \) (п-т*)р * —-------= 2----— < 1 получаем т* > пр - а, а из неравенства (m* + \)q~ Р„(т*) {п-т* + \)р —2------= ---------—>\ получаем т* < пр + р. Таким об- Р„{т*-\) m*q разом, получаем, что т* лежит в интервале единичной длины пр — q < т* < пр + р, причем, обозначив через /и0 = [пр — q] целую часть числа пр — q, получим: 1) если число пр — q — дробное, то имеется единственное целое число т* = (/и0 + 1), принадлежащее промежутку [пр — q, пр + р], для которого вероятность Рп(т) достигает своего максимально- го значения: Рп(т*) = max Рп(т), т = 0, 1, ..., л; 2) если число пр — q — целое, то имеются две точки мак- симума т* = пр — q и т* + 1 = пр + р: max Рп(т) = Рл(т*) = Рл(т* + 1), т = 0, 1, ..., п. Последнее равенство следует из непосредственной проверки Р(т* + \) (п-т*)р того, что отношение —-------= ------— равно единице, если (т* + 1)<7 заменить т* на пр — q, a q на 1 — р; 3) если пр целое, то наивероятнейшее число т* = пр. Дейст- вительно, если пр — целое, то в промежутке пр — q < т < пр + р, длиной единица (р + q = 1), содержится единственное целое число — пр.
Глава 4. Повторные независимые испытания. Теорема Бернулли 69 Задача 4. Монета подбрасывается 3 раза. Найти наиболее вероятное число успехов (выпадений герба). Решение. Возможными значениями для числа успехов в трех рассматриваемых испытаниях являются т = 0, 1,2 или 3. Пусть Ат — событие, состоящее в том, что при трех подбрасываниях монеты герб появляется т раз. По формуле Бернулли легко найти вероятности событий Ат. т 0 1 2 3 1/8 3/8 3/8 1/8 Из таблицы видно, что наиболее вероятными значениями являются числа 1 и 2 (их вероятности равны 3/8). Этот же ре- зультат можно получить и из теоремы 2. Действительно, п = 3, р = 1/2, q = 1/2. Тогда 1_1< 2 2“ 1 1 2 + 2 1</я’<2. Задача 5. Вероятность получения удачного результата при производстве сложного химического опыта равна 3/4. Найти наивероятнейшее число удачных опытов, если общее их число равно 10. Решение. В этом примере п = 10, р = 3/4 = 0,75, q = 1/4 = = 0,25. Тогда неравенство для наиболее вероятного числа успехов имеет вид: 10-0,75 — 0,25 <т* < 10-0,75 + 0,75 или 7,25 <т* <8,25. Существует только одно целое решение этого неравенства, а именно т* = 8. Задача 6. В результате каждого визита страхового агента до- говор заключается с вероятностью 0,1. Найти наивероятнейшее число заключенных договоров после 25 визитов. Решение. Имеем п = 25, р = 0,1, q = 0,9. Неравенство для наиболее вероятного числа успехов принимает вид: 25 -0,1 — 0,9 < s т* <25-0,1 + 0,1 или 1,6 < т* < 2,6. У этого неравенства только одно целое решение: т* = 2.
70 ЧАСТЬ I. Теория вероятностей ! 4.3. Предельные теоремы и приближенные формулы При больших значениях п непосредственное нахождение вероятностей Рп(т) по формуле Бернулли сопряжено с труд- ностями вычислительного характера, поэтому в таких случаях используют различные варианты приближенных формул, осно- ванных на предельных теоремах Пуассона и Муавра—Лапласа. Приближенная формула Пуассона используется в том слу- чае, когда число испытаний п велико, а вероятность успеха в отдельном испытании мала (р < 0,1) и при этом пр невелико (пр < 10). Теорема Пуассона. Пусть п р -> О, пр —> X = const. Тогда Рп(т)^^-е-\ ml Доказательство. По формуле Бернулли, после умножения чис- лителя и знаменателя на /Г и некоторых преобразований, получаем: D/м.\ Ст П(п — 1)...(п т +1)/? z) _\л-т р„ (т) = сп р q =--------------------(1 - р) т\ = п(п-1)...(п — т + 1)пт пр „ = /и!лт(1 -рУ Р * п ' 1(1-1)...(1-—) „ =--------------^-(прУ(1-^У —±-е\ п-+оо, р^О. ml и (1 - р) ml Хте~к Предельные вероятности Р„(т) » t называются пуас- соновскими. Поскольку при больших п верно пр » X, то можно считать, что X = пр. Формула выражает закон распределения Пуассона вероят- ностей массовых (п велико) и редких (р мало) явлений. Отсюда название закона Пуассона — закон редких явлений. Закон Пуассона широко применяют в теории информации, в теории массового обслуживания при изучении потока событий. В силу определенной «симметричности» понятий «успех» и «неудача» приближенная формула Пуассона может использовать- ся в схеме независимых испытаний Бернулли при больших п так- же и в случае, когда р близко к единице, т.е. при q < 0,1 и nq < 10: л т D ( ~ /^л-m _л-т ./л /-гл -к э м _ РП(п-т) = С р q =С„р q ~—е ,K = nq. ml
Глава 4. Повторные независимые испытания. Теорема Бернулли 71 Задача 7. Известно, что процент брака для некоторой де- тали равен 0,5%. Контролер проверяет 1000 деталей. Како- ва вероятность обнаружить ровно три бракованные детали? Какова вероятность обнаружить не меньше трех бракованных деталей? Решение. Имеем 1000 испытаний Бернулли с вероятно- стью «успеха» р = 0,005. Применяя пуассоновское прибли- жение с 1 = пр = 5, получаем: 1) Лооо(З)« зт*-5; 2) Р1000(т > 3) = 1 - Р1П00(т < 3) = 1 - [ Т’ооо(О)+^(l) + 7^(2) ] « 2 уп а 1 - V*—е"5, и по таблице значений функции Пуассона на- ходим Р1000(3) — 0,14; Р1000(/и > 3) « 0,875. Приближенные формулы Муавра—Лапласа. Предположим, что в схеме независимых испытаний Бернулли число испыта- ний п велико, а вероятности «успеха» и «неудачи» не малы (на- пример, 0,1 < р < 0,9) или пр и nq не малы {пр > 10, nq > 10), ► Локальная теорема Муавра—Лапласа. Пусть р = const, п -> <ю, тогда y/npq yjnpq 1 -- где <р(х) = —==е 2 л/2тг Здесь приближенное равенство понимается в смысле асим- птотической эквивалентности при л -> оо для ограниченных х. Функция ф(х) — четная, и для положительных значений х составлена таблица ее значений (приложение 2). Задача 8. Вероятность покупки при посещении клиентом магазина составляет р = 0,75. Найти вероятность того, что при 100 посещениях клиент совершит покупку ровно 80 раз.
72 ЧАСТЬ I. Теория вероятностей Решение. В данном случае п = 100, т = 80, р = 0,75, q = 0,25. „ „ 80-100-0,75 , ,, _ . _ Найдем х = =1,16, и по табл. 1 приложения 2 7100 0,75 0,25 определяем <р(х) = 0,2036, тогда искомая вероятность Р100(80) = = , °’2°36 = 0,047. 7100-0,75-0,25 ► Интегральная теорема Муавра-Лапласа. Пусть р = const, п -> оо, тогда т-пр ---===-<х . yjnpq 1 Т2тг J* е 2 dz, где т — число успехов для любого числа х. Отсюда следует, что для вычисления вероятности Pn(mv т2) = = Р(тх < т < /и2) события, состоящего в том, что число успехов т в п испытаниях Бернулли окажется заключенным в пределах от тх лъ т2, можно использовать приближенную формулу РД/и1,/п2) = Ф0(х2)-Ф0(х1), гщ-пр п^-пр 1 г -у , , где у = - ---- , х2 = —у=-, а Ф0(х) = —= I е 2 dz ~ функция Jnpq y/npq y/2irJQ Лапласа. Функция Ф0(х) равна 0 при х = 0: Ф0(0) = 0, и нечетная: Ф0(-х) = -Ф0(х) для всех х. Для функции Ф0(х) составлены спе- циальные таблицы при некоторых положительных значениях аргумента (табл. 2 приложения 2). При х > 5 можно считать, что Ф0(х) = 0,5. Задача 9. Страховая компания заключила 40 000 договоров. Вероятность страхового случая по каждому из них в течение года составляет 2%. Найти вероятность того, что таких случаев будет не более 870. Решение, По условию задачи п = 40 000, р = 0,02, пр = 800, yjnpq = 28. Для вычисления вероятности Р(т < 870) воспользу- емся интегральной теоремой Муавра-Лапласа:
Глава 4. Повторные независимые испытания. Теорема Бернулли 73 Р(0 < т < 870) = Ф0(х2) - ФдСХ]), где х, = ° J*00 =-28,57 и 870-800 28 y_ ---------— 2,5 . 2 28 Находим по таблице значений функции Лапласа: Р(0 < т< 870) = Ф^) - Ф0(х,) = Фо(2,5) - Фо(-28,57) = = 0,4938 + 0,5 = 0,9938. Следствие (интегральной теоремы Муавра—Лапласа). Вероятность того, что относительная частота появления успеха в п независимых испытаниях Бернулли (т.е. число т/п) отклонится от вероятности успеха не более чем на с > 0, может быть найдена по формуле k п 2Ф0 е. Доказательство получаем из следующей цепочки очевидных равенств: _(т ) Р----р < £ = J . п ) Jnp + ПЕ-Пр I-------- npq -ф ^0 пр — пъ — пр у["М т п = ФЛ Задача 10. Каждый из 900 посетителей оптового рынка слу- чайным образом обращается в один из 10 ларьков. В каких границах с вероятностью 0,95 лежит число клиентов отдельно взятого ларька? Решение. Из условия задачи следует п = 900, р = 0,1 и задан- zjn т = 0,95. Отсюда следу- ная вероятность Р\ —р <г = 2Ф0 п ет, что Фо PQ) = 0,475. По таблице функции Лапласа находим, что аргумент функции равен -^1 = 1,96, и получаем значение, у/рц т 1 е= 0,0196. Тогда из условия <0,0196 найдем проме-
74 ЧАСТЬ I. Теория вероятностей жуток для т: рл - 90| < 17,64 или 72,34 < т < 107,64, и так как т — число целое, то 73 < т < 107. Приближенную формулу можно использовать и в следую- щей «урновой» схеме, из генеральной совокупности объема N, содержащей М белых и N— М черных шаров, осуществляется по- следовательный выбор п шаров без возвращения. Вероятность того, что в полученной выборке окажется ровно т белых ша- ров, вычисляется по формуле «) = хт/и fin-m сп Если объем генеральной совокупности и число белых ша- ров достаточно велики (N -> оо, М -> оо, M/N р = const), то «урновую» схему можно приближенно заменить схемой Бернулли: Рм N(m,n)^Pn(m), где Pn(rn) = C*pmqn т- Далее, при необходимости, можно использовать формулы Пуассона и Муавра-Лапласа. 4.4. Полиномиальные испытания От схемы независимых последовательных испытаний с дву- мя исходами (схема Бернулли или биномиальная схема) можно перейти к полиномиальной схеме, т.е. к схеме последовательных независимых испытаний, в каждом из которых возможны к ис- к ходов, к > 2, с вероятностями pv pv ..., рк, 0 < р.< 1, 1. /=1 В этом случае пространство элементарных событий содержит к? таких событий, а вероятность того, что из п испытаний тх за- кончатся первым исходом, т2 — вторым исходом, ..., тк — к-м исходом, равна: м’ ..., =————< р2”>... р”>. • • • • Шк * Эта формула описывает полиномиальный закон распределения.
Глава 4. Повторные независимые испытания. Теорема Бернулли Полиномиальную схему можно трактовать как обобщение статистики Максвелла—Больцмана на случай, когда вероятно- сти попадания каждой частицы в различные ячейки различны. Задача 11. Шесть рукописей раскладываются случайным образом в пять папок. Какова вероятность, что ни одна папка не останется пустой? Решение. На раскладку 6 рукописей в папки можно смотреть как на серию шести полиномиальных испытаний с 5 исходами (попадание в ью папку — это i-й исход). Вероятности исходов (папок) совпадают и равны рх = р2 = ... = pk = 1/5. Событие А = {ни одна папка не останется пустой} означает, что в одну пачку попадут две рукописи, а в остальные папки — по од- ной рукописи. Следовательно, вероятность того, что в первую папку попадут две рукописи, а в остальные папки — по одной рукописи, равна: Р6(2,1,1,1,1) = lYfiYriYfiY 6! 1 — — II — II — I —--7“’ а вероятность искомого события А (для которого неважно, в какую из 5 папок попадают две рукописи) равна: 6' 1 6' 1 Р(А) = 5Р, (2,1,1,1,1) = 5 • - • 4 = — -4 = 0,1152. 6 2! 56 2! 5s Задача 12. Курс акции за день может подняться на 1 пункт с вероятностью 50%, опуститься на 1 пункте вероятностью 30% и остаться неизменным с вероятностью 20%. Найти вероятность того, что за 5 дней торгов курс поднимется на 2 пункта. Решение. Возможны только следующие два варианта раз- вития событий: 1) курс растет 2 дня, ни разу не падает, не меняется 3 дня; 2) курс растет 3 дня, падает 1 день, не меняется 1 день. Таким образом, Р(Л) - Р5(2, 0, 3) + Р5(3,1,1) = ^^0,52 • 0,3° • 0,23 + +—— 0,53 • 0,3' • 0,2' = 0,02 + 0,15 = 0,17. 3!1!1!
76 ЧАСТЬ I. Теория вероятностей Задачи для самостоятельного решения 1. Ежедневно новая сделка совершается с вероятностью 0,2 (но не более одной в день). Какова вероятность того, что за 5 дней будет совершено 3 сделки? 2. В результате каждого визита страхового агента договор заключа- ется с вероятностью 0,25. Какова вероятность, что из 10 визитов страхового агента 5 закончатся заключением договора? 3. Вероятность поражения мишени стрелком равна 0,9. Найти ве- роятность, что он поразит мишень ровно два раза, сделав 5 вы- стрелов. 4. Для вычислительной лаборатории приобретено 9 компьютеров, причем вероятность брака для одного компьютера равна 0,1. Какова вероятность, что придется заменить более двух компью- теров? 5. Зачетная работа по предмету состоит из 6 задач, при этом за- чет считается сданным, если студент решил хотя бы 3 задачи. Студент Иванов может решить каждую задачу с вероятностью 0,6 независимо от других. Какова вероятность, что он сдаст зачет? 6. В коробке 3 детали, вероятность брака для каждой детали равна 0,1. Какова вероятность, что среди 10 коробок будет не менее восьми не содержащих бракованных деталей? 7. Два равносильных противника играют в шахматы. Что вероят- нее: а) выиграть одну партию из двух или две партии из четы- рех; б) выиграть не менее двух партий из четырех или не менее трех партий из пяти? Ничьи во внимание не принимаются. 8. Мастер и ученик играют шахматный матч. Мастер выигрывает матч, если он выиграл все партии в матче, ученик выигрывает матч, если он выиграл хотя бы одну партию в матче. Из сколь- ких партий должен состоять матч, чтобы шансы на победу у ма- стера и ученика были равны, если вероятность победы мастера в одной партии равна 0,9, а ученика — 0,1? 9. Фонд инвестирует средства в три компании. Вероятность полу- чения прибыли от каждой из компаний равна 0,7. Фонд за- рабатывает деньги, если хотя бы две компании дают прибыль. Известно, что фонд оказался в выигрыше. Какова вероятность того, что при этом условии вложения во все три компании ока- зались прибыльными?
Глава 4. Повторные независимые испытания. Теорема Бернулли 77 10. Курс акции за день растет или падает на 1 пункт равновероят- но. Найти вероятность, что за 10 дней торгов курс: а) упадет на 4 пункта; б) поднимется на 2 пункта; в) поднимется на 6 пунктов. 11. В коробке 4 детали. Вероятность того, что деталь стандартна, равна 0,9. Сколько надо взять коробок, чтобы с вероятностью не менее 0,99 среди них нашлась хотя бы одна коробка, не содержащая брака? 12. Вероятность хотя бы одного попадания при двух выстрелах равна 0,96. Найти вероятность трех попаданий при четырех выстрелах. 13. Вероятность того, что в партии из 8 изделий имеется хотя бы одно бракованное изделие, составляет 57%. Найти вероятность того, что там не более одного бракованного изделия. 14. В люстре 3 лампы. Вероятность того, что они перегорят в те- чение года, составляет 0,8%. Найти вероятность, что в течение года перегорит ровно одна лампа. 15. На ежегодную вечеринку приглашены 12 человек, причем каж- дый из них может прийти с вероятностью 0,7 независимо от дру- гих. Найти наиболее вероятное число гостей и его вероятность. 16. Система состоит из 6 независимо работающих элемен- тов. Вероятность отказа каждого элемента равна 0,3. Найти: а) наивероятнейшее число отказавших элементов; б) вероят- ность наивероятнейшего числа отказавших элементов системы; в) вероятность отказа системы, если для этого достаточно, что- бы отказали хотя бы пять элементов. 17. Игральная кость бросается 16 раз. Найти наивероятнейшее число бросаний, в которых выпало число очков, кратное трем, и вычислить его вероятность. 18. Известно, что в среднем доля р деталей имеет дефекты. Сколько деталей надо проверить, чтобы с вероятностью г среди них оказалась хотя бы одна с дефектами? Найти наивероятнейшее число деталей с дефектами в этом случае. Решить задачу, если: а) р = 0,01, г = 0,95; б) р = 0,02, г = 0,97; в) р = 0,02, г = 0,99. 19. При визите страхового агента вероятность заключения до- говора равна р. Найти наивероятнейшее число заключенных договоров после N визитов и вероятность того, что их будет заключено не больше найденного числа. Решить задачу, если: а) р = 0,2, W = 10; б) р = 0,15, N = 12.
78 ЧАСТЬ I. Теория вероятностей --- e-sss*^^s^s^9sssBBBSBBa^aasse=sasBSBSsass=saKss*s=s*sesBs=--=eas~s**ssaa!^ss—sesasssss^a* 20. Страховой агент при каждом визите заключает договор с ве- роятностью 30%. При каком числе визитов наивероятнейшее число договоров будет равно 10? 21. Сколько надо сделать выстрелов с вероятностью попадания в цель 0,7, чтобы наивероятнейшее число попаданий в цель было равно 15? 22. Сколько раз надо бросить игральную кость, чтобы наивероят- нейшее число появлений четного числа очков было равно 6? 23. Сколько надо сыграть партий в шахматы с вероятностью побе- ды в одной партии, равной 1/3, чтобы наивероятнейшее число побед было равно 5? 24. Найти вероятность того, что в серии из N бросаний монеты числа «орлов» и «решек» совпадают, если: a) W= 100; б) #= 400. 25. Посетитель магазина совершает покупку с вероятностью 0,75. Какова вероятность, что из 300 посетителей сделают покупки ровно: а) 230; б) 240. 26. Каждый из 100 компьютеров в интернет-кафе занят клиен- тами в среднем в течение 80% рабочего времени. Какова ве- роятность, что в некоторый момент клиентами будет занято: а) от 70 до 90 компьютеров; б) не менее 80 компьютеров? 27. На научную конференцию приглашены 100 человек, причем каждый из них прибывает с вероятностью 0,7. В гостинице для гостей заказано 65 мест. Какова вероятность, что все при- ехавшие будут поселены в гостинице? 28. В партии из N арбузов каждый арбуз оказывается неспелым с вероятностью р. Найти наиболее вероятное число спелых арбу- зов и вероятность того, что их реальное число будет находиться в пределах от К до L, если: a) N= 768, р = 0,25, К= 564, L = 600; б) N = 800, р = 0,2, К = 600, L = 650; в) N = 400, р = 0,2, К = 300, L = 360; г) N = 625, р = 0,2, К = 490, L = 520. 29. Страховая фирма заключила 10 000 договоров. Вероятность страхового случая по каждому в течение года составляет 2%. Найти вероятность, что таких случаев будет: а) не более 230; б) не более 250. 30. Страховая фирма заключила W договоров. Вероятность стра- хового случая по каждому договору в течение года составляет 2%. Найти наивероятнейшее число страховых случаев и веро- ятность того, что реальное число случаев отклонится от него не более чем на К, если: a) W = 10 000, К = 30; б) N = 8100, К = 25; в) N= 1000, К= 10.
Глава 4. Повторные независимые испытания. Теорема Бернулли 79 31. Консалтинговая фирма обслуживает N компаний. Каждая ком- пания обращается в эту фирму в среднем 4 раза в год. Какова вероятность, что в течение месяца фирме придется обслу- жить не менее М компаний? Решить задачу, если: a) N= 120, М = 50; б) N = 240, М = 100. 32. Каждый из 1000 адресатов, получивших рекламное объявление, обращается в фирму с вероятностью 5%. Найти вероятность, что число обратившихся составит не менее 40 человек. 33. Каждый из 500 адресатов, получивших рекламное объявление, откликается на него с вероятностью 5%. Найти наивероятней- шее число откликов и вероятность, что число откликов будет отличаться от него не более чем на 10. 34. Посетитель магазина совершает покупку с вероятностью 0,8. Какова вероятность, что из 400 посетителей сделают покупки от 300 до 350 человек? 35. Посетитель магазина совершает покупку с вероятностью 0,4. Какова вероятность, что из 600 посетителей сделают покупки от 200 до 250 человек? 36. Известно, что вероятность рождения мальчика равна 0,515, а девочки — 0,485. Какова вероятность того, что среди 1000 новорожденных детей мальчиков будет больше, чем девочек? 37. Производится 500 подбрасываний симметричной монеты. В каких пределах будет находиться отклонение частоты вы- падения герба от 0,5 с вероятностью 0,99? 38. При изготовлении деталей наблюдается в среднем 10% брака. Исследуется партия в 1500 деталей. Найти границы, в которых число бракованных деталей лежит с вероятностью 0,9. 39. Каждый из 400 клиентов фирмы случайным образом обраща- ется к одному из 5 менеджеров. В каких границах с вероятно- стью 0,95 лежит число клиентов отдельно взятого менеджера? 40. Каждый из 900 посетителей оптового рынка случайным образом обращается в один из 10 ларьков. В каких границах с вероятно- стью 0,95 лежит число клиентов отдельно взятого ларька? 41. Страховая фирма заключила 10000 договоров. Вероятность страхового случая по каждому в течение года составляет 1%. В каких границах с вероятностью 0,95 лежит количество стра- ховых случаев? 42. Стиральным порошком «Снежок» пользуется 25% населения. Сколько людей надо опросить, чтобы определить эту долю с точностью 0,05 с вероятностью 0,95?
80 ЧАСТЬ I. Теория вероятностей 43. Зубной пастой «Чистозуб» пользуется 10% населения. Сколько человек надо опросить, чтобы определить эту долю с точно- стью 0,03 с вероятностью 0,99? 44. На выборах кандидата в мэры поддерживает 40% населения. При изучении общественного мнения было опрошено 1000 человек. С какой вероятностью можно утверждать, что доля избирателей из этой выборки, поддерживающих кандидата, от- личается от истинной доли не более, чем на 0,05? 45. Доля населения региона, занятого в промышленности, равна 0,4. В каких границах с вероятностью 0,95 лежит число за- нятых в промышленности среди 10 000 случайно отобранных людей? 46. Известно, что вероятность «зависания» компьютера равна 0,6%. Какова вероятность, что из 200 компьютеров «зависнут»: а) ровно 6 компьютеров; б) не более 5 компьютеров? 47. В среднем 1% документов содержит ошибки. Какова вероят- ность, что из 100 документов будет не более двух с ошибками? 48. При наборе текста наборщик делает ошибку в слове с вероят- ностью р. Какова вероятность, что в тексте из N слов будет не более М ошибок? Решить задачу, если: а) р = 0,001, N = 5000, М = 5; б) р = 0,002, N = 2000, М = 4. 49. При наборе текста наборщик делает ошибку в слове с вероят- ностью р. Найти наивероятнейшее число ошибок в тексте из А слов и вероятность того, что оно не будет превышено. Решить задачу, если: а) р = 0,002, N = 1500; б) р = 0,003, N = 1300. 50. Сборник задач содержит 400 задач с ответами. В каждом ответе может быть ошибка с вероятностью 0,01. Какова вероятность, что ровно 99% всех ответов даны без ошибок? 51. Вероятность правильно прочитать закодированное слово равна 99,75%. С какой вероятностью в тексте длиной 2000 слов будет сделано более двух ошибок? 52. Известно, что вероятность выпуска дефектной детали равна 0,02. Детали укладываются в коробки по 100 штук. Чему равна вероятность того, что: а) в коробке нет дефектных деталей; б) число дефектных деталей в коробке не более двух? 53. Производители калькуляторов знают из опыта, что в среднем 1% проданных калькуляторов имеет дефекты. Аудиторская фирма купила 500 калькуляторов. Какова вероятность, что придется заменить ровно 4 калькулятора?
Глава 4. Повторные независимые испытания. Теорема Бернулли 81 54. Изделие является годным с вероятностью р. Какова вероят- ность, что в партии из N деталей будет не более М бракованных? Решить задачу, если: а) р - 0,95, N = 100, М = 2; б) р = 0,96, # = 100, М = 3; в) р = 0,95, N = 120, М = 4. 55. Вероятность, что в партии из 100 изделий имеется брак, со- ставляет 63,2%. Найти вероятность, что там не более трех бра- кованных изделий. 56. Вероятность того, что пассажир опоздает к поезду, равна 0,004. Найти наиболее вероятное число опоздавших, если всего билет купили 750 человек, и вероятность того, что их будет именно столько. 57. Два шахматиста, А и В, встречались за доской 50 раз, причем 15 раз выиграл А, 10 раз выиграл В и 25 партий закончились вничью. Найти вероятность, что в матче из 10 партий между этими шахматистами 3 партии выиграет А, 2 партии выиграет В, а 5 партий закончатся вничью. Использовать результаты пре- дыдущих матчей для оценки вероятностей выигрыша каждого. 58. В магазине имеются в продаже: один костюм первого роста, два костюма второго роста, три костюма третьего роста. Костюм первого роста спрашивается с вероятностью 0,2, костюм второ- го роста — с вероятностью 0,3, костюм третьего роста — с ве- роятностью 0,5. В магазин обратилось три покупателя. Найти вероятность, что хотя бы один из них ушел без покупки. 59. Курс акции за день торгов может подняться или опуститься на 1 пункт либо остаться неизменным (все три случая равно- вероятны). Найти вероятность, что за 5 дней торгов курс под- нимется на 2 пункта. 60. Курс акции за день торгов может подняться на 1 пункт с ве- роятностью 50%, опуститься на 1 пункт с вероятностью 30% и остаться неизменным с вероятностью 20%. Найти вероятность, что за 5 дней торгов курс: а) поднимется на 3 пункта; б) упадет на 2 пункта.
Глава 5 ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 5.1. Случайная величина и ее закон распределения Случайной величиной называется любая действительная функция1 S, = £,(со), со е Q, определенная на пространстве эле- ментарных событий Q. Если множество значений функции конечно или счетно, то такую случайную величину называют дискретной. В результате опыта случайная величина может принять то или иное значение, причем заранее неизвестно, какое именно. Примерами случайных величин являются: колебания курсов валют или цен товаров, прибыль или убытки фирмы, время выполнения работы, ожидания транспорта и т.д. Пример 1. При двукратном подбрасывании монеты возможны следующие исходы: а>] = РР, со2 = РГ, со3 = ГР, <о4 = ГГ, т.е. про- странство элементарных событий имеет вид Q = {со,, со2, <о3, <о4}, причем каждый элементарный исход имеет вероятность 1/4. Пусть ^(<в) — число выпадений герба при двукратном бросании монеты, тогда ^(со3) = 0, £(со2) = 1, £(<о3) = 1, ^(<в4) = 2. Зная ве- роятности для элементарных исходов, можно вычислить веро- ятности для соответствующих значений случайной величины Р(^=0) = Р(®1)=1/4; Р(^=1) = Р(со1,<в2) = 1/4 + 1/4 = 1/2; Р(£=2) = Р(со4) = 1/4. 1 В аксиоматике Колмогорова требуется, чтобы функция была измери- мой, т.е. все события {^(ш) < t} принадлежали а-алгебре т вероятностного пространства (Q, т, Р) (см. § 3.7). Далее будем считать это условие выпол- ненным по умолчанию.
Глава 5. Дискретные случайные величины 83 Полученные вероятности можно свести в следующую таб- лицу (в первой строке перечислены значения случайной вели- чины, а во второй — их вероятности): £ 0 1 2 р 1/4 1/2 1/4 Такая таблица уже не содержит информацию о том, на ка- ком вероятностном пространстве определена случайная вели- чина, в ней приведены лишь значения случайной величины (в первой строке) и их вероятности (во второй строке). Законом распределения случайной величины называется вся- кое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им ве- роятностями. Простейшей формой закона распределения дискретной слу- чайной величины является ряд распределения. Рядом распределения дискретной случайной величины £ на- зывается следующая таблица, в которой перечислены все воз- можные значения х1 х2,..., хп этой случайной величины и соот- ветствующие им вероятности р. = Р(£ = х): $ Х2 р Pl Рг Р„ При этом сумма вероятностей равна единице: = 1- /=1 Если множество значений случайной величины счетно, то эта таблица является бесконечной справа, а суммой вероятностей является ряд =1. /=1 Задача 1. В связке из трех ключей только один ключ под- ходит к двери. Ключи перебирают до тех пор, пока не отыщет- ся подходящий. Построить закон распределения для случайной величины — числа опробованных ключей. Решение. Число опробованных ключей может равняться 1, 2 или 3. Если испытали только один ключ, это означает, что этот первый ключ сразу подошел к двери, а вероятность такого события равна 1/3. Итак, Р(£ = 1) = 1/3. Далее, если опробо- ванных ключей было 2, т.е. £, = 2, это значит, что первый ключ не подошел, а второй — подошел. Вероятность этого события
84 ЧАСТЬ I. Теория вероятностей равна 2/3-1/2 = 1/3, т.е. Р(£, = 2) = 1/3. Аналогично вычис- ляется вероятность P(t, = 3) = 1/3. В результате получается следующий ряд распределения случайной величины: 1 2 3 р 1/3 1/3 1/3 5.2. Функция распределения случайной величины Функцией распределения случайной величины £, называется функция F^x), определенная для любого действительного х и выражающая вероятность того, что случайная величина Е, при- мет значение, меньшее х: F^x) = Р(Е < х). Функция распределения обладает следующими свойствами: 1. Для любого х 6 R справедливо неравенство 0 < F^x) < 1. 2. Функция распределения является неубывающей функци- ей, т.е. если х2< хр то Р?(х,) < FJxJ. 3. Вероятность того, что случайная величина примет значение из полуинтервала [хр xj, равна разности значений функции рас- пределения на концах, т.е. P(xl<^<x2) = Р/х,) - F'txJ. 4. Справедливо равенство: Р(Е, > х) = 1 — F^x). 5. Справедливы следующие предельные соотношения: lim P(x) = 0, limP(x) = l. X—»-ос * х—»эо * 6. Функция распределения непрерывна слева, т.е. lim Р(х) = F(a). х—а-0 * Доказательство. 1) Очевидно, поскольку это вероятность события. 2) Представим событие, состоящее в том, что случайная величина примет значение, меньшее х2, в виде суммы несо- вместных событий {со: ^(со) < х2} = {со: %(со) < х,} о {со: х, < ^(со) < х2}. По теореме сложения для несовместных событий: ^(х2) = F(^((H) < х2) = Р(^(со) < X,) + Р(х, < $(со) < х2) = = Ffa) + Р(х, < ^(со) < х2),
Глава 5. Дискретные случайные величины 85 и так как вероятность Р(х| < ^(со) < х2) > 0, то получаем нера- венство ^(х2) > ^(х,). 3) Свойство вытекает из равенства Т^(х2) = F^xJ + Р(х} < ^(<о) < х2). 4) Событие {со: ^(со) > х} является противоположным собы- тию {со: ^(со) < х} и, следовательно, Р(^>х) = 1 - Р(^<х) = 1 - Цх). 5) Рассмотрим убывающую последовательность ап -> — оо и множества {со: ^(со) < ли}. Они удовлетворяют условиям ак- сиомы непрерывности (см. § 3.7), так что F^an) = Р(Ап) -> О, п -> оо. Для возрастающей последовательности ап -> +оо и мно- жеств Ап = {со: ^(со) > ап} получаем = 1 - Р(Лл) -> 1, п оо. 6) Рассмотрим возрастающую последовательность ап < а, ап-+ а и множества Ап = {со: ап< £>(со) < а}. Они удовлетворяют условиям аксиомы непрерывности, и поскольку F^(d) = F^an) + + Р(А:), то /^(аи) = FJa) - Р(Ап) -> F(a), п оо. Таким образом, каждая функция распределения является неубывающей, непрерывной слева и удовлетворяющей усло- виям Г(-оо) = 0 и F(+oo) = 1 функцией. Верно и обратное: каждая функция, удовлетворяющая перечисленным условиям, может рассматриваться как функция распределения некоторой случайной величины. Функция распределения является универсальным законом распределения случайной величины. Все ее свойства остаются верными и тогда, когда пространство элементарных событий не является дискретным. Функция распределения любой дискретной величины раз- рывна, возрастает скачками при тех значениях х, которые яв- ляются возможными значениями Величина скачка функции F(x) в точке х равна рг Задача 2. Построить функцию распределения Г(х) для слу- чайной величины £, из задачи 1. Решение. Случайная величина £ имеет три значения 1, 2, 3, которые делят всю числовую ось на четыре промежутка: (-оо, 1], (1, 2], (2, 3], (3, +оо). Если х < 1, то неравенство < х невоз- можно (левее х нет значений случайной величины £) и значит, Для такого х функция /^(х) = 0.
86 ЧАСТЬ I. Теория вероятностей --- aeaBMa-Ba—eaggg. j.j., .вямаяиянаиввидеядвдд ч м —i— . i . ...-jl-l- ' .". --я-чнда Если 1 < х < 2, то неравенство £ < х возможно только если {; = 1, а вероятность такого события равна 1/3, поэтому для таких х функция распределения F^x) = 1/3. Если 2 < х < 3, неравенство £ < х означает, что или Е, = 1, или = 2, поэтому в этом случае вероятность Р(^ < х) = P(t> = 1) + + = 2) = 2/3, т.е. Цх) = 2/3. И наконец, в случае х > 3 неравенство < х выполняется для всех значений случайной величины £, поэтому Р(& < х) = = = 1) + Р(£ = 2) + Р(£ = 3) = 1, т.е. FJx) = 1. Итак, мы получили следующую функцию: /•’(х) = О, 1/3. 2/3, 1, х<1; 1<х<2; 2<х<3; х>3. 5.3. Дискретный случайный вектор Пусть на дискретном вероятностном пространстве Q задано несколько случайных величин ^(со), ^2(<в), ..., ^и(<о), где ие Q. Такой упорядоченный набор называется многомерным случай- ным вектором, или л-мерной случайной величиной, и обозна- чается ^(<о) = (£,, ..., Q. Рассмотрим случай п = 2, т.е. когда на пространстве элемен- тарных исходов заданы две дискретные случайные величины £ и т|, принимающие значения х. (/ = 1, 2, ...) и (/ = 1, 2, ...) соответственно. Упорядоченная пара (^, г|) называется двумер- ным случайным вектором, или двумерной случайной величиной. Сами величины и г| называются в этом случае составляющими (или компонентами) случайного вектора. Геометрически совокупность двух случайных величин мож- но рассматривать как случайную точку с координатами (L rj) на плоскости X0Y или как случайный вектор, направленный из начала координат в точку (£, т|)> составляющие которого случайные величины и т]. Совокупность трех случайных вели- чин изображается случайной точкой или случайным вектором в трехмерном пространстве, совокупность п случайных вели- чин — случайной точкой или случайным вектором в простран- стве п измерений.
Глава 5. Дискретные случайные величины 87 Любое соотношение между возможными значениями слу- чайного вектора и их вероятностями называется совместным законом распределения. Совместный закон распределения вероятностей дискрет- ных величин и т] задается набором вероятностей р.} одно- временного осуществления событий {£ = xz} и {т| = уу}, т.е. р. = jP^ = x,,r| = yy}, и представляется в виде таблицы: 5 п У1 Ут Рп Рп Р\т х2 Ри Рц Ръп X. Р', Рщ Рпт Первый столбец таблицы содержит все возможные значения составляющей Е, а первая строка — все возможные значения со- ставляющей т|. В соответствующей клетке таблицы указана веро- ятность того, что двумерная случайная величина приняла значе- ние (х, уу). Так как события {o:^(co) = xz, т|(<о) = } образуют пол- ную группу событий, то сумма вероятностей, помещенных во всех клетках таблицы, равна единице: £Р(£, = х,, r| = yt) = £pfj = 1. Такая таблица называется рядом распределения вектора (£, ц). Вероятность события типа {(^, rj) G В} — «случайная точ- ка (^, г|) попадает в область В» — вычисляется по формуле =х,,Л=у?)> где суммирование происходит по всем возможным парам (xz, уу) значений случайных величин Е, И г|, для которых случайная точка (xz, уу) входит в область В. Частным законом распределения случайной величины Е, на- зывается набор вероятностей событий = х}. Если задан со- вместный закон распределения, то частный закон распределе- ния для можно получить с помощью формулы P^(xz) = = х,} = Yp{t>= xi’ ’I = У)J =
88 ЧАСТЬ I. Теория вероятностей Действительно, событие {со: £ = х.} может появиться с одним из событий = х,, n = yj, = хр ц = y2}, {£, = x(, q = ym}, которые несовместны и их объединение равно событию {со: £ — xj, т.е. {£ = х.} = |J {£ = х(, т| = у^. Отсюда в силу теоремы сложе- У=1 т ния несовместных событий следует, что Р(^ = х;) = . №1 Аналогично частным законом распределения г] называется набор вероятностей событий {т| = у(}, которые также можно вычислить с помощью формулы Z / Таким образом, распределение каждой случайной величины восстанавливается с помощью совместного закона распределе- ния вероятностей. Случайные величины и т| называются независимы- ми, если для любых множеств А и В выполняется условие: Р(^ g А, т| g В) - Р(£ g Л)Р(т| 6 В), т.е. независимы события g А} и {т| g В}. Справедлива следующая теорема. ► Теорема. Дискретные случайные величины и г| независимы тогда и только тогда, когда события = xj и {х\ = yj незави- симы для всех значений х. и yj . Доказательство. Пусть = х., т] = у.) = = х)Р(х\ = уу), тогда для всех значений х. и у получаем Р(^еЛ,цеР) = £ Р(^ = х,.,п = уу) = £ Р(^ = х,)Р(ц = уу) = x,eA,yfeB x^A.yjcB = z Р(^=X,) Z Ап = У,)=6 Л)Р(п 6 В). Х'^А У^В Задача 3. Совместный закон распределения случайных ве- личин и г, задан с помощью таблицы: п 1 2 -1 1/16 3/16 0 1/16 3/16 1 1/8 3/8
Глава 5. Дискретные случайные величины 89 Вычислить частные законы распределения составляющих величин £ и т|. Определить, зависимы ли они. Вычислить веро- ятность Р(£+п^2). Решение. Частное распределение для получается суммиро- ванием вероятностей в строках: /’(^ = -1) = Р(^ = -1,ц = 1) + Р(^ = -1,т1 = 2) = 1/16 + 3/16 = 1/4; Р(^ = 0) = Р(^ = 0,т] = 1) + Р(£ = 0, т| = 2) = 1 /16 + 3/16 = 1/4; Р(^ = 1) = Р(^ = 1, ц = 1) + Р($ = 1, П = 2) = 1/8+3/8 = 1/2. Аналогично получается частное распределение для tj: Р(Л = 1) = 1/16 + 1/16 + 1/8 = 1/4; Р(П = 2) = 3/16 + 3/16 + 3/8 = 3/4. Полученные вероятности можно записать в ту же таблицу напротив соответствующих значений случайных величин. 5 п 1 2 А -1 1/16 3/16 1/4 0 1/16 3/16 1/4 1 1/8 3/8 1/2 р. 1/4 3/4 1 Теперь ответим на вопрос о независимости случайных вели- чин и т|. С этой целью для каждой клетки совместного распре- деления вычислим произведение Р(^ = х.)Р(т) = уу) (т.е. сумм по соответствующей строке и столбцу) и сравним его со значением вероятности Р(^ = х,, ц = уу) в этой клетке. Например, в клетке Для значений £= -1 и ц = 1 стоит вероятность 1/16, а произведе- ние соответствующих частных вероятностей 1/4 • 1/4 = 1/16, т.е. совпадает с совместной вероятностью. Это условие так же про- веряется в оставшихся пяти клетках, и оно оказывается верным везде. Следовательно, случайные величины £ и ц независимы. Заметим, что если бы наше условие нарушалось хотя бы в одной клетке, то величины следовало бы признать зависимыми.
90 ЧАСТЬ I. Теория вероятностей] Для вычисления вероятности Р(£ + т|>2) отметим клетки,- для которых выполнено условие Е, + х}>2. Таких клеток всего- три, и соответствующие вероятности в этих клетках равны 1/8, 3/16, 3/8. Их сумма 11/16, это и есть искомая вероятность. Вычисление этой вероятности можно записать так: Ра + Л>2)=Р(^ = 1, п = 1) + Р(^ = 0, n = 2)+Pfc = l, п = 2)= = 1/8 + 3/16 + 3/8 = 11/16. 5.4. Совместная функция распределения случайного вектора Рассмотрим вероятностное пространство Q, на котором определен вектор £, = (^, и). Обозначим через {£ < х, г| < у} множество тех элементарных событий со, для которых одно- временно выполняются эти неравенства. Совместной функцией распределения вероятностей случайных величин и г| или случайного вектора (£, rj) называется функция двух аргументов F(x, у), равная вероятности Pfc < х, г| < у) = = F(x, у). Это общее определение верно как в дискретном, так и в непрерывном случаях. Частными функциями распределения называют функции распределения составляющих Е, и гр F^x) и Г(х). Многомерные функции распределения обладают аналогич- ными свойствами, что и одномерные: 1. 0 < F(x, у) < 1; 2. F(x, у) есть неубывающая функция по каждому из аргу- ментов; 3. F(x, у) непрерывна слева по каждому из аргументов; 4. F(x, у) удовлетворяет соотношениям: F (+<ю, +00) = 1 и F(x, —00) = F(—00, у) = 0. Геометрически функция распределения Дх, у) = <х, q <у) определяет вероятность попадания случайной точки в беско- нечный угол с вершиной в точке (х, у). Геометрическая интерпретация функции распределения F(x, у) позволяет дать простое пояснение предельным свой- ствам функции распределения: если х —ж (или у -оо), то правая граница (или верхняя граница) бесконечного квадранта неограниченно смешается влево (или вниз), и вероятность по-
Глава 5. Дискретные случайные величины 91 Рис. 5.1 падания случайной точки в квадрант стремится к нулю. При х -> +оо и у -> +оо бесконечный квадрант превращается во всю плоскость ХОУ и попадание случайной точки в эту плоскость является достоверным событием. Если один из аргументов равен +оо, то функция распреде- ления вектора превращается в функцию распределения случай- ной величины, соответствующей другому аргументу: Дх, +оо) = = /^(х), Д+«, у) = Г(у). Действительно, поскольку событие {<о: г|(ю) < +оо} достоверно, F(x, +а>) определяет вероятность события {а>: ^(<о) < х}, т.е. представляет собой функцию рас- пределения составляющей £. Аналогично Д+оо, у) = Г(у). Геометрически функция распределения составляющих есть веро- ятность попадания случайной точки в полуплоскость, ограничен- ную прямой X = х, для Дх, +оо) = Д(х), или прямой Y = у для Д+оо, у) = Г(у) (рис. 5.2). Рис. 5.2
92 ЧАСТЬ I. Теория вероятностей Используя геометрическую интерпретацию функции рас- пределения F(x, у), можно вычислить вероятность попада- ния случайного вектора ^(со) = (£> (со), т| (со)) в прямоуголь- ник П = {(х, у): х е [с7р Z>J, у е [av bj}. Действительно (рис. 5.3), Р[(^, п) е П] = bv r| < b2) - Р(^< bv г] < а2) + + Р(^< и < а2) - Р(^< а{, п < b2) = F(bv b2) - F(bv а2) - - F(at, b2) + F(av а2). Если вектор (^, т|) непрерывный, то эта формула верна для любого интервала, полуинтервала или отрезка, так как вероят- ности точек и прямых в этом случае нулевые. В двумерном случае приведенных четырех свойств недоста- точно, чтобы функция F(x, у) была функцией распределения. Необходимо, чтобы при любых at и Ь. следующее выражение было неотрицательно: Р(ах <£,</>,, а2 < г| < Z>2) = Р[(£,, п) е П] = = F(bv b2) ~ F(bt, а2) - F(at, b2) + F(a}, а2) > 0. Из определения независимости случайных величин £, и т] следует, что их совместная функция распределения рав- на произведению функций распределения составляющих: F(x, у) = ^(x)F (у). Справедливо и обратное: если F(x, у) = Г(х)Г(у) верно для любых х и у, то случайные величины и т] независимы. Все свойства, доказанные для функции распределения двумерной случайной величины, остаются справедливыми и для функции распределения F{xv х2, ..., хп) в случае п аргу- ментов.
Глава 5. Дискретные случайные величины 93 5.5. Числовые характеристики дискретных случайных величин Пусть £ — дискретная случайная величина со значениями х х2, хп и их вероятностями pt = Р(£ = х), i = 1,2, ..., п. Математическим ожиданием (или средним значением) дис- кретной случайной величины £ называется число Л/^ = ^х,д.. Z=1 Если множество значений случайной величины £ счетно, то математическое ожидание определяется как бесконечный ряд /=1 в случае, когда он абсолютно сходится. Если £ — дискретная величина и <р(х) — некоторая функция, то математическое ожи- дание величины г| = ф(£) можно вычислить по формуле / в случае конечной суммы либо при условии, что ряд абсолютно сходится. Если заданы совместное распределение вероятностей слу- чайных величин и т| и функция <р(х, у) двух аргументов, то Л/<р(^П) = 2<р(х,,уу)р<,. ij Математическое ожидание обладает следующими свой- ствами: 1) МС = С (С — константа); 2) M(Ct,) = СЛ/% для любой константы С; 3) М(£ + т|) = Mt, + Мт|; 4) Л/(^т|) = (Mty(Mr\), если и г| независимы. Доказательство. 1) константу С можно рассматривать как случайную вели- чину, принимающую единственное значение С с вероятностью единица, так что МС = С х 1 = С; 2) случайная величина Ct, принимает значения Сх( вместо xt с вероятностями рр таким образом, сумма увеличивается в С раз; 3) используя ранее введенные обозначения, получаем
94 ЧАСТЬ I. Теория вероятностей + П) = + У> X А + £ А Е А = •J i j j i = Уx, A (a )+£ a a( A)=^+^ 4) аналогичным образом получаем Л/(^П)= ^iy1Pii=^iyi Р^)рп(у}) = %x.,p^x,;)- У у J pn(Xj) = Mt,-Mr\. i-j i.j i J Методом математической индукции можно доказать, что ма- тематическое ожидание суммы п случайных величин ^2, равно сумме их математических ожиданий: + + - + U = ^1 + №>2 + - + Дисперсией случайной величины £ называется число Dt = = М(£- М^)2. Величина а = у[Щ называется средним квадра- тическим отклонением. Из определения дисперсии вытекают формулы для вычис- ления дисперсии дискретной случайной величины: если случайная величина принимает конечное число значений х2, хп, и ^=£(х,-^)2Л <=1 при условии абсолютной сходимости ряда. Для дисперсии справедливы следующие свойства: 1. Dt = Mt,1- (Mt,)1. 2. DC = 0 (дисперсия постоянной равна нулю). 3. £>(Q) = GDt,. 4. Z)(^+Q = Dt,. 5. Если случайные величины £ и и независимы, то D(t,+ р) = = Dt,+ Dry Доказательство. 1. Из свойств математического ожидания получаем Dt, = M(t, - Mt,)1 = M(t,2 - 2^M, + (Mt,)1) = Mt,1- 2(Mt,)1 + (Mt,)1 = = Mt,1- (Mt,)1 (при условии существования конечных Mt,1 и Mt,). 2. DC= (С - MC)1 = (С - О2 = 0. 3. D(Ct,) = M(Ct,~ M(Ct,))2= M(Ct,~ CMt,)2= CM(t,- Mfy2 = = C2Dt,.
95 Глава 5. Дискретные случайные величины 4. Р(^+ Q = W+ С)-М($,+ С))2=М^+ 0-(Л^+ С))2 = = W = 5. D(t + п) = MU + п) - + п))2= М((^~ М) + (п- М1))2 = = DZ, + 2Л/((^ — Л^)(т| — Л/т])) + А], где M((t, ~ Л/£,)(г| - Aft])) = Af(E,r| - ^Afr) - г)А^ + М^Мт\) = - — 2Л/^Л/г] + Л/^Л/т] = 0. Методом математической индукции можно доказать, что если £2, ..., попарно независимы, то дисперсия их суммы равна сумме дисперсий: + ... + Q = + ... + D^n. Дисперсия является мерой разброса значений случайной ве- личины вокруг ее математического ожидания. Модой случайной величины называют ее наиболее вероятное значение. В частности, наивероятнейшее значение числа успехов в схеме Бернулли — это мода биномиального распределения. Медианой случайной величины £ называют число Xmed, та- кое что Р(^ < Xmed) = = 1/2. Для дискретной слу- чайной величины £ это число может не совпадать ни с одним из значений Поэтому медиану дискретной случайной вели- чины определяют как любое число Xmcd, лежащее между дву- мя соседними возможными значениями х. и х/+1, такими, что 1\х) < 1/2; F(x„) > 1/2. Задача 4. Пусть случайная величина £, имеет следующий закон распределения: -1 0 2 р 1/4 1/4 1/2 Вычислить математическое ожидание Mt,, дисперсию Di, и среднее квадратическое отклонение ст. Решение. По определению математическое ожидание £ равно: з =-1-1/44-01/44-21/4 = 1/4. /=1 Далее: М^=^р, =(—I)2 1/4-02-1/44-22-1/4 = 5 / 4,
96 ЧАСТЬ I. Теория вероятносте( а потому Di,= Mi,1 -(Mi$ =5/4-1/16 = 19/16. Среднее квадратическое отклонение о = -/5^ = >/19 / 4. Задача 5. Для пары случайных величин из задачи 3 вычис- лить Л/(^т))- Решение. Воспользуемся формулой M(i,r\) = '^ixjyJpij , а имен- ‘j но: в каждой клетке таблицы выполняем умножение соответству- ющих значений х,. и у(, результат умножаем на вероятность р? » все это суммируем по всем клеткам таблицы. В итоге получаем: Л/(£т|) = —1-1-1/16+(-1)-2-3/16 + 0-1-1 /16 + 0-2-3/16 + + 1-1-1 /8 + 1-2-3/8 = —1/16 —3/8 +1/8 + 3/4 = 7/16. 5.6. Основные дискретные распределения и их характеристики Распределение Бернулли (или биномиальное распределение определяется как закон распределения случайной величины равной числу успехов в п испытаниях Бернулли. Эта случайна; величина £ может принять любое из значений 0, 1,2, ..., п, < их вероятности определяются формулой Бернулли: если р - вероятность успеха, q — вероятность неудачи, то Р(£ = т) = Р„(т) = С”pmq"~m, т = 0,1,..., п. Для распределения Бернулли Mi, = пр, Di, = npq. Распределение Пуассона. Случайная величина, распределен- ная по закону Пуассона, может принять любое из значений 0 1, 2, ... (счетное множество значений), а их вероятности зада- ются формулой Р(^ = от) = —е“х, т = 0, 1, 2, ..., X > 0. ml Для распределения Пуассона Mi, = X, Di, = X.
Глава 5. Дискретные случайные величины 97 Геометрическое распределение имеет случайная величина £, равная числу испытаний Бернулли до первого «успеха» (включи- тельно) с вероятностью «успеха» в одном испытании, равной р. Такая случайная величина £, принимает значения 1, 2, 3, а их вероятности задаются формулой />(£ = /и) = №"1, т = 1, 2, 0<р<1, q = \-p. Для геометрического распределения Mt, = \/р, Dt, — q/p1. Гипергеометрическое распределение возникает, например, в задаче о выборке деталей. Пусть имеется N деталей, из которых М — стандартные. Делается выборка из п деталей. Случайная величина £ определяется как число стандартных деталей в та- кой выборке. Оно может равняться любому числу от 0 до п, но, не больше, чем М. С другой стороны, число нестандартных деталей в выборке не больше, чем N - М, поэтому число стан- дартных не меньше п - (N - Л/). Вероятности этих значений определяются гипергеометрической формулой Р(£ = т)= , т — тах (0, n — N + M), ...,тш(л, М). Сы Для гипергеометрического распределения Mt, = пр, Dt, = = (N - n)npq/(N — 1), где р = M/N, q = 1 — р. 5.7. Ковариация. Коэффициент корреляции Ковариацией случайных величин t, и г| называется число cov(^, т]) = Л/[(£, - М)(П ~ W1 (в предположении существования всех математических ожи- даний). Из определения ковариации вытекают следующие ее свой- ства: 1. Ковариацию можно вычислить по формуле COV(^, л) = А/(^) - (Л^)(ЛЛ1). 2. Если t, и т| — независимые случайные величины, то cov ($, П) = 0. 3. cov(£, n) = cov(iq, Е). 4. cov(Q, q) = Ccov(^, т|); cov(^, Cq) = C cov(^, q). Теория вероятностей
98 ЧАСТЬ I. Теория вероятносте^ 5. COV(^, + q) = cov(^, q) + cov(^2, Г|); COV(^, q, + П2) в = cov(^, Г),) + cov(^, q2). 6. cov(£, £) = D^. 7. Если случайные величины ; и q имеют конечные дис-, Персии Dq и Z)q, то дисперсия суммы этих случайных величин существует и равна Л(£, + п) = № + Z)q + 2cov(^, q). 8. -yjD^Dr] < cov(£, q) < . 9. Равенство cov(^ {,2) = ±у]В^В^2 достигается тогда и толь- ко тогда, когда случайные величины и линейно зависимы. Доказательство. 1. cov(£, т|) = Л/[(^ — A/^)(q — Л/т|)] = A/](^q — S,A/q — г]Л/^ + + Л/^Л/q) = л) — 2Л/^ЛЛ) + М^Мг\ = A/(^q) — (Л/%) (Мт\). 2. В случае независимых случайных величин A/(%q) — - (Л/%)(Л/л) = 0. 3. От перемены мест сомножителей произведение не меня- ется. 4. cov(C%, q) = Af[(C£, - A/(C%))(q ~ Л/q)] = СЛ/%)) * х (q — Л/q)] = CM[(q — A/%)(q — Л/q)] = Ccov(%, q). Аналогично делается для q. 5. Воспользуемся свойством математического ожидания: cov(%, +^,q) = M(((^ + %2)-Л/(%, + %2))(q—Afq)) = = Л/((%, -МЫ + (С2 -Ж2))(т1-Мт1)) = = М((^ - М^ )(q - Л/q)) + М((%2 - М^2 )(q - Л/q)) - = cov(%1;q) + cov(%2,q). Аналогично для qj и q2. 6. Получаем по определению дисперсии. 7. + П) = М(^ + q)2 - (М& + q))2 = М(^ + 2^q + q2) - - (Л/^ + Л/q)2 = М^2 + 24/^q + Мх\2 - (Л^)2 - 2Л^ЛЛ] - — (Л/q)2 = Dt, + Dx\ + 2cov(^, q). 8. Найдем дисперсию случайной величины qx=x^-^2, где х — произвольное число. По свойствам дисперсии получим Dqx= x2/)^— 2xcov(^, q) + Dr\.
(лава 5. Дискретные случайные величины 99 Как функция от х дисперсия Рт]х представляет собой ква- дратный трехчлен. Но дисперсия любой случайной величины не может быть меньше нуля, так что />пх > 0 для любого х. Поскольку > 0, то дискриминант уравнения Dr]x = 0 должен быть неположителен, т.е. [covG;, n)]2- < О или |cov(^, т|)| < 9. Предположим, что дискриминант равен нулю, тогда урав- нение x2D^~ 2xcov(^, т]) + £>q = О имеет решение х0 и = 0. Это означает, что = с = const, т.е. величина постоянная, и случайные величины и г] связаны линейной функциональной зависимостью т| = х0£ - с, причем если коэффициент пропорциональности х0 положителен, то cov(^,T]) = Vo^ii, а если х0 отрицателен, то cov(£,t]) = -jDtJh] . Свойствами 1-5 удобно пользоваться при вычислении ко- вариации от сложных выражений. Например: cov(2£ + t), 3£-4т() =2cov(£, 3£—4t]) + cov(t], 3£-4т]) = = 6cov(£, £)-8cov(£, t]) + 3cov(t], £)-4cov(t], t,) = = 6D^—5cov(£, T|) —4Dx], Итак, ковариацию можно считать мерой зависимости слу- чайных величин, так как для независимых случайных величин ковариация равна нулю. Существенным недостатком ковариа- ции является то, что ее размерность совпадает с произведени- ем размерностей случайных величин. Естественно, желательно иметь безразмерную характеристику зависимости. Таковой яв- ляется коэффициент корреляции. Коэффициентом корреляции случайных величин £ и т| (с по- ложительными дисперсиями) называется число = cov(C, л) р Коэффициент корреляции является одной из важных мер зависимости случайных величин. Как следует из свойств ко- вариации, он принимает значения от -1 до +1, отражая как силу зависимости (по абсолютной величине), так и характер (положительная или отрицательная).
100 ЧАСТЬ I. Теория вероятностей' Чем ближе I р I к единице, тем с большим основанием мож- но считать, что £ и т] находятся в линейной зависимости, т.е. ко- эффициент корреляции характеризует не всякую зависимость, а только так называемую линейную вероятностную зависимость, которая заключается в том, что при возрастании одной случай- ной величины другая имеет тенденцию изменяться по линей- ному закону. Можно сказать, что коэффициент корреляции р отражает степень линейной зависимости случайных величин. С возрастанием Е, случайная величина г] имеет тенденцию к увеличению при р > 0 и к уменьшению при р < 0. Поэтому при р > 0 говорят о положительной корреляционной зависимости £ и П, при р < 0 — об отрицательной. Для независимых случайных величин коэффициент кор- реляции равен нулю. Если р = 0, то случайные величины на- зываются некоррелированными. Из независимости случайных величин следует их некоррелированность, но наоборот — не всегда. Для линейно зависимых величин, т.е. в случае ц = + Ь, где а и b — константы, коэффициент корреляции равен +1 при а > 0 и -1 при а < 0. Задача 6. Для пары случайных величин из задачи 3 вычис- лить ковариацию cov(^, rj). Решение. В предыдущей задаче уже было вычислено мате- матическое ожидание Mfy\ = 19/16. Используя полученные в решении задачи 3 частные законы распределения, получаем Л/£ = -1-1/4 + 0-1 /4 + 1-1 /2 = 1 /4 ; Мх\ = 11/4 + 2-3/4 = 7/4 и cov(^,Ti) = M(^Ti)-MVAf 11 = 7/16-1/4-7/4 = 0, чего и следовало ожидать вследствие независимости случайных величин. Задача 7. Случайный вектор (£, г]) принимает значения (0, 0), (1, 0), (—1, 0), (0, 1) и (0, —1) равновероятно (рис. 5.4). Вычислить ковариацию случайных величин £, и г). Показать, что они зависимы.
Глава 5. Дискретные случайные величины 101 1 о -1 —I---- ' ' |---———г ----------1---------; ♦.........♦..... ♦ 4-----------1....-.! ' 1" Рис. 5.4 Решение. Поскольку Р(£ = 0) = 3/5, Р(^ = 1) = 1/5, Р(£,= — 1) = = 1/5; Р(ц = 0) = 3/5, Р(ц = 1) = 1/5, Р(ц = -1) = 1/5, то Mt, = 3/5 • 0 + 1/5 • 1 + 1/5 (-1) = 0 и Мт\ = 0; = о • 0 • 1/5 + 1 • 0 • 1/5 - 1 • 0 • 1/5 + 0 • 1 • 1/5 - -0-1 -1/5 = 0. Получаем cov(^, г]) = _ = 0, и случайные вели- чины некоррелированы. Однако они зависимы. Пусть t, = 1, тогда условная вероятность события {ц = 0} равна Р(г] = 0 | t, = 1) = 1 и не равна безусловной Р(ц = 0) = 3/5, или вероятность со- вместного появления {^ = 0, г] = 0} не равна произведению вероятностей: P(t, = 0, т| = 0) = 1/5 * Р(^ = 0)Р(я = 0) = 9/25. Следовательно, и т| зависимы. Задача 8. Случайные приращения цен акций двух компа- ний за день и г] имеют совместное распределение, заданное таблицей: к п -1 +1 -1 0,3 0,2 +1 0,1 0,4 Найти коэффициент корреляции. Решение. Прежде всего вычислим А/^т] = 0,3 - 0, 2 - 0,1 + + 0,4 = 0,4. Далее находим частные законы распределения и ц:
102 ЧАСТЬ I. Теория вероятное^ 5 п -1 + 1 А -1 0,3 0,2 0,5 +1 0,1 0,4 0,5 р. 0,4 0,6 1,0 Определяем = 0,5 - 0,5 = 0; Мт\ = 0,6 - 0,4 = 0,2; DE, = 1 = 1 — 0,22 = 0,96; cov(£, д) = 0,4. Получаем 0,4 р= h ----«0,408. 717096 Задача 9. Случайные приращения цен акций двух компаний за день имеют дисперсии £%,= 1 и Z>r| = 2, а коэффициент их корреляции р = 0,7. Найти дисперсию приращения цены порт- феля из 5 акций первой компании и 3 акций второй компании. Решение. Используя свойства дисперсии, ковариации и определение коэффициента корреляции, получаем Z)(5^ + 3r!) = 52Z>^+32Z>n + 2-5-3p7^7^n = = 25-14-9-2 + 30-0,7-1-72 «72,7. Замечание. Дисперсия приращений цены портфеля акций часто используется на практике как мера риска вложений: чем больше дисперсия, тем больше риск. Поэтому оценка данной величины имеет важное значение для инвесторов. 5.8. Условные распределения и математические ожидания (дискретный случай) Пусть на одном и том же пространстве элементарных ис- ходов Q заданы две случайные величины Е, и г|. Условным законом распределения случайной величины £ при условии т] = у называется любое соотношение, ставящее в со- ответствие значениям случайной величины £ условные вероят- ности ИХ ПРИНЯТИЯ При УСЛОВИИ Г| = у. Рассмотрим здесь случай дискретных случайных величин Е) и г|, принимающих значения xt (i = 1, 2, ...) и (/ = L 2, ...)
Глава 5. Дискретные случайные величины ЮЗ соответственно. Тогда условное распределение £ при условии т] = у ставит в соответствие значениям х. вероятности = Л = У, ) = р^ = у.} При этом предполагается, что Р(г\ = уу) > 0. Если случайные величины независимы, то их условные рас- пределения совпадают с исходными, и значение одной величи- ны не влияет на распределение другой. Условной функцией распределения случайной величины £ при условии г| = у называется функция, ставящая в соответствие любому числу х условную вероятность события < х} при ус- ловии г| = у. В дискретном случае получаем: Г, , I , D/£ I х Л^<Х,Т1 = у.) (х I у,) = Р(6, < X | л = у,,) =--- Р(т\ = у/) Условным математическим ожиданием случайной величи- ны при условии т] = у называется математическое ожидание условного распределения £, при условии л = у. В дискретном случае получаем: | л = У/) = 52Х'Р^Х'1 У)). i Аналогичным образом можно определить условную дис- персию. Функцией регрессии случайной величины £, по л называется Функция, ставящая в соответствие числу у условное математи- ческое ожидание £, при условии л = у. Фул(у) = ЛГ(^|л = у) • Функция регрессии определена только на области возмож- ных значений л- На практике обычно невозможно точно предсказать значе- ние одной случайной величины на основе знания другой, однако можно сделать это «в среднем». Функция регрессии как раз и ха- рактеризует среднее значение одной (неизвестной) величины при известном значении другой. В случае если разброс возможных значений не очень велик, это может принести большую пользу. Условным математическим ожиданием по л называется случайная величина, равная ф^(л), которая обозначается А/(^|л).
104 ЧАСТЬ I. Теория вероятностей Условное математическое ожидание обладает следующими свойствами: 1) Af(c|r|) = с; 2) М(а^ 4- £>|т|) = аЛ/(^|т|) + й; 3) + ^|п) = Ш,1п) + Л/(^|П); 4) = л/[М(^|п)]; 5) Л/|/(ОЛ(п)1п] = Л(п)М/Ю1п], где/Ю и Л(п) - произволь- ные функции от случайных величин Е, и rj; 6) Л7(£,|г|) = М(^), если £ и т] независимы. Задача 10. Распределение двумерной случайной величины задано таблицей: п $ 1 3 4 8 3 0,15 0,06 0,25 0,04 6 0,30 0,10 0,03 0,07 Найти условное распределение и условное математическое ожидание д при = 1. Решение. Условное математическое ожидание равно М(Т]\^ = Х') = y,P(yl + Из условия задачи найдем распределение составляющих г] и £, (последний столбец и последняя строка таблицы): П $ 1 3 4 8 А 3 0,15 0,06 0,25 0,04 0,50 6 0,30 0,10 0,03 0,07 0,50 Л 0,45 0,16 0,28 0,11 1,00 Так как PJx,) = P(xt,yl) + P(x},y2) = 0,15 + 0,30 = 0,45, то ус- ловные вероятности находятся по формулам ws = l, = = + 1 1 Л<л,) 0,45 3 " 1 Р((х,) 0,45 3 а искомое условное математическое ожидание равно 1 2 Л/(т]|^ = 1) = 3 - Ч- 6 - = 5.
Глава 5. Дискретные случайные величины Ю5 Задачи для самостоятельного решения Теоретические задачи 1. Докажите, что для случайной величины распределенной по закону Пуассона с параметром X, математическое ожидание = X, а дисперсия = X . 2. Докажите, что для случайной величины распределенной по закону Бернулли с параметрами пир, математическое ожидание = пр , а дисперсия = пр(\ - р). 3. Докажите, что для случайной величины распределенной по геометрическому закону с параметром р, математическое ожи- дание М£ = — , а дисперсия = -- f . Р Р Вычислительные задачи 4. Монету подбросили 3 раза. Найти распределение вероятностей числа появлений герба. 5. Вероятность, что лотерейный билет окажется выигрышным, равна 0,1. Покупатель купил 5 билетов. Найти распределение числа выигрышей у владельца этих 5 билетов. 6. Три стрелка с вероятностями попадания в цель при отдельном выстреле 0,7, 0,8 и 0,9 соответственно делают по одному вы- стрелу. Найти распределение вероятностей общего числа по- паданий. 7. Два стрелка поражают мишень с вероятностями 0,8 и 0,9 соот- ветственно (при одном выстреле). Найти распределение общего числа попаданий в мишень, если первый стрелок выстрелил один раз, а второй — два раза. 8. Два станка выпускают детали с вероятностями брака 0,01 и 0,05 соответственно. В выборке одна деталь выпущена первым стан- ком и две - вторым. Найти распределение числа бракованных деталей в выборке. 9. Прибор комплектуется из двух деталей, вероятность брака для первой детали — 0,1, а для второй — 0,05. Выбрано 4 прибора. Прибор считается бракованным, если в нем есть хотя бы одна бракованная деталь. Найти распределение числа бракованных приборов среди выбранных. Ю. Стрелок поражает мишень с вероятностью 0,7 при одном вы- стреле. Стрелок стреляет до первого попадания, но делает не более 3 выстрелов. Найти распределение числа выстрелов.
106 ЧАСТЬ I. Теория вероятностей' ___ —a-gga—g=ssggss., ' ————s --- , .. 1 - i --дд-=д===—дд——-=ам 11. Монета подбрасывается до тех пор, пока герб не выпадет 2 раза, но при этом делается не более 4 бросаний. Найти рас- пределение числа подбрасываний. 12. С конвейера поступило N деталей. Вероятность брака для каж- дой детали равна р. Детали проверяют одну за другой, пока не наберут М годных или пока они не кончаются. Найти распре- деление числа проверенных деталей, если: a) N = 4, р = 0,1, М = 2; б) N = 5, р = 0,1, М = 3; в) N = 6, р = 0,05, М = 3; г) N = 6, р = 0,2, М = 2; д) N = 6, р = 0,1, М = 2. 13. Среди N деталей — М нужного размера. Детали извлекают по- очередно, пока не найдут К деталей нужного размера или пока не будет сделано L проб. Найти распределение числа извлечен- ных деталей, если: a) У = 10, М = 3, К = 2, L = 4; б) N = 12, Л/= 6, К= 2, L = 5; в) У = 13, М = 6, К = 3, L = 5; г) У = 12, М = 7, К= 2, L = 5; д) У = 8, М= 3, К = 2, L = 5; е) У = 10, М = 4, К = 2, L = 5; ж) N = 10, М = 5, К = 2, L = 4. 14. Среди 5 ключей два подходят к двери. Ключи пробуют один за другим, пока не откроют дверь. Найти распределение числа опробованных ключей. 15. Среди 6 ключей три подходят к двери. Ключи подбираются до тех пор, пока дверь не будет открыта. Найти распределение числа опробованных ключей. 16. Курс акции в течение дня торгов может подняться или опу- ститься на один пункт, либо остаться неизменным (все три ва- рианта равновероятны). Найти распределение изменения курса акции: а) за 2 дня; б) за 3 дня. 17. Курс акции в течение дня торгов может подняться на один пункт с вероятностью р, опуститься на один пункт с вероят- ностью г либо остаться неизменным с вероятностью s. Найти распределение изменения цены акции за 2 дня. Вычислить ма- тематическое ожидание. Решить задачу, если: а) р = 0,6, г = 0,3, 5 = 0,1; б) р = 0,5, г = 0,4, 5 = 0,1; в) р = 0,7, г = 0,2, 5 = 0,1. 18. В телеигре игроку задают вопросы. Если игрок правильно от- вечает на вопрос, ему задают следующий; если неправильно, то игрок выбывает из игры. Всего задается не более трех во- просов. Вероятность ответить на первый вопрос равна 0,9; на второй - 0,3; на третий - 0,1. Найти распределение числа пра- вильных ответов и математическое ожидание выигрыша, если за один правильный ответ платят 100 руб., за два — 400 руб. и за три - 1000 руб. 19. На викторине задаются 3 вопроса. Вероятность правильно от- ветить на первый — р, на второй — г, на третий — 5. После
Глава 5. Дискретные случайные величины 107 неправильного ответа игрок выбывает из игры. Найти распре- деление числа правильных ответов. Вычислить математическое ожидание. Решить задачу, если: а) р = 0,7, г = 0,6, 5 = 0,3; б) р = 0,8, г = 0,4, 5 = 0,1. 20. На викторине задаются 3 вопроса. Вероятность правильно от- ветить на первый — 0,7, на второй — 0,5, на третий — 0,2. После неправильного ответа игрок выбывает из игры. Найти распределение числа заданных вопросов. Вычислить математи- ческое ожидание. 21. На викторине задаются 4 вопроса. Вероятность правильно от- ветить на первый — р, на второй — г, на третий — 5, на четвер- тый — w. После неправильного ответа игрок выбывает из игры. Найти распределение числа правильных ответов. Вычислить ма- тематическое ожидание. Решить задачу, если: а) р - 0,9, г = 0,8, 5 = 0,4, w = 0,2; б) р = 0,9, г = 0,8, 5 = 0,3, w = 0,2; в) р = 0,9, г - 0,7, 5 = 0,4, w = 0,2. 22. В офисе проводится собеседование с N кандидатами на некото- рую должность (по очереди). Если подходящий человек найден (принято решение о приеме его на работу), то с оставшимися кандидатами собеседование не проводится. Вероятность того, что кандидат подходит, равна р. Найти распределение числа канди- датов, с которыми беседовали, и его математическое ожидание, если: a) N = 4, р = 0,2; б) N = 5, р = 0,3; в) N = 6, р = 0,2. 23. В игровом автомате три окошка, в которых случайным образом появляются цифры от 0 до 9, равновероятно и независимо друг от друга. Если две цифры совпали, игрок получает 10 руб., если все три — 100 руб. Чтобы начать игру, он платит 5 руб. Найти распределение выигрыша игрока и его математическое ожидание. 24. В игровом автомате три окошка, в которых случайным образом появляются 7 цветов, равновероятно и независимо друг от дру- га. Если два цвета совпали, игрок получает 20 руб., если три — 100 руб. Чтобы начать игру, он платит 10 руб. Найти распреде- ление выигрыша игрока. Вычислить математическое ожидание. 25. В экзаменационном билете три задачи. Вероятность правильного решения студентом первой задачи равна р, второй — г и тре- тьей — 5. Найти распределение числа правильно решенных задач и найти его математическое ожидание, если: а) р = 0,8, г = 0,7, 5 = 0,3; б) р = 0,9, г = 0,5, 5 = 0,3; в) р = 0,8, г = 0,6, 5 = 0,3. 26. Фирма участвует в трех независимых проектах. Вероятность успешного завершения первого равна р, второго — г, третьего — 5. Найти распределение числа успешных проектов. Вычислить
108 ЧАСТЬ I. Теория вероятностей математическое ожидание. Решить задачу, если: а) р = 0,9, г = 0,7, 5 = 0,6; б) р = 0,8, г = 0,7, 5 =0,5. 27. Фирма участвует в четырех независимых проектах. Вероятность успешного завершения первого и второго равна 0,8, а третьего и четвертого — 0,7. Найти распределение числа успешных про- ектов. Вычислить математическое ожидание. 28. В папке находятся 4 документа: два заявления и две анкеты. В заявлении могут быть ошибки с вероятностью 0,1. В анкете могут быть ошибки с вероятностью 0,2. Найти распределение числа документов с ошибками в папке и его математическое ожидание. 29. Стрелок стреляет по движущейся мишени до первого попа- дания в нее, причем успевает сделать не более 4 выстрелов. Найти математическое ожидание и дисперсию числа сделан- ных выстрелов, если вероятность попадания при каждом вы- стреле равна 0,6. 30. Найти математическое ожидание и дисперсию суммы выпав- ших очков при бросании четырех игральных костей. 31. На станцию обслуживания поступают заявки в соответствии с распределением Пуассона с параметром X = 2 (в единицу времени). Мощность станции позволяет обслуживать не более 2 заявок в единицу времени. Найти вероятность того, что в те- чение данной единицы времени: а) станция не справится с по- током заказов и образуется очередь; б) станция обслуживания будет простаивать или работать не на полную мощность; в) на станции обслуживания не образуется очередь. Решить задачу без учета заявок, возможно, оставшихся с прошлой единицы времени. 32. В процессе производства изделие высшего качества удается получить только с вероятностью 0,2. С конвейера берутся на- угад детали до тех пор, пока не будет взято изделие высшего качества. Найти математическое ожидание числа проверенных изделий. 33. Сдача экзамена по математике производится до получения по- ложительного результата. Шансы сдать экзамен остаются неиз- менными и составляют 25%. Найти математическое ожидание числа попыток сдачи экзамена. 34. ОТК должен проверить 100 комплектов, состоящих из 4 детали каждый. Найти математическое ожидание числа комплектов, состоящих только из стандартных деталей, если каждая деталь стандартна с вероятностью 0,8.
Глава 5. Дискретные случайные величины 109 35. Игральная кость подбрасывается до а) второго; б) третьего по- явления грани с номером «три». Найти среднее число подбра- сываний. 36. В каждой упаковке товара имеется одна из N различных на- клеек (равновероятно). Вычислить математическое ожидание и дисперсию числа упаковок, сколько понадобится купить, чтобы собрать все наклейки. Решить задачу, если: a) N = 3; б) #= 4; в) #= 5. 37. Закон распределения случайной величины х имеет вид: 0 1 2 3 р 1/8 3/8 3/8 1/8 Найти функцию распределения случайной величины вычис- лить ее математическое ожидание, дисперсию и среднее квадра- тическое отклонение. Вычислить вероятность Р{—1 < £ < 3/2}. 38. Закон распределения случайной величины имеет вид: £ -1 2 3 5 р 1/4 1/2 1/8 1/8 Найти функцию распределения случайной величины £, вычис- лить ее математическое ожидание, дисперсию и среднее квадра- тическое отклонение. Вычислить вероятность Р{5/2 < £ < 5}. 39. Закон распределения случайной величины £ имеет вид: 5 0 1 3 4 р 1/9 2/9 1/6 1/2 Найти функцию распределения случайной величины вычис- лить ее математическое ожидание, дисперсию и среднее квадра- тическое отклонение. Вычислить вероятность Р{ 1/2 < £ < 7/2}. 40. Закон распределения случайной величины £ имеет вид: 5 -2 -1 1 3 р 1/7 3/7 2/7 1/7 Найти функцию распределения случайной величины вычис- лить ее математическое ожидание, дисперсию и среднее квадра- тическое отклонение. Вычислить вероятность Р{-3/2 < £ < 2}.
по ЧАСТЬ I. Теория вероятностей 41. Совместное распределение £ и т| задано следующей таблицей: £ п 0 1 0 £ 4 --С 2 1 £ 4 С Найти С, при котором случайные величины независимы. 42. Совместное распределение и ц задано следующей таблицей: t. П -1 1 0 1 3 с £ 6 2 1 6 + с I 3 Найти С, при котором случайные величины независимы. 43. Совместное распределение £ и ц задано следующей таблицей: Е. п -1 1 -1 £ 3 с 1 --С 2 £ 6 Найти С, при котором случайные величины независимы. 44. Совместное распределение £ и ц задано следующей таблицей: Е, П 0 1 1 1 3 + с £ 4 2 £ 6 - - С 4 Найти С, при котором случайные величины независимы.
Глава 5. Дискретные случайные величины 1 ] 1 45. Совместный закон распределения пары (£, т|) задан таблицей. ’I -1 0 1 0 1 10 J_ 5 _1_ 5 1 £ 5 1 10 £ 5 Найти распределение вероятностей случайной величины £ — ц и вычислить cov(£ + т|, £ — т|). Исследовать вопрос о зависи- мости случайных величин £ и ц. 46. Совместный закон распределения пары (£, г|) задан таблицей. $ -1 0 1 -1 1 12 4 _1_ 6 1 4 1 12 J_ 6 Найти закон распределения вероятностей случайной величины ^т| и вычислить cov(2^ - Зт|, Е, + 2т|). Исследовать вопрос о за- висимости случайных величин и т|. 47. Совместный закон распределения пары (^, т|) задан таблицей. ’I 0 1 2 “1 9 6 £ 3 1 9 1 18 2 9 Найти закон распределения вероятностей случайной величины £ + т| и вычислить cov(2r| + £, т] + О- Исследовать вопрос о зависимости случайных величин и т|. 48. Совместный закон распределения пары (£, т|) задан таблицей. -1 0 2 0 2 8 ]_ 6 £ 6 1 1 12 1 12 3 8
112 ЧАСТЬ I. Теория вероятностей Найти закон распределения вероятностей случайной величины £ + т| и вычислить cov(£ — т|, + т|). Исследовать вопрос о зависимости случайных величин £ и ц. 49. Совместный закон распределения пары (^, rj) задан таблицей t, п -1 1 2 -1 6 J_ 6 6 1 1 18 1 18 7 18 Найти закон распределения вероятностей случайной величины ^г| и вычислить cov(2£ + т|, — rj). Исследовать вопрос о за- висимости случайных величин £ и ц. 50. Совместное распределение случайных величин и rj задано таблицей п -2 0 3 0 0,1 0,2 0,2 1 0,1 0,1 0,3 Зависимы ли эти случайные величины? Найти распределение их суммы. Вычислить cov(r|, Т| + 4£). 51. Совместный закон распределения пары т| задан таблицей 4 П -2 -1 0 -1 0,15 0,1 0,05 2 0,4 0,2 0,1 Зависимы ли и rj? Найти распределение их разности. Вычислить cov(^ + 5т|, 2^ — 7г|). 52. Совместный закон распределения пары rj задан таблицей 4 п -1 0 2 0 1/7 2/7 1/7 1 1/7 1/7 1/7 Зависимы ли и rj? Найти распределение их разности. Вычислить cov(^ - Зг|, Г| + 6^).
Глава 5. Дискретные случайные величины 113 53. Совместный закон распределения пары £, т] задан таблицей 5 п -1 0 2 -2 2/15 1/15 2/15 1 4/15 1/15 2/5 Зависимы ли £ и q? Н Вычислить cov(4^ — q, 2q • (айти распределение их разности. +• О- 54. Совместный закон распределения пары £, т] задан таблицей п 1 2 4 0 1/6 1/6 1/12 1 1/4 1/12 1/4 Зависимы ли и г|? Найти распределение их разности. Вычислить cov(2^ — rj, rj — 3^). 55. Случайные приращения цен акций двух компаний за день £ и т| имеют совместное распределение, заданное таблицей “1 + 1 “1 0,2 0,1 +1 0,2 0,5 Найти коэффициент корреляции. 56. Случайные приращения цен акций двух компаний за день £ и г| имеют совместное распределение, заданное таблицей. -1 + 1 -1 0,4 0,1 +1 0,1 0,4 Найти коэффициент корреляции. 57. Случайные приращения цен акций двух компаний за день име- ют дисперсии = 1,21 и Dr\ = 2,56, а коэффициент их корре- ляции р = 0,5. Найти дисперсию приращения цены портфеля из: а) 4 акций первой компании и 6 акций второй компании; б) 7 акций первой компании и 3 акций второй компании; в) 9 акций первой компании и 1 акции второй компании. 58. Случайные приращения цен акций двух компаний за день име- ют дисперсии = 2 и Z>r| = 3, причем они некоррелированы.
114 ЧАСТЬ I. Теория вероятностей Инвестор намеревается приобрести 10 акций. Сколько акций каждой компании он должен купить, чтобы минимизировать риск вложений, т.е. дисперсию приращения цены портфеля? 59. Случайные приращения цен акций двух компаний за день име- ют дисперсии = 1 и 2>г) = 3, причем они некоррелированы. Инвестор намеревается приобрести 12 акций. Сколько акций каждой компании он должен купить, чтобы минимизировать риск вложений? 60. Случайные приращения цен акций двух компаний за день име- ют дисперсии Л£ = 4и2>п = 9,аих коэффициент корреляции 0,5. В каких долях следует разделить капитал при вложении в акции, чтобы минимизировать риск? 61. Случайные приращения цен акций двух компаний за день име- ют дисперсии = 1 и Dr| = 4, а их коэффициент корреляции 0,7. В каких долях следует разделить капитал при вложении в акции, чтобы минимизировать риск? 62. По таблице совместного распределения из задачи 45: а) найти условное распределение £ при условии ц = 0; б) найти услов- ное распределение ц при условии £ = 0; в) функцию регрессии £ по ц; г) функцию регрессии ц по 63. По таблице совместного распределения из задачи 46: а) найти условное распределение £ при условии ц = — 1; б) найти услов- ное распределение ц при условии £ = 1; в) функцию регрессии £ по ц; г) функцию регрессии ц по £. 64. По таблице совместного распределения из задачи 47: а) найти условное распределение £ при условии ц = 2; б) найти услов- ное распределение ц при условии £ = -1; в) функцию регрес- сии £ по ц; г) функцию регрессии ц по £. 65. Две независимые случайные величины и имеют распреде- ления Пуассона с параметрами и Х2 соответственно. Найти условное распределение при условии, что т] = ^ + £2 = л, п > 0, и функцию регрессии по ц.
ГЛАВА 6 НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ 6.1. Плотность и функция распределения непрерывной случайной величины Случайная величина £ называется непрерывной, если ее функ- ция распределения F^x) = < х) непрерывна. Множество значений непрерывной случайной величины несчетно и обыч- но представляет собой некоторый промежуток (конечный или бесконечный). Функция распределения непрерывной случай- ной величины обладает теми же основными свойствами, что и в дискретном случае (§ 5.2). Случайная величина называется абсолютно непрерывной, если существует неотрицательная функция р^х), такая, что при любых х функцию распределения F^x) можно представить в виде интеграла Цх) = Р&<х)= f Функция рк(х) называется плотностью распределения. Имеют место следующие свойства; 1. р^х) > 0. 2. В точках непрерывности плотность распределения равна производной функции распределения: pt(x) = ^'(x). 3. Интеграл по всей числовой прямой от плотности распре- деления равен единице; Г pAx)dx = \.
116 ЧАСТЬ I. Теория вероятностей 4. Плотность распределения определяет закон распределе- ния случайной величины, так как определяет вероятность по- падания случайной величины на любой полуинтервал [а, Ь): ь P{f,e[a,b)} = P{a<f,<b} = F.(b)-F^a) = f p^t)dt. а 5. Вероятность того, что непрерывная случайная величи- на примет конкретное значение а, равна нулю: Р(^ = а) = 0. Поэтому справедливы следующие равенства: P{a<K<b] = P{a<k<b} = P{a<k<b} = P{a<k<b} = F^b)-FK{a). Доказательство. 1. Следует из определения. 2. Следует из взаимосвязи между производной и интегра- лом. ОО X 3. J*Pt(x)dx= lim Jpi(x)dx = lim/^(x) = l. -00 -oo 4. Используем формулу Ньютона—Лейбница. 5. Представим событие А — {со: £(со) = а} в виде произведе- ния Р| {а < £ < а + 1/л} и воспользуемся аксиомой непрерыв- Л=1 ности (§ 3.7), тогда в+- Р(Л) = Р(^ = а) = lim Р(а < Е, < а + 1 /л) = lim Г а (х)dx = 0. Л-+ОО л-»эо J а Заметим, что плотность может быть разрывна в некоторых точках, где ее можно определить произвольным образом: это никак не повлияет на функцию распределения и другие чис- ловые характеристики. Поэтому можно считать, что множество значений случайной величины совпадает с промежутком, на котором плотность распределения отлична от нуля. График плотности распределения называется кривой распре- деления. Площадь, ограниченная кривой распределения и осью абсцисс, как следует из свойства 3, равна единице. Тогда значе- ние функции распределения F^x) в точке х0 геометрически есть площадь, ограниченная кривой распределения и осью абсцисс и лежащая левее точки х0 (рис. 6.1).
Глава 6. Непрерывные случайные величины 117 Задача 1. Плотность распределения непрерывной случайной величины имеет вид: Р^х) = О, Сх2, х£[0,2]; хе [0,2]. Определить константу С, построить функцию распределе- ния 7^(х) и вычислить вероятность Р(—1 <^< 1). 00 Решение, Константа С находится из условия J p^(x)dx = l. В результате имеем ос 2 з 2 1 = J p((x)dx = f Cx2dx = C— -ос О 3 о 8С 3 ’ откуда С = 3/8. Чтобы построить функцию распределения 7^(х), отметим, что отрезок [0, 2] делит область значений аргумента х (чис- ловую ось) на три части: (—оо, 0), [0, 2], (2, »). Рассмотрим каждый из этих промежутков. В первом случае (когда х < 0) вероятность события {£, < х} вычисляется так: (х) = Р(£ < х) = f рк (t)dt = fodl = О, так как плотность Е, на полуоси^—», 0) равна нулю. Во втором случае X О х ~ х з ^(Х)= J P,(t)dt = f p^(t)dt+f pf(t)dt = G + t2dt = ^—. -ос -ос 0 6 О
118 ЧАСТЬ I. Теория вероятностей Наконец, в последнем случае, когда х > 2, F(. ^fPf. ^dt = fpt ^dt +fpt. ^dt + f p(. ^>dt = ° + о f{2dt = -oo —oo 0 2 0 = 0 + 14-0 = 1, так как плотность f^x) обращается в нуль на полуоси (2, оо). Итак, получена функция распределения ^(х) = 8 ’ 1. х<0; 0<х<2; х>2. Следовательно, Р{-1 < £ < 1} = F(l) - F(-1) = 1 / 8 - 0 = 1 / 8. 6.2. Числовые характеристики непрерывной случайной величины Математическое ожидание для непрерывно распределенных случайных величин определяется по формуле М^= f xp^(x)dx, при этом интеграл, стоящий справа, должен абсолютно схо- диться. Если ф(х) — некоторая функция и £, имеет плотность р(х), то математическое ожидание случайной величины ф(^) вычис- ляется по формуле М<№)= J tp(x)p(x)dx, если интеграл абсолютно сходится. Дисперсия непрерывной случайной величины вычисляется по формуле (x-Mk)2p(x)dx,
Глава 6. Непрерывные случайные величины 119 или, как и в дискретном случае, по формуле -(Mt)1, где М^2 = Jx2p(x)dx. -ос Все свойства математического ожидания и дисперсии, кова- риации и коэффициента корреляции, приведенные в гл. 5 для дискретных случайных величин, справедливы и для непрерыв- ных случайных величин. Задача 2. Для случайной величины £ из задачи 1 вычислить математическое ожидание и дисперсию. Решение. = j xp((x)dx = J x-0dx + -ос 3z ос п 4 f 2 J f 3 X - I x x dx+ I x-0dx =- 4 4 8 4 3 2’ Далее oo 2 i 5 i n iza2 Г 2 / \J 3 Г о 2j 3 X 12 Mf, — I x p('(x)dx = -I x -x dx =------------=—, и значит, -оо О О Z^ = ^2-(W =у-[|1 =0,15. В качестве других характеристик, описывающих свойства распределения случайной величины, используются начальные и центральные моменты. Начальным моментом к-го порядка называется математиче- ское ожидание к-й степени случайной величины: ак = М^к. Очевидно, что = аг Центральным моментом к-го порядка ц* называют математи- ческое ожидание к-й степени отклонения случайной величины от ее математического ожидания: ц* = Л/(^ — Mt)k. Из определения следует, что ц2 = — М^)2 = D^. Справедливы формулы: ^0 ~ 1 > Ц, = 0; ц2 = а2 - а2; = а3 — Заа2 + 2а3; Ц4 = а4 + 6а2а2 — 4аа3 — За4, ...
120 4 ЧАСТЬ I. Теория вероятностей Если распределение симметрично относительно математик ческого ожидания, то все центральные моменты нечетного по- рядка равны нулю. Величина р. = ц3/о3 называется коэффициентом асимметрии случайной величины Он характеризует «скошенность» рас- пределения по отношению к математическому ожиданию. Для- симметричных распределений ц3 = 0, поэтому коэффициент асимметрии равен нулю. Для распределений скошенных влево Р < 0, для скошенных вправо р > 0. Величина yt = ц4/а4 — 3 называется коэффициентом эксцесса (или просто эксцесс) случайной величины Он характеризует «сглаженность», или «крутость» распределения по отношению к нормальному, так как для нормального закона распределения щ/ст4 = 3 и, следовательно, у. = 0. Для более островершинных распределений у4>0, для менее островершинных у.<0 (рис. 6.2). Кроме начальных и центральных моментов на практике применяются так называемые абсолютные моменты, определя- емые формулами а\= Л/Ц I*, = МI— Mt I*. Очевидно, что абсолютные моменты четного порядка со- впадают с обычными моментами. Чаще других применяется 1-й абсолютный момент 11',= Л/Ц — Mt, I, называемый средним абсолютным отклонением. Для непрерывной величины модой Xmod называют точку локального максимума функции плотности распределения ве- роятностей. Если имеется один максимум, то распределение
(лава 6. Непрерывные случайные величины 121 называется унимодальным, более одного максимума — мульти- модальным (в частности, распределение, имеющее две моды, называется бимодальным). Распределение, имеющее минимум плотности, называется антимодальным. Медианой непрерывной случайной величины £ называют такое ее значение что Р(Е, < Xmed) = /^ > = 1/2. Геометрически медиана — это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам (рис. 6.3). Математическое ожидание, мода, медиана, начальные и центральные моменты являются основными числовыми харак- теристиками случайной величины. На практике числовыми ха- рактеристиками часто пользуются для приближенной замены одного закона распределения другим, но так, чтобы сохрани- лись неизменными несколько важнейших моментов. 6.3. Производящая функция моментов Производящей функцией моментов случайной величины Е, на- зывается функция параметра t, равная математическому ожида- нию функции е*-: m^t) = Met-. Наиболее важным ее свойством является то, что произво- дящая функция m^t) содержит в себе сведения обо всех на- чальных моментах («производит» моменты). Действительно, т/(0) = _ 0 = ME, = а,. В общем случае для любого к получаем m5U)(0) = Л/^*е^|( = 0= ак, т.е. к-я производная от про- изводящей функции при t = 0 равна начальному моменту к-го порядка, а любой центральный момент можно выразить через начальные моменты.
122 ЧАСТЬ I. Теория вероятностей Свойства производящей функции следующие: 1. mc, + a(f) = МеЛс£’ + а} = mjctje*. 2. Производящая функция суммы независимых случайных величин равна произведению производящих функций этих ве- личин. п Действительно, пусть £ = тогда = Мехр 52^,. = AfJJexp (/$,,) = JjAfexp (/$,,) = PJzw^(/). По производящей функции можно определить функцию распределения, содержащую все сведения о случайной вели- чине. В этом смысле производящая функция и функция рас- пределения являются эквивалентными обобщающими характе- ристиками случайной величины. К сожалению, производящая функция моментов может быть определена не при всех значе- ниях параметра (или вообще определена только в нуле). б.д. Примеры непрерывных случайных величин Равномерное распределение. Непрерывная случайная вели- чина £ имеет равномерное распределение на отрезке [a, Z>], если плотность распределения р^(х) сохраняет постоянное значение на этом промежутке: т—, хе [а, Ь], Ь — а О, х(£[а,Ь]. Графики функции и плотности равномерного распределе- ния показаны на рис. 6.4. Функция распределения F^x) равномерно распределенной случайной величины равна: ^(х) = О, х-а Ь-а' 1, х<а, а <х<Ь, х>Ь;
Рис. 6.4. Функция и плотность равномерного распределения Математическое ожидание и дисперсия соответственно рав- a + b, (Ь-а)2 ны: = Dt,= . В силу симметричности равномерного распределения отно- сительно математического ожидания асимметрия равна нулю, Xmed = а моды равномерное распределение не имеет. Для определения эксцесса вычислим четвертый централь- 1 г. Ь + а.4, (b-а)4 ~ ныи момент: ц, = ----I (х-----) dx = ---— . Отсюда эксцесс b-aJ 2 80 а равен у^= - 3 = -1,2. Вероятность попадания случайной величины £, на отрезок c-d [с, d\ с [а, 6] равна Р(с <^<d) = F(d) - F(c) = -, т.е. зави- b-a сит только от длины отрезка и не зависит от того, где этот от- резок расположен. Таким образом, равномерное распределение реализует принцип геометрической вероятности при бросании точки на отрезок [a, Z»]. Показательное (экспоненциальное) распределение. Непрерыв- ная случайная величина £, принимающая неотрицательные зна- чения, имеет показательное распределение с параметром X > 0, если плотность распределения вероятностей случайной вели- чины равна Р^х) = х>0, 0, х<0.
124 ЧАСТЬ I. Теория вероятностей Функция показательного распределения имеет вид = 1-е кх, х>0, О, х<0. Графики плотности и функции стандартного показательно- го распределения представлены на рис. 6.5 (при X = 1), общий вид — на рис. 6.6. Рис. 6.5 Рис. 6.6 Математическое ожидание и дисперсия равны: Л^= 1 D^ = -L. л л
125 Глава 6. Непрерывные случайные величины Действительно, имеем Mt = J ZX«rx'dr = I kt = z, dz = Xdr I = — T ze~*dz = о Ц = y (~ze z I “ + T <r<dz) = ; X „ X 1 1 00 1 Dt = Mt} - (Л^)2 = f fiker^dt - -L = JL f z2e-*dz - 4 J„ X2 X2 J X2 о 1 X2 ' 0 = 2------- X2 X2 Можно показать также, что ц3 = эксцесс у4= 6, A'mod= 0, Xmd = |1п2. Л 6 X3 ’ асимметрия 0^ = 2, Производящая функция моментов показательного распределения описывается форму- лой = -—- при t < X (в противном случае производящей функции не существует). Нормальное распределение (распределение Гаусса). Непре- рывная случайная величина называется распределенной по нор- мальному закону с параметрами а и ст2, если ее плотность рас- пределения /х 1 Pt(x) = —=е ст>/2л Множество случайных величин, распределенных по нор- мальному закону с параметрами а и ст2, обозначается через N(a, ст2). В частном случае, когда а = 0 и ст2 = 1, нормальное распределение называется стандартным, и класс таких случай- ных величин обозначается N(Q, 1). Функция распределения нормально распределенной случай- ной величины сту2л г„ (г-д)2 2^ dt. Графики плотности и функции стандартного нормального распределения представлены на рис. 6.7, в общем случае — на Рис. 6.8.
126 ЧАСТЬ I. Теория вероятностей Параметры нормального распределения суть математиче- ское ожидание = а и дисперсия = о2. Плотность нормального распределения симметрична отно- сительно х = ау поэтому Jmed = Xmod = = а. Асимметрия и эксцесс нормального распределения равны нулю. Плотность стандартного распределения равна 1 ф(х) = -=е 2 , л/2л
(лава 6. Непрерывные случайные величины 127 а функция распределения Ф(х) = -= Ге 2dt. 72л "х Такой интеграл не вычисляем аналитически, но функция Ф(х) связана с функцией Лапласа фо(*) = -7= fe 2dt V2nJ0 соотношением Ф(х) = ^+Ф0(х). В случае же произвольных значений параметров а и о2 функция распределения F^x) случайной величины Е, G N(a, ст2) связана с функцией Лапласа с помощью соотношения г. . 1 . (х-в') ^(*)=т+фо ---- • z a j Поэтому вероятность попадания нормально распределенной случайной величины Е, G N(a, ст2) на полуинтервал [ср с2) мож- но вычислять по формуле Р{^<с2} = Ф0^1-Ф0|^< I СТ J ( ст Напомним, что значения функции Лапласа затабулированы в табл. 2 приложения 2. Задача 3. Пусть задана случайная величина G N(l, 4). Вы- числить вероятность Р{0 < £, < 3}. Решение. Здесь а = 1 и ст = 2. Согласно указанной выше формуле />(0 < $ < 3) = Фо [^1] - Фо = Фо (1) - Фо(—0,5) = = Фо (1) + Фо (0,5) = 0,3413 + 0,1915 = 0,5328. Важными свойствами нормального распределения являются следующие: 1. Если и = АЕ, + В, где Е, е N(a, ст2), то г| е N(Aa + В, А2сЗ).
128 ЧАСТЬ I. Теория вероятностей В частности, случайная величина е N(a, ст2) может быть представлена в виде = а + где £,0 е МО, 1). 2. Сумма двух независимых нормально распределенных слу- чайных величин имеет нормальный закон распределения. При этом их математические ожидания и дисперсии суммируются. Производящая функция моментов нормального распределе- на^ ния имеет вид т^) = е г (существует при любом значении параметра t). Для центральных моментов любого порядка нормально рас- пределенной случайной величины можно вывести рекуррент- ное соотношение М*= (* “ Dct2^, позволяющее выражать моменты высших порядков через мо- менты низших порядков. Поскольку Pj = 0, все нечетные мо- менты нормального распределения равны нулю. Для четных моментов получаем следующие выражения: Ро= ь Ц2= ст2, ц4 = Зст4, ..., p2t= (2к - 1)!!ст2* Логарифмически нормальное (логнормальное) распределение случайная величина § имеет в том случае, когда ее логарифм имеет нормальное распределение. Соответственно Е, может быть представлена как показательная функция от нормально распре- деленной случайной величины. Для описания логнормального распределения используется различная параметризация и соот- ветственно по-разному выражаются математическое ожидание и дисперсия. Если = ае’’, r| G N(0, ст2), как это предполагается в [1], то М£ = ае°'/2 и D^ = a1e°1{ea‘ -1). Если = е11, г) G МО, ст2), что будем обозначать через е ехр{М^, ст2)}, то Л/^ = Ле°2/2 и £>£, = а2е°2 (е”1 -1), где А = е". Другие числовые характеристики: мода - Xmod = Ае~°2 ; медиана - %med = А; асимметрия — р^= (е°2 -1)2(е'2 +2); эксцесс — у^ = (е°2 - 1)(е3°2 4- Зе2°2 + 6е°! + 6). Из этих формул видно, что асимметрия и эксцесс лога-; рифмически нормального распределения всегда положительны
Глава 6. Непрерывные случайные величины 129 и тем ближе к нулю, чем ближе к нулю а. Мода и медиана стремятся к слиянию по мере стремления к нулю величины ст. Графики плотности и функции распределения при некото- рых значениях параметров представлены на рис. 6.9 (при А = 1, а = 1) и 6.10. Значения логарифмически нормальной случайной величины образуются как «случайные искажения» некоторого «истинного значения» А, которое является не средним значением, а меди- аной. Значения логарифмически нормальной случайной вели- чины оказываются характерными для многих конкретных фи- зических и социально-экономических ситуаций (размеры и вес 5- Теория вероятностей
130 ЧАСТЬ I. Теория вероятностей частиц, образующихся при дроблении; заработная плата работ- ника; доход семьи; размеры космических образований; долговеч- ность изделия, работающего в режиме износа и старения, и др.). Распределение Лапласа задается плотностью , X —*1х| Д>(х)—ув , , —оо < X < оо (двусторонняя показательная плотность). Функция плотности распределения симметрична относи- тельно нуля, т.е. четна, и поэтому математическое ожидание = 0. Дисперсия в два раза больше дисперсии случайной величины, распределенной по показательному закону: Действительно 2 X2 ’ РЕ, = - (Лф2 = | f x^'dx = kfx2e^dx = р- . Симметричная унимодальная функция плотности этого за- кона с острым максимумом в точке ноль иногда используется для описания распределений остаточных случайных компонент (ошибок) в моделях регрессионного типа. В силу симметрии имеем = Xmod = 0, = 0. Эксцесс равен у = 3. Графики плотности и функции стандартного распределения Лапласа представлены на рис. 6.11 (при X = 1), общий вид плотности — на рис. 6.12.
(Лава 6. Непрерывные случайные величины 131 Распределение Вейбулла может быть задано плотностью Р^х) = Хах“ ‘е и“, х>0, . “ а>0. О, х < О, Функция распределения имеет вид Цх) = х>0, х<0. Графики плотности и функции распределения Вейбулла при некоторых значениях параметров представлены на рис. 6.13 (а = 2, X = 1) и 6.14. Рис. 6.13
132 ЧАСТЬ I. Теория вероятностей Распределению Вейбулла подчиняется время безотказной работы многих технических устройств. В задачах этого профиля важной характеристикой является интенсивность отказа (ко- эффициент смертности) Х(7) исследуемых элементов возраста t, определяемый соотношением X(z) = _. ДдЯ распределения 1-Д(0 Вейбулла этот показатель принимает достаточно простой вид степенной функции: k(t) = 'ka.ta *. Если а = 1, то распределение Вейбулла превращается в по- казательное распределение, а если а = 2 — в так называемое распределение Рэлея. Математическое ожидание распределения Вейбулла = -1(1] = Х “Г 1ч— и дисперсия Z)^ = X \ «) Г(а) — гамма-функция Эйлера. где Мода имеет вид Xmod = О, а < 1; -- ! 1 1 “(1-----)“, а > 1; а медиана = 1п2 1/а В различных задачах прикладной статистики часто встреча- ются так называемые «усеченные» распределения. Например, налоговые органы интересуются распределением доходов тех лиц, годовой доход которых превосходит некоторый порог с0,
Глава 6. Непрерывные случайные величины 133 установленный законами о налогообложении. Эти распределе- ния приближаются распределением Парето. Распределение Парето задается функциями распределения и плотности (рис. 6.15, с0= 1, а = 2) (ча / ча+1 сп z ч а сп X со V х ) где а > 0, а х > с0 Функция плотности имеет вид монотонно убывающей кривой, выходящей из точки (с0, а/с0). Основные числовые характеристики этого распределения существуют не всегда, а лишь при соблюдении определенных требований к значению параметра а: ас0 математическое ожидание АЛ, = существует при а > 1; асо дисперсия /------ существует при а > 2; (а —1) (а-2) ( мода Xmod= с0 и медиана Amed = с0 2п существуют всегда; ас* момент к-го порядка М^к = —— существует при а > к. а-к Распределение Коши задается функцией плотности распре- деления
134 ЧАСТЬ I. Теория вероятностей --- г -------------------Ч F-- ......... / X С Р^Х)= -----— , 4 л(с +(х-а) ) где с > 0 — параметр масштаба и а — параметр сдвига, опре- деляющий значение моды и медианы. Функция распределения задается формулой , 1 1 х —а Л (х) = -+-arctg-. 2 к с Стандартное распределение Коши соответствует случаю а = О, с = 1. Для параметров а = 0, с = i графики приведены на рис. 6.16. Отметим два важных свойства (самовоспроизводимости) распределения Коши. 1. Если случайная величина £, имеет распределение Коши с параметрами с и а, то любая линейная функция Z>0 + bfi имеет распределение того же типа с параметрами с1 = I b{ I с и а' = b}a+bQ. 2. Если случайные величины ^2, ..., независимы и име- ют одинаковое распределение Коши, то среднее арифметиче- ское Е, = + ^2 + ... + Q/я имеет то же распределение Коши, что и Рис. 6.16
Глава 6. Непрерывные случайные величины 135 Задачи для самостоятельного решения Теоретические задачи 1. Случайная величина % имеет нормальное распределение с пара- 2 гт метрами а и а2. Показать, что величина —— нормально рас- пределена с параметрами 0 и 1. 2. Случайные величины £р £2, независимы и имеют одина- /де’", х>0, ковую функцию плотности распределения Р(х) = 4 [О, х < 0. Найти функцию и плотность распределения величин: а) п, = min{^ , б) n2 = тах{^ $2, £„}. 3. Случайные величины £р ^2, независимы и равномерно рас- пределены на отрезке [а, Ь]. Найти функции распределения и плотности величин т|, = min{^, £2, Q и r|2 = тах{^, £2, Q. Доказать, что Af(r|i + П2) = а + Ь. 4. Случайная величина распределена по закону Коши р(х)=— 1 + х Найти: а) коэффициент а; б) функцию распределения; в) веро- ятность попадания на интервал (—1, 1). Показать, что матема- тическое ожидание £ не существует. 5. Случайная величина подчинена закону Лапласа с параметром X (X > 0): р(х) = ае'^. Найти коэффициент а, математическое ожи- дание Mi. и дисперсию ZX;, вероятности событий {|^| < } и {|£| < < 3^}. 6. Найти , если £ имеет: а) нормальное распреде- ление с параметрами а и о2 ; б) показательное распределение с параметром X; в) равномерное распределение на отрезке [—1; 1]. 7. Случайная величина £ подчинена закону Симпсона на отрезке [~д, а], т.е. график ее плотности распределения имеет вид, по- казанный на рис. 6.17. Написать формулу для плотности рас- пределения, найти Mi. и
136 ЧАСТЬ I. Теория вероятностей 8. Случайная точка А имеет в круге радиуса R равномерное рас- пределение. Найти математическое ожидание и дисперсию расстояния р точки до центра круга. Показать, что величина р2 равномерно распределена на отрезке [О, 2Р]. 9. Найти производящую функцию моментов для: а) равномерно- го распределения на отрезке [а, />]; б) распределения Лапласа с параметром X. 10. Доказать, что для распределений: а) логнормального; б) Вей- булла с а < 1; в) Парето — производящая функция моментов определена только при t < 0; г) для распределения Коши — только при t = 0. Вычислительные задачи 11. Плотность распределения случайной величины £ равна р^х). Вычислить константу С, функцию распределения Дх), и вероятность Р(А), если: а) р(х) = !С(Х + Хб[ 1,21 • Л = (1;2 < 1} • ' |0, хй[-1,2]’ 1 Ь , ч fC(5-x), хе [-2,1] б) ^(х)-{о, хё[-2,1]; в) (С(х-2), хе[3,5] , . х.13,51’ г) *W = (o. «[-1.3Г д) (С(3-х), «1-3,21. '’‘"Но, хе|-5,2Г 12. Плотность распределения случайной величины £ равна р^х). Вычислить константу С, функцию распределения Дх), Mt, и вероятность Р(А), если: а) ^(х) = |С(х2-1)’ Х е 11,31; А = {2<£,<5}; с [О, хй[1,3] 1 ’ ,. . , [С(х2+3), хе[-2,1] . < , - -1 6) рЛх)=\ Л = {-1<£<2} ; [О, х«[-2,1] 1 1
Глава 6. Непрерывные случайные величины 137 ч . . (С(9-х2), хе -3,2 л (п Е в) рЛх) = < ; Л = {0<£<3|; с [О, х«[-3,2] ' 1 . . . [С(х2+х), хе[1,4] , „ ,, Г) '’'‘‘Но. х«|1,4|; 1С(х2-2х), хе[2,5] , , Д) ',‘<Х|-|о. «|2.5|: ', = (1<5<4); ч . (С(х3 + 1), хе[2,6] , (с Е " „1МГ л-<5<5<7>; . . . fC(x3 + 2), хе[1,3] . (п _ Ж) ИМ; Х = (О<5<2). 13. Плотность распределения случайной величины £ равна Вычислить константу С, функцию распределения Дх), и вероятность Р(А), если: ч z ч [С/(х-4), хе[5,8] л к а) ^Но. хе[5,8]; 6) л«-(С/<Х + 2)’ хе|'1,31; .-(0<6<з); 4 [0, Хй[-1,3] 1 1 . t ч fC/(8-x), хе[-2,3] , к с) в) "‘Но. «I-МГ д=<2<5<5’; г) ptw=lc/<x+6)’ ”н'41; ^-(о<5<5(. С [о, х«[-1,4] 1 s 1 14. Плотность распределения случайной величины имеет вид: , ч [С(х + 1Г3/2, х>0, [О, х < 0. Вычислить константу С, функцию распределения Дх), Mi,, Di, и вероятность Р{|^-1/3|<1}. 15. Плотность распределения случайной величины % имеет вид: , . JC(l-x2), |х|<1,
138 ЧАСТЬ I. Теория вероятностей Вычислить константу С, функцию распределения Цх), М^9DE, и вероятность Р{|£-1/2|<1/4}. 16. Плотность распределения случайной величины £ имеет вид: Найти константу С, функцию распределения Л[х), и вероятность Р{-2<£<1}. 17. Случайная величина £ имеет функцию распределения Лх) = —ех, 2 х<0, Найти плотность случайной величины, и вероятность Р{-1<^<3}. х<0, 18. Проверить, что функция F(x) = <2x-x2, 0<х<1, может быть функцией распределения случайной величины. Найти и 19. Стержень длины 24 см ломают на две части; будем считать, что точка излома распределена равномерно по всей длине стержня. Чему равна средняя длина большей части стержня? 20. Отрезок длины 12 см случайным образом разрезается на две части. Точка разреза равномерно распределена по всей длине отрезка. Чему равна средняя длина малой части отрезка? 21. Пассажир приходит в случайный момент на остановку, где может сесть на автобус или троллейбус (смотря что придет раньше). Автобус ходит с интервалами в 15 минут, троллей- бус — 10 минут (независимо друг от друга). Найти функцию распределения времени ожидания и его среднее значение. 22. Пассажир приходит в случайный момент на остановку, где может сесть на автобус, троллейбус или трамвай (смотря что придет раньше). Автобус ходит с интервалами 20 минут, трол- лейбус - 15 минут, трамвай - 10 минут. Найти функцию рас- пределения времени ожидания и его среднее значение. 23. У жителей поселка Соткино доходы имеют распределение Парето, минимальный доход составляет 100 тыс. руб., а сред- ний — 200 тыс. руб. Определить долю жителей с доходами: а) свыше 300 тыс. руб.; б) от 200 до 500 тыс. руб.
Глава 6. Непрерывные случайные величины 139 24. Известно, что срок службы изделия распределен показательно со средним 1 год. Найти вероятность того, что изделие про- служит не менее: а) 6 месяцев; б) 2 лет. 25. Относительное изменение курса акции за день (в процентах) имеет распределение Лапласа с = 8. Найти вероятность того, что курс акции: а) упадет более чем на 5%; б) поднимет- ся более чем на 3%. 26. Два сотрудника разделили работу поровну. Время выполнения доли работы каждого равномерно распределено от 1 до 2 часов. Найти среднее время выполнения работы. 27. Работа состоит из двух частей, которые выполняются незави- симо и параллельно. Время выполнения первой части равно- мерно распределено от 1 до 2 часов, второй — от 1 до 3 часов. Найти среднее время выполнения работы. 28. Работа состоит из двух частей, которые выполняются незави- симо и параллельно. Время выполнения первой части показа- тельно распределено со средним 1 час, второй — 2 часа. Найти среднее время выполнения работы. 29. Прибор состоит из двух блоков, которые могут выйти из строя независимо друг от друга. Прибор выходит из строя, если вы- ходит из строя хотя бы один блок. Срок службы первого блока показательно распределен со средним 2 года, второго — 4 года. Найти средний срок службы прибора. 30. Прибор состоит из двух блоков, которые могут выйти из строя независимо друг от друга. Прибор выходит из строя, если вы- ходит из строя хотя бы один блок. Срок службы первого блока имеет распределение Рэлея со средним 3 года, второго — 4 года. Найти средний срок службы прибора.
ГЛАВА 7 ФУНКЦИИ ОТ СЛУЧАЙНЫХ ВЕЛИЧИН. НЕПРЕРЫВНЫЙ СЛУЧАЙНЫЙ ВЕКТОР 7.1. Функции от случайных величин Пусть задана функция плотности р^х) случайной величи- ны и монотонная дифференцируемая функция у = ц/(х). Тогда плотность распределения случайной величины т] = у(^) равна Здесь v"'(y) — функция, обратная к функции у = у(х). Доказательство. Пусть у(х) — возрастающая функция, тог- да обратная ей функция также возрастающая, и функцию рас- пределения случайной величины т] = можно представить в виде Г(х) = /^(\|/_|(х)), так как F(x) = Луф < х) = Р& < у-'(х)) = Г5«'(х)). Дифференцируя, получаем A,(x) = F(x) = ; ;---= (х))^----- > dy (x) dx dx ~'(x) Q dx Пусть теперь у(х) — убывающая функция, тогда обратная ей также убывающая, и Г(х) = Р(у(^) < х) = v '(X)) = 1 - '(X)).
Глава 7. Функции от случайных величин. Непрерывный случайный вектор J4] Отсюда получаем /ч С \ п г/ -I/ XV ^«(*)) pn(x) = F'(x) = (1 -Ft(v '(х))' =-; ----= d\\i '(х) dx t d\f~\x) dx причем здесь ^2<o. dx Объединяя формулы, полученные в случаях возрастающей и убывающей функции у, получаем исходное утверждение. Если плотность р^х) отлична от нуля на некотором проме- жутке (конечном или бесконечном), то границы соответствую- щего промежутка для рп(у) находятся подстановкой исходных границ в функцию у. Заметим, что порядок следования границ может меняться, когда у — убывающая функция. Задача 1. Случайная величина £ равномерно распределе- на на отрезке [0, 2]. Найти плотность случайной величины п=-Л+1 • Решение. Из условия задачи следует, что О, х£[0,2], 1, хе[0,2]. Далее, функция у = —Vx + 1 является монотонной и диф- ференцируемой функцией на отрезке [0, 2] и имеет обрат- ную функцию х = у''(у) = у2-1, производная которой равна ~ = 1у. Кроме того, у(0) = -1, у(2) = —Уз. Следовательно, dy Pn(y) = A(V-‘(y)) '(У) = ^(y '(у))-2|у| = = 2|y|- О, 1 2’ У?Н/3, -1], ye[-V3, -1]. Значит, рп(у) = О, -У, у 21-Л-1], уе[->/з,-1].
142 ЧАСТЬ I. Теория вероятностей 7.2. Совместный закон распределения непрерывных случайных величин Пусть на вероятностном пространстве Q заданы две непре- рывные случайные величины £ и т]. Тогда упорядоченная пара (£, т|) определяет «случайную» точку на плоскости и называется двумерным случайным вектором, или двумерной случайной величи- ной, так же как в дискретном случае. Совместной функцией распределения непрерывных случайных величин £ и т| называется функция Г(х,у) = {£<х,т]<у}, опре- деляющая вероятность попадания случайного вектора (£, т|) в бесконечный угол на плоскости с вершиной в точке (х, у), ле- жащий ниже и левее этой точки. Это общее определение верно как в дискретном, так и в непрерывном случаях, и свойства совместной функции распределения для дискретных величин остаются справедливыми и для непрерывных случайных вели- чин. Напомним, если случайные величины £ и т| независимы, то совместная функция распределения равна произведению функций распределения составляющих: F(x, у) = F(x)F(y), и наоборот: если выполнено равенство F(x, у) = F^(x)F (у), то слу- чайные величины £ и rj независимы. Случайный вектор называется непрерывным, если его со- вместная функция распределения непрерывна. Случайный вектор называется абсолютно непрерывным, если существует та- кая неотрицательная функция р^п(х, у), называемая совместной плотностью распределения случайных величин и т| (или век- тора), что имеет место равенство X У F(x,y)= j' j' p^(u,v)dudv. -оо -ос Смысл определения совместной плотности распределения заключается в следующем. Вероятность того, что «случайная точка» (^, г|) попадет в область BQR2 на плоскости, вычис- ляется как объем трехмерной фигуры — «криволинейного» цилиндра, ограниченного поверхностью z = У) и пло- скостью z — 0, основанием которого является множество В. Аналитически этот факт записывается с помощью двойного интеграла: />{(£, п) е В} = р^(х, y)dxdy. В
Глава 7. Функции от случайных величин. Непрерывный случайный вектор 143 Совместная плотность распределения обладает также следу- ющими свойствами: 1) р(х, у)>0; +эо +00 2) f f р(х, y)dxdy = l; -ос -ос 3) р(х, у)=Щх, у). Простейшим примером совместного распределения двух случайных величин является двумерное равномерное распределе- ние на множестве А. Пусть задано ограниченное множество А с площадью 5(Л) Тогда указанное распределение определяется как распределение пары (£, т|), задаваемое с помощью следую- щей совместной плотности: Р^(х,у) = О, 1 5(Л)’ (х, у)<£А; (х, у)еА. Задача 2. Пусть двумерный случайный вектор (£, т|) равномерно распределен внутри треугольника Д = {(х, у): х > 0, у > 0, х + у < 2} . Вычислить вероятность неравенства £ > т|. Решение. Площадь указанного треугольника Д равна S(A) = 2 (рис. 7.1). В силу определения двумерного равномерного распре- деления совместная плотность случайных величин т] равна: О, (х, у) £ Д; Событие {£ > г|} соответствует множеству В = {(х, у): х > у} на плоскости, т.е. полуплоскости. Тогда вероятность Р(В) = Р{(^тЦеВ} = p^(x,y)dxdy. Рис. 7.1
144 ЧАСТЬ I. Теория вероятностей На полуплоскости В совместная плотность р^п(х, у) равна нулю вне множества А и 1/2 — внутри множества А. Таким об- разом, полуплоскость В разбивается на два множества: В, = В П Д и В2 = ВпД. Следовательно, двойной интеграл по множеству В представляется в виде суммы интегралов по множествам Bt и В2, причем второй интеграл равен нулю, так как там совместная плотность равна нулю. Поэтому /’{(£,, т])£ 5} = JJ p^(x,y)dxdy = JJ~±dxdy + Odxdy = В Bl в2 2*2 2 Если задана совместная плотность распределения р^х, у) пары (^, т|), то плотности р^х) и />л(у) составляющих £ и т| на- зываются частными плотностями и вычисляются по формулам: = / Pt^x,y)dy, -оо Р^у)= J P^x,y)dx. -00 Для непрерывно распределенных случайных величин с плот- ностями р^(х), р^у) независимость означает, что при любых х и у выполнено равенство Р^(х,у) = р^х)р^у). Задача 3. В условиях предыдущей задачи определить, неза- висимы ли составляющие случайного вектора Е, и т). Решение. Вычислим частные плотности р^х) и р^У)- Имеем: /\(х) = f P^(x,y)dy = Аналогично х£(0,2), хе (0,2) О, х£(0,2); 2 — г хе(0,2). ос р/х)= f P^x,y)dy = О, 2-У 2 У £(0,2); У €(0,2).
Глава 7. Функции от случайных величин. Непрерывный случайный вектор 145 Очевидно, что в нашем случае р^(х,у)^ р^(х)рЧ](у), и по- тому случайные величины £ и т| зависимы. Числовые характеристики для случайного вектора (£, т]) мож- но вычислять с помощью следующей общей формулы. Пусть р^(х, у) — совместная плотность величин и rj, а у(х, у) — функция двух аргументов, тогда Л/ф(£,т]) = J fw(x, y)p^(x,y)dxdy. -ос -оо В частности, 4-ос 4-ос м^= f f xp^(x,y)dxdy; —ос —оо yp^(x,y)dxtfy; -ос -оо М&] = f f xyPt^yWriy- -ОО -00 Задача 4. В условиях предыдущей задачи вычислить Mfyr\. Решение. Согласно указанной выше формуле имеем ЛЦт]= / f xyp^(x,y)dxdy = ffxyjdxdy. -ос -ос Д Представив треугольник А в виде Д = {(х,у):0<х<2;0<у<2-х}, двойной интеграл можно вычислить как повторный: Л/^] = JJ xy±dxdy = ±jxdx J ydy = ^fxdx Д ООО =if х(2~х>2</х о 3’ Важную роль в приложениях играет двумерное нормаль- ное распределение. Пусть г)] и т(2 — независимые случайные величины, имеющие стандартное нормальное распределение.
146 ЧАСТЬ I. Теория вероятностей Тогда двумерная случайная величина и = (т|р т|2) имеет стан- дартное двумерное нормальное распределение. Его совместная плотность равна: / х 1 /’Л1.Лг(х>’х2>=т;ехр По определению, случайная величина £ = (£р £2) имеет дву- мерное нормальное распределение, если ее можно представить в виде £ = а + Вг\, где а = (av а2) — вектор математических ожиданий, В — некоторая матрица. В случае, когда коэффициент корреляции р = р(^, Q от- личен по модулю от единицы, распределение имеет двумерную нормальную плотность'. РМ1^,Х2) = --------_х 2710,02 ^/1 — р хехр 1 ta-Oi)2 9 (х,-а|)(х2-а2) (х2-а2)2 К I о ' о 2(1-р2Д При этом составляющие имеют нормальные распределения: 5,6^,^, ^2еМа,,о2). Двумерное нормальное распределение обладает рядом по- лезных свойств, например: 1) если р = 0, то и £2 независимы; 2) любая линейная комбинация + с2£2 имеет нормальное распределение; 3) условные распределения каждой составляющей по другой также нормальны; 4) функции регрессии составляющих линейны. Поэтому на практике, если исследуется пара случайных ве- личин, каждая из которых имеет нормальное распределение, то можно предположить, что их совместное распределение являет- ся двумерным нормальным распределением.
(лава 7. Функции от случайных величин. Непрерывный случайный вектор |47 7.3. Плотность суммы двух непрерывных случайных величин Пусть £ и т) — независимые случайные величины с плот- ностями р5(х) и рл(у). Плотность случайной величины £, + ц вычисляется по формуле свертки J P^x-y)pn(y)dy. -00 Доказательство. Используем представление совместной функции распределения через двойной интеграл: F^Z) = Р{£> + Ц < z} = ff p^(x,y)dxdy, Dx где множество Dx = {(х, у): х + у < z} (рис. 7.2). Переходя от двойного интеграла к повторному, получаем /\+n(z)= f f p^(x,y)dxdy. Произведем замену во внутреннем интеграле, положив х = t - у, и поменяем порядок интегрирования: ^+л(г)= f f p(t-y,y)dy dt Дифференцируя под знаком интеграла, получим + ос Pi+^z) = F^(z) = f p^(z - y.y)dy.
148 ЧАСТЬ I. Теория вероятностей Поскольку величины £, и т] независимы, р^(х,у) = pk(x)p^(y). Подставляя последнее равенство в полученное выражение для плотности суммы, приходим к формуле свертки (с точно- стью до обозначения аргумента): оо Л+Ч(г) = f Pt(z-y)p/y)dy. Разумеется, в силу симметрии справедлива также формула ос Л+Л(У)= $ P^x)p^y-x)dx. -оо Задача 5. Пусть и т) — независимые случайные величины, распределенные по показательному закону с параметром 1 = 2. Вычислить плотность суммы + Т|. Решение. Поскольку и т| распределены по показательному закону с параметром 1 = 2, их плотности равны: Р^х) = р/х) = 2е"2х, О, х>0; х<0. Следовательно, 2е~2<х~у\ О, Х>У, х<у. Поэтому оо оо ^+л(х)= f pK(x-y)p/y)dy = J P^x-yyie'^dy. -оо О Если х < 0, то в этой формуле аргумент функции р^(х — у) отрицателен, и поэтому р^(х — у) = 0. Следовательно, р^+л(х) = 0. Если же х > 0, то имеем р^(х) = Jp^(x-y)-2e 2ydy = ^2e 2<х -2е 2ydy = о о е ».е 2>ф = 4е 2*J*dy = 4xe \ о о Таким образом, получен ответ: Pi+^x) = 0, 4хе-2х, х<0; х>0.
Глава 7. Функции от случайных величин. Непрерывный случайный вектор 149 7.4. Условные распределения и условные математические ожидания непрерывной случайной величины Пусть на одном и том же пространстве элементарных исхо- дов Q заданы две абсолютно непрерывные случайные величины п- Условным законом распределения случайной величины £ при условии г| = у, так же как и для дискретных случайных вели- чин, называется любое соотношение, ставящее в соответствие значениям случайной величины условные вероятности их принятия при условии Г| = у. В общем случае условную функцию распределения случай- ной величины £ при ц = у также естественно было бы опреде- лить формулой Однако это невозможно, поскольку для непрерывной слу- чайной величины Лл = у) — 0- Поэтому вместо события {т| = у} рассматривают событие {у < г] < у + Ау} и переходят к пределу по Лу -> 0. Таким образом, получаем формулу F <х |,)_ |im ^<х,.>'<К.>’ + Лу) = . * д>’-° Лу<л<у + Ду) А, (у) Наиболее важен для приложений случай, когда вектор (£, т|) представляет собой двумерную непрерывную случайную вели- чину с совместной плотностью распределения р^(х, у). Тогда Тогда условная функция распределения имеет производ- ную по х, т.е. существует условная плотность распределения при условии г| = у, равная , । х р^’У) | у) = —, • дх р^у) Условное математическое ожидание непрерывной случайной величины £ при известном ц вычисляется по формуле Л/(£,1л = У)= f xp^(x\y)dx = f х Р^,У^dx Р^У)
150 ЧАСТЬ I. Теория вероятностей и называется функцией регрессии по т|: Фул(>') = ^1п = У), Функция регрессии Ф^Су) определена в области возможных значений т), т.е. при дл(у)>0. Задача 6. Двумерный случайный вектор (^, т|) равномерно распределен внутри треугольника Д = {(х,у): х > 0, у > 0, х + у < 2}. Найти условное распределение £, при п = у и функцию регрес- сии <р^(у). Решение. Как уже было показано (см. задачи 2 и 3), Р^х,у) = о, 1 2’ (х,У)£Д, Л и рЛх) = (х.у)еД 11 0, у £(0,2); У 6(0,2). Поделив первую плотность на вторую, получаем условную плотность: 0, х£(0,2—у); /\|„(*|У) = ----, хе(0,2-у). 2-у Таким образом, речь идет о равномерном распределении на промежутке (0, 2 - у). Функцию регрессии вычисляем как мате- матическое ожидание равномерного распределения. Получаем Ф^(у) = (2 - у)/2, 0 < у < 2. Задача 7. Точку бросают случайным образом в круг радиуса R с центром в начале координат. Найти условную плотность распределения случайной величины — абсциссы точки паде- ния — при условии, что ордината л приняла значение у. Решение. Естественно, поскольку точка не может попасть за пределы круга, Р5л(х, у) = 0 при х2 + у2 > R2. Для каждой области внутри круга вероятность попадания пропорциональна площади этой области. Поэтому р;п(х, у) = А при х2 + у2 < /Р, т.е. плотность внутри круга постоянна. Определим константу А: f f Р$ n(x> yjdxdy = Adxdy = nAR2 = 1. -эс - эс х2+у2<Я2
Глава 7. Функции от случайных величин. Непрерывный случайный вектор 151 Отсюда А = 1/(л7?2) и плотность совместного распределе- ния Д,л(х,у) = О, x2+y2>R2, —Ц-, х2 + у2 < R2 О, |х|>^R2 -у2, ~2, \х\<№~У2-, ПК о, |у|>Л, 2yjR2-y2 nR2 ,|у|<Л и при | у I < R получаем условную плотность о, | х| > Jr2 -у2, I , р |х|<>М2-/. 2^R2 -у2 Таким образом, случайная величина £ при условии г] = у равномерно распределена на отрезке [-JR2 -y2', + >]R2 -у2]. Ее условное математическое ожидание тождественно равно нулю. Интересно отметить, что условная плотность распределения случайной величины при условии ц = у равномерна, в то вре- мя как безусловная плотность § таковой не является. И в этом примере случайные величины и ц зависимы между собой. В заключение отметим, что в таком важном для приложе- ний случае, когда случайная пара £ = (£р ^2) имеет двумерное нормальное распределение / х 1 /’(хрх2) =------Г==ТХ 2710^2^1 —р xevn 1 ?JXl-a^X2~a2> , (Х2-«2)Ч 2(1 —р2)[ о, 0^2 а2 J Функции регрессии оказываются линейными и имеют вид: Ч\л(х1) = а2 +р—(Х1 -д1); ф^,|^<х2> = "| +р—(*2 -вг)> СТ| СТ2 что также можно вывести из представленных выше формул.
152 ЧАСТЬ I. Теория вероятностей Задачи для самостоятельного решения Теоретические задачи 1. Найти плотности распределения: а) суммы; б) разности; в) про- изведения; г) частного двух независимых случайных величин, имеющих равномерное распределение на [0; а]. 2. Случайные величины и независимы и имеют нормальные распределения с параметрами av а2 и av а2 соответственно. Доказать, что имеет нормальное распределение, и найти его параметры. 3. Показать, что если имеет непрерывную функцию распреде- ления Дх) = Р(£ < х), то случайная величина т| = имеет равномерное распределение на отрезке [0, 1]. Вычислительные задачи 4. Плотность распределения £ равна: р(х) = Сх 2, 0, х>1; х<1. Найти постоянную С, плотность распределения т| = 1Д и веро- ятность 7X0,25 < т| < 0,64). 5. Случайная величина £ имеет функцию распределения 0, х < 0, Г(х) = ^х2, 0<х<1, 1, х>1. Найти функцию плотности случайной величины ц = —. 6. Случайная величина £ равномерно распределена на отрезке L Найти плотность распределения случайной величины т|, если: а) 1= [1, 3], n = + H б) /= [о, з], т] = 1о-$2; в) /= [1, 3], п = (Л+2)2; г) /= [0, 2L П=(3-^)3; д) /= [-1, 2], п = Л?3; е) /= [1, 2], ж) /= [-1, 2], ti = 1/(^+1); з) /= [1, 2], л=6/(^+1); и) /= [-1, 1], Ti = l/(£ + l)2 ; к) /= [-1, 1], т] = -1п(£+2).
Глава 7. Функции от случайных величин. Непрерывный случайный вектор 153 7. Случайная величина имеет показательное распределение с па- раметром Х=2. Найти плотность распределения случайной вели- чины т|, если: а) п = ^2-1; б) п = V + 1; В) П = 1 + ЗД; г) т]=е4-1; д) П = 1п(^+1)• 8. Случайная величина £ имеет показательное распределение с па- раметром X. Найти функции плотности распределения случай- ных величин: а) П,= Ч ; б) Т]2 =^2; в) т]3= -Л; г) т|4 = l-e~^. 9. Случайная величина £ распределена по нормальному закону с параметрами а и о2. Найти плотность распределения случайной величины т|, если: а) а = 2, о = 2, т] = (£-2)3 ; б) а = -1, о = 3, т| = ^3 + 2; в) а = 2, о = 1, т| = (£ -1)3; г) а = 1,о=2, т| = е^; д) а = 1, о = 3, п = ^. 10. Случайная величина £ имеет стандартное распределение Коши. Найти плотность распределения случайной величины т], если: а) п = £3; 6) T| = arctg£; в) т] = е*. 11. Плотность распределения случайной величины £ равна р^(х). Найти плотность распределения ц, если: х + 4 хе[ *’31; n=(£+i)3; Х01-1.3] а) РАх)=- ~2(Р 0, б) /\О) = • х-3 Т”’ 0, *б[4,6]. „ г. , T] = s -Ь, хе [4,6] 2(3-х) ’ Хе[ 5,21; п = 1/(^+5)- лс*[-5,2] в) PtM = < 63 °, 2(5-х) , хе[2,5] ; т] = 1п(£+4); хе [2,5] г) Р^(х) = - 55 0, 8-х хе [-1,3]. i ; г| = е -1. хй[-1,3] д) Pt(x) = < ”28~’ 0,
154 ЧАСТЬ I. Теория вероятностей 12. Плотность распределения случайной величины £ равна р^(х). Найти плотность распределения ц, если: 3(х2-1) , хе[1,3] с—г а) Pi(x) = < 20 0, хе [1,3] б) РЛХ) = х2 +1 24 ’ Хе11’41; л = >/^4; 0, хе [1,4] в) Р^х)=- 3(9-х2) 100 ’ хе[ 3’21; г| = 1/(^ + 3); 0, хе [-3,2] 2(х2 + х) ’ хе11’41; т| = 1п(2^+1); г) />5(х) = < 57 0, хй [1,4] д) Р5(х) = - х2 -2х 18 ’ хе[2,5]. , . , п = 1п(£-1); 0, хе [2,5] е) Р5(х) = - х3 +1 324 ’ Хе[2,6]; п = 2/(1-О; 0, хе [2,6] ж) Р^х) = 1_ < (1п2)(х —, хе[-1,3] 3_, + 5) ; и = е ; 0, хе [-1,3] ' 1 У (— Г О 'll з) Р^х) = (1п2)(8- , X Е [ Z, JJ -2 -х) ; т[ = е^ . 0, хе [-2,3] 13. Продавец прохладительных напитков установил, что его дохол (за день) в летний период зависит от среднедневной темпера- туры воздуха экспоненциальным образом и при повышении температуры от 20° С до 30° С растет от 1000 до 2000 денежны* единиц. В предположении, что температура равномерно рас- пределена от 20° С до 30° С, найти: а) вероятность того, чтс доход составит более 1500 денежных единиц; б) средний доход; в) среднее квадратическое отклонение дохода.
Глава 7. Функции от случайных величин. Непрерывный случайный вектор 155 14. Предприниматель взял кредит в 100 денежных единиц под сложные проценты (0,1% в день) на время реализации некото- рого проекта. Определить, какую сумму в среднем ему придет- ся выплатить, если время реализации проекта: а) равномерно распределено от 100 до 200 дней; б) показательно распределено со средним 150 дней. 15. Прибыль X производителя зависит от рыночной цены р на выпускаемый товар по закону: X = 90/j2. В предположении, что возможная цена равномерно распределена от 10 до 12 (де- нежных единиц), найти: а) вероятность того, что прибыль со- ставит более 10 тыс. денежных единиц; б) среднюю прибыль; в) среднее квадратическое отклонение прибыли. 16. Прибыль X производителя зависит от рыночной цены р на рас- ходуемое сырье по закону: X — 106//P. В предположении, что возможная цена равномерно распределена от 4 до 8 (денежных единиц), найти: а) вероятность того, что прибыль составит бо- лее 5 тыс. денежных единиц; б) среднюю прибыль. 17. Найти плотность распределения суммы двух независимых ве- личин и rj, равномерно распределенных на отрезках I и J соответственно, если: а) /=[1,3],/ = [0, 1]; б) / = [0, 2], J= [3, 4]; в) 1= [0, 4], J= [1, 2]; г) 1= [1, 3], J= [2, 4]; д) 1= [0, 1], J= [0, 7]. 18. Найти плотность распределения суммы независимых случай- ных величин £ и п, где £ имеет равномерное распределение на отрезке /, а ц имеет показательное распределение с параметром X, если: а) / = [0, 1], X = 2; г) I = [-1, 1], X = 3; б) 1= [0, 3], X = 2; д) 1= [1, 2], X = 2. в) / = [0, 2], X = 5; 19. Найти плотность распределения суммы независимых показа- тельно распределенных случайных величин £ и ц с параметра- ми Xt и Хл соответственно, если: а) /ч-2, Хл=3; г) Х^=1, Хл=5; б) Х^=2, Хл=5; д) Х^=4, Хл=5. в) X =4, X =6; 7 К ’ п ’
156 ЧАСТЬ I. Теория вероятности 20. Работа состоит из двух частей, которые выполняются неза-; висимо и последовательно. Время выполнения первой част# равномерно распределено от 1 до 2 часов, второй - от 1 до 3 часов. Найти: а) среднее время выполнения работы; б) веро- ятность того, что работа будет выполнена за 4 часа. ( 21. Работа состоит из двух частей, которые выполняются неза- висимо и последовательно. Время выполнения первой части равномерно распределено от 1 до 3 часов, второй - от 2 до 4 часов. Найти: а) среднее время выполнения работы; б) веро- ятность того, что работа будет выполнена за 5 часов. 22. Работа состоит из двух частей, которые выполняются неза- висимо и последовательно. Время выполнения первой части показательно распределено со средним 1 час, второй — со средним 2 часа. Найти вероятность того, что работа будет вы- полнена за 4 часа. 23. Работа состоит из двух частей, которые выполняются неза- висимо и последовательно. Время выполнения первой части показательно распределено со средним 2 часа, второй — со средним 3 часа. Найти вероятность того, что работа будет вы- полнена за 6 часов. 24. Двумерная случайная величина (£, rj) равномерно распределена на множестве А. Проверить величины £ и г| на зависимость, найти их плотности и ДО, если: а) А = {(х - 1)2 + у2 <9, у >0}, С= (1, 3); б) А = {х2 + (у - З)2 < 64}, С = (0, 3); в) А = {(х - 2)2 + у2 < 25, у > 0}, С = (2, 5); г) А = {х2 + (у - 5)2 < 49}, С = (0, 5); д) А = {х2 + (у - 2)2 < 9, х > 0}, С = (3, 2). 25. Двумерная случайная величина (^, т|) равномерно распределена на множестве А. Проверить величины £ и т| на зависимость, найти их плотности и F(Q, если: а) А = {N + [у - 3| < 10}, С = (5, 8); б) А = {|л| + |у - 4| < 6}, С = (3, 7); в) А = {|х - 1| + И < 4}, С=(0, —1); г) А = {И + 2W < 6}, С= (-1, -1); д) А = {|л| < 3; 0 < у < |3 - х|}, С=(1, 1); е) Л = {0 < х < у < 2}, С= (1, 3/2); ж) А = {-1 <у <7 - 2|х - 1|}, С= (2, 5); з) А = {И + 2[у - 3| < 6}, С = (4, 4).
Глава 7. Функции от случайных величин. Непрерывный случайный вектор 157 26. Двумерная случайная величина (£, rj) равномерно распределена на четырехугольнике, ограниченном прямыми у = 0, у = 2, у = 2х + 2, у = 14 - 2х. Проверить величины и т| на зависи- мость, найти их плотности и Д1, 1). 27. Двумерная случайная величина (£, т|) равномерно распределе- на на множестве А, ограниченном параболой и осью абсцисс: А={0<у<4-(х- 2)2}. Проверить величины £ и ц на за- висимость, найти их плотности и F(2, 4). 28. Двумерная случайная величина (£, rj) равномерно распределена в квадрате К = {(х, у): |х| + |у| < 2}. Найти вероятность I- U 2 1 J 29. Пара случайных величин и rj равномерно распределена вну- три треугольника К = {(х,у):х + у <1,х>0,у >0}. Найти вероят- ность Р(£<3/4). 30. Пара случайных величин £ и т| равномерно распределена вну- три трапеции с вершинами в точках (—6, 0), (—3, 4), (3, 4), (6, 0). Найти совместную плотность распределения для этой пары случайных величин и плотности составляющих. Зависимы ЛИ £ И Г|? 31. Случайная пара (£, rj) равномерно распределена внутри К = {(х,у):х>0; х<у<1}. Найти плотности £ и rj, исследовать вопрос об их зависимости. Найти М(& т|). 32. Совместная плотность двух случайных величин £ и т] равна: г/ ч fle2y, у^0,х<0, у<х; f(x,y) = । [0, иначе. Найти частные плотности т|. Исследовать вопрос о зависи- мости И Т]. 33. Дана совместная плотность случайных величин £ и rj: Р(х,у) = < /lsin(x + y), 0<х<у;0<у<~; 0, иначе. Найти: а) коэффициент Л; б) совместную функцию распреде- ления; в) частные плотности и функции распределения; г) ус- ловную плотность распределения £ при условии т| = у. 34. Функция совместного распределения случайного вектора (£, rj) имеет вид F(x,y) = ху(1 + а(1 - *)(1 - У)), х,у е [0,1].
158 ЧАСТЬ I. Теория вероятностей^ Найти: а) совместную и частные плотности распределения;' б) при каких а данная формула действительно задает функцию распределения; в) коэффициент корреляции; г) функцию ре> грессии £ по г|. 35. Случайная пара (£, ц) равномерно распределена в единичном квадрате К = {(х,у):0<х<1; 0 < у < 1}. Пусть р — расстояние от точки (£, ц) до нуля. Найти функцию условного распределения р при условии = х, 0 < х < 1. 36. Пара случайных величин с и т] равномерно распределена в тре- угольнике с вершинами в точках (0, 0), (1, 1), (2, -1). Найти: а) функцию регрессии по ц; б) функцию регрессии ц по 37. Две независимые случайные величины и имеют показа- тельное распределение с параметром X. Найти условное рас- пределение при условии, ЧТО Т] = ^ + = /, / > 0. 38. Случайные приращения цен акций А и Б (в процентах) имеют дисперсии 1 и 4 соответственно и нулевые средние, а их ко- эффициент корреляции 0,7. Как в среднем должен измениться курс акции: а) Б, если курс акции А поднимется на 2%; б) А, если курс акции Б опустится на 4%. Решить задачу, используя приближение двумерным нормальным распределением. 39. Случайный выпуск продукта в циклическом технологическом процессе на химическом производстве имеет среднее 50 и среднее квадратическое отклонение 12 (весовых единиц), при- чем выпуск в каждом цикле зависит от предыдущего с коэф- фициентом корреляции -0,4. Спрогнозировать выпуск в сле- дующем цикле, если в текущем цикле выпуск составил: а) 45; б) 65 весовых единиц. Решить задачу, используя приближение’ двумерным нормальным распределением. 40. Два экономических показателя, X и Y, имеют средние 10 и 20, дисперсии 25 и 64 соответственно, а их коэффициент корре- ляции 0,5. Найти: а) среднее Упри условии Х = 15; б) среднее X при условии Y= 28. Решить задачу, используя приближение двумерным нормальным распределением.
Глава 8 ЗАКОН БОЛЬШИХ ЧИСЕЛ. ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА 8.1. Неравенство Чебышева ► Теорема 1 (неравенство Маркова). Пусть для случайной вели- чины £ существует тогда для любого е > 0 верно Доказательство. Проведем доказательство раздельно в дис- кретном и в абсолютно непрерывном случае. Пусть Е, — дискретная случайная величина и Р(^ = х) = рр i = 1, 2, п. Тогда вероятность Р( I I > е) равна сумме веро- ятностей рр для которых х(. находятся вне промежутка (—е, е). |х | Очевидно, для таких х( имеет место неравенство — >1. Учитывая это неравенство, получаем е Р(Ц1 >£) = = Ел < Е—л < ЕИл + Е—л =-ЁМл=i"N- k|>. е щ>е е е е е Пусть Е — абсолютно непрерывная случайная величина с плотностью распределения р5(х). Тогда вероятность Р( I £ I > е)
160 ЧАСТЬ I. Теория вероятносте|| равна сумме интегралов от плотности распределения по про- |х| межуткам (-оо, -е) и (е, +оо). На этих промежутках — >1 8 Воспользовавшись формулой для математического ожидания получаем неравенство Р( 11-1 > е) = J p£x)dx + Jp^x)dx <|j lx\p^{x)dx + -ОО £ —ОО +-J |x|p5(x)cbc < - J IxIp^{x)dx +1 J* |x|^(x)dxr + -00 -6 + - f |x|p,(x)<ic =- f |x|p,(x)o!x = -M\$ I. £ J * £ J q 8 £ -00 В общем случае подобное доказательство проводится с ис- пользованием интеграла Лебега, который не входит в програм- му настоящего курса. Следствие. Пусть для случайной величины существует ME2, тогда для любого е > 0 верно I р(й>«)<^. Доказательство. Заметим, что событие {<о: IЕ, I > е} равно- сильно событию {<о: Е,2 > е2}, и применим неравенство Маркова к случайной величине Е,2. Теорема 2 {неравенство Чебышева). Пусть для случайной ве- личины £, существует математическое ожидание ME, и дисперсия DE,. Тогда для любого е> 0 верно < Доказательство. Применяем следствие неравенства Маркова к случайной величине |Е, — МЕ,\, замечая, что М(Е> — ME,)2 = DE,. Неравенство Чебышева часто используют в виде ,(|5-^<е) > 1-^.
Глава 8. Закон больших чисел. Центральная предельная теорема 161 Теорема 3. Пусть для случайных величин ^2, суще- ствуют математические ожидания MZ,. и дисперсии Dt,., тогда для любого е> 0 верно Р Доказательство. Применяем неравенство Чебышева к слу- чайной величине которая имеет Л/^ = —У и | п п 1 = 1 П / = 1 У £>%, (согласно свойствам математического ожидания п ,=1 и дисперсии). Задача 1. В 400 испытаниях Бернулли вероятность успеха в каждом испытании равна 0,8. С помощью неравенства Чебыше- ва оценить вероятность того, что разница между числом успехов в этих испытаниях и средним числом успехов будет меньше 20. Решение. Число успехов в этих испытаниях распределено по закону Бернулли, поэтому среднее число успехов равно Mt, = пр = 400 • 0,8 = 320, а дисперсия Dt, = npq = 400 • 0,8 х х 0,2 = 64. Тогда в силу неравенства Чебышева имеем - 320| < 20) > 1 - = 1 -— = 0,84. 1 202 400 Вычислим эту же вероятность с помощью приближенной (интегральной) формулы Муавра—Лапласа (см. гл. 4): Р(|^ —320|<20) = Р(|^—лр|<е)= Р £ £ у] npq npq Jnpq = 2Ф0 = 2Ф0 (2,5) = 2 • 0,4938 = 0,9876. Последнее вычисление показывает, что неравенство Чебы- шева дает довольно грубые оценки вероятностей. 8.2. Закон больших чисел ► Теорема 4 {закон больших чисел). Пусть задана бесконечная последовательность независимых одинаково распределенных слу- чайных величин %2, Е>п, для которых существуют мате- Теория вероятностей
162 ЧАСТЬ I. Теория вероятност» матическое ожидание Л/^( = а и дисперсия DE,, = ст2. Тогда любого е > 0 верно I К limP — -a >е =0. \п^ Доказательство. Применяем неравенство Чебышева к слу- 1 п | п чайной величине которая имеет М(,п =— = а р =Ж1>е)< 0, п —+ оо. Суть закона больших чисел состоит в том, что при возрас- тании числа слагаемых (одинаково распределенных случайных величин) среднее арифметическое этих слагаемых мало отлича- ется от математического ожидания а. Иначе говоря, любое по- ложительное отклонение среднего арифметического случайных величин от числа а становится при достаточно большом числе слагаемых маловероятным. Пример 1. Пусть Е,2, ... — последовательность слу- чайных величин, каждая из которых равна числу успехов в од- ном испытании Бернулли (т.е. 1 — в случае успеха и 0 — в случае неудачи). Закон распределения каждой такой случайной величины имеет вид: Тогда математическое ожидание = р и дисперсия D^. = pq. Среднее арифметическое х = —^2$,, равно частоте успехов в п испытаниях, и закон больших чисел утверждает, что эта частота успехов стремится к вероятности успеха р, когда чис- ло слагаемых (т.е. число испытаний) неограниченно возрастает. Закон больших чисел может выполняться и в случае по- разному распределенных случайных величин.
Глава 8. Закон больших чисел. Центральная предельная теорема 163 Теорема 5. Пусть ..., ... — последовательность не- зависимых случайных величин, для которых существуют матема- тические ожидания и дисперсии D^., удовлетворяющие усло- 1 X* А вию л -> оо. Тогда для любого г > 0 справедливо pa- ri ,=i венство 1 Л 1 Л 1 л limP <е =1. Доказательство. В силу теоремы 3 имеем 1 п £ п /=1 ( П /=1 Переходя к пределу в неравенстве при п -> <», получаем утверждение теоремы. Отметим, что для независимых одинаково распределенных случайных величин верно также следующее утверждение, более сильное, чем закон больших чисел. При этом можно даже от- казаться от условия существования дисперсии. ► Теорема 6 (усиленный закон больших чисел Колмогорова). Пусть задана бесконечная последовательность независимых оди- наково распределенных случайных величин ..., ^п, ..., для которых существует математическое ожидание М^. — а, тогда = а = 1. Р lim В общем случае сходимость случайной последовательности к пределу X вида Р( lim %„=*) = ! л—»эс называется сходимостью с вероятностью единица (или почти на- верное) и обозначается так: Хп-^-^Х. Из сходимости с вероятностью единица следует сходимость по вероятности, обратное верно не всегда.
164 ЧАСТЬ I. Теория 8.3. Центральная предельная теорема (ЦПТ) Теорема 7 (центральная предельная теорема). Пусть Е,1( ..., ^п, ... — независимые одинаково распределенные случайные ве- личины с = а и 1%. = cs2, i = 1, 2, ..., п, ... Тогда для любого числа х верно limP ^1+^2+- + ^-Лй Су/П <х =Ф(х) = —= е 2dy. . v2rc Смысл центральной предельной теоремы заключается в том, что сумма Sn = случайных величин при надлежа- щем линейном преобразовании с увеличением числа слагаемых (п оо) ведет себя почти как случайная величина со стандарт- ным нормальным распределением N(0, 1). Вероятность попада- ния в любой интервал имеет следующий предел: limP с1 < s„~na Gyjn = ~^= fе 2</у = Ф(с,)-Ф(с1) = Ф0(с2)-Ф0(с1), Лтг d п—»оо л/2л откуда следует приближенная формула которой имеет смысл пользоваться, если А и В не очень далеки ; от па. Центральная предельная теорема может оставаться спра- ведливой и в случае, когда случайные слагаемые не являются одинаково распределенными. ► Теорема 8 (Ляпунова). Пусть ^2>—> — независимые слу- чайные величины, имеющие конечный третий абсолютный цен- тральный момент, и пусть ак = М^к, <зк2 = D^k, с[ = М\^к~ ак\3, Ап = 52, в2п = 52 , с*=52е* • ^сли пРи п °° °тн°шение к=\ к = \ к=\ О, то для любого числа х верно limP п—»оо 1 г <х =Ф(х) = -= I е 2dy.
165 Глава 8. Закон больших чисел. Центральная предельная теорема В общем случае сходимость случайной последовательности X к пределу (случайной величине) X вида limP(Y <х) = Р(Х<х) л—»ос в точках непрерывности функции распределения X называется сходимостью по распределению и обозначается так: V d V V Из сходимости по вероятности следует сходимость по рас- пределению, обратное верно не всегда (но верно в случае схо- димости к константе). Пример 2. Пусть £|( ^2, ..., £л, ... — последовательность слу- чайных величин, удовлетворяющая условиям предыдущего при- мера 1. В этом случае сумма Sn = + £2 + ... + ^л есть число успехов т в п испытаниях Бернулли. Из ЦПТ следует, что limP т — пр yjnpq -i=fe 2Лс = Ф0(с2)-Ф0(с1), 1 р где Фо (%) = -= е 2 dy — функция Лапласа. Тогда вероятность того, что число успехов заключено между тх и mv равна Р(/И] <тл<ти2) = Р - пр т - пр т2 - пр y/npq ~ yjnpq ~ yfnpq Ф0 т2—пр -Фо -пр Jnpq t Этот результат называется интегральной теоремой Муавра— Лапласа и уже встречался нам раньше (см. § 4.3). Задача 2. В продукции цеха детали отличного качества со- ставляют 50%. Детали укладываются в коробки по 200 шт. в каждой. Какова вероятность того, что число деталей отличного качества в коробке отличается от 100 не более чем на 5? Решение. Пусть — случайное число деталей отличного ка- чества в /-й коробке, тогда при п = 200, p = q = - получим:
166 ЧАСТЬ I. Теория вероятностей P(95<m<105) = P 5 < т - пр < 5 ^50 ~ y/npq ~ >/50 «Фо(0,71)-Ф0(-О,71)«0,52. Задача 3. Используя условия задачи 2, указать, в каких гра- ницах с вероятностью 0,997 находится число деталей отличного качества в коробке. Решение. По табл. 2 приложения 2 при условии т — пр yfnpq Р 0,997 находим и = 3, и следовательно, Sn лежит в пределах np±3jnpq, т.е. число деталей отличного качества в коробке с вероятностью 0,997 находится в пределах 100 + 21. Задача 4. Используя условия задачи 2, определить, сколько деталей надо положить в коробку, чтобы с вероятностью, не меньшей 0,99, можно было утверждать, что число деталей от- личного качества в коробке не менее 100. Решение. Обозначим и= . Используя нормальное приближение, получаем Vw Р(т> 100) = Р т — пп 1-ф(и) = 1-Ф0(и)>0,99. Отсюда Ф0(и) < —0,49, а из табл. 2 приложения 2 и свойств функ- ции Лапласа получаем неравенство и < —2,32. Обозначив х = Jn > 0, 1 с учетом p = q = ~, приходим к квадратному неравенству х2 —2,3х - 200 > 0, решая которое, получаем п > 236. Можно предложить и другой метод. Пусть — число де- талей, которые пришлось перебрать, чтобы найти /-ю деталь отличного качества (включая ее саму). Случайные величины имеют геометрическое распределение с параметром р = 1/2. Можем вычислить М^ = \/р = 2, De, = (1 - pj/p1 = 2. Используя ЦПТ, получаем неравенство />(5100<«) = Ф f л-100-21 (V2V100 J гф" (л-200) I 14,14 J >0,99, откуда следует л > 200 + 14,14 • 2,32 = 232,8, или, округляя, л > 234.
(лава 8. Закон больших чисел. Центральная предельная теорема 167 Результаты получаются близкие, но первый метод более то- чен и потому предпочтительнее. Вторым методом лучше поль- зоваться, если нужно определить границы, в которых лежит неизвестное число деталей. Задача 5. Доходы (в месяц) жителей города имеют математи- ческое ожидание 10 тыс. руб. и среднее квадратическое отклоне- ние 2 тыс. руб. Найти вероятность того, что средний доход 100 случайно выбранных жителей составит от 9,5 до 10,5 тыс. руб. Решение. Переформулируем условие задачи для суммар- ного дохода: он должен составлять от 950 до 1050 тыс. руб. Используя ЦПТ, получаем: />(950 < 5|00 < 1050) — Фо 1050-10010 . 27100 , -фо 950-100 10 . 27100 , = 2Ф0(2,5) = 0,9876. Задача 6. Срок службы электрической лампы имеет пока- зательное распределение с математическим ожиданием 1000 ч. Найти вероятность того, что средний срок службы для 100 ламп составит не менее 900 ч. Решение. Примем для простоты 1000 ч за единицу времени. Вспомним числовые характеристики показательного распределе- 1Л 1 1 ния: Ак,= — , D^= . Отсюда следует, что среднее квадратиче- ское отклонение совпадает с математическим ожиданием (и оба они здесь равны единице). Переформулируя условие задачи для суммарного срока службы и используя ЦПТ, получаем: P(Sim > 90) = 1 -Ф= |+Фо(1) = 0,8413. I v 1 vU Задачи для самостоятельного решения Теоретические задачи 1. Проверить, выполняется ли закон больших чисел для последо- вательности независимых случайных величин имеющих следующие законы распределения: -4п 0 у/п р \/п 1-2 п 1/п
168 ЧАСТЬ I. Теория вероятносте( -2- 0 2" р 2"(2я + 1) 1 - 2-2" 2" (2л + 1) —у/~П 0 л/л р V л/л 1 — 2/ V л/л -П2П 0 Л2/3 р 1/л гч 1 с 1 1/л 2. Пусть £2, ... ... — независимые, одинаково распределенные случайные величины с функцией распределения Дх). Пусть за- даны случайные величины т]; = 1, <Х, О, £,,>*• Выполняется ли для последовательности г|1г|2, ..., т|Р ... закон больших чисел? 3. Доказать закон больших чисел в «обобщенной форме»: пусть ё,2, ..., %п, ... — последовательность независимых случайных величин, у которых существуют математические ожидания И дисперсии D^., причем все дисперсии ограничены сверху одной константой С > 0. Тогда для любого 8 > 0 limP >Е =0. I л—у л “7 4. Пусть случайная величина £ имеет нормальное распределение с параметрами = a, De, = ст2. Найти вероятности Р(|£-д|>су) и Р(| £ - а | > Зст), пользуясь таблицами функции Лапласа. Затем оцените те же вероятности с помощью неравенства Чебышева. 5. Пусть случайная величина £ имеет распределение Лапласа, т.е. А, ее плотность равна Р(х) = —е~^\ Х>0. Найти вероятности Р(|^|<ст) и Р(|^|<3о), где ст — среднее квадратическое от- клонение, и сравнить их с оценками, получаемыми с помощью неравенства Чебышева.
Глава 8. Закон больших чисел. Центральная предельная теорема 169 Вычислительные задачи 6. Средний размер вклада в отделении банка равен 6000 руб. Оценить вероятность, что случайно взятый вклад не превысит 10 000 руб. 7. Среднее количество вызовов, поступающих на АТС завода в течение часа, равно 300. Оценить вероятность того, что в те- чение следующего часа число вызовов на коммутатор: а) пре- высит 400; б) будет не более 600. 8. Отделение банка обслуживает в среднем 100 клиентов в день. Оценить вероятность того, что сегодня в отделении банка бу- дет обслужено: а) не более 200 клиентов; б) более 150 клиен- тов. 9. Среднее абсолютное приращение цены акции компании в тече- ние биржевых торгов составляет 0,3%. Оценить вероятность того, что на ближайших торгах курс изменится более чем на 3%. 10. Среднее квадратическое отклонение приращения цены акции компании в течение биржевых торгов составляет 2%, а среднее приращение равно нулю. Оценить вероятность того, что на ближайших торгах курс изменится более чем на 5%. 11. В каждой упаковке товара имеется одна из N различных на- клеек (равновероятно). С помощью неравенства Чебышева оценить вероятность того, что удастся собрать все наклей- ки, купив не более М упаковок товара. Решить задачу, если: a) N = 4, М = 20; б) N = 5, М = 30. 12. По статистическим данным, в среднем 87% новорожденных доживают до 50 лет. С помощью неравенства Чебышева оце- нить вероятность того, что из 1000 новорожденных доля до- живших до 50 лет будет отличаться от вероятности этого со- бытия не более чем на 0,04 (по абсолютной величине). 13. В среднем 10% работоспособного населения некоторого регио- на — безработные. Оценить с помощью неравенства Чебышева вероятность того, что уровень безработицы среди случайно вы- бранных 10 000 работоспособных жителей составит от 9 до 11% (включительно). 14. Опыт страховой компании показывает, что страховой случай приходится примерно на каждый пятый договор. Оценить с помощью неравенства Чебышева количество договоров, при котором с вероятностью 0,9 можно утверждать, что доля страховых случаев отклонится от 0,2 не более чем на 0,01 (по абсолютной величине). Уточнить ответ с помощью теоремы Муавра—Лапласа.
170 ЧАСТЬ I. Теория вероятностей 15. В продукции цеха детали отличного качества составляют 80%. В каких границах будет находиться с вероятностью 0,99 чис- ло деталей отличного качества среди 10 000 деталей? Сделать оценку с помощью неравенства Чебышева и с помощью тео- ремы Муавра—Лапласа. 16. Ежедневно новая сделка заключается с вероятностью 0,2 (но не более одной в день). За сколько дней с вероятностью 0,9 можно ожидать заключения не менее 50 сделок? 17. Аппаратура состоит из 100 одинаково надежных и независимо работающих элементов, каждый из которых может отказать в течение суток с вероятностью 0,01. На обнаружение отказав- шего элемента и его замену требуется 20 минут, в течение ко- торых аппаратура простаивает. Найти: а) вероятность того, что время простоя составит не более 40 минут в сутки; б) среднее время простоя аппаратуры в сутки. 18. На заводе 1000 станков, каждый из которых в среднем в тече- ние 24 дней в месяц потребляет электроэнергию независимо от других станков с интенсивностью 10 единиц в день. Какое количество электроэнергии необходимо заводу ежедневно, что- бы недостаток электроэнергии наблюдался в среднем не чаще двух раз за 100 дней? 19. Предприятие выпускает 30% изделий стоимостью 100 руб., 30% изделий — стоимостью 200 руб. и 40% изделий — стоимостью 300 руб. Какова вероятность получить за 1000 случайно ото- бранных изделий не менее 215 тыс. руб.? 20. Известно, что треть всех деталей, сходящих с конвейера, под- вергается выборочному контролю на основании некоторого случайного признака. Пусть через контроль прошло 100 дета- лей. В каких границах с вероятностью 0,99 лежит общее число деталей, сошедших с конвейера? 21. Кадровое агентство трудоустроило 500 специалистов. В каких границах с вероятностью 95% находилось общее число соис- кателей на работу, если каждый соискатель устраивается на работу с вероятностью 0,2? 22. Изготовление детали занимает случайное время, равномерно распределенное от 10 до 15 минут. Найти вероятность того, что на изготовление 100 деталей понадобится не менее 20,5 часа. 23. Изготовление детали занимает случайное время, равномерно распределенное от 4 до 8 минут. Изготовление скольких дета- лей за 25 рабочих часов можно гарантировать с вероятностью 95%?
Глава 8. Закон больших чисел. Центральная предельная теорема 171 24. В бункер помещается не более 150 деталей. Ежеминутно в бун- кер поступает случайное число деталей, имеющее распределе- ние Пуассона с параметром X = 2; количества деталей, поступа- ющих в непересекающиеся промежутки времени, независимы. Каждый час все находящиеся в бункере детали перегружают на тележку и увозят. В начальный момент времени бункер сво- боден. Найти вероятность того, что за 20 часов непрерывной работы не произойдет ни одного переполнения бункера. 25. Число посетителей магазина (в день) имеет распределение Пуассона с математическим ожиданием 289. Найти вероят- ность того, что за 100 рабочих дней суммарное число посети- телей составит от 28 550 до 29 250 человек. 26. По статистике страховой компании, число страховых случаев в день имеет распределение Пуассона, а за год в среднем про- исходит 400 страховых случаев. Найти вероятность того, что за год их произойдет не более 450. 27. Доходы жителей города имеют математическое ожидание 15 тыс. руб. и среднее квадратическое отклонение — 4 тыс. руб. (в месяц). Найти вероятность того, что средний доход 100 слу- чайно выбранных жителей составит от 14 до 16 тыс. руб. 28. Срок службы изделия имеет показательное распределение с математическим ожиданием 2500 часов. Найти вероятность того, что средний срок службы для 100 изделий составит не менее 2300 часов. 29. Вес яблока имеет математическое ожидание 200 г и среднее квадратическое отклонение 50 г. Найти вероятность того, что в 100 кг окажется не менее 490 яблок. 30. Вес арбуза имеет математическое ожидание 10 кг и среднее квадратическое отклонение 2 кг. Найти вероятность того, что в 1 тонне окажется не более 105 арбузов.
Глава io ОСНОВНЫЕ ПОНЯТИЯ И ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ юл. Генеральная и выборочная совокупность Генеральной совокупностью называется множество объектов произвольной природы, обладающих признаками, доступными для наблюдения и количественного измерения. Например, в случае социально-экономических исследований это может быть население какого-то города, региона или стра- ны, а измеряемыми признаками — доходы, расходы или объем сбережений отдельно взятого человека. Если какой-то признак имеет качественный характер (например, пол, национальность, социальное положение, род деятельности и т.п.), но принадле- жит к конечному множеству вариантов, он может быть также закодирован числом (как это часто делают в анкетах). Объекты, входящие в генеральную совокупность, называют- ся ее элементами, а их общее число — ее объемом. Пусть число элементов генеральной совокупности равно N. Примем каждый из них за элементарный исход со некоторо- го вероятностного пространства Q и припишем всем исходам одинаковую вероятность 1/N. Тогда соответствие между объек- тами и значениями какого-либо их признака задает случайную величину = ^(со) как функцию на вероятностном простран-
Глава 9. Цепи Маркова 173 б) время дискретно. Далее будем изучать цепи Маркова с конечным или счет- ным числом состояний, как с дискретным, так и с непрерыв- ным временем. 9.2. Цепи Маркова с конечным числом состояний и дискретным временем В этом параграфе рассмотрим цепи Маркова: а) с пространством состояний S из конечного числа эле- ментов лх; б) с дискретным временем п, принимающем значения 0, 1, 2 и т.д. Обычно полагают, что элементы S занумерованы числами 1, 2, ..., т. Для таких цепей марковское свойство может быть записано в следующей форме: р(^+1)=/„+1К(И)=/п, ^-1)=^,..., ^(О)=/о) = = />(£(л+1)=хп+1|£(л)=/„). Однородными называются цепи Маркова, для которых ус- ловные вероятности Р(^(п + 1) = j | £(л) = I) не зависят от п. Таким образом, однородная цепь ведет себя с любого момента так же, как с начала (л = 0). Далее будем рассматривать только однородные цепи Маркова. Вероятности р = Р(^(п + 1) = j | ^(л) = /) называются пере- ходными вероятностями, а составленная из них матрица Р — матрицей переходных вероятностей: >11 Р\2 • Р\т р = Р21 Р22 Р2т УРт\ Рт2 Рmm t Поскольку в каждой строке матрицы записаны вероятности всех возможных переходов из выбранного состояния (в том чис- ле и вероятности того, что система останется в нем), эти перехо- ды образуют полную группу событий. Поэтому для каждой стро- ки имеет место равенство =1 для любого i = 1, 2, ..., т.
174 ЧАСТЬ I. Теория вероятностей Распределение ^(п) задается вектором р(п) = (р{(п), ..., рт(п)) где р,.(л) = = О- По формуле полной вероятности получаем р(п + 1) = р(п)Р. Начальным распределением цепи Маркова называется рас- пределение £(0), заданное соответствующим вектором р(0). Зная начальное распределение, можно найти р(п) при любом п > 0, последовательно вычисляя р(1) = р(0)Р, р(2) = р(1)Р и т.д. В общем случае получаем формулу Х»)=А0)Р'’. Отсюда следует, что вероятности Р^п) перехода из состоя- ния i в состояние j за время п можно найти как элементы л-й степени матрицы Р, т.е. (А(и)) = Р". Говорят, что из состояния i можно перейти в состояние у, если существует п, такое, что Р.^п) > 0. Если из состояния i мож- но перейти в состояние у, такое, что обратно вернуться нельзя, то состояние / называют несущественным', в противном случае — су- щественным. Если из состояния i можно перейти в у, а изу — в /, то такие состояния называют сообщающимися. Все существенные состояния цепи разбиваются на классы сообщающихся состояний (внутри каждого класса все состояния сообщаются между собой, но не сообщаются с состояниями других классов). Класс называется периодическим с периодом d, если для лю- бого состояния / из этого класса возможные времена возвраще- ния в него (т.е. такие п, что Ри(п) > 0) кратны некоторому числу d > 2. В противном случае класс называется апериодическим. Эргодической называется цепь Маркова, для которой суще- ствует предельное распределение л = (лр ..., лт): т п=\тЦп), £>,=1. 7 = 1 Если имеется лишь один класс сообщающихся состояний и он апериодический, то цепь Маркова является эргодической. Предельное распределение имеет важное практическое зна- чение, однако найти его из приведенной формулы затрудни- тельно, поэтому используется иной подход. Стационарным распределением цепи Маркова называется та- кое распределение, которое, будучи задано в качестве началь- ного, в дальнейшем останется неизменным. В таком случае го- ворят, что система находится в стационарном режиме.
Глава 9. Цепи Маркова 175 Для эргодических цепей Маркова стационарное распреде- ление существует и единственно, а самое главное — совпадает с предельным. Таким образом, если система изначально не на- ходится в стационарном режиме, она со временем (при п -> <ю) выходит на него. Стационарное распределение л = (лр ..., лт) легко найти из системы уравнений: Л = лР, = 1. >1 Следует отметить, что это система из т + 1 уравнений с т неизвестными, так что одно из уравнений (любое из первых т) можно исключить. Пример 1. Простейшая форма контроля качества продукции с переменным планом заключается в следующем. Устанавливается т различных объемов выборок (планов) в порядке убывания: nt > п2 > ... > пт, т > 2. Если в выборке из партии изделий обна- ружено хотя бы одно дефектное, партия бракуется. Схема кон- троля производства строится по следующему алгоритму. Первая партия изделий проверяется выборкой максимального объема лг Если она оказалась принятой, делается вывод о нормальном ходе производства, и для следующей партии переходят на вы- борку меньшего объема л2; в противном случае объем остается максимальным. При контроле партии выборками промежуточ- ного объема пк, 1 < к < т, в случае приемки партии переходят на выборку меньшего объема л4+1; в случае отбраковки — на выборку большего объема п^г При контроле партии выборкой минимального объема пт в случае приемки этот объем сохра- няется, в случае отбраковки переходят на выборку объема В рассматриваемой модели номер используемого плана (объема выборки) образует цепь Маркова, так как при из- вестном текущем значении его следующие значения не зави- сят от предыдущих. Пространство состояний в данном случае •S' = {1, 2, ..., т}. Обозначим через rt вероятность отклонить партию при объеме выборки лр 1 < i < т. Тогда переходные вероятности принимают вид: <, J = i -1> i > 1; 1 —г,, У = / + 1, i<m; PiJ rt, j = i = l; l-rm, j = i = m.
176 ЧАСТЬ I. Теория вероятностей — " —I Заметим, что если вероятность дефекта изделия е мала, то, г« ел.. Поэтому для простоты далее будем полагать г, = гпг Задача 1. На производстве используется система приемоч- ного контроля с переменным планом, где п{ — 20, п2 = 10, е = 0,01. Построить матрицу переходных вероятностей и найти стационарное распределение для номера плана. Решение. Здесь 5 = {1, 2}. Вычисляем г, = 0,2; гг = 0,1. Матрица переходных вероятностей имеет вид Р = 0,2 0,8 .0,1 0,9 Решаем систему уравнений для вектора л = (л1,л2): Л = TtP, Ttj + я2 = 1, или, более подробно, =0,2Л] 4- 0,1л2; л2 =0,8Л] +0,9л2; л, +л2 =1. Решая первое (или второе) уравнение совместно с третьим, получаем л = (1/9, 8/9). Задача 2. В городе Ромашкино каждый год 1% жителей переселяются в пригород, а 4% жителей пригорода — в город. Найти стационарное распределение в предположении, что об- щая численность населения остается постоянной. Решение. Будем считать, что живущий в городе находится в состоянии 1, а живущий в пригороде — в состоянии 2. Матрица переходных вероятностей имеет вид р (0,99 0,01' "(0,04 0,96 Решая систему уравнений Л! =0,99л| +0,04л2; л2 = 0,01л, +0,96л2; л1 + л2 = 1, получаем л = (0,8; 0,2). Таким образом, в стационарном режиме 80% живут в городе, 20% — в пригороде.
Глава 9. Цепи Маркова 177 Задача 3. Магазин электротоваров торгует холодильниками. Случайный спрос на холодильники за неделю имеет распреде- ление, заданное таблицей: Спрос 0 1 2 Р 0,2 0,5 0,3 Если холодильники заканчиваются, делается заказ на 2 штуки, который прибывает на следующей неделе. Построить матрицу переходных вероятностей. Найти стационарное рас- пределение числа холодильников в магазине. Решение. В данном случае будем нумеровать состояния от нуля (по числу холодильников), так что S = {0, 1, 2}. Матрица переходных вероятностей имеет вид Р = 0 0 1 0,8 0,2 0 0,3 0,5 0,2 X 7 7 ’ / Предполагаем, что неудовлетворенный спрос пропадает и не переносится на следующую неделю (т.е. если он составлял 2 штуки, а в магазине был только один холодильник, то систе- ма переходит в состояние 0, без каких-либо последствий). Решая систему уравнений л0 = 0,87с, + 0,Зл2; л( =0,2n, + 0,5л2; л2 = л0 + 0,2л2; Ло +Л| + л2 =1, получаем л » (0,330; 0,258; 0,412). Следует отметить, что ис- пользуемая в данном случае политика пополнения запасов не выглядит эффективной. Действительно, 33% времени товар от- сутствует, и магазин упускает возможную прибыль от продаж. 9.3. Цепи Маркова с непрерывным временем. Системы массового обслуживания В этом параграфе рассмотрим цепи Маркова: а) с пространством состояний S из конечного или счетного числа элементов; б) с непрерывным временем t > 0.
178 ЧАСТЬ I. Теория вероятностей Обычно полагают, что элементы S занумерованы числами 1, 2, ... Как и ранее, будем рассматривать только однородные цепи Маркова, свойства которых не зависят от времени. Интенсивностью перехода из состояния i в состояние j (/ # j) называется число Х1;, такое, что вероятность перехода из со- стояния i в состояние j за промежуток времени А/ равна At + о(ДГ) при Д/ -> 0. Предполагается, что вероятность более чем одного перехода за это время составляет о(Д?) при Д/ 0. Определим также формально величины Ч = -р,. имеющие смысл полных интенсивностей выхода из соответ- ствующих состояний. Тогда для вероятностей p.(t) = = 0 имеет место си- стема дифференциальных уравнений, называемых уравнениями Колмогорова: Эти уравнения могут быть решены исходя из начального распределения р(0). Определим матрицу Л = (\у), называемую матрицей интен- сивностей переходов, тогда уравнения перепишутся в виде />'(/) = ХОЛ. Как и ранее, нас будут интересовать эргодические цепи Маркова и предельные (стационарные) распределения. Поскольку в стацио- нарном режиме распределение не меняется (и производные равны нулю), оно может быть найдено из системы уравнений лЛ = 0, = 1 7=1 Если в цепи Маркова с непрерывным временем имеется только один класс сообщающихся состояний, а стационарное распределение существует и единственно, то такая цепь оказы- вается эргодической, и ее предельное распределение совпадает со стационарным. Типичной областью применения цепей Маркова с непрерыв- ным временем является теория массового обслуживания, зани- мающаяся изучением систем массового обслуживания, т.е. таких систем, в которых, с одной стороны, возникают массовые тре-
Глава 9. Цепи Маркова 179 бования на выполнение каких-либо услуг, а с другой — проис- ходит удовлетворение этих требований (по мере возможности). Система массового обслуживания включает в себя источник требований (внешний или внутренний) и обслуживающие при- боры (каналы обслуживания). Эту терминологию не следует понимать буквально. Так, в качестве требований могут выступать люди, предметы, доку- менты, файлы и пакеты данных и др.; в качестве обслуживаю- щих приборов — люди, станки, организации, компьютеры и др. Простейшим потоком событий называется такая последо- вательность событий (в непрерывном времени), когда интен- сивность наступления очередного события постоянна. Иначе говоря, существует такое X, что вероятность наступления со- бытия за промежуток времени А/ равна ХА/ + о(Д0 при АГ -> 0. Предполагается, что вероятность наступления более чем одно- го события за это время составляет о(А/) при А/ -> 0. Отсюда получается, что время до наступления события распределено показательно с тем же параметром X. Верно и обратное. Таким образом, если требования поступают в систему через показательно распределенные промежутки времени и времена об- служивания требований также показательно распределены, при- чем параметры остаются постоянными во времени, то данную си- стему можно описать цепью Маркова1. Далее будем полагать все случайные времена показательно распределенными по умолчанию. Пример 2. Машина требует наладки в среднем один раз в 0 единиц времени. Наладка занимает в среднем т единиц време- ни. Требуется найти стационарное распределение вероятностей застать машину в рабочем (1) и нерабочем (0) состоянии. Перейдем к интенсивностям: X = 1/9, ц = 1/т. Переход из состояния 0 в состояние 1 (наладка) имеет интенсивность ц, а переход из состояния 1 в состояние 0 (поломка) — интенсив- ность X. Матрица интенсивностей переходов имеет вид Решая систему уравнений лЛ = 0, л0 + л, = 1, получаем 1 На практике эти условия выполняются далеко не всегда. Однако по- лучаемые при указанных предположениях результаты можно использовать в качестве предварительных грубых оценок показателей работы системы.
180 ЧАСТЬ I. Теория вероятностей X т ц0 Лп =----=----, 71. =--=------• Х + ц т+0 Х + р т+0 В общем случае, если выходят из строя или обслуживаются параллельно несколько объектов, соответствующие интенсив- ности суммируются. Пример 3. В систему из л обслуживающих приборов по- ступает поток требований с интенсивностью X. Среднее время обслуживания равна т единиц времени. Если при поступлении требования все приборы заняты, оно становится в очередь. Состояния будем нумеровать по числу требований, нахо- дящихся в системе (как в очереди, так и на обслуживании). Пространство состояний S = {0, 1,2, ...} в данном случае бес- конечно и счетно. Введем интенсивность обслуживания ц = 1/т и величину р = Х/ц = Хт, называемую загрузкой системы. Она описывает, сколько в среднем новых требований поступит за время обслу- живания одного. Если р > п, то очередь требований растет до бесконечности, если же р < п, то система выходит на стацио- нарный режим. Интенсивности переходов имеют вид х — j=г+1; " [min(/,n)n, j=i—1, />0. Для данной системы рассчитаны, в частности, следующие показатели: 1) вероятность того, что все приборы свободны: _ 1уР* I Р" Г- 0 kzoX! л!(1- р/л) 2) вероятность того, что в системе находится ровно к тре- бований: £ к =77ло ПРИ 1 к < л; пк = р я0 при X > л; к\ п\п 3) вероятность того, что все приборы заняты: п>п =------—л0; л!(1 —р/л) 4) средняя длина очереди: рп>„ р"+| л-р л!л(1-р/л)2 '0-
Глава 9. Цепи Маркова 181 Пример 4. Бригада из п рабочих обслуживает т станков (п < т). Каждый станок требует наладки в среднем один раз в О единиц времени. Наладка занимает в среднем т единиц вре- мени. Если все рабочие заняты, наладка станка откладывается (ставится в очередь). Состояния будем нумеровать по числу требований (т.е. требующих наладки станков). Пространство состояний S = {0, 1,2, ..., т} в данном случае конечно. Как и ранее, положим X = 1/0, ц = 1/т, р = Х/ц = т/9. Интенсивности переходов имеют вид: (?л-/)Х, j = i + l, i<m\ lJ [min(z,n)p, j = Z —1, />0. Для данной системы рассчитаны, в частности, следующие показатели: 1) вероятность того, что все станки исправны: П т I”1 л0 = е——рк + 52 “т——р* ’ 0 [h^m-kyP к^пк-пп\(т-куУ 2) вероятность того, что бований: в системе находится ровно к тре- р*тг0 при 1 < к < л; т\ л, =-------- к к\(т-к)\ т\ к , . Ъ ло при к> п’ п п\(т-ку 3) средняя длина очереди: Е -----------7Т7Р я0- к=п+1" п'.(т-ку Задачи для самостоятельного решения 1. На производстве используется система приемочного контроля с переменным планом, где пх = 20, п2 = 10, л3 = 5. Найти стацио- нарное распределение, если: а) 8 = 0,01; б) 8 = 0,02. 2. Трудоспособное население (постоянной численности) делится на работающих и безработных. Вероятность потерять работу в течение месяца составляет 2%, а вероятность ее найти — 16%. Найти стационарный уровень безработицы. Во сколько раз со- кратится доля безработных, если благодаря государственной
182 ЧАСТЬ I. Теория вероятностей программе занятости вероятность найти работу в течение меся- ца увеличится вдвое? 3. Рабочие города Молотково трудятся на трех заводах. Вероятности ухода с каждого завода в течение месяца составляют 1, 6 и 9% со- ответственно. В случае ухода с одного завода рабочий переходит на один из двух других равновероятно. Найти стационарное распре- деление. Общая численность рабочих предполагается постоянной. 4. Решить уже рассмотренную задачу о холодильниках в предполо- жении, что вводится дополнительное правило: если в магазине остается один холодильник, делается заказ на еще один. 5. Мебельный магазин торгует шкафами. Случайный спрос на шкафы за неделю имеет распределение, заданное таблицей. Спрос 0 1 2 Р 0,3 0,6 0,1 Если шкафы заканчиваются, делается заказ на 2 штуки, если оста- ется один — на 1 штуку. Заказы прибывают на следующей неделе. Найти стационарное распределение числа шкафов в магазине. 6. В городе Традицино каждый взрослый мужчина имеет одну из трех профессий А, Б и В. Сыновья сохраняют профессии отцов с вероятностями 3/5, 2/3 и 1/4 соответственно или выбирают любую из двух других равновероятно. Найти: а) распределение по про- фессиям в следующем поколении, если в нынешнем профессию А имело 20%, Б — 30%, В — 50%; б) стационарное распределение по профессиям. Предполагается, что у каждого отца ровно один сын. 7. Торговец из города Олино ездит продавать товар в города Алино и Валино. Выехав из Олино, он направляется в Алино с веро- ятностью 40%, в Валино — с вероятностью 60%. Продав товар, он возвращается в Олино. Найти стационарное распределение вероятностей застать предпринимателя в каждом из городов. 8. Решить предыдущую задачу в предположении, что, посетив Алино или Валино, торговец возвращается в Олино с веро- ятностью 80% или едет в другой из двух городов (продавать оставшийся товар) с вероятностью 20%. 9. Фирма оценивает недельный объем сбыта как удовлетворитель- ный (1), хороший (2) или отличный (3). Матрица переходных вероятностей имеет вид: (0,7 а) 0,3 0,1 0,2 0,6 0,7 0,1 0,1 ; б) 0,2 0,4 0,1 0,6 0,5 0,1 0,7 0,2 0,2 0,2 Найти стационарное распределение объема сбыта фирмы.
Глава 9. Цепи Маркова 183 10. Продуктивность фермерского хозяйства в каждом году оцени- вается как хорошая (1), удовлетворительная (2) или плохая (3). Матрица переходных вероятностей имеет вид: 0,3 0,6 0,1 0,3 0,5 0,2 а) 0,1 0,6 0,3 ; б) 0,2 0,6 0,2 0,1 \ 0,4 0,5 7 0,1 0,5 0,4 Найти стационарное распределение продуктивности хозяйства. 11. В процессе ежемесячного погашения кредита клиент банка мо- жет оказаться в одном из следующих состояний: 1) ежемесячный платеж погашен в срок в полном объеме; 2) ежемесячный платеж погашен в полном объеме, но с вре- менной задержкой; 3) ежемесячный платеж погашен в срок в неполном объеме, с переходом остатка долга на следующий месяц; 4) ежемесячный платеж погашен с временной задержкой и в не- полном объеме, с переходом остатка долга на следующий месяц. Матрица переходных вероятностей имеет вид: 0,3 0,4 0,1 0,2 0,5 0,3 0,2 0 о \ 0 0,2 0,5 0,3 • ГЛ 0 0,4 0,4 0,2 а) 0 0 0,4 0,6 0 0 0,3 0,7 0 0 0 1 0 0 0 1 Вычислить вероятности состояний через три месяца, если в начале клиент находился в состоянии а). 12. Машина требует наладки в среднем один раз в 2 часа. Наладка занимает в среднем 15 минут. Найти стационарное распреде- ление вероятностей застать машину в рабочем (1) и нерабочем (0) состоянии. 13. Имеется 2 станка, каждый из которых требует наладки в сред- нем один раз в 2 часа. Наладка занимает в среднем 10 минут. Найти стационарное распределение числа работающих стан- ков. Предполагается, что станки требуют наладки и обслужи- ваются независимо один от другого. 14. Машина состоит из трех узлов, каждый из которых отказывает с интенсивностью X = 2. Интенсивность восстановления отка- завшего узла равна ц = 3. Найти стационарное распределение числа работающих узлов. 15. Машина состоит из трех узлов. Среднее время безотказной работы каждого узла составляет 20 часов, а среднее время ре- монта узла — 5 часов. Найти среднюю производительность
184 ЧАСТЬ I. Теория вероятностей машины, если при трех работающих узлах она равна 100%, при двух — 50%, а при одном или менее машина вообще не работает. 16. В ремонтной мастерской трудятся 5 мастеров. В течение дня на ремонт поступает в среднем 10 изделий, а каждый мастер успевает отремонтировать в среднем 2,5 изделия. Предполагая, что мастерская работает в стационарном режиме, найти: а) ве- роятность того, что все мастера свободны; б) вероятность того, что все мастера заняты; в) среднюю длину очереди; г) среднее число мастеров, свободных от работы. 17. В ремонтную мастерскую, где работают 3 мастера, поступает в среднем 4 заказа в час. Среднее время выполнения заказа составляет полчаса. Определить среднее число заказов, ожида- ющих начала выполнения. 18. Рабочий обслуживает группу из 3 автоматов. Каждый автомат тре- бует обслуживания в среднем раз в полчаса. Обслуживание зани- мает в среднем 12 минут. Найти: а) стационарное распределение числа неисправных автоматов; б) среднее число автоматов, ожида- ющих обслуживания; в) среднее число простаивающих автоматов. 19. Двое рабочих обслуживают машину, состоящую из 4 блоков. Каждый блок требует обслуживания в среднем один раз в 2 часа. Обслуживание занимает в среднем 15 минут. Найти: а) стационарное распределение числа работающих блоков; б) среднюю длину очереди; в) среднее число занятых рабочих. 20. В кассу обращаются клиенты, в среднем по одному за 10 минут. Сколько в среднем времени должно занимать обслуживание одного клиента, чтобы средняя длина очереди в стационарном режиме не превышала: а) 2 человека; б) 5 человек? 21. В конторе три сотрудника принимают посетителей в порядке обшей очереди. В среднем обращается по 5 человек в час, обслуживание каждого занимает в среднем 18 минут. Найти: а) вероятность того, что все сотрудники свободны; б) веро- ятность того, что все сотрудники заняты; в) среднюю длину очереди. 21. На железнодорожную сортировочную станцию поступает в сред- нем 2 состава в час. Обслуживание (расформирование) состава занимает в среднем 20 минут. В парке прибытия станции есть два пути, на которых производится обслуживание; если оба пути заняты, составы ожидают на внешних путях. Найти: а) вероят- ность того, что все пути свободны; б) среднюю длину очереди.
Часть II МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Глава 9 ЦЕПИ МАРКОВА 9.1. Основные определения Случайным процессом называется функция двух переменных с(/, со), где t е Т — время, шей- элементарный исход. Время может быть непрерывным или дискретным (целочисленным). Случайный процесс ставит в соответствие каждому моменту времени t е Т случайную величину ^(/) = ^(/, со) как функцию от со е Q. Поэтому процесс обычно для краткости обозначают £,(/). Пусть заданы моменты времени 0 < Г, < t2 < ... < tn< tn+i < ... < < tn+m, n, m > 0, и A — любое событие (утверждение), относя- щееся к случайным величинам ^(/j), ..., ^(/л ])’ В ~ относяще- еся к ^(/я+1), ..., ^(/я+я1), С — относящееся к £(/n). Говорят, что процесс обладает марковским свойством, если для него всегда выполняется равенство Р(В\АС) = Р(В\С), или (в эквивалентной форме) Р(АВ\С) = Р(А\С)Р(В\С). Марковское свойство означает, что будущее поведение про- цесса не зависит от его прошлого при условии, что известно настоящее (т.е. текущее значение процесса). Марковским процессом называется случайный процесс, об- ладающий марковским свойством. Пространством состояний S случайного процесса называется множество всех возможных значений функции £,(/, со). Цепью Маркова называется марковский процесс, для кото- рого выполнено хотя бы одно из следующих двух условий: а) пространство состояний конечно или счетно;
188 ЧАСТЬ II. Математическая статистика стве (согласно аксиоматике А.Н. Колмогорова). Числовые ха- рактеристики введенной формально случайной величины от- ражают важные свойства совокупности исследуемых объектов. В частности, ее математическое ожидание равно среднему значению признака, а функция распределения /^(х) = Р(£ < х) показывает долю объектов, для которых значение признака меньше х. Например, в социально-экономических исследованиях нас могут интересовать средний доход на душу населения, доля лю- дей с доходами меньше прожиточного минимума и т.п. Распределение £ часто называют распределением генеральной совокупности. Будем последовательно извлекать из генеральной совокуп- ности ее элементы, выбирая их случайным образом (наудачу), измерять и записывать значения некоторого признака для них: хр х2, ..., хп. Эти значения называются наблюдениями (призна- ка), их набор — выборкой, а число сделанных наблюдений — объемом выборки п. Понятно, что наблюдения представляют собой случайные величины, в силу случайности нашего вы- бора объекта. Они заданы уже на другом вероятностном про- странстве — на множестве всех вариантов выбора п элементов из генеральной совокупности. Полученные данные называют наблюдениями случайной величины а также говорят, что слу- чайная величина £ «принимает значения» хр х2, ..., хл. Основная задача математической статистики — сделать на- учно обоснованные выводы о распределении одной или более неизвестных случайных величин или их взаимосвязи между со- бой. Выборочным методом называется метод решения этой задачи посредством анализа выборки, полученной в результате много- кратных наблюдений. Для того чтобы характеристики случайной величины, по- лученные выборочным методом, были объективны, необхо- димо, чтобы выборка была репрезентативной, т.е. достаточно хорошо представляла исследуемую величину. В силу закона больших чисел можно утверждать, что выборка будет репре- зентативной, если ее осуществить случайно, т.е. все объекты генеральной совокупности имеют одинаковую вероятность по- пасть в выборку. Для этого существуют различные виды от- бора выборки.
Глава 10. Основные понятия и задачи математической статистики 189 1. Простым случайным отбором называется отбор, при ко- тором объекты извлекаются по одному из всей генеральной совокупности (случайным образом). 2. Механическим называется такой, при котором генераль- ную совокупность делят на столько частей, сколько объектов должно войти в выборку, и из каждой группы случайным об- разом отбирают один объект. 3. Серийным называется отбор, при котором объекты из ге- неральной совокупности отбираются «сериями», которые под- вергаются сплошному обследованию. 4. Стратифицированный (расслоенный) отбор заключается в том, что исходная генеральная совокупность объема N подраз- деляется на подсовокупности (страты) Nv N2, ..., Nk, так что N} + N2 + ... + Nk- N. Когда страты определены, из каждой из них извлекается простая случайная выборка объема ир п2, .... пк. Частным случаем стратифицированного отбора является типи- ческий отбор, при котором объекты отбирают не из всей гене- ральной совокупности, а из каждой типической ее части. Комбинированный отбор сочетает в себе сразу несколько ви- дов отбора, образующих различные фазы выборочного обсле- дования. Существуют и другие методы организации выборки. Выборка называется повторной, если отобранный объект перед выбором следующего возвращается в генеральную сово- купность. Выборка называется бесповторной, если отобранный объект в генеральную совокупность не возвращается. Для ко- нечной генеральной совокупности случайный отбор без воз- вращения на каждом шаге приводит к зависимости отдельных наблюдений, случайный равновозможный выбор с возвращени- ем — к независимости наблюдений. На практике обычно имеют дело с бесповторными выбор- ками. Тем не менее, когда объем генеральной совокупности N во много раз больше, чем объем выборки п (например, в сотни или тысячи раз), зависимостью наблюдений можно пренебречь. Таким образом, в математической статистике наблюдения хр х2, хп моделируются независимыми случайными величина- ми с одинаковым распределением — тем же, что и у исходной случайной величины Иногда рассматриваются по-разному распределенные на- блюдения (например, в случае неравноточных измерений), а иногда — и зависимые наблюдения, но все эти случаи огова- риваются особо.
190 ЧАСТЬ II. Математическая статистика Бывают ситуации, когда затруднительно или невозможно описать объекты, чьи признаки мы наблюдаем. Речь идет об измерении какой-либо величины, которая меняет свое значе- ние случайным образом от одного наблюдения к другому. Это могут быть, например, колебания в ценах акций, курсах валют, случайные ошибки измерения и т.п. В качестве «объекта» вы- ступает некоторое стечение обстоятельств, которые в принципе могли сложиться различным образом. В этих случаях тем не менее все равно применяют изложенную выше статистическую модель, хотя «выбор» здесь осуществляется без личного участия исследователя, какими-то внешними силами. Как уже было отмечено, случайная величина £, имеет опре- деленную функцию распределения F^x) и другие числовые ха- рактеристики, которые будем называть теоретическими, в от- личие от выборочных, которые определяются по наблюдениям. Ряд наблюдений, упорядоченных по возрастанию, называют вариационным радом. Его члены обычно обозначают х(1), х(2),..., х(л). Наименьшее и наибольшее значения (минимум и максимум) обозначают xmjn и хтах и называют их крайними членами вариа- ционного рада. Различные значения признака, появившиеся в процессе наблюдения, называют вариантами. Варианты, как и наблюдения, обозначаются через хр ..., хл. Когда мы наблюдаем дискретную случайную величину, она может принимать одни и те же значения по много раз. Поэтому для экономии места и времени каждое значение записывают только один раз, с указанием, сколько всего раз оно появилось. Число и(, показывающее, сколько раз появилось значение х( в п наблюдениях, называют частотой данного значения, а отно- шение wt = njn — относительной частотой. Число к различных значений в п наблюдениях всегда конечно, и к < п. Очевидно, ft к имеют место равенства ^,nt=n и =1. Результаты можно записать в таблицу: ,=1 /=1 Х2 Х„ W1 W2 Wt В случае непрерывной случайной величины на практике часто применяют группировку. Это означает, что весь интервал наблюдаемых значений разбивают на к частичных интервалов [с0, с,), [ср с2), [с* р cj равной длины h и затем подсчитыва-
Глава 10. Основные понятия и задачи математической статистики 191 ются числа попаданий наблюдений в эти интервалы, которые принимают за частоты л. (для некоторой новой, уже дискрет- ной случайной величины). В качестве новых значений вариант х(. обычно берут середины интервалов (либо в таблице указы- вают сами интервалы). Группировка может применяться и в случае дискретных случайных величин, если шаг, с которым меняются их значения, кажется нам слишком мелким. Согласно формуле Стерджеса рекомендуемое число интер- валов разбиения к * 1 + log2«, а длины частичных интервалов А ~ (Xmax— Предполагается, что весь интервал имеет вид lXmin> XmJ- Понятно, что группировка связана с потерей части полез- ной информации, заключенной в выборке. Однако она имеет и свои преимущества. Оценим величину экономии, например, для п = 106 наблюдений. Рекомендуемое число интервалов к = 21, и от нас требуется сохранить и обработать лишь 2к = 42 числа вместо миллиона! Ю.2. Графическое представление статистических рядов Набор вариант х( (или частичных интервалов) и их относи- тельных частот wt называют статистическим радом. Графически статистические ряды могут быть представлены в виде полигона, гистограммы или графика накопленных частот. Полигоном частот называют ломаную линию, отрезки ко- торой соединяют точки (хр пх), (х2, л2), ..., (xt, л4). Полигоном относительных частот называют ломаную, отрезки которой со- единяют ТОЧКИ (хр W]), (х2, w2), ..., (xt, wt). Полигоны обычно служат для изображения выборки в случае дискретных случай- ных величин (рис. 10.1). Рис. 10.1
192 ЧАСТЬ II. Математическая статистика Задача 1. Построить полигон частот по данному распреде- лению выборки: х, 2 3 5 6 п> 10 15 5 20 Рис. 10.2 Решение. Отложим на оси абсцисс (рис. 10.2) варианты хр а на оси ординат — соответствующие им частоты л затем со- единим последовательно точки (х(, и,). Гистограммой относительных частот1 (или просто гисто- граммой) называется ступенчатая фигура, состоящая из прямо- угольников, основанием которых служат частичные интервалы длиною А, а высоты равны w(/A. Гистограмма обычно служит для изображения выборки в случае непрерывных случайных ве- личин. Площадь гистограммы равна единице (рис. 10.3). Поэтому гистограмму можно рассматривать как график эм- пирической (выборочной) плотности распределения ря{х). Если у теоретического распределения F существует конечная плот- ность, то эмпирическая плотность является некоторым при- ближением для теоретической. В этом и состоит практическая польза гистограммы. При построении гистограмм в реальных исследованиях сле- дует понимать, что формула Стерджеса (как и любая другая) для числа интервалов разбиения к. дает лишь рекомендацию, а не строгое правило. Проблема выбора этого числа заключается 1 На практике гистограммами также называют ступенчатые фигуры с высотами w (без деления на й), как на рис. 10.3.
Глава 10. Основные понятия и задачи математической статистики 193 в следующем. При слишком малых к гистограмма получает- ся слишком грубой, «смазанной», плохо отражающей свойства распределения. При слишком больших к гистограмма стано- вится «колючей» и в конце концов распадается на отдельные «иглы» (узкие столбцы) вперемешку с пустыми интервалами. Оптимальное значение в общем случае неизвестно — оно за- висит как от типа распределения, так и от конкретной выбор- ки. Что касается концов интервалов и значений вариант, то для человеческого восприятия удобнее, чтобы они выражались более или менее «круглыми» числами. Поскольку гистограммы теперь обычно строят не вручную, а на компьютере, исследователь легко может варьировать па- раметры гистограммы (нижнюю и верхнюю границы интерва- ла, число частичных) и в конечном счете выбрать тот вариант, при котором, по его мнению, график выглядит лучше всего. Графиком накопленных частот называется фигура, строяща- яся аналогично гистограмме с той разницей, что для расчета высот прямоугольников берутся не простые, а накопленные от- носительные частоты, т.е. величины wf = УХ- Эти величины /=1 не убывают, и таким образом, график накопленных частот име- ет вид ступенчатой «лестницы» (от 0 до 1). График накопленных частот и эмпирическая функция рас- пределения на практике используются для приближения теоре- тической функции распределения (рис. 10.4). Задача 2. Анализируется выборка из 100 малых предпри- ятий региона. Цель обследования — измерение коэффициента соотношения заемных и собственных средств (х() на каждом /-м предприятии. Результаты представлены в табл. 10.1. Таблица 10.1 Коэффициенты соотношений заемных и собственных средств предприятий 5,56 5,45 5,48 5,45 5,39 5,37 5,46 5,59 5,61 5,31 5,46 5,61 5,11 5,41 5,31 5,57 5,33 5,11 5,54 5,43 5,34 5,53 5,46 5,41 5,48 5,39 5,11 5,42 5,48 5,49 5,36 5,40 5,45 5,49 5,68 5,51 5,50 5,68 5,21 5,38 7* Теория вероятностей
194 ЧАСТЬ II. Математическая статистика Окончание табл. 10.1 5,58 5,47 5,46 5,19 5,60 5,63 5,48 5,27 5,22 5,37~ 5,33 5,49 5,50 5,54 5,40 5,58 5,42 5,29 5,05 5,79 5,79 5,65 5,70 5,71 5,85 5,44 5,47 5,48 5,47 5,55 5,67 5,71 5,73 5,05 5,35 5,72 5,49 5,61 5,57 5,69 5,54 5,39 5,32 5,21 5,73 5,59 5,38 5,25 5,26 5,81 5,27 5,64 5,20 5,23 5,33 5,37 5,24 5,55 5,60 5,51 Требуется построить гистограмму и график накопленных частот. Решение. Построим группированный ряд наблюдений. 1. Определим в выборке xmin = 5,05 и хтах = 5,85. 2. Разобьем весь диапазон [xmin хтах] на к равных интер- валов: к « 1 + log2100 = 7,62; к « 8, отсюда длина интервала fa _ *max ~*min _ 5,85 — 5,05 _ q j к ~ 8 “ ’ ’ Таблица 10.2 Сгруппированный ряд наблюдений Номер интервала Интервал Середина интервала х{ Ч /.(»> 1 5,05-5,15 5,1 0,05 0,05 0,5 2 5,15-5,25 5,2 0,08 0,13 0,8 3 5,25-5,35 5,3 0,12 0,25 1,2 4 5,35-5,45 5,4 0,20 0,45 2,0 5 5,45-5,55 5,5 0,26 0,71 2,6 6 5,55-5,65 5,6 0,15 0,86 1,5 7 5,65-5,75 5,7 0,10 0,96 1,0 8 5,75-5,85 5,8 0,04 1,00 0,4 На рис. 10.3 и 10.4, построенных по данным табл. 10.1 с помощью статистического пакета STATISTICA, представлены гистограмма и график накопленных частот. Кривые соответ- ствуют плотности и функции нормального распределения, «по- добранного» к данным.
Глава 10. Основные понятия и задачи математической статистики 195 Наблюдения Рис. 10.3 Наблюдения Рис. 10.4 10.3. Эмпирические законы распределения Эмпирической функцией распределения (или функцией рас- пределения выборки) называют функцию Fn(x), определяющую Для каждого числа х относительную частоту события < х, т.е. /’„(х) = njn, где пх — число наблюдений, меньших х, п — объ- ем выборки.
196 ЧАСТЬ II. Математическая статистика Иначе говоря, эмпирической функцией распределения на- зывают функцию, определяющую для каждого числа х долю из п наблюдений, меньших х. Из определения следует, что значения эмпирической функ- ции распределения при каждом х являются случайными вели- чинами. В отличие от эмпирической функции распределения, функцию распределения F^x) генеральной совокупности назы- вают теоретической функцией распределения. Эмпирическая функция распределения обладает всеми свой- ствами обычной функции распределения, а также некоторыми специфическими: 1. О <Fn(x) <1. 2. Fn(x) — неубывающая функция. 3. Fn(x) непрерывна слева. 4. Fn(x) = 0 при х < xmin и Fn(x) = 1 при х > хтах. 5. Р( lim sup | F (x) — Дх)| = 0) = 1 (теорема Гливенко—Кан- X л—+эс n телли). Доказательство теоремы Гливенко—Кантелли является до- вольно сложным, поэтому докажем следующий ее упрощенный вариант. Теорема 1. При любом е > 0 верно lim Р{ | Fn(х) — Дх) | < е) = 1 для любого х. Доказательство. По определению Д(х) = —, где пх — число п наблюдений, меньших х. Рассмотрим наблюдения как п неза- висимых испытаний Бернулли, в каждом из которых возможны два исхода: {xt<x} или {xt>x}. Вероятности этих событий равны р = P(t, < х) = Дх) и q = Р(£, > х) = 1 — F(x) соответственно. Событие {хл<х} можем называть успехом, тогда пх — число успе- хов в п независимых испытаниях Бернулли. Следовательно, ма- тематическое ожидание Мпх = пр и дисперсия Dnx = npq. Отсюда . 1 JZ nF(x) MF (х) = —Мп =------= F(x); п п np(V\- 1 пи _nF(x)(\-F(x)) _F(x)(\-F(x)) Ur \Х) -ОП 2 П П П В силу неравенства Чебышева для любого е > 0 верна оценка P(\Fn{x) - Дх)| >е) <
Глава 10. Основные понятия и задачи математической статистики 197 поэтому Лк(х) - Дх)| >с) < о, Л —> оо, пг откуда следует утверждение теоремы. Смысл теоремы Гливенко—Кантелли заключается в том, что при увеличении объема выборки п у эмпирической функции распределения исчезают свойства случайности, и она прибли- жается к теоретической функции распределения. Эмпирическая функция распределения служит оценкой функции распределе- ния генеральной совокупности. График эмпирической функции распределения есть неубы- вающая ступенчатая кривая со скачками, равными \/п в точ- ках вариационного ряда (если значения не совпадают). Если п. точек вариационного ряда совпадают и равны хр то скачок в точке х. равен njn. Задача 3. Задана таблица наблюдений случайной величины х, 2 3 5 п, 75 20 5 0,75 0,2 0,05 Эмпирическая функция распределения имеет вид: О, если х < 2; 0,75, если 2<х<3; 0,95, если 3<х<5; 1, если х > 5. Ее график представлен на рис. 10.5. Рис. 10.5
198 ЧАСТЬ II. Математическая статистика -- === -- — =====^=====д^ Дтя непрерывной случайной величины лучшую оценку плотности распределения р(х) дает полигон относительных ча- стот. Таким образом, закон распределения выборки является некоторым приближением закона распределения генеральной совокупности. Задача 4. Пусть хр х2, ..., хп — выборка независимых наблю- дений из непрерывной генеральной совокупности с функцией распределения F(x) и плотностью распределения р(х). Найти функции распределения и плотности распределения крайних членов вариационного ряда: xmjn и хтах. Решение. Из определения функции распределения следует, что W = Р^х™* <У)= Р^ <У, х2<у,...,х„<у) = Р"(х1 <у) = К" (у). Тогда рх (у) = [Гх (у)]’=[^(у)Г = л^"-,(у) ГЕ'(у) = л^',"'(у) р£(у). Аналогично W = -P^min < У) = 1 - Лхт1п У) = 1 - Л*1 > У, Х2 > У,..., X, > у) = Отсюда получаем функцию плотности •н^)М1-ж' Р^УУ Задача 5. Построить гистограмму- частот по данному рас- пределению выборки: Номер интервала i Частичный интервал Число наблюдений, попавших в интервал, п1 1 2-7 5 2 7-12 10 3 12-17 25 4 17-22 6 5 22-27 4 Решение. Найдем сначала плотности частот, т.е. величины л/й. Для данного примера h = 5.
Глава 10. Основные понятия и задачи математической статистики 199 Таким образом, получаем: Номер интервала i Плотность частоты n/h 1 1 2 2 3 5 4 1,2 5 0,8 Отложим на оси абсцисс (рис. 10.6) интервалы длиной h = 5 каждый, а затем проведем над ними отрезки, параллель- ные оси х, на расстояниях от нее, равных соответствующим значениям плотности частоты (ось ординат). Задача 6. Построить гистограмму относительных частот по заданному распределению выборки: Номер интервала i Частичный интервал Число наблюдений, попавших в интервал, nt 1 10-15 2 2 15-20 4 3 20-25 8 4 25-30 4 5 30-35 2 Решение. Найдем относительные частоты и плотности от- носительных частот:
200 ЧАСТЬ II. Математическая статистика Частота wt Плотность относительных частот w^h w, = л/л = 2/20 = 0,1 w}/h = 0,1/5 = 0,02 w2 = п2/п = 4/20 = 0,2 w2/h = 0,2/5 = 0,04 и>3 = л3/л = 8/20 = 0,4 w/A = 0,4/5 = 0,08 и-4 = = 4/20 = 0,2 w/A = 0,2/5 = 0,04 Ws = ns/n = 2/20 = 0,1 w/A = 0,1/5 = 0,02 Построим на оси абсцисс (рис. 10.6) частичные интервалы h = 5, затем проведем параллельно им отрезки, отстоящие от оси х на соответствующие значения плотности относительной частоты. Задачи для самостоятельного решения 1. Сколько частичных интервалов можно порекомендовать в слу- чае объема выборки: а) п = 200; б) п = 500? 2. Построить полигон частот по следующему распределению вы- борки: x, 15 20 25 30 35 n. 1 10 15 30 20 25 3. В таблице представлены данные по числу сделок на фондовой бирже за квартал для 400 инвесторов. xt 0 1 2 3 4 5 6 7 8 9 10 n I 146 97 73 34 23 10 6 3 4 2 2 Построить полигон относительных частот.
Глава 10. Основные понятия и задачи математической статистики 201 4. Построить гистограмму частот по следующему распределению выборки. Номер интервала i Частичный интервал Число наблюдений, попавших в интервал, nt 1 3-5 4 2 5-7 6 3 7—9 20 4 9-11 40 5 11-13 20 6 13-15 4 7 15-17 6 5. Построить гистограмму относительных частот по следующему распределению выборки: Номер интервала i Частичный интервал Число наблюдений, попавших в интервал, nt 1 2-5 6 2 5-8 10 3 8-11 4 4 11-14 5 6. Построить полигон относительных частот по следующему рас- пределению выборки: х, 2 4 5 7 10 w. 0,15 0,2 0,1 0,1 0,45 7. Для изучения распределения заработной платы работников определенной отрасли обследовано 100 человек. Результаты представлены в следующей таблице. Заработная плата в долларах США Число человек Заработная плата в долларах США Число человек 190-192 1 200-202 19 192-194 5 202-204 11 194-196 9 204-206 4 196-198 22 206-208 1 198-200 28 208-210 0 Построить гистограмму и график накопленных частот.
202 ЧАСТЬ II. Математическая статистика 8. В ОТК были измерены диаметры 300 валиков из партии, изго- товленной одним станком-автоматом. Отклонения измеренных диаметров от номинала (нм) даны в таблице: Границы отклонений Середина интервала Число валиков Границы отклонений Середина интервала Число валиков -30...-25 -27,5 3 0-5 2,5 55 -25...-20 -22,5 8 5-10 7,5 30 —20...—15 “17,5 15 10-15 12,5 25 — 15...—10 “12,5 35 15-20 17,5 14 -10...-5 -7,5 40 20-25 22,5 8 —5...0 -2,5 60 25-30 27,5 7 Построить гистограмму и график накопленных частот. 9. В таблице представлены данные о месячном доходе жителя региона (руб.) по выборке из 1000 жителей: х! Менее 500 500-1000 1000-1500 1500-2000 2000-2500 Свыше 2500 ni 58 96 239 328 147 132 Построить гистограмму и график накопленных частот. Указание, В качестве верхней границы последнего интервала ис- пользовать 3000. 10. В таблице представлены данные об удое 100 коров на молоч- ной фирме за лактационный период (ц): Х, 4-6 6-8 8-10 10-12 12-14 14-16 16-18 18-20 20-22 22-24 24-26 П' 1 3 6 11 15 20 14 12 10 6 2 Построить гистограмму и график накопленных частот. 11. Проведено исследование посещаемости популярного интер- нет-сайта. Много часов подряд регистрируется число посети- телей, посетивших сайт в течение данного часа. Результаты исследования представлены в таблице: Число посетителей Время, ч Число посетителей Время, ч 0 57 7 139 1 203 8 45 2 383 9 27 3 525 10 10 4 532 11 4 5 408 12 1 6 273 14 1 Построить полигон относительных частот.
Глава 10. Основные понятия и задачи математической статистики 203 12. Проведено исследование посещаемости популярного интернет- сайта. Много часов подряд регистрируется число посетителей, посетивших сайт в течение данного часа. Результаты исследо- вания представлены в таблице: Число посетителей Время, ч Число посетителей Время, ч 0 12 7 103 1 108 8 24 2 316 9 13 3 551 10 2 4 632 11 0 5 492 12 0 * 273 14 0 Построить полигон относительных частот. 13. Построить гистограмму и график накопленных частот по дан- ному распределению выборки. Номер интервала i Частичный интервал Число наблюдений, попавших в интервал, nt 1 2-7 5 2 7-12 10 3 12-17 25 4 17-22 7 5 22-27 5 14. Результаты исследования прочности 200 образцов на сжатие представлены в виде интервального статистического ряда в та- блице: Номер интервала i Частичный интервал Число наблюдений, попавших в интервал, п{ 1 190-200 10 2 200-210 26 3 210-220 58 4 220-230 64 5 230-240 30 6 240-250 14 Построить гистограмму и график накопленных частот.
204 ЧАСТЬ II. Математическая статистика 15. Построить гистограмму, полигон относительных частот и гра- фик накопленных частот по заданному распределению вы- борки: Номер интервала i Частичный интервал Число наблюдений, попавших в интервал, nt 1 10-15 2 2 15—20 4 3 20-25 8 4 25-30 5 5 30-35 3 16. Пассажир, приходящий в случайные моменты времени на авто- бусную остановку, в течение 5 поездок фиксировал свое время ожидания автобуса: 5,1; 3,7; 1,2; 9,2; 4,8 (мин.). Найти эмпири- ческую функцию распределения и построить ее график. 17. При измерении веса 10 шоколадных батончиков (г) получены значения: 49,1; 50,0; 49,7; 50,5; 48,1; 50,3; 49,7; 51,6; 48,1; 50,1. Найти эмпирическую функцию распределения и построить ее график.
Глава ii ТОЧЕЧНЫЕ ОЦЕНКИ ПАРАМЕТРОВ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ Н.1. Выборочные характеристики и точечные оценки Выборочными характеристиками называются функции от на- блюдений, приближенно оценивающие соответствующие число- вые характеристики случайной величины. В случае равноточ- ных измерений в качестве оценок математического ожидания, дисперсии, начальных и центральных моментов используются следующие выборочные характеристики: 1 ” 1) выборочное среднее — х = — V*х "7^ Iя 2) выборочные дисперсии — ст2 = — У'(х. - х)2; «"Д' п~1 /=1 3) выборочные начальные моменты fc-го порядка — 1 п ак = — Ух-', 4) выборочные центральные моменты fc-го порядка — ц* = -£(*,-х)*. И /=1
206 ЧАСТЬ II. Математическая статистика ’ В качестве других используемых на практике выборочных характеристик можно назвать выборочную моду Xmod, равную значению варианты с наибольшей частотой, и выборочную ме- диану Xmed, равную значению, стоящему в середине вариаци- онного ряда (либо полусумме двух значений, с номерами к и к + 1, при четном числе наблюдений п = 2к). Иногда рассматриваются такие числовые характеристики распределения, как коэффициент вариации V= асимме- трия р = ц3/ст3и эксцесс у = ц4/о4-3. Им также соответствуют выборочные характеристики: выборочный коэффициент вариа- ции Р = $/х, выборочная асимметрия р = ц3/$3, выборочный эксцесс Y = Д4 - 3. Все эти характеристики не совпадают с соответствующи- ми характеристиками генеральной совокупности, поскольку являются случайными величинами. Распределение указанных случайных величин однозначно определяется распределением генеральной совокупности. Заметим также, что вычисление выборочных характеристик для какого-либо набора полученных в исследовании данных может быть полезно даже без предположения, что наблюдения представляют собой независимые и одинаково распределенные случайные величины. Точечными оценками параметров распределения называются функции от наблюдений, предназначенные для приближенно- го оценивания этих параметров. Если распределение параме- тризуется какими-то числовыми характеристиками (например, нормальное распределение однозначно задается своими мате- матическим ожиданием и дисперсий), то соответствующие вы- борочные характеристики являются их точечными оценками. Чтобы статистические оценки давали «хорошие» прибли- жения оцениваемых параметров, они должны удовлетворять определенным требованиям. Эти требования заключаются в том, что оценка должна быть состоятельной, несмещенной и желательно эффективной. Оценка 0л называется состоятельной, если при неограни- ченном увеличении выборки она сходится по вероятности к оцениваемому параметру: limP(|0„ — G|<e) = 1 для любого е > 0.
Глава 11. Точечные оценки параметров законов распределения 207 Свойство состоятельности — асимптотическое, оно может проявляться и при столь больших объемах выборки, которых на практике не встречается. Оценка 0„ называется несмещенной (оценкой без система- тической ошибки), если ее математическое ожидание при лю- бом п равно оцениваемому параметру: м0„ = 0. Несмещенность оценки характеризует ее «доасимптотические» свойства, т.е. является показателем ее «хороших» свойств при любом конеч- ном объеме выборки. Оценка называется эффективной (в некотором классе оце- нок), если она имеет минимальную дисперсию в этом классе. Задача 1. Найти выборочное среднее по выборке объема п = 20. 2560 2600 2620 2650 2700 п< 2 3 10 4 1 Решение. Для упрощения расчетов перейдем к условным ва- риантам ut = xf— 2620. -60 -20 0 30 80 л/ 2 3 10 4 1 Тогда й = [2(-60) + 3(-20) + 10-0 +1 80]/20 = 1 и х = 2620 + + й = 2621. Замечание. В качестве числа, которое вычитается при пере- ходе к условным вариантам (условный нуль), обычно выбира- ется варианта, стоящая в середине ряда, либо та, для которой частота максимальна (выборочная мода). В данном примере они совпадают. 11.2. Статистическая устойчивость основных выборочных характеристик На практике важно знать, насколько выборочные характе- ристики отличаются от истинных значений характеристик ге- неральной совокупности.
208 ЧАСТЬ II. Математическая статистика Пусть £ имеет характеристики = a, D^ = а2, Mtk = ак, М(Е, - №)к = F(x) = Р(£, < х). Соответствующими выбороч- ными характеристиками будут х, а2, s2, а*, ц*, F„(x)- Докажем, что х является несмещенной и состоятельной оценкой математического ожидания. При этом воспользуемся известным неравенством Чебышева (см. гл. 8) Р(| п - ЛГг| | > е) < £ справедливым для любой случайной величины г| (имеющей ма- тематическое ожидание и дисперсию) и любого фиксированно- го £ > 0. Вычислим математическое ожидание и дисперсию выбороч- ного среднего: > <— Azf 1 V* 'I 1 V* Мх = М\ — > х, \ = = — = а> J П так как Мх,= М%, т.е. выборочное среднее является несмещен- ной оценкой математического ожидания. Далее, Dx = D\ —Ух{ \ = —^\Dx. =—— =-->0 при л -> оо, ) п п п так как Z)x = D^. Отсюда в силу неравенства Чебышева для любого фикси- рованного £ > О Р(\х-а|>£)<^Д = -^у -> 0 при п оо. £ Л£ Итак, среднее арифметическое выборки х сходится по ве- роятности к математическому ожиданию случайной величины, т.е. является состоятельной оценкой математического ожида- ния. Аналогично доказывается состоятельность оценок других начальных моментов ак • Вычислим математическое ожидание выборочных началь- _ г 1 V"'' к 1 1 1/ к П&-к ных моментов: Мак =М [-> х.*] = -\Л/х = —L = a. . п Следовательно, выборочные начальные моменты являются несмещенными оценками теоретических начальных моментов. Очевидно, что для любого к справедливо равенство Р(^) = Л/(е) - (Л/^)2 = *2к - а/.
Глава 11. Точечные оценки параметров законов распределения 209 Учитывая, что xi независимые случайные величины, полу- чим соотношение Dak = £)(—Ух*) = -^У.Ох* = ——--+0 при п -> оо, Л п что является достаточным условием для сходимости по вероят- ности. Действительно, в силу неравенства Чебышева для любо- го фиксированного 8 > О П/ I "" I \ ®"2к ^к л Л I ак - aj > 8) < —— = -^—А- -> о при л -> оо, 8 М8 \ т.е. выборочный начальный момент а.к к-го порядка является состоятельной оценкой начального момента ак генеральной со- вокупности. j л _ Покажем, что выборочная дисперсия ст2 =—У(х,-х)2 явля- Л /«1 ется смещенной оценкой дисперсии = ст2 генеральной со- вокупности. Поскольку выборочная дисперсия, как и теоретическая, не изменяется от прибавления к значениям случайной величины фиксированного числа, то для любого числа b выборочную дисперсию можно записать в виде СТ2=1£(Х/_6)2_(х-6)2. Л ,=1 Действительно, доказательство утверждения вытекает из следующей цепочки равенств: 1 я 1 я ° = -£(*/-х)2=-£[(х,-д)-(х-й)]2 = = -£[(х, - Ь)2 - Цх, - b)(x -b) + (x-b)2] = 1 V/ l\2 2(х— Ь) . >. 1 = -£(х( -Ь)2 —Ь----£(х, -Ь)+~Х(х-Ь)2 = = -У (х, - Ь)2 - —-[2У х, - 2nb- пх+nb] = 1 Л U _ L п п = -£(*, - Ъ)2---Ч2£х, - nb - £х( ] = л ,=1 л <=1 /=1 = -£(х(-b)2-(x-b)[-Yxt -й] = -£(х, -Z»)2 -(х-Ь)2. п^ п^
210 ЧАСТЬ II. Математическая статистика Следствие. Если = а есть среднее генеральной совокупности, то 1 п ° = -^(xi-a)2- (х-а)2. п 1=, Вычислим математическое ожидание выборочной дисперсии: Л/а2 = Л/ —Y(x. -а)2 -М(х-а)2 = —\M(xi -a)2 -Dx = п /=1 па2 ст2 м-1 2 =--------=----а . п п п Отсюда следует, что о2 является смещенной оценкой дис- персии. Несмещенной оценкой дисперсии будет s2 =----^(х,.-х)2, так как п ~ *,=1 1^2 П П if--) П М-1 2 2 Ms=M\ а2 = Л/ст2 =---------------о2 =а2. <м-1 ) м-1 м-1 м Поэтому оценку о2 (при получении которой сумма делит- ся на м) называют смещенной, или неисправленной выборочной дисперсией, а оценку s2 (при получении которой сумма делится на м - 1) называют несмещенной, или исправленной выборочной дисперсией. Выборочным средним квадратическим отклонением (исправленным или неисправленным) называют положительный корень из соответствующей выборочной дисперсии. Эта оценка теоретического среднего квадратического отклонения о = Jd^, к сожалению, в обоих случаях является смещенной. Далее по умолчанию мы будем иметь в виду исправленные оценки. Обычный закон больших чисел неприменим к центрирован- ным величинам, так как после центрирования они становятся зависимыми. Однако с помощью теоремы Слуцкого можно до- казать, например, что выборочная дисперсия сходится по вероят- ности к теоретической дисперсии, если последняя существует. ► Теорема 1 (теорема Слуцкого). Пусть функция f(x,y) непре- рывна в точке (а,Ь) и случайные последовательности Хп и Yn схо- дятся по вероятности соответственно к числам а и Ь. Тогда f(Xn, YJ сходится по вероятности к f(a, b).
Глава 11. Точечные оценки параметров законов распределения 211 — " ' -- Доказательство. Если Дх, у) непрерывна в точке (а, Ь), то для любого е > 0 существует 8 > 0, такое, что при | х — а | < 8 и I у - b | < 8 выполняется неравенство \Дх, у) - Да, b)\< е. Тогда, если |у(х, у) - Да, b) | > е, то справедливо хотя бы одно из неравенств: |х — о| >8 или |у — b\ >8. Рассмотрим событие {ш: |/(А;, У) - Да, Ь) | > е} с {«: | Хп - о| > 8} и {со: | У - b\> 8}. В силу теоремы сложения получаем Л ж, Y)-Да, />)| > £) < Р({ | а;- а| >8}о{| Y~ b | > 8}) = = Р(|Х - а| >8) + Р(| У- />| >8) - Р(|Хп- а| >8,| У- b\ >8) < <Р(|Хл- «| >8) + Р(| Y-/>|>8), причем Р( | Хп — о | >8) -> 0 и Р( | У — b | >8) -> О при п -> оо. Следовательно, вся сумма стремится к нулю, т.е. lim Л |ДГ, У) -Да, д)| > е) = 0 или/(%, У) Да, Ь). Для доказательства сходимости по вероятности выборочной дисперсии к теоретической достаточно рассмотреть функцию Дх, У) = х — у2, положив Хп = -> а2 = а2 + о2, У = х -> а (при п оо), п и применить теорему Слуцкого, поскольку выборочная дис- персия представима в виде Конечно, сходимость выборочной дисперсии можно дока- зать и проще. Однако подобным образом доказывается сходи- мость по вероятности всех выборочных центральных моментов —£-> ц*, если существует ц* = Л/(£ — а)к. Действительно, из сходимости по вероятности случайных величин ^.(и) к некото- рым постоянным числам л следует, в силу теоремы Слуцкого, сходимость по вероятности любой непрерывной функции ф(^(л), ^2(л), ..., ^к(л)) к ее значению в точке (av av ..., як), т.е. если Цп)—то <р(^(л), ^(и), ..., av .... ак) при п -> оо. Поскольку все выборочные центральные моменты (а так- же некоторые их модификации — асимметрия, эксцесс и т.п.) являются непрерывными функциями от наблюдений, они схо-
212 ЧАСТЬ II. Математическая статистика дятся по вероятности к соответствующим теоретическим зна- чениям. Справедлива следующая теорема. Теорема 2. Если 0л - несмещенная оценка параметра 0 и ее дисперсия стремится к нулю, D( 0л) -> 0 при п -> оо, то оценка состоятельная. Доказательство. Пусть 0л — несмещенная оценка параме- тра 0, т.е. Л/0л = 0. Тогда для любого 8 > 0 из неравенства I л I 7)0л Чебышева получаем Р( I 0 — 0 I > s) < —г-. А " 8 По условию DQn —» 0 при п -> оо и, следовательно, при каж- дом фиксированном 8>0 получаем limP(|0ll-0|>8) = O. Теорема л—>00 доказана. Задача 2. Найти неисправленную выборочную дисперсию по выборке объема п = 50. xi 18,4 18,9 19,3 19,6 ni 5 10 20 15 Решение. Перейдем к условным вариантам ut = 10(х( — 19,3). Тогда о (и) = 100ст2(и) и -9 -4 0 3 п 1 5 10 20 15 Найдем выборочную дисперсию для новой варианты и:. z’w = - ft—Т = n^f 1м п ) = -^(5(-9)2 +10(-4)2 + 20 02 +15-32)- 1 - [50 (-45 - 40 + 0 + 45)/50]2 = 13,36.
Глава 11. Точечные оценки параметров законов распределения 213 Тогда, переходя к первоначальной варианте х:. а2(х) = ст2(и)/100 = 13,36/100 = 0,1336. Задача 3. По выборке объема п = 50 найдена смещенная оценка ст2 = 9,8 теоретической дисперсии. Найти несмещен- ную оценку дисперсии генеральной совокупности. Решение. Несмещенная оценка дисперсии связана со сме- щенной следующей формулой: ?=а2- — = 9,8 • 50/49 = 10. п-\ 11.3. Асимптотически нормальный характер основных выборочных характеристик Свойства выборки объема п зависят от распределения ге- неральной совокупности, но по мере увеличения п (п -+ оо) выборочные характеристики начинают вести себя одинаковым образом независимо от специфики генеральной совокупности. Поэтому характер поведения выборочных характеристик сле- дует рассматривать в двух вариантах: при фиксированном п (ограниченном объеме выборки) и при л -> оо (асимптотические свойства выборки). При фиксированном п свойства выборок будут различны для разных типов генеральной совокупности (нормальной, экспоненциальной, равномерной, пуассоновской и т.д.). В условиях асимптотики (п -»оо) общий характер пове- дения числовых характеристик практически не зависит от типа анализируемой генеральной совокупности. Введем следующее определение. Последовательность случайных величин ..., ... назы- вается асимптотически нормальной, если существуют числовые по- следовательности Av ... и Bv Bv ... (В.> 0 для всех /), такие, что ^-4 П оо. Здесь Ф(х) — функция стандартного нормального распреде- ления. Числа А. и Bt называются параметрами асимптотически
214 ЧАСТЬ II. Математическая статистика нормально распределенной случайной величины Условие, что последовательность £2, £л, ... асимптотически нормальна, записывается в виде -е-» N(A., В). Используя введенный термин, центральную предельную те- орему можно сформулировать следующим образом: пусть гц, т|2, ..., т|я, ... — независимые одинаково распределенные случай- ные величины с конечными моментами первого и второго поряд- ков: Mv\. = a; Dry. = о2. Тогда если Sn = гц + Л2 + •• + Л,, то Sn —N(na, па2), п-+ю. ► Теорема 3. Если распределение генеральной совокупности име- ет конечные математическое ожидание а и дисперсию о2, то при п -> оо основные выборочные характеристики являются асимпто- тически нормальными: 1) х—а,— |; \ п ) 2) ст2,?—^->#Гст2, И4~ст4>|; I п ) 3) F„(x)— \ п ) Другими словами, при больших объемах выборки все ос- новные выборочные характеристики можно считать практиче- ски нормально распределенными. Доказательство следует из центральной предельной теоремы. 11.4. Эффективность оценок. Неравенство Рао—Фреше—Крамера Для одних и тех же параметров распределения существует бесконечно много различных несмещенных и состоятельных оценок. Поэтому важной задачей является сравнение их между собой и поиск наилучшей среди них. Естественным критерием такого поиска является дисперсия, как мера разброса значе- ний случайных величин вокруг среднего значения. Наилучшей оценкой является оценка с минимальной дисперсией. Однако
Глава 11. Точечные оценки параметров законов распределения 215 для смещенной оценки 0Л дисперсия служит мерой близости не к оцениваемому параметру 9, а к математическому ожида- нию этой же оценки MQn. Поэтому естественно искать наи- лучшие оценки с наименьшей дисперсией только среди несме- щенных оценок. Получая ту или иную оценку, мы должны иметь возможность определить, обладает ли она минимальной дисперсией из всех возможных, или нет. С этой целью вводится понятие эффектив- ности оценки и используется неравенство Рао—Фреше—Крамера. Информацией Фишера о неизвестном параметре 0, содержа- щейся в одном из независимых наблюдений случайной вели- чины называется величина /(0)=A/f^^)Y I зе ) где в качестве р(х, 0) берется либо плотность в точке х (для непрерывных случайных величин), либо вероятность принять значение х (для дискретных случайных величин). Говорят, что величина /(0) определяет количество информации Фишера. Теорема 4 (Рао—Фреше—Крамера). Пусть плотность р(х, Q) удовлетворяет следующим условиям регулярности: 1) область Gn = {х: p(x,Q) > 0} всех возможных значений случай- ной величины, для которых р(х, 0) * 0, не зависит от параметра 0; 2) в тождествах JQ„(X)p(X,Q)dX = М0„ и Jp(x,Q)dx = 1 допу- R" R’ стимо дифференцирование по параметру 0 под знаком интеграла; 3) информация Фишера I(Q) конечна и положительна. Тогда для произвольной несмещенной оценки 0„, построенной по выборке объема п, выполняется неравенство (Рао—Фреше— Крамера): " «/(0) Доказательство. Пусть 0„ — несмещенная оценка параме- тра 0, т.е. Л/0„ = /Г $Qn(X)p(X, Q)dX = 0, (11.1)
216 ЧАСТЬ II. Математическая статистика где X = (хр х2, хл) и р(Х, 0) — плотность распределения, так что jp(X 6)dX = 1. (11.2) Я" Дифференцируя по 0 равенства (11.1) и (11.2), получим । § (А)5д(Х,0)^ = ] и dX= 0. / 50 /50 Умножим второе равенство на 0 и вычтем его из первого: 1 = f(0,(A) - 0) ’ 9) dX. (11.3) R" 50 По условию на множестве Gn = Gn плотность р(Х, 0) > 0, поэтому можно записать, что dp(X,Q) _d\np(X,Q).y 30 30 Подставим полученное выражение в равенство (11.3) и, ис- пользуя неравенство Коши—Буняковского, находим 1 = [ Г(0Я (У) - 0) 1П 9) р(Х, Q)dX]2 < < [ J(0„(*)-0)2Р(Х, 9)dX]• [ J[а1п65’е)]2р(Х, Q)dX], Rn Rn do ИЛИ 7 a'n№9) л V 30 j Учитывая независимость и одинаковый закон распределе- ния наблюдений х,, х2, ..., хя, можно записать, что .„МУ дО 30 Подставляя это выражение в последнее неравенство, окон- * 1 чательно получаем утверждение теоремы: D 0„ > . Теорема верна и в дискретном случае, если в условии 2 за- менить интегралы на суммы (по всем возможным значениям случайной величины).
Глава 11. Точечные оценки параметров законов распределения 217 Заметим, что информацию Фишера можно также предста- вить в виде A0)=z/ain^| и /(9)=_Mfa2in^9)l I 50 J ( 502 J Обозначим правую часть неравенства Рао—Фреше—Крамера через Ал = • Эта величина является нижней гранью всех возможных дисперсий оценок. Эффективностью несмещенной оценки 0Л называется от- ношение минимально возможного значения дисперсии оценки в классе всех несмещенных оценок параметра 0 к дисперсии рассматриваемой оценки: е(0„) = ^ =--- DQn n!(Q)DQ„ Из определения следует, что эффективность любой несме- щенной оценки удовлетворяет неравенству 0 < е(0л) <1, и чем ближе она к единице, тем лучше оценка. Несмещенная оценка 0„ называется эффективной, если е(0я) =1. Асимптотической эффективностью оценки называется предел eo(0) = lime(0„), если он существует. Оценку 0„ называют асимптотически эффективной, если Мб) = 1 Кроме того, для асимптотически нормальных оценок поня- тие асимптотической эффективности иногда трактуется более широко, а именно: для асимптотически нормальной оценки 0„ е >А(0,ст2/я) при и -» да, полагают е°(0) = 7(0р’‘ Задача 4, Доказать, что выборочное среднее является эф- фективной оценкой математического ожидания нормального распределения, когда дисперсия известна. Решение. Выпишем функцию плотности для нормального распределения:
218 ЧАСТЬ II. Математическая статистика р(х, а) = —f=e 2°‘ стл/2л Прологарифмировав ее, получим / х 1 1 (х-а)2 In р(х, а) = In —== - -- cjb. 2а2 при этом производная будет равна dlnp(x, а) _ 2(х-а) _х-а да 2ст2 ст2 f dlnp(x, a)Y V да ) (х-а)2 Отсюда найдем информацию Фишера: = = ±Л/(х-д)2 =-L. V да ) ст ст Получаем значение Дл=ст2/п. С другой стороны, Дх = ст2/л, так что Dx = Д„. Таким образом, оценка является эффективной. Из доказанного следует, что чем больше дисперсия нор- мальной случайной величины, тем меньше информации о зна- чении среднего этой величины заключено в одном наблюдении. Задача 5. Доказать, что относительная частота успеха в ка- честве оценки неизвестной вероятности 0 в схеме Бернулли является эффективной оценкой. Решение. Оценкой неизвестной вероятности является отно- Л 1 п сительная частота успеха 0 = — У х, где х — успех (1) или не- fl М удача (0) в z-м испытании. Покажем, что оценка несмещенная: Л/0 = —A/(xt +х2 + ...+x„) = -YMxi=Mt = 8. И п /=1 Дисперсия имеет вид: 0(1-0) п п Найдем информацию Фишера, причем в данном случае на- блюдаемая величина принимает всего два значения: 0 и 1 с вероятностями Р(0; 0) = 1 — 0 и Р(1; 0) = 0.
Глава 11. Точечные оценки параметров законов распределения 219 /(9) = ainP(0;e) зе Р(9;0) + Э1пР(1;е) Р(1;0) = 39 1 Y fiY — (1-9)+ - е= i-е; оа-е) Таким образом, е(0_) =--------х— = 1 . л/(0)Л(9л) Задача 6. Пусть выборка хр х2, хп произведена из гене- ральной совокупности с равномерным распределением на ин- тервале (0; 9). Проверить на эффективность оценку 9 = ——хтах для неизвестного параметра 9. п Решение. Функция распределения Fmm(x) максимума хтах за- дается формулой / \ п Лпах W = Р(Хтах < *) = Р(Х\ < X,..., Х„ < X) = Р(Х] < X) ... Р(х„ < X) = Ш \ V J на отрезке 0 < х <0. Отсюда получаем л + 1вГ х"~' j а ме=— лх—dx=e. n J 0" Значит, оценка 0 несмещенная. Найдем дисперсию этой оценки: ме2 (п + 1)2 р2. п(п + 2) , * « о2 ие=ме2 -(ме)2 =—-—. п(п + 2) Видно, что дисперсия оценки 0„ при п -> оо убывает как . п Такая оценка оказалась лучше эффективной, поскольку дис- персия эффективной оценки имеет порядок убывания только —. Разгадка парадокса в том, что для данного семейства рас- п пределений не выполнены условия теоремы Рао—Фреше— Крамера, а именно: область значений случайной величины за- висит от параметра 0. Подобные оценки называют сверхэффективными.
220 ЧАСТЬ II. Математическая статистика 11.5. Оценка математического ожидания по неравноточным наблюдениям Ранее предполагалось, что все наблюдения равноточны, т.е. имеют одинаковую дисперсию (и среднее квадратическое от- клонение). Однако на практике встречаются и ситуации не- равноточных наблюдений. А именно пусть выполнено Мх} = Мх2 = ... = Мхп = a; Dx}= ст2, Dx2 = с22, ..., Dxn= ст2, и надо найти наилучшую (в смысле несмещенности и эффек- тивности) оценку для а. Классом линейных несмещенных оценок параметра 0 называ- ется класс оценок вида 0„ = с.х. + с,х, + ... + с х , для которых п 1 1 Z Z Л Л 7 х ме =е. Л Числовые коэффициенты с2, ..., сп называются весами наблюдений. Из требования несмещенности оценки следу- ет, что должно выполняться равенство + с2 + ... + сп = 1. Чтобы получить эффективную оценку (в классе линейных несмещенных оценок), надо минимизировать дисперсию Dan = c2g2 + с2ст2 + ... + с2ст2. Действительно, из требования несмещенности оценки Мап = М^сх = ^cl(Mxi) = a^cl =а /=1 /=1 /=1 получаем, что оценка будет несмещенной, если =1. /=1 По определению, оценка будет эффективной, если она име- ет минимальную дисперсию. Коэффициенты с. надо определить так, чтобы дисперсия была минимальна, но при условии, что = 1. Вычислим дисперсию Dan: /=1 Оа„ = D^c,x, = YSDx, = /=1 /=1 /=1 поскольку случайные величины х независимы и дисперсия суммы равна сумме дисперсий. Задача свелась к нахождению таких коэффициентов с., при которых функция /(с) = ^Гс2а2 имеет минимум при условии п / = 1 g(c) = ^c,.-1 = 0. Это задача на условный экстремум. Функция
Глава 11. Точечные оценки параметров законов распределения 221 Лагранжа имеет вид L(c) = /(с) — Xg(c). Для определения ко- эффициентов приравниваем к нулю производные: — = 2с,о2-1 = 0, дс, ' ' АГ ( п \ — = -g(c) = - £с(-1 =0; С7А у /=1 у Из этих условий получаем значения для коэффициентов с-о^ДХ2. Таким образом, веса наблюдений должны быть обратно пропорциональны их дисперсиям (менее точные на- блюдения, имеющие большую дисперсию, входят с меньшим весом, более точные — с большим). В результате эффективной оценкой математического ожидания оказывается средневзве- шенное значение, имеющее вид с дисперсией, равной ^оп = у^ст72. Если дисперсии всех наблюдений равны (т.е. наблюдения равноточные), то с. = \/п для любого i = 1, 2, п и ап =—У х. , т.е. среднее арифметическое выборки является эффективной оценкой математического ожидания в классе линейных несме- щенных оценок (при любом распределении, имеющем конеч- ное математическое ожидание и дисперсию).
222 ЧАСТЬ II. Математическая статистика Задачи для самостоятельного решения Теоретические задачи 1. Доказать состоятельность выборочного коэффициента вариации в случае > 0, выборочных коэффициентов асимметрии и эксцесса. 2. Пусть xv х2, хп, у2, ..., ут — случайные выборки объема п и т из нормально распределенной генеральной совокупности N(a, о2) с исправленными выборочными дисперсиями з*, з2у. Доказать, что 5Х2 =--5—-[(л - l)s2 +(т-1)52 ] п + т- 2 является несмещенной оценкой параметра ст2. 3. Вывести формулы, связывающие третий и четвертый централь- ные моменты с начальными моментами. Построить соответ- ствующие формулы для выборочных моментов и доказать их состоятельность. 4. Доказать, что если Л/0„ -» 0 и DQn -> 0 , то 0„ — состоятельная оценка параметра 0. 5. Доказать, что для показательного распределенной с функцией плотности / ~е °’ p(x,0) = S0 О, х < О выборочное среднее является эффективной оценкой параметра 0. 6. Доказать, что выборочное среднее является эффективной оцен- \к кой параметра X в распределении Пуассона: />(£ = &) = —е"х. к\ 7. Доказать, что для распределения Бернулли Р(^ = т) = С™ pmqN~m оценка р = х / N является эффективной оценкой вероятности р. 8. Доказать, что для геометрического распределения = т) = р(1 - р)т 1 с параметром р = 1 / 0, 0 > 1, выборочное среднее является эффективной оценкой параметра 0. 9. Доказать, что эмпирическая функция распределения F(x) явля- ется эффективной оценкой теоретической функции распределе- ния Г(х) при каждом х.
Глава 11. Точечные оценки параметров законов распределения 223 10. Пусть Дх) = е*-0, х < 0. Построить несмещенную оценку 0 на основе хтах и доказать ее сверхэффективность. 11. Пусть Дх) = (х/0)3, 0 < х < 0, р > 0. При известном значении р построить несмещенную оценку 0 на основе хтах и доказать ее сверхэффективность. 12. В случае распределения Парето . Jo, х<е; [i-(x/o)‘2, х>е Л X оценивается параметр 0. Проверить эффективность оценки 0 = —. Вычислительные задачи 13. Найти исправленную выборочную дисперсию по выборке объ- ема п = 50 Х1 0,1 0,5 0,6 0,8 ni 5 15 20 10 14. В итоге четырех измерений некоторой величины одним при- бором (без систематических ошибок) получены следующие результаты: 8, 9, 11, 12. Найти: а) выборочное среднее резуль- татов измерений; б) смещенную и исправленную выборочные дисперсии ошибок прибора. 15. С помощью измерительного прибора, не имеющего системати- ческой ошибки, было сделано 8 независимых измерений не- которой величины. Номер измерения 1 2 3 4 5 6 7 8 2504 2486 2525 2495 2515 2528 2492 2494 Найти несмещенные оценки математического ожидания и дис- персии. 16. При измерении веса 20 шоколадных батончиков (с номиналь- ным весом 50 г) получены следующие значения (г): 49,1; 50,0; 49,7; 50,5; 48,1; 50,3; 49,7; 51,6; 49,8; 50,1; 49,7; 48,8; 51,4; 49,1; 49,6; 50,9; 48,5; 52,0; 50,7; 50,6. Найти выборочное среднее, выборочные дисперсии, средние квадратические отклонения, выборочную медиану, крайние члены вариационного ряда. 17. В ОТК были измерены диаметры 300 валиков из партии, изго-. товленной одним станком-автоматом. Отклонения измеренных диаметров от номинала (нм) даны в таблице:
224 ЧАСТЬ II. Математическая статистика Границы отклонений Середина интервала Число валиков Границы отклонений Середина интервала Число валиков -30...-25 -27,5 3 0...5 2,5 55 -25..-20 -22,5 8 5...10 7,5 30 -20...-15 -17,5 15 10...15 12,5 25 — 15...—10 -12,5 35 15...20 17,5 14 -10...-5 “7,5 40 20...25 22,5 8 -5...0 -2,5 60 25...30 27,5 7 Найти выборочное среднее, выборочные дисперсии, выбороч- ную моду. 18. В таблице представлены результаты наблюдений случайной величины Найти выборочное среднее х, исправленную вы- борочную дисперсию s2, выборочное среднее квадратическое отклонение s. а) £ — число сделок на фондовой бирже за квартал; п = 400 (инвесторов). Х! 0 1 2 3 4 5 6 7 8 9 10 П! 146 97 73 34 23 10 6 3 4 2 2 б) £ — месячный доход жителя региона (руб.); п = 1000 (жи- телей). х. Менее 500 500—1000 1000-1500 1500-2000 2000-2500 Свыше 2500 п, 58 96 239 328 147 132 Указание. В качестве верхней границы последнего интервала ис- пользовать 3000. в) £ — удой коров на молочной ферме за лактационный период (ц); п = 100 (коров). х, 4-6 6-8 8-10 10-12 12-14 14-16 16-18 18-20 20-22 22-24 24-26 п. 1 3 6 11 15 20 14 12 10 6 2 19. В таблице приведено распределение 50 рабочих по произво- дительности труда £ (единиц за смену), разделенных на две группы: 30 и 20 человек.
Глава 11. Точечные оценки параметров законов распределения 225 Прошедшие техническое обучение (группа 1) Не прошедшие техническое обучение (группа 11) Xi 85 90 95 100 105 85 90 95 100 105 П, 2 5 11 8 4 2 6 8 3 1 Вычислить общие и групповые выборочные средние и диспер- сии. 20. Расстояние до цели определено двумя способами. Точность первого способа характеризуется средним квадратическим от- клонением Oj = 30 м, результат измерения jq = 1480 м; точность второго — средним квадратическим отклонением о2 - 40 м, результат измерения х, = 1 560 м. Определить приближенное значение расстояния до цели и оценить его точность. 21. Диаметр втулки определен четырьмя способами, точность которых о^ = 1,6 мм2, <з2 = 2 мм2, 03= 2,5 мм2, а4 = 3 мм2. Результаты измерений: х, = 19 мм, х2 = 18 мм, х3 = 20 мм, х4= 21 мм. Определить приближенное значение диаметра втул- ки и оценить его точность. 22. При измерении диаметра детали одним прибором установлен средний диаметр xj = 10 мк, = 8. При измерении другим равноточным прибором — х2 = 12 мк, п2= 16. Определить наи- более точную оценку диаметра по измерениям двух приборов. 23. Для изучения распределения заработной платы работников не- которой отрасли обследовано 100 человек. Результаты пред- ставлены в следующей таблице. Заработная плата, долл. Число человек Заработная плата, долл. Число человек 190-192 1 200-202 19 192-194 5 202-204 11 194-196 9 204-206 4 196-198 22 206-208 1 198-200 28 208-210 0 Найти несмещенные оценки математического ожидания и дис- персии зарплаты. 24. Производство зерна в России в 1996—2002 гг. представлено таблицей: Год 1996 1997 1998 1999 2000 2001 2002 Производство, млн т 69,3 88,6 47,9 54,7 65,5 85,2 86,6 8- Теория вероятностей
226 ЧАСТЬ II. Математическая статистика Найти выборочное среднее, выборочные дисперсии, средние квадратические отклонения, выборочную медиану, крайние члены вариационного ряда. 25. Производство пшеницы в России в 1995—2001 гг. представлено таблицей: Год 1995 1996 1997 1998 1999 2000 2001 Производство, млн т 30,1 34,9 44,3 27,0 31,0 34,5 47,0 Найти выборочное среднее, выборочные дисперсии, средние квадратические отклонения, выборочную медиану, крайние члены вариационного ряда. 26. Урожайность зерновых культур в России в 1992—2001 гг. пред- ставлена таблицей: Год 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 Урожай- ность, ц/га 18,0 17,1 15,3 13,1 14,9 17,8 12,9 14,4 15,6 19,4 Найти выборочное среднее, выборочные дисперсии, средние квадратические отклонения, выборочную медиану, крайние члены вариационного ряда. 27. Численность населения городов России с числом жителей бо- лее 1 млн чел. на 2002 г. представлена таблицей: Город Население, тыс. чел. Волгоград 1013 Екатеринбург 1293 Казань 1105 Москва 10 358 Нижний Новгород 1311 Новосибирск 1426 Омск 1134 Пермь 1000 Ростов-на-Дону 1070 Самара 1158 Санкт-Петербург 4669 Уфа 1042 Челябинск 1078
Глава 11. Точечные оценки параметров законов распределения 227 Найти выборочное среднее, выборочные дисперсии, средние квадратические отклонения, выборочную медиану, крайние члены вариационного ряда. 28. Решить предыдущую задачу, исключив из выборки Москву и Санкт-Петербург, как города, имеющие федеральный статус. 29. В таблице приведены сгруппированные данные о коэффициен- тах соотношения заемных и собственных средств на 100 малых предприятиях региона. Номер интервала Интервал Середина интервала xt ", 1 5,05-5,15 5,1 5 2 5,15-5,25 5,2 8 3 5,25-5,35 5,3 12 4 5,35-5,45 5,4 20 5 5,45-5,55 5,5 26 6 5,55-5,65 5,6 15 7 5,65-5,75 5,7 10 8 5,75-5,85 5,8 4 Найти выборочное среднее, выборочные дисперсии, средние квадратические отклонения. 30. Проведено исследование посещаемости популярного интернет- сайта. Много часов подряд регистрируется число посетивших сайт в течение данного часа. Результаты исследования пред- ставлены в таблице: Число посетителей Часы Число посетителей Часы 0 57 7 139 1 203 8 45 2 383 9 27 3 525 10 10 4 532 11 4 5 408 12 1 6 273 14 1 Найти выборочное среднее, выборочные дисперсии, средние квадратические отклонения, выборочную моду.
228 ЧАСТЬ II. Математическая статистика --- ====== . ========== ' . ....=======» 31. Проведено исследование посещаемости популярного интернет- сайта. Много часов подряд регистрируется число посетивших сайт в течение данного часа. Результаты исследования пред- ставлены в таблице. Число посетителей Часы Число посетителей Часы 0 12 7 103 1 108 8 24 2 316 9 13 3 551 10 2 4 632 11 0 5 492 12 0 6 273 14 0 Найти выборочное среднее, выборочные дисперсии, средние квадратические отклонения, выборочную моду. 32. В таблице приведены результаты измерения роста (см) случай- но отобранных 100 студентов. Рост 154-158 158-162 162-166 166-170 170-174 174-178 178-182 Число студентов 10 14 26 28 12 8 2 Найти выборочное среднее, выборочные дисперсии, выбороч- ную моду. 33. Трое исследователей провели выборочное обследование дохо- дов населения. Первый обследовал 10 семей и определил сред- ний годовой доход 2400 у.е., второй — 25 семей и 2350 у.е., третий — 15 семей и 2450 у.е. Построить наиболее точную оценку среднего годового дохода. 34. Трое исследователей провели независимые выборочные об- следования доходов населения. Первый определил средний годовой доход 3200 у.е. со средним квадратическим отклоне- нием Oj = 100 у.е., второй — 2900 у.е. с о2 = 50 у.е., третий — 3000 у.е. с ст3 = 40 у.е. Построить наиболее точную оценку среднего годового дохода и найти ее среднее квадратическое отклонение.
Глава 11. Точечные оценки параметров законов распределения 229 35. Трое исследователей провели независимые выборочные об- следования доходов населения. Первый определил средний годовой доход 3200 у.е. со средним квадратическим отклоне- нием CTj = 200 у.е., второй — 2900 у.е. с ст2= 100 у.е., третий — 3070 у.е. с ст3 = 50 у.е. Построить наиболее точную оценку среднего годового дохода и найти ее среднее квадратическое отклонение.
Глава 12 ФУНКЦИИ И РАСПРЕДЕЛЕНИЯ В МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ 12.1. Бета- и гамма-функции Бета-функцией, или интегралом Эйлера первого рода, на- 1 зывается интеграл вида B(a,b) = |xe’l(l-x)*"ldx, где параметры о а > О, b > 0. Введенный интеграл сходится для любых положительных значений параметров. Свойства бета-функции следующие: 1. В(а, Ь) = В(Ь, а). 2. B(a,b) = b~X B(a,b-l), В(\, 1) = 1. а + Ь-\ „ . (л-1)!(т-1)! Отсюда, в частности, следует, что В(т,п) = ------------. (л + zn-l)! 00 fl-1 3. В (а, Ь)= [— --r-dy. oJO + >') Х у0-1 Я В частности, В(а, 1-а)= [——dy =-------. jl + y sinaTr Гамма-функцией, или интегралом Эйлера второго рода, на- X зывается функция вида Г(а)= jxa le"xJx, где интеграл сходится о для любого значения параметра a > 0.
Глава 12. Функции и распределения в математической статистике 231 Свойства гамма-функции: 1. Г(а + 1) = аГ(а), откуда следует Г(а + п) = (а + п -1)(а + л - 2)...(а + 1)Г(а). 2. Г(1) = 1. 3. Г(л + 1) = л!, если л е N. 4. Г(1/2) = . Г(а)Г(6) , . . 5. B(a,b) =------- — формула связи гамма- и бета-функции. Г(а + о) 6. Г(о)Г(1-о) = —-— (формула дополнения). sin ап 7. Г(х + 1)~ — \/2пх, х->оо (формула Стирлинга). \е ) Докажем свойства 1—4. оо 1) Вычислим интеграл Г(а + 1) = j x?e~*dx, интегрируя по о 00 | частям. Получим Г(а + 1) = j X*e~xdx = — хе“х|о + 00 О + а | x?'e~xdx = аГ(а). о 2) Очевидно, Г(1) = J e~xdx = 1. о 3) Применим принцип математической индукции. Утвержде- ние верно для л = 0. Пусть оно выполнено для л = к — 1: Г(к) = =(к — 1)! Тогда по свойству 1: Г(к + 1) = кГ(к) = к(к — 1)! = !А 4) Вычислим интеграл методом замены переменной (у = X'/2) : Г(1/2) = jx ^exdx = 2fe~ydy = Je~ydy = Jn (интеграл О 0 -ос Эйлера—Пуассона). Поскольку гамма-функция не выражается через элементар- ные функции, ее значения табулированы. Обычно в таблицах представлены значения Г(х) для 1 < х < 2, и этого достаточно для вычисления функции при любых х > 0 (с помощью свой- ства 1).
232 ЧАСТЬ II. Математическая статистика Гамма-функция стремится к бесконечности при х -> 0 и при х -> +оо. На рис. 12.1 представлен график гамма-функции на отрезке [0,01; 5]. Примеры 1. Г(3/2) = Г(1 + 1/2) = = ; 2. Г(4,7) = 3,7 • 2,7 • 1,7 • Г(1,7) = 3,7 • 2,7 • 1,7 • 0,9086 = = 15,43; 3. Г(0,7) = Г(1,7)/0,7 = 1,298; 4. Пользуясь свойствами гамма-функции, можем вычислить: rfzvri) 5.3.irfivrm J7 3>1 f Li xL uJ UJ 2 2 2 uj 2 <2j В -, - = \x2(l-x)2ax= , =----------------^- = U 2) J r(- + -l r(5) 12 2 5-3-1 5л ------гл = —г- 4!-24 27 Задача 1. Доказать формулу, связывающую бета- и гамма- функции: Ца + Ь)
Глава 12. Функции и распределения в математической статистике 233 Решение. По определению бета-функция равна интегралу 2?(а,Р)= ]ха’1(1-х)э"1Лс. Сделаем замену переменных, положив о X у у =----, тогда х = —— и У 1-х’ 1 + у НЮ Q—1 / 1 +QQ д—j В(а, b) = Г — ----Г 1 ——1----------pdy = J— ------r-dy. 0J(i+jr'l i+jJ (i+y)2 Ja+j') Для доказательства равенства преобразуем гамма-функцию, сделав в интегральном выражении для Г(а) замену х = ty, тогда Г(а) = "j xa~'e~xdx = (“-'y^'e^idy. О о 1~</ \ "Ь» Отсюда следует равенство —jya~'e~ydy. Заменим в по- 1 о лученном равенстве t на t + 1 и положим а = а + Ь. Получим r(a + Z>) _ с (а+4)-1 ~(1+0у J (i+trb~r у' Умножив это равенство на Г**1 и проинтегрировав по t от О до +да, получим следующее равенство: Ню д-1 +о° +о° Г(а + 6)‘ 17Г7^Л = jy(a+t>-le-y(,+,,dy; oU + *) о о Г(о+Ь) В(а, Ь) = f-'e^dt = J y^'e^dy = ООО У = Цо)*! yk-le-ydy = Г(а)Г(Ь). о Задача 2. Вычислить интегралы: 2. ™jx4e-xdx = *fx5-'e-xdx = r(5) = 4'. = 24. О о
234 ЧАСТЬ II. Математическая статистика 3. fx3(l -x)2dx = fx4’1 (1 - х)3-1 dx = В(4,3) = Г(4)Г(3) = . I I Г(7) 6! 60 1 А 1 4. |x2(l-x)2dx = о Г(5) 5 з х miJП 22 2 ^2 J 2 Ы_5л 4! "64’ 2 5 15 5. jx2(2-x)3dr = |x = 2y, dx = 2dy\= j(2yy(2-2y)32dy = О о 2т.31 11.9 7 5 3 1 m _______'2 2 2 2 2 2 Uj 222 £ ЛРГ19-17-5’ 2 ‘ 2 ’ 2 ’ 2 ’ 2'2 2 2 2 2\2J Задача 3. Найти Решение. fx2(l-x2)dx = rf-lrf-Vrf- + ->| = \2 2) I UJ \2)l V2 2) 5з 1 гт 1 гп 5-3-1 =5л Г(5) -4!-24Я~27' 12.2. Квантили, процентные и критические точки Квантилью уровня р, или р-квантилью, непрерывной случай- ной величины £ с функцией распределения F(x) называется такое возможное значение хр этой случайной величины, для которого вероятность события £, < хр равна заданной величине р: Р(^ < хр) = р, 0 < р < 1, т.е. из определения следует, что х есть решение, по предположению единственное, уравнения Лхр) = р, 0 < р < 1.
(лава 12. Функции и распределения в математической статистике 235 Геометрически хр есть такое значение случайной величины при котором площадь криволинейной трапеции, ограничен- ная графиком плотности распределения и осью абсцисс, и ле- жащая левее xf, равна р (рис. 12.2). Процентной точкой уровня q, или 9%-ной точкой (при 0 < < q < 100), для непрерывной случайной величины £, с функци- ей распределения Дх) называется такое значение v случайной величины, что вероятность события £, > v равна q/100, т.е. 1 - f(v9) = Р^> vq) = 9/100. Геометрически 9%-ная точка — это значение случайной ве- личины, при котором площадь криволинейной трапеции, огра- ниченной графиком плотности распределения, осью абсцисс и лежащая правее v, равна 9/100. На рис. 12.3 показана квантиль уровня 0,8 (20%-ная точ- ка) для стандартного нормального распределения (на графиках плотности и функции распределения). К понятию процентной точки близко понятие критиче- ской точки, широко используемое в задачах проверки гипотез. Критические точки для заданного распределения определяют границы, за пределы которых случайная величина выходит до- статочно редко. Например, если нас интересуют большие по- ложительные значения случайной величины то критическая точка tKp может быть определена из условия Р(& > t ) = а, где а мало. Если же нас интересуют значения, большие по абсолют- ной величине (положительные или отрицательные), то можно определить критическую точку из условия Р(|^| > Г ) = а.
236 ЧАСТЬ II. Математическая статистика Плотность нормального Функция нормального Нижней критической границей и* и верхней критической гра- ницей йа, соответствующими заданному уровню значимости а, называются значения случайной величины, для которых вы- полнены условия: < Ц,) = F(ua) = а/2; Р(ца< £, < и) = F(u) ~ F(u) = 1 - а; Рис. 12.4
Глава 12. Функции и распределения в математической статистике 237 Между критическими границами и квантилями для симме- тричного распределения существуют следующие соотношения и =Ха ; и =х а (рис. 12.4). ~а 2 ' 2 Конкретные значения критических точек для различных распределений и уровней значимости можно найти в таблицах. Эмпирическими аналогами теоретических квантилей будут чле- ны вариационного ряда. 12.3. Распределение хи-квадрат (закон Пирсона) Распределением хи-квадрат с п степенями свободы (обозна- чается %2) называется распределение суммы квадратов п неза- висимых случайных величин со стандартным нормальным рас- пределением, т.е. Хл = 22^?, если 1)- Такое же распределение будет иметь величина £ = , если ^eN(a, ст2). „I ст Плотность распределения случайной величины х« с л сте- пенями свободы имеет вид: 1 1-1 -1 -г-!—х2 е 2, х>0; р2(х)= 22г| х I 2 ) О, х < 0. Функция распределения: F(x) = 0, Основные числовые характеристики распределения х^ сле- дующие: математическое ожидание - Му^п = п; дисперсия - />Хл = 2л;
238 ЧАСТЬ II. Математическая статистика асимметрия - Рх2 = ; эксцесс — у 2 = 11/п. На рис. 12.5 представлен график плотности распределения хи-квадрат с 5 степенями свободы. Плотность х» распределения зависит от одного параметра п — числа степеней свободы. При п < 2 функция плотности убывает, а при п > 2 имеет единственный максимум в точке Лп<х1= « — 2. С ростом числа степеней свободы п распределение Х2В приближается к нормальному закону распределения со сред- ним п и дисперсией 2л (в смысле асимптотической нормаль- ности). Общий вид графика представлен на рис. 12.6. Заштрихованная область соответствует вероятности а и опре- деляет квантиль уровня а распределения хи-квадрат. Задача 4. Доказать асимптотическую эффективность несме- щенной оценки генеральной дисперсии в случае нормального распределения. Решение. Как известно (см. § 8 гл. 12), несмещенная оценка генеральной дисперсии и ее дисперсия выглядят следующим л- 2 1 . 2 г» 2 2о образом: s =---->.(х - х) , Ds =-. л-17^ л-1
Глава 12. Функции и распределения в математической статистике 239 Для того чтобы доказать эффективность оценки, необходи- мо найти информацию Фишера. Выпишем функцию плотности нормального распределения: । <х-я>* р.(х,ст2) =—2°! , и прологарифмируем ее: Inа(х,с2) = 1п—а) = -1п^--1па2~^Х . * aVin 2a2 2 2a2 Продифференцируем по параметру 0 = о2: </1пр5(х,0) dQ 1 ,(х-а)2, 20 202 (</lna(x,0)Y 1 , , ---С =-Ц-((х-а)2-0)2. J0 ) 404 Тогда информация Фишера равна: W)=-Lm(K-0)’ -е>! = -—ft2-—-— 402 ^C1 202 2сг4 ’ так как случайная величина имеет распределение хи-квадрат с одной степенью свободы, и тогда =2 . Отсюда
240 ЧАСТЬ II. Математическая статистика л 2ст4 „ _ 2 2ст4 получим Д =-------. С другой стороны, Ds =-----, и в результате п л-1 Д„ 2о4 имеем —V =---------—> 1 при л -> да. Ds2 2ст4 л--------- л-1 Таким образом, несмещенная оценка генеральной диспер- сии является асимптотически эффективной. 12.4. Распределение Стьюдента Пусть п + 1 случайных величин •••> независимы и имеют стандартное нормальное распределение: e N(0,1). Пусть I | п к т]= — УХ2. Случайная величина tn— — называется безразмер- V п П ной дробью Стьюдента, а ее распределение — распределением Стьюдента с п степенями свободы. Плотность распределения /я имеет вид: Плотность распределения Стьюдента зависит от одного па- раметра — числа степеней свободы. С ростом числа степеней свободы п распределение Стьюдента сходится к стандартному нормальному распределению. Основные числовые характеристики: мода и медиана равны математическому ожиданию и равны нулю, т.е. распределение унимодально и симметрично относи- тельно точки х = 0; математическое ожидание существует при л > 1 и тоже равно нулю. дисперсия — Dt' = п /{п — 2) и существует только при л > 2; асимметрия — 0=0; эксцесс — уя = 6/(л — 4). На рис. 12.7 представлен график плотности распределения Стьюдента с тремя степенями свободы. Общий вид кривой распределения представлен на рис. 12.8.
Глава 12. Функции и распределения в математической статистике 241 Заштрихованным областям (слева и справа) соответствуют вероятности по а/2, в сумме дающие вероятность а и опре- деляющие критические точки распределения Стьюдента для двусторонней области.
242 ЧАСТЬ II. Математическая статистика 12.5. Распределение Фишера Если xi; и %* — независимые случайные величины, рас- пределенные по закону х2 с числами степеней свободы я и и соответственно, то случайная величина F(n, т) = имеет распределение, которое называют распределением Фишера— Снедекора (F-распределением) с числами степеней свободы п и т, или распределением дисперсионного отношения. Функция распределения и функция плотности имеют вид: _ п + т] 2 У Г ---- л2т2 I 2 J FJx) = v z 7 п9т ' ' Л и2 du; ( \ { 991 A J п-гт ГШГШ Q(nu+m)~ г[ п + т\ „ „ I 2 J п2т2х2 р„Ах)= z\—---------------, х>0. ( л^Г т) Г1 2 1Г1у I <пх + /”) Распределение Фишера определяется двумя параметрами п и т, называемыми числами степеней свободы. Основные числовые характеристики: w т математическое ожидание М =-----существует только при т > 2; т-2 2т2(л+т-2) . . дисперсия D = -------—5---— существует только при т > 4; п(т-2) (т-4) мода X . _ ")(л-2) ПрИ п > j. л(т + 2) (2л + т-2),/8(т-4) асимметрия р = -------- .л-----— при т > 6; (т-6)>/л(л + т-2) 3(т-6)(2 + |р2) эксцесс yF=----------=-----3 при т > 8. т-8
Глава 12. Функции и распределения в математической статистике 243 Из этих формул следует, что F-распределение всегда имеет модальное значение, меньшее единицы, и среднее значение, большее единицы, а также положительную асимметрию. На рис. 12.9 представлен график плотности распределения Фишера с числами степеней свободы п = 10 и т = 15. р (х) Плотность распределения Фишера Рис. 12.9 Общий вид графика плотности распределения Фишера при различных значениях параметров представлен на рис. 12.10.
244 ЧАСТЬ II. Математическая статистика 12.6. Гамма-распределение Двухпараметрический закон гамма-распределения случайной величины £ е у(а, X) описывается функцией плотности: ( 7 а Д' а-1 -Аг л -----х е , х>0; />Т(Х) = 4 Г(а) [о, х < О где Г(а) — гамма-функция Эйлера, а > 0 — параметр «формы», X > 0 — параметр «масштаба». Если X = 1, случайная величина у(а, 1) зависит от одного параметра а и подчинена однопараме- трическому закону гамма-распределения. Основные свойства гамма-распределения следующие: 1. Если случайная величина имеет гамма-распределение G у(а, X), то G у(а, Х/с), в частности Х^ G у(а, 1). Доказательство. Действительно, пусть ц = с^. Найдем функ- цию распределения F (у). По определению имеем У Fn(y) = Лп < У) = < у) = Я £ < -) = x“-'e-^dx = \ С) 0Jr(a) = \cx = u,cdx = du\ =-fl —1 е с —du = -С [ua 'е du. Г(а)0М с r(a)J Следовательно, функция плотности случайной величины т] = имеет вид РП(У) = < у>0; О, у < 0. Отсюда следует, что если с = X, то Х£, е y(a, 1). 2. Сумма любого числа независимых гамма-рзспределенных случайных величин с одинаковым параметром масштаба X и параметрами формы а,, а2, ..., ап также подчиняется гамма-рас- пределению с параметрами a = a! + a2 + ... + ал и X. Доказательство. Рассмотрим случай, когда Е, и ц являются однопараметрическими гамма-распределенными случайными величинами с параметрами аир соответственно (а > 0, р > 0),
Глава 12. Функции и распределения в математической статистике 245 т.е. X = 1. Покажем, что если % и т| независимые случайные величины, то случайная величина т = ^ + т| подчиняется гамма- распределению с параметром а + р. Пусть £ е у(а, 1) и т| g у(р, 1). Функции плотностей рас- пределения случайных величин £ и ц соответственно равны: рАх) = —±—ха1е х, р (х) = —— хр Хе~х, х > 0. Г(а) Г(Р) Поскольку £ и т| независимы, совместная плотность рас- пределения равна произведению функций плотностей сомно- жителей: р(х, у) = р^(х)рп(у), и функция плотности суммы вы- числяется с помощью свертки +ос 4-ОС P^tz) = J p(x,z-x)dx = j p^x)pn(z-x)dx. Подставляя в последнюю формулу выражения для плотно- стей составляющих, получим +СС | | p^(z) = J-—x°-'e-V|0„/x)—(z-x)₽-'e-u-x7|0oo)(z-x)dr, —ОС * 4 \Н/ где /(0оо) — индикаторная функция множества D с R1, определя- емая соотношением /fl(x) {о, хе Д xtD. Отсюда следует, что Ao.«)U-^) = 0<Z-X<+oo, Z-x<0 1, 0, x<z, x>Z- Таким образом, получаем +ос 1 1 л. _ (г) = f-------хо-1е'х-----(z - х)м е~г+х/|0 ,(x)rfx = ^+п о Г(а) Г(р) 10x1 --------[х° '(г-х:)₽ 'е zdx= —=u,dx = zdu r(a)r(p)J z 1 Г(а)Г(Р) I -a+p-1 1 f (zu)al (z - ZW)₽"' e~zzdu = [ «“' (1 - u)₽_| du = 0J Г(а)Г(₽) 0J zatp~'e~x Г(а)Г(р) Г(а)Г(Р)’ Г(а + Р)'
246 ЧАСТЬ II. Математическая статистика Поэтому функция плотности распределения суммы равная соответствует гамма-распределению с параметром а + + Г| е у(а + р, 1). р, т.е. и П, = Из первого свойства следует, что е у(а, X) 1 = — г| е у(р, X). Тогда в силу доказанного получаем, что случай- X ная величина ^, + т|, = — (^ + r|) е у(а + р, X). X По индукции теперь можно доказать, что сумма любого числа независимых гамма-распределенных случайных величин с одинаковым параметром масштаба X и параметрами формы ар а2, ..., ап также подчиняется гамма-распределению с пара- метрами а = а, + а2 + ... + ал и X. 3. Распределение %2 является частным случаем гамма-рас- п , 1 2 f« П пределения с параметрами а = у, Х = -, т е- , j Доказательство. Достаточно подставить параметры а = у> Х = ^ в формулу плотности гамма-распределения и сравнить с формулой плотности распределения хи-квадрат. Основные числовые характеристики случайной величины у (а, X) следующие: 1) математическое ожидание — М - —; 2) мода - Xmod = при а > 1; А 3) дисперсия — D = ; 2 4) асимметрия — р = -j= У Va 5) эксцесс — у = —. Y а
Глава 12. Функции и распределения в математической статистике 247 _ ня==!==и!=^== — Гамма-распределение иногда используют при моделирова- нии реальных ситуаций. Например, с его помощью описыва- ется распределение доходов или сбережений населения в не- которых определенных случаях. Задача 5. Пусть случайная величина имеет плотность рас- пределения вида , ч \Сх 'е~х, х>0; Р(х,а) = < [О, х < 0. Найти константу С, математическое ожидание Mi, и дисперсию Di- Решение. По свойству плотности распределения имеем |p(x)dx = С jx“ 'е Xdx = СГ(а) = 1, а>0. о Отсюда получаем, что С = ——. Г(а) Вычислим числовые характеристики распределения: \xp(x)dx = f——xae'xdx = —— [ х(аФ1)~‘е~х rfx = Г(а + = а. 2 I Г(а) Г(а) J Г(а) Для нахождения дисперсии вычислим второй начальный момент: Mi? = [x2p(x)dx =—— f x(a+2)~‘g~x</x = + 2) = 2 Г(а) J Г(а) (а + 1)аГ(а) . .. =-— ' / -=а(а + 1). Г(а) Тогда дисперсия равна: Dt, = Mi? - (Mi,)2 = a(a +1) - a2 = a. Общий вид графика плотности гамма-распределения при различных значениях параметров представлен на рис. 12.11. На рис. 12.12 представлен график плотности гамма-распре- деления при a = 3 и X = 1.
248 ЧАСТЬ II. Математическая статистика Рис. 12.12 Задача 6. Пусть случайная величина т| подчиняется стан- дартному нормальному закону распределения: r| g N(0, 1). Най- 2 ти функцию плотности случайной величины ^ = ~-. К какому параметрическому семейству распределений относится £? Решение. Поскольку случайная величина ц е МО, 1), ее плот- 1 — ностью распределения будет функция рп(х) = -=е 2. Найдем функцию распределения случайной величины (х) = < х) = < х) = Р(п2 < 2х) =
Глава 12. Функции и распределения в математической статистике 249 (1)Л= о. *<о -h ’ 2> 2 ’ t 2 xf du 1 xf . = —p= le —f==—f= и 2e du. V2n 0J V2u Vn J Из полученного равенства и функции плотности распреде- ления получаем плотность распределения случайной величины Е в виде 1 -1 р^(х) = -?=-х 2е’х, УЛ а эта функция является плотностью однопараметрического гам- ма-распределения с параметром, равным а = 1/2, т.е. у(1/2, 1) = = ¥(1/2). Задача 7. Пусть распределение случайной величины за- дано плотностью р(х,а,Х) = Сх“_|е Хх, х>0; 0, х < 0. Найти константу С, математическое ожидание и диспер- сию -КО -КО Решение. Поскольку j p(x)dx = 1, имеем j Cx^'e'^dx = 1. о Сделаем замену, положив Ах — и, kdx — du, получим а-1 * -ню e~udu = — fua-'e-udu = — Г(а) = 1. Аа 0J Аа Ха Отсюда следует, что С=------. Вычислим теперь математи- ческое ожидание: = | xp(x)dx = у j хае ^dx = "kx = u,dx = ^- Г(а) Аа*’ I Г(а)Х X
250 ЧАСТЬ II. Математическая статистика Для вычисления дисперсии аналогично находим второй на- чальный момент: Mt? = jx2 p(x)dx=—— \xa+'e~udx = \x = u, dx = — = -к F(a) о = Г du = Г(а + 2) = a<a + 1> Г(а) Xa+2 / Г(а)Х2 X2 Тогда дисперсию находим по формуле Dt, = Mt? - (Mt)2 = - ТГ=7Г- А Л A 12.7. Бета-распределение Случайная величина t, e P(a, b), подчиняющаяся закону бета-распределения (p-распределение) с параметрами a > 0 и b > 0, имеет плотность распределения Па + ^х'-'Д-х)4’1 pjx)= Г(а)Г(й) 0, 0<х<1, Х«£(0,1]. Основные свойства бета-распределения следующие: 1. Если е y(a., X) и L е у(а2, X) — две независимые гамма- распределенные случайные величины, то отношение т|=—— ^1+^2 имеет бета-распределение с параметрами а( и а2: ц е Р(ар а2). 2. Случайная величина Р( 1, 1) распределена равномерно на отрезке [0, 1]. 3. Функция распределения квадрата стьюдентовской вели- чины /2 связана с функцией распределения случайной вели- чины р соотношением F1(x)=F. ₽ х т + х Функция распределения случайной величины F(n, rri) свя- зана с функцией распределения случайной величины р соот- ношением F (х) = п,тх ' F Г "I
Глава 12. Функции и распределения в математической статистике 251 5. Между функцией распределения случайной величины 0 и биномиальным распределением существуют соотношение л(Я1Л w+i)W=Xc>*(i Р^т,п—m+i) х ' П х ' к=т 6. Имеет место симметрия: pWaM(x) = - х) и = 1 - f,../1 - *>• Основные числовые характеристики случайной величины р(а, Ь): а 1) математическое ожидание (среднее) — М$(а, Ь) = ---; а-1 а+^ 2) мода — Xmod = a^b 2 при а > 1, b > 1; 3) дисперсия — и... = ----;-------- ^а+Ь)\а + Ь + \) .. . 2(b-a)y/a + b + l 4) асимметрия — В = —------------=-; р (д + й + 2)л/йй 5) эксцесс — ур = 3(д+/> + 1)[2(а + />)2 +aZ>(a + l>-6)] 3 ай(д + 6 + 2)(а+6+3) Бета-распределение используется для описания некоторых реальных распределений, сосредоточенных на отрезке [0,1], на- пример, для описания распределения величин субъективных вероятностей, полученных в ходе экспертного опроса. На рис. 12.13 представлен график плотности бета-рас- пределения с а = 3, b = 5.
151 ЧАСТЬ II. Математическая статистика 12.8. Приложения распределений в математической статистике. Теорема Фишера При построении экономико-математической модели осо- бенно важным является исследование свойств конечной выбор- ки при фиксированном п, когда выборка хр х2, ..., хп сделана из нормальной генеральной совокупности N(a, а2). Справедлива теорема Фишера, описывающая доасимптотические свойства оценок. Предварительно рассмотрим следующие леммы. Лемма 1. Если хр х2, ..., хп — независимые одинаково нор- мально распределенные случайные величины: х. е N(0, о2), и ур У2> •••, Уп получены из xv х2, ..., хп ортогональным преобразова- нием у.= ^Cikxk ,/=1,2, ..., п, где С = (с ) — ортогональная к=\ матрица, то ур yv ..., уп независимые, одинаково нормально рас- пределенные случайные величины: у. е N(0, а2). Доказательство. Пусть xg N(0, о2) и у= ^ckixk ,/=1,2, ..., п, *=i где матрица С ортогональна. Тогда существует обратная ма- трица С~1 тоже ортогональная и, следовательно IdetC-1! = 1. В векторной форме это преобразование можно записать так: Y = СХ и обратное преобразование X = C~XY = X(Y). Функция плотности случайного вектора Y будет равна py(yv yv ул) = = рх(х,(У), Х2(У), .... x„(y»ldetJl, но так как преобразование X -> Улинейное, легко видеть, что якобиан J = С~' Кроме того, квадратичная форма инвариантна относительно ортогонально- го преобразования: у,2 + yf +... + у2 = YTY = (CXf(CX) = ХТ(СТС)Х = ХТХ = = х2+х2+... + х2. Поэтому Ру(У„ У2, У„) = 1 -Л<х|2(у)*х!2(У)+...+х,2(.>'>)) UL 1 -А- -------- е2а = П 7--------------е ’ J i=\ yJlTta2 откуда следует независимость и нормальное распределение у, 6 МО, о2).
Глава 12. Функции и распределения в математической статистике 253 Лемма 2 (Фишера). Пусть задано некоторое число р < п ли- нейных функций ур у2, урот хр х2, xn. yt = cnxt + + ... + + стхп, i = 1, 2, ..., р, где строки матрицы С = (с.) удов- л, Г1 i — летворяют условию ортогональности ^с^Сц = 8Л = < ’ . . Если j=i [0, i * к хр х2, хп независимые одинаково нормально распределен- ные случайные величины х. е МО, и2), то случайная величина = распределена по закону о2х2_р с п - р степенями /=1 /=1 свободы, причем и у2 + у% + ... + у2 взаимно независимы. Доказательство. Известно, что для прямоугольной матрицы С^п} с ортогональными строками можно подобрать дополни- тельно п — р строк и дополнить ее до квадратной ортогональ- ной матрицы С(яхя). Если к вектору X применить преобразова- ние СХ, то получим вектор У, у которого первые р компонентов совпадают с заданными случайными величинами ур у2, ..., у, и так как квадратичная форма инвариантна относительно орто- гонального преобразования, получим ^х2=^у2. Отсюда сле- /=1 /=1 дует, что ^ = ^xf = £ yf и как функция от ур+р ..., уп z=l /=1 /=р+1 р не зависит от ур у2, ..., у , т.е. не зависит от суммы 2^у2 <•=1 В силу леммы 1 случайные величины ур у2, ..., ур имеют нор- мальное распределение у(.е N(0, о2), а сумма квадратов нормаль- но распределенных случайных величин имеет х2-распределение: £ (—)2 е х2„-р , следовательно, у,2 е о2х^_р • Лемма доказана. i=p+\ & i=p+l Теорема Фишера. Пусть х и s2 — соответственно выбо- рочное среднее и выборочная дисперсия, построенные по выборке хр х2, ..., хп из нормальной генеральной совокупности N(a, о2). Тогда при любом фиксированном объеме выборки п их совместный закон распределения описывается следующим образом: 1) храспределено по нормальному закону хе N(a, а2/п) ; 2) статистика ——распределена по закону х2 с п — 1 о степенями свободы; 3) случайные величины х и s2 независимы.
254 ЧАСТЬ II. Математическая статистика Доказательство. Пусть хр х2, хп — случайная выборка из нормальной генеральной совокупности N(a, ст2). Нормальность распределения выборочного среднего х вытекает из факта нор- мального распределения любой линейной комбинации незави- симых нормально распределенных случайных величин. Введем случайную величину z. = х. - а. Тогда Mzt - О, Dzt = Dx. = ст2. Отсюда следует, что s2 = 5*, т.е. без ограничения общности можно полагать а = 0. Итак, z = х.- а е МО, ст2) и s2x =s2 = а = 0, имеем ----(Уг2-лг2). Так как —2 Отсюда получим пх Обозначим yj =у[п-z = -у=-+-^=- + ...+-^=-, т.е. случайная ве- yjn \/п yjn личина yj представлена в виде линейной функции ~ C\\Z\ + ^12^2 + ••• + 1 о , , 11 где Ск =-?=, а Сц + С12 +... + С1я =1, т.е. строка -т=-,...,-у= удов- ул ^п) летворяет условию ортогональности. Применяя лемму Фишера к yx=4n-z при р = 1, получаем, что у2 = nz и случайная вели- чина ^ = (л-1)52 =£z2-у2 в случае выборки из нормальной ге- /=1 _ неральнойсовокупности независимы, причем yx=yjn-z^ W(0,ct2), и (л-1)? ест2х2_г Таким образом доказано, что Xg7V(0,—), —— л ст Следствие 1. Дисперсия исправленной выборочной дисперсии s2, построенной по случайной выборке объема п из нормальной гене- ральной совокупности N(a, ст2), определяются формулой
(лава 12. Функции и распределения в математической статистике 255 Поскольку = 2(л- 0. то d{1Р Ds2 = 2(п-1). СТ J <5 2гг4 Поэтому Ds2 = —— • л-1 Следствие 2. Если х и s2 соответственно выборочное среднее и дисперсия, построенные по выборке из нормальной генеральной совокупности N(a, о2), то статистика распределена по закону Стъюдента с п — 1 степенями свободы. Ддя доказательства достаточно представить статистику Т в виде х-а г -----------------------------------у/п ? _ ст----------------------------- I ns2 N(n-1)CT2 Х~О Г кт та п 2 и, так как ---у/п е N (0, 1), ---5по определению, ст ст статистика Т имеет распределение Стьюдента с п — 1 степенями свободы. Следствие 3. Пусть случайная выборка хр х2, ..., хп произведе- на из нормальной генеральной совокупности N(a]t ст2 ), а выборка yv у2, ..., ут — из генеральной совокупности N(a2, стр, и эти вы- борки независимы. Тогда х-у eN 2 2 Л СТ] СТл + — п т В частности, если обе выборки взяты из одной и той же генеральной совокупности (at = а2, о, — ст2), то х-у е ЛИ 0,ст2[ —+— к \п т Поскольку линейная комбинация независимых нормально распределенных случайных величин распределена нормально, то для доказательства достаточно вычислить математическое ожидание и дисперсию разности независимых случайных ве- личин х и у.
256 ЧАСТЬ II. Математическая статистика Следствие 4. Пусть случайная выборка х2, хя произведе- на из нормальной генеральной совокупности N(av af), а выборка У у У2> — > Ут 113 генеральной совокупности N(a2, а22), и эти выборки независимы. Тогда при одинаковых (возможно, неизвестных) дис- персиях ст2 = о2 = ст2 случайная величина Т_ (х-у)-(а1-а2) 11 1 |(n-l)s2 +(/Л-1)$2 Уп тУ п + т~2 где s2 us2 — исправленные оценки дисперсий, имеет распределе- ние Стьюдента с (п + т — 2) степенями свободы. Из следствия 3 вытекает, что 1, - 6 Мо, I). /СТ1 ! СТ2 \ п т По теореме Фишера --------г-1- е е хт^ , причем ст ст 52, 52 независимы. Следовательно, = (л-1)52 (т-1)522 2 '12 2 "Г 2 е >Сп+/л-2 > СТ СТ так как по свойству х2-распределения сумма x»-i+x»-i распреде- лена тоже по закону х2 с т + п — 2 степенями свободы. Тогда случайная величина Т = -.—--— г по определению распреде- / П2 Vп + т-2 лена по закону Стьюдента с п + т — 2 степенями свободы. Следствие 5. Пусть случайная выборка xt, х2, ..., хп произведе- на из нормальной генеральной совокупности N(av а2), а выборка yt, У2> > Ут ~ из генеральной совокупности N(a2, и22), и эти вы- борки независимы. Тогда при одинаковых (возможно, неизвест- ных) дисперсиях ст2 = ст2 = ст2 случайная величина
Глава 12. Функции и распределения в математической статистике 257 распределена по закону Фишера с п — 1 и т — 1 степенями сво- боды. Доказательство вытекает из того факта, что случайные ве- личины ("-О*. cy2 cy2 2 с Л.я-1 ’ 2 е ^т-\ О О распределены по закону х2 и независимы, так как независимы соответствующие выборки. Задачи для самостоятельного решения 1. Вычислить значения: а) Г(7/2); б) Г(9/2); в) В(5/2,7/2); г) В(3/2,9/2). 2. Доказать свойства 1—3 бета-функции. 3. Доказать, что сумма двух независимых х2-распределенных слу- чайных величин подчиняется распределению х2> а именно Хл+л? — Хл + Хл> • 4. Найти математическое ожидание и дисперсию распределения х« • 5. Доказать, что распределение Хл сходится к нормальному закону со средним п и дисперсией 2п при п -> оо (в смысле асимптоти- ческой нормальности). 6. Пусть — независимые, нормально распределенные (1 ~п случайные величины, е МО, a2), i = 0, 1, 2, ..., п и г|= — Найти распределение случайной величины t = —. П 7. Найти дисперсию распределения Стьюдента при п > 2. 8. Найти эксцесс распределения Стьюдента при п > 4. 9. Пусть случайная величина £ имеет распределение Стьюдента с п степенями свободы. Какое распределение имеет случайная величина ц = ^2? 10. Доказать, что распределение Стьюдента с ростом числа степе- ней свободы (п оо) сходится к стандартному нормальному распределению. 11. Найти моду гамма-распределения у(а, X). Теория вероятностей
258 ЧАСТЬ II. Математическая статистика 12. Доказать, что если е у(ар X) и е у(а2, X) — две независи- мые гамма-распределенные случайные величины, то отноше- ние г| =------*— имеет бета-распределение с параметрами а. и ^2 а2: т] е Р(ар а2). 13. Найти математическое ожидание и дисперсию бета-распреде- ления Р(д, й). 14. Найти моду бета-распределения Р(д, й). 15. Пусть ^2, ..., и т]р т]2, ..., r|m — независимые, нормально распределенные случайные величины — е N(0, а2); т]. е N(0, а2). 1 п Найти закон распределения случайной величины у = ———. 16. Определить, к какому распределению сходится распределение Фишера т) при /и -> оо. 17. Найти математическое ожидание, моду и дисперсию распреде- ления Фишера. 18. Пусть даны две независимые случайные величины г| е у(и; X). Найти распределение случайной величины —. П 19. Доказать, что в случае нормального распределения N(a, о2) не- исправленная выборочная дисперсия имеет дисперсию п2 20. Пусть хр х2, ..., хл, ур у2, ут — независимые случайные вы- борки объема п и т из нормально распределенной генеральной совокупности N(a, а2) с исправленными выборочными дис- персиями s2x, s2y. Доказать, что оценка 5Х2 , = —-—-[(л- l)s2 +(т— 1)jJ ] 'у п + т-2 у является эффективной в классе всех линейных несмещенных оценок параметра а2, построенных по наблюдениям s2, s2y 21. Пусть имеется М независимых случайных выборок объемов Яр л2, ..., пм из нормально распределенной генеральной сово-
Глава 12. Функции и распределения в математической статистике 259 купности N(a, а2) с исправленными выборочными дисперсия- ми s2,52, . Построить эффективную оценку (в классе всех линейных несмещенных оценок) для дисперсии ст2. 22. Доказать, что смещенная выборочная дисперсия нормального распределения является асимптотически эффективной (соглас- но определению для асимптотически нормальных оценок). 23. Для показательного распределения с плотностью ^(хД) = Хе-Хх, х>0 доказать несмещенность и асимптотическую эффективность оценки параметра X. пх 24. Для оценивания параметра ст нормального распределения МО, ст2) намереваются использовать оценку вида = Найти константу с, при которой оценка ст* является несмещен- ной. Вычислить ее эффективность. 25. Для оценивания параметра ст нормального распределения МО, о2) намереваются использовать оценку вида ст = сл5, где s — исправленное выборочное среднее квадратическое откло- нение. Найти последовательность чисел сн, при которых оцен- ка ст является несмещенной. Проверить ее на асимптотическую эффективность.
Глава 13 МЕТОДЫ ПОСТРОЕНИЯ ОЦЕНОК 13.1. Метод моментов Метод моментов, предложенный английским статистиком Карлом Пирсоном в 1894 г., заключается в приравнивании опре- деленного числа выборочных моментов к соответствующим теоре- тическим, которые являются функциями неизвестных параметров 0Р 02, ..., 8к. Рассматривая количество моментов, равное числу к неизвестных параметров, подлежащих определению, и решая по- лученные уравнения относительно этих параметров, получаем искомые оценки. Иначе говоря, оценки параметров 0,, 02, ..., 0t являются решениями систем уравнений a,(0l,02,...,0t) = a/ или p,(0l,02,...,0t) = p, для некоторых / = /,, z2, ..., ik. Метод моментов содержит неопределенность, поскольку мож- но получить уравнения для неизвестных параметров 0Р 02, ..., Qk, используя как начальные, так и центральные моменты, а также некоторые их модификации типа асимметрии или эксцесса. Пример. Функция />(*) = < —е 2в, х>0; 0 О, х<0 х<0 задает плотность распределения Рэлея (см. § 6.4). Требуется оценить параметр 0 по выборке хр х2, ..., хл. Найдем оценку параметра 0, приравнивая начальные выбо- рочные и теоретические моменты. Первый начальный момент
Глава 13. Методы построения оценок 261 имеет вид: at = ^]лд/2. Приравнивая, получаем первую оценку _________________ _ Л 2х2 параметра: у]т1&п/2 = х, откуда 0„ =-. 71 Приравнивая вторые начальные моменты, можем получить другую оценку: = а нз уравнения, которое получит- ся при использовании второго центрального момента (диспер- ч А 2? сии), — третью оценку: 0„ =---. 4-л Часто полагают, что для нахождения оценки одного пара- метра следует брать первый момент, для двух — первые два момента и т.п. По возможности действительно имеет смысл поступать так, поскольку это проще всего. Однако такой под- ход годится не всегда. Он не проходит, например, если не- которые моменты равны нулю или не зависят от нужных па- раметров. В общем случае система уравнений для моментов может не иметь решения в элементарных функциях (и тогда можно ис- кать решение приближенными методами) или вообще оказать- ся неразрешимой (несовместной). Оценки, полученные методом моментов, часто оказываются смещенными. К достоинствам метода моментов следует отне- сти его простую вычислительную реализацию, а также то, что оценки являются функциями от выборочных моментов. В силу теоремы Слуцкого любая непрерывная функция от выборочных моментов функции сходится по вероятности к по- стоянной, получаемой подстановкой в эту функцию теоретиче- ских моментов, если они существуют и если получаемая таким образом постоянная конечна. Для определенности рассмотрим функцию Я(ар а2) от двух моментов (начальных или централь- ных), хотя ее можно обобщить на любое конечное число ар- гументов, в том числе и на случай, когда Н зависит только от одного аргумента. ► Теорема 1. (Крамера). Пусть в некоторой окрестности точки (% а2) функция Я(ар а2) непрерывна и имеет непрерывные част- ные производные первого и второго порядка: н= к н. н{а dot । da 2
262 ЧАСТЬ II. Математическая статистика Тогда для любой выборки, по которой найдены оценки си,аг, случайная величина Я(а|,аг) асимптотически нормальна при п со следующими параметрами: Иногда оценки, получаемые с помощью метода моментов, принимаются в качестве первого приближения, по которому можно построить другими методами оценки более высокого качества. Оценки метода моментов используются также, когда суще- ствует необходимость оценить не сами параметры распределе- ния (которые часто представляют собой некие абстракции), а определенные практически значимые показатели, зависящие от этих параметров функционально: G = g(0p 02, ..., 0к). Самый простой (хотя и не самый точный) способ такого оценивания — подставить полученные оценки в соответствующую функцию: G = g(0p02,...,0J. Если распределение определяется одним параметром, то для построения оценки один теоретический момент приравнивают к одному эмпирическому моменту того же порядка (обычно первого). Задача 1. Случайная величина £, (число появлений события Авт независимых испытаниях) подчинена биномиальному за- кону распределения с неизвестным параметром р. Ниже при- ведено эмпирическое распределение числа появлений события в 10 опытах по 5 испытаний в каждом (в первой строке указано число х. появлений события А в одном опыте; во второй строке указана частота п. — количество опытов, в которых наблюда- лось столько появлений события А). х< 0 1 2 3 4 п. 1 5 2 1 1 1 Найти методом моментов точечную оценку параметра р би- номиального распределения. Оценить вероятность /?0 = Р(^ = 0). Решение. Математическое ожидание биномиального распре- деления известно: = тр. Приравняв математическое ожи- дание к выборочному среднему, получим уравнение: тр = х, откуда р = х/т. Для рассматриваемого примера имеем:
Глава 13. Методы построения оценок 263 х = (0-5 + 1-2 + 2-1+ 3-1+ 4-1)/10 = 1,1; р = 1,1/5 = 0,22; р0=(1 - 0,22)5« 0,29. Если распределение определяется двумя параметрами, то для построения их оценок два теоретических момента приравнивают двум соответствующим эмпирическим моментам тех же поряд- ков (обычно первым двум). Задача 2. Случайная величина X (отклонение контролиру- емого размера изделия от номинала) подчинена нормально- му закону распределения с неизвестными параметрами а и о. Ниже приведена таблица наблюдаемых отклонений от номина- ла, подвергнутых группировке, для п = 200 изделий. В первой строке указаны середины интервалов отклонений х. (мм); во второй строке приведена частота п. — число наблюдений, по- падающих в данный интервал. X. 0,3 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,2 2,3 6 9 26 25 30 26 21 24 20 8 5 Найти методом моментов точечные оценки неизвестных параметров а и о нормального распределения. Оценить долю изделий с отклонением менее 1,5 мм в генеральной совокуп- ности, используя нормальное приближение. Решение. Для нахождения двух неизвестных параметров необходимо два уравнения. Первое получаем, приравняв на- чальный теоретический момент первого порядка к начально- му эмпирическому моменту первого порядка, а второе — при- равняв центральный теоретический момент второго порядка к центральному эмпирическому моменту второго порядка: а =х, (а*)2=52. Найдем величины х и о2 по данным выборки: х=—У пх = (0,3-6 + 0,5-9 + 0,7-26 + 0,9-25 +1,1-30 + 1,3-26 + 200+ ' ' +1,5-21+ 1,7-24 +1,9-20 +2,2-8 +2,3-5)/200 = 1,266. Для нахождения выборочной дисперсии перейдем к услов- ным вариантам w( = 10х.:
264 ЧАСТЬ II. Математическая статистика -2 1 11 ( 1 11 Г о (и)=—Уи2л- —= (6-9 + 9-25 + 26-49 + 25-81 + 200^Г ' ' J +30 121 + 26 169 + 21-225 + 24-289 + 20-361 + 8-484 + 5-529)/200- —1,2662 -100 = 24,72; о2(х) = а2(и)/100 = 0,2472; $2=у^-о2 = 0,2484 (при больших л исправленная и неисправленная выборочные дисперсии мало различаются); 5 = 0,498. Таким образом, получаем: а « 1,27 (мм); а‘ » 0,5 (мм). Оценим долю изделий с отклонением менее 1,5 мм как ве- роятность для нормальной ~ ~ <1 5-1 27 Л р = Р(%<1,5) = ф| ’ *’ «0,68. Замечание. Эту долю можно оценить также непосредственно по таблице: поскольку значение 1,5 мм делит соответствующий интервал пополам, получается, что 122 из 200 изделий имеет отклонение меньше заданного, что дает близкую оценку 0,61. Задача 3. Предполагается, что выполнение некоторой работы занимает случайное время с распределением Симпсона на отрез- ке [а, />]. Хронометраж 20 испытаний дал среднее время работы 30 мин. и исправленную выборочную дисперсию 24 мин.2. Опре- делить параметры а и b методом моментов. Оценить, за какое время работа будет выполняться с вероятностью 98%. Решение. Для распределения Симпсона (плотность которого имеет вид равнобедренного треугольника с основанием на за- данном отрезке) имеем = D^b~a^ . 5 2 24 Параметры распределения можно выразить через математи- ческое ожидание и дисперсию: = b = ME) + y[6D^. Подставляя вместо теоретических моментов выборочные, получаем оценки
Глава 13. Методы построения оценок 265 а = х-7б?; Ь = х + , откуда а = 18 (мин.), Ь =42 (мин.). Функция распределения Симпсона имеет вид: F(x) = О, х < а; 2(х-а)2 /(b-а)2, а<х<(а + Ь)/2; \-2(b-x)2/(b-a)2, (a+b)/2<x<b-, 1, Решая уравнение F(x) = 0,98, находим искомое время Т = Ь-ОД(Ь-а). Подставляя полученные оценки в формулу вместо тео- ретических параметров, получаем Т = 42 - 0,1(42 - 18) = = 39,6 (мин.). 13.2. Метод максимального правдоподобия Одним из основных методов получения оценок параметров генеральной совокупности по данным выборки является ме- тод максимального правдоподобия, предложенный Р. Фишером. Основу метода составляет функция правдоподобия, выражаю- щая плотность вероятности (либо вероятность) совместного по- явления результатов выборки хр хг ..., хп. Результаты выборки рассматривают как одну из возможных реализаций и-мерной случайной величины (^р ^2, ..., ^п), ком- поненты которой независимы и имеют одну и ту же функцию распределения. Совместное распределение этих величин задается в виде произведения частных распределений (поскольку предполага- ется, что наблюдения независимы) и, следовательно, функция правдоподобия имеет вид L(xv х2, ..., хп, 0) = JJP(x,.,0) (=1 в случае дискретного распределения, заданного вероятностями Р(х, 0), и L(xv х2, ..., хл, 0) = JJp(x,.,0)
ж ЧАСТЬ II. Математическая статистика в случае непрерывного распределения с плотностью р(х,0). Из определения функции правдоподобия следует, что чем вероятнее (правдоподобнее) набор значений (хр х2, хл) слу- чайной величины £ при фиксированном 0, тем больше значе- ние функции правдоподобия. Поэтому в качестве оценки неиз- вестного параметра 0 принимается такое значение 0Л, которое максимизирует функцию правдоподобия. Если параметр 0 е Q, где Q — замкнутая область допусти- мых значений параметра, то получаем задачу математического программирования: найти такое 0Л, чтобы £(х1?...,хл, 0Л) = тах£(х1,...,хл,0). Поиск оценки упрощается, если максимизировать не саму функцию правдоподобия, а ее логарифм, потому что максиму- мы Z(X 0) и lnZ(X 0) достигаются при одном и том же значе- нии параметра 0. Функцию /л(хр ..., хл, 0) = In ДА", 0) называют логарифмической функцией правдоподобия. Если максимум функции /л(хр ..., хл, 0) достигается внутри допустимой области Q, то в точке максимума 0Л выполняются необходимые условия экстремума: 5/л(хр...,хя,0) Л _ . . _ , ——?-------— = 0 для любого I = 1,2, ..., к, 50,. Полученная система уравнений называется уравнениями прав- доподобия. Решения этой системы могут соответствовать макси- муму (минимуму) функции L(xv ..., хп, 0), а также являться точ- ками перегиба. Необходимо проверить, что полученное решение есть точка максимума функции правдоподобия. Отсюда алгоритм для отыскания оценки параметра 0: реша- ют уравнение или систему уравнений правдоподобия, получае- мых приравниванием производной (частных производных) по / х л 51п£ Л п _ параметру (параметрам) 0 к нулю: ------= 0. Затем отбирают то 50 решение, которое соответствует именно максимуму функции 1п£, т.е. вторая производная в данной точке должна быть от- „ 521п£ тл . _ рицательнои: -----— <0. Иногда функция правдоподобия имеет 50 несколько максимумов и приходится искать наибольший из них. Бывают также случаи, когда этот алгоритм не действует, поскольку функция правдоподобия достигает максимума не во внутренней точке, а на границе некоторой области, либо ког-
Глава 13. Методы построения оценок 267 да она просто недифференцируема в точке максимума. Такие случаи называют нерегулярными. Достаточные условия регулярности (в одномерном случае) следующие. 1. В интервале возможных значений параметра 0 плотность р(х, 0) трижды дифференцируема по 0, МН(£) < С, С не зависит от 0. причем д3р ае3 <Я(х), где 2. Тождество 00 Jp(x, tydx = 1 можно дважды дифференциро- вать под знаком интеграла по параметру 0. - КА MX 3. Математическое ожидание /(0) = Л/ ---2—- конечно и положительно. Теорема 2. Если выполнены условия регулярности 1—3, то 1) решение 0я уравнения правдоподобия существует; 2) 0Я — состоятельная оценка параметра 0; 3) распределение оценки 0я асимптотически нормально с па- раметрами 0 и —у—у ; 4) оценка максимального правдоподобия асимптотически эф- фективна. Если для оценок максимального правдоподобия выполнены условия теоремы Рао—Фреше—Крамера (см. § 11.4), то спра- ведлива следующая ► Теорема 3. Если эффективная (по Рао—Фреше—Крамеру) оцен- ка существует, то она является оценкой максимального правдо- подобия. Однако это не означает, что любая оценка максимально- го правдоподобия эффективна. Но если оценка оказывается неэффективна, это значит, что эффективных оценок вообще нет, хотя при этом могут существовать оценки с дисперсией, сколь угодно близкой к Дл. Следует также отметить, что метод максимального прав- доподобия иногда дает те же оценки, что и метод моментов, а иногда — другие. Бывает, что ни один из этих методов не дает хороших оценок, и приходится использовать другие методы.
268 ЧАСТЬ II. Математическая статистика А. Дискретные распределения Задача 4. Найти методом максимального правдоподобия оценку вероятности «успеха» 0 в схеме испытаний Бернулли. Решение, Рассмотрим случайную величину _ J1, в случае «успеха»; [0, в случае «неудачи», тогда функция вероятностей случайной величины £ запишется в виде Р(х, 0) = |0, Х = 1; [i-е, х=о. Логарифмическая функция правдоподобия для одного ис- пытания будет иметь вид ч [1п0, х = 1; /.(0) = In Р(х, 0) = 1 [1п(1-9), х = 0. Для п испытаний и т «успехов» в п испытаниях получаем /л (0) = т 1п0 + (л — т) ln( 1 — 0). Отсюда f (0) = — - —— = 0 и 0 = -. Проверим знак " 0 1-0 "п „ ,„,лх т п-т п второй производной: / л(0) — ——^р-<0. Таким образом, относительная частота появления события является оценкой вероятности «успеха» в одном испытании Бернулли, найденной методом максимального правдоподобия. Поскольку М$п =0, то оценка 0Л является несмещенной оцен- кой вероятности. Задача 5. Случайная величина £ (число поврежденных сте- клянных изделий в одном контейнере) распределена по зако- ну Пуассона с неизвестным параметром X. В таблице приведе- но эмпирическое распределение числа поврежденных изделий в 500 контейнерах (в первой строке указано число х. поврежденных изделий в одном контейнере, во второй строке указана частота л. — число контейнеров, содержащих х поврежденных изделий). х< 0 1 2 3 4 5 6 7 п, 199 169 87 31 9 3 I 1
Глава 13. Методы построения оценок 269 ============ — Найти методом максимального правдоподобия точечную оценку неизвестного параметра X распределения Пуассона. Решение. Выпишем функцию правдоподобия L = P(xv X) Р(х2, X) ... Р(хп; X) =-j-J--Г'+‘>+-^е-"\ Xj .х2.... хп. Найдем точку максимума логарифмической функции прав- доподобия, для чего приравняем к нулю ее первую произво- дную по X: п Я1п I 1 п In L = (£х, ) InX - пк - 1п(х,! х2! ... хп!) , —— = -£х,-п = 0. /=1 h /=! Получаем X* = х. Убедимся, что полученное значение X яв- ляется точкой максимума. Для этого найдем вторую производ- a2ini, 1а с ную и проверим ее знак в точке X: -----— = —Если в дк к1 ,=i последнее уравнение подставить Х’ = х, то вторая производная будет отрицательна, значит х является точкой максимума. Найдем значение X’ для рассматриваемого примера: 1 8 X' = -Ул,х, = (169 + 2-87+3-31 + 4-9 + 5-3+6+7)/500 = 1. «м Б. Непрерывные распределения Задача 6. Найти методом максимального правдоподобия по выборке хр х2, ..., хп точечные оценки параметров а и ст нор- мального распределения, плотность которого р(х) = —f=e 2°! . стл/2л Решение. Выпишем функцию правдоподобия: 1 fl" 7 А £(х1х„...,хлд,ст)=-==—exp vXU -a) . (стУ2я)" I 2ст2-=1 ) Логарифмическая функция правдоподобия имеет вид 1п£ = -л1пст-л1пл/2л—-а)2-
270 ЧАСТЬ II. Математическая статистика Найдем точку максимума, решив систему из двух уравне- ний, получающихся путем приравнивания первых двух частных производных по неизвестным параметрам к нулю: ainZ 1 А. . . -z—=—2>,-в)=о; да а" SlnZ л 1 А 2 —— = —£(х,-л)2=0 ост ст ст “7 £(х,-а) = 0; /=1 Проверим, является ли точка (я, а ) точкой максимума функции правдоподобия: д21п£ _ п да2 ст2 9 д2 L п 3 2 тт=-2---гЕ(х/-а); 0(5 (5 (5 /=j a2inz 2 а, -----= —г / (xi - а). дада ст3 “j* Как известно из математического анализа, чтобы функ- ция f(xv х2, ..., хп) достигала максимума в некоторой точке, достаточно, чтобы матрица второго дифференциала функции cPf в этой точке была отрицательно определена. По критерию Сильвестра для этого необходимо и достаточно, чтобы ее глав- ные миноры чередовались по знаку, а именно А, < 0, Д2 > 0. Рассмотрим матрицу производных
Глава 13. Методы построения оценок 271 Отсюда ^2 п2 Зп2 . 2п2 п —г+—л—0 = —г>0 ста ст Л ~2 Следовательно, точка (Л,ст ) — действительно точка макси- мума, и полученные оценки являются оценками максимально- го правдоподобия. Задача 7. Найти оценку максимального правдоподобия для параметра сдвига 0 распределения Коши, заданного плотно- стью р(х) =---------—, по выборке из двух наблюдений, если: л(1 + (х-0)2) a) Xj = -1, х2 = 1; б) Xj = -2, х2 = 2. Решение. Функция правдоподобия для двух наблюдений име- ет вид Ц0) =------------2---------- л(1+(х,-0)2) л(1+(х2-0)2) Введем функцию Л(0) = 1 л2Ц0) . Тогда задача максимизации функции правдоподобия эквивалентна задаче минимизации Л(0): а) если х, = -1, л^= 1, то А(0) = (1+(1 + 0)2)(1+(0-1)2) = 04+4. Функция R достигает минимума в точке 0=0, так что это и есть оценка максимального правдоподобия; б) если х, = -2, х2=2, то Л(0) = (1+(2 + 0)2 )(1+ (0 - 2)2) = 04 - 602 + 25, и производная имеет три нуля: в точках 0 = 0 и 0 = ±л/з. При этом точка 0=0 оказывается точкой максимума функции R. Точкам 0 = ±7з соответствует минимум функции Л, причем в обеих этих точках величина R одинакова. Таким образом, оба значения ±>/з являются в данном случае оценками максималь- ного правдоподобия. Замечание. Ни метод моментов, ни метод максимального прав- доподобия не могут дать хороших оценок для параметра сдвига распределения Коши. Тем не менее существует простая оценка Для него — выборочная медиана: 0л = xmed, поскольку Л0) = 1/2.
272 ЧАСТЬ II. Математическая статистика В. Нерегулярные случаи Задача 8. Найти методом максимального правдоподобия оценки параметров а и Ь равномерного закона распределения: О, х^1а,Ь]. Решение. Для равномерного закона не выполняется одно из условий регулярности, а именно: плотность разрывна по пара- метрам. В подобных ситуациях оценку следует искать другим способом. Выпишем функцию правдоподобия для равномерного рас- пределения: Цх„ х^ ..., х) = -------------, если все х. е [a, Ь]; 12 п (Ь-а)” ' ‘ L(xv х,, хл) = 0 в остальных случаях. Условие, что все наблюдения принадлежат отрезку [a, Z>], можно выразить через неравенства для крайних членов вариа- ционного ряда: а < xmjn, b > х^. При фиксированном значении а функция правдоподобия убывает по b при b > хтах и, следо- вательно, принимает максимальное значение при b = хтах. При фиксированном значении b функция правдоподобия возрастает по а при а < xmin и, следовательно, принимает максимальное значение при а = xmin. Таким образом, оценками максимального правдоподобия бу- дут крайние члены вариационного ряда а = xmjn и b = х^. Задача 9. Построить оценку методом максимального прав- доподобия параметра сдвига 0 для распределения Лапласа с плотностью р(х) = уехр(-|х-0|),-оо<х<оо. Решение. Функция правдоподобия имеет вид £(0)=^ехр| -£|х,-0| |. Логарифмируя, получаем 1п£(0) = -л1п2-£|х,-0|.
Глава 13. Методы построения оценок Заметим, что эта функция недифференцируема во всех точ- ках х2,..., хл, а в остальных точках производная имеет вид Лп£ _у|+1’ 0<хр J0 “^[-1, 0>х,.. Отсюда следует, что функция правдоподобия возрастает, если слева от значения 0 находится меньше членов вариационного ряда, чем справа, и убывает в противном случае. Следовательно, максимума она достигает посередине вариационного ряда. Если п — 2к + 1, то это происходит в точке x(t). Если п = 2к, то функ- ция постоянна на интервале (x(t), x(t+l)), где принимает наиболь- шее значение, и в качестве оценки можно взять середину этого интервала. Таким образом, оценкой максимального правдоподо- бия оказывается выборочная медиана 0„ = х^. 13.3. Метод наименьших квадратов. Линейная регрессия Метод наименьших квадратов заключается в том, что оценка определяется из условия минимизации суммы квадратов от- клонений выборочных данных от определяемой оценки. Метод наименьших квадратов получил самое широкое распростра- нение в практике статистических исследований, так как, во- первых, не требует знания закона распределения выборочных данных, во-вторых, достаточно хорошо разработан в отноше- нии вычислительной реализации. Первоначально метод был разработан для обработки данных с нормальными ошибками. В простейшем случае речь идет о данных вида х,. = 0 + ер где £( е 7V(0, о2). Оценка 0 строится ме- тодом максимального правдоподобия. Функция правдоподобия для нормального распределения равна ( 1 Г hT L(G) = -4= е 20 =Ce-hT, J ( 1 где С = —т==г {a>j2n J T = £(x,.-0)2. Следовательно, функция правдоподобия имеет максимум тогда, когда 7’ = ^(х,-0)2 достигает минимума. Если на пара-
ХМ ЧАСТЬ II. Математическая статистика метр 0 не накладываются ограничения, то оценка, полученная методом наименьших квадратов, совпадает с оценкой макси- мального правдоподобия для нормального распределения 0 = х . В более общем случае пусть Y — некоторый экономический показатель, объективный закон которого описывается функцио- нальной зависимостью Y= <р(Х, 0), где 0 = (0Р 02, ..., 0J — па- раметр; X — многомерная неслучайная переменная. Пусть в результате z-ro наблюдения мы получили значение yt функции <р(хр 0) со случайной ошибкой еР т.е. у{ = <р(х, 0) + гг Требуется по наблюдениям (хр у(), ..., (хп, уп) оценить значения параме- тров 0,, 02, ..., 0ж. Если в результате наблюдений получено п пар значений (х,, у), где х. — значение аргумента, а — значение функции, то параметры (0Р 02, ..., 0J аппроксимирующей функции вы- бираются так, чтобы обратилась в минимум сумма 5= £Lf, - ф(х, 0)Р. <=1 Обоснование метода следующее. Пусть измерения неза- висимы и распределение ошибок нормальное: е(. е N(0, ст2). Величина yt как сумма постоянной величины <р(х(., 0) и слу- чайной величины ez является случайной величиной, и ее рас- пределение также нормальное: у. е МфЦ, 9), ст2)- Плотность распределения будет иметь вид । (у,-Ф<х,.е))г р(у, 0)=—т=е 2°2 ст-у2л Функция правдоподобия для наблюдаемых значений ур у2, ..., уп будет равна ДГ, 0) = 2 ° /=| Отсюда функция правдоподобия Д0) при изменении 0 име- ет максимум тогда и только тогда, когда статистика = i си, - ф(х, о)]2 / = 1 достигает минимума. Задача свелась к задаче математического программирова- ния: найти такое значение 0„, которое минимизировало бы квадратичную форму
Глава 13. Методы построения оценок 275 ТМ = min £[у, -<p(x,.,0)]1 2, в,„ „в, ,=| где (х,, у,), (Хр у2), (хл, уп) — случайная выборка. Так как 0Л = (0р 02,..., 0J является точкой минимума статистики 7^(0), то, приравнивая к нулю ее частные производные = 0, i = 1,2, ..., к, ае, получаем систему нормальных уравнений, решения которой и являются оценками (0!, 02,..., 0„) неизвестных параметров, най- денными методом наименьших квадратов. Система нормальных уравнений всегда имеет решение, так как положительный квадратичный многочлен всегда достигает минимума. Однако решение не обязательно является единствен- ным. Может случиться, что нормальные уравнения однозначно разрешимы лишь для некоторых определенных линейных ком- бинаций параметров 0р 02, ..., 0к, а относительно самих параме- тров однозначного решения нет. Такие линейные комбинации индийский статистик Рао назвал допускающими оценку. На практике метод применяется теперь гораздо шире, в частности, если об ошибках е. известно лишь, что = 0 и Zk < оо. Бывает, что метод применяется даже в случаях, когда об ошибках нельзя сказать, что они являются случайными ве- личинами, независимыми и одинаково распределенными. Одной из основных задач математической статистики явля- ется исследование зависимости между двумя или несколькими переменными. Строгая функциональная зависимость реализу- ется редко, так как одна или обе величины подвержены еще и воздействию случайных факторов. Статистической называется зависимость, при которой изменение одной из величин влечет за собой изменение распределения другой. Поскольку обычно невозможно точно предсказать неизвест- ное значение одной величины при известном значении другой, это желательно сделать хотя бы «в среднем». Поэтому есте- ственно использовать функции регрессии (см. § 7.4). Например, в случае двумерного нормального распределения с плотностью p(Xj, Х2 ) =---== х -р 1 (_?,(*i -Д|)(х2-а;) (х2-а2)2>|] ХСХР] zp •+- 2 [ 2(1-р ст, CTtCT2 с2 J)
?76 ЧАСТЬ II. Математическая статистика функции регрессии оказываются линейными и имеют вид: 9..^ , ) = ai + Р—- ^ )> <Р5,15, (х2) = а, + р—(х2 -а2). П1 СТ2 Однако на практике модель линейной зависимости между величинами используется гораздо шире, без предположения нормальности совместного распределения. Линейной регрессией называется сведение наблюдаемой на опыте зависимости некоторой переменной (зависимой или объ- ясняемой) от одной или более других переменных (независимых или объясняющих) к линейной (в предположении, что строгая линейная зависимость между ними нарушается случайными ошибками). Для проведения линейной регрессии часто исполь- зуется метод наименьших квадратов. В простейшем случае речь идет о двух переменных. Пусть х — независимая переменная, у — зависимая, и между ними существует следующая связь: у. = а + Ьх. + £., 1дс а и b — числовые коэффициенты, случайные ошибки, Ме/ = 0 и /)е < оо. Задача состоит в том, чтобы по имеющимся наблюдениям (хг ух), (х2, у2), ..., (хл, уп) построить оценки для а и Ь. Согласно методу наименьших квадратов необходимо ре- шить следующую математическую задачу: Т = ^(у, -a-bXj)2 ->min. Решим задачу, вычислив частные производные суммы ква- дратов по каждому из коэффициентов и приравняв эти произ- водные к нулю. Получим систему нормальных уравнений: АТ - = -2^(yi-a-bxl)=0; да % ат п — = -2^(У, - а - Ьх, )х, = 0. до Решая данную систему относительно параметров а и Ь, по- лучим оценки: л п п ь = - Т)(*, -х) / £(х( -х)2; а = у-Ьх • '-1 / Z-1
Глава 13. Методы построения оценок 277 Уравнение вида у = а + Ьх называется уравнением линейной регрессии, а получаемые из него значения yi=a + bxt — пред- сказанными значениями, в отличие от наблюдаемых значений у Заметим, что уравнение линейной регрессии часто бывает удобно записать в виде у = у + Ь(х-х). Соответствующая пря- мая всегда проходит через точку выборочных средних (х,у). Числитель и знаменатель в формуле оценки параметра b можно вычислять по следующим эквивалентным формулам: - У )(Х, -х) = £х,У/ - пху; - х)2 = £х,2 - пх2. /=1 /=1 /=1 1=1 Здесь также можно перейти к условным вариантам и = х.-с, v. = у. - d, и оценка b от этого не изменится. В некоторых случаях, например когда величина у (по смыс- лу) представляет собой некую долю от х, рассматривают более простой тип линейной зависимости: у. = bx. + £., т.е. полагают а = 0. В этом случае оценка Ь методом наимень- ших квадратов имеет вид Л п / п /=1 / /=1 Важным и практически значимым результатом линейной регрессии является то, что она позволяет «предсказывать» зна- чения зависимой переменной даже для таких значений неза- висимых, которые не наблюдались реально. Таким образом, например, можно строить прогнозы на будущее. Задача 10. Затраты х на развитие производства и у — вели- чина годовой прибыли фирмы в течение 5 лет представлены в условных единицах следующей таблицей: X 6 3 7 5 10 У 33 27 32 28 42 На величину прибыли влияют случайные факторы. Предпо- лагается, что имеет место линейная зависимость у. = а + Ьх.+ е между затратами х и прибылью у. Среднее значение е/. равно нулю и дисперсия конечна. Каждый год случайное влияние не коррелировано с предыдущими годами. Оценить параметры а
278 ЧАСТЬ II. Математическая статистика и Ь. Оценить годовую прибыль в том случае, если на развитие производства будет затрачено 12 у.е. Решение. Перейдем к условным вариантам и. = х. - 6, v. = = У,-33. и 0 -3 1 -1 4 V 0 -6 -1 -5 9 Получаем и = (0 — 3+1-1+ 4)/5 = 0,2; v =(0-6- - 1 - 5 + 9)/5 = -0,6. Отсюда х = 6,2; у = 32,4. Далее вычисляем следующие суммы: £«,v, -nuv = ((-3) • (-6) + 1 • (-1) + (-1) • (-5) + 4 • 9) - - 5 • 0,2 • (-0,6) = 18 - 1 + 5 + 36 + 0,6 = 58,6. -пй2 = (0 + (-3)2 + I2 + (-1)2 + 42) - 5 • 0,22 = 9 + 1 + + 1 + 16 - 0,2 = 26,8. Получаем b = 58,6/26,8 «2,187; а = 32,4 - 2,187 • 6,2 « « 18,843. Имеем +(12) » 45 (у.е.). На рис. 13.1 представлены данные задачи и прямая линей- ной регрессии. Замечание. На самом деле по столь небольшому числу точек нельзя делать серьезные выводы на будущее. Зависимость между расходами на развитие и прибылью У-е. 40 5 35 Q. С 30 25 2 3 4 5 6 7 8 9 10 11 У-е. Расходы Рис. 13.1
Глава 13. Методы построения оценок 279 Задача 11. В таблице представлены данные о годовых доходах и расходах на личное потребление (долл. США) для 10 семей: Годовой доход Расходы на личное потребление 2508 2406 2572 2464 2408 2336 2522 2281 2700 2641 2531 2385 2390 2297 2595 2416 2524 2460 2685 2448 Зависимость расходов от доходов Провести линейную регрессию расходов по доходам в виде у = Ьх. Оценить параметр Ь. Оценить величину расходов для семьи с годовым доходом 2500 долл. США. Решение. Суммируем доходы х., расходы yt и делим одно Л п In на другое. Получаем значение параметра Ь = = = 24 134/25 435 « 0,949. м Для семьи с доходом 2500 долл. США получаем оценку рас- ходов в 2372 долл. США. На рис. 13.2 представлены данные задачи и прямая линей- ной регрессии долл. I 2600 2500 С О I 2400 s Е? Л * 2300 § х £ 2200 2300 2400 2500 2600 2700 ДОЛЛ. Доходы Рис. 13.2
280 ЧАСТЬ II. Математическая статистика Задачи для самостоятельного решения Теоретические задачи 1. Найти методом моментов оценку параметра X распределения Пуассона. 2. Найти методом моментов оценку параметра р (вероятности «успеха») для геометрического распределения. 3. Найти методом моментов оценку параметра 0 для геометриче- ского распределения с вероятностью «успеха» р = 1/(1 + 0), 0 > 0. Доказать ее несмещенность. 4. В случае сдвинутого показательного распределения 1 р(х,0,ц) = — е ° , х > ц (0, ц > 0) с помощью метода моментов 0 найти оценки 0 и ц параметров 0 и ц соответственно. 5. Для гамма-распределения у(а, X) методом моментов найти оценку параметра а при известном X. Доказать ее несмещен- ность и найти дисперсию этой оценки. 6. Для гамма-распределения у(а, X) методом моментов найти оценки неизвестных параметров а и X. 7. Найти оценку для числа степеней свободы г распределения Хг методом моментов. Доказать несмещенность и найти диспер- сию этой оценки. 8. Найти оценку для числа степеней свободы г распределения Стьюдента методом моментов. При каких г это возможно? 9. Пусть случайная величина £ равномерно распределена на от- резке [0, 0]. Найти методом моментов оценку для параметра 0. 10. Пусть случайная величина £ равномерно распределена на от- резке [а, д]. Найти методом моментов оценки для а и Ь. 11. Пусть случайная величина £ равномерно распределена на [c-4d\c + 4d]. Найти методом моментов оценки для с и d. Доказать их несмещенность. 12. В случае равномерного распределения на отрезке [0Р 01 + 02] с помощью метода моментов найти оценки 0, и 02 для пара- метров 0, и 02. 13. Случайная величина £, равна сумме двух независимых случай- ных величин, имеющих показательное распределение с пара- метрами Xj и Х2 соответственно. По наблюдениям случайной
Глава 13. Методы построения оценок 281 величины оценить параметры Xj и Х2 методом моментов, в предположении, что X, < Х2. 14. По наблюдениям случайной величины с распределением Парето г(х)=40. х<1; оценить параметр а методом моментов. х>1 При каких значениях параметра а это возможно? 15. По наблюдениям случайной величины с распределением Дх) = хР, 0 <х < 1, оценить параметр р методом моментов. 16. По наблюдениям случайной величины с распределением Дх) = (х/0)₽, 0 < х < 0, оценить методом моментов а) параметр Р при известном 0; б) параметр 0 при известном р. 17. По наблюдениям логнормальной случайной величины £ е е exp{N(a, о2)} найти оценки параметров а и о2 методом моментов. 18. Найти оценку методом моментов для параметра X распреде- ления Лапласа, заданного функцией плотности р(х) = —е"х|х|. 19. Найти по выборке хр х2, ..., хп методом максимального прав- доподобия точечную оценку параметра р геометрического рас- пределения: Р(& = к) = р(1 — р)к'\ к > \. 20. Найти методом максимального правдоподобия оценку пара- метра 0 для геометрического распределения с вероятностью «успеха» р = 1/(1 + 0), 0 > 0. Доказать ее несмещенность. 21. По выборке хр х2, ..., хп в случае биномиального распределения P^ = m) = C™pmqN~m при известном У методом максимального правдоподобия найти оценку параметра р. Совпадает ли эта оценка с оценкой, полученной с помощью метода моментов? Исследовать оценку на несмещенность и состоятельность. 22. По выборке хр х2, ..., хп в случае равномерного распределения на отрезке [0, 0] методом максимального правдоподобия най- ти оценку параметра 0. Вычислить математическое ожидание полученной оценки и построить несмещенную оценку на ее основе. 23. Случайная величина равномерно распределена на [0, 20], 0 > 0. Найти оценку параметра 0 методом максимального правдопо- добия. 24. Случайная величина равномерно распределена на [- 0, 20], 0 > 0. Найти оценку параметра 0 методом максимального правдо- подобия.
282 ЧАСТЬ II. Математическая статистика 25. Случайная величина равномерно распределена на [1 -0, 1 + 0], О < 0 < 1. Найти оценку параметра 0 методом максимального правдоподобия. 26. Найти методом максимального правдоподобия оценку пара- метра а для распределения, заданного следующей функцией плотности: ч [1, а<х<а + 1; р(х) = [О, х & [а,а +1]. Построить несмещенную оценку на основе оценки максималь- ного правдоподобия. 27. Найти оценку методом максимального правдоподобия для па- раметра X распределения Лапласа, заданного функцией плот- ности Р(х) = увх^. 28. Оценить с помощью метода максимального правдоподобия па- 29. 30. раметр сдвига 0 в сдвинутом показательном распределении, / ч [е"(х"0), х>0; заданном плотностью р(х) = < [0, х < 0. Пусть случайная величина £ имеет функцию распределения . (ех~е, х<0, F(x) = < [0, х>0. Методом максимального правдоподобия оценить параметр 0. Распределение Кэптейна имеет плотность вида (g(x)-fl)2 p(x)=-^Le 2»2 , с\/2л где g(x) — дифференцируемая функция. Найти методом мак- симального правдоподобия точечную оценку параметра а, если параметр о известен. 31. Для распределения Кэптейна найти методом максимального правдоподобия точечную оценку параметра о, если параметр а известен. 32. Для гамма-распределения у(а, X) методом максимального прав- доподобия найти оценку параметра А. при известном а. 1 33. Для показательного распределения с плотностью р(х) = — е и, Ц х > 0, ц > 0, найти оценку параметра ц методом максимального правдоподобия.
Глава 13. Методы построения оценок 283 34. Функция распределения случайной величины % имеет вид F(x) = е х' , х > 0, 0 > 0. Найти оценку параметра 0 методом максимального правдоподобия. 35. Для распределения Вейбулла вида Р(х) = \-е~^2 , х > 0, X > 0, найти оценку параметра X методом максимального правдопо- добия. 36. Для сдвинутого показательного распределения с плотностью 1 р(х) = —е 0 , х > ц, 0 > 0, методом максимального правдоподо- 0 бия найти оценки параметров 0 и ц. 37. Для распределения Парето вида 0, 1-х"а, х < 1; х > 1, оценить параметр а методом максимального правдоподобия. 38. По наблюдениям случайной величины с распределением Дх) = х^, 0 <х < 1, оценить параметр р методом максимального правдоподобия. 39. По наблюдениям случайной величины с распределением Дх) = (х/0)р, 0 < х < 0, оценить методом максимального прав- доподобия: а) параметр р при известном 0; б) параметр 0 при известном р. 40. По наблюдениям логнормальной случайной величины £ е ехр{Ма, о2)} найти оценки параметров а и а2 методом мак- симального правдоподобия. 41. По наблюдениям случайной величины, равномерно распреде- ленной на отрезке [а, Л], найти оценки параметров а и b мето- дом максимального правдоподобия. Найти их математическое ожидание и построить несмещенные оценки. 42. Доказать эффективность оценки, полученной методом макси- мального правдоподобия, для параметра 0 гамма-распределе- ния (с фиксированным параметром а), параметризованного в виде га-1 Дх, а, 0) =----е’х/0, х > 0. 0аГ(а) 43. Доказать, что оценка методом моментов для параметра р би- номиального распределения P(t3 = m) = C”prnqNm является эф- фективной (при известном 7V).
284 ЧАСТЬ II. Математическая статистика 44. Доказать, что не существует эффективных оценок для параме- тра X показательного распределения р^(х,Х) = Хе"Хх, х>0. 45. Доказать, что не существует эффективных оценок для параме- тра X гамма-распределения (с фиксированным параметром а), параметризованного в виде р(х, а, 0) =---, х > 0 . Па) 46. Доказать, что не существует эффективных оценок для параме- тра о2 нормального распределения N(a, о2). Вычислительные задачи 47. Случайная величина £ (число семян сорняков в пробе зерна) X7 распределена по закону Пуассона: Р(/) = —Ниже приве- дено распределение семян сорняков в п = 1000 пробах зерна (в первой строке указано количество х. сорняков в одной про- бе; во второй строке указана частота ni — число проб, содер- жащих х. семян сорняков). xf. 0 1 2 3 4 5 6 п, 405 366 175 40 8 4 2 Найти методом моментов точечную оценку параметра X. Оценить вероятность того, что в пробе зерна не будет сорняков. 48. Случайная величина £ (срок службы изделия) имеет показа- тельное распределение р(х) = Хе ^ (х > 0). В таблице приведены сгруппированные данные по срокам службы (ч) для п = 200 изделий. х. 2,5 7,5 12,5 17,5 22,5 27,5 п. 133 45 15 4 2 1 Найти методом моментов точечную оценку неизвестного пара- метра X показательного распределения. Оценить время, кото- рое изделие прослужит с вероятностью 90%. 49. В таблице приведены сгруппированные данные о коэффициен- тах соотношения заемных и собственных средств на 100 малых предприятиях региона.
Глава 13. Методы построения оценок Номер интервала Интервал Середина интервала х{ 1 1 5,05-5,15 5,1 5 2 5,15-5,25 5,2 8 3 5,25-5,35 5,3 12 4 5,35-5,45 5,4 20 5 5,45-5,55 5,5 26 6 5,55-5,65 5,6 15 7 5,65-5,75 5,7 10 8 5,75-5,85 5,8 4 Оценить долю малых предприятий с коэффициентом не более 5,5 на основе оценок методом моментов (используя нормаль- ное приближение) и непосредственно по таблице. 50. В ОТК были измерены диаметры 300 валиков из партии, изго- товленной одним станком-автоматом. Отклонения измеренных диаметров от номинала (нм) даны в таблице. Границы отклонений Середина интервала Число валиков Границы отклонений Середина интервала Число валиков -30...-25 -27,5 3 0...5 2,5 55 -25...-20 -22,5 8 5...10 7,5 30 -20...-15 -17,5 15 10...15 12,5 25 -15...-10 -12,5 35 15...20 17,5 14 -10...-5 -7,5 40 20...25 22,5 8 -5...0 “2,5 60 25...30 27,5 7 Оценить долю изделий, для которых отклонение не превос- ходит 15 нм по абсолютной величине, с применением метода моментов (используя нормальное приближение) и непосред- ственно по таблице. 51. В таблице представлены данные по числу сделок на фондовой бирже за квартал для 400 инвесторов: х. 0 1 2 3 4 5 6 7 8 9 10 п' 146 97 73 34 23 10 6 3 4 2 2 В предположении, что случайное число сделок описывается распределением Пуассона, оценить параметр X методом мо- ментов. Определить вероятность того, что число сделок за квартал будет не менее двух, применяя метод моментов, и не- посредственно по таблице.
286 ЧАСТЬ II. Математическая статистика 52. Для изучения распределения заработной платы работников определенной отрасли обследовано 100 человек. Результаты представлены в таблице. Заработная плата, долл. США Число человек Заработная плата, долл. США Число человек 190-192 1 200-202 19 192—194 5 202-204 11 " 194-196 9 204-206 4 196-198 22 206-208 1 198-200 28 208-210 0 Определить долю работников с заработной платой менее 200 долл. США на основе оценок методом моментов (исполь- зуя нормальное приближение) и непосредственно по таблице. 53. При измерении веса 20 шоколадных батончиков (с номиналь- ным весом 50 г) получены следующие значения (г): 49,1; 50,0; 49,7; 50,5; 48,1; 50,3; 49,7; 51,6; 49,8; 50,1; 49,7; 48,8; 51,4; 49,1; 49,6; 50,9; 48,5; 52,0; 50,7; 50,6. Оценить долю батончиков с весом менее 49 г на основе оценок методом моментов (используя нормальное приближение) и не- посредственно по их доле в выборке. 54. Уровень воды в реке во время паводка (по сравнению с нор- мой) описывается гамма-распределением с параметрами а и X. Наблюдения за паводками показали выборочное среднее 165 см и выборочное среднее квадратическое отклонение 83 см. Найти методом моментов оценки а и X. Вычислить мо- дальное значение уровня воды. 55. Время выполнения работы описывается гамма-распределением с параметрами а и X. Хронометраж показал выборочное сред- нее N мин и выборочное среднее квадратическое отклонение М мин. Найти методом моментов оценки а и X. Вычислить модальное значение времени выполнения работы. Решить за- дачу при: a) N = 60, М = 30; б) N = 63, М = 21. 56. В поселке Червонцево все жители имеют доход не менее 100 тыс. руб. в месяц. Выборочное обследование доходов 10 че- ловек дало средний доход 200 тыс. руб. В предположении, что случайная величина дохода имеет распределение Парето вида [0, х<х0;
Глава 13. Методы построения оценок 287 где х0 = 100 тыс. руб., оценить параметр а и средний доход жителей с доходами свыше 500 тыс. руб. с использованием метода моментов. 57. В поселке Полтинниково все жители имеют доход не менее 50 тыс. руб. в месяц. Выборочное исследование дало средний доход 250 тыс. руб. В предположении, что случайная величи- на дохода имеет распределение Парето с х0 = 50 (тыс. руб.), оценить параметр а методом моментов и долю жителей с до- ходами свыше 800 тыс. руб. 58. Известно, что некоторая работа занимает время, состоящее из обязательного периода ц и случайной задержки, распределен- ной показательно со средним значением 6. Хронометраж рабо- чего времени в 10 испытаниях показал среднее время 37 мин. при исправленной выборочной дисперсии 49 мин2. Оценить параметры ц и 0 методом моментов. Оценить срок, за который работа будет выполнена с вероятностью 99%. 59. Известно, что некоторая работа занимает время, состоящее из постоянного периода и случайной задержки, распределенной показательно. Хронометраж рабочего времени показал, что ра- бота занимает в среднем N мин. со средним квадратическим отклонением М мин. С помощью метода моментов оценить вероятность того, что работа будет закончена за час, а также время, за которое работа будет выполнена с вероятностью 95%. Решить задачу при: a) N = 45, М = 15; б) N = 40, М = 8. 60. Прибор состоит из двух блоков: основного и резервного. Если основной блок выходит из строя, включается резервный. Времена службы блоков показательно распределены со сред- ними значениями 0j и 02. Выборочные испытания для 10 при- боров показали средний срок службы 35 часов и среднее ква- дратическое отклонение 25 часов. Оценить средние времена службы основного и резервного блоков методом моментов в предположении, что 0j > 02. 61. В группе людей, имеющих доходы с логнормальным распреде- лением ехр{7У(я, ст2)}, проведено выборочное обследование. По выборке из 10 человек получен средний доход 5000 руб. при среднем квадратическом отклонении 300 руб. Найти оценки параметров аист2 методом моментов. Оценить долю людей с доходами от 4500 до 5500 руб. 62. Пассажир, приходящий в случайные моменты времени на авто- бусную остановку, в течение 5 поездок фиксировал свое время ожидания автобуса: 5,1; 3,7; 1,2; 9,2; 4,8 (мин.). Известно, что
288 ЧАСТЬ II. Математическая статистика автобус ходит с интервалами по 0 мин. Оценить 0 методом мо- ментов. 63. Ежедневный спрос на некоторый товар имеет распределение Симпсона на отрезке [а, Л]. За 25 рабочих дней спрос состав- лял в среднем 100 кг с исправленной выборочной дисперсией 54 кг2. Определить параметры а и b методом моментов. Оценить, сколько нужно товара, чтобы удовлетворить ежедневный спрос с вероятностью 92%. 64. Ежедневный спрос на некоторый товар имеет равномерное распределение на отрезке [а, Л]. За период наблюдения спрос составлял в среднем N кг с исправленной выборочной дис- персией М кг2. С помощью метода моментов оценить, сколько нужно товара, чтобы удовлетворить ежедневный спрос с ве- роятностью 90%. Решить задачу, если: a) N = 100, М = 192; б) N = 125, М = 432. 65. Известно, что доля возвратов по кредитам в банке имеет рас- пределение F(x) = 0 <х < 1. Наблюдения доли показали выборочное среднее w. Методом моментов оценить параметр р и вероятность того, что доля опустится ниже г. Решить задачу при: a) w = 0,9, г = 0,75; б) w = 0,8, г - 0,6. 66. Срок службы некоторого изделия имеет распределение Вейбулла с параметром а = 2. Наблюдения показали, что в среднем он составляет N часов. Найти вероятность того, что изделие про- служит не менее М часов. Решить задачу, если: a) N = 1000, М= 1500; б) # = 1500, М = 2000. 67. Случайные относительные изменения цены акции за день опи- сываются распределением Лапласа. Наблюдения показали, что выборочное среднее квадратическое отклонение составляет 1%. Оценить границы, в которых относительное изменение цены акции за день находится с вероятностью 90%. 68. Случайные относительные изменения цены акции за день описываются распределением Лапласа. Наблюдения показали, что выборочное среднее абсолютное значение составляет 2%. Оценить границы, в которых относительное изменение цены акции за день находится с вероятностью 95%. 69. В июне ежедневный спрос на мороженое в киоске составляет в среднем 700 порций с выборочным средним квадратическим отклонением 50 порций. Оценить количество порций, удов- летворяющих потребность на один день с вероятностью 95% (используя нормальное приближение).
Глава 13. Методы построения оценок 289 70. Рукопись проверяют два редактора, независимо друг от друга. Один нашел 70 ошибок, другой - 50, причем 25 найденных ошибок были одни и те же (т.е. они обнаружены обоими редакторами). Оценить число ошибок, которые они еще не нашли. 71. В поселке Полтинниково все жители имеют доход не менее 50 тыс. руб. в месяц. Выборочное обследование доходов 10 че- ловек дало следующие результаты: 54; 60; 59; 79; 71; 92; 53; 54; 78; 56 (тыс. руб.). В предположении, что случайная величина дохода имеет распределение Парето с х0 = 50 (тыс. руб), оце- нить параметр а и средний доход жителей методом максималь- ного правдоподобия. Оценить долю жителей с доходами свыше 100 тыс. руб. 72. Известно, что некоторая работа занимает время, состоящее из обязательного периода ц и случайной задержки, распределен- ной показательно со средним значением 6. Хронометраж ра- бочего времени в 10 случаях дал следующие результаты: 32; 30; 37; 35; 42; 39; 34; 32; 31; 35 (мин.). Оценить параметры m и q методом максимального правдоподобия. Оценить срок, за который работа будет выполнена с вероятностью 99%. 73. Известно, что некоторая работа занимает время, состоящее из постоянного периода и случайной задержки, распределенной показательно. Хронометраж рабочего времени показал, что ра- бота занимает как минимум N мин., а в среднем — М мин. С помощью метода максимального правдоподобия оценить вероятность того, что работа будет закончена за час, а также время, за которое работа будет выполнена с вероятностью 95%. Решить задачу, если: a) N = 32, М = 39; б) N = 36, М = 48. 74. В группе людей, имеющих доходы с логнормальным распреде- лением exp{7V(fl, ст2)}, проведено выборочное обследование. По выборке из 10 человек получены следующие результаты: 4722; 2907; 4974; 2763; 3659; 5493; 3161; 3175; 4521; 3698 (руб.). Найти оценки параметров аист2 методом максимального правдоподо- бия. Оценить долю людей с доходами от 4000 до 5000 руб. на основе оценок максимального правдоподобия. 75. Пассажир, приходящий в случайные моменты времени на авто- бусную остановку, в течение 5 поездок фиксировал свое время ожидания автобуса: 5,1; 3,7; 1,2; 9,2; 4,8 (мин). Известно, что автобус ходит с интервалами по 0 мин. Оценить параметр 0 методом максимального правдоподобия. Вычислить несмещен- ную оценку. 10- Теория вероятностей
290 ЧАСТЬ II. Математическая статистика 76. Ежедневный спрос на некоторый товар равномерно распреде- лен на отрезке [а, й]. За 6 рабочих дней спрос составлял: 104; 80; 96; 120; 113; 82 (кг). Оценить а и Ь, используя несмещен- ные оценки на основе оценок максимального правдоподобия. Оценить, сколько товара нужно для удовлетворения ежеднев- ного спроса с вероятностью 90%. 77. В таблице представлены данные о производстве электроэнер- гии в России за 1998—2003 гг. Год 1998 1999 2000 2001 2002 2003 Производство, млрд кВт-ч 827 846 878 891 891 915 Провести линейную регрессию производства по годам и сде- лать прогноз на 2004 г. 78. В таблице представлены данные о производстве всех зерновых культур и производстве пшеницы в России за 1998—2002 гг. Год 1998 1999 2000 2001 2002 Производство зерновых, млн т 47,9 54,7 65,5 85,2 86,6 Производство пшеницы, млн т 27,0 31,0 34,5 47,0 57,7 Провести линейную регрессию и сделать прогнозы на 2003 г. для: а) производства зерновых по годам; б) производства пше- ницы по годам. 79. В условиях предыдущей задачи провести линейную регрессию производства пшеницы по производству всех зерновых культур в виде: а) у = а + Ьх\ б) у = Ьх (а = 0). В обоих случаях оценить производство пшеницы, если произ- водство всех зерновых составит 90 млн т. 80. В таблице представлены данные о годовых доходах и расходах на личное потребление (долл.), для 10 семей. Годовой доход, долл. США Расходы на личное потребление, долл. США 2435 2311 2354 2278 2404 2240 2381 2181
Глава 13. Методы построения оценок 291 Окончание табл. Годовой доход, долл. США Расходы на личное потребление, долл. США 2581 2408 2529 2379 2562 2378 2624 2554 2407 2232 2448 2356 Провести линейную регрессию расходов по доходам в виде у = Ьх. Оценить параметр Ь. Определить величину расходов для семьи с годовым доходом 2600 долл.
Глава 14 ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ 14.1. Основные понятия Точечная оценка неизвестного параметра, найденная по вы- борке объема п, не указывает, какую ошибку допускают, при- нимая вместо точного значения параметра 0 его приближенное значение. Поэтому вводят интервальную оценку, которая опре- деляется двумя числами — концами интервала, внутри которого с определенной вероятностью находится неизвестное значение параметра 0, причем границы интервала не должны зависеть от искомого параметра. Доверительным интервалом, или интервальной оценкой, на- зывается интервал (0Р02), который покрывает неизвестный параметр 0 с заданной доверительной вероятностью 0 < у < 1 (ее называют также надежностью доверительного интервала). Часто доверительный интервал может быть представлен в виде (0-5, 0 + 5), тогда величина 5 (половина длины интервала) на- зывается точностью оценки (точностью доверительного интер- вала). При заданном значении у точность 5 зависит от объема выборки п. Понятно, что чем меньше длина доверительного интервала, тем точнее оценка. Однако сама интервальная оценка конструируется вокруг точечной оценки, вид которой определяется законом распреде- ления случайной величины, который зависит от неизвестного параметра, т.е. границы доверительного интервала зависят от значения неизвестного параметра и, следовательно, пользовать-
Глава 14. Доверительные интервалы 293 ся такими границами нельзя. Существуют два подхода к пре- одолению этой трудности. 1. Классический метод состоит в искусственном подборе ста- тистик Oj = 01(Х1,х2,...,хя), 02 = 02(х],х2,...,хя), не зависящих от неизвестного параметра и таких, что <02 при любых хр х^ ..., хл, 0, и р(01<0<е2) = у. 2. Другой метод основан на асимптотических свойствах оце- нок (как правило, на асимптотической нормальности). Поэтому такой метод дает приближенные результаты и пригоден только при достаточно больших объемах выборок. В обоих случаях бывает, что границы доверительных ин- тервалов, построенных формально из каких-то теоретических соображений, выходят за рамки возможного (например, стано- вятся отрицательными для положительных по смыслу величин). В таких случаях их «округляют» до разумных пределов. 14.2. Точные доверительные интервалы Точные доверительные интервалы строятся, как правило, в предположении нормальности данных. Следует понимать, что реальные данные, на основании которых мы строим эти интервалы, могут совсем не выглядеть нормальными (напри- мер, это целые положительные числа, в то время как нор- мальное распределение непрерывно и рассредоточено по всей действительной прямой). Тем не менее широкое практическое применение описываемых методов дает неплохие результаты (это объясняется, в частности, асимптотической нормально- стью оценок), и такое несоответствие не должно нас смущать в дальнейшем. Предположим, что наблюдается случайная величина £, е N(a, о2). Для параметров строятся следующие точные доверительные ин- тервалы. 1. Для неизвестного среднего а при известной дисперсии о2: _ о _ о х —-j=uy < а < х + —j=uy, у/п у/п где определяется из соотношения Фо(^) = у/2.
ЧАСТЬ II. Математическая статистика 2. Для неизвестного среднего а при неизвестной дисперсии о2: х—Sj=ty <a<x+-^=ty, у/п у]П где — критическая точка распределения Стьюдента (для дву- сторонней области) с п — 1 степенями свободы и уровнем зна- чимости а = 1 — у. 3. Для неизвестной дисперсии су2: (л-1)52 2 (и-1)$2 ~г~<а <7—’ , Л*, а , 2’Л-1 ’-Т"-1 где Ха — критические точки х2-распределения с п - 1 сте- пенями свободы и соответствующими уровнями значимости, а = 1 — у. Доказательство. 1. По теореме Фишера (см. 12.8) имеем х еЛ^(а,су2/л). Случайная величина т| = -—- тогда имеет стан- су дартное нормальное распределение N(fi, 1) и Р(| Т| | < и) = Р(-и < Т| < и) = Ф(и) - Ф(-и) = Фо (и) - Фо (-и) = 2Ф0 (и). Выбирая иу из соотношения Ф0(иу) = у/2, получаем, что Р(|т||<и ) = у. Таким образом, с вероятностью у верно откуда следует х-а СУ _ СУ _ СУ х—-=иу <а<х+-=иу. у/П у/П 2. По следствию 2 из теоремы Фишера (см. 12.8) статистика х — а г~ Т =-----у/п имеет распределение Стьюдента с п - 1 степеня- s ми свободы. Заметим, что критическая точка распределения Стьюдента (для двусторонней области) определяется таким об- разом, чтобы выполнялось Р(\ 7] > 1^) = а. Выбирая а = 1 — у, получаем Р(\7| < t ) — у. Таким образом, с вероятностью у вер- но < гу, откуда следует 5 х —-j=ty < а < х + —j=ty • у/п yjn
Глава 14. Доверительные интервалы 295 3. По теореме Фишера имеем ——Заметим, что СУ критические точки распределения %2р л_| определяются из усло- вия Р(%2 >Хд.л_1) = Р- Выбирая а = 1 - у, получаем Лх2 <х2<Ха )=Лх2>х\ )-Лх2>х2 ) = = = 1 — а = у. Таким образом, с вероятностью у верно х2 < < х2 , 1-—,л-1 гт2 —,л-1 откуда следует 2 u 2 (л-1)? 2 (Л-1)? —;----< о < —;-----. Можно также по выборке хр х2, хп построить довери- тельный интервал для следующего, (л + 1)-го наблюдения (т.е. определить границы, в которых оно будет лежать с заданной вероятностью у). А именно имеем <x+sty Понятно, что это может быть полезно в качестве прогноза на будущее. Доказательство. Заметим, что случайные величины хл+1 и х независимы, причем хл+)eN(a, ст2) и xeN{a,a1/n), следова- тельно, х . -xg7V| 0,| 1 + — ст2 |. Тогда величина —— имеет II п) ) аГТ стандартное нормальное распределение N(0, 1). у п Введем статистику Г* = (И-1)? (л- 1)ст2 п (Л-1)? Поскольку ----j— <7 ление Стьюдента с л — 1 степенями свободы. Рассуждая как е X2„-i, статистика Т имеет распреде-
296 ЧАСТЬ II. Математическая статистика ранее в доказательстве 2, получаем, что с вероятностью у верно откуда следует х - st. х +st. Задача 1. Найти минимальный объем выборки, при кото- ром с надежностью 0,925 точность оценки математического ожидания нормально распределенной случайной величины (по выборочному среднему х ) равна 8 = 0,2, если известно среднее квадратическое отклонение о= 1,5. Решение. Формула, определяющая точность оценки матема- тического ожидания по выборочному среднему, выглядит сле- и1^1 дующим образом: 8 = -~. Отсюда следует л = (при этом у!п 8 обычно п округляют в большую сторону для надежности). По таблице функции Лапласа находим для данного примера, учитывая, что функция принимает значение Ф0(нт) — 0,925/2 = = 0,4625. Таким образом, и = 1,78. Подставив данные зада- 1 782 -1 52 чи, получим искомый объем выборки: п = ---------—«178,22. 0,22 Принимаем округленно п = 179. Задача 2. Из генеральной совокупности извлечена выборка объема п = 12: Варианта х. “0,5 -0,4 “0,2 0 0,2 0,6 0,8 1 1,2 1,5 Частота п. 1 2 1 1 1 1 1 1 2 1 Оценить с надежностью 0,95 математическое ожидание а нормально распределенной случайной величины с помощью доверительного интервала. Решение. Найдем выборочное среднее х и исправленное вы- борочное среднее квадратическое тогда отклонение 5. Пусть и. = 10х. 1 10 -У И и = 4,2; 1 /1-1 10 £ п х= — = 0,42; 10 2 10 0,52. Находим для уровня значимости а = 0,05 и числа степеней свободы п — 1 = 11 по таблице распределения Стьюдента кри-
Глава 14. Доверительные интервалы 297 тическую точку / = 2,23 и определяем границы доверительного интервала: х —= 0,42- 2,23_2’72 = _о,О4; х+-^ = 0,42 + 2’23_£’72 = о,88. 4п V12 4п 712 Таким образом, искомый доверительный интервал: -0,04 < а < 0,88. Задача 3. Для отрасли, включающей 1200 фирм, составле- на случайная выборка из 19 фирм. По выборке оказалось, что исправленное среднее квадратическое отклонение для числа работающих на фирме составляет 5 = 25 (человек). Построить 90%-ный доверительный интервал для среднего квадратическо- го отклонения числа работающих на фирме по всей отрасли. Решение. Доверительный интервал для параметра ст имеет вид (л-1) где xi и х2 о находят по таблице критических точек рас- —, Л-1 1-—, л-1 2 2 пределения хи-квадрат. По таблице определяем для данного примера Хо,о5;18 =28,9; Xo,9s;i8 =9,39. Подставив в формулу необ- ходимые величины, получаем искомый доверительный интервал: 25^18/28,9 < ст < 25718/9,39, откуда 19,74 < ст < 34,61 (человек). Задача 4, За последние 5 лет годовой рост цены актива А составлял в среднем 20% со средним квадратическим отклоне- нием (исправленным) 5%. Построить доверительный интервал с вероятностью 95% для цены актива в конце года, если в на- чале года она равна 100 денежных единиц. Решение. Рассмотрим величины относительного прироста цены актива за год. Будем пользоваться нормальным прибли- жением1. Применяем формулу , 1 Х-5Г J! + -<x„+l V п 1 Такое приближение и соответствующие оценки являются довольно грубыми. На практике распределение относительного прироста цены обыч- но далеко от нормального и, к сожалению, не описывается ни одной из классических формул.
298 ЧАСТЬ II. Математическая статистика где / находим из таблицы критических точек распределения Стьюдента (для двусторонней области): Г = /кр(0,05; 4) = 2,78. Получаем 0,2-0,05-2,787^2 <х6 <0,2 + 0,05-2,787^2 , откуда 0,05 < х6 < 0,35. Таким образом, цена актива в следующем году составит от 105 до 135 денежных единиц. Помимо случаев построения доверительных интервалов для параметров одной выборки иногда рассматривают и случай двух выборок. Например, когда имеются две выборки хр х2, ..., хл и ур у2, ..., ут из распределений N(av и N(a2, <j22) соответ- ственно, и надо построить доверительный интервал для разности средних. 1. При известных дисперсиях - - а2 о? - - сг2 а2 х-у-J—Ч—<а, -а2 <х-у+J—Ч—-и V п т 1 V п т где и, определяется из соотношения Ф0(ну) = у/2. Доказательство основано на следствии 3 теоремы Фишера (см. § 12.8). 2. При неизвестных, но равных дисперсиях (и-1)^ +(m-l)r п + т + \----------;—- J------Гг> V л + тя - 2 V пт где — критическая точка распределения Стьюдента (для дву- сторонней области) с п Ч- т - 2 степенями свободы и уровнем значимости а = 1 - у. Доказательство основано на следствии 4 теоремы Фишера. 14.3. Асимптотические доверительные интервалы Асимптотическим доверительным интервалом при оцени- вании параметра 0 называется такой интервал (9р02), что Р(ё, < е < ё2) —> у (при п -> оо). Предположим, мы решили учитывать тот факт, что наши наблюдения имеют распределение, отличное от нормального. Пусть это распределение зависит только от одного параметра 0,
Глава 14. Доверительные интервалы 299 для которого надо построить доверительный интервал, а также известно, что оценка 0л асимптотически нормальна и верно 9—>2V(0, ог2(0)/л) при п —> оо. Приведем два метода построе- ния асимптотических доверительных интервалов. 1. Подстановка оценки параметра в формулу для дисперсии. Получаем: е-Я0Иу<е<9+^, у/П у/п где wy определяется из соотношения Ф0(«т) = у/2. 2. Использование функционального преобразования. Опре- делим функцию g(u) = Г—, тогда верно g(6)—^—>N(g(Q), 1/ri) при п -> ос. J <т(и) Следовательно, можно использовать асимптотическое не- равенство g(0)—^<g(9)<g(0) + -^. у/П \1П Решая его относительно 0, получаем асимптотический до- верительный интервал. Например, доверительный интервал для вероятности «успе- ха» р в п испытаниях Бернулли обычно строится первым мето- дом. Поскольку = р и = р(1 - р), то из ЦПТ получаем w— р(1-р)/л), и доверительный интервал имеет вид Iw(l-w) lw(l — w) V n \ n где w — относительная частота события. Асимптотические доверительные интервалы рекомендуется применять, когда объем выборки достаточно велик (порядка сотен и более). Доказательство (обоснование метода функционального пре- образования). Если оценка 9Л асимптотически нормальна и верно 0—>А(0, о2(0)/л), то для любой функции g, гладкой в окрестности 0, верно g(0)—>JV(g(0),(g'(0))2o2(0)//i). Чтобы дисперсия не зависела от 0, необходимо функцию g подобрать так, чтобы выражение o(0)g'(0) было постоянным, например, положив o(9)g/(9) = 1.
300 ЧАСТЬ II. Математическая статистика Задача свелась к выбору такой функции g, чтобы она яв- лялась решением дифференциального уравнения g'(O) = 1/а(6). Решение этого уравнения имеет вид g(0) = , при этом J о(0) произвольная постоянная в неопределенном интеграле вы- бирается из соображений простоты окончательного выра- жения и обычно полагается равной нулю. Тогда получается g(0)—при п ->оо. Задача свелась к построению доверительного интервала для математического ожидания нормально распределенной случай- ной величины при известной дисперсии с заданной надежно- стью у. Согласно ранее доказанному такой интервал имеет вид <?(6„) <^(О)<^(0Я) + -7=«Г у/П у/П Задача 5. Произведено 300 испытаний, в каждом из которых неизвестная вероятность р появления события А постоянна. Событие А появилось в 250 испытаниях. Найти доверительный интервал, покрывающий неизвестную вероятность р с надеж- ностью 0,95. Решение. Число испытаний п = 300 достаточно велико, по- этому можем воспользоваться следующими формулами для гра- ниц доверительного интервала: w(l-w) w(l-w) рх = w - А—--и ; p2=w + А------и, \ п N п Значение и находим из соотношения Ф0(ну) = у/2 = 0,475 по таблице функции Лапласа, в данном случае и = 1,96. Относительная частота события А составляет w = 250/ЗЙО » 0,83. Подставим это значение w в формулы для рх и р2: Pi = 0,83-1,96 Г’83'0,17 «0,79; р2 = 0,83 +1,96 /°’83 0,17 «о,87. 1 V 300 2 V 300 Итак, получаем искомый доверительный интервал: 0,79 < р < 0,87. Задача 6. Построить доверительный интервал для вероят- ности «успеха» в испытаниях Бернулли методом функциональ- ного преобразования.
Глава 14. Доверительные интервалы 301 Решение. Необходимо построить функцию g(u)= [—где J а(и) о(/>) = Для рассматриваемого случая имеем Л’> = J-* =|,=Л«, = 2,Л| = 2/-72£_ = 2/ " = = 2arcsinr = 2arcsinTp« С учетом вида функции g(p) асимптотическое неравенство примет вид 2arcsinVw—^<2arcsin>/p <2arcsinVw . yjn \ln Для функции у = g(x) = 2arcsin Vx при 0 < x < 1 обратной функцией будет х = = sin2(y/2), где 0 < у < л. Поэтому если выполняются неравенства то, применив обратное преобразование g ‘, получим довери- тельный интервал sin2(arcsinVw---j=-) < р <sin2(arcsin y[w -I—?=). 2y/n 2jn Замечание. Очевидно, первым способом получается гораздо более простой и удобный в применении доверительный интер- вал, хотя и менее точный. Задача 7. Построить асимптотический доверительный ин- тервал для параметра X показательного закона распределения (двумя способами). Решение. В данном случае удобно перейти к новому па- раметру 0 = 1/1. Эффективной оценкой для него является выборочное среднее 0 = х. Имеем Л/0 = 0, D$ = tf/n, откуда о(0) = 0.
302 ЧАСТЬ II. Математическая статистика Первым способом, подставляя оценку в формулу для дис- персии, получаем Возвращаясь к параметру X = 1/0, приходим к неравенству Вторым способом, определив функцию g(u)= I— = 1пи, J и получаем асимптотическое неравенство _ и _ и 1пх----, \1п \1п откуда следует —ехр —~ <Х<—ехр х Jn х Заметим, что по ходу решения задачи получены доверитель- ные интервалы для математического ожидания 0 показатель- ного распределения. Этот результат имеет и самостоятельную ценность. В дальнейших задачах асимптотические интервалы по умол- чанию строятся методом функционального преобразования (кроме задач на вероятности «успехов»). 14.4. Интервальная оценка коэффициента корреляции Пусть (х1? (х2, у2), ..., (хл, уп) — независимые наблюдения над двумерной нормальной случайной величиной. Построим асимптотический доверительный интервал для коэффициента корреляции р, соответствующий надежности у.
Глава 14. Доверительные интервалы 303 Точечной оценкой методом моментов для коэффициента корреляции является выборочный коэффициент корреляции Рл ~х^у> -у) -£(х,.-х)2 -£и-у)2 Известно, что оценка асимптотически нормальна со следу- ющими параметрами: Р„ — N р, (1-Р2)2 п п —> оо . Отсюда следует, что а(р) = 1 — р2 и g(p) = f = arth Р- J 1-р 2 1-р Получено так называемое z-преобразование Фишера для ко- эффициента корреляции. Это преобразование хорошо исследо- вано, и для него известны следующие соотношения: A/(arthP ) «arthp+ р , Z>(arthP„) = —. 2(л-1) л-3 Построим доверительный интервал для arthp. Заменив л на л — 3 и пренебрегая в математическом ожидании при достаточ- , Р но большом л величиной —-—, получаем 2(л —1) P(arthpn - < arth р < arthp„ + 2.— и ) = у. ул-З ул-З Функция thx = -—е— (гиперболический тангенс), обрат- е +е ная функции arth х, однозначна и монотонно возрастает, поэ- тому после преобразования доверительный интервал имеет вид th(arthpn — 1 wT)<p<th(arthpB + где и, определяется соотношением Ф0(«г) = у/2. Найденный приближенный доверительный интервал на- столько мало отличается от истинного, что может применяться уже для выборок объема л > 10.
304 ЧАСТЬ II. Математическая статистика Задачи для самостоятельного решения1 * * Теоретические задачи 1. 2. Построить асимптотический доверительный интервал для пара- метра X распределения Пуассона: Р(^ = к) =—е~х . к ’ Построить асимптотический доверительный интервал для па- раметра 0 случайной величины равномерно распределенной на отрезке [0, 0]. Точечную оценку параметра 0 найти методом моментов. 3. Построить асимптотический доверительный интервал для неиз- вестного параметра X при известном а, если случайная величина имеет гамма-распределение: £, е у(а, X). Указание: перейти к новому параметру 0 = а/Х. 4. Построить асимптотический доверительный интервал для неиз- вестного параметра а при известном X, если случайная величина имеет гамма-распределение: £, g у(а, X). 5. Построить асимптотический доверительный интервал для числа степеней свободы распределения хи-квадрат. 6. Построить асимптотический доверительный интервал для р с из- вестным числом испытаний т\ Рт(к) = Скрк(\-р)т~к (двумя спо- собами). 7. Построить асимптотический доверительный интервал для пара- метра 0 (математического ожидания) геометрического распреде- ления с р = 1/0 (методом подстановки). 8. Построить доверительный интервал для параметра а распреде- ления Парето вида при а > 2 (методом подстановки). Указание: перейти к новому параметру 0 = а/(а — 1). 9. Построить асимптотический доверительный интервал для пара- метра 0 нормального распределения 7V(0, 04), 0 > 0. 10. Построить асимптотический доверительный интервал для пара- метра 0 нормального распределения 7V(0, 06), 0 > 0. 1 В задачах выборочная дисперсия и выборочное среднее квадратиче- ское отклонение предполагаются исправленными по умолчанию, если не сказано обратное.
Глава 14. Доверительные интервалы 305 Вычислительные задачи 11. Импортер упаковывает чай в пакеты. Известно, что напол- няющая машина работает со средним квадратическим откло- нением, равным 1 г. Выборка 50 пакетов показала средний вес 125,18 г. Найти доверительный интервал для среднего веса пакета с вероятностью 95%. Найти объем выборки п, при ко- тором точность интервала составила бы 0,2 г. Генеральная со- вокупность распределена нормально. 12. Автомат упаковывает товар в пакеты со средним квадратиче- ским отклонением веса, равным А г. Выборка 100 пакетов по- казала средний вес В г. Найти доверительный интервал для среднего веса пакета с вероятностью 95%. Решить задачу, если: а) Л = 1,5, В= 100,2; б) Л = 1, В= 100,5; в) А = 0,8, В= 100,1. 13. Автомат упаковывает товар в пакеты со средним квадратиче- ским отклонением веса, равным А г. Выборка N пакетов по- казала средний вес В г. Найти доверительный интервал для среднего веса пакета с вероятностью 90%. Решить задачу, если: а) А = 1, N = 50, В = 100,2; б) А = 1,2, N = 40, В = 100,4; в) А = 0,8, А= 100, В = 99,95. 14. Станок-автомат штампует валики. По выборке объема п = 100 вычислено выборочное среднее диаметров изготовленных ва- ликов. Найти с надежностью 0,95 точность 5, с которой выбо- рочное среднее оценивает математическое ожидание диаметров изготовляемых валиков, зная, что их среднее квадратическое отклонение о = 2 мм. Предполагается, что диаметры валиков распределены нормально. 15. Фирма коммунального хозяйства желает на основе выборки оценить среднюю квартплату за квартиры определенного типа с надежностью 99% и точностью до 10 денежных единиц (д.е.). Предполагая, что квартплата имеет нормальное распределение со средним квадратическим отклонением 35 д.е., найдите не- обходимый объем выборки. 16. Для исследования средней заработной платы работающих жи- телей города сделана выборка из N человек, при этом оказа- лось, что средняя заработная плата в выборке равна А у.е., а выборочная дисперсия В. С надежностью 95% найти дове- рительный интервал для средней заработной платы жителей города. Определить, какой объем выборки нужен, чтобы до- стигнуть точности в 1 у.е. Решить задачу, если: a) N = 121, А = 300, В = 324; б) N = 256, А = 250, В = 289; в) N = 400, А = 280, В = 625.
306 ЧАСТЬ II. Математическая статистику 17. Для отрасли, включающей 1200 фирм, составлена случайная выборка из 19 фирм. По выборке оказалось, что в фирме в среднем работают 77,5 человека при выборочном среднем ква- дратическом отклонении 25 человек. Пользуясь 95%-ным до- верительным интервалом, оцените среднее число работающих в фирме по всей отрасли и общее число работающих в отрасли. Предполагается, что случайное число работников фирмы опи- сывается нормальным распределением. 18. Производитель автомобильных шин заинтересован в получе- нии оценки средней износоустойчивости шин особой модели. Он произвел случайную выборку объемом 10 шин и подверг их специальному испытанию. Средняя износоустойчивость по данным выборки оказалась равна 22 500 миль с неисправ- ленным средним квадратическим отклонением 3000 миль. Построить доверительный интервал с вероятностью 99% для средней износоустойчивости всего выпуска шин этого типа. Генеральная совокупность распределена нормально. 19. По данным испытаний на износ 25 автомобильных шин вы- борочная средняя износоустойчивость составила N тысяч ки- лометров с выборочным средним квадратическим отклонением М тысячи километров. Построить доверительный интервал для средней износоустойчивости с надежностью 99%. Решить за- дачу, если: a) У = 27, М = 4; б) N = 32, М = 5. 20. В деревне Простоквашино проведено выборочное исследова- ние доходов. По выборке из N человек получен выборочный средний доход А рублей с выборочным средним квадратиче- ским отклонением В руб. Построить доверительный интервал для среднего дохода с надежностью 95%. Решить задачу, если: a) N = 25, А = 4750, В = 150; б) N = 16, А = 4250, В = 125; в) N= 25, А = 4760, В = 230. 21. Бухгалтер компании решил предпринять выборочную проверку и выбрал 18 из 1200 компонент, продававшихся в прошлом месяце. Стоимости отобранных компонент: 82, 30, 98, 116, 80, 150, 200, 88, 70, 90, 160, 100, 86, 76, 90, 140, 76, 68 (д.е.). Найти оценку средней стоимости всех компонент и построить для нее доверительный интервал с надежностью 0,95. Оценить, какой объем выборки необходим для достижения точности 5 = 3 (д.е.). 22. Среднеее время сборки изделия было 90 мин. Инженер изобрел новый метод сборки изделия. При испытаниях времена сборки 10 изделий новым способом составили: 79, 74, 112, 95, 83, 96,
Глава 14. Доверительные интервалы 307 77, 84, 70, 90 (мин.). Построить доверительный интервал для нового среднего времени сборки с надежностью 95%. 23. При измерении веса 20 шоколадных батончиков получены вы- борочное среднее 50,01 г и выборочное среднее квадратическое отклонение 1,02 г. Найти доверительный интервал для средне- го веса с надежностью 95%. 24. Произведено 12 измерений одним прибором (без системати- ческой ошибки) некоторой физической величины, причем выборочное среднее квадратическое отклонение случайных ошибок измерения оказалось равным 0,6. Найти точность (среднее квадратическое отклонение) прибора с надежностью 0,95. Предполагается, что результаты измерений распределены нормально. 25. Выборочное среднее квадратическое отклонение ежесуточного дохода случайно выбранных 10 магазинов некоторой фирмы оказалось равно 100 д.е. Построить доверительный интервал для среднего квадратического отклонения с надежностью 90%. Предполагается, что доход — нормально распределенная вели- чина. 26. Выборочное среднее квадратическое отклонение ежесуточного дохода 30 киосков некоторой фирмы оказалось равно N д.е. Построить доверительный интервал для среднего квадратиче- ского отклонения с надежностью 90%. Решить задачу, если: a) N = 80; б) N = 75. 27. Проведены испытания новой машины, упаковывающей товар в пакеты. По выборке из 30 пакетов получено выбором!к среднее квадратическое отклонение веса А г. Построить до верительный интервал с надежностью В% для дисперсии • пакета при упаковке машиной. Решить задачу, если: а) А 2 В = 90; б) А = 1,5, В = 90; в) А = 0,7, В = 95; г) А - 0,4, В - 95 28. Проведены испытания новой машины, упаковывающей то вар в пакеты. По выборке из N пакетов получено выборочное среднее квадратическое отклонение веса А г. Построить до- верительный интервал с надежностью В% для среднего ква- дратического отклонения веса пакета при упаковке машиной. Решить задачу, если: a) N = 16, А = 3, В == 90; б) N = 20, А = 4, Я= 90; в) W= 25, А = 1,5, В = 95; г) N 20, А = 0,9, В= 90; д) W= 25, Л = 0,5, В= 95. 29. По выборке из 25 упаковок товара средний вес составил 101 г с выборочным средним квадратическим отклонением 3 г.
308 ЧАСТЬ II. Математическая статистика Построить доверительные интервалы для среднего и дисперсии с вероятностью 90%. 30. За последние 9 лет годовой рост цены актива А составлял в среднем 22% с выборочным средним квадратическим отклоне- нием 6%. Построить доверительный интервал с вероятностью 90% для средней цены актива в конце года, если в начале года она равна 200 денежным единицам. 31. За последние 7 лет годовой рост цены актива Б составлял в среднем 15% с выборочным средним квадратическим отклоне- нием 3%. Построить доверительный интервал с вероятностью 95% для средней цены актива в конце года, если в начале года она равна 120 денежным единицам. 32. Производство зерна в России в 1996—2002 гг. составляло в среднем 71,11 млн т в год с выборочным средним квадрати- ческим отклонением 16,26 млн т. Построить доверительные интервалы для среднего объема производства и для следую- щего наблюдения с надежностью 95%, используя нормальное приближение. 33. Производство пшеницы в России и 1995—2001 гг. составляло в среднем 35,54 млн т с выборочным средним квадратическим отклонением 7,45 млн т. Построить доверительные интервалы для среднего объема производства и для следующего наблюде- ния с надежностью 95%, используя нормальное приближение. 34. Урожайность зерновых культур в России в 1992—2001 гг. состав- ляла в среднем 15,85 ц/га с выборочным средним квадратиче- ским отклонением 2,17 ц/га. Построить доверительные интер- валы для средней урожайности и для следующего наблюдения с надежностью 95%, используя нормальное приближение. 35. По результатам наблюдений за 100 рабочих дней, ежедневные доходы магазина А составляли в среднем 150 д.е. с выбороч- ным средним квадратическим отклонением 26 д.е., а магази- на Б — в среднем 120 д.е. с выборочным средним квадра- тическим отклонением 32 д.е. Приняв оценки дисперсий за их точные значения, построить доверительный интервал для разности средних ежесуточных доходов магазинов А и Б с на- дежностью 95%. 36. По результатам наблюдений за 21 рабочий день, ежедневные доходы магазина А составляли в среднем 140 д.е. с выбороч- ным средним квадратическим отклонением 22 д.е., а магазина Б - в среднем 100 д.е. с выборочным средним квадратическим отклонением 24 д.е. В предположении, что неизвестные дис- i
[лава 14. Доверительные интервалы 309 Персии равны, построить доверительный интервал для разно- сти средних ежесуточных доходов магазинов А и Б с надеж- ностью 90%. 37. Изготовлен экспериментальный игровой автомат, который должен обеспечить появление выигрыша в одном случае из 100 бросаний монеты в автомат. Для проверки пригодности ав- томата произведено 400 испытаний, причем выигрыш появил- ся 5 раз. Построить доверительный интервал, покрывающий неизвестную вероятность появления выигрыша с надежностью у = 0,99. 38. При испытаниях 1000 элементов зарегистрировано 100 отказов. Найти доверительный интервал, покрывающий неизвестную вероятность р отказа элемента с надежностью 0,95. 39. В случайной выборке из 300 аспирантов, специализирующихся по управлению предприятиями, составленной по нескольким основным университетам, 180 человек оказались детьми биз- несменов. Построить доверительные интервалы с надежностью 90% для доли аспирантов, являющихся детьми бизнесменов, и числа таких аспирантов среди 2000 аспирантов. 40. Среди 100 электрических ламп в течение 1000 часов вышло из строя 36 штук. Построить доверительный интервал с на- дежностью 95% для вероятности того, что лампа прослужит не менее 1000 часов. 41. Среди N изделий в течение года вышли из строя М. Построить доверительный интервал с надежностью К% для вероятности того, что изделие прослужит не менее года. Решить задачу, если: a) N= 100, М = 25, К= 95; б) N = 200, М = 25, К= 90; в) N = 100, М = 20, К = 95; г) N = 250, М = 45, К = 90; д) W = 400, Л/ = 50, К = 95. 42. Фирма разослала 1000 новых рекламных каталогов и получи- ла N заказов. Построить доверительный интервал для эффек- тивности рекламы (вероятности отклика) с надежностью Л/%. Решить задачу, если: a) N = 120, Л/ = 95; б) N = 140, М = 90; в) W = 180, Л/ = 95; г) N = 130, М = 90. 43. По выборке из 400 зрителей рейтинг телепрограммы оценива- ется в 9%. Построить доверительный интервал для истинного рейтинга с надежностью 95%. 44. Проведена случайная выборка заемных счетов в банке. Из 1000 отобранных счетов 60 оказались с задолженностью по возврату ссуды сроком до трех месяцев. Найти доверительный интервал
ЗЮ ЧАСТЬ II. Математическая статистика --- ... .. ......................... ... "" с вероятностью 90% для доли счетов в банке, которые имеют задолженности до трех месяцев. 45. В ходе аудиторской проверки была проведена случайная вы- борка записей по счетам. В выборке из 500 записей 10 содер- жали некоторые ошибки в самой записи или процедуре. Найти доверительный интервал для доли ошибок во всей генеральной совокупности с надежностью 0,95. Оценить объем выборки, которую надо произвести аудитору, чтобы определить долю ошибок с точностью до 0,5% и надежностью 95%. 46. Согласно социологическому опросу среди 100 человек, 20 из них пользуются стиральным порошком фирмы А. Сколько еще людей надо опросить, чтобы с вероятностью 99% получить ре- зультат (долю людей, пользующихся этим стиральным порош- ком) с точностью до 1%? 47. По данным социологического опроса среди 100 человек 25 из них пользовались шампунем «Колобок». Оценить, сколько все- го человек надо опросить, чтобы определить долю пользую- щихся данным шампунем с точностью до 2% и надежностью 95%. 48. По данным социологического опроса среди 100 человек 16 из них пользовались моющим средством «Мойдодыр». Оценить, сколько всего человек надо опросить, чтобы определить долю пользующихся данным моющим средством с точностью до 1% с надежностью 90%. 49. В выборке из 100 изделий средний срок службы изделия соста- вил 1000 часов. Построить доверительный интервал для сред- него срока службы изделия с вероятностью 90%. Время службы изделия распределено по показательному закону. 50. В выборке из 400 изделий средний срок службы составил N ча- сов. Известно, что срок службы изделия имеет показательное распределение. Построить доверительный интервал для сред- него срока службы изделия с вероятностью 95%. Решить за- дачу, если: a) N = 1500; б) N = 2000; в) N = 2500. 51. За 100 рабочих дней в магазин обращалось в среднем 2V поку- пателей в день. Известно, что число покупателей в день имеет распределение Пуассона. Построить доверительный интервал для среднею числа покупателей с вероятностью Л/%. Решить задачу, если: a) W = 256, М = 99; б) W = 289, Л/ = 90. 52. Число семян сорняков в пробе зерна распределено по закону Пуассона. Выборка из 1000 проб зерна показала в среднем
Глава 14. Доверительные интервалы 311 0,9 семян в пробе. Построить доверительный интервал для среднего числа семян с надежностью 95%. 53. В поселке Соткино все жители имеют доход не менее 100 тыс. руб. в месяц. Выборочное обследование доходов 100 человек дало средний доход 150 тыс. руб. В предположении, что случайная величина дохода имеет распределение Парето вида Р, , ГО, х<х0; Г(х) = < [1-(х/х0)~ , х>х0, где х0 = 100 (тыс. руб.), построить доверительный интервал для параметра а с надежностью 90%. 54. Анализ выборки из 100 заказов в интернет-магазине показал, что в среднем делается по К покупок. Построить доверитель- ный интервал для математического ожидания 0 с надежностью 95% в предположении, что число покупок в заказе имеет гео- метрическое распределение. Решить задачу методом подста- новки, если: а) К = 1,8; б) К = 2,5. 55. По выборке из N наблюдений двумерной нормальной случайной величины получен выборочный коэффициент корреляции А. Построить доверительный интервал для коэффициента корре- ляции с надежностью 90%. Решить задачу, если: a) N = 50, А = 0,5; б) N = 100, А = 0,7.
Глава 15 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 15.1. Основные определения Статистической гипотезой называется любое предположение относительно генеральной совокупности. Гипотеза называется параметрической, если в ней содержится некоторое утверждение о параметрах распределения случайной величины (когда сам закон распределения считается известным) и непараметрической в иных случаях. В этой главе будем иметь дело с параметриче- скими гипотезами. Метод использования выборки для проверки истинности статистической гипотезы называется статистическим доказа- тельством истинности выдвинутой гипотезы. Наряду с выдвинугой гипотезой рассматривают альтерна- тивную гипотезу. Если выдвинутая гипотеза отвергается, то вместо нее принимается альтернативная. Поэтому гипотезы делятся на нулевые и альтернативные. Нулевой (основной) гипотезой Яо называется предположе- ние, которого мы придерживаемся изначально. При проверке параметрических гипотез в качестве основной гипотезы обычно предполагается равенство одного или нескольких параметров заданным значениям (или между собой). Альтернативной (конкурирующей) гипотезой Нх называется ги- потеза, которая противоречит основной гипотезе Яо и которую мы принимаем, если отвергаем основную гипотезу. При этом пред- полагается, что другие возможности (кроме Яо и Н{) исключены. Для проверки нулевой гипотезы используют специально подобранную случайную величину — выборочную статистику, точное или приближенное распределение которой известно. Случайная величина К, построенная по наблюдениям для проверки нулевой гипотезы, называется статистикой критерия.
Глава 15. Проверка статистических гипотез 313 Схема построения критерия такова: все выборочное про- странство делится на две взаимодополняющие области — об- ласть S отклонения основной гипотезы Яо и область 5 приня- тия этой гипотезы. Область S, при попадании в которую выбо- рочной точки х = (хр х2, ..., хп) основная гипотеза отклоняется, называется критической. При проверке гипотез могут быть ошибки двух типов. Ошибка первого рода состоит в том, что основная гипотеза отвергается, хотя на самом деле она верна. Ее вероятность обо- значают обычно а. Ошибка второго рода состоит в том, что основная гипотеза принимается, хотя на самом деле она неверна. Ее вероятность обозначают обычно р. Вероятность а совершить ошибку первого рода называют также уровнем значимости, или размером критерия. Вероятность 1 - р не совершить ошибку второго рода называют мощностью критерия. Критерий называется наиболее мощным, если из всех воз- можных критериев с заданным уровнем значимости а он об- ладает наибольшей мощностью. Пример. Пусть определена статистика критерия К и пусть функция плотности вероятностей выборочной статистики К при условии истинности нулевой гипотезы /70 равна р(Х|Я0), медиана К равна Ко. По заданному уровню значимости а опре- деляют квантили Ка/1 и из условия Р(К < KJ = f pW.)dK = а/2; Р{К > КХа/г) = f p(K\Hn)dK = а/2, К'Л где а полагают достаточно малым, чтобы попадание случайной величины К за пределы интервала (Ка/2', К} а/2) можно было счи- тать маловероятным событием. Область (Л^2; и является областью допустимых значений, т.е. областью принятия нуле- вой гипотезы. Промежутки (—оо; Л^2) и +°°) образуют критическую область критерия, при попадании в которую на- блюдаемого значения К нулевую гипотезу отвергают. Точки, от- деляющие критические области от области принятия гипотезы, называются критическими точками (рис. 15.1).
314 ЧАСТЬ II. Математическая статистика-
Глава 15. Проверка статистических гипотез 315 Критическая область называется двусторонней, если она располагается слева и справа от медианы KQ (см. рис. 15.1), правосторонней, если Р(К > К] а) = а, и левосторонней, если Р(К<К) = а (рис. 15.2). Итак, основной принцип проверки статистической гипоте- зы можно сформулировать так: если наблюдаемое значение ста- тистики критерия принадлежит критической области, нулевую гипотезу отвергают; если наблюдаемое значение принадлежит области допустимых значений, нулевую гипотезу принимают. Заметим также, что можно установить связь между зада- чами проверки гипотез и задачами построения доверительных интервалов (см. гл. J4). Например, пусть построен доверитель- ный интервал (01,02)для параметра 0 с надежностью у. Тем самым утверждается, что истинное значение параметра лежит в интервале с вероятностью у. а вне этого интервала — с малой вероятностью а = 1 - у. Таким образом, если мы проверяем гипотезу Яо: 0 = 0О против какой-либо альтернативной^ гипо- тезы, то в качестве критерия можно взять 5 = {х:0о £(01?02)}. Уровень значимости в этом случае будет равен а. Однако такой критерий не обязательно будет оптимальным. 15.2. Критерий отношения правдоподобия Основным методом построения наиболее мощных статисти- ческих критериев (по теореме Неймана—Пирсона) является ме- тод отношения правдоподобия, суть которого заключается в сле- дующем: пусть £ — непрерывная случайная величина, имеющая плотность распределения р(](х) при условии истинности нулевой гипотезы Яо и р,(х) при выполнении гипотезы Нг Функции правдоподобия в точке х соответственно равны A) W = A (*i) А (*2) • А (*„); A W = A (*i)А (х2) • • А ) • О правдоподобии выборки в отношении гипотез Яо и Нх будем судить по отношению правдоподобия /и/А)(£о* 0): чем правдоподобнее выборка в условиях истинности гипотезы ЯГ). тем меньше по сравнению с Lo, и тем меньше отношение LJL(V ► Теорема 1 (Неймана—Пирсона). Критическая область S наи- более мощного критерия имеет вид S= х:£о(х) = Ои 7ут>с> д,(х)^о Ц)(х)
316 ЧАСТЬ II. Математическая статистика где константа С = С(а) является решением уравнения1. р Р^_>С|Я =а. Подобный метод построения критической области, исполь- зующий отношение правдоподобия, дает нам критерий отноше- ния правдоподобия. В дискретном случае построение проводит- ся аналогично (только вместо плотностей берутся вероятности). Статистика критерия здесь имеет вид К = L/Ц. (при Ло= О полагаем К = +оо), тогда критическая область S = {К > Q, а область допустимых значений S = {К < С]. Задача 1. Пусть случайная величина 6, g N(a, о2), причем значение параметра а неизвестно, а дисперсия о2 известна. Тре- буется на уровне значимости а проверить нулевую гипотезу Яо: а = а0, если альтернативная гипотеза Н}: а = ах > л0. Построить критерий отношения правдоподобия. Вычислить объем выборки л, необходимый для достижения ошибки второго рода, равной р, при уровне значимости а. Решение. Если верна гипотеза Яо, т.е. £ е N(a^ о2), то функ- ция правдоподобия в точке х = (х,, х2, ..., хп) равна Е(х,-а0)2 /=1________ 2о2 Если же верна гипотеза Hv т.е. £, е N(at, ст2), то функция правдоподобия равна Л(х) = ЕЦ-а,)2 /=1______ 2<г Отношение правдоподобия имеет вид Л — = ехр А, (а, -о0)(2х-О|-а0)п 2а2 Поскольку а, > а(), то это отношение является монотонно возрастающей функцией от х , и поскольку А0(х) * 0, то неравен- 1 Бывает, что данное уравнение не имеет решения, и в таких случаях используются так называемые рандомизированные критерии, которые мы здесь рассматривать не будем.
Глава 15. Проверка статистических гипотез 317 ство LjL^C равносильно неравенству х>С, где Си С — не- которые константы. Поэтому критическая область имеет вид 5 = {х:х>С}, где Р(х>С|Я0) = а. При условии истинности нулевой гипотезы Но имеем - лл/ ст\ х е N(a0, —), поэтому п а=Р(х>С|Я0) = 1-Ф 1_ф 2 0 С — а. Отсюда Фо 1 — а. 2 Обозначим через иа решение уравнения Ф0(иа) = 1/2 - а, тог- да константа имеет вид С = aQ + иа-^=-. Заметим, что величина иа У1П является квантилью уровня 1 - а для стандартного нормального распределения и выступает здесь в качестве критической точки. Значение ее можно найти по таблице функции Лапласа. Итак, наиболее мощным критерием проверки гипотезы Яо: а = aQ при альтернативной а = ах > я0 оказывается следующий: если х <aQ+ua—=, то Яо принимается; у/п если x>aQ+ua—^, то Яо отклоняется (и принимается \1п По определению ошибка второго рода равна (а,-С Я , о -----=1-р. С-а, Получаем, что должно выполняться равенство C = fll-^~r=flo+Wa-7=-- V/7 V/7 Решая уравнение относительно л, получаем объем выборки, необходимый для получения ошибки второго рода р, при за- данном уровне значимости а: (wa+w₽)2 2 /7 =------Я О . Полученное значение обычно округляется до целого в боль- шую сторону, для уменьшения вероятностей ошибок.
318 ЧАСТЬ II. Математическая статистика --- та Мощность критерия в данном случае равняется 1 Q Ж ^1 С Г~ Ж ( ^0 / 1~Р = Ф —---->Jn =Ф —-----yln-Ua . О ( О’ Задача 2. Крупная торговая фирма желает открыть в но- вом районе города филиал. Известно, что фирма будет работать прибыльно, если средний месячный доход жителей района пре- вышает 400 долл. Также известно, что среднее квадратическое отктонение дохода о составляет 20 долл. Проводится выбороч- ное обследование населения по величине доходов, чтобы при- нять решение об открытии филиала. 1) Определите правило принятия решения, с помощью ко- торого, основываясь на выборке п = 100 (человек) и уровне значимости а = 0,05, можно установить, что филиал будет ра- ботать прибыльно. 2) Рассчитайте вероятность того, что при применении пра- вила принятия решения, полученного при ответе на вопрос п. 1, будет совершена ошибка второго рода, если в действитель- ности средний доход достигает 406 долл. 3) Считая альтернативное значение генерального среднего месячного дохода равным 410 долл., рассчитайте объем вы- борки, при котором ошибка первого рода не превысит 2,5%, а ошибка второго рода не превысит 5%. Решение. 1) Фирма не откроет филиал, если средний доход жителей не превысит 400 долл. Поэтому будем считать, что Яо: а = а() = 400, а Нх: а = ах > 400. Значение дисперсии о2 дохода известно. Находим иа по таблице функции Лапласа исходя из равенства Ф0(«а) = 1/2 - а. Поскольку а0= 400 и ма= 1,65, то Нх принимают и, следовательно, филиал открывают, если средний месячный доход 100 жителей 20 х >400 + --=1,65 = 403,3 . V100 2) Вероятность ошибки второго рода р можно легко найти, зная мощность критерия, которая равна 1 - р. Получаем 1 -р = Ф .---+00Vi00-l,65 = Ф(1,35) = | + Ф0(1,35)«0,91. Отсюда вероятность ошибки второго рода р ~ 0,09.
Глава 15. Проверка статистических гипотез 319 .— ====== * — - ==========^========- 3) Используем формулу для необходимого объема выборки. Для этого найдем квантили иа и с помощью таблицы функ- ции Лапласа и получим (1,96 + 1,65)2 2 „ п>----------—20 = 52,13, откуда п = 53. “100 Замечание. Приведенная формула может давать слишком малые значения п, так как основывается на строго нормальном распределении. На практике п должно быть достаточно велико, чтобы пользоваться асимптотической нормальностью оценок. 15.3. Проверка гипотез для одной выборки Рассмотрим простые методы проверки параметрических ги- потез в случае нормального распределения (которые являются формально точными), а также гипотезы о вероятности «успе- ха» в испытаниях Бернулли (на основе асимптотической нор- мальности). Как и ранее, нас не будет смущать тот факт, что реальные данные, по которым проверяются гипотезы, могут совсем не выглядеть нормальными (например, это целые по- ложительные числа, в то время как нормальное распределение непрерывно и рассредоточено по всей действительной прямой). Тем не менее широкое практическое применение описываемых методов дает неплохие результаты (это объясняется, в частно- сти, асимптотической нормальностью оценок). Следующие три типа гипотез проверяются для нормальных данных: £, е N(a, о2). 1. Гипотезы о неизвестном среднем а при известной диспер- сии о2. Основная гипотеза Яо: а = ад, альтернативная гипотеза Ht может быть трех видов: а) а * а0; б) а > а0; в) а < а0. Во всех трех случаях для проверки используется статистика критерия В случае а) критическая точка ыкр выбирается из условия Ф0(ы ) = (1 - а)/2. Если |£/| < мкр, гипотеза Но принимается, если *> икр — отвергается. Таким образом, в данном случае имеет место двусторонняя критическая область. В случаях б) и в) критическая точка мкр выбирается из ус- ловия Ф0(нкр) = 1/2 - а.
ЧАСТЬ II. Математическая статистику В случае б) если U < и , то гипотеза HQ принимается, если U > и — отвергается. В случае в) если U > -и то гипотеза HQ принимается, если U < — ик[) — отвергается. Здесь имеют место односторонние критические области (пра- восторонняя и левосторонняя соответственно). Замечание. Этим методом можно пользоваться и в случае неизвестной дисперсии при больших объемах выборки (поряд- ка сотен), когда оценку дисперсии можно принять за ее точное значение. 2. Гипотезы о неизвестном среднем а при неизвестной дис- персии о2. Основная гипотеза Яо: а = я0, альтернативная гипотеза Н может быть трех видов: а) а * aQ; б) а > aQ; в) а < а0. Во всех трех случаях для проверки используется статистика критерия Для проверки берутся критические точки / распределения Стьюдента с п — 1 степенями свободы и уровнем значимости а, причем в случае а) — для двусторонней критической области, в случаях б) и в) — для односторонней критической области. В случае а) если \Т\ < Гкр, то гипотеза HQ принимается, если |Т| > / — отвергается. В случае б) если Т < / то гипотеза HQ принимается, если Т > гкр — отвергается. В случае в) если Т > -t , то гипотеза HQ принимается, если Т < —/ — отвергается. 3. Гипотезы о неизвестной дисперсии о2. Обычно предполагается, что хотя дисперсия неизвестна, но дана ее несмещенная оценка s2. Основная гипотеза HQ: а2 = о02, альтернативная гипотеза Нх может быть трех видов: а) о2^о02; б) ст2 > сг()2; в) су2 < а()2. Во всех трех случаях для проверки ис- пользуется статистика критерия 2 =(Я-1)52 ао Для проверки берутся критические точки распределения хи- квадрат с п — 1 степенями свободы (и различными уровнями значимости).
Глава 15. Проверка статистических гипотез 321 В случае а) если xla^-i <Х2 <X^2:«-i> то гипотеза Но прини- мается, иначе она отвергается. Заметим, что границы области несимметричны относительно оценки s2. В случае б) если х2<х2:л_(, то гипотеза Но принимается, иначе отвергается. В случае в) если х2 >X2-a;»-i> то гипотеза Но принимается, иначе отвергается. Следующая гипотеза проверяется приближенно, на основе асимптотической нормальности оценки. 4. Гипотеза о неизвестной вероятности «успеха» в испытаниях Бернулли. Основная гипотеза HQ: р = р0, альтернативная гипотеза Нх может быть трех видов: а) р * р0; б) р > р0; в) р < р0. Во всех трех случаях для проверки используется статистика критерия Ц= 4п, где w — относительная частота «успехов» в VPo(l-Po) п наблюдениях. Далее критические точки и области для проверки выби- раются так же, как и при проверке гипотезы о неизвестном среднем при известной дисперсии. Замечание. Этим методом можно пользоваться только при больших объемах выборки (порядка нескольких десятков или сотен). Доказательство. 1) Если нулевая гипотеза справедлива, ста- .. х-ай г- тистика критерия U =-------чп имеет стандартное нормальное a распределение N(0, 1). В случае справедливости гипотезы а) эта статистика может стремиться как к +оо, так и к —оо, в зависимости от того, а > а0 или а < а0. Поэтому область принятия гипотезы Но следует огра- ничить с двух сторон, справа и слева. Логично это сделать сим- метричным образом, в силу симметрии нормального распределе- ния. Имеем Р(|(7| < и) = 2Ф0(и), поэтому, выбирая и из условия фо(^) = (1 _ а)/2, получаем P(\U\ < и^) = 1 - а и P(|t/| > и^) = = а, что обеспечивает уровень значимости а. В случае справедливости гипотезы б) а > aQ статистика U стремится к +оо, так что область принятия гипотезы Яо следу- 11- Теория вероятностей
322 ЧАСТЬ II. Математическая статистика ет ограничить справа. Имеем P(U < и) = Ф(м) = 1/2 + Ф0(м), поэтому, выбирая мкр из условия Ф0(мкр) = 1/2 — а, получаем P(U < икр) = 1 - а и Р(U > мкр) = а, что обеспечивает уровень значимости а. В случае справедливости гипотезы в) а < а0 статистика U стремится к —оо, так что область принятия гипотезы HQ следует ограничить слева. Имеем P(U > - и) = 1 - Ф(~и) = 1/2 + Ф0(и), поэтому, выбирая из условия Ф0(нкр) = 1/2 — а, получаем P(U > ~икр) = 1 - а и P(U < -и ) = а, что обеспечивает уровень значимости а. 2) Если нулевая гипотеза справедлива, статистика критерия __ X ~~ Ол I Т =-----у/п имеет распределение Стьюдента с п - 1 степеня- 5 ми свободы. Критическая область выбирается в зависимости от альтернативной гипотезы из тех же соображений, что и в случае 1. 3) Если нулевая гипотеза справедлива, статистика критерия 2 (n-l)s2 . X =-—2—имеет распределение хи-квадрат с п — 1 степенями сто свободы. Далее рассуждаем аналогично. 4) Если нулевая гипотеза справедлива, из центральной предельной теоремы (см. гл. 8) следует, что относительная ча- стота успехов w асимптотически нормальна, с математическим ожиданием р0 и дисперсией р0(1 — рй}/п, так что статистика U _ ™—go—сходится по распределению к стандартной yJPo^-Po) нормальной величине при п -> <ю. Значит, при достаточно боль- ших п можно считать, что она имеет стандартное нормальное распределение. Далее рассуждаем, как в случае 1. Описанные критерии проверки гипотез можно представить в виде табл. 15.1. Задача 3. Из нормальной генеральной совокупности с из- вестным средним квадратическим отклонением ст = 5 извлечена выборка объема п = 100 и по ней найдено выборочное среднее 26,5. Требуется на уровне значимости 0,05 проверить гипотезу Яо: а = а0 = 25 против альтернативной гипотезы а * 25. Изменится ли результат, если заменим альтернативную гипо- тезу на Н}'. а > 25?
Глава 15. Проверка статистических гипотез 323 Решение. Найдем значение статистики критерия: и = 2.6’.5~?.5Vioo=3. 5 При проверке гипотезы Нх. а * 25 из соотношения Ф0(«кр) = = 0,95/2 = 0,475 находим икр = 1,96 и | U\ > икр, так что основ- ная гипотеза отвергается. При проверке гипотезы Нх: а > 25 из соотношения Ф0(«кр) = 0,45 находим икр = 1,65 и U > нкр, так что основная гипотеза отвергается. В обоих случаях результат одинаков. Таблица 15.1 Предпо- ложения Статистика критерия Область принятия Яо a =aQ о2 известно [/ = Х-О2_^ О' а> а0 а< а0 а^а0 и < Ф^ = 1/2 - а и> ~и^ фо<“«р) = 1/2-а |U|< V Ф0(и1ф)=(1-а)/2 ст2 не- известно х -ап г Т = °->/п S а>а0 а<а0 а^а0 Т < /кр(а, п - 1) для односторонней области Т > ~1кр(а, п - 1) для односторонней области И < ГкР(а’ л “ О Для двусторонней области о2=а02 а не- известно II S Q 1 0 bj Н-* м <^>сто2 °2< сто2 X Ха; л-1 X Х1-а; л-1 Х1-а/2;л-1 <Х <Ха/2;л-1 Р = Ро п порядка несколь- ких десятков или сотен и= у]Ра0- Ро) где w = т/п Р > Ро Р< Ро Р *Ро <W = 1/2 - а и> ~и^ фо(м«р) = 1/2 - а IM < ФЮ = (1 - а)/2
324 ЧАСТЬ II. Математическая статистика Задача 4. По выборке объема п = 16, извлеченной из нор- мальной генеральной совокупности, найдены выборочное сред- нее, равное 12,4, и исправленное среднее квадратическое от- клонение, равное 1,2. Требуется при уровне значимости 0,05 проверить нулевую гипотезу HQ: а = 11,8 при конкурирующей гипотезе Нх: а * 11,8. Решение, Найдем наблюдаемое значение статистики критерия: г (х-о0)^ (12,4-11,8)4 2 5 1,2 Поскольку конкурирующая гипотеза имеет вид а * а0, ис- комая критическая область двусторонняя. По таблице крити- ческих точек распределения Стьюдента найдем по уровню зна- чимости а = 0,05 и числу степеней свободы п - 1 = 15 крити- ческую точку /кр= /кр (0,05; 15) = 2,13. В силу того что |Т| < / , нет оснований отвергнуть нулевую гипотезу. Задача 5. Точность работы станка-автомата проверяется по дисперсии размеров изделий, которая не должна превышать = 0,01 (мм2). По выборке из 25 изделий получена исправ- ленная выборочная дисперсия s2 = 0,02 (мм2). На уровне зна- чимости 0,05 проверить, обеспечивает ли станок необходимую точность. Решение. Найдем значение статистики критерия: 2 = 24^02 = 48 0,01 Альтернативной гипотезой в данном случае является Н(. ст2 > ст02. По таблице находим критическую точку распределения хи- квадрат: Хо.О5;24 = 36,4. Поскольку 48 > 36,4, то основная гипотеза отвергается. Сле- довательно, станок не обеспечивает необходимой точности. Задача 6. Из нормальной генеральной совокупности извле- чена выборка объема п = 31. В следующей таблице представле- ны сгруппированные данные. Вариант х. 10,1 10,3 10,6 11,2 Н,5 11,8 12,0 Частота 1 3 7 10 6 3 1
Глава 15. Проверка статистических гипотез 325 .-——============================================================================ - Требуется на уровне значимости 0,05 проверить нулевую гипотезу Яо: а2 = 0,18, приняв в качестве конкурирующей ги- потезы Нх: ст2 > 0,18. Решение. Перейдем к условным вариантам м. = Юх, —110. и1 -9 -7 -4 2 5 8 10 п. 1 3 7 10 6 3 1 Получаем: 1 30 262 31 26,67; s>2U0,27; z>=fcJ«=^ = 45. х 100 о2 0,18 По таблице критических точек распределения хи-квадрат по уровню значимости а = 0,05 и числу степеней свободы к = = л - 1 = 30 находим х2кр(0,05; 30) = 43,8. Поскольку 45 > 43,8, основная гипотеза Нй отвергается. Задача 7. Партия изделий принимается, если доля брака составляет не более 2%. Среди случайно отобранных 500 из- делий оказалось 13 бракованных. Следует ли принять партию (на уровне значимости 0,05)? Решение. Относительная частота брака составляет w = 13/500 = = 0,026. Найдем значение статистики критерия и = ^26 - 0,02^ 70,02 0,98 0,96. Альтернативной гипотезой в данном случае является Нх: р > Ро- Из соотношения Ф0(«кр) = 0,45 находим икр= 1,65 и полу- чаем U < икр, так что основная гипотеза принимается. Таким образом, партию изделий можно принять. Задача 8. Торговец утверждает, что он получает заказы в среднем, по крайней мере, от 30% предполагаемых клиентов. Можно ли при 5%-ном уровне значимости считать это утверж- дение неверным, если торговец получил заказы от 20 из 100 случайно отобранных потенциальных клиентов?
326 ЧАСТЬ II. Математическая статистика Решение. В данном случае нулевая гипотеза будет выглядеть как Яо: р — рй — 0,3, а конкурирующая — как Н{: р < 0,3. Найдем значение статистики критерия, учитывая, что от- носительная частота для данной задачи равна w = 20/100 = 0,2: и = (м>-р0)7й = (0,2-0,3) 10 ~ _2 18 у1р^-р0) Vo,30,7 Из соотношения Фп(и ) = 0,45 находим и = 1,65, и U < -и , так что нулевая гипотеза отвергается и с утверждением торговца согласиться нельзя. Задача 9. По выборке объема п, извлеченной из нормальной генеральной совокупности с известным средним квадратиче- ским отклонением о, найдено выборочное среднее. При уровне значимости а требуется найти функцию мощности критерия проверки нулевой гипотезы Яо: а = а0 при конкурирующей ги- потезе Н(. а = а}* ай. Решение. Поскольку конкурирующая гипотеза имеет вид а * а0, критическая область двусторонняя. Она определяется неравен- ством: |С/| > и^, где мкр находится из соотношения Ф0(«кр) = = 1/2 - а. Найдем мощность рассматриваемого критерия, что по опре- делению есть вероятность попадания статистики критерия в критическую область при допущении, что справедлива конку- рирующая гипотеза: 1-р = Р (х-д0)7й ст а— Д|- Преобразуем выражение, стоящее под знаком модуля: (х-ай)4п = (х-а,)Уи (д,-д0)Уй =ь + х О СТ СТ (x-a{)Jn . (а{-ай)4п где Ь =-----5---, X = —!--------. ст ст Используя данные соотношения, найдем мощность кри- Р 1 - Р = Р(\Ь + Х| > мкр) = P(b + X > дкр) + P(b + X <-икр) = = Р(Ь > «кр - X) + Р(Ь < - «к - X) = [1 - P(b < ик - X)] +
Глава 15. Проверка статистических гипотез 327 7 X) = [1/2 - Ф0(Мкр - X)] + [1/2 + Ф0(-мкр - X)] = = 1 - Ф»(«кр - *) - «Шр + *)• Поскольку каждому значению ах будет соответствовать свое значение мощности критерия (в силу того, что X есть функция от tfj), то мощность критерия также является функцией от аг Обозначив мощность критерия через тс, получим я(о,) = 1 - [фо(икр - X) + фо(ыкр + X)]. 15.4. Проверка гипотез для двух выборок. Зависимые выборки: парные наблюдения Под случаем «зависимых выборок» обычно имеют в виду ситуацию, когда речь идет об одном и том же наборе объектов до и после какого-либо воздействия на них. Предполагается, что воздействие может повлиять на признаки, сдвинув их сред- ние значения в большую или меньшую сторону, и это необхо- димо проверить. Вначале признаки объектов принимают значения х., после воздействия — значения у.. Такие наблюдения называются пар- ными. Вычислим их разности: d. = у. — х, Тогда ставится следу- ющая задача: по наблюдениям dv d2, ..., dn проверить гипотезу о равенстве нулю генерального среднего (Яо: ad = 0) при неиз- вестной дисперсии а2. Предполагается, что случайные измене- ния признаков распределены нормально. Тогда гипотезу можно проверить, как это описано в предыдущем параграфе. Задача 10. Физическая подготовка 9 спортсменов была про- верена при поступлении в спортивную школу, а затем после недели тренировок. Итоги проверки в баллах приведены в та- блице (в первой строке указано число баллов, полученных каж- дым спортсменом при поступлении в школу; во второй стро- ке — после обучения). х. 76 71 57 49 70 69 26 65 59 у. 81 85 52 52 70 63 33 83 62 Требуется на уровне значимости 0,05 проверить, существен- но ли улучшилась физическая подготовка спортсменов (ис- пользуя нормальное приближение).
328 ЧАСТЬ II. Математическая статистика Решение. Вычислим разности dt = yt — xr 5 14 -5 3 0 -6 7 18 3 Получаем = 5+14- 5 + 3- 6 + 7+18 + 3 = 39; Ь2= 25 + 196 + 25 + 9 + 36 + 49 + 324 + 9 = 673. i=i Отсюда находим выборочное среднее и исправленное сред- нее квадратическое отклонение: 7 39 л ть а = — > а, = — и 4,33 9tT ' 9 673-169 8 «7,94. Проверяем гипотезу Но: аа= 0 против Я,: ad> 0. Найдем значение статистики критерия: „ dyfo 4,33-3 .._ Т —-----—------«1,47. 7,94 По таблице критических точек распределения Стьюдента для односторонней области по уровню значимости 0,05 и числу степеней свободы к = п - 1 = 8 определяем /кр(0,05; 8) = 1,86. Поскольку Т < Г , нет оснований отвергнуть нулевую гипотезу. Таким образом, нельзя утверждать, что подготовка спорт- сменов существенно улучшилась. 15.5. Проверка гипотез для двух выборок. Независимые выборки Пусть имеются две независимые выборки: хр х2, ..., хп и у2, уп, имеющие нормальное распределение с параметра- ми (ах, стх2) и (ау, а?2) соответственно. Обычно ставится задача проверки их однородности, т.е. равенства обоих параметров, либо надо проверить равенство параметров по отдельности.
Глава 15. Проверка статистических гипотез 329 1. Гипотеза о равенстве дисперсий двух выборок. Предположим, что известны исправленные выборочные дисперсии для обеих выборбк — s2 и s2. Проверяем гипотезу Яо: ах2 = о2. Альтернативная гипотеза Нх может быть трех видов: а) стх2 * о?2; б) ох2 > ау2; в) стх2 < ст?2, однако случай в) сводится к б) перестановкой х и у и не будет рассматриваться отдельно. В случае а) делят большую выборочную дисперсию на мень- шую: s2 р _ max s2 ' Jmin Обозначим через лтт объем выборки с меньшей выбороч- ной дисперсией и через лтах — с большей. По таблице для распределения Фишера находим критическую точку с уровнем значимости а/2 и числами степеней свободы п^- 1 и nmin- 1. Если F < Я , то основная гипотеза принимается, иначе отвер- гается. В случае б) делят первую выборочную дисперсию на вто- рую: F = -y. s> По таблице распределения Фишера находим критическую точку с уровнем значимости а и числами степеней свободы п — 1 и т — 1. Если F< Fxp, то основная гипотеза принимается, иначе отвергается. 2. Гипотеза о равенстве средних при известных дисперсиях. Проверяем гипотезу Яо: ах = ау. Альтернативная гипотеза Н{ может быть трех видов: а) ах * ау; б) ах > ау; в) ах < ау, однако случай в) сводится к б) перестановкой х и у и не будет рас- сматриваться отдельно. Во всех случаях вычисляют статистику критерия V п т В случае а) критическая точка икр выбирается из условия фо(\р) = (1~а)/2- Если \ U\ < икр, гипотеза Яо принимается, если |t/| > икр — отвергается.
330 ЧАСТЬ II. Математическая статистика В случае б) критическая точка выбирается из условия Ф0(И1ф) = 1/2 — а. Если U < и^, то гипотеза Но принимается, если U > — отвергается. Замечание. Гипотеза о средних обычно проверяется таким образом и в случае неизвестных дисперсий для больших выбо- рок (объемом порядка сотен), когда оценки дисперсий можно принять за их точные значения. 3. Гипотеза о равенстве средних при неизвестных равных дисперсиях. Проверяем гипотезу Но: ах = ау. Альтернативная гипотеза Нх может быть трех видов: а) ах * ау, б) ах > ау, в) ах < ау, однако случай в) сводится к б) перестановкой х и у и не будет рас- сматриваться отдельно. Во всех случаях вычисляют статистику критерия: -Г- х-у Ул т 2 (л-1)^+(т-1)^ где s=---------------- п + т-2 Величина s2 является объединенной оценкой дисперсии (об- щей для выборок). Эту же формулу можно представить в виде Т________х-у________ /пт(п + т^2) /n-l)s2x +(m — V)s2 N » + т Для проверки берут критические точки tKp распределения Стьюдента с п + т — 2 степенями свободы и уровнем значимо- сти а, причем в случае а) — для двусторонней критической об- ласти, в случае б) — для односторонней критической области. В случае а) если |7] < /кр, то гипотеза Яо принимается, если |Т| > г — отвергается. В случае б) если Т < t , то гипотеза Яо принимается, если Т > tKp — отвергается. Замечание. Поскольку для проверки гипотезы требуется ра- венство дисперсий у двух выборок, сначала необходимо про- верить гипотезу о равенстве дисперсий. В противном случае данный метод применять нельзя.
Глава 15. Проверка статистических гипотез 331 4. Гипотеза о равенстве вероятностей «успеха» в двух сериях испытаний Бернулли. Гипотеза проверяется на основе асимптотической нормаль- ности относительных частот, так что данный метод может применяться только при больших объемах выборок (порядка нескольких десятков или сотен). Пусть в одной серии из пх испытаний получили тх «успехов», в другой серии из п2 испы- таний получили т2 «успехов». Проверяем гипотезу Яо: р{ = рг Альтернативная гипотеза может быть трех видов: а) рх * р2, б) Рх > Р2’ в) Р\< Р1> °Днако случай в) сводится к б) перестанов- кой индексов и не будет рассматриваться отдельно. Во всех случаях вычисляют статистику критерия и= *1-^2 — + — w(l - w) Л1+И2 В случае а) критическая точка нкр выбирается из условия Ф0(нкр) = (1 ~ а)/2. Если \U\ < икр, гипотеза Яо принимается, если \U\ > икр — отвергается. В случае б) критическая точка нкр выбирается из условия Ф0(\р) = 1/2 - а. Если U < икр, то гипотеза HQ принимается, если U > ик — отвергается. Доказательство. 1) Если основная гипотеза справедлива, то 52 по следствию 5 теоремы Фишера (см. 12.8) статистика F = Sy имеет распределение Фишера с числами степеней свободы п — 1 и т - 1. Если справедлива гипотеза б), то F стремится к +оо, так что область принятия нулевой гипотезы следует ограничить спра- ва. Критические точки распределения Фишера определяются из условия: P(F > Fp) = а. Выбирая соответственно критическую область, получаем уровень значимости а. Если справедлива гипотеза а), то F может стремиться как к -f-оо, так и к 0, так что область принятия нулевой гипотезы следует ограничить и справа, и слева. Но условие < С эк- *min
332 ЧАСТЬ II. Математическая статистика 1 s2 Бивалентно — < -у < С при С > 1. С учетом того, что для рас- пределения Фишера верно F(n,m) =-----------, получаем, что Л-а(^ Л) при выборе критической точки F , соответствующей уровню значимости а/2, будет выполняться P-^>F Jmin достигается нужный нам уровень значимости а. 2) Если основная гипотеза справедлива, то по следствию 3 х — у теоремы Фишера статистика U = —===== имеет стандартное = а , так что V п т нормальное распределение. Далее рассуждаем так же, как при проверке гипотезы для одной выборки (см. § 15.3). 3) Если основная гипотеза справедлива, то по следствию 4 тео- х-у ремы Фишера статистика Т= - - .у yl(n-l)s2x + (m-l)s2y N п + т имеет распределение Стьюдента с п + т — 2 степенями свобо- ды. Далее рассуждаем так же, как при проверке гипотезы для одной выборки. 4) Если основная гипотеза справедлива, то из центральной предельной теоремы следует, что относительные частоты и w2 асимптотически нормальны с одинаковым средним р = рх = р2 и дисперсиями р(1 - p)/ni и р(1 - р)/пг Кроме того, они неза- висимы. Следовательно, их разность w, - и>2 асимптотически нор- мальна с нулевым средним и дисперсией р(1 — /0(1/^ + 1/л2). Однако р неизвестно. Наилучшей оценкой (несмещенной, со- стоятельной, эффективной в классе линейных несмещенных оценок) для р является w = —-----Заменяя р на w, получаем, И1+Л2 что распределение статистики t/ = *.-*2 W(1 - w) «1 Ъ) сходится к стандартному нормальному распределению при п оо. Далее рассуждаем так же, как при проверке гипотезы для одной выборки.
Глава 15. Проверка статистических гипотез 333 Описанные критерии проверки гипотез можно представить в виде табл. 15.2. Таблица 15.2 ". Предпо- ложения Статистика критерия ". Область принятия Яо II и Q < и °,2 известны ‘Г IX II “х> ау а.< ау ах^ ау U< Фо(«кр) = 1/2 - а U > “V фо<“кр) = 1/2 - а IM < %, Фо(%) = О " «)/2 ст2 и ст/ не- известны, но равны Т Х~У Т = —7= , где /1 1 S, - + — N и т (n-l)s, +(m-l)s2 п + т- 2 °х> а, ау а^ау Т < /^(а, п + т — 2) для односторонней области Т > — /^(а, п + т —2) для односторонней области |7] < /^(а, п + т - 2) для двусторонней области 0^ II ахи ау не- известны Г 2 . 2 F = -у, где Sx > s S, ах2 > °х2*а/ F< Fp(a, п — 1, т - 1) F< Г,(а/2, п- 1, т- 1) II л, и п2 порядка несколь- ких десятков или сотен TJ- W1~W2 Г J 1 1 Iw(l-w) —1 v 1л ъ) пи + пи1 где w =—! - «1+«2 Р,> Рг Р1<Рг Р^Р2 и < «хр, Фо(%) = 1/2 - а "> "V «W = 1/2 - а М < “кр- фо<“кр) = О " “)/2 Задача 11. По выборке объема п = 30 найден средний вес изделий, равный 130 г, изготовленных на первом станке; по выборке объема т = 40 найден средней вес изделий, равный 125 г, изготовленных на втором станке. Генеральные дисперсии известны: стх2 = 60 г2, а2 = 80 г2. Требуется на уровне значи- мости 0,05 проверить нулевую гипотезу Но: ах = ау при конку- рирующей гипотезе Ht: as* ау. Предполагается, что случайные величины распределены нормально и выборки независимы.
334 ЧАСТЬ II. Математическая статистика Решение. Найдем значение статистики критерия: _ х-у _ 130-125 N п + т '3® 40 По таблице функции Лапласа найдем критическую точку из равенства Ф(икр) = (1~а)/2 = 0,475, получаем икр= 1,96. Так как \U\ > икр, гипотеза HQ отвергается. Таким образом, нельзя утверждать, что средние значения веса изделий двух станков совпадают. Задача 12. По двум независимым выборкам, объемы кото- рых п = 9 и т = 16, извлеченным из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии $2 =34,02 и s^=12,15. На уровне значимости 0,01 проверить нулевую гипотезу Яо: ох2 = а2 против конкурирующей гипотезы Я:о2>о2. 1 X у Решение. Рассчитаем значение статистики критерия: ?_Ч02 Числа степеней свободы кх = п - 1 = 8, к2 = т — 1 = 15. По таблице критических точек распределения Фишера—Снедекора по заданному уровню значимости а = 0,01 и числам степеней свободы находим Гр(0,01; 8; 15) = 4. Поскольку F < Гр, нуле- вая гипотеза принимается. Задача 13. Реклама утверждает, что из двух типов пласти- ковых карт «Русский Экспресс» и «Супер-Понт» богатые люди предпочитают первый. С целью проверки этого утверждения были обследованы среднемесячные платежи п = 16 обладателей «Русского Экспресса» и т = 11 обладателей «Супер-Понта». Выяснилось, что платежи по картам «Русский Экспресс» со- ставляют в среднем 563 долл, с исправленным средним квадра- тическим отклонением 178 долл., а по картам «Супер-Понт» — в среднем 485 долл, с исправленным средним квадратическим отклонением 196 долл. Предварительный анализ законов распределения месячных расходов как среди обладателей «Русского Экспресса», так и
(лава 15. Проверка статистических гипотез 335 среди обладателей «Супер-Понта» показал, что они достаточно хорошо описываются нормальным приближением. Проверить утверждение рекламы на уровне значимости 10%. Решение. В данном случае речь идет о проверке гипотезы о средних при неизвестных дисперсиях (объемы выборок малы). Поэтому прежде всего необходимо проверить гипотезу о равен- стве дисперсий, а лишь затем двигаться дальше. Имеем f ^L_ 1962 38416 . 4n 1782 31684 ~ ’ По таблице критических точек распределения Фишера— Снедекора по уровню значимости а/2 = 0,05 и числам сте- пеней свободы кх = птт - 1 = 10 и к2 = nmin — 1 = 15 найдем критическую точку F = 2,55. Так как 1,21 < 2,55, принимаем гипотезу о равенстве дисперсий двух выборок. Теперь можем воспользоваться критерием Стьюдента для проверки гипотезы о равенстве средних. Имеем ?=Ю.38416 + 15.31684 25 Вычисление статистики критерия дает: 563-485 185,4^/1/11 + 1/16 1,074. Из таблиц критических точек распределения Стьюдента (для односторонней области) по уровню значимости а = 0,1 и числу степеней свободы 25 находим Гкр = 1,32. Поскольку Т < z , принимается основная гипотеза (о равен- стве средних). Таким образом, утверждение рекламы не под- тверждается имеющимися данными. Задача 14. В партии из 500 деталей, изготовленных первым станком-автоматом, оказалось 60 нестандартных; из 600 дета- лей второго станка — 42 нестандартных. На уровне значимости а = 0,01 проверить нулевую гипотезу Яо: pt = р2 о равенстве вероятностей изготовления нестандартной детали обоими стан- ками против конкурирующей гипотезы Н^. р{ р2. Решение. Имеем w, = 60/500 = 0,12; w2 = 42/600 = 0,07; и- = (60 + 42)/(500 + 600) « 0,09.
336 ЧАСТЬ II. Математическая статистика Найдем значение статистики критерия и = 0,12-0,07 '0,09-0,91 — + -5- рОО 600 «2,85. Найдем критическую точку из соотношения: Ф0(нкр) = 0,495, откуда и = 2,57. Поскольку |С/| > мкр, нулевая гипотеза отверга- ется. Значит, вероятности изготовления нестандартных деталей на двух станках различны. 15.6. Проверка гипотез о равенстве дисперсий для нескольких выборок. Критерии Бартлетта и Кокрена Пусть генеральные совокупности Xv Х2, ..., Хи распреде- лены нормально. Из этих совокупностей извлечены независи- мые выборки объемов лр л2, ..., л^. По выборкам найдены ис- правленные выборочные дисперсии s1 2,s2,...,Sm. Требуется на уровне значимости а проверить нулевую гипотезу о равенстве дисперсий для всех выборок, т.е. Яо: ст2 =о2 = ... =а^ (против гипотезы, что какие-то из дисперсий не равны). Опишем критерий Бартлетта, позволяющий проверить та- кую гипотезу. Введем обозначения: пусть к1 = л(. — 1 — число степеней свободы 5(2; и к = ^2^ — сумма чисел степеней свободы; <=1 1 м s2 = —У^/гд2 — среднее арифметическое исправленных дис- /=1 персий, взвешенное по степеням свободы; м 1 И = Л1п52-У'А:/1п52; С = 1 +----- м 3(М-1) к Статистикой критерия Бартлетта является величина В= V/C. При условии, что нулевая гипотеза верна, эта статистика рас- пределена примерно как хи-квадрат с М — 1 степенями свободы. Для применения критерия необходимо, чтобы все л, > 4. Если В < Ха;м-i’ то принимается, иначе отвергается.
Глава 15. Проверка статистических гипотез 337 Иногда нет необходимости вычислять величину С. А имен- но, если оказывается, что V < %2а.м_х, то этого достаточно для выполнения В < поскольку С > 1. В случае, когда размеры выборок одинаковы, предпочти- тельнее использовать критерий Кокрена. Статистикой критерия Кокрена является отношение максимальной исправленной вы- борочной дисперсии к их сумме: q________ max____ 5,2+52 + ... + 4 ’ В предположении, что нулевая гипотеза верна, распределе- ние этой статистики зависит только от числа степеней свободы к = п — 1 и числа выборок М. По таблице критических точек распределения Кокрена на- ходят критическую точку (7кр = GKp(a; к\ М). Если G < G^, то Яо принимается, иначе отвергается. Если гипотеза о равенстве дисперсий у всех выборок при- нимается, то в качестве оценки этой общей дисперсии можно использовать величину s2. Задача 15. По четырем независимым выборкам, объемы ко- торых л1 = 17, п2 = 20, л3 = 15, л4 = 16, извлеченным из нормаль- ных генеральных совокупностей, найдены исправленные вы- борочные дисперсии, соответственно равные 2,5; 3,6; 4,1; 5,8. Требуется: 1) на уровне значимости 0,05 проверить гипотезу о равенстве дисперсий; 2) оценить генеральную дисперсию. Решение. 1) Вычислим вначале числитель V критерия Бартлетта: 4 4 К = Л1П52-^М2, где k = 'Y\kj =16 + 19 + 14 + 15 = 64. /=1 /=1 Имеем s2=-Yk^ =-(16-2,5 + 19-3,6 + 14-4,1 + 15-5,8) = 3,95. к~{ " 64 Следовательно, V = 64 • 1пЗ,95 — (16 • 1п2,5 + 19 • 1пЗ,6 + + 14 • 1п4,1 + 15 • 1п5,8)) » 2,79. По таблице критических точек распределения хи-квадрат для уровня значимости 0,05 и числа степеней свободы М — 1 = 3 находим критическую точку х2^ = 7,8. Так как V < х2 , то В = = V/C < х2^, и принимаем нулевую гипотезу о равенстве средних. 12- Теория вероятностей
338 ЧАСТЬ II. Математическая статистика --- Ex3===s=s====9sn=s9=^nznss==e=s========ns==~=~к====—====к=!=~==~!г=-я-к==^=к=яяммтмк 2) При условии равенства дисперсий в качестве оценки ге- неральной дисперсии принимаем среднее арифметическое ис- правленных дисперсий, взвешенное по числам степеней свобо- ды: s2 = 3,95. Задача 16. По четырем независимым выборкам одинакового объема п = 17 найдены исправленные выборочные дисперсии: 0,21; 0,25; 0,34; 0,40. Требуется: 1) на уровне значимости 0,05 проверить гипотезу о равенстве дисперсий; 2) оценить гене- ральную дисперсию. Решение. I) Находим значение статистики критерия Кокрена: 0,21 + 0,25 + 0,34 + 0,4 По таблице критических точек распределения Кокрена по уровню значимости 0,05, числу степеней свободы 16 и числу вы- борок 4 находим 6кр = (7кр(0,05; 16; 4) = 0,437. Поскольку G< G^, нулевая гипотеза принимается. 2) При условии равенства дисперсий в качестве оценки ге- неральной дисперсии принимают среднее арифметическое ис- правленных дисперсий: 2 0,21 + 0,25 + 0,34 + 0,4 s - —------2----2-----— = 0,3 . 4 Задачи для самостоятельного решения1 Теоретические задачи 1. Пусть случайная величина £, е N(a, о2) , причем значение па- раметра а известно, а дисперсия о2 неизвестна. Требуется на уровне значимости а проверить нулевую гипотезу Но: о = а0, если альтернативная гипотеза Нх. с = о1 > ст0. Построить крите- рий отношения правдоподобия. 2. Пусть имеется последовательность независимых испытаний Бер- нулли с неизвестной вероятностью «успеха» р. Требуется на уровне значимости а проверить нулевую гипотезу Яо: р = р0, если альтернативная гипотеза Я,: р = pt> р0. Построить крите- 1 В задачах выборочная дисперсия и выборочное среднее квадратиче- ское отклонение предполагаются исправленными по умолчанию.
Глава 15. Проверка статистических гипотез 339 рий отношения правдоподобия, используя нормальное прибли- жение для числа успехов. Вычислить объем выборки п, необ- ходимый для достижения заданных ошибок первого и второго рода аир. 3. Пусть случайная величина имеет распределение Пуассона с параметром X. Требуется на уровне значимости а проверить нулевую гипотезу Но: X = Хо, если альтернативная гипотеза Нх. X = Xj > Хо. Построить критерий отношения правдоподобия, используя нормальное приближение. Вычислить объем выбор- ки п, необходимый для достижения заданных ошибок первого и второго рода аир. 4. Пусть случайная величина имеет показательное распределение с параметром X. Требуется на уровне значимости а проверить нулевую гипотезу Яо: X = Хо, если альтернативная гипотеза Н}: Х= X, > Хо. Построить критерий отношения правдоподобия. 5. Проверяется нулевая гипотеза о том, что случайная величина равномерно распределена на отрезке [-1, 1] против гипотезы, что она имеет нормальное распределение N(0, о2). Построить критерий отношения правдоподобия в общем виде и в частном случае при п = 2, а < п/4. Вычислительные задачи 6. По выборке объема п = 9, извлеченной из нормальной гене- ральной совокупности с известным средним квадратическим от- клонением а = 4, на уровне значимости а = 0,05 проверяется нулевая гипотеза Яо: а = а0= 15. Требуется: а) найти мощность критерия для проверки гипотезы Н}: а = ах = 17; б) найти объем выборки Пу при котором мощность критерия равна 0,8. 7. По выборке объема п = 25, извлеченной из нормальной ге- неральной совокупности с известным средним квадратическим отклонением а = 10, найдено выборочное среднее, равное 18. При уровне значимости 0,05 требуется: а) найти критическую область для проверки нулевой гипотезы Яо: а = а0 = 16 при конкурирующей гипотезе Нх: а = а} > 16 и провести проверку; б) найти мощность критерия при а} = 20. 8. Крупная торговая фирма желает открыть в новом районе города филиал. Известно, что фирма будет работать прибыльно, если средний месячный доход жителей района превышает 300 долл. Также известно, что среднее квадратическое отклонение дохо- да а составляет 50 долл. Проводится выборочное обследование
340 ЧАСТЬ II. Математическая статистика населения по величине доходов, чтобы принять решение об от- крытии филиала. а) Определите правило принятия решения, с помощью которого, основываясь на выборке п = 100 (человек) и уровне значимости а = 0,05, можно установить, что филиал будет работать прибыль- но. б) Рассчитайте вероятность того, что при применении правила принятия решения, полученного при ответе на вопрос п. а), будет совершена ошибка второго рода, если в действительности средний доход достигает 310 долл. в) Считая альтернативное значение генерального среднего ме- сячного дохода равным 320 долл., рассчитайте объем выборки, при котором ошибка первого рода не превысит 2,5%, а ошибка второго рода не превысит 5%. 9. Путем выборочного опроса проверяется гипотеза о том, что сти- ральным порошком фирмы А пользуется 30% населения, против гипотезы, что им пользуется только 20%. Оценить объем вы- борки, необходимый для проверки гипотезы с ошибкой первого рода не более 5% и второго рода — не более 2,5%. 10. Выборочные испытания 10 изделий показали, что их средний срок службы составляет 950 час. В предположении, что срок службы изделия распределен показательно, проверить гипотезу о том, что генеральное среднее составляет 1000 ч (против ги- потезы, что оно меньше) на уровне значимости 5%. 11. Рафинированный сахар упаковывается в пакеты с номиналь- ным весом 1,0 кг со средним квадратическим отклонением, равным 0,01 кг. Случайная выборка п = 16 пакетов готовой продукции выявила средний вес 1,01 кг. При уровне значи- мости 5% проверить нулевую гипотезу о том, что средний вес пакета соответствует номиналу. 12. Штамповочный пресс делает отверстия в металлических шайбах с нормативным размером 4,00 мм и средним квадратическим отклонением ст = 0,20 мм. Случайная выборка п = 25 шайб по- казала, что средний размер 3,88 мм. При уровне значимости 1% проверить нулевую гипотезу о том, что средняя величина отверстия соответствует нормативу. 13. Автомат производит детали с известным средним квадратиче- ским отклонением размера А мм. Выборка из 100 деталей по- казала выборочный средний размер В мм. Можно ли утверждать на уровне значимости 10%, что средний размер детали соот- ветствует номиналу в С мм (против гипотезы, что не соответ-
Глава 15. Проверка статистических гипотез 341 ствует)? Решить задачу, если: а) А = 0,05; В = 7,02; С = 7; б) А = 0,08; В = 5,01; С = 5; в) А = 0,09; В = 5,02; С = 5. 14. В прошлом году средняя заработная плата жителей города Булкино составляла N руб. В этом году выборка из 400 чело- век показала, что средняя заработная плата составляет А руб. при выборочном среднем квадратическом отклонении В руб. Можно ли на уровне значимости 5% утверждать, что заработ- ная плата жителей города увеличилась? Решить задачу, если: a) = 7300, А = 7320, В = 150; б) W= 7770, А = 7779, В = 120; в) N = 7500; А = 7530, В = 120; г) N = 9500, А = 9514, В = 180. 15. В прошлом году средняя заработная плата жителей города Сушкино составляла N руб. В этом году выборка из 250 чело- век показала, что средняя заработная плата составляет А руб. при выборочном среднем квадратическом отклонении В руб. Можно ли на уровне значимости 5% утверждать, что заработ- ная плата жителей города увеличилась? Решить задачу, если: a) N= 8500, А = 8520, В = 150; б) # = 7500, А = 7550, В = 500; в) N= 9500, А = 9515, В = 350. 16. По выборке из 25 упаковок товара средний вес составил 101 г с выборочным средним квадратическим отклонением 3 г. На уровне значимости 5% проверить гипотезу о том, что средний вес упаковки товара составляет 100 г. 17. При измерении веса 20 шоколадных батончиков (с номиналь- ным весом 50 г) получены следующие значения (г): 40,1; 50,0; 49,7; 50,5; 48,1; 50,3; 49,7; 51,6; 49,8; 50,1; 49,7; 48,8; 51,4; 49,1; 49,6; 50,9; 48,5; 52,0; 50,7; 50,6. Согласуются ли полученные данные с номиналом (на уровне значимости 10%)? 18. Средний доход фирмы в день составлял А единиц. После ре- организации выборочный средний доход в день за N рабочих дней составил В единиц с выборочным средним квадратиче- ским отклонением С единиц. Можно ли утверждать (на уров- не значимости 5%), что реорганизация привела к увеличению среднего дохода? Решить задачу, если: а) А = 1020, N = 30, В = 1070, С = 90; б) А = 500, N = 25, В = 530, С = 30; в) А = 1500, N = 25, В = 1506, С = 20; г) А = 300, N = 16, В = 320, С = 15; д) А = 250, N = 16, В = 254, С = 12. 19. Средний дневной объем продаж в магазине составлял 500 еди- ниц. После реорганизации, за период в 25 рабочих дней, вы- борочный средний дневной объем продаж составил 520 единиц с выборочным средним квадратическим отклонением 40 еди-
342 ЧАСТЬ II. Математическая статистика ниц. Можно ли утверждать (на уровне значимости 10%), что реорганизация привела к увеличению среднего объема продаж? 20. Среднее время сборки изделия было 90 мин. Инженер изо- брел новый метод сборки этого изделия. В результате времена сборки 10 изделий новым способом составили: 79, 74, 112, 95, 83, 96, 77, 84, 70, 90 мин. Можно ли утверждать, что среднее время сборки сократилось (на уровне значимости 5%)? 21. Среднее время сборки изделия было N мин. При испытаниях нового метода сборки по выборке из М изделий получено вы- борочное среднее время сборки А мин. с выборочным средним квадратическим отклонением В мин. Можно ли утверждать на уровне значимости 5%, что среднее время сборки сократи- лось? Решить задачу, если: a) N = 60, М = 25, А = 51. В ~ 6; б) N = 50, М = 25, А = 48, В = 7; в) N = 60, М = 16, А = 57, В = 9; г) N = 80, М = 16, А = 76, В = 5. 22. Фирма утверждает, что средний срок службы ее изделия состав- ляет N часов. По выборке из 25 изделий получен выборочный средний срок службы А часов с выборочным средним квадра- тическим отклонением В часов. Подтверждается ли заявление фирмы на уровне значимости 5% (против гипотезы, что сред- ний срок службы на самом деле меньше)? Решить задачу, если: a) N = 200, А = 192, В = 11; б) N = 300, А = 290, В = 15; в) N = 250, А = 235, В = 16; г) N = 350, А = 347, В = 13. 23. В селе Сидорово проведено выборочное обследование доходов жителей. По выборке из 16 человек получено среднее 2620 руб. и среднее квадратическое отклонение 150 руб. Можно ли утверждать на уровне значимости 10%, что средний доход жи- телей составляет более 2500 руб.? 24. В селе Петрово проведено выборочное обследование доходов жителей. По выборке из 25 человек получено среднее 2380 руб. и среднее квадратическое отклонение 90 руб. Можно ли ут- верждать на уровне значимости 5%, что средний доход жителей составляет менее 2500 руб.? 25. В книжном магазине проведено исследование продаж детек- тивов писателя Горшкова «Хромой против Косого». В течение 16 рабочих дней роман продавался ежедневно в среднем по 57 экземпляров с выборочным средним квадратическим от- клонением 12 экземпляров. Можно ли утверждать на уровне значимости 10%, что этот роман расходится лучше, чем пре- дыдущий роман автора, «Хромой против Слепого», если тот расходился в среднем по 50 экземпляров в день?
Глава 15. Проверка статистических гипотез 343 г —лдяяе -- 26. В книжном магазине проведено исследование продаж фанта- стического романа писателя Бурьяненко «Танцы в пустоте». В течение 25 рабочих дней роман продавался ежедневно в среднем по 64 экземпляра с выборочным средним квадратиче- ским отклонением 10 экземпляров. Можно ли утверждать на уровне значимости 5%, что этот роман расходится хуже, чем предыдущий роман автора, «Звездная жуть», если тот расхо- дился в среднем по 70 экземпляров в день? 27. В книжном магазине проведено исследование продаж нового романа писательницы Пунцовой. В течение 30 рабочих дней роман продавался ежедневно в среднем по 48 экземпляров с выборочным средним квадратическим отклонением 15 экзем- пляров. Можно ли утверждать на уровне значимости 5%, что этот роман расходится лучше, чем предыдущий роман автора, если тот расходился в среднем по 40 экземпляров в день? 28. Из нормальной генеральной совокупности извлечена выбор- ка объема п = 17 и по ней найдена выборочная дисперсия ст2 = 0,24. Требуется на уровне значимости 0,05 проверить ну- левую гипотезу Яо: ст2 = о02 = 0,18, приняв в качестве конкури- рующей гипотезы ст2 > 0,18. 29. В результате длительного хронометража времени сборки узла различными сборщиками установлено, что дисперсия этого времени о02 = 2 мин2. Результаты 20 наблюдений за работой новичка приведены в таблице Ц — время сборки одного узла в минутах, середины интервалов; ni — частота). X, 56 58 60 62 64 п, 1 4 10 3 2 Можно ли на уровне значимости 0,05 считать, что дисперсия затрачиваемого им времени существенно не отличается от дис- персии времени остальных сборщиков? 30. Инвестор считает вложения в активы с дисперсией доходности более 0,04 слишком рискованными. За последние 10 лет выбо- рочная дисперсия доходности актива А составила 0,06. Следует ли делать вложения в актив Л, принимая решение на уровне значимости 5%? 31. Партия изделий принимается, если дисперсия размеров не превышает 0,2. Выборочная дисперсия для 30 изделий оказа- лась равна 0,3. Можно ли принять партию на уровне значи- мости 5%?
344 ЧАСТЬ II. Математическая статистика 32. Старая наполняющая машина работала со средним квадрати- ческим отклонением веса упаковки А (г). Были проведены ис- пытания новой машины. По выборке из N упаковок товара по- лучено выборочное среднее квадратическое отклонение В (г). Можно ли утверждать на уровне значимости 5%, что для новой машины среднее квадратическое отклонение меньше? Решить задачу, если: а) А = 1,5, W = 30, В = 0,8; б) А = 0,7, N = 25, В = 0,6; в) А = 1,1, N= 25, В = 0,4; г) А = 1, N = 30, В = 0,8. 33. По 100 независимым испытаниям найдена относительная ча- стота w = 0,15. На уровне значимости 0,05 проверить нулевую гипотезу Яо: р = 0,17 при конкурирующей гипотезе р *0,17. 34. Независимому статистику поручено проверить информацию маркетинговой службы некоторого туристического бюро о том, что 70% клиентов выбирают в качестве формы обслуживания полупансион. Статистик провел опрос 150 случайно выбран- ных туристов, из них полупансион предпочли 84 человека. К какому выводу пришел статистик при проверке гипотезы HQ: р = 0,7 при альтернативе Нх: р ф 0,7 на уровне значимости критерия а = 0,05? 35. Статистику необходимо проверить экспертную оценку о том, что 75% отечественных предприятий уклоняется (частично) от уплаты налогов. По результатам неофициального опроса руко- водителей предприятий 140 из 200 случайно отобранных ди- ректоров подтвердили, что используют различные схемы для ухода от уплаты налогов. Можно ли при уровне значимости 0,05 согласиться с приведенной экспертной оценкой? 36. Партия изделий принимается, если вероятность того, что изде- лие окажется бракованным, не превышает 0,03. Среди случай- но отобранных 400 изделий оказалось 18 бракованных. Можно ли принять партию на уровне значимости 0,05? 37. Фирма разослала новых рекламных каталогов и получила М заказов. Можно ли утверждать (на уровне значимости 5%), что эффективность рекламы повысилась, если ранее она составля- ла в среднем Л%? Решить задачу, если: a) N = 1000, М = 120, А = 10; б) # = 500, М= 75, А = 13; в) N= 500, М = 70, А = 12. 38. В таблице приведены данные по годовым поступлениям в ре- гиональные бюджеты доходов от налогообложения субъектов малого предпринимательства (юридических лиц) до и после введения в рассматриваемых регионах единого налога на вме- ненный доход (млн руб.):
Глава 15. Проверка статистических гипотез 345 Год «до» 32 25 42 35 50 40 38 19 15 Год «после» 35 35 25 19 40 40 75 45 18 Требуется установить на уровне значимости 0,05, существенно ли изменились объемы поступлений в региональные бюджеты в сторону увеличения (используя нормальное приближение). 39. В таблице представлены месячные объемы продаж в магазинах фирмы до и после проведения ее рекламной компании (у.е.): Магазин 1 2 3 4 5 6 7 До рекламы 10 15 12 13 14 11 15 После рекламы 17 20 13 11 16 10 18 Можно ли утверждать на уровне значимости 0J0, что реклам- ная кампания привела к существенному увеличению объемов продаж? 40. В таблице представлены данные о производительности труда группы сотрудников фирмы до и после обучения на курсах повышения квалификации: Сотрудник 1 2 3 4 5 6 7 До обучения 20 18 15 16 20 14 17 После обучения 26 27 20 23 19 22 28 Можно ли утверждать на уровне значимости 5%, что обуче- ние привело к существенному увеличению производительности труда ? 41. За последние .Улет выборочная дисперсия доходности актива А составила I/, актива Б - V Есть ли основания утверждать (на уровне значимости 5%), что вложения в Б более рискованны, чем в Л? Решить задачу, если: a) N = 5, U = 0,04, V = 0,05; б) У= 7, U= 0,05, V= 0,08; в) N = 10, U= 0,03, V= 0,12; г) N= 10, U= 0,08, V= 0,14. 42. По двум независимым выборкам с объемами пх и пу, извле- ченным из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии пх2 и оу2. При уровне значимости а проверить нулевую гипотезу ах2 = сН против кон- курирующей гипотезы Н}: стх2 > а2, если: а) пх = 10; пу = 16; ах2 = 3,6; csy = 2,4; а= 0,05; б) пх= 13; пу= 18; ох2 = 0,72; о,2 = 0,20; а= 0,01.
346 ЧАСТЬ II. Математическая статистика 43. Для сравнения точности двух станков-автоматов взяты две про- бы (выборки), объемы которых п = 10 и т = 8. В результате измерения контролируемого размера отобранных изделий по- лучены следующие результаты. Х! 1,08 1,10 1,12 1,14 1,15 1,25 1,36 1,38 1,40 1,42 У, 1,11 1,12 1,18 1,22 1,33 1,35 1,36 1,38 Можно ли считать, что станки обладают одинаковой точно- стью, если принять уровень значимости а = 0,1 и в качестве конкурирующей гипотезы взять Нх. ох2 оу2? 44. По выборке объема п = 50 найден средний размер диаметра ва- ликов, изготовленных автоматом № 1, равный 20,1 мм; по вы- борке объема т = 50 найден средний размер диаметра валиков, изготовленных автоматом № 2, равный 19,8 мм. Генеральные дисперсии известны: ох2 = 1,750 мм2, оу2= 1,375 мм2. Требуется на уровне значимости 0,05 проверить нулевую гипотезу Яо: ах = ау при конкурирующей гипотезе Нх. ах * ау. Предполагается, что случайные величины распределены нор- мально и выборки независимы. 45. По двум независимым выборкам с объемами п = 10 и т = 10, извлеченным из нормальных генеральных совокупностей, най- дены выборочные средние, равные 14,3 и 12,2 соответственно. Генеральные дисперсии известны: ох2= 22, оу2= 18. На уровне значимости 0,05 проверить нулевую гипотезу Но: ах = а при конкурирующей гипотезе Н,: ах > ау. 46. По двум независимым выборкам с объемами п = 50 и т = 50, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние, равные 142 и 150 соответствен- но. Генеральные дисперсии известны: ох2= 28,2, оу2= 22,8. На уровне значимости 0,01 проверить нулевую гипотезу Яо: ах = ау при конкурирующей гипотезе Нх. ах < ау. 47. Компания по производству сахарного песка имеет две произ- водственные линии для наполнения пакетов сахарным песком по 1 кг. Среднее квадратическое отклонение веса пакетов, поставляемых с первой линии, а, = 0,02 кг, а со второй ли- нии — о2= 0,04 кг. С первой линии была взята случайная вы- борка объема пх = 10 пакетов и найден средний вес х, = 1,018 кг. Подобная выборка п2 = 12 пакетов была взята со второй линии и найден средний вес х2 =0,989 кг. Есть ли основание считать, что средний вес пакетов первой и второй линий раз- личаются? Проверить гипотезу при уровне значимости 0,01.
Глава 15. Проверка статистических гипотез 347 48. В течение 100 рабочих дней магазин А посещало в среднем 198 покупателей в день, магазин Б — 202. Есть ли основания утверждать на уровне значимости 5% , что магазин Б более популярен, чем Л, если числа покупателей в день имеют дис- персии, равные 256? 49. В течение К дней в фирму А обращалось в среднем N клиен- тов в день, в фирму Б — М. Есть ли основания утверждать (на уровне значимости 5%), что фирма Б Ъълж популярна, чем фирма Л, если числа клиентов в день имеют известные дис- персии U и V соответственно? Решить задачу, если: а) К = 64, N = 87, М = 93, U= 124, И= 132; б) К= 64, N= 90, М= 93, U= 125, 199; в) К= 25, # = 49, М= 58, (/= 119, И= 137; г) К = 100, N - 109, М - 112, U - 150, V = 250. 50. В городах Усатово и Полосатово проведены выборочные об- следования доходов жителей. По выборкам из 100 человек получены следующие результаты: в Усатово — средний до- ход 4050 руб., среднее квадратическое отклонение 105 руб.; в Полосатово — средний доход 3970 руб., среднее квадрати- ческое отклонение 85 руб. Можно ли утверждать на уровне значимости 5%, что в Усатово живут в среднем так же, как и в Полосатово? 51. В городах Сковородкино и Кастрюлино проведены выбо- рочные обследования доходов жителей. По выборкам из 200 человек получены следующие результаты: в Сковородкино — средний доход 5230 руб , среднее квадратическое отклонение 250 руб.; в Кастрюлино — средний доход 5180 руб., среднее квадратическое отклонение 190 руб. Можно ли утверждать на уровне значимости 5%, что в Сковородкино живут в среднем богаче, чем в Кастрюлино? 52. В городах Бубликово и Баранкино проведены выборочные об- следования доходов жителей. По выборкам из 100 человек по- лучено, что в Бубликово средний доход А руб. с выборочным средним квадратическим отклонением В руб., в Баранкино средний доход С руб. с выборочным средним квадратическим отклонением D руб. Можно ли утверждать на уровне зна- чимости 5%, что в Бубликово живут в среднем богаче, чем в Баранкино? Решить задачу, если: а) А = 8030, В = 240, С = 7960, D = 180; б) А = 9010, В = 200, С = 8985, D = 150; в) А = 8120, В = 140, С = 7990, D = 180.
348 ЧАСТЬ II. Математическая статистика 53. В таблице представлены сгруппированные данные о расходе сырья на одно изделие для двух различных технологий изго- товления. Показатель Старая технология Новая технология Расход сырья 304 307 308 303 304 306 308 Число изделий 1 4 4 2 6 4 1 В предположении, что расход сырья как при старой, так и при новой технологии, имеет нормальное распределение, вы- яснить, влияет ли изменение технологии на средний расход сырья на одно изделие. Принять а = 0,1. 54. По двум независимым выборкам с объемами п = 10 и т = 8, извлеченным из нормальных генеральных совокупностей, най- дены выборочные средние, равные 142,3 и 145,3, и исправлен- ные выборочные дисперсии, равные 2,7 и 3,2 соответственно. На уровне значимости 0,1 проверить нулевую гипотезу HQ. ах = ау при конкурирующей гипотезе ах* ау. 55. Компания «Рекс», производящая батарейки, утверждает, что в среднем период службы их батареек дольше, чем батареек их конкурента — компании «Полкан». Ассоциация потребителей взяла случайную выборку п = 10 батареек производства ком- пании «Рекс», и, испытав их, определила средний срок службы х = 198 час. с исправленным средним квадратическим отклоне- нием sx= 8,7 час. Такая же проверка продукции «Полкан» для выборки объема т = 15 дала величины у = 194 и sy = 5,8 час. Подтверждают ли эти результаты заявление компании «Рекс»? Уровень значимости — 0,1. 56. Проведено исследование батареек фирм «Винтик» и «Шпунтик». По выборке из N батареек фирмы «Винтик» получен средний срок службы часов А с выборочным средним квадратиче- ским отклонением В часов, по выборке из М батареек фирмы «Шпунтик» — средний срок службы С часов с выборочным средним квадратическим отклонением D часов. Можно ли ут- верждать на уровне значимости 10%, что в среднем срок служ- бы батареек этих двух фирм одинаков? Решить задачу, если: a) N = 11, М = 16, А = 207, В = 9, С = 195, D = 8; б) N = 10, М = 17, А = 256, В = 13, С= 252, D = 11; в) N = 12, М = 15, А = 205, В = 8, С = 195, D = 7. 57. В селах Сидорово и Петрово проведены выборочные обследо- вания доходов жителей. По выборкам из 10 человек получены следующие результаты: в Сидорово — средний доход 2620 руб., среднее квадратическое отклонение 150 руб.; в Петрово —
Глава 15. Проверка статистических гипотез 349 средний доход 2380 руб., среднее квадратическое отклонение 90 руб. Можно ли утверждать на уровне значимости 10%, что в Петрово живут в среднем беднее, чем в Сидорово? 58. В книжном магазине проведено исследование продаж детек- тивов писателя Горшкова «Хромой против Косого» и «Рябой против Глухого». В течение 10 рабочих дней первый роман продавался ежедневно в среднем по 57 экземпляров со сред- ним квадратическим отклонением 12 экземпляров; второй ро- ман — в среднем по 62 экземпляра со средним квадратическим отклонением 15 экземпляров. Можно ли утверждать на уровне значимости 10%, что второй роман расходится лучше первого? 59. В книжном магазине проведено исследование продаж фанта- стических романов писателя Бурьяненко «Ночной досмотр» и «Дневной просмотр». В течение 12 рабочих дней первый роман продавался ежедневно в среднем по 70 экземпляров со сред- ним квадратическим отклонением 14 экземпляров; второй ро- ман — в среднем по 63 экземпляра со средним квадратическим отклонением 11 экземпляров. Можно ли утверждать на уровне значимости 10%, что второй роман расходится хуже первого? 60. Урожайность зерновых культур в России в 1992—2001 гг. пред- ставлена таблицей. Год 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 Урожай- ность, ц/га 18,0 17,1 15,3 13,1 14,9 17,8 12,9 14,4 15,6 19,4 Можно ли утверждать, что урожайность в 1992—1996 гг. и 1997—2001 гг. была в среднем одинаковая (на уровне значимо- сти 0,1)? 61. Производство пшеницы в России в 1995—2002 гг. представлено таблицей: Год 1995 1996 1997 1998 1999 2000 2001 2002 Производство, млн т 30,1 34,9 44,3 27,0 31,0 34,5 47,0 57,7 Можно ли утверждать, что производство пшеницы в 1992- 1998 гг. и 1999—2002 гг. было в среднем одинаковое (на уровне значимости 0,1)? 62. Для оценки качества изделий, изготовленных двумя заводами, взяты выборки по пх = 200 и л2= 300 изделий. В этих выборках оказалось соответственно т} = 20 и т2 = 15 бракованных изде- лий. При уровне значимости 0,05 проверить нулевую гипотезу
350 ЧАСТЬ II. Математическая статистика Яо: р} - р2 о равенстве вероятностей изготовления бракован- ного изделия обоими заводами при конкурирующей гипотезе Я,: рх > рг 63. Для оценки качества изделий, изготовленных двумя заводами, взяты выборки из 100 изделий первого и 200 изделий второ- го. В них оказалось по N и М бракованных изделия соответ- ственно. Можно ли утверждать на уровне значимости 10%, что вероятность изготовления брака на обоих заводах одинакова? Решить задачу, если: a) N = 18, М = 24; б) N = 15, М = 14; в) N = 10, М = 26. 64. Фирма разослала 1000 рекламных каталогов и получила N за- казов. Можно ли утверждать на уровне значимости 5%, что эф- фективность рекламы повысилась, если в прошлом году фирма получила М заказов (при том же объеме рассылки)? Решить за- дачу, если: a) N = 160, М= 120; б) Я = 120, Л/= 100; в) N = 150, М = 130; г) А = 140, М= 100; д) У= 180, М= 160. 65. Аудиторы компании интересуются системой обработки счетов доходов. Они взяли случайную выборку из 100 законченных счетов, в которой 8 счетов оказались дефектными. Тогда ау- диторы предложили некоторые модификации в процедуре и через определенное время провели случайную выборку из 150 завершенных счетов, где обнаружили 6 дефектных счетов. Имеется ли основание предполагать на уровне значимости 5%, что новые процедуры уменьшают ошибку? 66. Можно ли воспользоваться критерием Бартлетта для провер- ки гипотезы об однородности дисперсий по выборкам объема п} = 15, п2 = 25, л3 = 10, п4 = 3? Дайте пояснения. 67. По трем независимым выборкам, объемы которых л, = 9, п2 = 13, п3 = 15, извлеченным из нормальных генеральных совокупно- стей, найдены исправленные выборочные дисперсии, равные 3,2; 3,8; 6,3 соответственно. Требуется: а) на уровне значимости 0,05 проверить гипотезу о равенстве дисперсий; б) оценить ге- неральную дисперсию. 68. Четыре фасовочных автомата настроены на отвешивание одина- кового веса. На каждом автомате отвесили 10 проб, затем эти же пробы взвесили на точных весах и нашли исправленные вы- борочные дисперсии отклонений от норматива: 0,01; 0,02; 0,04; 0,03. Можно ли утверждать на уровне значимости 5%, что авто- маты обеспечивают одинаковую точность взвешивания?
Глава 15. Проверка статистических гипотез 351 69. Инвестор имеет данные по доходности актива Л за 5 лет, актива Б — за 7 лет, актива В — за 10 лет. Исправленные выборочные дисперсии доходностей равны 0,01; 0,02 и 0,03 соответственно. Можно ли утверждать на уровне значимости 5%, что риск вло- жений в эти активы одинаков? 70. Инвестор имеет данные за 10 лет по доходности активов Л, Б, В и Г. Исправленные выборочные дисперсии доходностей равны 0,012; 0,021; 0,025; 0,032 соответственно. Можно ли утверждать на уровне значимости 5%, что риск вложений в эти активы одинаков?
Глава 16 КРИТЕРИИ СОГЛАСИЯ Критерии проверки гипотезы о предполагаемом виде закона распределения случайной величины называют критериями со- гласия. Следует понимать, что проверяют не тот факт, что случайная величина действительно имеет определенный закон распреде- ления (например, нормальный), а проверяется лишь, достаточ- но ли хорошо наблюдаемые данные согласуются с некоторым законом распределения, чтобы можно было использовать этот закон для прогнозирования поведения рассматриваемой слу- чайной величины. Гипотезы могут быть как простыми, так и сложными. Гипотеза называется простой, если проверяется соответствие некоторому закону распределения с заданными параметрами. Гипотеза называется сложной, если проверяется соответствие некоторому закону распределения с произвольными параметра- ми. В этом случае параметры оценивают по выборке. Наиболее часто используемые критерии согласия — это критерии Пирсона, Фишера и Колмогорова. 16.1. Критерии согласия Пирсона и Фишера (хи-квадрат) Критерий согласия Пирсона (хи-квадрат) идеально подхо- дит для проверки гипотез в полиномиальной схеме. Пусть проводится п независимых испытаний, каждое из ко- торых может иметь г различных исходов Av А2,... Аг. Требуется проверить гипотезу о том, что вероятности этих исходов равны Р2’ • Л’ если в последовательности испытаний они встрети- лись т}, т2, ..., тг раз.
Глава 16. Критерии согласия 353 Теорема 1 (Пирсона). Если основная гипотеза верна, то рас- пределение статистики хи-квадрат £ у^-прД nPi при п -> оо стремится к распределению хи-квадрат с г - 1 сте- пенями свободы. В противном случае эта статистика стремится к бесконеч- ности. Отсюда получаем критерий (применимый при больших п): если х2 <Ха;гч, то основная гипотеза принимается, иначе отвер- гается. Дадим краткое обоснование критерия Пирсона. Будем считать наступление события А. успехом, а его от- сутствие — неудачей. Тогда т. — это число успехов в п испытаниях Бернулли, т./п - относительная частота события Ар которая является асимптотически нормальной, несмещенной и состоятельной . / mi оценкой вероятности этого события. Поскольку м\— = А> при больших п можно считать справедливым приближенное ра- ти. т (т^ т,\ венство — « р., т.е. вектор частот —= —>—>•••>— является п ' п \п п п ) оценкой гипотетических вероятностей р = (рр р2, ..., р). В качестве меры расхождения гипотетической и теоретиче- ской вероятностей рассматривается сумма квадратов отклоне- ний \2 ГП- I — ~Pi П- J где у(. — веса отклонений. Например, в методе наименьших квадратов принято у(. = 1, но согласно теории ошибок Гаусса каждое слагаемое должно входить в сумму со своей точностью. Пирсон показал, что если положить у. = п/p., то полученная статистика критерия будет иметь известный закон распределе- ния. Действительно, n Y = у Jh(= y(mi-nPi)2 п ' J рХ л ) h nPi & /=1 \
354 ЧАСТЬ II. Математическая статистике от, - пр, величина yt = х л? асимптотически нормальна, т.е. у, —1 — р). Если бы yi имели распределение N (0, 1) и были независимы, то случайная величина х2 = £у,2 имела бы <=1 предельное распределение х2 • Однако между случайными ве- личинами у. для различных I существует линейная зависимость. Действительно, поскольку V1 I ~пР)У 1 V1/ , 1 , \ л L Va а = L~—г=--------=“г 2-И - лА)=“г (« -«) = О, /=1 /=1 yJnPi \П i=\ yjn ГП,-Пр, то у = линейно зависимы, причем их связь описывает- >/лА ся всего одним уравнением. С учетом этих фактов, при п -» « случайная величина х2 = ^у2 имеет распределение х2 с г ~ 1 степенями свободы. Если вероятности р{, р2, ..., рг зависят от неизвестных пара- метров 0Р 02, ..., 0Р то при вычислении статистики хи-квадрат используют оценки этих вероятностей, найденные по данным эксперимента отр от2,... тг, как правило, методом максимально- го правдоподобия. Но в этом случае предельное распределение статистики хи-квадрат имеет уже г - к - 1 степеней свободы. Затем принимают решение: если х2 <xL-*-i>, то гипотеза при- нимается, иначе отвергается. Критерий хи-квадрат для простой гипотезы (т.е. в случае известных параметров) называют также критерием хи-квадрап Пирсона, а критерий хи-квадрат для сложной гипотезы (с оце- ниванием параметров) — критерием хи-квадрат Фишера. Критерий хи-квадрат можно применять и в более общей схеме, для проверки распределений случайных величин. В этом случае в качестве исходов At, Av ..., Аг берут попадания наблю- дений в некоторые множества Др Д2, ..., Дг. Для дискретных ве- личин это могут быть отдельные значения или их объединения Для непрерывных величин используют обычную группировку т.е. подсчитывают числа попаданий в некоторые интервалы. Если распределение не ограничено слева или справа, то край- ние интервалы продолжают до бесконечности. Если числа по- паданий в какие-то интервалы слишком малы (например, мень-
(лава 16. Критерии согласия 355 ше 5), то такие интервалы объединяют с соседними интервалами. Всего желательно иметь не менее 50 наблюдений в выборке. В результате есть множества Др Л2, ..., Аг, находят числа mv mv тг попаданий наблюдений в эти множества и теоре- тические вероятности pt= g А(), i = 1,2, ..., г, после чего применяют критерий хи-квадрат. Рассмотрим более подробно следующие случаи. I. Пусть хр х2, ..., хя — независимые наблюдения некоторой случайной величины £, с неизвестной функцией распределения F(x). Требуется по выборке хр х2, ..., хп проверить нулевую ги- потезу о том, что генеральная совокупность имеет функцию распределения Г0(х), если известны значения параметров зако на распределения, т.е. имеет место простая гипотеза. Для проверки этой гипотезы область наблюдаемых значе- ний Хр х2, ..., хп случайной величины Е, произвольнььм образом разбивают на г непересекающихся областей А(, i = 1, 2, ..., г. Обычно это последовательность непересекающихся интервалов и полуинтервалов вида (-«, С,); [Ср С2); ...; [С^, +»); Со= -оо; Сг = +оо. Если справедлива основная гипотеза, т.е. случайные вели- чины хк имеют своей функцией распределения функцию F0(x), то можно найти теоретические вероятности попадания случай- ной величины в частичные интервалы из условия А <^<Ci) = F0(Ci)-Fv(Ci_}), где р, > 0, 2> = 1- / = 1 Со случайными величинами хр х2, хп естественно свя- зана полиномиальная схема с п испытаниями, в которой ре- зультатом Л-го испытания является попадание значения хк в какой-либо интервал. Обозначим через mi = /л.(хр х2, ..., хп) число значений среди хр х2, .... х, попавших в промежуток \ = [С-рС). По теореме Пирсона получаем, что если хр х2, ..., хя — выборка из генеральной совокупности с функцией распреде- ч , ^(/И. -ЛД)2 ления гп(х), то статистика %= > — -------— имеет при п —> о пр, (т.е. при достаточно больших п) распределение хи-квадрат с г — 1 степенями свободы, если основная гипотеза верна. В про- тивном случае статистика стремится к бесконечности. Поэтому в качестве критической области выбирают область больших значений.
356 ЧАСТЬ II. Математическая статистика Поскольку односторонний критерий более «жестко» отвер- гает нулевую гипотезу, чем двусторонний, построим правосто- роннюю критическую область исходя из требования, что ве- роятность попадания критерия в эту область в предположении истинности нулевой гипотезы должна быть равна принятому уровню значимости а: Лх2^ Х2а^|) = а- Алгоритм проверки гипотезы следующий. 1. Из генеральной совокупности производят выборку объ- ема п (п > 50). 2. Составляют сгруппированный статистический ряд. 3. Весь диапазон наблюдаемых значений разбивают на г ча- стичных интервалов (в каждом из которых должно быть мини- мум 5—8 наблюдений, иначе интервалы объединяются; хорошие результаты получают при npt >10). 4. На основании гипотетической функции распределения F0(x) вычисляют вероятности попадания случайной величины § в частичные интервалы: Р,= Р(С„ < $ < С,.) = F0(Cf) - F0(CM), i = 1, 2, ..., г. 5. Умножая полученные вероятности pt на объем выборки, получаем теоретические частоты пр., т.е. частоты, которые сле- дует ожидать, если нулевая гипотеза справедлива. , г> 2 V'(ff!,-”A)2 6. Вычисляют статистику хи-квадрат: х = > ————. ПР) 7. По таблице критических точек распределения хи-квадрат по заданному уровню значимости а и числу степеней свободы г — 1 находим критические точки х2а 8. Сравнивая наблюдаемые значения статистики х2 с кри- тическим значением xtr-i > принимаем одно из двух решений: а) если х2 > Xa,r-i ’ то нУлевая гипотеза отвергается в пользу альтернативной, т.е. считается, что гипотетическая функция распределения не согласуется с опытными данными; б) если х2 < Ха г-i > т° нет основания для отклонения нуле- вой гипотезы, т.е. гипотетическая функция F0(x) согласуется с опытными данными. II. Если значения параметров гипотетической функции рас- пределения F0(x) неизвестны, то имеем сложную гипотезу. Основная гипотеза Но заключается в том, что функция рас- пределения имеет вид F0(x) = F(x, 0,, ..., 0t) при некоторых
Глава 16. Критерии согласия 357 неизвестных значениях параметров 0Р 02, 0Г В этом случае вероятности рх, р2, ..., pt также зависят от параметров. Статистика хи-квадрат принимает вид: 2 = A(/n,.-/i/>,(0i,O2,.-,0t))2 Z лЛ(0,,02>...,0,) При известных значениях параметров имел бы место пер- вый случай. Но так как истинные значения 0р 02, Qk неиз- вестны, то, подставляя их оценки, найденные методом мак- симального правдоподобия, получаем статистику х2 с мень- шим числом степеней свободы, а именно v = г — к — 1, где г — число интервалов, на которые разбит весь диапазон на- блюдаемых значений, к — число параметров гипотетической функции распределения. Сравнивая наблюдаемое значение статистики х2 с критиче- ским значением Ха г-к-\ > по приведенной схеме делаем заклю- чение об истинности нулевой гипотезы: гипотеза принимается, если х2 < Xa,r-i-i ’ и отвергается в противном случае. Задача 1. В следующей таблице представлены данные о чис- ле сделок, заключенных на фондовой бирже за квартал, для 517 инвесторов. i 0 1 2 3 4 5 6 7 mt 112 168 130 68 32 5 1 1 В первой строке приведено число сделок, во второй — число инвесторов, заключивших указанное число сделок за квартал. Проверить, используя критерий Пирсона, что на уровне значимости a = 0,05 число сделок, заключенных одним инве- стором за квартал, распределено по закону Пуассона с параме- тром X = 1,5. Решение. Поскольку распределение Пуассона дискретно, в качестве различных исходов здесь можно принять сами значе- ния случайной величины. Заметим, что два последних значения (6 и 7) встретились слишком много раз, поэтому их следу- ет объединить с предыдущим (5). Кроме того, распределение Пуассона не ограничено справа, и следует учесть все значе- ния, превышающие число 7 (которые не встретились ни разу).
358 ЧАСТЬ II. Математическая статистика Таким образом, в качестве множеств А, выберем значения {0}, {1}, {2}, {3}, {4}, [5, +оо). Здесь г = 6. Найдем теоретические вероятности по формуле распреде- ления Пуассона: = = у = 0, 1,2, ... у! При 1 = 1,5 получаем: р, = = 0) « 0,2231; р4 = = 3) « 0,1255; р2 = = 1) « 0,3347; р5 = = 4) « 0,0471; р3 = Р(£, = 2) « 0,2510; р6 = 5) » 0,0186. Умножим эгу величину на число инвесторов л = 517 и со- ставим таблицу (табл. 16.1). Таблица 16.1 А npt т. ~ пр. (m( - пр)1/(пр) 0 112 115,34 -3,34 0,10 1 168 173,04 -5,04 0,15 2 130 129,77 0,23 0,00 3 68 64,88 3,12 0,15 4 32 24,35 7,65 2,40 >5 1 7 9,62 -2,62 0,71 Суммируя значения в последнем столбце, получаем значе- ние статистики хи-квадрат (х2 = 3,51). По таблице критических точек распределения хи-квадрат при уровне значимости а = 0,05 и числе степеней свободы г — 1 = 5 находим критическую точку х2кр = 11,1- Поскольку х2 < Z2^» можно считать, что число сделок, заключенных одним инвесто- ром за квартал, распределено по закону Пуассона с параметром Х= 1,5. Замечание. Если бы значение параметра Л. = 1,5 было оцене- но по самой выборке, следовало бы задать число степеней сво- боды г - 2 = 4. Тогда имеем х2кр = 9,5, следовательно, гипотеза тоже принимается.
Глава 16. Критерии согласия 359 Задача 2. В табл. 16.2 приведены сгруппированные данные о коэффициентах соотношения заемных и собственных средств на 100 малых предприятиях региона. Таблица 16.2 Номер интервала Интервал Середина интервала Число наблюдений в интервале 1 5,05-5,15 5,1 5 2 5,15-5,25 5,2 8 3 5,25-5,35 5,3 12 4 5,35-5,45 5,4 20 5 5,45-5,55 5,5 26 6 5,55-5,65 5,6 15 7 5,65-5,75 5,7 10 8 5,75-5,85 5,8 4 На уровне значимости а = 0,05 проверить гипотезу о том, что коэффициенты можно описать нормальным распределением. Решение. В рассматриваемом случае параметры распределения явно не заданы, их следует оценить по сгруппированным дан- ным. Находим выборочное среднее (5,46) и выборочную диспер- сию (0,03). Теоретические вероятности оцениваем по формуле: Р(с/_,<^<с,) = Ф -Ф С,-‘ * , i = l, 2, ...,8. I ) Следует продолжить крайние интервалы и положить с0 = —оо, с8 = +оо, поскольку нормальное распределение не огра- ничено с обеих сторон. С учетом полученных значений строим таблицу (табл. 16.3). Таблица 16.3 А т1 лр, Л1. — пр. (m. - пр)г/(пр) <5,15 5 3,67 1,32 0,47 _ 5,15-5,25 8 7,59 0,41 0,02
360 ЧАСТЬ II. Математическая статистика Окончание табл. 16.3 А т. nPi т. ~ nPt (m. - пр)г/(пр) 5,25-5,35 12 15,00 -3,00 0,60 5,35-5,45 20 21,43 -1,43 0,09 5,45-5,55 26 22,14 3,86 0,67 5,55-5,65 15 16,53 -1,53 0,14 5,65-5,75 10 8,93 1,07 0,13 >5,75 4 4,70 -0,70 0,10 Суммируя значения в последнем столбце, получаем значе- ние статистики хи-квадрат (х2 — 2,22). С помощью таблицы критических точек распределения хи- квадрат по уровню значимости а = 0,05 и числу степеней сво- боды г-1-£=8— 1-2 = 5 находим критическую точку Х2кр= 11,1. Поскольку %2 < Х2кр> можно считать, что коэффици- енты хорошо описываются нормальным распределением. Замечание. В принципе здесь можно было бы объединить крайние интервалы с соседними. Вычисления показывают, что и в этом случае гипотеза принимается. III. Экономисты также используют критерий х2 в качестве критерия однородности. Пусть имеется к > 2 независимых выборок, содержащих соот- ветственно пх, п2, ..., пк независимых наблюдений: (х1эх2,...,х ); Гипотеза об однородности предполагает, что генеральные совокупности, из которых извлечены выборки, одинаковы (или все выборки произведены из одной генеральной совокупности) и им соответствуют одинаковые функции распределения. Наиболее часто в приложениях встречается случай, когда к = 2. Пусть имеется два ряда наблюдений некоторого при- знака, и каждый ряд разбит на г групп по значениям этого признака. Сгруппированный ряд имеет вид: п{\ тх т2 ... mt ... тг П- /, /2 ... / ... /г
Глава 16. Критерии согласия 361 Пусть mi и I. — количество выборочных значений в z-й груп- пе для первого и второго ряда наблюдений. Тогда статисти- ческий критерий для проверки истинности нулевой гипотезы принимает вид X2=«!"2Z «1 П1) гп'+1. и в случае истинности основной гипотезы при и -> оо он имеет предельное распределение с г — 1 степенями свободы. Критическими точками, соответствующими уровню значимости а, будут Ха,г-i > и проверка гипотезы проводится по общей схеме: если х2<Ха;г-м то нулевая гипотеза принимается, в противном случае отвергается. с mi л. Если ПОЛОЖИТЬ W = -----— И W = —!—, то формулу мож- но представить в виде, часто более удобном для практических расчетов: 2 _(”1 +Ъ)2(у т1 +/, Л] + ^2 1 w(l-w) -цы i=i Задача 3. Распределение доходов среди рабочих и служа- щих согласно шведской переписи 1930 г. приведено в таблице. С помощью критерия Пирсона проверьте гипотезу об одина- ковости распределения доходов у двух возрастных групп для заводских мастеров и всех рабочих и служащих. Доходы, 1000 крон Все рабочие и служащие в промышленности Заводские мастера возрастные группы возрастные группы ж, 1, ж, 40-50 50-60 40-50 50-60 0-1 7831 7558 0,508869 71 54 0,568000 1-2 26 740 20 685 0,563837 430 324 0,570291 2-3 35 572 24 186 0,595267 1072 894 0,545269
362 ЧАСТЬ II. Математическая статисти! Окончание mafa 3-4 20 009 12 280 0,629784 1609 1202 0,572394 4-6 11 527 6776 0,629787 1178 903 0,566074 > 6 6919 4222 0,621039 158 112 0,585185 Решение. Рассматривается гипотеза однородности: обе вы- борки (по возрастным группам) извлечены из одной генераль- ной совокупности. Статистика критерия при проверке основ- ной гипотезы имеет вид Для заводских мастеров получаем х2 = 4,27. Отсюда х2 < < Хо,о5;5 = Н,1 и можно считать, что две выборки извлечены из одной генеральной совокупности. Но если сравнить рас- пределение доходов у возрастных групп всех промышленных рабочих и служащих, то получаем х2 = 840,62, что указывает на очень высокую степень различия между распределениями. При этом видно, что числа w. имеют тенденцию возрастать с ростом доходов. 16.2. Критерий согласия Колмогорова Критерий согласия Колмогорова применяют для проверки гипотез о законах распределения только непрерывных случай- ных величин. Проверяем гипотезу Яо: Дх) = Г0(х) против аль- тернативной Нх\ Дх) ф Г0(х). Критерий основан на том факте, что распределение супре- мума разности между теоретической и эмпирической функци- ями распределения Dn = sup|F (х) — Дх)| одинаково для любой Дх). Величину Dn называют статистикой Колмогорова. При малых п для статистики Колмогорова существуют та- блицы критических точек Z) Если Dn < D 9 то гипотеза Яв принимается, иначе отвергается. При больших п используют предельное распределение Колмогорова. Имеет место следующая теорема.
Глава 16. Критерии согласия 363 Теорема 2 (Колмогорова) P(4nD„ < х) -+ Q(x) = 1 + г£(- , л —> оо. *=i Для распределения Колмогорова Q(x), предельного для статистики X = 4nDn, также существуют таблицы критических точек \р. Практически их используют уже при л > 20. Если л < X , то гипотеза Но принимается, иначе отвергается. Покажем, что распределение статистики Колмогорова D не зависит от вида неизвестной функции распределения Дх). Рассмотрим преобразование t - F{t), 0 < t’ < 1. Можно предположить, что F[t) — строго возрастающая функция. Тогда существует обратное преобразование t = Л‘(г'). Разность функ- ций распределения равна ДО - Д(0 = f - Д(^'('')), где Д(Г’|(/')) = числ° xt<F (t) Однако из неравенства х,. < P\t') п следует, что F(x) < f. Пусть Дх) = д. и обозначим через Gn(f) выборочную функцию распределения для ц,, q2, ..., т|я. Теоретическая функция распределения для т] следующая: G(f) = Дц,.< Г) = ДДх) < С) = Дх, < F-'(t')) = Д/^>(Г)) = Г, и в силу свойств вероятности можно записать б(Г) = О, 1, /'<0; 0<Г'< 1; Г>1 Следовательно, G(t') является функцией распределения рав- номерной случайной величины, заданной на отрезке [0, 1], т.е. Дх) имеет равномерное распределение на отрезке [0, 1]. Тогда статистика Д,= sup I Дг) - Д(01 = sup |r- Fn(Pl(t') \ = sup |г' - (7(Г)| —х</<ос 0</'<1 0</'<1 имеет ту же величину, но уже для известного (равномерного) распределения. Таким образом доказано, что распределение статистики Dn не зависит от вида неизвестной функции рас- пределения Дх). Функция распределения Дх) является разрывной, причем она имеет разрывы только первого рода, являющиеся скачками,
364 ЧАСТЬ II. Математическая статистику и поэтому выборочную статистику Dn в общем случае опреде- ляют с помощью точной верхней границы (sup): D = sup |F(x) - F0(x)|. -oc<x<oc Введем также статистики D~ = sup [F0(x) — F(x)] и л; = sup [F(x) - F0(x)], тогда Dn =max[Zr,Zr]. Статистики Dn, D* называют статистиками Смирнова. На практике статистику Колмогорова можно вычислить по эквивалентным формулам: Dn = max Л \<i<n Цо) 2п п ^оЦо)| и D„ = max ” 1</<л FZ \ 2/"1 W)) 1 4----, 2п где х(/) — члены вариационного ряда. Заметим, что критерий Колмогорова, строго говоря, нельзя применять в случаях сгруппированных данных при неизвест- ных параметрах распределения. Тем не менее, его иногда при- меняют на практике и в подобных ситуациях. Однако при этом статистики критерия получаются заниженными, что увеличивает ошибку первого рода. В таких случаях предпочтительнее поль- зоваться критерием хи-квадрат Пирсона. Проверка гипотезы однородности с помощью критерия Кол- могорова-Смирнова состоит в следующем. Пусть хр х2, ..., хЖ1 и yv у2. ..., уП2 — выборки из двух генеральных совокупно- стей. Требуется проверить нулевую гипотезу Яо о совпадении законов распределения генеральных совокупностей, из которых произведены выборки. Определим эмпирические функции распределения ^(л,) и £(Лг). Для проверки гипотезы вводятся статистики: D; n2 = sup (F^\x)-F^(x)y, Dnini = ,Л;,2) = jupj^>(x)-F‘*>(x)|. Пусть nv n2 -» оо, „ = ^п2 и предельные функции Fx(x) и ”i+«2 F2(x) непрерывны. Тогда в условиях истинности нулевой гипо-
Глава 16. Критерии согласия 365 тезы статистика Dn „ имеет в пределе распределение Колмо- горова. Критической областью является область больших значе- ний, т.е. основная гипотеза отклоняется, если > Ха, где А.а — критическая точка распределения Колмогорова, соответ- ствующая уровню значимости а. Задача 4. Пассажир, приходящий в случайные моменты времени на автобусную остановку, в течение пяти поездок фик- сировал время ожидания автобуса: 5,1; 3,7; 1,2; 9,2; 4,8 (мин.). Проверить гипотезу о том, что время ожидания равномерно распределено на отрезке [0; 10] на уровне значимости а = 0,05. Решение. Составим вариационный ряд: 1,2; 3,7; 4,8; 5,1; 9,2. С учетом того, что в данном случае Г0(х) = х/10, 0 <х < 10, построим таблицу: / *(/) Г&ц) (2/ - 1)/(2л) IW - (2/ - 1)/(2л)| 1 1,2 0,12 0,1 0,02 2 3,7 0,37 0,3 0,07 3 4,8 0,48 0,5 0,02 4 5,1 0,51 0,7 0,19 5 9,2 0,92 0,9 0,02 Таким образом, значение статистики Колмогорова состав- ляет Z>5= 0,19 + 0,1 = 0,29. По таблице критических точек при а = 0,05 и п = 5 находим Z) = 0,56. Поскольку D < нулевая гипотеза (о равномер- ности распределения) принимается. Замечание. На самом деле по таким небольшим выборкам, конечно же, нельзя делать далеко идущие выводы. Задача 5. Выборка из 10 наблюдений приведена в таблице. Проверить с помощью критерия Колмогорова гипотезу о том, что эта выборка из генеральной совокупности, равномерно рас- пределенной на отрезке ]0, 1]. Уровень значимости а = 0,05.
366 ЧАСТЬ II. Математическая статистика। Решение. Пусть Н*(0) — tr I Х(0 п Л>Ц) = fi / IIе 1 1 0,01 0,1 0,01 0,09 0,01 2 009 0,2 0,09 0,11 -0,01 3 0,1 0,3 0,1 0,2 -0,1 4 0,25 0,4 0,25 0,15 -0,05 5 0,33 0,5 0,33 0,17 -0,07 6 0,35 0,6 0,35 0,25 -0,15 7 0,52 0,7 0,52 0,18 -0,08 8 0,73 0,8 0,73 0,07 0,03 9 0,76 0,9 0,76 0,14 -0,04 10 0,86 1 0,86 0,14 -0,04 Из таблицы получаем Z)10 = 0,25. По заданному уровню значимости а = 0,05 находим кри- тическую точку DKp = 0,41. Поскольку Z>10 < DKp, то гипотеза принимается. Задача 6. В таблице приведены условные данные о заработ- ной плате «j = 100 и п2 = 100 служащих двух отраслей народ- ного хозяйства. Проверить с помощью критерия Колмогорова- Смирнова гипотезу о том, что распределение заработной платы служащих первой отрасли (ГДх)) совпадает с распределением заработной платы служащих второй отрасли (F2(x)). Уровень значимости а = 0,05. Решение. Заработная плата X, У, / Заработная плата ЛЦо) 130-150 4 1 1 150 0,04 0,01 0,03 150-170 4 1 2 170 0,08 0,02 0,06 170-200 15 8 3 200 0,23 0,10 0,13 200-250 51 43 4 250 0,74 0,53 0,21 250-300 22 34 5 300 0,96 0,87 0,09 300-350 3 7 6 350 0,99 0,94 0,05 350-400 1 3 7 400 1,00 0,97 0,03 400-500 — 3 8 500 1,00 1,00 0,00
Глава 16. Критерии согласия 367 Используя значения эмпирических функций распределения в правых концах интервалов, получаем данные для расчета кри- тических статистик. Получаем X = 100 750 = 0,21750 «1,4849, так как «1^2 _ П щ + п2 2 = 50. По таблице критических точек распределения Колмогорова находим Х^ = 1,36. Поскольку X > Х^, гипотеза однородности отвергается. Задачи для самостоятельного решения Теоретические задачи 1. В городе 17 036 семей имеют двоих детей. В 4529 семьях — два мальчика, в 4019 — две девочки, в 8488 семьях — мальчик и девочка. Можно ли на уровне значимости 0,05 считать, что количество мальчиков в семьях с двумя детьми имеет биноми- альное распределение с вероятностью рождения мальчика 0,515? 2. В следующей таблице приведены данные о числе покупок, сделанных в магазине (в первой строке — число покупок, во второй — количество покупателей, сделавших такое число по- купок). х, 1 2 3 4 5 6 7 8 ni 298 152 77 35 20 11 4 3 На уровне значимости а = 0,05 проверить гипотезу, что число покупок для одного покупателя имеет геометрическое распре- деление с параметром р = 1/2. 3. В следующей таблице представлены данные о числе крупных сделок, заключенных на фондовой бирже за квартал, для 400 инвесторов. х. 0 1 2 3 4 5 6 7 8 9 10 п, 146 97 73 34 23 10 6 3 4 2 2 На уровне значимости а = 0,05 проверить гипотезу о том, что число крупных сделок, заключенных инвестором за квартал, имеет распределение Пуассона.
368 ЧАСТЬ II. Математическая статисти» 4. Проведено исследование посещаемости популярного интернет^ сайта. Долгое время регистрируется число людей, посетивших сайт в течение данного часа. Результаты исследования пред- ставлены в таблице. Число посетителей Часы Число посетителей Часы 0 57 7 139 1 203 8 45 2 383 9 27 3 525 10 10 4 532 11 4 5 408 12 1 6 273 14 1 На уровне значимости а = 0,05 проверить гипотезу, что посе- щаемость сайта можно описать распределением Пуассона. 5. В следующей таблице представлены сгруппированные данные о заработной плате (в тыс. руб.) мужчин и женщин, работающих на крупной фирме. Заработная плата Женщины Мужчины 10—30 80 60 30-50 160 180 50-100 120 240 > 100 40 120 Проверить гипотезу однородности на уровне значимости а = 0,05. 6. В следующей таблице представлены сгруппированные данные о продолжительности жизни мужчин и женщин в некотором городе. Продолжительность жизни, лет Женщины Мужчины < 40 39 197 40-50 56 111 50-60 103 136 60-70 168 161 70-80 258 185 > 80 376 210 Проверить гипотезу однородности на уровне значимости а = 0,05.
Глава 16. Критерии согласия 369 7. В следующей таблице приведены сгруппированные данные о моментах прибытия машин к бензоколонке в течение 10 ч на- блюдений (с 8 до 18 ч). Время Число машин 8-9 12 9-10 40 10-11 22 11-12 16 12-13 28 13-14 6 14-15 11 15-16 33 16-17 18 17-18 14 На уровне значимости а = 0,01 проверить гипотезу, что момен- ты прибытия машин распределены равномерно. 8. В следующей таблице приведены сгруппированные данные по срокам службы (ч) для 1000 изделий: х, 0-10 10-20 20-30 30-40 40-50 50-60 60-70 ni 365 245 150 100 70 45 25 На уровне значимости а = 0,05 проверить гипотезу, что срок службы изделия имеет показательное распределение. 9. В следующей таблице представлены данные о месячных доходах жителей региона (тыс. руб.) для 1000 жителей: х. < 5 5-10 10-15 15-20 20-25 > 25 п, 58 96 239 328 147 132 На уровне значимости а = 0,05 проверить гипотезу, что доходы жителей региона можно описать нормальным распределением. 7. В следующей таблице представлены данные об удоях коров на молочной ферме за лактационный период (ц) для 100 коров. 4-6 6-8 8-10 10-12 12-14 14-16 16-18 18-20 20-22 22-24 24-26 nt 1 3 6 11 15 20 14 12 10 6 2 13- Теория вероятностей
370 ЧАСТЬ II. Математическая статистик На уровне значимости а = 0,05 проверить гипотезу, что удои коров можно описать нормальным распределением. 11. В ОТК были измерены диаметры 300 валиков из партии, изго- товленной одним станком-автоматом. Отклонения измеренных диаметров от номинала (нм) даны в таблице. Границы отклонении Середина интервала Число валиков Границы отклонений Середина интервала Число валиков -30...-25 -27,5 3 0...5 2,5 55 -25...-20 -22,5 8 5...10 7,5 30 -20...-15 -17,5 15 10...15 12,5 25 -15..-10 -12,5 35 15...20 17,5 14 -10...-5 “7,5 40 20...25 22,5 8 -5...0 -2,5 60 25...30 27,5 7 На уровне значимости а = 0,05 проверить гипотезу, что от- клонения диаметров от номинала можно описать нормальным распределением. 12. За 6 рабочих дней спрос на некоторый товар составлял: 104; 80; 96; 120; 113; 82 кг. На уровне значимости а = 0,1 проверить гипотезу о том, что спрос равномерно распределен на отрезке [75; 125]. 13. В поселке Полтинниково все жители имеют доход не менее 50 тыс. руб. в месяц. Выборочное обследование доходов 10 че- ловек дало следующие результаты: 54; 60; 59; 79; 71; 92; 53; 54; 78; 56 тыс. руб. На уровне значимости а = 0,05 проверить гипотезу, что случайная величина дохода имеет распределение Парето вида 0, х<хп; F(x) = , « 1-(х/х0) , х>х0, где х0 = 50 (тыс. руб.), а = 3. 14. При измерении веса 20 шоколадных батончиков (с номиналь- ным весом 50 г) получены следующие значения (г): 49,1; 50,0; 49,7; 50,5; 48,1; 50,3; 49,7; 51,6; 49,8; 50,1; 49,7; 48,8; 51,4; 49,1; 49,6; 50,9; 48,5; 52,0; 50,7; 50,6. На уровне значимости а = 0,05 проверить гипотезу, что вес батончиков имеет нормальное распределение со средним 50 г и дисперсией 1 г2.
Глава 16. Критерии согласия 371 15. Урожайность зерновых культур в России в 1992—2001 гг. пред- ставлена таблицей. Год 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 Урожай- ность, ц/га 18,0 17,1 15,3 13,1 14,9 17,8 12,9 14,4 15,6 19,4 Проверить на уровне значимости а = 0,1 гипотезу, что урожай- ность можно описать нормальным распределением с параме- трами а = 16, ст - 2 (ц/га).
Глава 17 ЭЛЕМЕНТЫ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ 17.1. Основные понятия в анализе временных рядов Временным рядом называется ряд наблюдений некоторой величины, сделанных в последовательные моменты времени (обычно через равные интервалы). В экономических приложениях это могут быть, например, объемы производства или продаж каких-либо товаров, цены акций, курсы валют и т.п. Данные могут регистрироваться еже- годно, ежемесячно или ежедневно, а учитывая современные компьютерные технологии — даже ежечасно и ежеминутно. Основными целями анализа временных рядов является вы- явление присущих им закономерностей и прогнозирование на будущее (с учетом этих закономерностей). Существует великое множество методов анализа временных рядов, которым посвящена обширная литература. Эти методы могут применяться каждый в отдельности, в различных комби- нациях и в разной последовательности. В зависимости от этого могут получаться различные результаты. Однако для «хороших» временных рядов они будут не очень сильно различаться между собой. Предполагается, что временной ряд можно разделить на три составляющие: 1) тренд, т.е. некая общая закономерность роста или убы- вания; 2) сезонная (или циклическая) компонента;
Глава 17. Элементы анализа временных рядов 373 3) случайная компонента (шум). В качестве тренда обычно берут достаточно простую функ- цию. Наиболее часто используют линейный и экспоненциаль- ный тренды. Первое означает, что величина в среднем растет или убывает в арифметической прогрессии (на столько-то в единицу времени), второе — что она меняется в геометриче- ской прогрессии (во столько-то раз или на столько-то процен- тов в единицу времени). Иногда рассматривают и более слож- ные тренды, например полиномиальные и т.п. Линейный тренд легко построить с помощью линейной ре- грессии, применяя метод наименьших квадратов к исходным данным. Экспоненциальный тренд можно построить, если пе- рейти к логарифмам наблюдаемых величин, провести линей- ную регрессию для них, а затем взять экспоненту от получен- ной линейной функции. Сезонной компоненты во временном ряду может не быть совсем, их может быть несколько или одна. Например, во вре- менном ряду из ежемесячных данных скорее всего будет се- зонная компонента с периодом 12 (годичный цикл). В ряду ежедневных наблюдений могут быть компоненты с периодом 7 (неделя), около 30 (месяц) и 365 (год) и т.д. В ежегодных наблюдениях могут присутствовать многолетние циклы (напри- мер, экономические циклы Кондратьева). Сезонная компонента может быть аддитивной (когда ее ам- плитуда относительно «среднего» значения остается в среднем постоянной) и мультипликативной (когда колебания проис- ходят пропорционально текущему «среднему», и их амплитуда может расти или убывать со временем согласно тренду). Для описания сезонной компоненты часто используют сезонные ин- дексы, показывающие, на сколько (или во сколько раз) значе- ние в данной точке цикла отличается от некоторого «среднего» значения. Следует отметить, что существуют временные ряды с лож- ными трендами и ложными циклами, когда закономерности, выявленные на одном отрезке наблюдений, не подтверждаются на других. Однако здесь такие ряды рассматривать не будем. Общая схема анализа временного ряда обычно такова, что выявленные в нем закономерности исключают путем некото- рых преобразований и далее изучают получившиеся величины, называемые остатками, пытаясь выявить закономерности уже
374 ЧАСТЬ II. Математическая статистика в их поведении, и т.д. Так продолжают до тех пор, пока не останутся чисто случайные колебания (независимые случайные величины). 17.2. Простые методы анализа и прогнозирования временных рядов Рассмотрим некоторые простые методы анализа и прогно- зирования временных рядов, не требующие глубокой теории, на примере нескольких практических задач. Задача 1. В таблице представлены данные об урожайности (ц/га) зерновых культур в СССР за 1951—1970 гг. Год Урожайность Год Урожайность 1951 7,4 1961 10,7 1952 8,6 1962 10,9 1953 7,8 1963 8,3 1954 7,7 1964 Н,4 1955 8,4 1965 9,5 1956 9,9 1966 13,7 1957 8,4 1967 12,1 1958 11,1 1968 14,0 1959 10,4 1969 13,2 I960 10,9 1970 15,6 Построить линейный тренд. Решение. Методом наименьших квадратов находим /г(0 = 6,97 + 0,34(г —1950), где /— год наблюдения. На рис. 17.1 изображен график урожайности и линейный тренд. Видно, что в поведении остатков (отклонений от тренда) не проявляется какой-либо закономерности, и их можно считать чисто слу- чайными.
Глава 17. Элементы анализа временных рядов 375 Рис. 17.1 Задача 2. В таблице представлены данные о производстве молока (тыс. т) в России с января 1992 г. по октябрь 1996 г. (рис. 17.2). Месяц/год 1992 1993 1994 1995 1996 Январь 2015 1759 1510 1172 1038 Февраль 2123 1773 1484 1226 1104 Март 2624 2361 1988 1651 1439 Апрель 2891 2649 2211 1859 1521 Май 3335 3203 2559 2392 1827 Июнь 4071 3936 3209 2864 2446 Июль 4040 3861 3204 2714 2369 Август 3392 3321 2687 2420 2081 Сентябрь 2467 2438 2031 1925 1577 Октябрь 2092 1760 1506 1338 1081 Ноябрь 1494 1299 1050 984 Декабрь 1562 1345 1054 1020
376 ЧАСТЬ II. Математическая статистика Месяц Рис. 17.2 Построить линейный тренд, вычислить сезонные индексы по данным 1992-1995 гг. Сделать прогноз на 1996 г. и сравнить его с реальными данными. Решение. Методом наименьших квадратов получаем tr(t) = 2899,9 -26,64/, где t — номер месяца (от 1 до 58). Производство молока имеет тенденцию к уменьшению, обу- словленную сокращением поголовья молочного скота, и под- вержено сильным сезонным колебаниям с максимумом летом и минимумом зимой. При этом величина сезонных колебаний пропорциональна среднему уровню производства. Вычислим значения выразим их в процентах, а затем усредним для каждого месяца за 1992—1995 гг., и таким образом получим сезонные индексы. Месяц/год 1992 1993 1994 1995 Сезонный индекс (среднее) Январь 70,13 68,88 67,59 61,22 66,96 Февраль 74,58 70,16 67,23 64,95 69,23 Март 93,05 94,43 91,16 88,71 91,84
Глава 17. Элементы анализа временных рядов 377 Окончание табл. Месяц/год 1992 1993 1994 1995 Сезонный индекс (среднее) Апрель 103,50 107,09 102,64 101,34 103,64 Май 120,54 130,89 120,29 132,32 126,01 Июнь 148,57 162,62 152,75 160,80 156,18 Июль 148,89 161,29 154,47 154,69 154,83 Август 126,25 140,30 131,23 140,06 134,46 Сентябрь 92,74 104,17 100,50 113,16 102,64 Октябрь 79,44 76,06 75,52 79,90 77,73 Ноябрь 57,31 56,79 53,37 59,71 56,80 Декабрь 60,54 59,49 54,30 62,91 59,31 Теперь, чтобы построить прогноз для какого-либо меся- ца последующих лет, надо умножить значение, получаемое из тренда, на соответствующий сезонный индекс. Для 1996 г. по- лучаем таблицу (результаты округлены до целых). Месяц Тренд на 1996 г. Прогноз на 1996 г. Реальные данные Январь 1595 1068 1038 Февраль 1568 1085 1104 Март 1541 1415 1439 Апрель 1515 1569 1521 Май 1488 1875 1827 Июнь 1461 2282 2446 Июль 1435 2221 2369 Август 1408 1893 2081 Сентябрь 1381 1418 1577 Октябрь 1355 1053 1081 Приведенные данные свидетельствуют о хорошем согласии прогноза с реальными данными в первые 5 месяцев — относи- тельная погрешность не превышает 3%. В последующие 4 ме- сяца прогноз ниже реальных данных на 6—10%. Относительная ошибка за октябрь не превышает 3%. Заметим, что наибольшие
378 ЧАСТЬ II. Математическая статистика различия прогноза с реальными данными наблюдаются в лет- ние месяцы, сезонный индекс которых подвержен наибольшим колебаниям. Эти колебания из года в год имеют порядок 10— 20%. С учетом этого можно признать в целом хорошее согласие прогноза с реальными данными. Задача 3. Годовые прибыли фирмы (тыс. долл.) за 5 лет представлены в таблице: Год 1 2 3 4 5 Прибыль 99 112 120 135 144 Построить экспоненциальный тренд и сделать прогноз на следующий год. Решение. Построим временной ряд из логарифмов y(t) = = In x(t): Год, / 1 2 3 4 5 Х0 4,60 4,72 4,79 4,91 4,97 Проведя линейную регрессию, получаем линейный тренд: try(t) = 4,52 + 0,09/. Возвращаясь к исходным величинам, получаем trx (/) = ехр(4,52 + 0,09/). В качестве прогноза на следующий год имеем /гх(6)« 157,6 (тыс. долл.). 17.3. Стационарность. Автокорреляция. Периодограмма Временной ряд можно рассматривать как последователь- ность наблюдений некоторого случайного процесса %(/), / > 0, в целочисленные моменты времени. Случайный процесс А"(/) называется стационарным в узком смысле, если для любого s > 0 и любых 0 < /, < /2 < ... < /л рас- пределение многомерного вектора (X(t{), X(t2), ..., X(tn)) совпа- дает с распределением вектора (Д/, + 5), X(t2 + 5), ..., X(tn + 5)). Таким образом, стационарный в узком смысле случайный процесс ведет себя с любого момента так же (в статистиче-
Глава 17. Элементы анализа временных рядов 379 ском смысле), как и с начала. Однако проверить это условие на практике бывает затруднительно. Определим характеристики случайного процесса: функцию математического ожидания m(t) = MX(t) и ковариационную функ- цию B(t, s) = cov(X(t), X(s)), t, s > 0. Отсюда можем выразить дисперсию DX(t) = B(t, t) и среднее квадратическое отклонение о(/) = •jDX(t) = ^B(t, t). Корреляционной функцией называется R(t, s) = B(t, • a(s)). Случайный процесс X(t) называется стационарным в широком смысле, если для него m(f) = const и B(tt + s, t2+ s) = B(tt, t2) любых /|2, 5 > 0. Это условие уже проще проверить статисти- ческими Методами. Из него также следует, что /?(.' + s, t2 + s) = - R(tt, t2) для любых ti2, s > 0. Автокорреляционной функцией стационарного случайного про- цесса называется функция г(г) = R(s, s + t), где s > 0 — любое. Пример 1. Пусть X(t) = ^cos(w/ + <р), где w > 0 — число, £ е МО, 1), а <р равномерно распределено от 0 до 2л, и эти слу- чайные величины независимы. Данный процесс стационарен как в широком, так и в узком смысле, причем r(r) = cos(wt). Действительно, поскольку Л/i; = 0 и = 1, то m(f) = 0 и B(tt,t2) = MX(QX(J2) = М{% cos(wt, + ф)со5(н'/, + ф)} = = [cosCmT, +«)cos(Htf2 + и)— = о 2л = у j{cos(w(f, - Л)) + cos(w(A +12) + 2“)l^ = 1 1 I2" 1 = -cos(w(tj -t2))+—sinMt, +/j) + 2«)| =-cos(w(t1 -t2)), 2 4л |0 2 так что B(t{ + s, t2+ s) = B(t{, t2) для любых tl2, s > 0. Кроме того, ст(0 = y/B(t,t) = \/Jl и R(t{, t2) = 2B(tt, t2) = cos(h’(Z1 - t2)), откуда следует r(i) = cos(wr). В случае временных рядов имеем дело с автокорреляци- онной функцией от целых чисел, т.е. г(к). Ее можно оценить статистически следующим образом.
380 ЧАСТЬ II. Математическая статистика Выборочной автокорреляционной функцией называют п-к 52(х,. -х)(х,.+* -х) /•=1 Этой формулой имеет смысл пользоваться только при до- статочно больших размерах п (не менее 50). Отметим, что точ- ность приближения снижается с ростом Л, поэтому на прак- тике обычно ограничиваются изучением ограниченного числа первых значений г(к) (как правило, не более и/4). Кроме того, полученная оценка оказывается смещенной (со смещением по- рядка 1/и). График выборочной автокорреляционной функции называ- ют коррелограммой. Построение коррелограммы для реальных временных рядов может давать различные результаты. Если все значения выборочной автокорреляционной функ- ции достаточно велики и испытывают слабую тенденцию к убыванию, это может свидетельствовать о наличии тренда (или общей нестационарное™ ряда). Если после удаления тренда и анализа остатков получаем коррелограмму, похожую на график периодической функции, это может свидетельствовать о наличии одной сезонной (ци- клической) компоненты с соответствующим периодом. Если после удаления тренда и сезонной компоненты корре- лограмма имеет хаотический характер, причем значения выбо- рочной автокорреляционной функции малы и попадают (все или почти все) в 95%-ный доверительный интервал -l/n±2/\fn , это свидетельствует о том, что остатки можно считать за «белый шум» (последовательность независимых одинаково распреде- ленных случайных величин). Некоторые другие случаи поведения коррелограмм будут рассмотрены в следующем параграфе. Бывают ситуации, когда временные ряды содержат несколь- ко циклических компонент с разными периодами, которые на- кладываются одна на другую и создают сложную картину. Для их анализа можно применить следующий метод, предложенный А. Шустером в 1898 г. Введем функции
(лава 17. Элементы анализа временных рядов 381 J(X) = 2^^C0S^ B(k) = -^xksin—, S2(k) = A2(X) + B2(k). п к=\ п к=\ График функции ^(Х) называют периодограммой. Построенная функция должна принимать большие зна- чения (иметь локальные максимумы — пики) для тех значе- ний X, которые являются периодами имеющихся у временного ряда циклических составляющих. На практике, в силу наличия случайности временного ряда, это не всегда так, и некоторые максимумы могут не иметь отношения к реальным периодам. Поэтому к анализу периодограммы следует подходить с осто- рожностью. В настоящее время разработаны также другие, бо- лее точные и более сложные методы. 17.4. Модели авторегрессии и скользящего среднего До сих пор предполагалось, что случайная компонента вре- менного ряда представляет собой «белый шум» (последова- тельность независимых одинаково распределенных случайных величин). Однако на практике это может оказаться не так, и величины могут быть зависимы. Эта зависимость может воз- никать и в результате каких-то преобразований ряда, что также необходимо учитывать. Для описания этих явлений использу- ются, в частности, следующие модели. Процессом скользящего среднего порядка q называется про- цесс вида ад=^+ел,_,+...+ол_«, где 0t — некоторые коэффициенты, а образуют последова- тельность независимых одинаково распределенных случайных величин. Определенный таким образом процесс всегда является стационарным. В коррелограмме процесса скользящего среднего достаточ- но велики только значения г (к) при к от 1 до q (те, для кото- рых коэффициенты 0t отличны от нуля), а остальные малы и хаотичны. Процессом авторегрессии порядка q называется процесс вида X(k) = yxX(k-\)+-+qpX(k-q) + t:k ,
382 ЧАСТЬ II. Математическая статистика где ф* — некоторые коэффициенты, а образуют последова- тельность независимых одинаково распределенных случайных величин. Такой процесс является стационарным только при дополнительном условии: все корни характеристического урав- нения 1₽=ФЛ'’-1+-+Фр должны быть по модулю меньше единицы. Коррелограмма процесса авторегрессии имеет вид экспонен- циального убывания или затухающих колебаний (при р > 1). В простейшем случае, при р = 1, автокорреляционная функ- ция представляет собой просто геометрическую прогрессию: г(Л) = ф*. Как правило, рассматриваются процессы скользящего сред- него и авторегрессии небольших порядков (первого или вто- рого). В случае, когда применяется модель авторегрессии первого порядка, т.е. ад=Фда-1)+^, можно также провести линейную регрессию Х(к) по Х(к — 1). Пример 2. Временной ряд описывает значения выхода 70 последовательных партий продукта в химическом производ- ственном процессе (данные расположены по столбцам). 47 71 51 50 48 38 68 64 35 57 71 55 59 38 23 57 50 56 45 55 50 71 40 60 74 57 41 60 38 58 45 50 50 53 39 64 44 57 58 62 49 59 55 80 50 45 44 34 40 41 55 45 54 64 35 57 59 37 25 36 43 54 54 48 74 59 54 52 45 23
Глава 17. Элементы анализа временных рядов 383 Выборочное среднее значение выхода продукции составляет 51,13 единицы, а выборочное среднее квадратическое отклоне- ние — 11,91 единицы. Тренд и циклические компоненты от- сутствуют. Видно, что в ряду имеется отчетливая тенденция к чере- дованию «вверх-вниз», однако невозможно предсказать точно выход следующей партии. Проведем линейную регрессию Х(к) по Х(к - 1). Результат представлен на рисунке 17.3. Рис. 17.3 В качестве оценки коэффициента cpj (как автокорреляции) получаем ср, ^-0,4. Подобная отрицательная зависимость ча- сто наблюдается в данных о выпуске продукции и является следствием эффекта «переноса». В данном примере высокий выход цикла производства приводил к получению дегтярных остатков, которые не полностью устранялись из емкости и от- рицательно влияли на выход следующего цикла.
384 ЧАСТЬ II. Математическая статистика Задачи для самостоятельного решения 1. В таблице представлены данные по объемам продаж товаров на оптовом рынке Кировской области за 2002—2003 гг. (тыс. руб.) (рис. 17.4). Месяц Год 2002 2003 Январь 2174 3174 Февраль 2078 3570 Март 2608 3788 Апрель 2701 3694 Май 2834 3421 Июнь 2852 3522 Июль 2840 4056 Август 3033 4338 Сентябрь 2895 4312 Октябрь 3244 4693 Ноябрь 3133 4621 Декабрь 3126 4746 Построить экспоненциальный тренд. Насколько хорошо он приближает данные? Построить прогноз на 2004 г. Месяц Рис. 17.4
Глава 17. Элементы анализа временных рядов 385 2. В таблице представлены данные по продажам, мороженого «Пломбир» фирмой в Нижнем Новгороде за два года (руб./день) (рис. 17.5) Месяц Объем продаж Месяц Объем продаж Июль 8174,40 Июль 8991,84 Август 5078,33 Август 5586,16 Сентябрь 4507,20 Сентябрь 4957,92 Октябрь 2257,19 Октябрь 2482,91 Ноябрь 3400,69 Ноябрь 3740,76 Декабрь 2968,71 Декабрь 3265,58 Январь 2147,14 Январь 2361,85 Февраль 1325,56 Февраль 1458,12 Март 2290,95 Март 2520,05 Апрель 2953,34 Апрель 3248,67 Май 4216,28 Май 4637,91 Июнь 8227,57 Июнь 9050,33 Построить линейный тренд и вычислить сезонные индексы. Построить прогноз на следующий год. 10 000 а» Продажи мороженого «Пломбир» 9000 8000 - 7000 - 6000 5000 - 4000 3000 - 2000 - 1000 0 2 4 6 8 10 12 14 16 18 20 22 24 26 Месяц * s ф Рис. 17.5
386 ЧАСТЬ II. Математическая статистика 3. В таблице представлены данные по розничной торговле бензи- ном в США в 1991—1995 гг. (млн долл.) (рис. 17.6). Месяц 1991 1992 1993 1994 1995 Январь 11 297 10 508 10 839 10 966 И 981 Февраль 10 064 10 071 10 498 10 652 11 443 Март 10 883 10 725 11 476 11 800 12 790 Апрель 11 052 10 885 11 684 11 842 12 701 Май 11 960 11 836 12 346 12 491 13 937 Июнь 11 846 11 874 12 291 12 835 14 210 Июль 12 091 12 225 12 638 13 207 14 013 Август 12 406 12 218 12 418 13 710 14 186 Сентябрь 11 350 11 569 11 679 12 854 13 213 Октябрь 11 678 12 002 12 237 12 983 13 190 Ноябрь 11 360 11 418 11 806 12 647 12 650 Декабрь 11 308 11 619 11 785 12 880 12 931 Построить линейный тренд и вычислить сезонные индексы. 4. В таблице представлены данные по месячным перевозкам пас- сажиров на международных авиалиниях в 1954-1958 гг. (тыс. чел.) (рис. 17.7).
Глава 17. Элементы анализа временных рядов 387 Месяц 1954 1955 1956 1957 1958 Январь 204 242 284 315 340 Февраль 188 233 277 301 318 Март 235 267 317 356 362 Апрель 227 269 313 348 348 Май 234 270 318 355 363 Июнь 264 315 374 422 435 Июль 302 364 413 465 491 1 Август 293 347 405 467 505 1 Сентябрь 259 312 355 404 404 Октябрь 229 274 306 347 359 Ноябрь 203 237 271 305 310 Декабрь 229 278 306 336 337 Построить экспоненциальный тренд и вычислить сезонные ин- дексы. Перевозки пассажиров на международных авиалиниях Рис. 17.7 5. В таблице представлены данные о производстве электроэнергии в России за 1998—2003 гг. Год 1998 1999 2000 2001 2002 2003 Производство, млрд кВт ч 827 846 878 891 891 915 Построить экспоненциальный тренд и сделать прогноз на 2004 г.
Глава 18 ЭЛЕМЕНТЫ ЛИНЕЙНОГО РЕГРЕССИОННОГО И КОРРЕЛЯЦИОННОГО АНАЛИЗА 18л. Функциональная, статистическая и корреляционная зависимости Для описания, анализа и прогнозирования явлений и про- цессов в экономике применяют математические модели в фор- ме уравнений или функций. Модели экономического объекта, отражая основные его свойства и абстрагируясь от второсте- пенных, позволяют судить о его поведении в определенных условиях. Одной из основных задач математической статистики явля- ется исследование зависимости между двумя или несколькими переменными. Две переменные X и Y могут быть независи- мыми или связанными функциональной либо статистической зависимостью. Строгая функциональная зависимость реализу- ется редко, так как хотя бы одна из переменных подвержена случайным факторам. Статистической зависимостью называется такая зависимость, при которой изменение одной из величин влечет за собой из- менение распределения другой. Если при изменении одной из величин изменяется среднее значение другой, то в этом случае статистическая зависимость
Глава 18. Элементы линейного регрессионного и корреляционного анализа 389 является корреляционной. Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным ма- тематическим ожиданием другой. Основная цель изучения зависимостей между случайными величинами заключается в прогнозировании с данной вероят- ностью области значений одной случайной величины на ос- новании наблюдаемых значений другой случайной величины. На практике при исследовании зависимости между слу- чайными величинами X и Y часто ограничиваются исследо- ванием зависимости между X и условным математическим ожиданием Y. Напомним, что зависимости такого рода называются регрес- сионными зависимостями. Функцию <p(x) = jyp(y|x)Jy = Af(y|Ar = x) называют функцией регрессии первого рода (или модельной функцией регрессии) Y по X, а ее график — линией регрессии Y на X (см. § 7.4). Аналогично функцию V(y) = jxp(x\y)dx = M(X\Y = y) называют функцией регрессии X по Y. Например, уравнение регрессии К по X двумерной случай- ной величины (X, У), распределенной по нормальному закону, имеет вид - ст <р(х) = А>,+г—(Х~ах), °х т.е. функция является линейной и график ее имеет вид пря- мой линии, проходящей через центр распределения С(ах, ау). Аналогично линией регрессии % по Y будет прямая V(y) = flx +г—(У-а>). Уравнение регрессии у = ср(х) делает возможными точечные предсказания значений условных математических ожиданий составляющей Yдвумерной случайной величины (X, Y) по зна-
390 ЧАСТЬ II. Математическая статистика чению составляющей X = х. Однако для такого прогноза не- обходимо знать закон распределения двумерной случайной ве- личины (X, Y), который на практике, как правило, неизвестен. Поэтому исследование зависимости случайной величины от ряда неслучайных и случайных величин приводит к моде- лям регрессии на базе выборочных данных. В качестве оценок условных математических ожиданий принимаются условные средние, которые находятся по данным выборки (х., у.), i = 1, 2, ..., п, объема п. Условным средним ^называется среднее арифметическое наблюдавшихся значений у, соответствующих значению X = х. Например, если при х = 2 величина у принимает значения .. Л п ~ 5 + 6 + 10 + 8 29 у, = 5, у2 - 6, у, = 10, у4 ---- й, тома ух =---= —. Условным средним ху называется среднее арифметическое наблюдавшихся значений X, соответствующих У = у. Если результаты выборки представить в виде точек (х., у.), / = 1, 2, п, в декартовой системе координат, то получим точеч- ную диаграмму, называемую корреляционном полем (рис. 18.1.). Оценку функции регрессии называют эмпирической регрес- сией, или функцией регрессии второго рода. Поскольку функ- ции регрессии обладают свойством минимальности, т.е. среднее квадратическое отклонение случайной величины У от функции <р(х) является наименьшим, то для нахождения эмпирических уравнений регрессии у = <р(х, а, ..., с) применяется метод наи- меньших квадратов (см. § 13.3). Регрессионный анализ — это анализ функций регрессии первого и второго рода. Перед проведением регрессионного анализа необходимо по статистическим данным выбрать об-
Глава 18. Элементы линейного регрессионного и корреляционного анализа 391 ший вид эмпирической функции регрессии. На практике ча- сто считают, что функция регрессии — это линейная функция: у = Ьх + а, где b — коэффициент регрессии у на х. Проверка этой гипотезы основывается на результатах оценки коэффици- ента корреляции. Если установлено, что зависимость между некоторыми на- блюдаемыми величинами существует, то на практике важно знать, какая она: сильная или слабая, положительная или от- рицательная. Для выяснения этих обстоятельств используется корреляционный анализ. Корреляционный анализ — это анализ оценок коэффици- ента корреляции. Он позволяет ответить на вопрос, существует ли линейная функциональная зависимость между случайными величинами X и У, и позволяет измерить степень близости ста- тистической зависимости к функциональной. 18.2. Регрессионные модели как инструмент анализа и прогнозирования экономических явлений В случае применения регрессионных моделей результат действия экономической системы или объекта в виде одного или нескольких выходных показателей можно представить как функцию влияющих на него факторов. Некоторые из них ока- зывают существенное влияние на результат, другие — весьма незначительное. Как правило, существенных факторов мало, в то время как несущественных — достаточно много, поэтому пренебрегать полностью ими нельзя. К числу основных факторов при изучении экономического объекта обычно относятся настоящий труд (или трудовые ресур- сы) и прошлый труд (энергия, сырье, материалы, оборудование, здания, сооружения и т.д.). Вместе с тем труд прилагается при определенном состоянии внешней среды, т.е. при определенных экономических и природных условиях. Поэтому соответствую- щие факторы также должны найти отражение в модели. В процессе производства и распределения продукции имеют место массовые многократно повторяющиеся события. Несмотря на развитие экономики и ее отдельных частей, на протяжении относительно небольших временных периодов и в пределах от- дельных экономических подсистем имеет место стабильность в
392 ЧАСТЬ II. Математическая статистика условиях совершения массовых событий. Так, прежде всего в процессе прогнозирования подразумевается возможность много- кратного повторения производственной ситуации, при наличии других существенных и несущественных факторов, однако при относительно стабильном комплексе внешних условий. Таким образом, приходим к следующей теоретико-вероят- ностной схеме. Результирующий показатель у является функ- цией существенных (хр хг, ..., xt) и несущественных факторов (Ер е2, ..., £„): у = Дхр хк, ер ..., е„). Несмотря на инертность поведения экономических систем, особенно больших, возможно их резкое изменение в связи с достижениями научно-технического прогресса. В новых усло- виях, вообще говоря, следует рассматривать другую функцию. Однако исходя из предположения эволюторности поведения экономической системы на относительно небольшом времен- ном интервале и при сравнительно малых изменениях пере- менных в принципе с помощью полиномов можно с высокой степенью приближения описать любую эволюторную функцию. В случае же невозможности линеаризировать функцию (разла- гая в ряд или преобразуя ее) при небольшом числе коэффици- ентов используют методы нелинейного оценивания. Линейная регрессия двух переменных и ее различные эко- номические приложения более подробно разобраны в § 13.3. 18.3. Выборочные коэффициенты корреляции Основными характеристиками, описывающими степень свя- зи между составляющими Хи У двумерной случайной величины (X, У) являются ковариация cov(X, У) = цху =А/(Х-ах)(У-ау) и коэффициент корреляции р = , который является мерой линейной зависимости между X и У Так как в случае статистических данных закон распределе- ния двумерной случайной величины неизвестен, для оценки тесноты связи применяется эмпирическая (или выборочная) ковариация =—^T(xz-х)(у,-у) и эмпирический (или вы- fl /=1 борочный) коэффициент корреляции.
Глава 18. Элементы линейного регрессионного и корреляционного анализа 393 Выборочным коэффициентом корреляции для выборки вида (хр у,), (х2, у2), ..., (хп, ул) называется выборочная характери- стика ^Ъ-хУ^-у) Гху ~ i =l -^)2Х(У, -у)2 V /=1 /=1 Выборочный коэффициент корреляции может принимать значения от -1 до +1. Он сходится к теоретическому коэффи- циенту корреляции соответствующих случайных величин, если тот существует. По абсолютной величине и знаку коэффициен- та можно судить о степени зависимости (сильная или слабая) и характере (положительная или отрицательная). Выборочный коэффициент корреляции обычно используется в предположении нормального закона распределения данных (нор- мальность данных). Как известно, в этом случае из равенства нулю теоретического коэффициента р следует независимость случайных величин (в более общем случае это неверно). В случае нормально- го распределения можно проверить гипотезу р = 0. Пусть т г^/п-2 71 - г2 Если гипотеза р = 0 верна, то Т имеет распределение Стьюдента с п — 2 степенями свободы. При уровне значимо- сти а выберем критическую точку Z = /кр(а; п — 2) для дву- сторонней области. Если |7] < гкр, гипотеза р = 0 принимается, иначе — отвергается. В случае, когда нормальность данных нарушается, приме- нение выборочного коэффициента корреляции может вести к ошибкам: либо «не заметим» зависимость между величинами, либо получим ложную корреляцию. Существуют коэффициен- ты и методы, свободные от предположения о нормальности. Наблюдения всегда можно упорядочить по возрастанию какой- либо переменной (х или у). Рангом наблюдения называется его но- мер в таком ряду. Если какое-то значение переменной встречается несколько раз, ему приписывается средний ранг. Обозначим ранги наблюдений по возрастанию х и у через г и s.соответственно. Пусть
ЧАСТЬ II. Математическая статистика Выборочным коэффициентом ранговой корреляции Спирмена называется величина Этот коэффициент также может принимать значения от —1 до +1. Аналогичным образом он отражает силу и характер зави- симости между величинами. Для проверки гипотезы о незави- симости случайных величин существуют специальные таблицы критических точек. Однако при больших п можно проверять гипотезу так же, как для обычного выборочного коэффициента корреляции. Заметим, что с помощью коэффициента Спирмена можно анализировать и ситуации, когда некоторый признак объекта («качество», «привлекательность» и т.п.) нельзя строго выразить численно, но можно упорядочить объекты по его возрастанию или убыванию, т.е. проранжировать их. Задача 1. В табл. 18.1 представлены средние цены на расти- тельное масло и сахар-песок в 12 городах Центрального района России на июнь 1996 г. (руб.) (рис. 18.2). Таблица 18.1 Город Цена на масло Цена на сахар Брянск 7726 3410 Владимир 7880 3183 Иваново 6182 3209 Калуга 8237 3400 Кострома 8750 3600 Москва 11 024 4418 Орел 8456 3634 Рязань 9172 4033 Смоленск 8320 3909 Тверь 7083 3416 Тула 8259 3486 Ярославль 7991 3938
Глава 18. Элементы линейного регрессионного и корреляционного анализа 395 4600 4400 ко 4200 | 4000 | 3800 | 3600 3400 3200 3000 5000 6000 7000 8000 9000 10000 11000 Цены на масло и сахар в городах Центральной России Цены на масло, руб. Рис. 18.2 Вычислить выборочный коэффициент корреляции между ценами на растительное масло и сахар. Проверить нулевую ги- потезу на уровне значимости а = 0,1. Решение. Для проверки нулевой гипотезы вычисляем вы- борочный коэффициент корреляции, равный г = 0,82, и на- _ „ 0,82л/10 . .. _ блюдаемое значение статистики Т = -----= »4,53. Из табли- Vl-0,822 цы распределения Стьюдента по заданному уровню значимости а = 0,1 и числу степеней свободы п = 10 находим критическую точку /кр(0,1; 10) = 1.81. Поскольку ITl > tKp, нулевая гипотеза отвергается. Связь между ценами на растительное масло и са- хар оказывается довольно сильной и положительной. Задача 2. Два эксперта проранжировали 11 фирм в порядке их привлекательности для инвестиций. Получены следующие последовательности рангов фирм: Г. 1 1 2 3 4 5 6 7 8 9 10 11 s. 1 2 3 5 4 9 8 11 6 7 10 Проверить с помощью коэффициента Спирмена, насколько согласуются мнения экспертов. Проверить нулевую гипотезу на уровне значимости а = 0,05.
396 ЧАСТЬ II. Математическая статистика Решение. Вычисляем 5= 12+ 12+ З2 + 12+ З2 + З2 + З2 + 12 = = 40, отсюда rs =1--^0,82. Для проверки нулевой гипо- О 82^9 тезы вычисляем Т = -^==^4,29 и из таблицы распределе- ния Стьюдента по заданному уровню значимости а = 0,05 и числу степеней свободы п = 9 находим критическую точку /кр(0,05; 9) = 2,26. Поскольку |Т| > ZKp нулевая гипотеза от- вергается. Мнения экспертов достаточно хорошо согласуются между собой. Задачи для самостоятельного решения 1. В табл. 18.2 представлены средние цены на растительное масло, сахар-песок, говядину и белый хлеб высшего сорта в 12 городах Центрального района России на июнь 1996 г. (руб.): Таблица 18.2 Город Цена на масло Цена на сахар Цена на говядину Цена на хлеб Брянск 7726 3410 12 500 4875 Владимир 7880 3183 13 857 7125 Иваново 6182 3209 14 150 4998 Калуга 8237 3400 12 697 5170 Кострома 8750 3600 13 000 5476 Москва И 024 4418 14 120 6466 Орел 8456 3634 10 678 4200 Рязань 9172 4033 12 163 4720 Смоленск 8320 3909 12 833 4354 Тверь 7083 3416 14 400 5440 Тула 8259 3486 12 083 5140 Ярославль 7991 3938 14 397 5283
Глава 18. Элементы линейного регрессионного и корреляционного анализа 397 Вычислить выборочные коэффициенты корреляции между це- нами: а) на масло и говядину; б) масло и хлеб; в) сахар и говядину; г) сахар и хлеб; д) говядину и хлеб. В каждом случае проверить нулевую гипотезу на уровне значи- мости 0,05. Сделать вывод о зависимости цен. 2. Решить предыдущую задачу, вычислив выборочные коэффици- енты ранговой корреляции Спирмена для цен на товары. 3. Два эксперта проранжировали 9 проектов реорганизации фирмы по их предполагаемой эффективности. Получены следующие последовательности рангов. г. 1 2 3 4 5 6 7 8 9 si 4 1 5 3 2 6 9 8 7 Проверить с помощью коэффициента Спирмена, насколько со- гласуются мнения экспертов. Проверить нулевую гипотезу на уровне значимости а = 0,1. 4. В таблице представлены данные о производстве всех зерновых культур и производстве пшеницы в России за 1996—2002 гг. Год 1996 1997 1998 1999 2000 2001 2002 Производство зерновых, млн т 69,3 88,6 47,9 54,7 65,5 85,2 86,6 Производство пшеницы, млн т 34,9 44,3 27,0 31,0 34,5 47,0 57,7 Вычислить выборочный коэффициент корреляции и выбо- рочный коэффициент ранговой корреляции Спирмена между показателями. 5. В табл. 18.3 представлены данные о годовых доходах и расходах на личное потребление для 10 семей (долл.).
398 ЧАСТЬ II. Математическая статистика Таблица 18.3 Годовой доход Расходы на личное потребление 2508 2406 2572 2464 2408 2336 2522 2281 2700 2641 2531 2385 2390 2297 2595 2416 2524 2460 2685 2448 Вычислить выборочный коэффициент корреляции и выбо- рочный коэффициент ранговой корреляции Спирмена между показателями.
ГЛАВА 19 ЭЛЕМЕНТЫ ДИСПЕРСИОННОГО АНАЛИЗА 19.1. Основные понятия и определения Предположим, что имеется £ выборок с объемами nv п2,пк, N = л, + п2 + ... + пк, и наблюдения можно представить в виде xtj = cl + £., где i — номер наблюдения в выборке; j — номер выборки; cl — групповые математические ожидания; е/; — слу- чайные ошибки с Мг^ = 0, о которых предполагается, что они независимы и одинаково распределены. Подобная ситуация возникает, когда существует некий фак- тор, принимающий к различных значений (называемых уров- нями), и каждая группа объектов, чьи признаки мы измеряем, подвергается воздействию определенного уровня этого фактора. Методы математической статистики, изучающие воздействие одного фактора на объекты и их признаки, называют в сово- купности однофакторным анализом. Предположим, что ошибки нормально распределены: £(> е N(Q, о2). Тогда можно изучать влияние фактора, вычисляя дисперсии некоторых величин. Совокупность этих методов на- зывают однофакторным дисперсионным анализом. Основной гипотезой, нуждающейся в проверке, является ги- потеза о равенстве групповых средних — Но: ах= а2 = ... = ак. Иными словами, проверяют гипотезу о том, что фактор во- обще не влияет на наблюдения. В случае нормальных ошибок
400 ЧАСТЬ II. Математическая статистика ее можно проверить, вычислив две разные оценки дисперсии ст2, а именно: 2* 1 V’V'/ \2 . 2** 1 V1 Л —\2 где через х обозначены групповые выборочные средние. Первую величину называют остаточной дисперсией, а вторую — факторной. При нарушении гипотезы Но оценка ст2** имеет тенденцию к возрастанию, тем большему, чем больше отклонение от Яо. Проверить гипотезу можно с помощью уже знакомого нам дис- персионного отношения Фишера: F = ct2**/ct2*, которое должно иметь распределение Фишера с к — 1 и N — к степенями свобо- ды. При заданном уровне значимости а можно найти критиче- скую точку — Гкр(а; к — 1; N — к). Если F < F , то нулевая гипотеза принимается, иначе отвергается. Заметим, что если F < 1, то следует сразу принять гипотезу Но, поскольку F всегда больше единицы. Если гипотеза о равенстве средних не подтверждается, име- ет смысл оценивать величины по отдельности. Получаем для них следующие доверительные интервалы (с надежностью у): « « СТ л <5 х., —-=t < а, < X', + —f=t , Jnj JHj где / — критическая точка распределения Стьюдента с N — к степенями свободы и уровнем значимости a = 1 - у (для дву- сторонней области): г = гкр(1 — у; N - к). Существуют и более сложные методы однофакторного ана- лиза, не требующие предположения о нормальности наблюде- ний. Однако здесь будем придерживаться классического дис- персионного анализа. Задача 1. Банк имеет по четыре отделения в трех горо- дах. Текущие объемы денежных вкладов (в условных единицах) представлены в следующей таблице: Отделение Город 1 2 3 1 38 20 21 2 36 24 22 3 35 26 31 4 31 30 34
[лава 19. Элементы дисперсионного анализа 401 Можно ли утверждать на уровне значимости а = 0,05, что в среднем дела идут одинаково хорошо во всех трех городах? Построить доверительные интервалы для средних по городам с надежностью 90%. Решение. Вычисляем групповые средние хи = 35, х>2 = 25, х.з = 27 и общее среднее х = 29. Затем вычисляем оценки дисперсий: ст2’* = 112, ст2” « 22,67. Получаем F«4,94. По та- блице находим критическую точку: Гкр(0,05; 2; 9) = 4,26. Имеем F > F , следовательно, групповые средние различаются. Чтобы построить»доверительные интервалы, находим ст* « 4,76 и / = = ^(0,1; 9) = 1,83. Точность доверительных интервалов во всех группах составляет «4,36, отсюда 30,64 < ах< 39,36; 20,64 < а2< 29,36; 22,64 < а3< 31,36. Таким образом, лучше все- го дела идут в первом городе, с явным отрывом от двух других, где ситуация примерно одинакова (доверительные интервалы перекрываются). Задача 2. В цеху работает четыре бригады по семь рабочих. Выработка каждого (в условных единицах) представлена в сле- дующей таблице: Рабочий Бригада 1 2 3 4 1 51 52 56 54 2 59 58 56 58 3 53 66 58 62 4 59 69 58 64 5 63 70 70 66 6 69 72 74 67 7 72 74 78 69 Можно ли утверждать на уровне значимости а = 0,05, что все бригады работают в среднем одинаково? Решение. Вычисляем групповые средние хе1 = 60,9; х<2 = 65,9; х<3= 64,3; хи = 62,9 и общее среднее х = 63,5. Затем вычисляем оценки дисперсий: ст2*’ = 31,67; ст2’ « 60,25. Получаем F< 1, так что следует принять гипотезу о равенстве групповых сред- них. Все бригады работают в среднем одинаково. 14- Теория вероятностей
402 ЧАСТЬ II. Математическая статистика Задачи для самостоятельного решения 1. Фирма имеет по пять филиалов в четырех регионах страны. Прибыли за отчетный период (в условных единицах) представ- лены в таблице: Филиал Регион 1 2 3 4 1 36 56 52 39 2 47 61 57 57 3 50 64 59 63 4 58 66 58 61 5 67 66 79 65 Можно ли утверждать на уровне значимости а = 0,05, что дела во всех регионах идут в среднем одинаково? 2. Фирма имеет 13 магазинов в трех округах Москвы: 4 — в Северном округе, 6 — в Южном, 3 — в Восточном. Объемы продаж за отчетный период (в условных единицах) по каждому магазину представлены в таблице: Филиал Регион Северный округ Южный округ Восточный округ 1 37 60 69 2 47 86 100 3 40 67 98 4 60 92 5 95 6 98 Можно ли утверждать на уровне значимости а = 0,01, что про- дажи во всех округах идут в среднем одинаково? Построить доверительные интервалы для средних по регионам с надеж- ностью 95%. 3. В целях изучения влияния материального вознаграждения на производительность труда проведено обследование четырех групп рабочих по 5 человек, упорядоченных по величине воз- награждения (от меньшей к большей). Выработка (в условных единицах) представлена в таблице:
Глава 19. Элементы дисперсионного анализа 403 Рабочий Группа 1 2 3 4 1 8 12 12 24 2 10 17 15 16 3 16 14 16 22 4 13 9 16 18 5 12 16 19 20 Можно ли утверждать на уровне значимости а = 0,05, что возна- граждение влияет на производительность труда? Построить дове- рительные интервалы для средних по группам с надежностью 90%. 4. В продуктовом магазине продается четыре вида соков - яблочный, апельсиновый, персиковый и ананасовый (за одну цену). Данные о продажах за пять рабочих дней представлены в таблице (л): День Сок яблочный апельсиновый персиковый ананасовый 1 18 28 26 20 2 24 31 28 29 3 ’ 25 32 30 32 4 29 33 29 30 5 34 33 40 33 Можно ли утверждать на уровне значимости а - 0,05, что спрос на разные виды соков в среднем одинаковый? 5. Изучается популярность еженедельной передачи у трех возраст- ных групп населения. Рейтинги, %, за 4 недели представлены в таблице: Неделя Группа молодежь средний возраст пожилые 1 27 24 22 2 23 20 21 3 29 26 36 4 29 30 37 Можно ли утверждать на уровне значимости а = 0,05, что пере- дача пользуется одинаковой популярностью у всех трех групп населения?
ПРИЛОЖЕНИЯ Приложение i i. Примеры вариантов контрольных и экзаменационных работ Контрольная работа № 1 по теории вероятностей. Случайные события Вариант 1 1. Основные правила комбинаторики. Сочетания, раз- мещения, перестановки. Разбиение множества на группы. Дискретное пространство элементарных исходов. Простые и сложные события. Классическое определение вероятности. 2. В урне 9 белых шаров, 7 красных и 4 черных. Найти вероятность достать (без возвращения) три шара, не все цвета которых одинаковы. 3. Два аудитора проверяют 8 фирм (по 4 фирмы каждый), у трех из которых имеются нарушения. Вероятность обнаружения нарушений первым аудитором равна 0,6, вторым — 0,9. Найти вероятность, что все фирмы-нарушители будут выявлены. 4. В цехе работают 7 мастеров и 3 ученика, производящие одинаковое число изделий. Мастер допускает брак в 1% случа- ев, а ученик — в 5% случаев. Изделие оказалось бракованным. Найти вероятность, что его сделал ученик. 5. Деталь является бракованной с вероятностью 2%. Сколько деталей надо взять, чтобы с вероятностью 99% среди них оказа- лась хотя бы одна бракованная? Найти наивероятнейшее число бракованных деталей в этом случае. Вариант 2 1. Сигма-алгебры и аксиомы вероятности. Доказать экви- валентность счетной аддитивности и непрерывности. Геомет- рическая вероятность. 2. В партии из 30 изделий 5 бракованных. Найти вероятность, что в случайной выборке из 10 изделий содержится не более одного бракованного.
Приложение 1. Примеры контрольных и экзаменационных работ 405 3. В одной коробке 4 красных шара и 6 синих, а во второй — 8 красных и 2 синих. Из первой во вторую переложили два шара, а затем извлекли из второй два шара без возвращения. Найти вероятность, что последние оказались одного цвета. 4. На заводе установлена система аварийной сигнализации, которая при наличии аварии срабатывает с вероятностью 99%. Однако в 0,2% случаев, когда аварии нет, сигнал также может возникнуть. Найти вероятность, что случилась авария, если сигнализация сработала. Вероятность аварии 0,007. 5. Страховой агент при каждом визите заключает договор с вероятностью 30%. При каком числе визитов наивероятнейшее число договоров будет равно 10? Вариант 3 1. Независимые испытания Бернулли. Формула Бернулли и неравенство для наивероятнейшего числа успехов (с доказа- тельствами). 2. Шесть клиентов обращаются в 3 фирмы равновероятно. Найти вероятность, что ровно в одну фирму обратятся 2 кли- ента. 3. Из продукции птицефабрики 75% яиц стандартные, 20% большего объема и 5% двухжелтковых. С какой вероятностью среди 3 случайно выбранных яиц окажутся хотя бы одно боль- шего объема и хотя бы одно двухжелтковое (вместе)? 4. К системному администратору обращаются за помощью пользователи. Среди них начинающих — 60%, опытных — 40%. Вероятность обращения начинающего пользователя — 85%, опытного — 15%. Найти вероятность, что очередной пользова- тель, обратившийся за помощью, окажется начинающим. 5. Стиральным порошком фирмы А пользуется 25% населе- ния. Сколько людей надо опросить, чтобы получить эту долю с точностью 0,05 с вероятностью 0,95? Вариант 4 1. Условная вероятность. Полная группа событий. Формула полной вероятности и формула Байеса (с доказательствами). 2. Студент в состоянии решить 20 задач из 25 в первом туре экзамена и 15 из 20 во втором. Найти вероятность сдачи им экзамена, если в каждом туре дается 3 задачи и достаточно решить хотя бы 2 из них.
406 Приложения 3. Фирма участвует в четырех независимых проектах, веро- ятности успеха которых составляют 0,5; 0,6; 0,7 и 0,8. Найти вероятность того, что хотя бы два проекта увенчаются успехом. 4. В город поступают товары трех фирм в соотношении 2:3:5. В поставках первой фирмы 60% товара высшего качества, второй — 40%, а третьей — 20%. Куплен товар высшего каче- ства. Найти вероятность, что он изготовлен второй фирмой. 5. Вероятность того, что пассажир опоздает к поезду, равна 0,005. Найти наиболее вероятное число опоздавших, если все- го билет купило 600 человек, и вероятность того, что их будет именно столько. Вариант 5 1. Операции над событиями. Формулы де Моргана. Независимость событий. Вероятность противоположного со- бытия. Теоремы сложения и умножения вероятностей (с до- казательствами). 2. В каждой упаковке товара фирмы «Том» имеется одна из букв «Т», «О», «М» равновероятно. Какова вероятность собрать все буквы, купив 5 упаковок товара? 3. В урне 7 красных шаров и 9 синих. Извлекли три шара (без возвращения), затем положили их обратно и добавили в урну два шара того цвета, который оказался в большинстве среди извлеченных. С какой вероятностью два шара, вынутых после этого, окажутся синими? 4. Мимо бензоколонки проезжают легковые и грузовые ма- шины. Среди них грузовых машин 75%. Вероятность того, что проезжающая машина подъедет заправиться, для грузовой ма- шины равна 0,1, для легковой — 0,2. Найти вероятность того, что очередная машина, подъехавшая на заправку, окажется гру- зовой. 5. 400 клиентов фирмы обращаются к 5 менеджерам рав- новероятно и независимо друг от друга. В каких границах с вероятностью 0,95 лежит число клиентов отдельно взятого ме- неджера? Вариант 6 1. Теорема Муавра—Лапласа и следствия. Теорема Пуассона (с доказательством).
Приложение 1. Примеры контрольных и экзаменационных работ 407 2. Группа из 27 студентов пишет контрольную из 3 вариантов (по 9 человек в каждом). Найти вероятность, что среди случайно выбранных 5 студентов есть писавшие каждый вариант. 3. Фирма имеет трех поставщиков, каждый из которых надежен с вероятностью 0,8. В случае отказа одного поставщика вероятность разорения фирмы равна 0,25, двух — 0,75, трех - 0,95. Найти вероятность разорения фирмы. 4. Из урны, где было 10 красных, 6 белых и 4 синих шара, вынут один шар. После этого из урны извлечены (без возвращения) 2 шара, оказавшиеся красным и белым. При этом условии найти вероятность, что сначала был вынут синий шар. 5. Страховая фирма заключила 2500 договоров. Вероятность страхового случая по каждому в течение года составляет 2%. Найти вероятность того, что число таких случаев не превзойдет наивероятнейшее число более чем на 20. Контрольная работа № 2 по теории вероятностей. Случайные величины. Законы распределения Вариант 1 1. Два станка выпускают некоторую деталь соответственно с вероятностями брака рх = 0,01 и р2 = 0,05. В выборке одна деталь, выпущенная первым станком, и две со второго станка. Найти распределение вероятностей случайной величины £, - числа бракованных деталей в выборке. 2. Совместный закон распределения пары (£, т|) задан таб- лицей: t, п -1 0 1 -1 1/16 1/8 1/16 1 3/16 3/8 3/16 Найти распределения вероятностей £+г] и ковариацию cov(^ - 3 г), £ + ц); проверить зависимость Е, и г). 3. Плотность распределения случайной величины Е, имеет ГС(х + 1), хе[-1,2], вид /^(х) = -( Найти С, функцию распределения F(x), Р(&2< 1), Л/%. хй[-1,2].
408 Приложения 4. Случайная величина равномерно распределена на отрезке [1, 3]. Найти плотность распределения вероятностей л = + 1. 5. Двумерная случайная величина (£, л) равномерно распре- делена на множестве {(х, у)/х2 + у*< 1, у > 0}. Найти плотность распределения составляющих £ и г] и ответить на вопрос о за- висимости и т] (ответ обосновать). Вариант 2 1. Два стрелка поражают мишень соответственно с вероят- ностями 0,7 и 0,8 при одном выстреле. Найти распределение вероятностей числа попаданий, если первый стрелок выстрелил один раз, а второй — два раза. 2. Совместный закон распределения пары (£, т|) задан таб- лицей: £ п -1 0 1 -1 1/8 1/4 1/8 1 3/8 1/4 1/8 Найти распределение + т] и ковариацию cov(^ — ц, 2л); проверить зависимость Е, и л- 3. Плотность распределения случайной величины Е, имеет вид Л(х)=!С(х+1)"’х-0; 5 [0, х<0. Найти С, функцию Г(х), Р(1£ “ 1/31 < 1) и М^2. 4. Случайные величины £ и л независимы и имеют показа- тельное распределение с параметром X = 2. Найти + л - О- 5. Двумерная случайная величина (£, л) равномерно распре- делена в квадрате с вершинами (-2, 0), (0, —2), (2, 0), (0, 2). Найти значение функции совместного распределения F[x, у) в точке (1, —1). Ответить на вопрос о зависимости и л (ответ обосновать). Вариант 3 1. Среди 5 ключей два подходят к двери. Ключи пробуют один за другим, пока не откроют дверь. Найти распределение вероятностей £ - числа опробованных ключей. 2. Совместный закон распределения пары (4, л) задан таб- лицей:
Приложение 1. Примеры контрольных и экзаменационных работ 409 п -1 0 1 -1 1/10 1/5 1/5 1 1/5 1/10 1/5 Найти распределение £ — т| и ковариацию cov(2^ + rj; £ - л); проверить зависимость £ и т). 3. Плотность распределения случайной величины £, имеет вид pk(x) = < С(1-х2),|х|<1; 0, | х| > 1 Найти С, функцию распределения Дх), Д|£ — 1/21 < 1/4), Mi,. 4. Случайная величина £, имеет равномерное распределе- ние на отрезке [—1; 1]. Найти плотность случайной величины г, = tg(^/2). 5. Двумерная случайная величина равномерно распределена в треугольнике (0, 4), (4, 0) и (4, 4). Найти плотность распреде- ления составляющих i, и q. Ответить на вопрос о зависимости случайных величин £ и г] (ответ обосновать). Вариант 4 1. С конвейера поступило 4 детали. Вероятность брака для каждой детали р. Детали проверяют одну за другой, пока не на- берут 2 доброкачественные. Найти распределение вероятностей числа i, проверенных деталей. 2. Совместный закон распределения пары (£, т|) задан таб- лицей: п -1 0 1 -1 1/12 1/6 1/4 1 1/4 1/12 1/6 Найти закон распределения вероятностей ^тд, ковариацию cov(^ - т|, £ + г|); проверить зависимость случайных величин и л. 3. Плотность распределения случайной величины i, имеет вид JC(x3 + 2), хе[1,3]; [0, хе [1,3]. Найти С, функцию распределения Дх) и Mi,, Р(-1 < i, < 2).
410 Приложения 4. Случайная величина £ имеет равномерное распреде- ление на отрезке [—1, 1]. Найти плотность распределения П = —1п(2 + £). 5. Случайная пара (£, т|) имеет равномерное распределение на множестве {х, у: |х| + |у|< 2}. Найти плотности распреде- ления и г|. Являются ли они зависимыми? (ответ обосно- вать). Вариант 5 1. Со склада получено 4 прибора. Каждый прибор комплек- туется из двух деталей, вероятность брака для первой детали — 0,1, а для второй — 0,05. Найти распределение числа брако- ванных приборов. 2. Совместный закон распределения пары (^, г|) задан таб- лицей: 5 п -1 0 1 -1 1/16 1/16 1/8 1 3/16 3/16 3/8 Найти распределение £+ т>, ковариацию cov(^ + 2r], 2^+ т|); проверить зависимость Е, и г). 3. Случайная величина Е, имеет плотность распределения JC(9-x2), хе[-3,2]; ',‘w = |o, xei-3.2). Найти С, функцию распределения F(x) и вероятность 4. Случайная величина равномерно распределена на от- резке [~1/2, 1/2]. Найти плотность распределения случайной • величины г| = sin— • 5. Случайная пара (£, г|) равномерно распределена на мно- жестве {х,у: | х | + | у | < 1; у > 0}. Найти плотности распреде- ления и г|. Ответить на вопрос о зависимости и г| (ответ обосновать).
Приложение 1. Примеры контрольных и экзаменационных работ 411 2. Примеры вариантов экзаменационных работ по теории вероятностей (специальность «Экономика») Вариант 1 1. Пространство элементарных исходов. События (простые и сложные). Операции над событиями. Формулы де Моргана. Классическое определение вероятности. 2. Ковариация, коэффициент корреляции и их свойства. 3. Группа из 20 студентов пишет контрольную работу из 4 вариантов (по 5 человек в каждом). Найти вероятность того, что среди случайно выбранных 5 студентов окажутся писавшие каждый вариант. 4. Двумерная случайная величина (£,т]) равномерно распре- делена на множестве {0<у<4-х2}. Проверить величины и т| на зависимость, найти их частные плотности. 5. Плотность случайной величины равна: JC(5-x2), хб[0,21; «(0.2). Найти константу С, функцию распределения Г(х), вероят- ность f\ -2 < ^ < 1), математическое ожидание и плотность П = ^ + 1. Вариант 2 1. Непрерывная случайная величина. Плотность непрерыв- ной случайной величины и ее свойства. Совместная плотность распределения двумерной случайной величины. Условия неза- висимости случайных величин. ,2. Нормальный закон распределения, его функция распре- деления и плотность. Вычислить математическое ожидание и дисперсию нормально распределенной случайной величины. 3. Семь клиентов случайным образом обращаются в 5 фирм. Найти вероятность, что хотя бы в одну фирму никто не обра- тится. 4. Найти плотность распределения суммы независимых слу- чайных величин £, и г), если они равномерно распределены на отрезках [0, 2] и [1,4] соответственно. 5. Плотность случайной величины £, равна:
412 Приложения JC(x + 4), хе[-1,3]; ’ [0, хё[-1,3]. Найти константу С, функцию распределения F(x), вероят- ность Р(1 < £, < 4), математическое ожидание и плотность 1 П“3-< Вариант 3 1. Независимость событий, попарная и в совокупности. Независимые испытания Бернулли. Теорема о распределе- нии вероятностей числа успехов в п независимых испытаниях Бернулли. Формула Бернулли. Наивероятнейшее число успехов. 2. Дать определение показательного распределения. Вычис- лить его математическое ожидание и дисперсию. 3. Найти вероятность, что в 8-значном числе ровно 3 цифры совпадают, а остальные различны (число может начинаться с нуля). 4. Двумерная случайная величина равномерно распределена на множестве |0<у<4-(х-1)2}. Проверить величины и ц на независимость, найти их плотности. 5. Плотность случайной величины равна: [С(х-1)-5, х>2; “(о. х<2. Найти константу С, функцию распределения Г(х), вероят- ность Р(0 < < 4), плотность т| = ——, математическое ожида- ние Mt,. Вариант 4 1. Полная группа событий. Формула полной вероятности, формула Байеса (с доказательством). 2. Дать определение распределения Бернулли. Вычислить его математическое ожидание и дисперсию. 3. Фирма нарушает закон с вероятностью 0,25. Аудитор об- наруживает нарушение с вероятностью 0,75. Проведенная им проверка не выявила нарушений. Найти вероятность, что на самом деле они есть.
Приложение 1. Примеры контрольных и экзаменационных работ 413 4. Найти плотность распределения суммы независимых слу- чайных величин и т), если равномерно распределена на от- резке [0, 1], а т) показательно распределена с параметром X = 2. 5. Плотность случайной величины £ равна: |С(х + 2)2, хе [0,2]; [О, [0,2]. Найти константу С, функцию распределения Дх), вероят- 2 ность Р(—1 < ^< I), плотность = математическое ожи- дание М^. Вариант 5 1. Определение вероятности события. Вероятность противо- положного события. Условная вероятность. Теоремы сложения и умножения. Теорема умножения для независимых событий. 2. Дать определение распределения Пуассона. Вычислить его математическое ожидание и дисперсию. 3. Курс акции за день растет или падает на 1 пункт равно- вероятно. Найти вероятность, что за 10 дней торгов курс акции упадет на 4 пункта. 4. Двумерная случайная величина (^, ц) равномерно распре- делена на множестве {(х-2)2 + у2<9,у>0}. Проверить величины £ и г] на зависимость, найти их частные плотности. 5. Плотность случайной величины £ равна: Сх~5, х>1; 0, х<1. Найти константу С, функцию распределения Г(х), вероят- ность Р(0 < ^ < 2), плотность т| = 7^-1, математическое ожи- дание М^. Вариант 6 1. Неравенство Чебышева. Закон больших чисел в форме Чебышева. Теорема Бернулли как частный случай теоремы Чебышева. Формулировка центральной предельной теоремы. 2. Случайная величина и ее законы распределения. Функция распределения случайной величины и ее свойства.
414 Приложения 3. Два аудитора проверяют 8 фирм (по 4 фирмы каждый), у двух из которых есть нарушения. Вероятность обнаружения нарушений первым аудитором равна 0,8, вторым — 0,9. Найти вероятность, что все фирмы-нарушители будут выявлены. 4. Найти плотность распределения суммы независимых слу- чайных величин и т), если они показательно распределены с параметрами = 1 и = 2 соответственно. 5. Плотность случайной величины равна: ГС(х + 7), хе[-2,Ц; рЛх)=1 , , „ 5 [0, хе [-2,1]. Найти константу С, функцию распределения Дх), вероят- ность < 1/4), математическое ожидание и плотность П = (^ + 2)2. 3. Примеры вариантов контрольных по математической статистике Контрольная работа № 3. Математическая статистика (специальность «Менеджмент») Вариант 1 1. Точечные оценки и их свойства. Эмпирическая функция распределения, выборочное среднее, выборочные дисперсии, их свойства. Теорема Фишера. 2. Найти оценки методом моментов для параметров а и b равномерного распределения на [а, д]. 3. Найти оценку максимального правдоподобия для параме- тра 0 распределения Вейбулла F(x) = l-e'ex2, х > 0, 0 > 0. 4. По данным испытаний 25 автомобильных шин выбороч- ная средняя износоустойчивость составила 32 тыс. км с вы- борочным средним квадратическим отклонением 5 тыс. км. Построить доверительный интервал для средней износоустой- чивости с надежностью 99%. 5. Автомат производит детали с известным средним квадра- тическим отклонением размера 0,09 мм. Выборка из 100 де- талей показала выборочный средний размер 5,02 мм. Можно ли утверждать на уровне значимости 10%, что средний размер детали соответствует номиналу в 5 мм (против гипотезы, что не соответствует)?
Приложение 1. Примеры контрольных и экзаменационных работ 415 Вариант 2 1. Распределения хи-квадрат и Стьюдента, их определения, свойства, графики, математические ожидания и дисперсии. 2. Найти оценку методом моментов для параметра 0 рас- пределения F(x) = (х/0)2, 0 < х < 0. 3. Найти оценку методом максимального правдоподобия для параметра р геометрического распределения. 4. Автомат упаковывает товар в пакеты с известным средним квадратическим отклонением веса 1,5 г. По выборке из 25 па- кетов получен выборочный средний вес 1,01 кг. Построить до- верительный интервал для среднего веса пакета с надежностью 95%. 5. Средний дневной доход фирмы составлял 250 единиц. После реорганизации за 16 рабочих дней выборочный средний доход составил 258 единиц с выборочным средним квадратиче- ским отклонением 12 единиц. Можно ли утверждать на уров- не значимости 5%, что реорганизация привела к увеличению среднего дохода фирмы? Вариант 3 1. Метод моментов. Метод максимального правдоподобия. 2. Найти оценку методом моментов для параметра р рас- пределения F(x) = хр, 0 < х < 1. 3. Найти оценку максимального правдоподобия для параме- тра 1 распределения Пуассона. 4. Для исследования средней заработной платы работающих жителей города сделана выборка из 256 человек, при этом ока- залось, что средняя заработная плата в выборке равна 289 у.е., а выборочная дисперсия 324. С надежностью 95% найти до- верительный интервал для средней заработной платы жителей города. 5. Фирма утверждает, что средний срок службы ее изделия составляет 250 часов. По выборке из 25 изделий получен вы- борочный средний срок службы 243 часа с выборочным сред- ним квадратическим отклонением 11 часов. Подтверждается ли заявление фирмы на уровне значимости 5% (против гипотезы, что средний срок службы на самом деле меньше)? Вариант 4 1. Информация Фишера. Неравенство Рао—Фреше—Крамера. Эффективность оценки.
416 Приложения --- .... ..... I, — . „ 1 . - -^дед-я———в— 2. Найти оценку методом моментов для параметров 0 и ц равномерного распределения на [0, 0 + ц]. 3. Найти оценку методом максимального правдоподобия для параметра а распределения Парето: F(x) = 1 — jto, х > 1, а > 0. 4. В деревне Сидорово проведено выборочное исследование доходов. По выборке из 16 человек получен выборочный сред- ний доход 5270 руб. с выборочным средним квадратическим отклонением 115 руб. Построить доверительный интервал для среднего дохода с надежностью 95%. 5. Среднее время сборки изделия было 50 мин. При испы- таниях нового метода сборки по выборке из 25 изделий полу- чено выборочное среднее время сборки 42 мин. с выборочным средним квадратическим отклонением 7 мин. Можно ли ут- верждать на уровне значимости 5%, что среднее время сборки сократилось? Вариант 5 1. Понятие доверительного интервала. Точность и надеж- ность. Доверительные интервалы для параметров нормального распределения. 2. Найти оценку методом моментов для параметра а рас- пределения Парето: F{x) = 1 — Х~а, х > 1, а > 1. 3. Найти оценку методом максимального правдоподобия для параметра 0 равномерного распределения на [0, 0]. 4. Выборочное среднее квадратическое отклонение ежесу- точного дохода 30 киосков некоторой фирмы оказалось равно 75 единиц. Построить доверительный интервал для среднего квадратического отклонения с надежностью 90%. 5. В книжном магазине проведено исследование продаж но- вого романа писателя Бородачева. В течение 25 рабочих дней роман продавался ежедневно в среднем по 36 экземпляров с выборочным средним квадратическим отклонением 9 экзем- пляров. Можно ли утверждать на уровне значимости 5%, что новый роман расходится лучше, чем предыдущий, если тот рас- ходился в среднем по 30 экземпляров в день? Вариант 6 1. Проверка статистических гипотез. Основные понятия. Критерий отношения правдоподобия. Теорема Неймана— Пирсона. •
Приложение 1. Примеры контрольных и экзаменационных работ 417 2. Найти оценку методом моментов для параметра 0 равно- мерного распределения на [—0, 0]. 3. Найти оценку методом максимального правдоподобия для параметра 0 распределения F(x) = л*, 0 < х < 1. 4. Проведены испытания нового автомата по упаковке това- ра. При взвешивании 16 упаковок было получено выборочное среднее квадратическое отклонение 2,5 г. Построить довери- тельный интервал для среднего квадратического отклонения с надежностью 95%. 5. В прошлом году средняя заработная плата жителей города составляла 370 у.е. В этом году выборка из 400 человек пока- зала, что средняя выборочная заработная плата равна 380 у.е. при выборочном среднем квадратическом отклонении 25 у.е. Можно ли на 5%-ном уровне значимости утверждать, что сред- няя заработная плата жителей города увеличилась? Контрольная работа № 1 по математической статистике. Точечные оценки (специальность «Экономика») Вариант 1 1. Бета- и гамма-функции: определения и свойства. Найти Г(11/2) и В(9/2,5/2). 2. Вывести формулу, связывающую третий центральный мо- мент с начальными моментами. Построить соответствующую формулу для выборочного момента и доказать его состоятель- ность. 3. Доказать эффективность оценки методом максимального правдоподобия для математического ожидания в случае нор- мального распределения. 4. Найти оценку методом моментов для параметра 0 рас- пределения Дх) = (х/5)₽, 0 < х < 5. 5. Трое исследователей провели независимые выборочные обследования доходов населения. Первый определил средний годовой доход 3500 у.е. со средним квадратическим отклоне- нием Oj = 120 у.е., второй — 3100 у.е. с ст2 = 60 у.е., третий — 3200 у.е. с ст3 = 90 у.е. Построить наиболее точную оценку среднего годового дохода и найти ее среднее квадратическое отклонение.
418 Приложения Вариант 2 1. Распределения хи-квадрат, Стьюдента и Фишера: опреде- ления, свойства, характеристики, графики. Определить, какое распределение имеет случайная величина £2, если £ имеет рас- пределение Стьюдента с п степенями свободы. 2. Доказать несмещенность и состоятельность исправлен- ной выборочной дисперсии как оценки теоретической дис- персии. 3. Доказать эффективность оценки максимального прав- доподобия параметра 0 показательного распределения р(х) = (1/0)^®, х > 0. 4. Найти оценки методом моментов для параметров а и Ь равномерного распределения на отрезке [а, />]. 5. В поселке Семеркино все жители имеют доход не менее 70 тыс. руб в месяц. Выборочное исследование дало средний доход 210 тыс. руб. В предположении, что случайная величина дохода имеет распределение Парето /^х)=1-(х/х0)~а, х > х0, где х0 = 70 (тыс. руб.), оценить параметр а методом моментов и долю жителей с доходами свыше 280 тыс. руб. Вариант 3 1. Генеральная совокупность. Выборка и вариационный ряд. Эмпирическая функция распределения и ее свойства. Теорема Гливенко—Кантелли. Доказать несмещенность и состоятель- ность эмпирической функции распределения как оценки тео- ретической функции распределения (в любой точке). 2. Найти дисперсии исправленной и неисправленной вы- борочных дисперсий в случае нормального распределения. 3. Для распределения F(x) = (х/0)2, 0 < х < 0, построить несмещенную оценку параметра 0 на основе хтах и доказать ее сверхэффективность. 4. Найти оценку методом моментов для числа степеней сво- боды г распределения Стьюдента. Определить, при каких г это возможно. 5. Ежедневный спрос на некоторый товар имеет равномер- ное распределение на отрезке [а, />]. За период наблюдения спрос составлял в среднем 128 кг с исправленной выбороч- ной дисперсией 363 кг2. С помощью метода моментов оценить, сколько потребуется товара, чтобы удовлетворить ежедневный спрос с вероятностью 90%.
Приложение 1. Примеры контрольных и экзаменационных работ 419 Вариант 4 1. Выборочные характеристики и их свойства. Точечные оцен- ки параметров. Несмещенность, состоятельность, эффектив- ность. Теорема Слуцкого (с доказательством). Асимптотическая нормальность оценок. 2. Найти функции распределения и плотности xmjn и хтах для выборки Хр ..., хя из генеральной совокупности с функцией распределения Дх) и плотностью р(х). 3. Доказать эффективность оценки методом моментов для вероятности р распределения Бернулли с числом испытаний N. 4. Найти оценку максимального правдоподобия для параме- тра 0 распределения Вейбулла F(x) = l-e'flx , х > 0, 0 > 0. 5. Известно, что некоторая работа занимает время, со- стоящее из постоянного периода и случайной задержки, рас- пределенной показательно. Хронометраж рабочего времени показал, что работа занимает в среднем 50 мин. со средним квадратическим отклонением 20 мин. С помощью метода мо- ментов оценить время, за которое работа будет выполнена с вероятностью 95%. Вариант 5 1. Бета- и гамма-распределения: определения, свойства, ха- рактеристики, графики. Найти математическое ожидание гам- ма-распределения. 2. Даны две выборки xt, ..., хя и ..., ут из общего нор- мального распределения N(a, а2). Построить оценку дисперсии, эффективную в классе линейных несмещенных оценок, по ис- правленным выборочным дисперсиям ст2х, ст2?. 3. Доказать эффективность оценки методом максимального правдоподобия для параметра 1 распределения Пуассона. 4. Найти оценку методом моментов для параметра а рас- пределения Парето Дх) = 1 — (х/2)-а, х > 2. 5. Известно, что некоторая работа занимает время, состо- ящее из постоянного периода и случайной задержки, распре- деленной показательно. Хронометраж рабочего времени пока- зал, что работа занимает как минимум 30 мин., а в среднем - 40 мин. С помощью метода максимального правдоподобия оценить вероятность того, что работа будет выполнена за час.
420 Приложения Вариант 6 1. Леммы и теорема Фишера. Следствия из теоремы (с до- казательствами). 2. Построить оценку математического ожидания, эффек- тивную в классе линейных несмещенных оценок, в случае не- равноточных наблюдений. Вычислить ее дисперсию. 3. Доказать асимптотическую эффективность исправленной выборочной дисперсии как оценки теоретической дисперсии в случае нормального распределения. 4. Найти оценку максимального правдоподобия для пара- метра 0 равномерного распределения на отрезке [0, 30], 0 > 0. 5. Известно, что доля возвратов по кредитам банка имеет распределение Дх) = Xs, 0 < х < 1. Наблюдения показали, что в среднем она составляет 80%. С помощью метода моментов оценить параметр р и вероятность того, что доля возвратов опустится ниже 70%. Контрольная работа № 2 по математической статистике. Доверительные интервалы. Статистическая гипотеза (специальность «Экономика») Вариант 1 1. Основные понятия в проверке гипотез: основная и аль- тернативная гипотезы, статистика критерия и критическая об- ласти, ошибки первого и второго рода, уровень значимости и мощность критерия. 2. Построить асимптотический доверительный интервал для параметра 0 нормального распределения 2V(0, 06), 0 > 0. 3. Фирма разослала 1000 рекламных каталогов и получила 180 заказов. Построить доверительный интервал для эффектив- ности рекламы (вероятности заказа по каталогу) с надежностью 95%. 4. В прошлом году средняя заработная плата жителей го- рода Мушкино составляла 8500 руб. В этом году выборка из 300 человек показала, что средняя заработная плата составляет 8560 руб. при выборочном среднем квадратическом отклонении 120 руб. Можно ли на 5%-ном уровне значимости утверждать, что заработная плата жителей города увеличилась?
Приложение 1. Примеры контрольных и экзаменационных работ 421 5. За последние 10 лет выборочная дисперсия годовой до- ходности актива А составила 0,08, актива Б - 0,14. Можно ли утверждать на уровне значимости 5%, что вложения в актив Б более рискованны, чем в А (т.е. дисперсия там больше)? Вариант 2 1. Критерий отношения правдоподобия. Теорема Неймана- Пирсона. Применение к гипотезе о математическом ожидании для нормального распределения. 2. Построить асимптотический доверительный интервал для неизвестного параметра а при известном X, если случайная ве- личина имеет гамма-распределение. 3. По данным социологического опроса среди 100 чело- век, 18 из них пользовались моющим средством «Чистомой». Оценить, сколько всего человек надо опросить, чтобы с веро- ятностью 95% определить долю пользующихся моющим сред- ством с точностью до 2%. 4. В книжном магазине проведено исследование продаж но- вого романа писателя Бородачева. В течение 25 рабочих дней роман продавался ежедневно в среднем по 55 экземпляров с выборочным средним квадратическим отклонением 12 экзем- пляров. Можно ли утверждать на уровне значимости 10%, что этот роман расходится лучше, чем предыдущий роман автора, если тот продавался в среднем по 48 экземпляров в день? 5. В течение 100 рабочих дней в фирму А обращалось в среднем 89 клиентов в день, в фирму Б — 96. Есть ли основе- ния утверждать на уровне значимости 5%, что фирма Б более популярна, чем фирма А, если числа клиентов в день для фирм А и Б имеют известные дисперсии 120 и 136 соответственно? Вариант 3 1. Проверка гипотез о математическом ожидании и диспер- сии для нормальной выборки. 2. Построить асимптотический доверительный интервал для неизвестного параметра А. при известном а, если случайная ве- личина имеет гамма-распределение. 3. Проведены испытания новой машины, упаковывающей товар в пакеты. По выборке из 30 пакетов получено выбороч- ное среднее квадратическое отклонение веса 0,6 г. Построить доверительный интервал с надежностью 95% для дисперсии веса пакета при упаковке машиной.
422 Приложения 4. Фирма разослала 500 рекламных каталогов и получила 75 заказов. Можно ли утверждать на уровне значимости 5%, что эффективность рекламы возросла, если раньше она со- ставляла 13%? 5. В городах Бусино и Гусино проведены выборочные об- следования доходов жителей. По выборкам из 250 человек по- лучено, что в Бусино средний доход 8020 руб. с выборочным средним квадратическим отклонением 195 руб., в Гусино сред- ний доход 7960 руб. с выборочным средним квадратическим отклонением 140 руб. Можно ли утверждать на уровне значи- мости 5%, что в Бусино живут в среднем богаче, чем в Гусино? Вариант 4 1. Понятие доверительного интервала. Точные доверитель- ные интервалы для параметров нормального распределения. 2. Построить асимптотический доверительный интервал для параметра 0 равномерного распределения на отрезке [0, 6] (ис- пользовать оценку методом моментов). 3. Импортер упаковывает чай в пакеты. Известно, что на- полняющая машина работает со средним квадратическим от- клонением, равным 0,7 г. Выборка 16 пакетов показала сред- ний вес 100,2 г. Найти доверительный интервал для среднего веса пакета с вероятностью 95%. 4. Средний дневной объем продаж фирмы составлял 1200 единиц. После реорганизации за 25 рабочих дней выборочный средний объем продаж составил 1270 единиц с выборочным средним квадратическим отклонением 30 единиц. Можно ли утверждать на уровне значимости 5%, что реорганизация при- вела к увеличению среднего объема продаж фирмы? 5. Для оценки качества изделий, изготовленных двумя за- водами, взяты выборки из 100 изделий первого и 200 изделий второго. В них оказалось по 18 и 24 бракованных изделия соот- ветственно. Можно ли утверждать на уровне значимости 10%, что вероятность изготовления брака на обоих заводах одина- кова? Вариант 5 1. Проверка гипотез о математических ожиданиях и дис- персиях для двух нормальных выборок. 2. Построить асимптотический доверительный интервал для параметра X показательного распределения.
Приложение 1. Примеры контрольных и экзаменационных работ 423 3. В деревне Валенково проведено выборочное исследова- ние доходов. По выборке из 25 человек получен выборочный средний доход 4760 руб. с выборочным средним квадратиче- ским отклонением 230 руб. Построить доверительный интервал для среднего дохода с надежностью 95%. 4. Среднее время сборки изделия было 60 мин. При испы- таниях нового метода сборки по выборке из 16 изделий полу- чено выборочное среднее время сборки 53 мин. с выборочным средним квадратическим отклонением 9 мин. Можно ли ут- верждать на уровне значимости 5%, что среднее время сборки сократилось? 5. Проведено исследование батареек фирм «Винтик» и «Шпунтик». По выборке из 11 батареек фирмы «Винтик» полу- чен средний срок службы 207 ч с выборочным средним квадра- тическим отклонением 9 ч, по выборке из 16 батареек фирмы «Шпунтик» — средний срок службы 195 ч с выборочным сред- ним квадратическим отклонением 8 ч. Можно ли утверждать на уровне значимости 10%, что в среднем срок службы батареек этих двух фирм одинаков? Вариант 6 1. Понятие асимптотического доверительного интервала. Методы построения асимптотических доверительных интерва- лов. 2. Построить асимптотический доверительный интервал для параметра X распределения Пуассона. 3. Среди 400 изделий в течение года вышли из строя 50. Построить доверительный интервал с уровнем надежности 95% для вероятности того, что изделие прослужит не менее года. 4. Старая наполняющая машина работала со средним ква- дратическим отклонением веса упаковки 1,1г. Были проведены испытания новой машины. По выборке из 25 упаковок товара получено выборочное среднее квадратическое отклонение 0,4 г. Можно ли утверждать на уровне значимости 5%, что для новой машины среднее квадратическое отклонение меньше? 5. Фирма разослала 1000 рекламных каталогов и получи- ла 180 заказов. Можно ли утверждать на уровне значимости 5%, что эффективность рекламы повысилась, если в про- шлом году фирма получила 160 заказов (при том же объеме рассылки)?
424 Приложения д. Примеры вариантов экзаменационных работ по математической статистике (специальность «Экономика») Вариант 1 1. Бета-распределение: определение, свойства, характери- стики, график. Вычислить математическое ожидание. 2. Критерий отношения правдоподобия. Теорема Неймана- Пирсона. Применение к гипотезе о среднем для нормального распределения. 3. Доказать эффективность оценки методом максимального правдоподобия для математического ожидания в случае нор- мального распределения. 4. В выборке из 400 изделий средний срок службы соста- вил 1500 ч. Известно, что срок службы изделия имеет показа- тельное распределение. Построить доверительный интервал для среднего срока службы с надежностью 95%. 5. Средний дневной объем продаж фирмы составлял 860 единиц. После реорганизации за 25 рабочих дней выбороч- ный средний объем продаж составил 900 единиц с выборочным средним квадратическим отклонением 35 единиц. Можно ли утверждать на уровне значимости 5%, что реорганизация при- вела к увеличению среднего объема продаж? Вариант 2 1. Гамма-распределение: определение, свойства, характеристи- ки, график. Вычислить математическое ожидание и дисперсию. 2. Понятие доверительного интервала. Точные доверитель- ные интервалы для параметров нормального распределения. 3. Доказать эффективность оценки максимального правдопо- добия параметра 0 показательного распределения р(х) = (1/0)е“х/е, х > 0. 4. Проведены испытания новой машины, упаковывающей товар в пакеты. По выборке из 30 пакетов получено выбороч- ное среднее квадратическое отклонение веса 0,7 г. Построить доверительный интервал с надежностью 95% для дисперсии веса пакета при упаковке машиной. 5. В прошлом году средняя заработная плата жителей го- рода Булкино составляла 7300 руб. В этом году выборка из 400 человек показала, что средняя заработная плата составляет 7320 руб. при выборочном среднем квадратическом отклонении
Приложение 1. Примеры контрольных и экзаменационных работ 425 150 руб. Можно ли на уровне значимости 5% утверждать, что заработная плата жителей города увеличилась? Вариант 3 1. Распределение Стьюдента: определение, свойства, харак- теристики,, график. Доказать сходимость при п ->оо к нормаль- ному распределению 7V(0, 1). 2. Понятие асимптотического доверительного интервала. Методы построения асимптотических доверительных интерва- лов. Примеры построения интервалов для вероятности «успеха» в испытаниях Бернулли (двумя методами). 3. Доказать несмещенность, состоятельность и эффектив- ность эмпирической функции распределения как оценки тео- ретической функции распределения. 4. Импортер упаковывает чай в пакеты. Известно, что на- полняющая машина работает со средним квадратическим от- клонением, равным 0,8 г. Выборка 100 пакетов показала сред- ний вес 99,9 г. Найти доверительный интервал для среднего веса пакета с надежностью 90%. 5. Проведено исследование батареек фирм «Нептун» и «Плутон». По выборке из 10 батареек фирмы «Нептун» получен средний срок службы 207 ч с выборочным средним квадрати- ческим отклонением 11 ч, по выборке из 16 батареек фирмы «Плутон» — средний срок службы 194 ч с выборочным сред- ним квадратическим отклонением 8 ч. Можно ли утверждать на уровне значимости 10%, что в среднем срок службы батареек этих двух фирм одинаков? Вариант 4 1. Распределение Фишера: определение, свойства, харак- теристики, график. Проверить, к какому распределению оно сходится при т -> оо. 2. Основные понятия в проверке гипотез: основная и аль- тернативная гипотезы, статистика критерия и критическая об- ласть, ошибки первого и второго рода, уровень значимости и мощность критерия. 3. Доказать эффективность оценки максимального правдо- подобия для вероятности «успеха» р распределения Бернулли с числом испытаний т. 4. За 100 рабочих дней в магазин в среднем обращалось 289 покупателей в день. Известно, что число покупателей в
426 Приложения день описывается распределением Пуассона. Построить дове- рительный интервал для среднего числа покупателей в день с надежностью 90%. 5. Старая наполняющая машина работала со средним ква- дратическим отклонением веса упаковки 1 г. Были проведены испытания новой машины. По выборке из 30 упаковок товара получено выборочное среднее квадратическое отклонение 0,7 г. Можно ли утверждать на уровне значимости 5%, что для новой машины среднее квадратическое отклонение меньше? Вариант 5 1. Распределение хи-квадрат: определение, свойства, харак- теристики, график. Доказать, что = т(л/2,1/2). 2. Метод наименьших квадратов. Система нормальных урав- нений. Теорема Гаусса—Маркова. 3. Доказать эффективность оценки методом моментов для параметра X распределения Пуассона. 4. В деревне Ложкино проведено выборочное исследование доходов. По выборке из 25 человек получен выборочный сред- ний доход 4750 руб. с выборочным средним квадратическим отклонением 150 руб. Построить доверительный интервал для среднего дохода с надежностью 95%. 5. Фирма разослала 1000 рекламных каталогов и получила 140 заказов. Можно ли утверждать на уровне значимости 5%, что эффективность рекламы повысилась, если в прошлом году фирма получила 100 заказов (при том же объеме рассылки)? Вариант 6 1. Бета- и гамма-функции: определения и свойства. Найти Г(11/2) и В(9/2,5/2). 2. Критерии согласия Пирсона (хи-квадрат) и Колмогорова. 3. Построить оценку математического ожидания, эффек- тивную в классе линейных несмещенных оценок, в случае не- равноточных наблюдений. Вычислить ее дисперсию. 4. Фирма разослала 1000 рекламных каталогов и получила 140 заказов. Построить доверительный интервал для эффективности рекламы (вероятности заказа по каталогу) с надежностью 90%. 5. В городах Глашино и Дашино проведены выборочные об- следования доходов жителей. По выборкам из 100 человек по- лучено, что в Глашино средний доход 8020 руб. с выборочным средним квадратическим отклонением 190 руб., в Дашино сред-
Приложение 1. Примеры контрольных и экзаменационных работ 427 ний доход 7960 руб. с выборочным средним квадратическим от- клонением 160 руб. Можно ли утверждать на уровне значимости 5%, что в Глашино живут в среднем богаче, чем в Дашино? 5. Примеры вариантов экзаменационных работ по теории вероятностей и математической статистике (специальность «Менеджмент»)* Вариант 1. Теоретическая часть. 1. Формула полной вероятности имеет вид: а) Р(АВ) = Р(А\В)Р(В); б) P(A) = ^P(Hk\A)P(Hky, в) P(A)^n^P(A\Hk)P(Hk)- г) P(Hk\A) = P(A\Hk)P(Hk)/P(A). 2. Свойством испытаний Бернулли является следующее: а) все исходы испытаний равновероятны; б) испытания заканчиваются одним из двух исходов; в) вероятность успеха определяется результатом одного произвольного испытания; г) все приведенные выше ответы верны. 3. Размещением т элементов из п называется: а) упорядоченный набор п элементов из множества, содер- жащего т элементов; б) упорядоченный набор т элементов из множества, содер- жащего п элементов; в) неупорядоченный набор т элементов из множества, со- держащего п элементов; г) операция перемены мест т элементов во множестве, со- держащем п элементов. 4. Случайная величина называется дискретной, если она: а) зависит от случая; б) принимает конечное или счетное число значений; 1 Каждый вариант состоит из теоретического теста и вычислительных задач.
428 Приложения в) равна числу успехов в схеме Бернулли; г) задается своей функцией распределения. 5. Какое свойство НЕ является обязательным для функции распределения: а) Е(л:)не убывает; б) lim^ F(x) = 1; в) P(a<^<b) = F(b)~ F(a); г) F(x) непрерывна? 6. Случайная величина распределена по показательному за- кону, если: а) ее закон распределения имеет вид Р(^ = к) = кке~к /к\; б) ее плотность р(х) = (\/у!2п)е~х2/2; в) ее плотность р(х) = Хе-кх,х>0; г) ее функция распределения F(x) = e;jc при х>0. 7. Дисперсию дискретной случайной величины можно най- ти по формуле: а) б) Z) = cov(^A^); в) = г) ни один из ответов не верен. 8. Метод моментов для нахождения оценок заключается в: а) поиске распределения случайной величины; б) приравнивании выборочных моментов к теоретическим; в) максимизации функции моментов; г) вычислении s2. 9. Доверительный интервал для параметра — это интервал: а) в который параметр попадает с максимальной вероятно- стью; б) в котором параметр лежит с заданной вероятностью; в) в котором лежат все возможные значения параметра; г) в котором выборочное среднее лежит с заданной вероят- ностью.
Приложение 1. Примеры контрольных и экзаменационных работ 429 10. Распределение Фишера имеет: а) один параметр - число степеней свободы; б) один параметр — уровень значимости; в) два параметра — два числа степеней свободы; г) два параметра — уровень значимости и число степеней свободы. Задачи 1. В очередь в булочную случайным образом встали 5 жен- щин и 2 подростка. Какова вероятность того, что два подростка стоят в очереди рядом? 2. Фирма нарушает закон с вероятностью 0,25. Аудитор об- наруживает нарушение с вероятностью 0,85. Проведенная им проверка не выявила нарушений. Найти вероятность того , что на самом деле они есть. 3. Плотность распределения случайной величины £ имеет вид ГО, х«[1,4]; [С(х-1), хе[1,4]. Найти С, F(x), Р(^>3). 4. Совместное распределение двух дискретных случайных величин и г| задано таблицей: П -1 0 2 1 0,1 0,1 0,2 2 0,2 о,з 0,1 Зависимы ли эти величины? Вычислить Р(^+т|<2) и cov(^,r]). 5. По выборке из 25 упаковок товара средний вес составил 105 г при выборочном среднем квадратическом отклонении (исправленном) 5 г. На уровне значимости 10% проверьте ги- потезу о том, что средний вес упаковок товара в генеральной совокупности равен 100 г. Вариант 2. Теоретическая часть 1. Теорема умножения вероятностей имеет вид: а) Р(АВ) = Р(А\В)Р(В); б) Р(АВ) = Р(А)Р(В) ; в) Р(АВ) = Р(В\А)Р(В); г) Р(А)Р(В) = Р(А\В)Р(В\А).
430 Приложения 2. События А и В независимы, если: а) Р(АВ) = 0; б) Р(А\В) = Р(В); в) Р(АВ) = Р(А)Р(В); г) Л и Я не пересекаются. 3. Каково классическое определение вероятности: a) P(A) = N(A)/ N ; б) Р(А) равна 1, если А произошло, и 0, если А не произошло; в) /,(^=и)=Сл"рУ"; г) P^ = m) = pqm-1? 4. Случайная величина распределена по Пуассону, если: а) ее закон распределения имеет вид Р(^ = Л) = Х‘е"х; б) ее плотность р(х) = А.е“Хх, х>0; в) ее закон распределения имеет вид = = г) ее закон распределения имеет вид Р(£=Л) = Х*е'х/к\. 5. Приближенная формула Пуассона используется в случае, когда: а) п велико, пр < 10; б) п велико, пр > 10; в) п любое, пр > 10; г) недостаточно данных для точного подсчета. 6. Математическое ожидание произвольной дискретной слу- чайной величины определяется по формуле: a) £х p(x)dx ; б) в) ; Г) -(х,+... + Х,). п
Приложение 1. Примеры контрольных и экзаменационных работ 431 7. Какое из перечисленных ниже свойств НЕ является свой- ством функции плотности р(х): а) Р(&<х) = Г p(x)dx ; J—ao б) Нтх_>4Л,/Хх) = 1; в) р(х)>0; 0 f“/>(x)dx = l? J-00 8. Распределение Стьюдента имеет случайная величина: а) + где еЛГ(0,1) и независимы; б) +... + ^)/п где бЛГ(0,1) и независимы; в) ^о/7^о+- + ^)/л гДе ^О’-Л,бЛГ(О,1) и независимы; г) ^о/\1(^+- + ^и)/п где ^о,...ЛяеМО,1) и независимы. 9. Ошибкой 1-го рода при проверке статистических гипотез называется ошибка, при которой: а) отвергается неверная гипотеза Но; б) отвергается правильная гипотеза Но; в) отвергается правильная альтернативная гипотеза Нх; г) вероятность отклонения Яо становится меньше уровня значимости. 10. Несмещенной оценкой для неизвестной дисперсии яв- ляется: а) б) lcxj+...+х,); »Az;., г) -Ц-z*./*-**)2 • л-1 * 1
432 Приложения Задачи 1. Пять рукописей случайным образом раскладывают в 4 папки. Какова вероятность того, что ровно одна папка оста- нется пустой. 2. Два аудитора проверяют 4 фирмы (по 2 каждый), у двух из которых имеются нарушения. Вероятность обнаружения на- рушений первым аудитором равна 0,7, вторым - 0,9. Найти вероятность, что все фирмы-нарушители будут выявлены. 3. Совместное распределение двух дискретных случайных величин и т| задано таблицей: £ и 0 1 2 -1 1/9 2/9 1/18 1 1/9 1/3 1/16 Зависимы ли эти величины? Вычислить Р(£+т}>2) и cov(^,-q). 4. Плотность распределения случайной величины £ имеет вид ГО, х£Н,1]; р(х) = 5 |С(1 + х), хе(-1, !]• Найти С, Дх), Л^, > 0). 5. Средний вес таблеток сильного действия должен быть 0,50 мг. Выборочная проверка 121 таблетки показала, что средний вес таблетки равен 0,53 мг. На уровне значимости 0,01 проверьте гипотезу о том, что выборочные данные согла- суются с нормативом. Считать, что вес таблеток распределен по нормальному закону со средним квадратическим отклоне- нием 0,11 мг. Вариант 3. Теоретическая часть 1. Формула Байеса имеет вид: а) Р(АВ) = Р(А\В)Р(В); б) P(A) = ^P(A\Hk)P(Hky, в) P(Hk\A) = P(A\Hk)P(Hk)/P(A)', г) Р(Нк | А) = Р(А | Нк)Р(Нк)/| Л)Р(Яу).
Приложение 1. Примеры контрольных и экзаменационных работ 433 2. Сочетанием т элементов из п называется: а) упорядоченный набор п элементов из множества, содер- жащего т элементов; б) неупорядоченный набор п элементов из множества, со- держащего т элементов; в) упорядоченный набор т элементов из множества, содер- жащего п элементов; г) неупорядоченный набор т элементов из множества, со- держащего п элементов. 3. Вероятность того, что в п испытаниях Бернулли произой- дет т успехов, равна: а) №*'; б) В) ?Lp"'qn~m\ п\ г) -----ртап~т. т\(п-т)\ 4. Случайная величина является непрерывной, если: а) она непрерывно изменяется; б) она принимает бесконечно много значений; в) ее плотность равна интегралу от вероятности; г) ее функция распределения равна интегралу от плотности. 5. Какое свойство НЕ всегда справедливо для дисперсии: a) De = 0; б) + n) = + Dq; в) = Л^2 - (М&; г) = cov(i;, £)? 6. Случайная величина распределена равномерно, если а) ее закон распределения имеет вид P(t, = к) = б) ее значения равномерно распределены по прямой; в) ее плотность р(х) = 1/(Ь-а), хе [а, Л]; г) ее закон распределения имеет вид Р(£ = х) = \/(Ь - а), х е [а, Ь]. 15-Теория вероятностей
434 Приложения 7. Какое из перечисленных ниже свойств справедливо для дискретной случайной величины , принимающей значения a) = = б) Р& = хк) < = хк+1)~, в) г) все ответы верны? 8. Метод максимального правдоподобия заключается в: а) приравнивании функции правдоподобия к 0; б) нахождении оценки, ближайшей к параметру; в) максимизации функции правдоподобия; г) поиске наивероятнейшего значения функции правдопо- добия. 9. Распределение Фишера имеет случайная величина: а) ^2+... + ^2, где ,...ЛЛ еN(0,1) и независимы; б) Х„/Хл> гДв Хт>Хл независимы и имеют х2-распределение; , х! / л» > > в) , где Хи>Х„ независимы и имеют х2-распределение; Хл/« г) -т=Хл > гДе Х„2 имеет х2-распределение. ул 10. Доверительный интервал для параметра а нормального распределения при известной дисперсии имеет вид: а) х - стиу / п < а < х + стиу / л ; б) х - стиу / 4п< а < х + сшу / >/п ; в) х-sty /4n<a<xJr-sty I>/п ; г) (x-st^/4n<a<(x + sty)/4п . Задачи 1. Шесть пассажиров садятся в поезд, случайно выбирая один из шести вагонов. Какова вероятность того, что ровно в один вагон никто не сядет?
Приложение 1. Примеры контрольных и экзаменационных работ 435 2. Изделие имеет скрытые дефекты с вероятностью 0,15. В течение года выходит из строя 70% изделий со скрытыми де- фектами и 10% изделий без дефектов. Найти вероятность того, что изделие имело скрытые дефекты, если оно вышло из строя в течение года. 3. Плотность распределения случайной величины £ имеет , ГО, xg(-2,l]; вид р(х) = < |С(1-х),хе[-2,1]. Найти С, Дх), М^, Р(0 < £ <3). 4. Совместное распределение двух дискретных случайных величин и т| задано таблицей: К п -1 1 2 0 1/8 1/6 1/12 1 1/12 1/6 3/8 Зависимы ли они? Вычислить Р(^+л<2) и cov(^,t]). 5. Взвесив 50 пакетов товара, нашли выборочное среднее 502 г и выборочное среднее квадратическое отклонение 10 г. На уровне значимости 5% проверьте гипотезу о том, что вес пакета равен 500 г. Вариант 4. Теоретическая часть 1. Формула для числа сочетаний (без повторений) т эле- ментов из п имеет вид: п\ а) ~in\' б) —-—; т\(п-т)\ . п\ в) ; (л-/и)! г) ни один из приведенных выше ответов не верен. 2. Теорема сложения вероятностей имеет вид: а) Р(А + В) = Р(А) + Р(В)', б) Р(А + В) = Р(А) + Р(В) + Р(АВУ,
436 Приложения в) Р(А + В) = Р(А) + Р(В)-Р(АВ); г) Р(А + В) = Р(А\В)Р(В). 3. События А и В называются несовместными, если: а) Р(АВ) = Р(А)Р(В)\ б) Р(ЛЯ) = 1; в) А и В = 0; г) А п В = 0. 4. Наиболее вероятное число успехов т в схеме Бернулли определяется по формуле: а) пр-р<гп <пр+р; б) np-q<m' <пр + р; в) np-q<>rn <np+q; г) пр-р< tn <np + q. 5. Математическое ожидание непрерывной случайной вели- чины находится по формуле: a) ^p(x)dx-, p(x)dx ; в) £>*5 0 • 6. Какое из свойств НЕ является свойством ковариации: a) cov(c£, т|) = cov(cq, ^); б) cov(^ + ц, ^) = cov(^, и) + cov(^, ^); в) cov(^, г|) = 0 для независимых ц; г) cov(c^, Ь) = с2 cov(^, £,)? 7. Случайная величина распределена по Бернулли, если: а) ее закон распределения имеет вид Р(^ = т) = С"pmq"~m; б) ее закон распределения имеет вид P(t, = m) = pmq"~m; в) ее закон распределения имеет вид Р(^ = т) = pqmA-y г) ее плотность р(т) = С” pmq"~m.
Приложение 1. Примеры контрольных и экзаменационных работ 437 8. Оценка параметра называется несмещенной, если: а) ее отклонение от оцениваемого параметра равно 0; б) ее математическое ожидание равно оцениваемому пара- метру; в) она равна выборочному среднему; г) ее дисперсия минимальна. 9. Ошибкой 2-го рода при проверке статистических гипотез называется ошибка, при которой: а) отвергается неверная гипотеза Яо; б) отвергается правильная гипотеза Яо; в) отвергается неверная альтернативная гипотеза Нх; г) отвергается правильная альтернативная гипотеза Нх. 10. Распределение /2 имеет случайная величина: а) равная квадрату нормальной случайной величины N(a, о2); б) равная квадрату суммы независимых нормальных слу- чайных величин Я(0,1); в) равная сумме квадратов независимых нормальных слу- чайных величин Я(0,1); г) ни один из приведенных ответов не верен. Задачи 1. Группа из 20 человек пишет контрольную работу из 4 ва- риантов (по пять человек в каждом). Найти вероятность того, что среди 5 случайно отобранных работ есть каждый вариант. 2. Фирма участвует в трех проектах, каждый из которых мо- жет закончится не удачей с вероятностью 0,2. В случае неудачи одного проекта вероятность разорения фирмы равна 20%, двух — 50%, трех - 90%. Определить вероятность разорения фирмы. 3. Совместное распределение двух дискретных случайных величин £ и т] задано таблицей: П -1 0 2 1 0,2 0,3 0 2 0 0,1 С Определить константу С. Исследовать вопрос о независимо- сти £ И Т|. Вычислить COV(^,T|) .
438 Приложения 4. Плотность распределения случайной величины £ имеет , ч Го, xg[0,5J; вид р(х) = \ (Сх, хе [0,5]. Найти С, F(x), ME,, Р(2 < $ <3). 5. Средний доход фирмы в день составлял 1020 у.е. После реорганизации фирмы выборочный средний доход в день за 30 рабочих дней составил 1070 у.е. с выборочным стандартным отклонением 90 у.е. Можно ли утверждать (на уровне значи- мости 5%), что реорганизация фирмы привела к увеличению среднего дохода? Вариант 5. Теоретическая часть 1. В определение классического вероятностного простран- ства входит условие: а) исходы равновероятны; б) исходы независимы; в) испытания заканчиваются одним из двух исходов; г) все приведенные выше ответы верны. 2. Условная вероятность Р(А | В} события А при условии В равна: а) Р(Л)/Р(5); б) Р(Л)/Р(Л); в) Р(АВ)/Р(А)\ г) Р(АВ) / Р(В). 3. Локальная теорема Муавра-Лапласа используется в слу- чае, когда: а) п велико, яр <10; б) п велико, пр > 10 ; в) п любое, яр <10; г) не хватает данных для точного подсчета. 4. Случайная величина — это: а) набор вероятностей, зависящих от случая; б) числовая функция, заданная на вероятностном прост- ранстве. в) случайный исход эксперимента. г) набор случайных событий, отвечающих заданному усло- вию.
Приложение 1. Примеры контрольных и экзаменационных работ 439 5. Какое свойство НЕ выполняется для независимых слу- чайных величин г): a) cov(^,t|) ; б) Щ + т|) = Di, + Z>n; в) = Л/^Л/т]; г) zx^n) = 6. Пусть случайная величина распределена по показатель- ному закону. Какое из следующих свойств верно: а) при х>0 P{i, = х) = б) при х>0 ее функция распределения F(x) = e>J‘; в) при х>0 ее функция распределения Г(х) = еХх; г) для любого х = х) = О? 7. Дисперсия непрерывной случайной величины равна: a) Di,= ^(x-M&dx- б) Dt,= £(x-Mt,)2p(x)dx ; в) Di, = £\x~x)2p(x)dx; г) D^=— Г(x-x)2dx. п J-» 8. Оценкой для неизвестного параметра называется: а) истинное значение параметра; б) угаданное значение параметра; в) функция от выборки; г) число, отличающееся от параметра не более чем на за- данную величину. 9. Доверительный интервал для параметра а нормального распределения при неизвестной дисперсии имеет вид: а) х - стиу / п < а < х + о«у / п ; б) х-ому /4п <а<х + стиу / 4п ; в) х-sty /4п <а<х + st.f /4п ; г) (x-st^/Jn <a<(x + sty)/4п .
440 Приложения 10. Критической областью при проверке статистических ги- потез называется: а) область значений наблюдаемой статистики, в которой верна основная гипотеза Яо; б) область значений наблюдаемой статистики, в которой верна альтернативная гипотеза Нх; в) область значений наблюдаемой статистики, в которой отклоняется основная гипотеза Яо; г) область значений наблюдаемой статистики, в которой отклоняется альтернативная гипотеза Н}. Задачи 1. В лифт семиэтажного дома на первом этаже входят пять человек. Какова вероятность того, что на первых трех этажах (начиная со второго) вышли два человека при условии, что все вышли на разных этажах? 2. Поставки продуктов в город производятся из трех об- ластей в количествах 20, 45, 35%. Доля продукта высшего ка- чества в поставках составляет 45, 40, 25%. Покупатель купил продукт высшего качества. Какова вероятность того, что он произведен в первой области? 3. Плотность распределения случайной величины имеет . ч ГО, х«[0,4]; вид р(х) = ( , И (Сх2, хе[0,4]. Найти С, Дх), Д1 < <7). 4. Совместное распределение двух дискретных случайных величин и т] задано таблицей: П -1 0 2 1 1/6 1/6 1/3 2 1/12 1/6 1/12 Исследовать вопрос о независимости и q. Вычислить P(t + г| < 2) и cov(^,t]) . 5. Яблоки упаковываются в коробки весом по 10 кг. Случайная выборка 9 коробок с яблоками выявила, что средний вес коробки равен 9,5 кг с выборочной дисперсией 0,04 кг2. На
Приложение 1. Примеры контрольных и экзаменационных работ 441 уровне значимости 5% проверить гипотезу о том, что средний вес коробок с яблоками равен 10 кг. Вариант 6. Теоретическая часть 1. Число размещений (без повторений) т элементов из п равно: а) б) в) nl/ ml; т/л; п!/(п-т)!; г) п! т\(п-т)\ 2. Какое из свойств условной вероятности НЕ верно: а) б) в) г) Р(А\В)Р(В) = Р(В\А)Р(А)', Р(А\В) = \-Р(А\В)', Р(Л|5) = 0, если Ас\В-<Ь', />(Л|Б) = 1, если 3. Приближенная формула Пуассона имеет вид: а) V" РЛт)а—е"', где X = пр-, ml б) к" РАт)я—е’\ где X = тр-, ml в) ml г) Р„(т)« • ml(n-m)l 4. рыми Пусть событие А может произойти совместно с некото- событиями (гипотезами) Н,. Какое условие нужно для применения формулы полной вероятности: а) события Ht образуют полную группу событий; б) события Ht независимы; в) события Ht содержат в себе один из двух исходов; г) все приведенные выше ответы верны?
442 Приложения 5. Пусть £, — непрерывная случайная величина с плотно- стью р(х) и функцией распределения F(x). Какое из следую- щих свойств верно: а) Р(а < £ < b) = F(b) - F(a); б) Р(а<^< Ь) = р(Ь) - р(а); в) Р(а < i < b) = р(а) - р(Ь)- г) Р(а < t, < b) = F[a) - F(b)2 6. Случайная величина распределена по геометрическому закону, если: а) ее плотность р(х) = р(1 - р)х~' при х > 0; б) ее закон распределения имеет вид Р(^ = т) = (I — рУ*~1р', в) ее закон распределения имеет вид Pit, = т) = (1 — р)"-1; г) ее плотность р(х) = Хе при х>0. 7. Дисперсия дискретной случайной величины равна: a) ^ = £t(xt-Mij)2; б) ^ = ^(х*-М^)2А; в> г> ^~£,(xt-x)2. 8. Оценка называется состоятельной, если: а) среди всех оценок она наиболее точно описывает параметр; б) ее математическое ожидание равно оцениваемому пара- метру; в) с ростом числа наблюдений она сходится по вероятности к параметру; г) с ростом числа наблюдений она сходится к вероятности успеха. 9. Надежностью доверительного интервала называется: а) вероятность того, что оцениваемый параметр попадет в интервал; б) вероятность того, что оцениваемый параметр не попадет в интервал; в) длина доверительного интервала; г) половина длины доверительного интервала.
Приложение 1. Примеры контрольных и экзаменационных работ 443 10. Пусть основная гипотеза Но: а = а0 отклоняется. В этом случае: а) делается вывод, что истинное значение параметра а от- личается от а0; б) нужно дополнительно посчитать выборочное среднее х ; в) мы совершаем ошибку 1-го рода; г) мы совершаем ошибку 2-го рода. Задачи 1. Семь клиентов случайным образом обращаются в 5 фирм. Найти вероятность того, что хотя бы в одну фирму никто не обратится. 2. В ящике 20 теннисных мячей, в том числе 12 новых и 8 игранных Из ящика извлекаются наугад два мяча для игры и после игры возвращаются в ящик. После этого из ящика вы- нимают два мяча для следующей игры. Найти вероятность того, что эти оба эти мяча будут новыми (т.е. неигранными). 3. Совместное распределение двух дискретных случайных величин £, и т| задано таблицей: П 1 2 3 1 С 0,2 0 2 0,2 0,4 0,2 Найти С. Вычислить cov(£, tj) и ЛЛ + л > 3). Исследовать вопрос о независимости i и гу 4. Плотность распределения случайной величины имеет вид [0, хе[0,1]; PW [Сх3, хе[0,1]. Найти С, Нх), Л1/2 < ^ < 3/2). 5. Средний дневной объем продаж в магазине составлял 500 единиц. После реорганизации выборочный средний днев- ной объем продаж за 25 рабочих дней составил 520 единиц с выборочным средним квадратическим отклонением 40 единиц. Можно ли утверждать (на уровне значимости 5%), что реорга- низация привела к увеличению среднего объема продаж?
Приложения 6. Пример задания по теории вероятностей для самостоятельной работы 1. На фирме работают 10 сотрудников, из которых знают английский 7, немецкий - 6, французский - 5, английский и немецкий — 3, английский и французский - 3, немецкий и французский — 4, все три языка — 2. Найти вероятность того, что команда из трех случайно выбранных сотрудников сможет осуществить перевод со всех трех языков. 2. На фирме работают 3 менеджера по продажам. Каждый из 10 клиентов обращается к любому из менеджеров равнове- роятно и независимо от других. Найти вероятность того, что у какого-либо из менеджеров окажется больше клиентов, чем у двух других вместе взятых, при условии, что к каждому менед- жеру обратился хотя бы один клиент. 3. В урне имеется 5 шаров: 2 черных, 1 белый, 1 красный и 1 синий. Два игрока поочередно вынимают шары из урны (начиная с первого игрока). Игрок, вынувший белый шар, вы- игрывает. Если вынут красный шар, игра оканчивается вни- чью. Если вынут черный шар, игра продолжается. Если вынут синий шар, все шары возвращаются в урну и игра начинается с начала. Найти вероятности выигрышей каждого из игроков и ничьей. 4. В каждой двенадцатой упаковке товара фирмы «Рекс» вложена одна из букв «Р», «Е», «К», «С» равновероятно. Покупатель хочет собрать все буквы, чтобы выиграть приз. Найти математическое ожидание и дисперсию числа упаковок, которые ему придется купить. 5. Случайные доходности по акциям компаний «Астра» и «Василек» имеют дисперсии 4 и 9 соответственно, а их коэф- фициент корреляции равен 1/2. В каких долях следует разде- лить капитал при вложении в акции, чтобы минимизировать риск (дисперсию доходности)? 6. Случайное время изготовления каждой детали равно- мерно распределено от 4 до 8 мин. и не зависит от других. Изготовление скольких деталей за 25 рабочих часов можно га- рантировать с вероятностью 95? 7. Случайные величины А, В, С независимы и равномерно распределены на отрезке [0, 1]. Найти вероятность того, что уравнение Ах2 + 2Вх + С = 0 имеет решения.
Приложение 1. Примеры контрольных и экзаменационных работ 445 8. Случайная величина Е, имеет показательное распреде- ление с математическим ожиданием 3. Найти вероятность P(sin Е, < 1/2). 9. Случайные величины аир независимы и имеют стан- дартное нормальное распределение. Найти распределение S = а/Р- 10. Построить пример двух зависимых случайных величин и т], каждая из которых имеет равномерное распределение на отрезке [0, 1], а их коэффициент корреляции равен любому заданному р е [—1, 1]. 7. Пример задания по математической статистике для самостоятельной работы 1. Вычислить дисперсию и моду распределения Стьюдента. 2. Вычислить математическое ожидание и дисперсию рас- пределения Фишера. 3. Вычислить математическое ожидание, моду и дисперсию бета-распределения. 4. Показать, что выборочные средние квадратические от- клонения, полученные по исправленной и неисправленной дисперсии для нормального распределения, являются смещен- ными оценками. Вычислить их математические ожидания. 5. Показать, что оценка максимального правдоподобия для параметра X показательного распределения является смещен- ной. Построить на ее основе несмещенную оценку. 6. Для оценивания параметра а нормального распределения МО, ст2) используют оценку вида = Найти констан- \ П J i=\ ту с, при которой оценка окажется несмещенной. Вычислить эффективность оценки. 7. Для равномерного распределения на отрезке [0, 30] найти оценку максимального правдоподобия, вычислить ее математи- ческое ожидание. Построить на основе этой оценки несмещен- ную оценку и доказать ее сверхэффективность. 8. Случайная величина принимает значения —1, 0 и 1с веро- ятностями (1 — 0)/3; 1/3; (1 + 0)/3 соответственно, 0G [-1; 1]. Построить для параметра 0 оценки методом моментов и мето- дом максимального правдоподобия, а также асимптотический доверительный интервал (на основе метода моментов).
Приложения 9. Для распределения Коши с плотностью р(х)=--------т- п(1+(х-0)2) строится оценка максимального правдоподобия параметра 0 по двум наблюдения. Определить, при каких и х, эта оценка существует и единственна. 10. Проверяется нулевая гипотеза о том, что случайная ве- личина равномерно распределена на отрезке [—1; 1], против гипотезы, что она имеет распределение Лапласа. Построить критерий отношения правдоподобия при п = 2 с уровнем зна- чимости а < 1/2.
Приложение 2. Таблицы 447 Приложение 2. Таблицы Таблица 1. Значения функции <p(x) = -j==e х>/2 >/2л X Сотые доли х 0 1 2 3 4 5 6 7 8 9 0,0 0,39894 39892 39886 39876 39862 39844 39822 39797 39767 39733 0,1 39695 39654 39608 39559 39505 39448 39387 39322 39253 39181 0,2 39104 39024 38940 38853 38762 38667 38568 38466 38361 38251 0,3 38139 38023 37903 37780 37654 37524 37391 37255 37115 36973 0,4 36827 36678 36526 36371 36213 36053 35889 35723 35553 35381 0,5 35207 35029 34849 34667 34482 34294 34105 33912 33718 33521 0,6 33322 33121 32918 32713 32506 32297 32086 31874 31659 31443 0,7 31225 31006 30785 30563 30339 30114 29887 29659 29431 29200 0,8 28969 28737 28504 28269 28034 27798 27562 27324 27086 26848 0,9 26609 26369 26129 25888 25647 25406 25164 24923 24681 24439 1,0 24197 23955 23713 23471 23230 22988 22747 22506 22265 22025 1,1 21785 21546 21307 21069 20831 20594 20357 20121 19886 19652 1,2 19419 19186 18954 18724 18494 18265 18037 17810 17585 17360 1,3 17137 16915 16694 16474 16256 16038 15822 15608 15395 15183 1,4 14973 14764 14556 14350 14146 13943 13742 13542 13344 13147 1,5 12952 12758 12566 12376 12188 12001 11816 11632 11450 11270 1,6 11092 10915 10741 10567 10396 10226 10059 09893 09728 09566 1,7 09405 09246 09089 08933 08780 08628 08478 08329 08183 08038 1,8 07895 07754 07614 07477 07341 07206 07074 06943 06814 06687 1,9 06562 06438 06316 06195 06077 05959 05844 05730 05618 05508 2,0 05399 05292 05186 05082 04980 04879 04780 04682 04586 04491
448 Приложения Окончание табл. 1 X Сотые доли х 0 1 2 3 4 5 6 7 8 9 2,1 04398 04307 04217 04128 04041 03955 03871 03788 03706 03626 2,2 03547 03470 03394 03319 03246 03174 03103 03034 02965 02898 2,3 02833 02768 02705 02643 02582 02522 02463 02406 02349 02294 2,4 02239 02186 02134 02083 02033 01984 01936 01888 01842 01797 2,5 01753 01709 01667 01625 01585 01545 01506 01468 01431 01394 2,6 01358 01323 01289 01256 01223 01191 01160 01130 01100 01071 2,7 01042 01014 00987 00961 00935 00909 00885 00861 00837 00814 2,8 00792 00770 00748 00727 00707 00687 00668 00649 00631 00613 2,9 00595 00578 00562 00545 00530 00514 00499 00485 00470 00457 3,0 00443 00430 00417 00405 00393 00381 00370 00358 00348 00337 3,1 00327 00317 00307 00298 00288 00279 00271 00262 00254 00246 3,2 00238 00231 00224 00216 00210 00203 00196 00190 00184 00178 3,3 00172 00167 00161 00156 00151 00146 00141 00136 00132 00127 3,4 00123 00119 00115 00111 00107 00104 00100 00097 00094 00090 3,5 00087 00084 00081 00079 00076 00073 00071 00068 00066 00063 3,6 00061 00059 00057 00055 00053 00051 00049 00047 00046 00044 3,7 00042 00041 00039 00038 00037 00035 00034 00033 00031 00030 3,8 00029 00028 00027 00026 00025 00024 00023 00022 00021 00021 3,9 00020 00019 00018 00018 00017 00016 00016 00015 00014 00014 X Десятые доли х 0 2 4 6 8 4 0,0001338 0000589 0000249 0000101 0000040 5 0,0000015
Приложение 2. Таблицы 449 Таблица 2. Значения функции Лапласа ф0(х)=-4=Р",/2л 72л о X ф,(х) х Ф,(х) х Ф.(х) X Ф,(х) 0,00 0,0000 0,32 0,1255 0,64 0,2389 0,96 0,3315 0,01 0,0040 0,33 0,1293 0,65 0,2422 0,97 0,3340 0,02 0,0080 0,34 0,1331 0,66 0,2454 0,98 0,3365 0,03 0,0120 0,35 0,1368 0,67 0,2486 0,99 0,3389 0,04 0,0160 0,36 0,1406 0,68 0,2517 1,00 0,3413 0,05 0,0199 0,37 0,1443 0,69 0,2549 1,01 0,3438 0,06 0,0239 0,38 0,1480 0,70 0,2580 1,02 0,3461 0,07 0,0279 0,39 0,1517 0,71 0,2611 1,03 0,3485 0,08 0,0319 0,40 0,1554 0,72 0,2642 1,04 0,3508 0,09 0,0359 0,41 0,1591 0,73 0,2673 1,05 0,3531 0,10 0,0398 0,42 0,1628 0,74 0,2703 1,06 0,3554 0,11 0,0438 0,43 0,1664 0,75 0,2734 1,07 0,3577 0,12 0,0478 0,44 0,1700 0,76 0,2764 1,08 0,3599 0,13 0,0517 0,45 0,1736 0,77 0,2794 1,09 0,3621 0,14 0,0557 0,46 0,1772 0,78 0,2823 1,10 0,3643 0,15 0,0596 0,47 0,1808 0,79 0,2852 1,Н 0,3665 0,16 0,0636 0,48 0,1844 0,80 0,2881 1,12 0,3686 0,17 0,0675 0,49 0,1879 0,81 0,2910 1,13 0,3708 0,18 0,0714 0,50 0,1915 0,82 0,2939 1,14 0,3729 0,19 0,0753 0,51 0,1950 0,83 0,2967 1,15 0,3749 0,20 0,0793 0,52 0,1985 0,84 0,2995 1,16 0,3770 0,21 0,0832 0,53 0,2019 0,85 0,3023 1,17 0,3790 0,22 0,0871 0,54 0,2054 0,86 0,3051 1,18 0,3810 0,23 0,0910 0,55 0,2088 0,87 0,3078 1,19 0,3830 0,24 0,0948 0,56 0,2123 0,88 0,3106 1,20 0,3849 0,25 0,0987 0,57 0,2157 0,89 0,3133 1,21 0,3869 0,26 0,1026 0,58 0,2190 0,90 0,3159 1,22 0,3883 0,27 0,1064 0,59 0,2224 0,91 0,3186 1,23 0,3907 0,28 0,1103 0,60 0,2257 0,92 0,3212 1,24 0,3925 0,29 0,1141 0,61 0,2291 0,93 0,3238 1,25 0,3944 0,30 0,1179 0,62 0,2324 0,94 0,3264 0,31 0,1217 0,63 0,2357 0,95 0,3289
450 Приложения Окончание табл. 2 X Ф,(х) х Ф,(х) х Ф0(х) х Ф.(Х) 1,26 0,3962 1,59 0,4441 1,92 0,4726 2,50 0,4938 1,27 0,3980 1,60 0,4452 1,93 0,4732 2,52 0,4941 1,28 0,3997 1,61 0,4463 1,94 0,4738 2,54 0,4945 1,29 04015 1,62 0,4474 1,95 0,4744 2,56 0,4948 1,30 0,4032 1,63 0,4484 1,96 0,4750 2,58 0,4951 1,31 0,4049 1,64 0,4495 1,97 0,4756 2,60 0,4953 1,32 0,4066 1,65 0,4505 1,98 0,4761 2,62 0,4956 1,33 0,4082 1,66 0,4515 1,99 0,4767 2,64 0,4959 1,34 0,4099 1,67 0,4525 2,00 0,4772 2,66 0,4961 1.35 0,4115 1,68 0,4535 2,02 0,4783 2,68 0,4963 1,36 0,4131 1,69 0,4545 2,04 0,4793 2,70 0,4965 1,37 0,4147 1,70 0,4554 2,06 0,4803 2,72 0,4967 1,38 0,4162 1,71 0,4564 2,08 0,4812 2,74 0,4969 1,39 0,4177 1,72 0.4573 2,10 0,4821 2,76 0,4971 1,40 0,4192 1,73 0,4582 2,12 0,4830 2,78 0,4973 1,41 0,4207 1,74 0,4591 2,14 0,4838 2,80 0,4974 1,42 0,4222 1,75 0,4599 2,16 0,4846 2,82 0,4976 1,43 0,4236 1,76 0,4608 2,18 0,4854 2,84 0,4977 1,44 0,4251 1,77 0,4616 2,20 0,4861 2,86 0,4979 1,45 0,4265 1,78 0,4625 2,22 0,4868 2,88 0,4980 1,46 0,4279 1,79 0,4633 2,24 0,4875 2,90 0,4981 1,47 0,4292 1,80 0,4641 2,26 0,4881 2,92 0,4982 1,48 0,4306 1,81 0,4649 2,28 0,4887 2,94 0,4984 1,49 0,4319 1,82 0,4656 2,30 0,4893 2,96 0,4985 1,50 0,4332 1,83 0,4664 2,32 0,4898 2,98 0,4986 1,51 0,4345 1,84 0,4671 2,34 0,4904 3,00 0,49865 1,52 0,4357 1,85 0,4678 2,36 0,4909 3,20 0,49931 1,53 0,4370 1,86 0,4686 2,38 0,4913 3,40 0,49966 1,54 0,4382 1,87 0,4693 2,40 0,4918 3,60 0,499841 1,55 0,4394 1,88 0,4699 2,42 0,4922 3,80 0,499928 1,56 0,4406 1,89 0,4706 2,44 0,4927 4,00 0,499968 1,57 0,4418 1,90 0,4713 2,46 0,4931 4,50 0,499997 1,58 0,4429 1,91 0,4719 2,48 0,4934 5,00 0,499997
л т Таблица 3. Значения функции Пуассона Р(т,Х)=—е'- т\ тД 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0 0,90484 0,81873 0,74082 0,67032 0,60653 0,54881 49659 0,44033 0,40657 0,36788 1 0,09048 0,16375 0,22225 0,26813 0,30327 0,32929 0,34761 0,35946 0,36591 0,36788 2 0,00452 0,01637 0,03334 0,05363 0,07582 0,09879 0,12166 0,14379 0,16466 0,18394 3 0,00015 0,00109 0,00333 0,00715 0,01264 0,01976 0,02839 0,03834 0,04940 0,06131 4 0,00005 0,000250 0,00072 0,00158 0,00296 0,00497 0,00767 0,01111 0,01533 5 0,00002 0,00006 0,00016 0,00036 0,00070 0,00123 0,00200 0,00307 6 0,00001 0,00004 0,00008 0,00016 0,00030 0,00051 7 0,00001 0,00002 0,00004 0,00007 8 0,00001 тД 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 0 0,22313 0,13534 0,08208 0,04979 0,03020 0,01832 0,01111 0,00674 0,00409 00248 1 0,33740 0,27067 0,20521 0,14936 0,10569 0,07326 0,04999 0,03369 0,02248 0,01487 2 0,25102 0,27067 0,25652 0,22404 0,18496 0,14653 0,11248 0,08422 0,06181 0,04462 3 0,12551 0,18045 0,21376 0,22404 0,21579 0,19537 0,16872 0,14037 0,11332 0,08924 4 0.04707 0,09022 0,13360 0,16803 0,18881 0,19537 0,18981 0,17547 0,15582 0,13385
Окончание табл. 3 т/Х 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 5 0,01412 0,03609 0,06680 0,10082 0,13217 0,15629 0,17083 0,17547 0,17140 0,16062 6 0,00353 0,01203 0,02783 0,05041 0,07710 0,10420 0,12812 0,14622 0,15712 0,16062 7 0,00076 0,00344 0,00994 0,02160 0,03855 0,05954 0,08236 0,10444 0,123245 0,13768 8 0,00014 0,00086 0,00311 0,00810 0,01687 0,02977 0,04633 0,06528 0,08487 0,10326 9 0,00002 0,00019 0,00086 0,00270 0,00656 0,01323 0,02316 0,03627 0,05187 0,06884 10 0,00004 0,00022 0,00081 0,00230 0,00529 0,01042 0,01813 0,02853 0,04130 11 0,00001 0,00005 0,00022 0,00073 0,00192 0,00426 0,00824 0,01426 0,02253 12 0,00001 0,00006 0,00021 0,00064 0,00160 0, 00343 0,00654 0,1126 13 0,00001 0,00006 0,00020 0,00055 0,00132 0,00277 0,00520 14 0,00001 0,00006 0,00018 0,00047 0,00109 0,00223 15 0,00002 0,00005 0,00016 0,00040 0,00089 16 0,00002 0,00005 0,00014 0,00033 17 0,00001 0,00004 0,00012 18 0,00001 0,00004 19 0,00001 Приложения
Приложение 2. Таблицы 453 Таблица 4. Критические точки распределения хи-квадрат Число степеней свободы к Уровень значимости а 0,01 0,025 0,05 0,95 0,975 0,99 1 6,6 5,0 3,8 0,0039 0,00098 0,00016 2 9,2 7,4 6,0 0,103 0,051 0,020 3 п,з 9,4 7,8 0,352 0,216 0,115 4 13,3 10,1 9,5 0,711 0,484 0,297 5 15,1 12,8 11,1 1,15 0,831 0,554 6 16,8 14,4 12,6 1,64 1,24 0,872 7 18,5 16,0 14.1 2,17 1,69 1,24 8 20,1 17,5 15,5 2,73 2,18 1,65 9 21,7 19,0 16,9 3,33 2,70 2,09 10 23,2 20,5 18,3 3,94 3,25 2,56 11 24,7 21,9 19,7 4,57 3,82 3,05 12 26,2 23,3 21,0 5,23 4,40 3,57 13 27,7 24,7 22,4 5,89 5,01 4,11 14 29,1 26,1 23,7 6,57 5,63 4,66 15 30,6 27,5 25,0 7,26 6,26 5,23 16 32,0 28,8 26,3 7,96 6,91 5,8! 17 33,4 30,2 27,6 8,67 7,56 6,41 18 34,8 31,5 28,9 9,39 8,23 7,01 19 36,2 32,9 30,1 10,1 8,91 7,63 20 37,6 34,2 31,4 10,9 9,59 8,26 21 38,9 35,5 32,7 11,6 10,3 8,90 22 40,3 36,8 33,9 12,3 11,0 9,54 23 41,6 38,1 35,2 13,1 11,7 10,2 24 43,0 39,4 36,4 13,8 12,4 10,9 25 44,3 40,6 37,7 14,6 13,1 11,5 26 45,6 41,9 38,9 15,4 13,8 12,2 27 47,0 43,2 40,1 16,2 14,6 12,9 28 48,3 44,5 41,3 16,9 15,3 13,6 29 49.6 45,7 42,6 17,7 16,0 14,3 30 50,9 47,0 43,8 18,5 16,8 15,0
454 Приложения Таблица 5. Критические точки распределения Стьюдента Число степеней Уровень значимости а (двусторонняя критическая область) свободы к 0,2 0,1 0,05 0,02 0,01 0,002 0,001 1 3,08 6,31 12,7 31,82 63,7 318,3 637,0 2 1,89 2,92 4,30 6,97 9,92 22,33 31,6 3 1,64 2,35 3,18 4,54 5,84 10,22 12,9 4 1,53 2,13 2,78 3.75 4,60 7,17 8,61 5 1,48 2,01 2,57 3,37 4,03 5,89 6,86 6 1,44 1,94 2,45 3,14 3,71 5,21 5,96 7 1,42 1,89 2,36 3,00 3,50 4,79 5,40 8 1,40 1,86 2,31 2,90 3,36 4,50 5,04 9 1,38 1,83 2,26 2,82 3,25 4,30 4,78 10 1,37 1,81 2,23 2,76 3,17 4,14 4,59 11 1,36 1,80 2,20 2,72 з,н 4,03 4,44 12 1,36 1,78 2,18 2,68 3,05 3,93 4,32 13 1,35 1,77 2,16 2,65 3,01 3,85 4,22 14 1,34 1,76 2,14 2,62 2,98 3,79 4,14 15 1,34 1,75 2,13 2,60 2,95 3,73 4,07 16 1,34 1,75 2,12 2,58 2,92 3,69 4,01 17 1,33 1,74 2,11 2,57 2,90 3,65 3,95 18 1,33 1,73 2,10 2,55 2,88 3,61 3,92 19 1,33 1,73 2,09 2,54 2,86 3,58 3,88 20 1,33 1,73 2,09 2,53 2,85 3,55 3,85 21 1,32 1,72 2,08 2,52 2,83 3,53 3,82 22 1,32 1,72 2,07 2,51 2,82 3,51 3,79 23 1,32 1,71 2,07 2,50 2.81 3,49 3,77 24 1,32 1,71 2,06 2,49 2,80 3,47 3,74 25 1,32 1,71 2,06 2,49 2,79 3,45 3,72 26 1,32 1,71 2,06 2,48 2,78 3,44 3,71 27 1,31 1,71 2,05 2,47 2,77 3,42 3,69* | 28 1,31 1,70 2,05 2,46 2,76 3,40 3,66 29 1,31 1,70 2,05 2,46 2,76 3,40 3,66 30 1,31 1,70 2,04 2,46 2,75 3,39 3.65 40 1,30 1,68 2,02 2.42 2,70 3,31 3,55 60 1,30 1,67 2,00 2,39 2,66 3,23 3,46 120 1,29 1,66 1,98 2,36 2,62 3,17 3,37 оо 1,28 1,65 1,96 2,33 2,58 3,09 3,29 Число степеней 0,1 0,05 0,025 0,01 0,005 0,001 0,0005 свободы к Уровень значимости а (односторонняя критическая область)
Таблица 6. Критические точки распределения Фишера—Снедекора (кх — число степеней свободы в числителе, к2 — число степеней свободы в знаменателе) Уровень значимости а = 0,01 ^2 1 2 3 4 5 6 7 8 9 10 11 12 1 4052 4999 5403 5625 5764 5889 5928 5981 6022 6056 6082 6106 2 98,49 99,01 90,17 99,25 99,33 99,30 99,34 99,36 99,36 99,40 99,41 99,42 3 34,12 30,81 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,13 27,05 4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,54 14,45 14,37 5 16,26 13,27 12,06 11,39 10,97 10,67 10,45 10,27 10,15 10,05 9,96 9,89 6 13,74 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72 7 12,25 9,55 8,45 7,85 7,46 7,19 7,00 6, 84 6, 71 6,62 6,54 6,47 8 11,26 8,65 7,59 7,01 6,63 6,37 6,19 6,03 5,91 5,82 5,74 5,67 9 10,56 8,02 6,99 6,42 6,06 5,80 5,62 5,47 5,35 5,26 5,18 5,П 10 10,04 7,56 6,55 5,99 5,64 5,39 5,21 5,06 4,95 4,85 4,78 4,71 11 9,86 7,20 6,22 5,67 5,32 5,07 4,88 4,74 4,63 4,54 4,46 4,40 12 9,33 6,93 5,95 5,41 5,06 4,82 4,65 4,50 4,39 4,30 4,22 4,16 13 9,07 6,70 5,74 5,20 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96 14 8,86 6,51 5,56 5,03 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80 15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67 16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,61 3,55 17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,45 Приложение 2. Таблицы
Уровень значимости а = 0,05 *2 1 2 3 4 5 6 7 8 9 10 11 12 1 161 200 216 225 230 234 237 239 241 242 243 244 2 18,51 19,00 19,16 19,25 19,30 19,33 19,36 19,37 19,38 19,39 19,40 19,41 3 10,13 9,55 9,28 9,12 9,01 8,94 8,88 8,84 8,81 8,78 8,76 8,74 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,93 5,91 5 6,61 5,79 5,41 5,19 5,05 4.95 4,88 4,82 4,78 4,74 4,70 4,68 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,63 3,60 3,57 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,34 3,31 3,28 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,13 3,10 3,07 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,97 2,94 2,91 И 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,86 2,82 2,79 12 4,75 3,88 3,49 3,26 3,11 3,00 2,92 2,85 2,80 2,76 2,72 2,69 13 4,67 3,80 3,41 3,18 3,02 2,92 2,84 2,77 2,72 2,67 2,63 2,60 14 4,60 3,74 3,34 3,11 2,96 2,85 2,77 2,70 2,65 2,60 2,56 2,53 15 4,54 3,68 3,29 3,06 2,90 2,79 2,70 2,64 2,59 2,55 2,51 2,48 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,45 2,42 17 4,45 3,59 3,20 2,96 2,81 2,70 2,62 2,55 2,50 2,45 2,41 2,38 Приложения
Приложение 2. Таблицы 457 Таблица 7. Критические точки для статистики Колмогорова Dn Объем выборки п Уровень значимости а 0,10 0,05 0,02 0,01 1 0,95 0,98 0,99 0,995 2 0,78 0,84 0,90 0,93 3 0,64 0,71 0,78 0,83 4 0,57 0,62 0,69 0,73 5 0,51 0,56 0,62 0,67 6 0,47 0,52 0,58 0,62 7 0,44 0,48 0,54 0,58 8 0,41 0,45 0,51 0,54 9 0,39 0,43 0,48 0,51 10 0,37 0,41 0,46 0,49 11 0,35 0,39 0,44 0,47 12 0,34 0,38 0,42 0,45 13 0,33 0,36 0,40 0,43 14 0,31 0,35 0,39 0,42 15 0,30 0,34 . 0,38 0,40 16 0,29 0,33 0,37 0,39 17 0,29 0,32 0,36 0,38 18 0,28 0,31 0,34 0,37 19 0,27 0,30 0,34 0,36 20 0,26 0,29 0,33 0,35 Критические точки распределения Колмогорова 0(Х) = 1 + 2£(-1)‘е"2Л’ 4=1 а 0,10 0,05 0,02 0,01 ч 1,23 1,36 1,52 1,63
Таблица 8. Критические точки распределения Кокрена (к — число степеней свободы, / — количество выборок) Уровень значимости а = 0,05 //А 1 2 3 4 5 6 7 8 9 10 2 0,999 0,975 0,939 0,906 0,877 0,853 0,833 0,816 0,801 0,788 3 0,967 0,871 0,798 0,746 0,707 0,677 0,653 0,633 0,617 0,603 4 0,907 0,768 0,684 0,629 0,590 0,560 0,537 0,518 0,502 0,488 5 0,841 0,634 0,598 0,544 0,506 0,478 0,456 0,439 0,424 0,412 6 0,781 0,616 0,532 0,480 0,445 0,418 0,398 0,382 0,368 0,357 7 0,727 0,561 0,480 0,431 0,397 0,373 0,354 0,338 0,326 0,315 8 0,680 0,516 0,438 0,391 0,360 0,336 0,319 0,304 0,293 0,283 9 0,639 0,478 0,403 0,358 0,329 0,307 0,290 0,277 0,266 0,257 10 0,602 0,445 0,373 0,331 0,303 0,282 0,267 0,254 0,244 0,235 Приложения
ОТВЕТЫ И УКАЗАНИЯ Глава 1. Элементы комбинаторного анализа 1. 8. 2. 125. 3. 1022. 4. 216. 5. 16’00. 6. З6. 7. 76. 8. 14 670. 9. 256. 10. ЗО3-1О3. 11. ^-4 = 96. 12. 1800. 13. Л35 = 13800. 14* 9* 14. 10!. 15. 9!-8. 16. 5-2-4! = 240. 17. 14-8!. 18. . 19. -. 27 4 10' 20. —. 21. 84. 22. 100. 23. 45. 24. 50 600. 25. 5О-49-С'0. 24 48 26. С^-С2 = 231. 27. 2520. 28. 210. 29. С35 = 2300. 30. С’5С4 =16 824 500. 31. С,2 =36. 32. 165. 33. 1365. 34.28.35.220. 36. 210. 37. 38. (С‘)2. 39. 210. 40. Л,Х(2,3,4)=—. 5!7!4! 4 41. —. 42. 3136. 43. 54. 44. 2(5!)2. 45. 1). З6; 2). 6! Глава 2. Классическая вероятностная модель. Геометрическая вероятность 1. 5/18. 2. 0,52. 3. а) 1/54; б) 1/53; в) 24/53. 4. 0,994. 5. 0,00756. 6. 0,35. 7. 0,082. 8. 0,384. 9. 50/81. 10. 0,264. И. а) 0,765; б) 0,619; в) 0,215. 12. а) 2/3; б) 0,461; в) 0,154. 13. 50/81. 14. а) 0,381; б) 0,513. 15. 0,215. 16. 0,1008. 17. 0,085. 18. 25/63. 19. 2/7. 20. 0,155. 21. 0,0476. 22. 1/7. 23. а) 5/18; б) 3/18; в) 5/9. 24. 0,43. 25. 0,067. 26. а) 0,603; б) 0,612. 27. а) 0,238; б) 0,124. 28. а) 0,152; б) 0,758; в) 0,197; г) 0,657. 29. а) 0,725; б) 0,322; в) 0,305; г) 0,459. 30. 0,17. 31. 0,47. 32. 0,094. 33. 0,126. 34. а) 0,892; б) 0,903. 35. а) 2/7: б) 0,135. 36. 0,9. 37. 1-(11/12)2. 38. 49/64. 39. 8/9. 40. 4/9. 41. 0,88. 42. 0,6. 43. 49/63. 44. 0,2. Указание: запишите условие задачи в виде неравенства, изобразите графически события и вычислите площади с помощью интегралов (1п9 « 2,2). 45. 0,5. Введите пространственную систему координат. Возможные значения х, у, z — от 0 до L. События, благоприятствующие условию задачи, x<y+z, y<x+z, z<x+y.
460 Ответы и указания Глава з. Основные формулы теории вероятностей 1. a) AtА2Л, + А,А2А, + А1А2А); б) А{А2А3\ в) Л1Л2Л3, Р - 0,488. 2. а) Л1Л2Л31 б) Л,Л2Л, + Л,Л2Л3 + А]А1А,; в) AtA2A3 , р - 0,784. 3. а) Л,; б) 44; в) Д; р = 0,09. 4. п > 17. 5. 0,5. 6. 0,075. 7.0,75.8.0,099. 9.2/9. 10.0,114. 11.0,4. 12. а) 0,38; б) 0,25; в) 0,41; г) 0,59. 13. 0,2499. 14. 0,2334. 15. 0,781. 16. 0,66. 17. 0,535. 18. 0,512. 19. 0,5. 20. 0,5. 21. 0,476. 22. 2/7. 23. 0,51. 24.0,67. 25.7/15. 26.0,98. 27.0,2. 28.0,014. 29.0,24. 30. а) 0,1424; б) 0,1756. 31. 0,085. 32. а) 0,562; б) 0,5072; в) 0,34; г) 0,722. 33. 0,9148. 34. 0,0631. 35. 17/45. 36. 0,282. 37. 0,3098. 38. 0,58. 39. 0,328. 40. 34/55. 41. 5/9 42. а) 0,077; б) 1/46; в) 1/41. 43. 0,182. 44. а) 5/9; б) 0,308. 45. а) 15/22; б) 8/13. 46. 0,00207. 47. 0,138. 48. а) 0,83; б) 0,777. 49. а) 12/13; б) 51/57; в) 56/59. 50. а) 3/5; б) 7/13. 51. 4/45. 52. 6/17. 53. 23/32. 54. Стрелок В попал в мишень с вероятностью 10/19 и не попал с вероятностью 9/19. Более вероятно, что он попал. 55. Стрелок В попал в мишень с вероятностью 10/19 и не попал с вероятностью 9/19. Более вероятно, что он попал. 56. 0,75. 57. 5/12. 58. 2/9. 59. 12/19. 60. 12/37. Глава 4. Повторные независимые испытания 1. 0,05. 2. 0,058. 3. 0,0081. 4. 0,05. 5. 0,82. 6. 0,463. 7. а) Ве- роятнее выиграть одну партию из двух; б) вероятнее выиграть две партии из четырех. 8. 7. 9. 7/16. 10. а) 15/128; б) 0,205; в) 0,044. 11. п > 5. 12. 0,4096. 13. 0,813. 14. 0,384. 15. 9; 0,24. 16. а) 2; б) 0,324; в) 0,0109. 17. 5; 0,2078. 18. а) 299; 2 и 3; б) 174; 3 в) 228; 4. 19. а) 2; 0,678 б) 1; 0,443. 20. п = 33, 34, 35. 21. 21. 22. п = 11, 12, 13. 23. п = 14, 15, 16, 17. 24. а) 0,079; б) 0,04. 25. а) 0,042; б) 0,007. 26. а) 2Ф0(2,5) = 0,9876; б) 0,5. 27. 0,5 - Фо(1,09) = 0,1379. 28. а) 576; Ф0(2) + Фо(1) = 0,8185; б) 640; Фо(0,88) + Ф0(3,54) « 0,8104; в) 320; 0,5 + ФО(2,5) = 0,9938; г) 500; Фо(2) + Фо(1) = 0,8185. 29. а) Фо(2,14) + 0,5 = 0,9838; б) Фо(3,57) + 0,5 = 0,9998. 30. а) 200; 2Ф0(2,14) = 0,9676; б) 162; 2Ф0 (1,98) = 0,9522; в) 20; 2Ф0(2,26) = 0,9762. 31. а) 0,5 - Фо(1,94) = 0,0262; б) 0,5 - Фо(2,74) = 0,0031. 32. 0,5 + Ф0(1,45) = 0,9265. 33. 25; 2Фо(2,О5) =0,96. 34. ФО(3,75) +
Ответы и указания 461 + Фо(2,5) « 0,9937. 35. Фо(О,83) + Фо(3,33) « 0,7964. 36. 0,5 + + Фо(0,89) = 0,8133. 37. е = 0,057. 38. От 131 до 169. 39. От 65 до 95. 40. От 73 до 107. 41. От 81 до 119. 42. 289. 43. 666. 44. 0,998. 45. От 3904 до 4096. 46. а) 0,00125; б) 0,998. 47. 0,92. 48. а) 0,616; б) 0,63. 49. а) 3; 0,647 б) 3; 0,452. 50. 0,195. 51. 0,875. 52. а) 0,135; б) 0,676. 53. 0,175. 54. а) 0,125; б) 0,433; в) 0,285. 55.0,981. Р{т^1} = 1-Р(0) = 1-е’х =0,632.Отсюда и Р{/п<3} = /’(0) + /*(1) +А2)+Р(3) = 0,981 (формула Пуассона). 56. 3; 0,224. 57. 0,08505. 58. 0,131. 59. 10/81. 60. а) 0,14375; б) 0,0612. 1лава 5. Дискретные случайные величины Теоретические задачи 1. Воспользуйтесь разложением £— = ех. 2. Воспользуйтесь k=Q к' представлением £ = £,+... + £„, где ^=0 в случае неудачи в /-м испытании, и = 1 в случае успеха. 3. Воспользуйтесь тем, что лр"-' =(р’У. Вычислительные задачи 4. 0 1 2 3 р 1/8 3/8 3/8 1/8 0 1 2 3 4 5 р 0,59049 0,32805 0,0729 0,0081 0,00045 0,00001 6. 5 0 1 2 3 р 0,006 0,092 0,398 0,504 7. 0 1 2 3 р 0,002 0,044 0,306 0,648 8. к 0 1 2 3 р 0,893475 0,103075 0,003425 0,000025
462 Ответы и указания Q 0 12 3 4 У. P 0,53439 0,36251 0,0922 0,0104 0,00044 $ 1 2 3 10. — P 0,7 0,21 0,09 5 2 3 4 11. P 1 1/4 1 1/4 1/2 a 2 3 4 12. a) — P 0,81 0,162 0,028 5 3 4 5 б ' P 0,729 0,2187 0,0523 . 3 4 5 6 7 P 0,8574 0,1286 0,0129 0,0011 S, 2 3 4 5 6 I ’ P 0,64 0,256 0,0768 0,02048 0,00672 £ 2 3 4 5 6 7 P 0,81 0,162 0,0243 0,00324 0,00046 E 2 3 4 13‘ a) | P | 1/15 7/60 49/60 £ 2 3 4 5 ' P 5/22 3/11 5/22 3/11 £34 5 a) P 10/143 21/143 112/143 £ 2 3 4 5 i j P 7/22 7/22 7/33 5/33
Ответы и указания 463 2 3 4 5 р 3/28 5/28 3/14 1/2 2 3 4 5 р 2/15 1/5 3/14 19/42 5 2 3 4 р 2/9 5/18 1/2 $ 1 2 3 4 р 0,4 0,3 0,2 0,1 1 2 3 4 р 1/2 3/10 3/20 1/20 5 -2 -1 0 1 2 р 1/9 2/9 1/3 2/9 1/9 -з -2 -1 0 1 2 3 р 1/27 1/9 2/9 7/27 2/9 1/9 1/27 17. а) Mt, = 0,6 -2 -1 0 1 2 р 0,09 0,06 0,37 0,12 0,36 б) Mt, = 0,2 -2 -1 0 1 2 р 0,16 0,08 0,41 0,1 0,25 в) Mt, = 1 -2 -1 0 1 2 р 0,04 0,04 0,29 0,14 0,49 18. Mt, = 187,2 (руб.) t, 0 1 2 3 р 0,1 0,63 0,243 0,027
464 Ответы и указания 19. а) Mt, = 1,264 К 0 1 2 3 р 0,3 0,28 0,294 0,126 б) Mt, = 1,152 5 0 1 2 3 р 0,2 0,48 0,288 0,032 20. Mt, = 2,05 5 1 2 3 р 0,3 0,35 0,35 21. a) Mt, = 1,9656 £ 0 1 2 3 4 р 0,1 0,18 0,432 0,2304 0,0576 б) Mt, = 1,8792 5 0 1 2 3 4 р 0,1 0,18 0,504 0,1728 0,0432 в) Mt, = 1,8324 5 0 1 2 3 4 р 0,1 0,27 0,378 0,2016 0,0504 22. a) Mt, = 2,952 £ 1 2 3 4 р 0,2 0,16 0,128 0,512 б) Mt, = 2,7731 5 1 2 3 4 5 р 0,3 0,21 0,147 0,1029 0,2401 в) Mt, = 3,6893 5 1 2 3 4 5 6 р 0,2 0,16 0,128 0,1024 0,08192 0,32768 23. Mt, = -1,3 (руб.) 5 -5 5 95 р 0,72 0,27 0,01
Ответы и указания 24. Mt, = -30/49 (руб.) $ -10 10 90 р 30/49 18/49 1/49 25. a) Mt, = 1,8 5 0 1 2 3 р 0,042 0,284 0,506 0,168 б) Mt, = 1,7 X 0 1 2 3 р 0,035 0,365 0,465 0,135 в) Mt, = 1,7 5 0 1 2 3 р 0,056 0,332 0,468 0,144 26. a) Mt, = 2,2 5 0 1 2 3 р 0,012 0,154 0,456 0,378 б) Mt, = 2 5 0 1 2 3 р 0,03 0,22 0,47 0,28 29. Щ = 1,624; 2^ = 0,811. 30. Щ = 14; Dt, = 35/3. 31. а) Р{^>2} = 1-Р{^<2} = 1-Р(0)-Р(1)-Л2) = 1-5е-2 =0,323; б) Р{^<1} = Р(0) + Р(1) = Зе’2 =0,406; в) Р{^<2} =5е’2 =0,677. 16- Теория вероятностей
466 Ответы и указания 32. 5 (геометрическое распределение). 33. 4 (геометрическое распределение). 34. 40,96. 35. а) 12; б) 18. 36. а) Mt, = 11/2, = 27/4; б) Mt, = 25/3, Dt, = 130/9; в) Mt, = 137/12, Dt, = 3625/144. 37. ЛГ^ = 3/2; Z)^ = 3/4; ст = ^/2; Р{-1<^<3/2} = 1/2; F(x) = о, х<0, 1/8, 0 < х < 1, 1/2, 1 <х<2, 7/8, 2 < х < 4, 1, х>4. 38. Л/^ = 7/4; 2^ = 55/16; а«1,854; Р{5/2<^<5} = 1/8; 0, х<-1, 1/4, -1<х<2, F(x) = < 3/4, 2<х<3, 7/8, 3<х<5, 1, х > 5. 39. Mt = 49/18; ^«2,312; ст«1 0, х < 0, 1/9, 0<х<1, Лх) = - 1/3, 1<х<3, 1/2, 3<х<4, 1, х > 4. 40. Mt = 0; D^ = 18/7; ст«1,604; 0, х<-2, 1/7, -2<х<-1, F{x) = < 4/7, - 1<х<1, 6/7, 1<х<3, 1, х>3. Р{-3/2<£<2} = 5/7;; 1,52; Р{1/2<^<7/2} = 7/18; 41. 1/4. 42. 1/6. 43. 1/3 и 1/6. 44. 1/6 и -1/4. 45. cov(£ + r|,£-r|) = -0,44 ; £ и г| зависимы.
Ответы и указания 467 t, -1 0 1 2 р 1/5 2/5 1/5 1/5 46. cov(2£-3t],£ + 2t|) = -13/6 ; £ и т] зависимы. 5 -1 0 1 р 5/12 1/3 1/4 47. cov(2t| + £,t| + £) = 176/81 ; £ и т] зависимы. 5 -1 0 1 2 3 р 1/9 1/6 4/9 1/18 2/9 48. cov(£-r|,2£ + r|) = -47/36; £ и г| зависимы. $ -1 0 1 2 3 р 1/8 1/4 1/12 1/6 3/8 49. cov(2£ + r|,3£-r|) = 406/81; и т] зависимы. X -2 -1 1 2 р 1/6 2/9 2/9 7/18 I 50. cov(r|, т] 4- 4£) = 4,69 5 -2 -1 0 1 3 4 р 1/10 1/10 1/5 1/10 1/5 3/10 51. cov( + 51], 2Е, - 7т])= -15,3 - 0 1 2 3 4 р 0,05 0,1 0,15 0,1 0,2 0,4 52. cov(^ - Зть л + 6^) = -143/49 к -2 -1 0 1 2 р 1/7 1/7 2/7 2/7 1/7 53. cov(4^ - п, 2т] + ^) = 1226/225 -3 -2 0 1 3 р 2/15 1/5 2/5 1/15 1/5
468 Ответы и указания 54. cov(2^- т], П- ЗУ = —21/8 $ - -3 -2 -1 0 р 1/12 1/4 1/6 1/4 1/4 55. 0,356. 56. 0,6. 57. а) 153,76; б) 119,29; в) 116,41. 58. 6 акций первой компании и 4 акции второй компании. 59. 9 акций первой компании и 3 акции второй компании. 60. 6/7 — в акции первой компании, 1/7 — в акции второй ком- пании. 61. Все в акции первой компании. X 0 1 2/3 1/3 У -1 0 1 0,2 0,4 0,4 У -1 0 1 2/3 1/3 1/2 X 0 1 ФпК 0,2 0 X -1 1 Л|л(х|-1) 1/4 3/4 У -1 0 1 ^П) 1/2 1/6 1/3 У -1 0 1 Ф«п 1/2 -1/2 0
Ответы и указания 469 65. Биномиальное распределение с параметрами п и р--------------------------*—, А»। Ч" ^*2 JtX функция регрессии cp^)T1(fc) =-----------—, к = 0, 1, 2, п. 1 + Л<2 Глава 6. Непрерывные случайные величины Теоретические задачи 1. Воспользоваться формулой для плотности функции от слу- чайной величины. 2. a) Ph, < х) = 1 - Р(^ > х,$2 > х,...Л„ £ х) = 1 -(Л£ > х))я = 1 - е~апх; б) Р(п2 < х) = Р(^ < хЛ2 < х,...Ля < х) = (Р($ < х))я = (1 -е'^У . 3. Найти функции распределения для гц и т|2 методом, использованным в задаче 2, и найти их математические ожидания. 4. а) а = —;б) F(x) = —+ —arctgx ; в) Р{-1<£<1} = 1/2 . 71 2 71
470 Ответы и указания 5. а = Ь Щ = 0,^ = А; р{|£|<^) = 1-е-л «0,75 ; Р{|^|<з7^} = 1-е-зл «0,98. 6. а) 0,9974; б) 0,9817; в) 1. 7. р(х)=-(1-Ш|х|<а; j|^ = 0; Z^= £1 < а)" 6 8. Воспользоваться методом геометрической вероятности: Р(р<х)=Л^+п2<х2)=-^=4; хеМ; mp=\r,dp~. ПК К э 1 о 9. a) = - t{b-a)' [1, еы -еа1 /*0- ч /х V б) ^(0 = 73—2, Л ~ I / = 0; 10. Указание. Изучить соответствующие интегралы на сходимость. Вычислительные задачи 11. а) С = 2/9; F(x) = б) С = 2/33;Г(х) = 0, (х + 1)2 9 1, х<-1; -1<х<2; ЛГ^ = 1;Р{^<1} = 4/9; х>2; 0, -х2 + 10х + 24 33 1, х<-2; -2<х<1; х>1; Л/^ = -7/11;Р{0<^<2} = 3/11; 0, в) С = 1/4; Лх) = х<3; 3<х<5; х>5; Щ = 25/6;Р{4<^<6} = 5/8;
Ответы и указания 471 г) C = l/20; F(x) = О, х<-1; -1<х<3; 40 1, х > 3; М; = 19/15;Р{2<£<5} = 13/40; Д) С = 2/63;Г(х) = О, х < -5; -5<х<2; 63 1, х>2; ЛЛ; = -65/27;Р{0<^<5} = 8/63. О, х3 -Зх + 2 20 ’ 1, ЛГ^ = 12/5;/»{2<^<5} = 4/5; О, х« *‘+9*+26. 2s 36 1, х > 1; Л^ = -11/16;Р{-1<$<2} = 5/9; 12. а) С = 3/20;Р(х) = б) С = 1/12;Р(х) = 1 <х<3; в) C = 0,03;F(x) = О, х<-3; -хЧ27х + 54; _3^2. 100 1, Щ = -3 /16; Р{0 < £ < 3} = 0,64; г) С = 2 / 57; Р(х) = О, 2х3 +3х2 -5 171 1, 1<х<4; Щ = 113/38; Р{3 < < 6} = 5/9;
Ответы и указания О, д) С = 1/18;Р(х) = 54 1, , 2<х<5; Л/!; = 33/8;Р{1<$<4} = 10/27; О, х4 + 4х - 24 1296 ’ 1, е) С = 1/324; F(x) = 2<х<6; Щ = 652/135; Р{5<$ <7} = 25/48; ж) С = 1/24;Г(х) = - О, х4+8х-9 96 1, , 1<х<3; Щ = 47/20;Р{0<^<2} = 23/96. О, х < 5; 5<х<8; In 4 1, х>8; 13. а) С = 1 / 1п4; Р(х) = Л/£ = 4+^;Р{3<£<6} = 1/2; б) С = 1/1п5;Р(х) = О, 1п(х + 2) In 5 1, -1<х<3; 1ZE 4 „ nfn Е , 1п2 Л/£ =----2;Р{0<Е<2} = 1-----; 1п5 * s ' 1п5 в)С = 1/1п2;Р(х) = О, х<-2; nCHW-x» _2<х<3; 1п2 Л/^ = 8—— ;Р{2<^<5}=^^; 5 1п4 ' ’ 1п2
Ответы и указания 473 0, х<-1; г) C = l/ln2;F(x) = . 1п((х + 6)/5) . , 1 S X S ч, 1п2 1. х > 4; Щ = —-6;Р{0<^<5} = 1п(10/6). , . „ , „ [0, х<0, 14. C = l/2;F(x) = < ... математическое ожида- [1—(х + 1) ' , х>0; ние и дисперсия не существуют; Р{|^-1/3|<1} = 1-(7/3)'1/2. 15. C = 3/4;F(x) = < VI 7 * VI v Д! л X 1 к гч + > тГ 1 . X от Щ = 0;^ = 1/5;Р{|^-1/2|<1/4} = 35/128. 16. С = 1;Г(х)={^’ Х^; 1И^ = -1,^ = 1;Р{-2<^<1} = 1-е’2 =0,86. 17. p(x)=|e'w; ЛГ^ = 0,Р^ = 2;Р{-1<^<3}«0,79. 18. р(х) = 12“2х’ хе1°’1,; М^ = 1/3,^ = 1/18. [О, хе[ОД]; 19. Указание', доказать, что случайная величина г| = тах(£,24-£) распределена по равномерному закону на [12; 24]. Ответ: 18 см. 20. Указание: доказать, что случайная величина r| = min(^,12-y распределена по равномерному закону на [0; 6]. Ответ: 3 см. 0, х<0; 21. F(x) = < X х2 —, 0<х<10; 6 150 1, х>10. 22. F(x) = Среднее время ожидания — 3,89 0, 13 3 2 1 з X X + X 60-------------200-3000 ’ 1, минуты.
474 Ответы и указания Среднее время ожидания — 3 мин 20 с. 23. а) 1/9; б) 0,21. 24. а) 0,607; б) 0,135. 25. а) 0,041; б) 0,112. 26. 1 ч 40 мин. 27. 2 ч 5 мин. 28. 2 ч 20 мин. 29. 1 год 4 мес. 30. 2,4 года. Глава 7. Функции от случайных величин. Непрерывный случайный вектор Теоретические задачи х<0, х<-а, 1. а) х>2а; 1 а2 в) р(х) = —Ий—,0<х<а; а1 х г) р(х) = х>а; 0, х < 0, 1/2, 0<х<1, 1/(2х2), х£1. 2. Достаточно доказать это свойство для «центрированных» случайных величин, т.е. для тех, у которых = 0. Воспользоваться формулой свертки, учитывая соотношение [e~ax2dx = . — . _i Va 3. Рассмотреть функцию распределения для q. Вычислительные задачи 4. С = -, р(х) = -4= при х е (0, 1]; Р(0,25 < п < 0,64) = 0,3. 2 2\1х 2 ( 1 А 5. р(х)=-т|1— при х>1. X V х) 6. а) р(х) = —Д= при хе[2,10];
Ответы и указания 475 б) р(х) = ^-у=== при хе[2,10); в) р(х) = —при хе[9,25]; 4л/х г) р(х) = ^х~2/3 при хе[1,27]; 6 д) р(х) = |х при xe[\/2,-j5]; е) р{х) = 2х при хе[0,1]; ж) р(х) = -!у при х>1/3; Зх з) р(х) = Д- при хе[2,3]; х и) р(х) = -^р7Г при х>1/4; к) р(х) = ^-е'х при хе [-In 3,0]. 7. а) р (х)= -г—-,х>—1; Vx + 1 б) рл(х)=-|(х -1)~2/3е’2(х’|,1/3, х > 1; в) рАх) = —х > 1; ” (х-1)2 2 г) р(х) = -—-у, х>0; (х + 1)3 д) рл(х) = 2е’2<г|,+х, х > 0 . 8. а) р(х) = е х при х>0; б) р(х) = —^=е‘х7х при х>0; 2Vx в) р(х) = 2Ххе_>л2 при х>0; г) равномерное распределение на отрезке [0, 1].
476 Ответы и указания PW = W2b^'’ '"РИ ”°; б) />л(х)=—^=(х-1)'2/3е,х*2; 9у2я в) Мх)=^х’2,3‘-2<^х*°; 1 —^1пх)2 г) р(х) =—г^-е 8 при х>0; 2\/2пх Д) X2 (х3-1): Рл(х) = -^=е 18 у 2 71 10. а) рп(х)=-------—ттт-, х # 0; л Зл(1 + х2/3)х2/3 б) рл(х) = 1/л, хе(-л/2,л/2); в) Рп(-Х) =----------5---, х > 0 . л л(1+(1пх)2)х х 3/3 + Зх 2/3 11. а) р(х)=-------------- при хе[0,64]; б) р(-х) = о?6 * < при хе (10,30]; 8>/х + 6 в) ^^бЗх372 ^8-^) П₽И х-1/49: 2 г) р(х) =—(9-ех)ел при х е[1п6,1п9]; ч z . 8-ln(x + l) r .j , з „ д) ~;о; -----------L ПРИ ^е[е -1,е -1]. 12. а) р(х) = — (х5-2х3) при xg[V2,2]; б) p(x) = -j^x(x4 +2х + 2) при хе[0,\/3]; х/х 3f6 1) , .с в) ^(х)=т^гт—г при *^/5; 100x4 х х )
Ответы и указания 477 г) Р(х) = -|твх(е2х -1) при х е [1пЗ, In 9]; 2.2.0 д) р(х)=-^(е2х-1)ех при хе[0,In4]; 1 о \ \ 1 ( 6 12 8 - 'ч /ел ъ) р(х)=77ТТ 2—+~—Г ПРИ хе[-2,-2/5]; 162х V х х х 2 ж) p(x)=;i v;g~;—г при ; (1п2)(8-1пх)х з) р<х)= , эх/, л —Г" при лгеП,е5]. (1п2)(10-1пх)х 13. а) 0,415; б) 1142,7; в) 287,5. 14. а) 116,2; б) 117,6. 15. а) 0,73; б) 10 920; в) 1143,5. 16. а) 0,46; б) 5859,375. 0, Х<1 0, х<3 17• а) д.+л(х) = < х —1 2 ’ 1/2, 1<х<2 2<х<3 б) р^п(х) = - х-3 , . , 3<х<4 2 1/2, 4<х<5 в) Р^(х) = - 4-х 0, 0, х —1 4 ’ 1/4, 3<х<4 х>4; х<1 1<х<2 2<х<5 г) р^(х 6- 2 0, ) = • —, 5<х<6 х>6; 0, х<3 х-3 , , , 3<х<5 4 Д) Р^п(х) = < О I 00 1 Р I 04 lx-'*4 | * 5<х<6 х>6; х<0 0<х<1 1<х<7 7<х<8 х>8. 7-х . _ , 5<х<7 4 0, х>7;
478 Ответы и указания 0, х < 0 18. а) р^п(х) = < 1-е-2х, 0<х<1 (е2 —1)е~2х, х>1; 0, х<0 б) Р^п(х) = < (1-е'2х)/3, 0<х<3 (е6 - 1)е’2х / 3, х > 3; 0, х < 0 в) P^(x) = i (1-е’5х)/2, 0<х<2 (е10 - 1)е‘5х / 2, х>2; 0, х<-1 г) Р^х) = - (1_е-3(х+1>)/2, -1<х<1 (е3 -е~3)е“3х /2, х > 1; Д) Р^(х) = О, 1-е2‘2х, (е4 -е2)е~2х, х<1 1<х<2 х>2. 19. а) />(х) = 6(е“2х-е’3х) при х>0; б) р(х) = у<е’2х-е~5х) при х>0; в) р(х) = 12(е~*х -е*х) при х>0; г) р(х) = -(е“х-е"5х) при х>0; 4 д) р(х) = 20(е'4х-е'5х) при х>0. 20. а) 3,5 ч; б) 3/4. 21. а) 5 ч; б) 1/2. 22. 0,748. 23. 0,694. 24. Во всех случаях случайные величины и г) зависимы. а) р^х) = ^-yl9-(х-1)2, хе[-2,4); Р,(У) = У е 1-3,3); Л1.3) = 1/2; 9л б) р?(х)=^-->/б4-х2,хе[-8,8]; РЛ(У) = -^->/б4-(у-3)2, у е [-5,11]; F(0,3) = 1/4; 1 Ч /гг
Ответы и указания 479 в) р^х) = ^-^25 - (х - 2)2, х е [-3,7]; Р^У) = -^25-у2, у е [0,5]; F(2,5) = 1/2; 2эП г) р№ = 7Т~^49 - *2 >х е I"5- 5]; 49л Рл( У) = -^-^-(у-5)2, у е [-2,12]; F(0,5) = 1/4; л 49л д) д,(х)=-^->/9 - х2, х е [0,3]; 9л Р„Ы=^-т/9-(У-2)2, у 6 [-1,5]; F(l,3) = 1/2. м 9л 25. Во всех случаях случайные величины и q зависимы. a) />5(x)=^J^,xe[-10,10]; Рл(у) = 10~^0~31 У 6 [-7,13]; Л5.8) = 3/4; б) ^(х) = ^^,хе[-6,6]; А,(У) = 6~1У/41 У в [-2,10]; ЛЗ,7) = 3/4; Зо в) А(х) = — Лхе[-3,5]; 10 Рл(у)=^, У е [-4,4]; ЛО-1) = 1/16; г) А(х) = ^й,хе[-6,6]; Рл(у) =^, У е [-3,3]; Л-1-1) = 1/16; д) Л<х> = х е 1-3,3]; Рл(у) = ^L, у е [0,3]; ЛМ) = 7/18; е) А(х) = х е [0,2]; Pri(y) = j, у е [0,2]; ^(1,3/ 2) = 1 / 2 ;
480 Ответы и указания ж) р5(х) = 4-1* t х е [-3,5}; Р1>(у) = у е [-1,7]; F(2,5) = 21/32; з) (х) = х е [-6,6]; рл(у) = 3 31, у е [0,6]; F(4,4) = 13 /18. 8 — у pn(y)=^-,ye[0,2];F(\,\) = \/S. Случайные величины и т] зависимы. 3 27. Р„(х) = —(4-(x-2)2),xg[0,4]; Р'М = A У е l°> 41 F<2’4) =1 /2- 10 Случайные величины £ и q зависимы. 28. 1/32. 29. 15/16. 30. /\л(х,у) = 1/36 0, X й[-6,6] внутри трапеции, Р^(х) = ' х + 6 ~тГ' 1/9, m 1 m V V X X V V Mj, 7 6-х ~тГ' 3 < х < 6; О, уе[0,4]; Д,(у)=^8-у —, У 6 [0,4]. Случайные величины £ и г| зависимы. 31. pJx) = 2(1-x),xg[0, 1],рл(у) = 2у,у g[0, 1]; случайные величины £ и т| зависимы; м(£т]) = 1 / 4. 32. р^(х) = 2е2х,х<0,рл(у) = -4уе2>,у<0, случайные величины £ и т] зависимы. оа \ л 1 ч sinx + siny-sin(x + y) 33. а) А = 1/2; б) F(x,y) =----------------—;
Ответы и указания 4$1 ч . 1-cosx + sinx z . sinx + cosx гл /П1 в) /^(х) =--------------; р^(х) =-----------; х е [0,я/2]; случайная ч z . . sin(x + у) . величина г| распределена так же; г) р^\х | у) = > х е [0,л/2], _Ие[0,я/2]. 34. а) р(х, у) = 1 + а(1 - 2х)(1 - 2у), х, у g [0, 1]; р (х) = 1, х g [0, 1]; Д,(У) = 1, У е {0, 1]; б) а е [—1, 1]; в) а/3; г) (2ау — а + 3)/6. 35. FpK(x\y) = Jx2-y2, хе[у,у]у2 + 1]. -1SXS0; -, OjJxjJI; 36. а) ФЩп(у) = - 2Д3 л< 4 6-5х , , 1£х£2. [5 1 4 37. Равномерное распределение на отрезке [0, /]. 38. а) поднимется на 2,8%; б) опустится на 1,4%. 39. а) 52; б) 44. 40. а) 24; б) 12,5. Глава 8. Закон больших чисел. Центральная предельная теорема Теоретические задачи 1. Везде - да, по теореме 5. 2. Выполняется. 3. Применить неравенство Чебышева к случайной величине п 1=1 4. Неравенство Чебышева дает оценки: Р||^-а|^ст}^1, Р{|£-а|£Зст}^1/9 = 0,11. Непосредственное вычисление этих веро- ятностей дает P{|lj-a|£ ст} = 0,3174, Р{|£-а|£Зст} = 0,0027. 5. М^ = 0,ст = —; Р{|$|<ст}=1-е’Л=0,75; Р{|^|<3ст} = 1-е‘3^ =0,98. Неравенство Чебышева приводит к оцен- кам: Р{|^|<ст}^0;Р{|^|<Зст}^0,89.
482 Ответы и указания Вычислительные задачи 6. >0,4. 7. а) <0,75; б) >0,5. 8. а) >0,5; б) <2/3. 9. <0,1. 10. £0,16. 11. a) S0,89; б) s0,93. 12. s0,93. 13. >0,91. 14. Нера- венство Чебышева дает оценку п > 16 000, а следствие из интеграль- ной формулы Муавра—Лапласа п >4356. 15. Р(|л1-лр|<х) = 0,99, от- сюда х я 2,57у]npq «103. Величина т находится в пределах 8000 ± 103 по ЦПТ, и 8000 ± 400 по неравенству Чебышева. 16. л >294. 17. а) 0,92; б) 20 мин. 18. Не менее 8310 единиц. 19. 0,0287. 20. От 237 до 363. Указание: применить ЦПТ, учитывая, что на каждую подвергнутую контролю деталь приходится геометрически распределенное (р = 1/3) число деталей, сошедших с конвейера. 21. От 2304 до 2696. 22. 0,9177. 23. 245. 24. 0,94. 25. 0,9606. 26. 0,9938. 27. 0,9876. 28. 0,7881. 29. 0,9649. 30. 0,9927. Глава 9. Цепи Маркова 1. а) (0,0065; 0,0523; 0,9412); б) (1/28, 3/28, 6/7). 2. Доля безработных — 1/9. Сократится в 17/9 ® 1,89 раза. 3. (18/23, 3/23, 2/23). 4. (0,079; 0,658; 0,263). 5. (1/31, 20/31, 10/31). 6. а) (143/400, 171/400, 86/400); б) (15/41, 18/41, 8/41). 7. (0,5; 0,2; 0,3). 8. (4/9, 13/54, 17/54). 9. а) (25/54, 23/54, 1/9); б) (4/15, 42/75, 13/75). 10. а) (1/8, 17/32, 11/32); б) (7/36, 5/9, 1/4). 11. а) (0,027; 0,076; 0,217; 0,68); б) (0,125; 0,183; 0,242; 0,45). 12. (1/9, 8/9). 13. (1/169, 24/169, 144/169). 14. (8/125, 36/125, 54/125, 27/125). 15. 70,4%. 16. а) 0,013; б) 0,554; в) 2,216; г) 1,001. 17. 8/9. 18. а) (0,282; 0,339; 0,271; 0,108); б) 0,49; в) 1,2. 19. а) (0,00046; 0,00729; 0,05837; 0,31129; 0,62259); б) 0,00821; в) 0,44353. 20. а) не более 7,32 мин.; б) не более 8,54 мин. 21. а) 0,211; б) 0,237; в) 0,237. 22. а) 1/2; б) 1/12.
Ответы и указания 483 Глава ю. Основные понятия и задачи математической статистики 1. а) к = 9; б) к = 10. 0, x<48,l; 16. F(x) = < o, 0,2, 0,4, 0,6, 0,8, 1, x<l,2; l,2<x^3,7; 3,7<x<4,8; .о /, 17. F(x) = \ 4,8<x<5,l; 5,l<x59,2; x>9,2. 0,2, 0,3, 0,5, 0,6, 0,7, 0,8, 0,9, 48,1 <x< 49.1; 49,1 <x< 49,7; 49,7 <x <50,0; 50,0<x<50,l; 50,1 <x <50,3; 50,3<x<50,5; 50,5 <x <51,6; 1, x >51,6. Глава и. Точечные оценки параметров законов распределения Теоретические задачи 3. АГ (£ - М$ = + 2(М&; = а3 - За2х + 2х3; М^-М^ =М^ -4М^М$ + 6М^(М&-3(М&; ц4 = а4 - 4а3х 4- 6а2х2 - Зх4. 10. 6 = xmax+—. п 1L ® = (1 + рл)Хт“’ 12. Оценка неэффективна, ее дисперсия бесконечна. Вычислительные задачи 13. s2 = 0,035. 14. а) х = 10; б) ст = 2,5; s2 =3,33. 15. х = 2504,88; 254,41. 16. х = 50,01; s>= 1,05; 5 = 1,02; х= 49,9; х . = 48,1; х = 52. 17. х = -0,4; ?= 128,85; Xmod = -2,5. 18. a) x = 1,535; s2 = 3,39, 5 = 1,84; 6) x = 1653; ?= 446037, 5 = 667,86; в) x = 15,6; 19,9; 5 = 4,38. 19. В группе I: x = 96,17; s2 = 30,49;
484 Ответы и указания в группе II: х = 88,75; s2 = 25,99; общие: х = 93,2; s2 = 41,59. 20. а = 1508,8; ст= 24 (м). 21. а = 19,31; а = 0,73 (мм). 22. а = н.ЗЗ (мк). 23. х = 198,96; s2 = 9,45. 24. х = 71,11; ?= 264,52; s = 16,26; xm = 69,3; х. = 47,9 77 77 7 7 mca 7 7 min 7 88Л 25. x = 35,54; ? = 55,45; 5 = 7,45; xmcd= 34,5; x^ 27; xmax= 47. 26. x = 15,85; №= 4,69; s = 2,17; x .= 15,45; x .= 12,9; x= 19,4. 7 7 7 7 7 7 mca 7 7 min 7 7 max 7 27. x = 2127,46; 7 078 286; j = 2660,5; x = 1134; x = 1000; ’ ’ 7 77 mca 7 min 7 X = 10 358. max 28. x = 1148; ?= 18937,16; 5 = 137,61; xm, = 1105; x . = 1000; ’ 7 7 7 7 med ’ mm ’ Xmax=1426- 29. x = 5,46; j2 = 0,03; 5 = 0,17. 30. x = 3,87; j2 = 3,69; s = 1,92; xmod= 4. 31. x = 3,99; 2,48; j = 1,57; xmod= 4. 32. x = 166; ? =33,44; xmod=168. 33. a = 2390 (y.e.). 34. a = 2982,22 (y.e.); a= 29,81 (y.e.). 35. a = 3060,95 (y.e.); a = 43,64 (y.e.). Глава 12. Функции и распределения в математической статистике 256’ 256 16 8 6. Распределение Стьюдента с п степенями свободы. 9. Распределение Фишера—Снедекора Д1, п). 15. Распределение Фишера—Снедекора Д/л, л). ,, ~ (л 16. Сходится к гамма-распределению yl —, —I. 18. Распределение Фишера—Снедекора Д2л, 2л). 1 А/ М 21‘ = ’где N=^n‘
Ответы и указания 485 24. c = Jn/2 ; е(ст*) =--0,88. Оценка неэффективна. п-2 25. с„ эффективна. . Оценка неэффективна, но асимптотически Глава 13. Методы построения оценок Теоретические задачи 1. Х = х. 2. р = \/х. 3. 0 = х-1. 4. 0 = 5,ц = х-s. 5. а = кх,/)а = а/л. 6. a = x2/s2,X = x/s2. 7. r = x,Dr = 2r/n. а. 2^2 Л Л г~ * г~ 8. г = ——,г>2. 9. 0 = 2х. 10. a = x-syi$, b = x+sy/3. s2-l 11. с = х, d = 3s2. 12. е = x-sj3, 02=2x/3s. 13. £,=-. 2 14. a = —, a>l. 15. P = 16. a) p = ——; 6) 0 = £±lx. x-1 1-x H 0 —x p 17. a = 21nx“lna2, a2 = lna2-21nx. 18. £ = >/2/5. 19. p-\/x. 20. e = x-l. 21. p = x/N. Оценка несмещенная, состоятельная. 22. 0 = хтЯ¥. Несмещенная оценка: 0 = ^-^-хт . 23. 0 = хтя /2. ПТаХ IlidA IlidA / 24. 0 = max(-xmin, хтах/2). 25. 0 = max(l-xmin, хтах-1). 26. Оценкой максимального правдоподобия является любое число на интервале (xmax-I, xmin)- Несмещенная оценка — середина интервала: a = (xm„+xmi„-l)/2. 27. • 28. 0 = х_,п. 29. 0 = хт min max 30. а =—Vg(x(). 31. а= —^(g(xf)-a)2. 32. £ = а/х. 33. ц = х. и /=| V п <=|
486 Ответы и указания 37. « = |-Е|пх/ | -38- ₽ = -[-Llnx/ I -З9.а)0 = 1п0- -DnxJ ; J L пм J б> 0 = хт„. 40. а=|£1пх(; ;2=1£(1пх,-а)2. 41. а=х^п,Ь=хтт. п ,=1 п ,=1 X “X ~ X — X Несмещенные оценки: а = х —221----—; b = х + ——-----—. л-1 л-1 Вычислительные задачи 47. £ = 0,9; рй = 0,407, по таблице — 0,405. 48. £ = 0,2; Т =11,51 (часа). 49. На основе оценок методом моментов — 59%, по таблице — 58%. 50. На основе оценок методом моментов — 81%, по таблице — 82%. 51. £ = 1,535. На основе оценки методом мо- ментов — 46%, по таблице — 39%. 52. На основе оценок методом моментов — 63%, по таблице — 65%. 53. На основе оценок мето- дом моментов — 16%, по доле в выборке — 20%. 54. а = 3,95, £ = 0,024, Xmod = 123 (см). 55. а = 4, £ = 1/15, Xmod = 45 (мин); б) а = 9, £ = 1/7, Xmtxl = 56 (мин). 56. а = 2; доля жителей 4%. 57. а = 5/4; доля жителей 1/32. 58. ц = 30; 0 = 7; Т - 62,24 (мин). 59. а) 0,86; 75 мин; б) 0,97; 56 мин. 60. 6, =20; б2=15(ч). 61. а = 8,156; ст2 = 0,003; доля людей 92%. 62. б = 9,6 (мин). 63. а = 82; b = 118 (кг); товара нужно 110,8 (кг). 64. а) 119,2 (кг); б) 153,8 (кг). 65. а) 0 = 9, р = 0,075; б) 0 = 4, р = 0,1296. 66. а) 0,17; б) 0,25. 67. ±1,63%. 68. ±6%. 69. 783 порции. 70. 45 ошибок. 71. а =3,94. Средний доход — 67 тыс. руб.; доля жителей 6,5%. 72. 6 = 30; 6 = 4,7; Т = 51,64 (мин). 73. а) 0,98; 53 мин; б) 0,86; 72 мин. 74. а = 8,244; ст2= 0,059; доля людей 29%. 75. 0 = 9,2; 0 = 11,04 (мин). 76. а = 72; b = 128 (кг); товара нужно 122,4 кг. 77. у = 866,27 + 16,8(х - 2000); у (2004) = 933,47 (млрд кВт-ч). 78. а) у = 67,98 + 10,79(х - 2000); у (2003) = 100,35 (млн т); б) у = 39,44 + 7,74(х - 2000); у (2003) = 62,66 (млн т). 79. а) у = -7,26 + 0,69 х; у (90) = 54,84 (млн т); б) у = 0,58 х; у (90) = 52,22 (млн т). 80. у = 0,943 х; у (2600) « 2452 (долл.).
Ответы и указания 487 Глава 14. Доверительные интервалы Теоретические задачи lx | £ Вычислительные задачи 11. 124,90 < а < 125,46 (г); п = 96. 12. а) 99,9 < а < 100,5; б) 100,3 < а < 100,7; в) 99,94 < а < 100,26 (г). 13. а) 99,97 < а < 100,43; б) 100,09 < а < 100,71; в) 99,97 < а < < 100,03 (г).
488 Ответы и указания 14. 5 = 0,39 (мм). 15. п = 82. 16. а) 269,79 < а < 303,21 (у.е.); п = 1245; б) 247,92 < а < 252,08 (у.е.); п = 1111; в) 277,55 < а < 282,45 (у.е.); п = 2401. 17. 65,46 < а < 89,54 (человек на фирме); 78 552 < N < 107 448 (чело- век в отрасли). 18. 19 250 < а < 25 750 (миль). 19. а) 24 760 < а < 29 240; б) 29 200 < а < 34 800 (км). 20. а) 4688,2 < а < 4811,8; б) 4183,44 < а < 4316,56; в) 4665,24 < а < 4854,76 (руб.) 21. 80,11 < а < 119,89 (д.е.); п = 792. 22. 77,04 < а < 94,96 (мин). 23. 49,53 < а < 50,49 (г). 24. 0,43 < а < 1,02. 25. 72,98 < о < 164,4 (д.е.). 26. а) 66,01 < с < 102,4; б) 61,88 < с < 96 (д.е.). 27. а) 2,72 < а2 < 6,55; б) 1,53 < а2 < 3,69; в) 0,31 < о2 < 0,89; г) 0,10 < о2 < 0,29 (г2). 28. а) 2,32 < о < 4,31; б) 3,18 < а < 5,49; в) 1,17 < а < 2,09; г) 0,72 < о < 1,23; д) 0,39 < с < 0,70 (г). 29. 99,97 < a < 102,03 (г); 5,93 < а2 < 15,65 (г2). 30. От 220,5 до 276,5 д.е. 31. От 128,6 до 147,4 д.е. 32. 56,05 < а < 86,17; 28,52 < х < 113,7 (млн т). 33. 28,64 < а < 42,44; 16,03 < х < 55,05 (млн т). 34. 14,3 < а < 17,4; 10,71 < а < 20,99 (ц/га). 35. 21,92 < а, - а2 < 38,08 (д.е.). 36. 28,06 < а, - аг < 51,94 (д.е.). 37. 0 < р < 0,03. 38. 0,08 < р < 0,12. 39. 0,55 < р < 0,65; 1107 < ЛГ < 1293. 40. 0,55 < р < 0,73. 41. а) 0,67 < q < 0,83; б) 0,84 < q < 0,91; в) 0,72 < q < 0,88; г) 0,78 < q < 0,86; д) 0,84 < q < 0,91.
Ответы и указания 489 42. а) 0,10 < р < 0,14; б) 0,12 < р < 0,16; в) 0,16 < р < 0,20; г) 0,11 < р < 0,15. 43. От 6,2 до 11,8%. 44. 0,05 < р < 0,07. 45. 0,01 < р < 0,03; п = 3012 (записей). 46. п = 10 551. 47. п = 1801. 48. п = 3659. 49. 847,89 < 0< 1179,39 (ч). 50. а) 1360,0 < 0 < 1654,5; б) 1813,3 < 0 < 2205,93; в) 2262,6 < 0 < 2757,4 (ч). 51. а) 251,9 < X < 260,1; б) 286,2 < X < 291,8 (покупателей). 52. 0,84 < 1 < 0,96 (сорняков). 53. 2,56 < а < 3,80. Этот пример показывает, что выборочное среднее плохо характеризует распределение Парето, и лучше использовать другие оценки. 54. а) 1,56 < 0 < 2,04; б) 2,12 < 0 < 2,88 (покупок) 55. а) 0,30 < р < 0,66; б) 0,60 < р < 0,78. Глава 15. Проверка статистических гипотез Теоретические задачи L 5 = -[x:^-J(x/-a)2>x«,„l- [ СТ0 /=1 J 2. 5 = {х: х > р0 +иа7?о(1 -Ро)/Л| 5 фо(иа) = 1/2-«; фо(и₽) = 1/2-₽; («а-УлО-А) + ^VaO-a)) Л = ---------------э------- • (Ро-А> 3. 5 = {x:x>X0+ua>/V«}; « =-------n v------• 4. 5 = S X. < Х1-а,2л [ • l /=1 J 5. В общем виде: 5 = {х:|х|П11х>1}о^х:^х2 <с[ • I i=i J Г 4 1 В частном случае: 5 = { |х, |>1}о{ |>1}о^х2+х2 <-а>.
490 Ответы и указания Вычислительные задачи 6. а) Мощность критерия 0,44; б) п = 25. 7. а) х >19,3. Нулевая гипотеза принимается; б) мощность критерия 0,6368. 8. а) х > 308,25; б) р = 0,3632; в) п = 82. 9. п = 237. 10. Нулевая гипотеза отвер- гается. 11. Нулевая гипотеза отвергается. 12. Нулевая гипотеза отвергается. 13. а) нет; б) да; в) нет. 14. а) да; б) нет; в) да; г) нет. 15. а) да; б) нет; в) нет. 16. Нулевая гипотеза принимается. 17. Да. 18. а) да; б) нет; в) да; г) нет. 19. Да. 20. Нет. 21. а) да; б) нет; в) нет; г) да. 22. а) нет; б) нет; в) нет; г) да. 23. Да. 24. Да. 25. Да. 26. Да. 27. Да. 28. Нулевая гипотеза принимается. 29. Нет. 30. Да. 31. Нет. 32. а) да; б) нет; в) да; г) нет. 33. Нулевая ги- потеза принимается. 34. Нулевая гипотеза отвергается. 35. Да. 36. Нет. 37. а) да; б) нет; в) нет. 38. Нет. 39. Да. 40. Да. 41. а) нет; б) нет; в) да; г) нет. 42. а) нулевая гипотеза принимается; б) нулевая гипотеза отвергается. 43. Да. 44. Нулевая гипотеза принимается. 45. Нулевая гипотеза принимается. 46. Нулевая ги- потеза отвергается. 47. Нет. 48. Да. 49. а) да; б) нет; в) да; г) нет. 50. Нет. 51. Да. 52. а) да; б) нет; в) да. 53. Да. 54. Нулевая гипотеза отвергается. 55. Да. 56. а) нет; б) да; в) нет. 57. Да. 58. Нет. 59. Да. 60. Да. 61. Да. 62. Нулевая гипотеза отвергается. 63. а) да; б) нет; в) да. 64. а) да; б) нет; в) нет; г) да; д) нет. 65. Нет. 66. Нет, т.к. л4 < 4. 67. а) Нулевая гипотеза принимается; б) 4,69. 68. Нет. 69. Да. 70. Да. Глава 16. Критерии согласия 1. Да. 2. Да. 3. Нет. 4. Да. 5. Нет. 6. Нет. 7. Нет. 8. Нет. 9. Да. 10. Да. 11. Да. 12. Да. 13. Да. 14. Да. 15. Да. Глава 17. Элементы анализа временных рядов 1. a) trx(t) = 2098 +103,67/, где t — номер месяца (от начала наблю- дений); б) Ггх(Г) = ехр(7,72 + 0,03г). Прогнозы на 2004 г. пред- ставлены в таблице: Месяц Прогноз (линейный) Прогноз (экспонента) Январь 4690 4770 Февраль 4793 4915 Март 4897 5064
Ответы и указания 491 Окончание табл. Месяц Прогноз (линейный) Прогноз (экспонента) Апрель 5001 5219 Май 5104 5378 Июнь 5208 5541 Июль 5312 5710 Август 5415 5884 Сентябрь 5519 6063 Октябрь 5622 6248 Ноябрь 5726 6438 Декабрь 5830 6634 2. /гх(/) = ехр(8,2024 + 0,007Г), где t — номер месяца (от начала на- блюдений). Месяц Сезонные индексы, % Прогноз Июль 224 9725 Август 138 6042 Сентябрь 122 5362 Октябрь 60 2685 Ноябрь 90 4046 Декабрь 78 3532 Январь 56 2554 Февраль 34 1576 Март 59 2725 Апрель 76 3513 Май 108 5016 Июнь 208 9788 Здесь и далее сезонные индексы, как и прогнозируемые значе- ния, округлены до целых.
492 Ответы и указания 3. trx{t) = 10 836 + 39,285/, где t — номер месяца (от начала наблю- дений). Месяц Сезонные индексы, % Январь 94 Февраль 89 Март 97 Апрель 97 Май 105 Июнь 105 Июль 106 Август 107 Сентябрь 100 Октябрь 102 Ноябрь 98 Декабрь 99 4. trx(t) = ехр(5,44 + 0,01Г), где t - номер месяца (от начала наблю- дений). Месяц Сезонные индексы, % Январь 92 Февраль 87 Март 101 Апрель 98 Май 99 Июнь 114 Июль 128 Август 125 Сентябрь 107 Октябрь 92 Ноябрь 80 Декабрь 89
Ответы и указания 493 5. a) trx(t) = 815,87 + 16,8г, где t — номер года (начиная с 1998). Прогноз: 933,5; б) /гх(т) = ехр(6,7 + 0,02г). Прогноз: 934,5 (млрд кВт-ч). Глава 18. Элементы линейного регрессионного и корреляционного анализа 1. а) г = —0,18; зависимости нет; б) г = 0,24; зависимость есть; в) г - 0,01; зависимости нет; г) г = —0,05; зависимости нет; д) г = 0,61; зависимость есть. 2. а) гг _ -0,43; б) гг = 0,07; в) rt= —0,1; г) гг = —0,18; д) гг = 0,62. 3. rs= 0,73. Мнения экс- пертов достаточно хорошо согласованы. 4. г = 0,90; rs = 0,89. 5. г = 0,78; rs= 0,76. 1лава 19. Элементы дисперсионного анализа 1. Да. 2. Нет. 29,61 < а, < 62,39; 69,62 < а2< 96,38; 69,05 < а}< < 108,95. В Северном округе дела идут хуже, чем в Южном и Восточном (где примерно одинаково). 3. Да. 4. Да. 5. Да.
ЛИТЕРАТУРА 1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и осно- вы эконометрики. — М.: ЮНИТИ, 1998. 2. Айвазян С.А., Мхитарян В,С. Прикладная статистика в задачах и упражнениях. — М.: ЮНИТИ, 2001. 3. Бочаров П.П., Печинкин А.В. Теория вероятностей. Матема- тическая статистика. — М.: Гардарика, 1998. 4. Большее Л.Н., Смирнов Н.В. Таблицы математической стати- стики. — М.: Наука, 1983. 5. Боровиков В, STATISTICA. Искусство анализа данных на компьютере. — СПб.: Питер, 2003. 6. Ван дер Варден Б. Математическая статистика. — М.: Высшая школа, 1975. 7. Венецкий Г.И., Кильдышев А.Н. Математическая статистика. — 3-е изд. — М.: Статистика, 1986. 8. Вентцелъ Е.С. Теория вероятностей и математическая стати- стика. — М.: Мир, 1972. 9. Вентцелъ Е.С. Исследование операций: задачи, принципы, методология. - М: Наука, 1980. 10. Виленкин Н.Я., Виленкин А.Н., Виленкин П.А. Комбинато- рика. - М.: МЦНМО, 2006. 11. Гнеденко Б.В. Курс теории вероятностей. — М.: Наука, 1960. 12. Гмурман В.Е. Руководство к решению задач по теории веро- ятностей и математической статистике. — М.: Высшая школа, 1998. 13. Грачева М.В., Фадеева Л.Н, Черемных Ю.Н. Количественные методы в экономических исследованиях. — М.: ЮНИТИ, 2004. 14. Зубков А.М., Севастьянов Б.А., Чистяков В.П. Сборник задач по теории вероятностей. — М.: Наука, 1989. 15. Доугерти К. Введение в эконометрику. — М.: ИНФРА-М, 2001. 16. Кибзун А.И., Горяйнова Е.Р., Наумов А.В., Сиротин А.Н. Теория вероятностей и математическая статистика. — М.: Физматлит, 2002. 17. Колемаев В.А., Староверов О.В., Турундаевский В.Б. Теория вероятностей и математическая статистика. — М.: Высшая школа, 1991. 18. Крамер Г. Математические методы статистики. — М.: Мир, 1975. 19. Кремер Н.Ш. Теория вероятностей и математическая стати- стика. - М.: ЮНИТИ, 2002. 20. Кузнецов Ю.А. Оптимальное управление экономическими системами. — Изд-во Нижегородского госуниверситета, 2008.
Литература 495 21. Лукаш Е.Н., Медведев П.А., Пахомов В.Ф. Высшая матема- тика. - М.: МГУ, 1987. 22. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Экономет- рика. — М.: Дело, 1997. 23. Севастьянов В.А. Курс теории вероятностей и математиче- ской статистики. — М.: Наука, 1982. 24. Соколов Г.А., Чистякова НА. Теория вероятностей. Управ- ляемые цепи Маркова в экономике. — М.: Физматлит, 2005. 25. Сулицкий В.Н. Методы статистического анализа в управле- нии. — М.: Дело, 2002. 26. Тутубалин В.Н. Теория вероятностей. — М.: Академия, 2008. 27. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере, под ред. В.Э. Фигурнова. — М.: ИНФРА-М, 2003. 28. Тюрин Ю.Н., Макаров А. А., Высоцкий И.Р., Ященко И. В. Теория вероятностей и статистика. — М.: МЦНМО, 2004. 29. Тюрин Ю.Н., Макаров А.А., Симонова Т.Н. Теория вероят- ностей. - М.: МЦНМО, 2009. 30. Фадеева Л.Н. Теория вероятностей и математическая стати- стика. — М.: Эксмо, 2006. 31. Фадеева Л.И, Жуков Ю.В., Лебедев А.В. Математика для экономистов: Теория вероятностей и математическая статистика. Задачи и упражнения. — М.: Эксмо, 2006. 32. Фадеева Л.Н., Лебедев А.В. Теория вероятностей и матема- тическая статистика. — М.: Эксмо, 2010. 33. Феллер В. Введение в теорию вероятностей и ее приложе- ния. — М.: Мир, 1984. 34. Чистяков В.П. Курс теории вероятностей. — М.: Наука, 1982. 35. Ширяев А.Н. Вероятность. — М.: МЦНМО, 2007. 36. Ширяев А.Н. Задачи по теории вероятностей. — М.: МЦНМО, 2006. 37. Ширяев А.Н. Основы стохастической финансовой математи- ки. - М.: ФАЗИС, 1998. 38. Уотшем Т.Дж.. Паррамоу К. Количественные методы в фи- нансах. - М.: ЮНИТИ, 1999. 39. Эддоус М., Стэнсфилд Р. Методы принятия решения. — М.: ЮНИТИ, 1997. 40. Экономико-математические методы и прикладные модели / под ред. В.В. Федосеева. — М.: ЮНИТИ, 1999.
Учебное издание НАЦИОНАЛЬНОЕ ЭКОНОМИЧЕСКОЕ ОБРАЗОВАНИЕ Фадеева Людмила Николаевна Лебедев Алексей Викторович ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Учебное пособие Главный редактор И. Федосова Ответственный редактор В. Щербакова Художественный редактор М. Левыкин Технический редактор Н. Белова Компьютерная верстка С. Терентьева ООО «Рид Групп» 119021, Москва, ул. Россолимо, д. 17, стр. 1, тел. 788-0075(76) Свои пожелания и предложения по качеству и содержанию книг Вы можете сообщить по эл. адресу editorial@readgroup.ru Издание осуществлено при техническом содействии ООО «Издательство ACT* Подписано в печать 30.06.2011. Формат 60x90/16. Усл. печ. л. 31,0. Печать офсетная. Бумага писчая. Тираж 2 000 экз. Заказ № 1494. Отпечатано с готовых диапозитивов в типографии ООО «Полиграфиздат» 144003, г. Электросталь, Московская область, ул. Тевосяна, д 25
Книга входит в состав учебного комплекса «Математика для экономистов», специально созданного для экономи- ческих вузов страны экономическим факультетом МГУ имени М. В. Ломоносова. Ее цель — в ясной и удобной для восприятия форме дать студенту-экономисту весь объем необходимых математических знаний в части теории вероятностей и математической статистики. 9 2039081 ЧИТАЙ www.roicon.ru Допущено УМО по классическому университетскому образованию в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению 080100 «Экономика» Вы можете приобрести книги издательства обратившись по тел.: + 7 (495) 988 9668; адрес в Интернете: www.readgroup.ru ISBN 978-5-4252-0390-8 limn mil iiiiiiiinii 785425 203908II 785425