Текст
                    
Теория вероятностей и математическая статистика в задачах
Jrv

л Высшее образование к-— •ф- ж ф- Теория вероятностей и математическая статистика в задачах 2-е издание, исправленное Допущено Министерством образования Российской Федерации в качестве учебного пособия для студентов высших учебных заведений, обучающихся по направлению подготовки 657100 «Прикладная математика» d р о ф а
УДК 519.2(075.8) ББК 22.17я73 ТЗЗ Авторы: В. А. Ватутин, Г. И. Ивченко, Ю. И. Медведев, В. П. Чистяков Рецензенты: кафедра прикладной математики Государственного университета управления им. Серго Орджоникидзе (ГУУ) (зав. кафедрой прикладной математики ГУУ д-р эконом, наук, проф. В. А. Колемаев); д-р физ.-мат. наук В. Г. Михайлов (Математический институт им. В. А. Стеклова РАН) Теория вероятностей и математическая статистика в за- ТЗЗ дачах: Учеб, пособие для вузов / В. А. Ватутин, Г. И. Ивченко, Ю. И. Медведев и др. — 2-е изд., испр. — М.: Дрофа, 2003. — 328 с.: ил. ISBN 5—7107—6667—4 Материал пособия соответствует программе курса по теории вероятностей и математической статистике для студентов высших учебных заведений и отвечает современному уровню этих дисциплин. Изложение ведется последовательно в соответствии с рядом основных вероятностных моделей, причем различные главы можно использовать практически изолированно. Такой подход позволяет задавать в данной модели вероятность в явном виде, не излагая аксиоматические основы теории вероятностей. Для каждой модели приведены краткие теоретические сведения, примеры решения задач и задачи для самостоятельного решения. Среди прикладных задач имеются задачи по теории страхования и экономике. Для студентов, преподавателей вузов и всех, кто хочет быстро научиться решать стандартные задачи по курсу теории вероятностей и математической статистике. УДК 519.2(075.8) ББК 22.17я73 ISBN 5—7107—«667—4 © ООО «Дрофа», 2003
ПРЕДИСЛОВИЕ На сегодняшний день вузы, в которых теория вероятностей изучается систематически и рассматривается как строгая математическая дисциплина, достаточно хорошо обеспечены соот-ветствующимиучебнымипособиямииучебниками.Однако для целого ряд а институтов и университетов фундаментальное изучение теории вероятностей нецелесообразно, поскольку их вы-пускникипородусвоейприкладнойдеятельностилишьизредка встречаются с ситуациями, требующими решения вероятностных задач. Более того, решение такого рода задач весьма часто сводится к применению простейших вероятностных утверждений. Понятно, что в этих вузах систематическое изучение те-ориивероятностейиматематическойстатистикиразумнозаме-нить ознакомлением с основными понятиями этих дисциплин. Из приведенных в списке литературы учебных пособий учебник[2]являетсявнекоторомсмысле«предельным»:попыт-ки дальнейшего существенного упрощения и сокращения материала приведуткпотереструктурнойстройноститеоретическо-го курса теории вероятностей. И все же вряд ли можно рекомендовать эту книгу для ознакомления с теорией вероятностей, поскольку теоретические основы предложенного в ней курса требуют определенной математической подготовки. Перед преподавателем, ведущим занятия по теории вероятностей и математической статистике, возникает дилемма: с одной стороны, необходимо ознакомить студента с основными идеями теории предметов, с другой — временные рамки не позволяют сделать это на строгом математическом уровне. Такаяжеситуациявозникалавпериодбурногоколичествен-ного роста ЭВМ. Пользователей не интересовали тонкости используемых языков и трансляторов. Хотелось сегодня, в край
нем случае завтра, научиться программировать и решать свои простейшие задачи. Авторы пособий по программированию, идя навстречу велениям времени и желаниям массового читателя, решили эту проблему весьма успешно ’.многие пособия начи-налисьсразусобъясненияработыпростейшихпрограммбезка-ких-нибудь предварительных разъяснений. Аналогичные требования (сразу научиться решать задачи) предъявляют многие читатели («потребители») к книгам по те-ориивероятностейиматематическойстатистике.Авторыданно-го учебного пособия надеются, что им удалось найти способ удовлетворитьихинтересы.Теориявероятностейизлагаетсядо-статочно изолированно поосновным простейшим вероятностным моделям. Этот способ имеет ряд преимуществ: явное задание вероятности в конкретной модели позволяет исключить общееаксиоматическоеизложение;удобнообсуждатьпримени-мость рассматриваемой модели в реальных условиях; легко ис-пользоватьмногочисленныеформулывконкретныхповторяю-щихся условиях. Пособие состоит из небольших глав, каждая из которых на-чинаетсяс конспективного изложениятеоретических сведений, необходимых прирешении задач данного раздела; приводятся примеры решения задач; формулируются задачи для самостоятельного решения. При изложении теоретических сведений не-которыепонятиянеопределяются.Однакоблизостьвероятност-ной терминол огии повседневно используемой не приведет к су-щественнымзатруднениямприпримененииконкретныхформул в простейших случаях. Желающие уточнить те или иные понятия могут обратиться к учебным пособиям ([2], [4], [6]), которые хорошо согласованы с данным и содержат более полное изложение теории. Предлагаемое пособие может быть использовано: 1) вкачествезадачникаилиметодическогопособияпореше-нию задач для всех вузов; 2) как основа дляпостроенияознакомительногокурсапоте-ории вероятностей и математической статистике; 3) длясамостоятельногоизучениятеориивероятностейима-тематической статистики; 4) как базис (в сочетании с пособиями [2], [4], [6]) теоретического курса.
ВВЕДЕНИЕ До возникновения теории вероятностей объектом исследования науки были явления или опыты, при анализе которых неявно предполагалось, что внешние условия практически однозначно определяют результат наблюдения или эксперимента. Однако для широкого круга явлений наблюдается неоднозначность исхода опыта при сохранении основных условий его про-ведения.Приподбрасываниимонетынельзяпредсказать,какой стороной онаупадет.Траекторииполетаснарядовприсохране-нии основных условий стрельбы не будут одинаковы из-за незначительных колебанийначальнойскорости, весаснаряда, состояния атмосферы и т. д. Воздействие очень большого числа разнообразныхпричин,каждаяизкоторыхвотдельностинемо-жетзаметно повлиять на исход эксперимента, приводит к тому, что этот исход не определяется однозначно. В этом случае говорят, что результат или исход опыта случаен. Случайность исходов испытаний или опытов приходится учитыватьприисследованиях,относящихсякразличнымоблас-тям науки итехники (физика, биология, демография, здравоохранение, массовое производство и т. п.). В качестве величины, характеризующей возможность появления случайного события, используетсяего вероятность. Экспериментально установлено, что с ростом числа опытов п, проводимых в практически одинаковых условиях, частота появления случайного события А (отношение числа опытов иА, в которых появилось событие А, к общему числу опытов п) становится почти постоянной и сближается с некоторым числом, котороеможнобылобыпринятьзаопределениевероятностисо-бытия А. Однако найденную таким способом частоту нельзя принять за математическое определение вероятности.
Для теоретических исследований случайных явлений нужна их математическая модель. Многообразие и сложность задач, встречающихся в приложениях, требуют четкого определения понятий, связанных с явлениями, исходы которых случайны. В математической модели случайных явлений вероятность рассматривается как функция случайного события. Свойства этойфункциидолжнысоответствоватьсвойствамчастотысобы-тий в соответствующих сериях испытаний. Общий аксиоматический подход к построению теории вероятностей был предложен А. Н. Колмогоровым в книге «Основные понятия теории вероятностей»,котораявпервыебылаизданананемецкомязыке в 1933 г. В данной книге мы не излагаем общего аксиоматического подход а по причинам, указанным в предисловии. Однако он сохранен в каждой отобранной вероятностной модели. Эти модели описывают достаточно широкий круг случайных явлений, часто возникающих в приложениях. Теориявероятностейявляетсяразделомматематики,вкото-ромпозаданнымвероятностямоднихслучайныхсобытийнахо-дят вероятности других событий, связанных каким-либо образом с первыми. Первые работы, в которых зарождались основ-ныепонятиятеориивероятностей,представлялисобойпопытки создания теории азартных игр (Д. Кардано, X. Гюйгенс, Б. Паскаль, П. Ферма и др. в XVI—XVII вв.). Первая теорема, подучившая название «закон больших чисел» и давшая начало целой серии «предельных теорем» теории вероятностей, была доказана Якобом Бернулли (1654—1705). Затем развитие теории вероятностей продолжалось в работах А. Муавра,П. Лапласа,К. Гаусса,С. Пуассонаивработахрус-скихматематиковП. Л. Чебышева,А. А. Маркова,А. М.Ляпу-новаиС. Н. Бернштейна.Окончательноеоформлениекакмате-матической науки теория вероятностей получила в работах российских математиков А. Н. Колмогорова, А. Я. Хинчина, Б. В. Гнеденко и их учеников.
ГЛАВА 1 КЛАССИЧЕСКАЯ ВЕРОЯТНОСТНАЯ МОДЕЛЬ § 1. Определение вероятности. События Классическая вероятностная модель используется для описания опытов с конечным числом взаимно исключающих возможных исходов. При этом предполагается, что исходы опыта случайны и равновероятны по тем или иным соображениям (практический опыт, симметричность исходов, невозможность отдать предпочтение одним исходам перед другими и т. п.). Такие ситуации часто возникают в различных играх: домино, лото, карточные игры, бросание игральных костей и т. д. При организации лотерей, отборе контрольной выборки из партии изделий равновероятность организуется специально. Пусть результаты опыта описываются S взаимно исключающими исходами соъ со2, ..., cos. Эти исходы называют также элементарными событиями. Множество П = {(01, ..., <os} всех таких исходов называют множеством элементарных событий. Любое случайное событие А, связанное с данным опытом, может быть задано посредством перечисления всех элементарных событий, при которых оно происходит. Пусть, например, А — это выпадение четного числа очков при бросании игральной кости. Тогда А можно задать перечислением благоприятствующих ему элементарных событий: выпало либо 2 очка, либо 4 очка, либо 6 очков. Событие Q, состоящее из всех возможных исходов, называют достоверным. В дальнейшем будем обозначать | А | число элементарных событий, входящих в А. Если событию А благоприятствует К элементарных исходов, то вероятность Р(Л) события А в классической вероятностной модели определяется формулой Р(Л)=И1=-. (1.1) ' ’ |й| s J
При решении задач необходимо сначала описать множество элементарных событий 12={<В!, <bs}; найти число 5=|12|; найти число К=|Л| элементарных событий, благоприятствующих А, и воспользоваться формулой (1.1). 1.1. Брошено две одинаковых монеты. Найти вероятность того, что монеты выпали разными сторонами. Решение. Возможны четыре исхода: на 1-й и на 2-й монете выпал герб (обозначим этот элементарный исход ГГ); на 1-й монете—герб, на 2-й—решетка (обозначим исход ГР); два других исхода обозначим РГ и РР. Таким образом, множество элементарных событий 12={ГГ, ГР, РГ, РР] и 5=1121 = 4. Событие А = {монеты выпали разными сторонами} происходит в двух случаях ГР или РГ, т. е. ,4 = {ГР, РГ} и К=[А1 = 2. По формуле (1.1) находим Р(А) = 2/4 = 1/2. 1.2. Брошено три монеты. Описать множество всех Элементарных событий. Найти вероятности событий: а) Л = {не выпало ни одного герба}, б) В={выпало четное число гербов}, в) С={на 3-й монете выпал герб}. Ответ: Р(Л)=78, Р(В) = Р(С) = 72. 1.3. Из двух претендентов Е и L на ответственную должность три члена комиссии должны отобрать одного. Каждый член комиссии должен указать либо одного достойного, либо забраковать обоих. Претендент считается выбранным, если он был признан достойным хотя бы двумя членами комиссии. Найти вероятности событий: А = {рекомендован L}, В = {рекомендован Е}. Решение. Каждый член комиссии принимает одно из трех решений: Е—рекомендовать претендента Е; L—рекомендовать претендента L; О—никого не рекомендовать. Решение комиссии можно записать тройками, составленными из этих символов: ЕЕЕ—все члены комиссии рекомендовали претендента Е; OLE—1-й член комиссии никого не рекомендовал, 2-й рекомендовал L, а 3-й член комиссии рекомендовал Е и т. д. Тогда множество элементарных событий состоит из всех возможных троек: 12 = {ЕЕЕ, LEE, ОЕЕ, ...}. Общее число элементарных событий 1121 нетрудно найти. Первое место тройки заполняется тремя способами. Первые два места
заполняются девятью способами, так как каждое из трех заполнений 1-го места можно продолжить тремя способами заполнения 2-го места. Наконец, любое из 9 заполнений первых двух мест продолжается любым из трех способов заполнения 3-го места. Таким образом, |Q| = 9-3 = 27. Событие А происходит либо в случае, когда все члены комиссии рекомендовали L, либо когда ровно один член комиссии не рекомендовал L. Событие А выражается через элементарные события следующим образом: A = {LLL, LLE, LLO, LEL, LOL, ELL, OLL}. Таким образом, \А | = 7 и по формуле (1.1) р(л)=И!=1. ' ! |Й| 27 Элементарные события, составляющие В, получатся, очевидно, если в элементарных событиях, составляющих А, заменить L на Е, а Е на L. Тогда |В| = 7 и по формуле (1.1) р(в>!£!=2., ' ' |41| 27 1.4. Брошено две игральных кости. Описать множество элементарных событий. Найти вероятности событий: А = {выпало две «шестерки»}, В={сумма выпавших очков не меньше 11}, С={не выпала ни одна «шестерка»}. Ответ: Р(Л)=1/36, Р(В) = 3/36= 1/12, Р(С)=25/36. § 2. Вероятность суммы событий Событие А + В называют суммой событий А и В, если А+В происходит, когда происходит хотя бы одно из событий: А или В. Вероятность суммы А+В равна сумме вероятностей А и В, Р(Л+Б) = Р(Л)+Р(В), (2.1) если события А и В несовместны, т. е. Л и В не могут произойти одновременно. В общем случае р(Л+В)=Р(Л)+Р(В)-Р(ЛВ). (2.2) Здесь произведение событий АВ—это событие, состоящее в том, что происходит и событие А, и событие В. Если
А и В несовместны, то АВ—невозможное событие. Тогда Р(АВ) = 0 и из (2.2) следует (2.1). Если использовать задание случайных событий посредством перечисления благоприятствующих элементарных событий, то суммой событий А+В нужно назвать событие, состоящее из элементарных событий, каждое из которых входит хотя бы в одно из событий А или В; произведение АВ состоит из элементарных_ событий, входящих и в Я, и в В. Событие А, противоположное событию А, состоит в том, что А не произошло. Формула Р(Л) = 1—Р(Л) (2.3) оказывается полезной в тех случаях, когда вероятность события А вычислить проще, чем вероятность события А. Если среди событий Л15 А2, ..., Ап любые два события несовместны, то Р(Л1 + ...+Лв)=Р(Л1)+...+Р(Лв). (2.4) 2.1. Брошено две игральных кости. Найти вероятность события D = {выпала хотя бы одна «шестерка»}. Решение. 1-й способ. Элементарным событием является пара чисел (г, у): i—число очков, выпавших на 1-й кости, j—число очков, выпавших на 2-й кости. Поскольку при любом значении г(г = 1, ..., 6) число j может принять любое из 6 возможных значений, то каждому фиксированному г соответствует 6 элементарных событий: (г, 1), (г, 2), ..., (г, 6); таким образом, Q = {(1, 1), (1, 2), ..., (1, 6); (2, 1), ..., (2, 6); (3, 1), ..., (6, 6)} и |П | = 6 -6 = 36. Пусть 2?1 = {на 1-й кости выпала «шестерка»}, £2 = {на 2-й кости выпала «шестерка»}. Тогда D = El+E2. Заметим, что события £t и Е2 не являются несовместными, так как Et и Е2 могут произойти одновременно: ЕГЕ2 = {на обеих костях выпала «шестерка»} = (6, 6). Таким образом, ЕгЕ2 происходит при единственном элементарном событии (|Е1Е2| = 1); Ei и Е2 происходят при 6 элементарных событиях (|Е'11 = | £21 = 6). По формуле (1.1)
и-вд-n. р<ад)-4£Ч- Используя эти значения, по формуле (2.2) найдем вероятность события D = Ei+E2- P(D) = P(Et) + P(E2)-P(ElE2)-'i+'-~^-^. 2-й способ. Заметим, что событие D противоположно событию С: Б=С={яе выпала ни одна «шестерка»}. Событие С состоит из всех элементарных событий (г, j), в которых г/6 и у/6: C={(i, 2, 3, 4, 5}. Нетрудно проверить, что |С| = 25. По формуле (1.1) р(С)=—=—. ' ' |£2| 36 Отсюда, привлекая формулу (2.3), получаем Р(2>)=1-Р(5)-1-Р(С5 = 1-Н»11. 2.2. В условиях задачи 1.3 найти вероятность события С = {выбор не состоялся}. Ответ: Р(С)= 13/27. 2.3. В ящике 10 одинаковых карточек, на которых по одной написаны цифры 0, 1, ..., 9. Два раза с возвращением вынимается по одной карточке. Найти вероятности событий: Л = {на вынутых карточках появились цифры «0», «0»}, 2?={на 2-й карточке появилась «9»}, С={ни на одной вынутой карточке не было «5»}, D = {появилась хотя бы одна «1»}. Ответ: Р(Л) = 0,01, P(5) = 0,l, Р(С) = 0,81, P(Z>) = 0,19. 2.4. В телефонном номере три последние цифры стерлись. Считая, что все возможные значения стершихся цифр равновероятны, найти вероятности событий: А = {стерлись различные цифры}, В={стерлись одинаковые цифры}, С={среди стершихся цифр хотя бы две совпадают}, D={среди стершихся цифр хотя бы две различны}.
Ответ: Р(Л)= 10 9-8/103 = 0,72, Р(5)= 10/103 = 0,01, Р(С) = = Р(Л) = 0,28, P(Z>) = 0,99. § 3. Случайные величины Довольно часто с исходами опыта 0 = {ю1, cos} связывают различные числовые характеристики: суммарное число очков при бросании нескольких игральных костей, число бракованных изделий в обследуемой выборке и т. д. Естественно эти числовые характеристики рассматривать как различные функции от элементарных событий. Принимаемые этими функциями значения зависят от исхода опыта. Если число элементарных событий конечно, то любую функцию от элементарного события, определенную для каждого элементарного события, называют случайной величиной. Обычно случайные величины обозначают заглавными буквами Z=X((o). Среди S чисел А'(со), шеП, могут быть одинаковые. Обозначим хъ х2, ..., хп все различные значения функции У(ю). Очевидно, n^S'=|Q|. Можно найти вероятность события {Х=хк}, к=1,...,п. Событие {Х=хк} состоит из всех тех со из О = {го1, ..., cos}, для которых Х(а>) = хк. Это можно записать так {2Г=х*} = {ю:2Г(ю) = х*}. Набор вероятностей Р{У=хк}=1И|^И, А:=1, ..., и, (3.1) Iw I называют законом распределения случайной величины X. 3.1. В лотерее имеется 10 билетов, из которых один выигрышный. Размер выигрыша 10 рублей; стоимость билета 1 рубль. Найти закон распределения случайной величины X, равной чистому выигрышу участника лотереи, который вытаскивает билет первым. Решение. Будем для удобства считать, что билеты занумерованы и что билет с номером 1—выигрышный. При вытаскивании одного билета может появиться любое из чисел 1, 2, ..., 10. Таким образом, П = {1, 2, ..., 10}. Если появляется билет с номером один, то участник получает 10 рублей и его чистый выигрыш равен 10 руб. — 1 руб. = 9 рублей. В остальных случаях его чистый выигрыш отрицательный: —1 рубль.
Следовательно, Jf(l) = 9 руб.; X(i)= — 1 руб., г = 2, ..., 10, т. е. события {Jf=9} и {У=—1} выражаются через элементарные события следующим образом: {Х=9} = {/:Х(0 = 9} = {1}, {Х=-1} = {г:Х(/)=ч-1} = {2, 3,..., 10}. По формуле (3.1) находим р f у— gl _ । {-^=9} I _ J_ > |£2| Ю’ ' > |£2| Ю‘ 3.2. Из ящика с 10 одинаковыми карточками, на которых по одной написаны цифры 0, 1, ..., 9, два раза с возвращением вынимают по одной карточке. Введем случайные величины: Х2—цифра на 1-й карточке, Х2—цифра на 2-й карточке; X—сумма цифр на вынутых карточках (т. е. Х=ХГ + Х2). Указать все возможные значения величин Xlt Х2, X; найти вероятности, соответствующие этим значениям. Найти вероятность события {Jf^2}. Решение. Множество П = {(/, у):/, у = 0, 1, ..., 9} и |П| = 100. Элементарное событие (/, у) означает, что на 1-й карточке появилась цифра i и на 2-й карточке—цифра у. Величины Х1г Х2, X являются функциями от элементарных событий: Xt =Xt (i, у) = i, Х2 = Х2 (г,- у) =у, X = X(i, у) = г+у. Случайные величины Xt и Х2 принимают значения из множества 0, 1, ..., 9, а множество значений X есть {0, 1, ..., 16, 17, 18}. Событие {А\ = г} через элементарные события выражается следующим образом: {Xi = i} = {(i, 0), (i, 1),.9)}. По формуле (3.1) находим Р{Х1 = г}=Н^1ГШ=21 = о,1О, 1 = 0, 1, ..., 9. 1 1 J |£2| 100 ’ Аналогичные рассуждения дают закон распределения Х2: P{*2=j} = 0,10, у = 0, 1, ..., 9.
Событие {Z=0} происходит в единственном случае {Z=0} = = {(0,0)} и, следовательно, Р{Х=0} = 0,01. Событие {Х=1} = = {(0, 1), (1, 0)}, и поэтому P{Z=l} = 0,02. В общем случае {Х=к} = \$,к}, (1, Аг—1), ..., (Аг—1, 1), (к, 0)}, 0^А^9; {Х=9 + 1} = {(1, 9), (/+1, 8),..., (8, /4-1), (9, /), 1^9, и, следовательно, P{Z=Ar}=^, А=0, 1, ..., 9; (3.2) Р{Х=9+/}=^, /=1,...,9. Событие {Z^2} = {(0, 0), (0,1), (1,0), (0,2), (2,0), (1,1)} и Р {JV^2} = 0,06. Событие {А^2} можно также представить в виде {X2} = {Z=0} 4-{Z=l} 4-{Z=2}, а затем воспользоваться найденным законом распределения величины X (см. (3.2)) и формулой (2.4): Р {Z< 2} = Р {Х= 0} 4- Р {Х= 1} 4- Р {Х= 2} = 0,014- 0,02 4- 0,03 = 0,06. 3.3. В опыте, описанном в задаче 3.2 введем случайную величину Z, равную числу четных цифр на вынутых карточках. Величины Zx и Z2 определим равенствами: Zx = l, если на 1-й карточке четная цифра, и Zx = 0 в противном случае; Z2 = l, если на 2-й карточке четная цифра, и Z2 = 0 в противном случае. Указать возможные значения случайных величин Z, Zx, Z2. Проверить, что Z=Z14-Z2. Найти законы распределения Zx, Z2, Z. Ответ: P{Z=0}=J, P{Z=1}=|, P{Z=2}=b P{Z1 = l} = P{Z1 = 0} = P{Z2 = l} = P{Z2 = 0}=l. 3.4. Брошено две игральных кости. Найти закон распределения случайной величины X, равной сумме выпавших очков. Найти вероятности событий: {Z^4}, {Z>4}.
Ответ: Хк 2 3 4 5 6 7 8 9 10 11 12 р {*=*»} 1 2 3 4 5 6 5 4 3 2 1 36 36 36 36 36 36 36 36 36 36 36 Р{Х^4} = 1 Р{У>4}=Л. О о § 4. Математическое ожидание Закон распределения случайной величины позволяет найти вероятность любого события, определенного при помощи случайной величины. Но такая полная информация не всегда необходима. Иногда достаточно знать более простую и наглядную характеристику случайной величины—ее среднее значение или математическое ожидание. Математическое ожидание случайной величины X обозначается символом МУ и в классической схеме определяется формулой 1 1 |П| МЛ'=^1 <4Л) 1“1шеП lU4 = l Если в формуле (4.1) привести подобные члены, т. е. вынести за скобки хк в слагаемых с номерами /, для которых Х(а>{)=хк, то из формулы (3.1) и (4.1) получится формула для вычисления MI=fxtP{I=4 (4.2) k = l Отметим, что для вычисления по формуле (4.1) не требуется знание закона распределения случайной величины. Если закон распределения известен, то вычисления по формуле (4.2) могут оказаться более простыми. Пусть теперь X и Y—любые случайные величины. Из формулы (4.1) непосредственно следует равенство М(У+У) = МУ+МГ, (4.3) т. е. математическое ожидание суммы двух случайных величин равно сумме математических ожиданий слагаемых. Формула (4.3) по индукции распространяется на любое число слагаемых.
4.1. Найти среднее значение выигрыша X, определенного в задаче 3.1. Решение. По формуле (4.1) 1 10 1 По формуле (4.2) вычисления в данном случае более простые: МХ=9-—+( —1)-—=0. ю ' ’ ю Таким образом, средний чистый выигрыш оказался равным 0. Это довольно естественный результат: 10 участников внесли 10 рублей и эта сумма была полностью выплачена. Игры с нулевым средним выигрышем называют безобидными. 4.2. Найти математическое ожидание величин Хи Х2, X, определенных в задачах 3.2 и 2.3. Решение. Воспользуемся обозначениями, введенными при решении задачи 3.2. По формуле (4.2) 9 9 9 9 MX^Z-У У XJi, j)=— У У i= 100.%,=о 11 ’ J> 100 ДД 9 / 9 \ 9 =— У i( У 1 =— У 1=4,5. 100 .£-0 ) 100 Если воспользоваться полученным при решении задачи 3.2 распределением случайной величины Х2, то можно применить формулу (4.2): 9 9 МХ1=£1Р{У1 = 1} = ±^ 1=4,5. i = 0 1 Ui = 0 Аналогичные выкладки показывают, что МХ2 = 4,5. Для вычисления MX проще всего воспользоваться формулой (4.3): М X = М (Xr + Х2) = МХ2 + М Х2 = 4,5 + 4,5 = 9. 4.3. Найти MZ случайной величины Z, определенной в задачах 3.2 и 3.3. Ответ: MZ=1. 4.4. Найти математическое ожидание суммы числа очков, выпавших при бросании двух игральных костей. Ответ: 7.
4.5. Найти математическое ожидание суммы числа очков, выпавших при бросании 100 игральных костей. Указание. Использовать представление Х=Хг + Х2 + ...+Хюо, где Хк—число очков, выпавших на к-й кости. Ответ: 350. 4.6. Продавец тортов оценивает, сколько тортов продается за день. Он знает, что число тортов, требуемых за день, является случайной величиной с законом распределения X 0 1 2 3 4 5 6 р 1/16 2/16 3/16 4/16 3/16 2/16 1/16 Продавец получает 4 рубля 80 копеек прибыли с каждого торта. Если торт не продан в течение дня, то (по санитарным нормам) он должен быть выброшен, при этом продавец теряет 3 рубля 20 копеек. Продавец желает максимизировать средний дневной доход. Сколько тортов он должен заказывать каждый день? Решение. Пусть X—количество тортов, заказанных продавцом в некоторый день, Хе 1, 2,..., 6, а т]—количество покупателей, захотевших купить торт. Вычислим ожидаемый средний размер дохода ^(Х) продавца за этот день. Ясно, что Ж 00 = г' (4,8/- 3,2 (X- 0) Р (п = 0 +4,8УР {ц > X}. i = O Отсюда нетрудно вывести, что М£Н)=4 р. 30 коп., М£(2) = 7 р. 60 коп., М£(3)=18 р. 40 коп., М^(4) = 8 р. 80 коп., М^(5) = 7 р. 50 коп., М^(6) = 4 р. 80 коп. Таким образом, Х=3.
ПРОСТЕЙШИЕ ВЕРОЯТНОСТНЫЕ МОДЕЛИ § 1. Условные вероятности Условная вероятность Р(Л|В) события А при условии, что произошло событие В, определяется формулой Р(Л|В)=Р(ЛБ)/Р(В). (1.1) Для классической вероятностной модели РМ-Щ, Р(^)=^ и по формуле (1.1) PU|B)=^e=!^. Условие «событие В произошло» можно понимать как дополнительную информацию о множестве элементарных событий (множество исходов £1 заменяется на множество исходов В). Формула (1.1) приводит к замене равновероятных исходов £1 на равновероятные исходы В. 1.1. Из колоды (36 карт) вынимаются последовательно без возвращения две карты. Найти вероятность того, что первой картой была шестерка, а второй семерка. Найти условную вероятность того же события при условии, что обе карты бубновой масти. Решение. Воспользуемся классической схемой. Множество £1 состоит из всех упорядоченных пар различных карт. Поскольку любой из 36 вариантов 1-й карты может объединиться с любым из 35 вариантов 2-й карты, то число различных исходов |П| = 36-35. Определим события А и В: А = {первая карта—шестерка, вторая—семерка}, 5= {обе карты бубновой масти}.
Тогда АВ={первая карта — бубновая шестерка, вторая карта— ) бубновая семерка/' По аналогии с вычислением | £1|, находим: | В| = 9 -8. В событии А шестерка и семерка имеют любую масть, и поэтому | А | = 4 -4. Произведение АВ состоит из единственного элементарного исхода, и, следовательно, | АВ | = 1. По формуле (1.1) гл. 1 и формуле (1.1) данной главы получаем P(j)=_i±=_L, р(лв)=——, p(b)=2JL v ’ 36-35 315 ' ' 36-35 ' ' 36-35 И Р(Л|В)= 1/36-35 =-. v 1 ’ 9-8/36-35 72 1.2. Брошено две игральных кости. Найти условную вероятность того, что выпала хотя бы одна «1», если известно, что сумма очков равна 4. Ответ: 2/3. Обычно равенство (1.1) используется в форме «теоремы умножения»: Р(ЛВ) = Р(В)Р(Л|В). (1.2) Значение Р(Л|В) в этом случае задают исходя из дополнительной информации о явлении, и формула (1.2) используется для задания вероятности произведения событий. Если в некотором опыте нас интересуют два события С и D, то естественно возникают четыре исхода: CD = {наступили оба события}, CD= {событие D наступило, а событие С—нет), „ СО = {событие С наступило, а событие D—нет}, } CD = {sn одно событие не наступило}. По формуле (1.2) вероятности событий (1.3) можно записать в виде: P(CD)=P(C)P(D|C), P(CD) = P(C)P(D|C) = (1-P(C))P(D|C), (14) Р(CD)=Р(С) Р (D | С)=Р (С) (1 - Р (D | С)), P(CD) = P(C)P(D|C) = (1-P(C))(1-P(D|C)).
Таким образом, чтобы определить вероятности событий (1.3), достаточно знать вероятности Р(С), P(Z)|C), P(Z)|C). Четыре элементарных исхода (1.3) и равенства (1.4) определяют новую вероятностную модель, основанную на дополнительной информации: знание трех указанных вероятностей. Эти вероятности часто могут быть заданы естественным образом. 1.3. Изготовленное изделие поступает потребителю, если при проверке оно будет признано стандартным. Вероятность изготовления бракованного изделия равна 0,2; в результате проверки бракованное изделие ошибочно принимается за стандартное с вероятностью 0,05, а стандартное может быть принято за бракованное с вероятностью 0,01. Найти вероятности событий: А = {потребитель получил стандартное изделие}, В— {потребитель получил бракованное изделие}. Решение. Определим события С= {изготовлено стандартное изделие}, £>={при проверке изделие признано стандартным}. По условию задачи Р(С) = 0,2; P(Z>|C)=0,05, Р(5|С) = 0,01. События А и В можно представить в виде: A = CD, B=CD. По формулам (1.4) получаем Р(Л) = Р(С)Р(2>|С)=(1 —0,2)(1 —0,01) = 0,792, Р(Л) = Р(С)Р(Я|С) = 0,2 0,05 = 0,01. 1.4. Из урны, содержащей два белых и три черных шара, последовательно извлекаются два шара; вынутые шары не возвращаются. Если первый шар оказался черным, то перед вторым извлечением в урну добавляют белый шар. В противном случае состав оставшихся шаров не меняют. Найти вероятности событий: А = {извлечены два белых шара}, В= {извлечены два черных шара}. Указание. Пусть С! = {1-й_шар белый}, С2 = {2-й шар белый}. Тогда Л = С1С2, В—С1С2- Отъет. Р(Л)=1/10, Р (2?) = 6/25.
1.5. Если телефонный разговор длился время t, то вероятность его окончания в интервале времени (t, t+h) при Л-»0 равна ай + о(А). Найти вероятность того, что разговор продлится больше t. Решение. Определим события: At = {разговор к моменту t не закончился}, ДЛ = {разговор закончится в интервале времени (t, t+h)}. По условию задачи Р (Bt h |At) = осА + о (h). Событие At+h можно записать в виде At+h=AtBtth (т. е. разговор не закончится к моменту t+h, если он не закончится к моменту t и не закончится в интервале (i, t+h)). Вероятность события At обозначим P(t):P(t)=P(At). Тогда р(Л+Л)=Р(А)Р(Д,Л1А)=Р(А)(1-аЛ+о(л)) или P(t + h) = P(t)(l-ah + o(h)). Отсюда При h -»0 получим- Считая, что Р(0)=1, находим P(t) = e § 2. Независимость событий Если условная вероятность Р(Л|2?) события А при условии, что событие В произошло, совпадает с безусловной вероятностью Р(Л), то факт такого совпадения можно интерпретировать более наглядно: наступление события В не влияет на наступление события Л; естественно считать, что в случае Р(Л|5) = Р(Л) (2.1) событие А не зависит от В. Если Р(Л|Л) = Р(Л), (2.2) то В не зависит от А. Нетрудно проверить, что из (2.1) следует (2.2), а (2.2) следует из (2.1). Таким образом, понятие
независимости взаимно. За определение независимости событий А и В принимается более симметричное условие: события А и В независимы, если Р(АВ) = Р(Л)Р(5). (2.3) Из равенства (2.3) следует любое из равенств: (2.1), (2.2). Если вероятностная модель уже задана, то (2.3) можно использовать для проверки независимости событий. Чаще (2.3) используется при построении новой вероятностной модели, основанной на дополнительной информации о независимости соответствующих реальных событий. Если нас в некотором опыте интересуют события С и D, то естественно возникают четыре исхода, приведенные в § 1 (см. (1.3)). Можно показать, что из независимости событий С и D следует независимость событий в любой из трех других пар: С, D; С, Б; С, Б. Тогда для этих четырех пар должны выполняться равенства: P(CD)=P(C)P(D), Р(СО)=Р(ЙР(В), Р(СР)-Р(С)Р(Р), Р(СО)-Р(С)Р(Р). ' ’ Четыре элементарных исхода (1.3), равенства (2.4) и вероятности Р(С), P(Z>) определяют вероятностную модель, основанную на дополнительной информации о независимости событий. 2.1. Куплено два изделия, изготовленные на разных заводах. На первом заводе брак среди поступивших в продажу изделий составляет 2%, а на втором—5%. Найти вероятности событий: Л0 = {оба изделия бракованные}, А = {хотя бы одно изделие стандартное}, Аг = {ровно одно изделие бракованное}. Решение. Определим события: С={купленное изделие 1-го завода бракованное}, D — {купленное изделие 2-го завода бракованное}. Естественно предположить, что события С n D независимы и что Р (Q = 0,02, P(Z)) = 0,05. Так как А0 = СБ, то Р(Л0) = Р(С) P(Z>) = 0,02-0,05 = 0,001. Событие Аг происходит в двух случаях: 1) изделие 1-го завода бракованное, а 2-го завода—стандартное; 2) изделие 2-го завода бракованное^ а 2-го завода — стандартное. Таким образом, Ax = CD-\-CD. Отсюда P(At)
= P(CD) + P(CD), так как события CD и CD несовместны. Используя независимость событий, находим Р (CD) = Р (С) Р (D) = 0,02 • (1 - 0,05) = 0,02 • 0,95 = 0,0190, Р(СГ>) = Р (С) Р (D) = (1 - 0,02) 0,05 = 0,98 • 0,05 = 0,0490 и, следовательно, Р(Ai) = 0,0190 + 0,0490 = 0,0680. Заметим теперь, что А=А0 и Р(Л) = 1 — Р(Л0) = 0,999. 2.2. Два стрелка делают по одному выстрелу, каждый по своей цели. Вероятность поражения цели 1-м стрелком равна 0,7, а вторым—0,9. Найти вероятности событий: + = {обе цели поражены}, В= {ни одна из целей не поражена}, С= {первая цель поражена, а вторая нет}. Ответ: Р(А) = 0,63, Р(В) = 0,03, Р(С) = 0,07. 2.3. Электрическая цепь состоит из двух последовательно соединенных элементов. Вероятность отказа одного из элементов за год равна 0,2, а второго — 0,7. При отказе элемента цепь в месте его включения разрывается. Найти вероятность того, что за год цепь не будет разорвана. Ответ: 0,24. 2.4. Решить задачу 2.3, если элементы включены в цепь параллельно. Ответ: 1—0,2-0,7 = 0,86. 2.5. Вероятность аварии на 1-м объекте за рассматриваемый период равна р15 а на 2-м—р2. Найти вероятности событий: 1) ни на одном объекте аварии не было; 2) авария произошла ровно на одном объекте. Ответ: 1) (1 —Pi)(l -р2); 2) pr (1 -р2)+р2(1 ~Pi)-
ВЕРОЯТНОСТНЫЕ МОДЕЛИ С УСРЕДНЕНИЕМ ВЕРОЯТНОСТЕЙ § 1. Формула полной вероятности Если события Вк, В2, В„ попарно несовместны (BiBj=0— невозможное событие при любых zVj) и их сумма является достоверным событием (51 + ... + 5„ = О), то Р(Л)= £ р(вк)р(л|вк). (1.1) к = 1 Эту формулу называют формулой полной вероятности. Более наглядно приведенные условия означают, что среди событий Вг, В„ может наступить ровно одно и какое-нибудь из них обязательно наступит. Формулу (1.1) можно рассматривать как еще одну модель, определяющую вероятность: если в каждом из п случаев (или гипотез) известно, как вычислить вероятность любого события А (известны условные вероятности Р(Л|5|1)), то, зная вероятности случаев (или гипотез) Вк, по формуле (1.1) можно вычислить вероятность события А. Таким образом, условные вероятности при различных гипотезах усредняются с весами, равными вероятностям этих гипотез. 1.1. Среди четырех неразличимых по внешнему виду урн три урны имеют одинаковый состав шаров — 2 белых и 1 черный, а в четвертой урне—один белый и один черный шар. Из случайно выбранной урны наудачу вынимается шар. Найти вероятность того, что этот шар — белый. Решение. В качестве гипотез можно выбрать состав шаров выбранной урны: Вк = {в выбранной урне 2 белых и 1 черный шар}, 1?2 = {в выбранной урне 1 белый и 1 черный шар}. Обозначим А интересующее нас событие:
А = {вынут белый шар}. Условные вероятности события А при условии, что, известен состав шаров выбранной урны, можно вычислить при каждом условии по своей классической схеме: Р(Л|^) = -, Р(Л|Л2)=1. Вероятности событий Bt и В2, связанных с выбором урны, можно также определить по соответствующей классической схеме: 'W=;. Вероятность события А теперь вычисляется по формуле полной вероятности (1.1): pw-p(^)P^IJ>,)+p(e2)p(^lfl2)=l.?+l.l-l. Таким образом, в определении вероятности участвовали три разные классические схемы: две из них усреднялись по третьей. 1.2. В продажу поступила партия запасных деталей, произведенных на двух станках. Известно, что 70% продукции произведено на первом станке. Среди деталей, произведенных первым станком, 4% бракованных, среди деталей, произведенных вторым станком,— 1% бракованных. Найти вероятность того, что купленная покупателем деталь оказалась бракованной. Ответ: 0,031. 1.3. В ящике 3 билета, среди которых лишь один выигрышный. Найти вероятность того, что выбранный билет окажется выигрышным. Ответ: 1/3. 1.4. Решить задачу 1.3, если перед извлечением один билет (неизвестно какой) был утерян. Указание. Воспользоваться событиями: ®i = {утерян выигрышный билет}, ^2 = (утерян невыигрышный билет}. Ответ: 1/3. 1.5. Безаварийная работа объекта обеспечивается тремя контролирующими его работу системами. Вероятности того, что первым отказом будет отказ 1-й, 2-й, 3-й систем, равны
соответственно 1/2, 1/3, 1/6. В каждом из этих случаев может произойти авария с вероятностями, равными соответственно 0,04, 0,03, 0,012. Найти вероятность аварии при первом отказе какой-нибудь контролирующей системы. Ответ: 0,032. § 2. Формулы Байеса В предположениях, при которых была приведена в § 1 формула полной вероятности, можно получить следующие формулы Байеса '. р(в.М)- .pWp<-<IA> . (2.1) j Р(Д)Р(Л|Д) i=l k= 1, 2, ..., п. Согласно распространенной интерпретации этой формулы вероятности Р(Вк) называют априорными (известными до результатов опыта, в котором может наступить событие А), а Р(В4|Л)— апостериорными (переоцененными в результате наступления события А). Типичными применениями этой формулы являются ее применения в задачах «распознавания образов». 2.11 В условиях задачи 1.1 найти вероятность того, что была выбрана урна с составом шаров «2 белых, 1 черный», если известно, что вынутый шар оказался белым. Решение. Воспользуемся обозначениями, введенными в решении задачи 1.1. Нужно определить вероятность Р^^Л). По формуле (2.1) находим 3 2 Р(« 14)- Р(Д1)Р(4|В1) _ 4 3 _4 V 11 ' Р(В1)Р(Л|В1)+Р(В2)Р(Л|.В2) 3 2 1 1 5’ 4 3~*"4 2 2.2. В некотором вузе 75% юношей и 25% девушек. Среди юношей курящих 20%, а среди девушек—10%. Наудачу выбранное лицо оказалось курящим. Какова вероятность, что это юноша? Указание. Воспользоваться следующими обозначениями событий: А = {выбранное лицо оказалось курящим}, Bi — {выбранное лицо—юноша}, В2 = {выбранное лицо—девушка}.
Ответ: Р(В1|Л) = 6/7. 2.3. По каналу связи может быть передана одна из трех последовательностей букв А А А, ВВВ, ССС с равными вероятностями. При передаче каждая буква независимо от остальных принимается правильно с вероятностью 0,8 и принимается ошибочно за каждую из двух других с вероятностями 0,2. Найти вероятность того, что было передано ААА, если принято В А А. Указание. Использовать формулы Байеса и воспользоваться тем, что для независимых событий (искажения или неискажения различных букв) вероятность произведения событий равна произведению вероятностей (см. (2.3) в гл. 2). Проверить, что Р (ААА | ВАА) = 0,2 • 0,8 • 0,8, Р (ВВВ\ВАА) = 0,8 • 0,2 • 0,2, Р (ССС\ВАА) = 0,2 • 0,2 • 0,2. Ответ: 16/21. 2.4. Вероятность обнаружения дефекта в дефектном изделии равна 0,8. Вероятность принять стандартное изделие за дефектное равна 0,05. Известно, что доля дефектных изделий равна 0,05. Найти условную вероятность того, что изделие удовлетворяет стандарту, если оно было признано дефектным. Указание. Рассмотреть события: В± — {изделие дефектное}, В2 = {изделие стандартное}, А = {изделие признано дефектным}. Ответ: 19/35. 2.5. Долговременная практика рекламирования новых видов товаров показала, что после проведения рекламной компании 5% мужчин и 10% женщин желали бы приобрести новый вид зубной пасты, а остальные покупают прежние виды паст. Числа мужчин и женщин в городе Крепкие Зубы соотносятся как 4:6 и все они покупают зубную пасту. Какова вероятность того, что случайно выбранный покупатель, приобретший новый вид пасты, будет женщиной? Указание. Применить формулу Байеса. Ответ: 3/4.
ГЛABA 4 УРНОВЫЕ СХЕМЫ § 1. Вероятность произведения событий Простым обобщением «теоремы умножения» (1.2) из главы 2 является следующая формула Р(Л^2 ... Л) = Р(^1)Р(^2М1)Р(^зМ1^2) - (1 п ...Р(41М-М ( ) Содержательные применения этой формулы связаны с заданием вероятностей элементарных исходов опыта, выраженных через произведения тех или иных событий; это задание возможно, если условные вероятности в правой части (1.1) могут быть определены из естественных дополнительных предположений. 1.1. В урне 3 белых и 2 черных шара. Последовательно без возвращения вынимается 3 шара. Определить вероятность появления комбинации шаров: белый, белый, черный. Решение. Обозначим А2, А3 события, состоящие в появлении белого при первом, втором и третьем извлечениях шаров. Появление черных шаров в соответствующих испытаниях являются противоположными событиями: Л1, А2, А2. Элементарный исход, вероятность которого требуется задать по условию задачи, можно представить в виде следующего произведения трех событий Л1Л2Л3. По формуле (1.1) Р(ЛМ2Л3) = Р(Л1)Р(Л2|Л1)Р(Лз|Л1Л2). Используя классическое определение вероятности по отношению к 1-му извлечению шара, находим Р(4)=3/5. Условную вероятность P(AMi) (второй шар белый, при условии, что первый—белый) можно найти по классическому определению, примененному к урне с измененным составом (первоначальное число шаров уменьшилось на один после
2 1 удаления белого шара). Тогда Р(Л2|Л1) = -=-. Аналогично находим р(л3|лм2)=|. Перемножая эти три вероятности, получим окончательный результат Р(Л1Л2Л3)=-----=-. ' 1 2 37 5 4 3 5 1.2. Из урны, содержащей три билета (среди них один выигрышный), по одному без возвращения извлекают билеты. Определить вероятность того, что выигрышным будет последний билет. Указание. Представить нужное событие в виде произведения трех событий, относящихся к результатам различных извлечений. Ответ: 1/3. 1.3. Из урны, содержащей 3 черных и 2 белых шара, два игрока поочередно извлекают шары (без возвращения). Выигрывает игрок, первым вытащивший белый шар. Найти вероятность выигрыша игрока, начавшего игру. Указание. Воспользоваться следующим представлением события А = {выиграл игрок, начавший игру}: А — ВГ + ВГВ2В3, где Bi = {i-n шар, извлеченный из урны,— белый}, т. е. первый игрок выигрывает в двух взаимно исключающих случаях: сразу извлекает белый шар (событие Bj) или в случае (^ВгВэ), когда при первом извлечении появляется черный шар (Bt), 2-й игрок тоже вытаскивает черный шар (В2), и при втором подходе 1-й игрок вытаскивает белый шар (В3). Ответ: 3/5. 1.4. Из 1-й урны, содержащей 2 белых и 2 черных шара, переложили наудачу один шар во 2-ую урну, в которой сначала было 2 черных и 1 белый шар. После этого из 2-й урны наудачу выбранный шар вернули в 1-ю урну. Найти вероятность того, что состав шаров в 1-й урне после этих перекладываний не изменится. Указание. Определим события: Вх = {из 1-й урны переложен белый шар},
В2 = {вз 2-й урны вернули белый шар}. Событие А = {состав шаров 1-й урны не изменится} представить в виде: А = ВцВ2 + ВГВ2, т. е. состав не меняется, если вынули белый и вернули белый или вынули черный и вернули черный. События ВГВ2 и ВгВ2 несовместны. Ответ: 5/8. § 2. Две модели случайного выбора Дадим описание вероятностных моделей случайного выбора в терминах «шаров» и «урн». В реальных приложениях «шарами» могут быть детали контролируемой партии изделий, особи биологической популяции, численность которой оценивается, и т. п. Из урны, содержащей N шаров, среди которых М белых и N—M черных, извлекают по одному п шаров. Если каждый извлеченный шар сразу возвращается обратно, то такую, схему выбора называют случайным выбором с возвращением; если ни один извлеченный шар не возвращается, то говорят о случайном выборе без возвращения. Элементарные исходы любого из этих опытов можно описать цепочками длины п, составленными из цветов извлекаемых шаров. Можно также эти исходы представить в виде произведений событий: Ai = {i-H шар белый}, А{ = {1-й шар черный}. Например, при и = 3 {белый, белый, белый} = Л1Л2Л3, {белый, черный, белый} =Л1тГ2Л3 и т. д. Вероятность любого исхода в каждой из рассматриваемых моделей определяется по формуле (1.1), в которой условные вероятности вычисляются по классическому определению, примененному к данному извлечению одного шара из урны, состав которой определился предыдущими извлечениями. Например, в случае выбора без возвращения Р (А41А 1А^2А^з)—,
так как к четвертому извлечению в урне осталось N— 3 шара и из них М белых (извлекались только черные шары); Р(/3М1Л)=^, Р(Л5|Л1Л2Л3Л4)=^^ и т. д. В случае выбора с возвращением состав шаров в урне не меняется и те же вероятности определяются следующими равенствами: Р(Л4|Л1Л'2Л3)=Р(Л3|Л1Л2)=^, P(Z5|A^3A)=^. Отметим, что вероятности исходов не изменятся, если их вычислить непосредственно по классической схеме без привлечения формулы (1.1). При решении задач нужно пользоваться наиболее подходящим в данном случае определением. Каждый исход опыта однозначно определяет число X белых шаров среди п выбранных. Таким образом (см. § 3 гл. 1), X является случайной величиной. Случайную величину X можно представить в виде суммы более простых величин Х=У1 + У2 + ... + Ул, (2.1) где случайная величина Yk (к=1,...,п) равна 1, если к-й извлеченный шар белый и У& = 0 в противном случае. Это представление часто используется при решении задач. 2.1. Из урны, содержащей 4 белых и 6 черных шаров, по схеме выбора без возвращения извлекается 3 шара. Описать множество элементарных исходов, указать их вероятности. Решение. Возможны следующие 8 исходов: св1 = Л1Л2Л3 = {все три шара белые}, <в2=Л1Л2Л3 = {1-й шар черный, остальные белые}, со3 = -Л 1Л2Л3, со4 — AjА2Лз, =-43_42-г4з> 2^13, =^4j^42^43, COg = ^43^42^3* По формуле (1.1) находим .р(<й1)=р(л1)Р(^2|л1)р(л3|л1л2)=А.|.|=1
Р(Ш2).Р(Л,)Р(Л2|Л)Р(ЛИ1.Ы-£Л|-^. и т. д. В результате получим: к 1 2 3 4 5 6 7 8 PS) 1/зо 3/зо 3/зо 3/зо 5/зо 5/зо 5/зо 5/зо 2.2. В опыте, описанном в задаче 2.1, для случайных величин fl, если 1-й шар белый, [О, если 1-й шар черный, fl, если 2-й шар белый, [О, если 2-й шар черный, найти вероятности: Р{У1 = 1}, Р{У1 = 1, У2 = 1}, Р{У1=0, У1 = 1}. Указание. Воспользоваться определением случайного выбора без возвращения и равенствами {Y! = 1}=Ai, {У1 = 1, У2 = 1} = Л1Л2, {У1 = 0, Y2 = l} = AiA2. Ответ: 4/10, 12/90, 24/90. 2.3. В опыте, описанном в задаче 2.1, найти закон распределения случайной величины X, равной числу белых шаров среди выбранных. Указание. Воспользоваться решением задачи 2.1. Для вычисления Р{Х=т} сложить вероятности исходов, в которых было т белых шаров. Например, для вычисления Р{Х=1} НУЖНО СЛОЖИТЬ ВерОЯТНОСТИ СЛеДуЮЩИХ ИСХОДОВ 605=^1^2^3, <Вб = Л1ЛгЛз, а>7 = А1А2Аз. Ответ: т 0 1 2 3 Р{Х=т} 5/30 15/30 9/30 1/30 2.4. Решить задачу 2.1 для схемы выбора с возвращением. Указание. Воспользоваться описанием исходов (t>i, ..., со8, приведенных в задаче 2.1.
2.6. Решить задачу 2.3 для схемы выбора с возвращением. Ответ: т 0 1 2 3 Р{Х=т} f-Y \10/ 4^ 102 4^6 103 f-Y \10/ 2.7. В общей схеме случайного выбора без возвращения определить закон распределения числа X белых шаров среди выбранных п. Решение. Из определения случайного выбора без возвращения следует, что вероятности любого элементарного исхода, содержащего т белых шаров, одинаковы и равны ЛГ(ЛГ-1)...(ЛГ-л+1) Если воспользоваться обозначениями обобщенной степени, к[тА=к{к—!)...(к—т + 1), то вероятность исхода с т белыми шарами можно переписать в следующем виде: Для вычисления вероятности события {Х=т} нужно сложить одинаковые вероятности всех исходов с т белыми шарами. Число таких исходов равно числу способов расположений т белых шаров среди п мест цепочек, описывающих элементарные исходы, а это—число сочетаний С" из п элементов по т. Таким образом, в случае выбора без возвращения Р {Х=т} = . (2.2) 2 - 8516 Ватутин 33
Эту формулу можно также записать в следующем виде Р{Х=т}=мС (2.3) N—M C"N ’ т = 0, 1, ..., min(M, и), схеме случайного выбора с возвращением распределения числа X белых шаров среди Решение аналогично решению задачи 2.7. содер- 2.8. В общей определить закон п выбранных. Указание. Воспользоваться тем, что вероятность любого исхода, жащего т белых шаров равна — ----- J \ N J Ответ: В случае выбора с возвращением (2.4) п. 20 теннисных мячей (12 взяли по одному мячу. нет новых; два новых; новых Найти /и = 0, 1 2.9. Из ящика, содержащего и 8 старых), пять спортсменов вероятности событий: 1) среди отобранных мячей 2) среди отобранных ровно 3) все отобранные мячи новые. Решение. Воспользуемся формулой (2.3). Выбор без возвращения производится из общего числа #=20 мячей; число новых мячей М = 12; отбирается п — 5 мячей. Все три события, вероятности которых надо найти, совпадают соответственно со следующими событиями: 1) {#=0}, 2) {Х—2}, 3) {#=5}, где X—число новых мячей. Таким образом, Р(г=01=^*=— p[Y-2)-CbCi-77 * -• С20 1938’ * -• С20 323’ pZr= зз * do 646' 2.10. В группе из 28 учащихся четверть родилась летом. Наудачу отбирается 4 учащихся. Найти вероятности событий: 1) среди отобранных двое родились летом; 2) среди отобранные хотя бы один родился .летом.
Указание. В п. 2 найти сначала вероятность противоположного события и воспользоваться формулой (2.3) главы 1. Ответ: 1) 42/195; 2) 46/65. 2.11. Группу из 2п юношей и 2и девушек наудачу разделили на две части. Найти вероятность того, что в каждой части юношей и девушек поровну. Ответ: (Сл2л)2/С^. 2.12. В общей схеме случайного выбора без возвращения для случайных величин (1, если к-й шар белый, У& = )А 1 “ (О, если к-и шар черный определить вероятности: Р{П=1}, р{у,-=1, у7=1}. Решение. Удобнее воспользоваться классическим определением. Пусть все шары занумерованы. Элементарным исходом является упорядоченный набор п различных номеров, выбираемых из N номеров шаров, т. е. элементарные исходы—это размещения из N элементов по п и, следовательно, их число |П| = Лл = .У(.У— и+1) = .У[л3. Найдем число благопри- ятных исходов для события {У|С=1} = {А:-й шар белый}. В цепочке из п номеров, описывающих исход опыта, k-е место должно соответствовать белому шару и, следовательно, его можно заполнить М способами (номер любого белого шара). При любом из этих заполнений остальные и — 1 мест можно произвольно заполнить N— 1 оставшимися номерами шаров. Это можно сделать (N— 1)[л-13 способами. Общее число способов равно произведению: | {У^ = 1} | —A/-(7V—1)[л-13. По формуле (2.1) главы 1 находим р(У _ll-Kn=l}l_Af(Ar-l)-(Ar-»+l)_Af 1 к 3 |П| JV(JV-J)...(jV-n+l) ЛГ’ Аналогично вычисляется вероятность Р {У4=1, У,-=1}> i*j. Окончательно для схемы выбора без возвращения получаем р{у =1}=^, P{yf=l, y.= l} = MjM^lL^, zVj. (2.5) 1 к 3 АГ’ 11 3 3 АГ(АГ-1) AM21’ J v 7
2.13. Решить задачу 2.12 для схемы выбора с возвращением. Ответ: Для схемы выбора с возвращением р{п=0=^; m=i. т,= г}=^„ i*j. (2.6) 2.14. При большом числе шаров N по отношению к п различие между схемами выбора с возвращением и без возвращения уменьшается. Найти пределы вероятностей (2.2) и (2.4), когда М, N->ao так, что мlN-+p (0<р< 1), а п и т остаются постоянными. Ответ: оба предела одинаковы и равны Ст^т /1 —\ п — т пР (1-Р) § 3. Более общие модели случайного выбора В предыдущем параграфе рассматривалась модель, в которой при каждом испытании было два возможных исхода: белый или черный шар. Будем теперь предполагать, что урна содержит W шаров, занумерованных числами 1, 2, ..., N. Извлекается п шаров. В результате п извлечений получим цепочку номеров извлеченных шаров: <B = (h, i2, in)- (3-1) Если извлеченный шар обратно не возвращается, то в цепочке (3.1) все it, ..., in различны. Множество всех таких цепочек Q={(z\, ..., in):ik-l, 2, ..., N; ik=£ii при k=£l] содержит \£l\=N(N—l)...(N—n+l) цепочек. Это множество элементарных событий более общей схемы выбора без возвращения. В случае выбора с возвращением множество элементарных событий Q состоит из цепочек, в которых числа it, i2, , in могут повторяться: Q = {(4, i2, ..., 4):4=1, 2, ..., N, к=\, ...,«}. (3.2) В этом случае в Q имеется |Q| = 7V" цепочек. В двух рассмотренных схемах все элементарные события естественно считать равновероятными и вероятность определить по классической схеме. Отметим, что в случае, когда шары с номерами 1, 2, ..., М белые, а М+1, ..., N—черные, то события, выраженные в тер
минах черных и белых шаров будут иметь такие же вероятности, как вероятности соответствующих событий, вычисленные в моделях § 2. 3.1. Найти вероятность того, что в группе из 6 человек ни у кого нет дня рождения в январе и декабре. Указание. Использовать схему случайного выбора с возвращением при и = 6, #=12. Решение. «Шарами» можно считать 12 месяцев года. День рождения соответствует результату извлечения шара в схеме с возвращением. Таким образом, множество Q состоит из цепочек длины 6, составленных из чисел 1, 2, ..., 12. Число таких цепочек |Q| = 126. Событие А, состоящее в том, что нет дней рождения в январе и декабре, означает, что благоприятны цепочки длины 6, составленные только из 10 чисел 2, 3, ..., 10, 11. Число таких цепочек |Л| = 10б. Таким образом, по классическому определению гл. 1, § 1, (1.1): Ответ: 0,334897... 3.2. В задаче 3.1 найти вероятность того, что хотя бы два человека родились в один месяц. Указание. Найти вероятность противоположного события, состоящего в том, что все дни рождения приходятся на разные месяцы. Благоприятные этому цепочки длины 6 должны составляться из разных чисел. „ , 12-11 -10-9-8-7 Ответ: 1—-------------=0,777199... 12® 3.3. Найти вероятность того, что в группе из 30 человек нет общих дней рождения. Указание. Воспользоваться схемой с возвращением в случае и = 30, #=365. Ответ: fl—-V1——Y„f 1 = 0,29368... \ 365/\ 365/ \ 365/ 3.4. В схеме случайного выбора с возвращением обозначим Хп случайную величину, равную числу появлений среди п шаров шара с номером 1. Найти Р{Хп>Ь}. / 1 \л Ответ: 1—1 1---. \ N)
ГЛАВА 5 ВЕРОЯТНОСТНЫЕ МОДЕЛИ С КОНЕЧНЫМ ЧИСЛОМ ИСХОДОВ § 1. Определение вероятности. Случайные величины Вероятностная модель с конечным числом исходов обобщает почти * все обсуждавшиеся в предыдущих главах схемы. Предлагаемое обобщение упрощает введение основных понятий и облегчает построение новых моделей с конечным числом исходов. Пусть множество элементарных событий Q={<n}—конечно; {р(<в):<веИ}—конечный набор чисел (элементарных вероятностей), удовлетворяющих условиям р(<в)>0, <веП, У р(<в)=1. (1.1) coeQ Любое событие А определяется благоприятствующими ему элементарными исходами со (А подмножество £1). Вероятность события А равна сумме тех элементарных вероятностей р (<в), у которых <в входят в А: Р(Л)= Хр(<в). (1.2) coeQ Это определение совпадает с определением классической схемы главы 1, если все элементарные вероятности р(<в) одинаковы: = Вероятностная модель с четырьмя исходами из главы 2 (см. (1.3), (1.4)) также является частным случаем _модели с конечным числом исходов. Здесь £1={CD, CD, CD, CD}, а вероятности исходов задаются соотношениями (1.4) гл. 2. * Исключением является глава 3. Рассматривавшаяся в ней модель может быть получена усреднением вероятностей, определенных для моделей с бесконечным числом исходов.
Случайной величиной для модели с конечным числом исходов называется любая функция от элементарного события, определенная на всех <neQ. Очевидно, что число различных значений любой случайной величины не превосходит |Q|. Пусть х15 ..., х„ (и<Щ|) различные значения случайной величины X. Закон распределения случайной величины Х=Х(аи) определяется формулой P{X=xk}= X р(<в). (1.3) ше{(о:У((о)=х4} В правой части этого равенства суммируются элементарные вероятности тех исходов <в, при которых Х(т) = хк. Две случайные величины X и Y называются независимыми, если для любых значений (xh yj), i=l, ..., п, j=l, ..., т пары (X, Y) выполняется равенство Р {X=xb Y=yj} =Р {Х=х(} Р { Y=yj}. (1.4) Если хотя бы для одной пары (х;, уД равенство (1.4) не выполняется, то величины зависимы. Формула для вычисления вероятности в левой части (1.4) аналогична (1.3): P{X=xh Y=yj}= X p((B). (1.5) й)€{со:У((о)=х(, У(ш)=^} Для любого конечного числа случайных величин Хк, Х2, , Хг вводится понятие взаимной независимости или просто независимости. Случайные величины Хи ..., Хг независимы, если для любых значений (xlfl, ..., xrir) вектора (Xt, ..., Хг) выполняется равенство P{Xt=xUt, ..., Xr = xrir} =Р {Xt=xtii} ...-Р {Xr = xrir}. (1.6) Отсюда следует, что для любой части этих величин выполняются аналогичные соотношения. 1.1. Из урны, содержащей 4 белых и 6 черных шаров, по схеме случайного выбора без возвращения выбирается 3 шара. Найти распределения вероятностей для каждой из случайных величин fl, если z-й шар белый, 1 (0, если z-й шар черный, 1=1, 2, 3. Решение. Воспользуемся решением задачи 2.1 главы 4. Найдем, например, закон распределения У3. Величина
Y3 принимает два значения: 0 и 1. Событие {У3 = 1} происходит при _ следующих элементарных _ событиях: — ^41^4.2^43) СО2 = -^1^4 2-^3) ®з =СО7 = ^41^42-^3* COOT" ветствующие элементарные вероятности определяются равенствами рМ=^. рМ=^. '•W-S' 'М=5- По формуле (1.3) находим Р { Y3 = 1} =р (Oi)+р (ю2)+р (<о3)+р (<о7) = I 2 3 Отсюда Р{У3=0} = 1—-=-, так как события У3 = 1 и У3 = 0 противоположны. Аналогично находим Р {У2 = 1}=Р{ Ух = 1} = 2 = Таким образом, для любой из трех рассматриваемых 2 3 случайных величин имеем: Р{У, = 1}=-, Р{У = 0}=~, i=l, 2, 3. 1.2. Являются ли случайные величины Уъ У2, У3, определенные в задаче 1.1, независимыми? Указание. Найти вероятность Р{УХ = 1, У2=1, У3 = 1}; воспользоваться определением (1.6). Ответ: Случайные величины Уь У2, У3 зависимы. 1.3. Решить задачу 1.1 для схемы выбора с возвращением. Ответ: р{у.= 1} = ?, р{у. = о}=Ц, /=1, 2, 3. * 1.4. Решить задачу 1.2 для схемы выбора с возвращением. Ответ: Случайные величины Уъ У2, Уз независимы. 1.5. Являются ли независимыми случайные величины Уъ У2, ..., У„, определенные в § 2 гл. 4 для общей схемы случайного выбора без возвращения. Указание. Использовать решение задачи 2.13 гл. 4. Ответ: Случайные величины Уъ ..., Ул зависимы. 1.6. Решить задачу 1.5 для схемы случайного выбора с возвращением. Ответ: Случайные величины Уъ ..., Y„ независимы. 1.7. К трем болтам были подобраны гайки. При сборке гайки выбирали наудачу. Найти распределение случайной величины X, равной числу гаек, попавших к своим болтам.
Указание. Использовать классическую модель; выписать элементарные события; воспользоваться формулой (1.3). Ответ: к 0 1 2 3 В{Х=к} 2/6 3/6 0 1/6 § 2. Математическое ожидание Среднее значение или математическое ожидание случайной величины для классической схемы было определено формулой (4.1) гл. 1 как среднее арифметическое значений случайной величины, принимаемых при различных равновероятных исходах. В общем (неравновероятном) случае усреднение естественно проводить с различными весами. Математическим ожиданием МУ случайной величины X в конечной схеме называется число МУ= £У(<о)р(со), (2.1) где р(ю) — элементарные вероятности. Предположим, что различных значений х1? ..., х„ случайной величины У меньше |Q|. В этом случае среди У (о) в (2.1) есть одинаковые. Если в (2.1) привести подобные члены, то получим следующую формулу МУ= f xkV{X=xk}. (2.2) fc=i В случае п = | Q | формула (2.1) очевидно совпадает с (2.2). Приведем свойства математического ожидания. 1°. Математическое ожидание постоянной величины С равно этой величине: МС=С. (2.3) 2°. Постоянный множитель С можно выносить за знак математического ожидания: М(СУ) = СМУ (2.4) 3°. Математическое ожидание суммы случайных величин равно сумме их математических ожиданий:
М (х+ Y) = МУ+ М Y. (2.5) 4°. Математическое ожидание произведения независимых (условие независимости существенно) случайных величин X и Y равно произведению их математических ожиданий: MXY=MX-MY. (2.6) Свойства (2.5) и (2.6) переносятся на любое число случайных величин. 2.1. Закон распределения случайной величины X определен таблицей: к 1 2 3 хк -1 2 3 Р{Х=хк} 1/2 1/4 1/4 Найти MX. Указание. Использовать формулу (2.2). Ответ: 3/4. 2.2. Найти математическое ожидание случайной величины X, определенной в задаче 1.7. Решение. Занумеруем болты и соответствующие им гайки цифрами 1, 2, 3. Исходы опыта будем обозначать тройками цифр: 1-ая цифра—это номер гайки, взятой для 1-го болта, 2-ая цифра — номер гайки для 2-го болта и 3-ья цифра—номер гайки для 3-го болта; событие 123 означает, что для каждого болта отобрана своя гайка; 213 = {2-ая гайка для 1-го болта, 1-ая для второго и 3-ья для третьего} и т. д. Таким образом, имеем 6 элементарных событий: Q = {123, 132, 213, 231, 312, 321}. Составим таблицу, определяющую для каждого исхода со соответствующую элементарную вероятность р (со) и значение случайной величины У(со): (О 123 132 213 231 312 321 1 1 1 1 1 1 Р(ш) — 6 6 6 6 6 6 2Г(ш) 3 1 1 0 0 1
По формуле (2.1) находим МХ=3.-+1--+1 .-+0--+0 •-+!•-= 1. 6 6 6 6 6 6 Если воспользоваться законом распределения X, найденным в задаче 1.7, то MX можно найти по формуле (2.2): МХ=3-Р{Х=3}+1 -P{X=l} + 0-P{X=0} = = з.1+1.2=1. О о 2.3. Из урны, содержащей 4 белых и 6 черных шаров, по схеме случайного выбора без возвращения извлекается 3 шара. Случайные величины Уъ У2, Т3 определяются равенствами fl, если г-й шар белый, (О, если г-й шар черный. Найти МУ15 МУ^г, MYrY2Y3. Решение. В задаче 1.1 получен закон распределения Ух: Р{У1 = 1}=|, Р{У1==0} = ^. Отсюда по формуле (2.2): МУ1 = 1-Р{У1 = 1} + 0-Р{У1=0}=|. Произведение У1У2—новая случайная величина, принимающая тоже два значения 0 и 1. По формуле (2.2) находим, что МУ1У2 = Р{У1У2 = 1}. Событие {Y1Y2 = 1} происходит при со1=Л1Л2Л3, <в4 = Л1Л2Л3, определенных в задаче 2.1 гл. 4. Там же подсчитаны элементарные вероятности р((Ог) = 1/30, р(го4) = 3/30. Таким образом, Р{У1У2 = 1}=/г(<в1)+/?(<в4) = 2/15 и, следовательно, MY1Y2 = 2/\5. Аналогично находим М Yr У2 У3 = Р {Yr У2 У3 = 1} =р Н = 1/30. 2.4. Решить задачу 2.3 для схемы выбора с возвращением. Указание. Воспользоваться независимостью величин Уь Y2, Y3 (см. задача 1.4) и свойством математического ожидания (2.6). Ответ: MYr=~, MYiY2=-, MY1Y2Y3=8^-. 1 5 1 2 25 1 2 3 125
2.5. Найти математическое ожидание числа белых шаров среди п шаров, отобранных по схеме выбора без возвращения (см. § 2 гл. 4). Указание. Для числа белых шаров X использовать представление в виде суммы (2.1) гл. 4. Воспользоваться обобщением свойства математического ожидания (2.5). Ответ: nM/N. 2.6. Решить задачу 2.5 для схемы выбора с возвращением. Ответ: nM/N. 2.7. К п болтам подобраны гайки. При сборке гайки выбирали наудачу. Найти математическое ожидание случайной величины X, равной числу гаек, попавших к своим болтам. Указание. Представить X в виде: Х= Yi+ Y2 +...+ Y„, где Yi — 1, если к i-му болту попала своя гайка и У) = 0 в противном случае. Воспользоваться свойством математического ожидания (2.5). Ответ: М¥=1. 2.8. Известно, что МХ=2, МУ=3 и случайные величины X и Y независимы. Найти: 1) М(ЗХ), 2) МУУ, 3) М(У+У), 4) М(ЗХ-2У). Указание. Воспользоваться свойствами 2.4—2.6. Ответ: 1) 6; 2) 6; 3) 5; 4) 0. 2.9. В схеме случайного выбора с возвращением (см. § 3 гл. 4) обозначим р.о («> N) число непоявившихся номеров шаров. Найти Мц0(п, N). Вычислить lim — Мц0(п, N), если jv—♦ a, N n = aN (а >0—некоторая постоянная). Указание. Воспользоваться представлением Цо(п, N) в виде суммы: По (я, N)=Z1 + ...+Zn, где Zt=l, если шар с k-м номером не появился Zk = 0 в противном случае. Использовать также свойство математического ожидания (2.5). / А» Ответ: N 1 —) : е “.
§ 3. Дисперсия. Неравенство Чебышёва Мерой разброса случайной величины относительно своего среднего значения является дисперсия. Дисперсией случайной величины Х=Х(уХ) <neQ называется число ПГ=М(Г-МГ)2, (3.1) т. е. дисперсия равна математическому ожиданию квадрата отклонения случайной величины от своего математического ожидания. Определение (3.1) сохраняется для любой вероятностной модели. Среднеквадратичным отклонением называют у/ТУХ. Для вычисления дисперсии можно также пользоваться формулой ПГ=МГ2-(МЛу. (3.2) В конечной схеме, определенной в § 1, иногда полезны формулы DY= X (Г(<в)-МГ)2р(<в), (3.3) (й 6 Q МГ2= Y Г2(<в)р(<в), (3.4) или равенства Dr= f (xk-MX)2P{X=xk}, (3.5) k=l n MI2= £ xkP{X=xk}. (3.6) k=l Все эти соотношения являются следствием формулы (2.1). Приведем свойства дисперсии. 1°. Дисперсия постоянной С равна 0: DC=0. (3.7) 2°. Постоянный множитель можно выносить за знак дисперсии, возведя его в квадрат: D(CX) = C2DX. (3.8) 3°. Дисперсия суммы независимых случайных величин равна сумме дисперсий B(X+Y) = DX+DY. (3.9)
Если известна дисперсия, то можно оценить вероятность отклонения случайной величины от своего математического ожидания, воспользовавшись неравенством Чебышёва: Р{|Х-МХ|>е}^ (3.10) при любом Е>0. 3.1. Закон распределения случайной величины X определен следующей таблицей: к 1 2 3 4 xk -1 0 1 2 1/8 3/8 3/8 1/8 Найти MX, MX2, DX Указание. Воспользоваться формулами (2.2), (3.6) и (3.2) или формулами (2.2) и (3.5). Ответ: 1/2, 1, 3/4. 3.2. Известно, что случайные величины X и Y независимы, причем DT=4, DE=3. Найти: 1) D(3Jf), 2) D( —2У), 3) D(Z+E), 4) D(X-E). Указание. Воспользоваться свойствами (3.8), (3.9). Обратить внимание на (3.8) для отрицательных C:D(-2Y) = (-2)2DY; D(X— Y) = DX + DY. Ответ: 1) 36; 2) 12; 3) 7; 4) 7. 3.3. Из урны, содержащей 4 белых и 6 черных шаров по схеме случайного выбора без возвращения извлекается 3 шара. Найти дисперсию числа X белых шаров среди выбранных. Указание. Воспользоваться формулами (3.6) и (3.2) или (3.4) и (3.2), а также решениями задач 2.3 или 2.1 гл. 4. Ответ: 14/25. 3.4. Решить задачу 3.3 в случае выбора с возвращением. Указание. Воспользоваться формулами (3.6) и (3.2), а также решениями задачи 2.4 гл. 4. Ответ: 18/25. 3.5. Найти дисперсию числа белых шаров X в случае схемы выбора с возвращением, описанной в § 2 гл. 4. Указание. Использовать представление X в виде суммы (2.1) гл. 4, решение задачи 1.6 и обобщение свойства дисперсии (3.9).
о. М\ Ответ: DX=п — 1----. N \ N J 3.6. Найти математическое ожидание и дисперсию случайной величины У=(У—МУ)/^/БУ. Указание. Любая случайная величина и постоянная независимы. Воспользоваться представлением Y в виде ( 1 -Д , / MX \ У=| -У + -— и свойствами математического ожидания \Vdx / \ jDxJ и дисперсии. Ответ: МУ=0, 1)У=1. 3.7. Известно, что МУ =10, БУ=0,4. Используя неравенство Чебышева, оценить снизу вероятность того, что абсолютная величина отклонения У—10 не превосходит 2. Указание. Так как Р{|У—МУ|<е} = 1 —Р{| У—МУ|^е}, то из неравенства Чебышева (3.10) следует, что р{|у-му|<е}^1-^. Ответ: Р{|У-10|<2}^0,9. 3.8. Оценить снизу вероятность того, что величина |У—МУ| не превосходит К среднеквадратичных отклонений. Найти числовое значение оценки при К=3. Указание. Оценить по неравенству Чебышева вероятность Р{|У- MX\^Ky/DX}. Воспользоваться указанием к задаче 3.7. Ответ: Р{\Х-МХ\<К^ВХ}^1- при К=3 интере- сующая нас вероятность не меньше 8/9. 3.9. Из урны с М белыми и N—M черными шарами по схеме случайного выбора с возвращением извлекается п шаров. Пусть У—число белых шаров среди выбранных. В качестве оценки (приближенного значения) неизвестной доли М/N белых шаров можно взять случайную величину У/п. Оценить снизу вероятность того, что У/п отличается от М/N не больше е. Указание. Так как М(У/и)=-МУ, Б(У/и) = ДбУ, то п гг согласно решению задач 2.5 и 3.5 имеем М^=-, Df-") = --fl--\ (3.11) \п) N \п) nN\ NJ v 7
Воспользоваться неравенством Чебышева. Ответ: Р 1 м(\—м'\ пг2 N \ nJ' й У § 4. Ковариация. Коэффициент корреляции Ковариацией случайных величин X и У называется число — cov(X, У)=М[(Х-MX) (У-МУ)]. (4.1) Ковариацию можно также находить по формуле cov (X, У) = МХУ-МХМУ. (4.2) Отметим, что cov(X, У) = cov (У, X). Если случайные величины X и У независимы, то cov(X, У) = 0. Отсюда следует, что в случае cov(X, У)#0 величины X и У зависимы. В качестве меры зависимости используется следующая величина, получающаяся нормированием cov(X, У): Величина (4.3) называется коэффициентом корреляции. Коэффициент корреляции иногда обозначают согг(Х, У). Определения (4.1), (4.3) и формула (4.2) сохраняются в любой вероятностной модели. Если для любой пары Xh Xj величин Xt, Х„ известна cov(X;, Xj), то можно вычислить дисперсию суммы всех величин D(X,+ ... +Х„) = £D^+Zcov(Xf, Xj). (4.4) .=i Отсюда для независимых величин имеем D(Xi+...+X„) = DXt+...+DX„. (4.5) 4.1. Известно, что МХ=1, МУ=2, MX2 = 2, МУ2 = 8, МХУ=1. Найти DX, ОУ, COv(X, У), Px.Y- Являются ли величины X, У независимыми? Указание. Воспользоваться формулами (3.2), (4.2), (4.3). Ответ: DX=1, ОУ=4, cov(X, У) = — 1, pXY=— 0,5; случайные величины зависимы. 4.2. Найти О(Х+У), если X и У удовлетворяют условиям задачи 4.1.
Указание. Использовать формулу (4.4) при л = 2: D (У+У) = D У + 2cov (У, У). Ответ: D (Х+ Y) = 4. 4.3. Из урны с М белыми и N—M черными шарами по схеме случайного выбора без возвращения извлекается п шаров. Положим У(=1, если z-й шар белый, и Y{ = 0, если z-й шар черный, (i= 1, ..., п). Найти DYb cov (У,, Yj), i=£j. Указание. Воспользоваться решениями (2.5), формулами (3.2) и (4.2) и равенствами У?=У;. М ( . м\ lv V\ (л лЛ Ответ: ПУ.=—1------; cov(Yb Yj)=----------г 1 — — . nJ v 1 ” n(n-\}\ nJ 4.4. Найти дисперсию числа X белых шаров среди п шаров, выбор которых описан в задаче 4.3. Указание. Воспользоваться формулой (4.4) и решением задачи 4.3. Ответ: DX=n-\ N M\N—n NlN-l (4-6) 4.5. Решить Указание. (4-6). Ответ: Р задачу 3.9 для выбора без возвращения. Использовать указание к задаче 3.9 и формулу х_м ~п ~N 1 i_M\N-n ~n)n-\' Заметим, что полученная здесь оценка снизу лучше оценки в задаче 3.9, так как множитель (У—n)/(N— 1) меньше 1. Таким .образом, случайный выбор без возвращения дает более точную оценку доли белых шаров. 4.6. Для схемы случайного выбора с возвращением (см. §3 гл. 4) определим случайные величины Zk (k= N): Zk=], если шар с k-м номером не появился и Zk = Q в противном случае. Найти cov(Zb Zt), k^=l; DZk. Ответ: cov(Zk, Z|)=(l--) -(1—J ; Z>Zt = (l--l - \ NJ 4.7. Найти дисперсию величины ц0, определенной в задаче 2.9. При и = аУ (а>0—некоторая постоянная) найти lim АГ—► оо
Указание. Воспользоваться указанием к задаче 2.9, формулой (4.4) и решением задачи 4.5. (1 / 1 \2и 1-- +У(У-1)11--) —N2[ 1--I ; NJ ' \ NJ \ NJ lim ^--ОНо = е-“[1—(1 + а)е"“]. N—» оо 2V
ГЛABA 6 СХЕМА БЕРНУЛЛИ § 1. Определение вероятности Схема Бернулли является вероятностной моделью последовательности независимых испытаний, в каждом из которых может наступить один из двух исходов, и испытания проводятся в неизмененных условиях. Как вероятностная модель схема Бернулли является частным случаем конечной схемы, рассмотренной в главе 5. Традиционно два исхода в отдельных испытаниях схемы Бернулли называют «успехом» и «неудачей». Элементарными исходами п независимых испытаний схемы Бернулли являются цепочки длины п из «успехов» и «неудач». Для краткости «успехи» и «неудачи» будем обозначать буквами У и Н. Тогда, например, при и = 4 цепочка УУУУ означает, что каждое из четырех испытаний закончилось успехом; цепочка НУУН означает, что первое и последнее испытания закончились неудачей, а остальные—успехом и т. д. Вероятность успеха в любом отдельном испытании должна быть задана; эту вероятность обозначают р(0<р<1). Вероятность неудачи в отдельном испытании равна <?=1— р. В схеме Бернулли любые события, относящиеся к различным испытаниям или различным (непересекающимся) группам испытаний, являются независимыми. Отсюда следует, что вероятность любой цепочки равна произведению п сомножителей р и q, соответствующих У и Н в данной цепочке. Например, Р(УУУУ)=р-рр-р=р4, P{HyyH)=q-pp-q=p2q2. Вероятность любого элементарного исхода, содержащего т успехов и п — т неудач, равна pmqn~m. Таким образом, описаны элементарные события и указаны их вероятности. Этого достаточно для полного задания конечной вероятностной схемы. Вероятность любого события
вычисляется как сумма вероятностей элементарных событий, вводящих в данное случайное событие (см. (1.2) гл. 5). Отметим, что вероятности цепочек, относящихся к меньшему числу испытаний, вычисляем по тому же правилу, что и для полных цепочек схемы. 1.1. Выписать все элементарные исходы схемы Бернулли с п = 3 испытаниями и найти их вероятности, если вероятность успеха равна р. Найти вероятность события А = {успехи и неудачи чередуются}. Указание. А = {УНУ, НУН}. Ответ: P(A)=p2q+pq2 =pq. 1.2. В условиях предыдущей задачи найти распределение вероятностей случайной величины ц3, равной числу успехов в трех испытаниях. Ответ: т 0 1 2 3 Р{Из = т} 93 Зм2 зр2? Р3 1.3. В условиях задачи 1.1 найти вероятность того, что произошло ровно два успеха, причем не в соседних испытаниях. Ответ: p2q. 1.4. В условиях задачи 1.1 найти вероятность того, что произошло четное число успехов. Ответ: q3 + 3p2q. 1.5. В схеме Бернулли с п испытаниями и вероятностью успеха р найти вероятности событий: А = {произошел хотя бы один успех}, В={ни одного успеха не произошло}. Указание. Событие В противоположно А:В=А. . Ответ: Р(Л)=1— qn, P(B) = qn. 1.6. В схеме Бернулли с п испытаниями и вероятностью успеха р найти вероятности событий: Ак = {успех впервые произойдет на k-м испытании}, В={за п испытаний успех не произойдет}. Указание. Пусть Cj=Jycnex в z-м испытании}. Тогда Ak = CiC2 Ск-гСк, B=CtC2 Сп. Ответ: P{Ak) — qk~lp, к=Л, п; P(B) = qn. Замечание. Формально для конечной схемы Бернулли нельзя ввести величину v, равную номеру испытания, в котором произошел' первый успех, так как на элементарном событии НН ... Н=В велйчина v не определена. Однако каждое кон
кретное значение v = k определяется за конечное число испытаний, и это событие {v=fc} = ylt. Тогда Р {v = k} = qk~1p. (1.6) Если определить вероятность для схемы с неограниченными последовательностями, то величина v будет определена, а все конечные схемы при различных п будут согласованы между собой и бесконечной схемой. Вероятность окажется определенной формулой (1.6). § 2. Вероятность заданного числа успехов Во многих задачах, связанных со схемой Бернулли, возникает случайная величина цп, равная числу успехов в п испытаниях. Закон распределения этой величины называется биномиальным и определяется формулой Р{Ив=т} = С?р’"9"-’", 9=1-р, w = 0, 1, ..., п. 2.1. Брошено 10 игральных костей. Найти вероятности событий: А = {выпало ровно две «6»}, В = {выпала хотя бы одна «6»}. Указание. Воспользоваться схемой Бернулли с и = 10, 1 , р=- (десять игральных костей—десять испытании; выпадение 6 «6»—успех); Л = {ц10 = 2}, В={ц10>1}, В={цп = 0}. Ответ: Р (Л) = С Р(В)=1-^10. 2.2. Решить задачу 2.1, используя классическое определение вероятности. 2.3. Сколько нужно бросить игральных костей, чтобы вероятность выпадения хотя бы одной «1» была не меньше 0,9? Указание. Для произвольного п найти вероятность события {|д.„^1}, где —число выпавших «1», и разрешить соответствующее неравенство относительно п. Ответ: Р{ц„>1} = 1 '5\" -1 ; нужно бросить 13 игральных костей. 2.4. По каналу Связи передается 20 знаков. Вероятность искажения знака равна 0,01. Найти вероятность того, что будет искажено не более двух знаков.
Указание. Воспользоваться схемой Бернулли с и = 20, р = 0,01 и событие {|л„^2}, где |i„—число искажений, представить в виде суммы трех несовместных событий: {p„^2} = {p„ = 0} + {p„ = l} + {p„ = 2}. Ответ: (0,99) 20 + 20 • 0,01 • (0,99)19+^- (0,01) 2 (0,99)18 = = 0,9989... . 2.5. Найти вероятность того, что за 6 подбрасываний пары монет ровно два раза выпадет сочетание «герб-герб». Ответ: С10) 0^ = 0,2966308... . 2.6. Имеется N однотипных объектов; вероятность аварии на любом объекте в течение года равна р. Найти вероятность Р(Т; N; р) того, что за Т лет хотя бы на одном из имеющихся N объектов произойдет авария. Предполагается, что аварии на разных объектах и аварии разных лет происходят независимо. Вычислить Р(100; 20; 0,001). Указание. Воспользоваться схемой Бернулли с n = NT. Ответ: Р(Т; У; р)= 1 -(1 -p)NT- Р(100; 20; 0,001) = 0,8647... . 2.7. Система, состоящая из 100 блоков, работает нормально, если за рассматриваемый период выйдет из строя не более трех блоков. Найти вероятность нормальной работы системы за рассматриваемый период, если отказы блоков независимы и вероятность отказа одного блока равна 0,02. Ответ: (0,98)100 +100 (0,02) (0,98)99 + (0,02)2 (0,98)98 + + 100 98(0,02)3 (0,98) 97 = 0,86 1 7... . 6 2.8. Работа уличного агента по приглашению потенциальных покупателей тайм-шер считается удовлетворительной, если по его приглашению за день на презентацию придет более 10 покупателей. Считая, что вероятность того, что лицо, к которому агент обратится с предложением, с вероятностью 0,1 придет на презентацию, вычислить вероятность того, что работа агента будет признана удовлетворительной, если агент обратится с предложением к 40 прохожим. Решение. Пусть ^-количество прохожих из 40 опрошенных, которые придут на презентацию. Вероятность того, что работа агента будет признана удовлетворительной, есть Р{£,>10}.
Применяя схему Бернулли с 40 испытаниями и вероятностью успеха 0,1, имеем P{^>10} = l-Pg^l0} = l-Pg=0}- ... -Р{£ = 10} = = 1 -С2о(0,1)°(0,9)4°- ... -С*8(0,1)1О(0,9)зо = 0,00146... § 3. Математическое ожидание и дисперсия В схеме Бернулли для вычисления математического ожидания и дисперсии можно пользоваться формулами (2.1), (2.2), (3.2), (3.3), (3.5) гл. 5, а также свойствами математических ожиданий и дисперсий, применяя их к различным выражениям данных случайных величин через более простые случайные величины. 3.1. В схеме Бернулли с п—3 и р=^ вычислить Мц3 и Dp3 по формулам (2.2) и (3.6), (3.2) гл. 5. Указание. Воспользоваться найденным в задаче 1.2 распределением вероятностей ц3. 2 Ответ: Mp3 = l, Dp3=-. 3.2. Решить задачу 3.1 по формулам (2.1) и (3.2), (3.4). Указание. Воспользоваться выписанными в задаче 1.1 элементарными исходами с соответствующими вероятностями. 3.3. В схеме Бернулли с п = 3 и вероятностью успеха р определим величины fl, если в i-м испытании был успех, (0, если в i-м испытании была неудача, i=l, 2, 3. Найти МУ;, DXi. Указание. Воспользоваться формулами (2.1) и (3.2), (3.4). Ответ: МХг=р, 3.4. Доказать независимость случайных величин Х15 У2> Х3, определенных в задаче 3.3. 3.5. Найти математическое ожидание числа успехов в п испытаниях схемы Бернулли с вероятностью успеха р. Указание. Использовать представление |i„ в виде суммы |Лп = ^1+^2+ +^Gi> (3-1) где Х, = 1, если в i-м испытании был успех и Xt = 0, если в z-м испытании была неудача.
Ответ: Мр.п = пр. 3.6. Найти дисперсию числа успехов |i„ в п испытаниях схемы Бернулли с вероятностью успеха р. Указание. Использовать представление (3.1), независимость величин Х15 ..., Х„, а также формулу (4.5) гл. 5. Ответ D\i„ — npq. 3.7. Два стрелка, для каждого из которых вероятность попадания в цель равна р, производят п залпов по два выстрела. Найти математическое ожидание и дисперсию числа парных попаданий X и общего числа попадания Y. Ответ: МХ=пр2, DX=np2 (1 -р2), MY=2np, DY=2npq. 3.8. В схеме Бернулли с п +1 испытаниями и вероятностью успеха р в отдельном испытании обозначим Z„ число успехов, за которыми сразу следует успех. Найти Z„, DZ„. Указание. Представить Z„ в виде: Zn = Xi + X2 + ... +хп, где Х, = 1, если в z-м и (г+1)-м испытаниях был успех и А) = 0 в остальных случаях. Случайные величины X, и Xj зависимы, если |j—/| = 1, и независимы, если |z—/|>2. Использовать формулу (4.4) гл. 5: D(X1+...+x4=fDXi+2£cov(Xi, Xi+1)+ £ cov(Xf, Xj). i=l i=l |<-Д»2 Ответ: -MZ„ = np2, DZ„ = np2(l—p2)+2(n-1)р3(1—р). § 4. Закон больших чисел При увеличении числа испытаний в схеме Бернулли частота успеха щ/и сближается с вероятностью успеха р. Дадим математическую формулировку этого экспериментального факта в вероятностной модели: для любого £>0 при п->со Р (4.1) Таким образом, частоту успехов при больших п можно использовать как оценку (приближенное значение) неизвестной вероятности успеха р. Используя неравенство Чебышева можно оценить снизу вероятность рассматриваемого отклонения
4.1. Найти м(^ и of—Y \п J \п J Указание. Использовать свойства математического ожи дания и дисперсии, а также найденные в задачах (3.5) и (3.6) М|л„ и Dp„. Ответ: 4.2. Используя неравенство Чебышева (см. (3.10) гл. 5), оценить вероятность события <£. Ответ: (4-2) 4.3. Доказать утверждение (4.1). Указание. Воспользоваться решением задачи 3.2. 4.4. Оценить, используя неравенство (4.2), наименьшее число бросаний монеты, при котором частота герба отличается от 1/2 не более чем на 0,1 с вероятностью не меньшей 0,9. Указание. Бросание монеты описывается схемой Бернулли с р = q = 1/2. Найти наименьшее п, удовлетворяющее неравенству 1— -^^0,9 при p = q=\, £ = 0,1. П£2 г ’ 2 Ответ: 250. Замечание. В данной задаче неравенство Чебышева приводит к завышенной оценке необходимого числа испытаний п. Эта оценка может быть значительно снижена (см. § 6). § 5. Теорема Пуассона По формулам (2.1) даже при использовании ЭВМ не всегда легко получить числовые значения вероятности P{|i„ = w}. При больших п и малых р (таких, что пр невелико) можно использовать приближенные формулы, основанные на следующей теореме. Теорема Пуассона. Если п-*оо и р->0 так, что пр->к (0<Х<оо), то при любом постоянном т (т = 0, 1, ...) lim P{p„ = w)=Ye к и—® т! пр-д (5.1)
В качестве приближенной формулы используется предельной значение вероятности: P{Pn = "2}~^-e_4 Х„ = ир. (5.2) т\ Эта формула дает удовлетворительное приближение при больших п (например, и >100) и небольших пр (например, пр <8 или пр < 10). 5.1. В ящике содержится 100 карточек, занумерованных числами 1, 2, ..., 100. Из ящика наудачу 200 раз вынимается карточка; после каждого извлечения карточка сразу возвращается. Найти приближенное значение вероятности того, что карточка с числом 1 появится ровно 3' раза. Решение. Описанная схема случайного выбора с возвращением эквивалентна схеме Бернулли с и = 200, р = 0,01; число успехов —это число появившихся карточек с числом 1. Точное значение вероятности находится по формуле (2.1): р {й200 = 3} = С loo (0,01) 3 (0,99)199 = 0,181367... . В этой задаче и = 200 достаточно велико, р мало, а величина пр = 2 небольшая. По приближенной формуле (5.2) находим P{p„ = w}«-e-2. Из таблицы 3 получаем Р{щ = /и}я»0,18045. 5.2. Используя пуассоновское приближение (5.2), найти приближенное значение вероятности безотказной работы системы, описанной в задаче 2.7. Ответ: 0,8571. 5.3. В тысячу ящиков разложили изделия, среди которых было 200 бракованных. Оценить вероятность того, что в определенном ящике не менее трех бракованных изделий. Указание. Использовать схему Бернулли в качестве математической модели распределения бракованных изделий в ящике; положить и = 200, р = 0,001. Ответ: 0,001. 5.4. Вероятность выпуска бракованного изделия равна 0,05. Куплено 100 изделий. Найти вероятности событий: 1) среди купленных изделий нет бракованных; 2) число бракованных изделий не превосходит двух. Ответ: 1) 0,00674; 2) 0,12465.
5.5. В условиях задачи 5.4 оценить, сколько нужно купить изделий, чтобы среди них было не менее 100 стандартных изделий с вероятностью не меньшей 0,9? Указание. Обозначим Цюо+s число бракованных изделий среди 100 + 5 купленных. Нужно подобрать s так, чтобы Р {p-ioo+s^5} >0,9. Ответ: 108. 5.6. Сколько в среднем должны содержать изюма булочки, чтобы вероятность того, что в булочке найдется хотя бы одна изюмина, было не меньше 0,99. Указание. Использовать схему Бернулли с п испытаниями и вероятностью успеха р для описания процесса попадания изюма в булочку. Число попавших изюмин обозначим |i„. Среднее число изюмин в булочке Мщ = пр = Х„. Если изюмины не раскладываются индивидуально по булочкам, то и очень велико, а р очень мало, и, следовательно, можно воспользоваться пуассоновским приближением (5.2) для подбора Х„. Ответ: 4,6. § 6. Теорема Муавра—Лапласа В схеме Бернулли точная вероятность события вычисляется по формуле т2 Р {т, щт2} = £ C:pV"m-m = mi (6.1) При больших и и таких р, что npq достаточно велико, можно использовать приближенную формулу для вычисления вероятности (6.1), основанную на следующей теореме. Теорема Муавра—Лапласа. Если р—постоянно (0<р< 1), то lim (6.2) Напомним, . что Мцп = пр, D|i„ = np^. В качестве приближенного значения вероятности, стоящей в левой части (6.1), используется следующее значение:
где Р{™1 ^ц„^/и2}=Р т1 - ПР < Ми - ПР < т2~ПР . y/npq \!прч \/прч (6.3) a = {mi-np)!y/npq, b = (m2-np)/Jnpq. Для конкретных а и b числовое значение интеграла в (6.3) можно найти при помощи функции U2 Ф0(х)=—7= e2dn, (6-4) О значения которой приведены в таблице 1. Отметим, что Ф0(оо)=1/2. Нетрудно проверить (см. рис. 1), что 1 Г *2 Ф0(щ—Ф01а), если Ь>а>0; —= е2 dx=< Фо(щ+Фо(Iа|), если Л>>0, а<0; (6.5) V2jlJ 1Фо(|а|)-Фо(1^|), если а<Ь<0. 6.1. Стрелок попадает в цель при одном выстреле с вероятностью 3/4. Найти вероятности событий: А — {число попаданий в цель при 1200 выстрелах лежит в пределах между 885 и 930}, В= {число попаданий в цель при 1200 выстрелах не меньше 870}. Решение. Число попаданий |д.„ имеет биномиальное распре-з деление с п = 1200, р=~. События А и В можно записать в виде: А = {885 ц„ 930}, В= {ц„ 870} = {870 < оо}. Так как ир = 900, npq = 225, -Jnpq =15, то для события А имеем 885-900 , , 930-900 „ а =--------=—1, Ь —----------= 2. 15 15 Используя формулы (6.3), (6.5) и таблицу 1, получим 2 е^х=..Фо(2) + Фо(1) = 0,4772 + 0,3413 = 0,8185.
_ ЙО 870 - 900 _ , В случае события В:а =———=— 2, о=оо и *00 — 2 dx = Фо (2) + Фо (оо) = 0,4772+1 = 0,9772. 6.2. Полагая вероятность рождения мальчика равной 0,515, найти вероятность того, что среди 10000 новорожденных мальчиков будет больше, чем девочек. Указание. Применить схему Бернулли с р = 0,515, «=10000; |л„—число мальчиков среди 10000 новорожденных; 10000 —|л„—число девочек. Применить нормальное приближение для оценки вероятности P{ji„> 10000 —щ} = Р{щ>5000}. Ответ: 0,9987 (Мц„ = 5150, ^0^=50). 6.3. Вероятность того, что лампочка прослужит более 1000 часов, равна 1/3. Оценить вероятность того, что из 1800 лампочек срок службы хотя бы 580 лампочек превысит 1000 часов. Ответ: 0,8413. 6.4. (см. задачу 3.4). Сколько раз нужно бросить монету, чтобы частота герба отличалась от 1/2 не более чем 0,1 с вероятностью не меньшей 0,95? Указание. Событие и» п <0,1, где |ли число выпадений герба, можно записать в виде
1 где zn = 0,2y/n. Подобрать по таблице 1 z„ (а следовательно, и и), так, чтобы Ответ: 97 раз. 6.5. Вероятность отказа датчика в течение месяца равна 0,1. Раз в месяц осматривают 1000 датчиков. Сколько нужно иметь запасных датчиков, чтобы с вероятностью не меньшей 0,99 можно было заменить отказавшие? Указание. Подобрать т так, чтобы P{|iiooo^w} = 0,99, где Цюоо—число отказавших датчиков. Ответ: 122. 6.6. Кабельная телевизионная компания Новая Вершина Телевидения (НВТ) города Захапинска, решая вопрос о целесообразности покупки прав телетрансляции по кабельному телевидению чемпионата города по мини-футболу, провела опрос среди болельщиков и выяснила, что каждые 20 из 100 болельщиков, не имеющих кабельного телевидения, пожелают по этой причине стать абонентами НВТ. Считая, что в городе Захапинске имеется 10000 болельщиков, не охваченных НВТ, а чистая прибыль НВТ от подключения одного абонента равна 50$, выяснить: 1) какова вероятность того, что чистая прибыль компании от привлечения новых абонентов превысит 105000$? 2) какова вероятность того, что чистая прибыль компании от привлечения новых абонентов будет менее 95 000$? 3) при условии, что стоимость прав на телетрансляции чемпионата равна 80 000$, указать диапазон, симметричный относительно 20000$, в котором с вероятностью 0,9 будет находиться чистая прибыль компании за вычетом расходов на приобретение прав на телетрансляцию. Решение. Воспользуемся схемой Бернулли с «=10000 и р = 0,2.
Р {р >2100} = р J " +^оооо-0,2 • 10000 .2-0.8-10000 1) Пусть |л„—число болельщиков, ставших абонентами НВТ. Тогда чистая прибыль компании равна 50р.„$. Нас интересует вероятность события {50р„> 105 000} = {ц„> 2100}. Используя теорему Муавра—Лапласа, находим 2100-0,2 10000] 70,2 0,8 10000 J ^2 ~Ф°®Ч -Ф(2’5Н -°’4938 =0,0062. 2) Ответ: 0,0062. 3) Ответ: (16700, 23 300). 6.7. (см. предыдущую задачу). Компания кабельного телевидения НВТ анализирует возможность присоединения к своей сети пригородов Захапинска. Опросы показали, что в среднем каждые 3 из 10 семей жителей пригородов хотели бы стать абонентами сети. Стоимость работ, необходимых для организации сети в любом пригороде, оценивается величиной 2080000$. При подключении к сети каждого пригорода НВТ надеется получить 1 000 000$ в год от рекламодателей. Планируемая чистая прибыль от оплаты за кабельное телевидение одной семьей в год равна 120$. Каким должно быть минимальное количество семей в пригороде для того, чтобы с вероятностью 0.99 расходы на организацию сети в этом пригороде окупились за год. Решение. Пусть п—искомое количество семей и —число семей, ставших абонентами НВТ. Тогда чистая прибыль компании равна 120цп$. Нас интересует вероятность события {120цп +1 000 000 2 080 000} = {ц„ 9000}. Используя центральную предельную теорему, находим Р{ц„>9000} = Р( и"~0,3и >——-Фо(900^1-)0,99. (70,3 • 0,7п 7°’3-0,7и J \ 70,2In / Отсюда 9000-0,Зи 0,21 и 2,33. Следовательно, п 30 623.
§ 7. Задачи из теории страхования Ниже будут обсуждаться некоторые задачи, возникающий при расчете тарифных ставок по рисковым видам страхования* т. е. видам страхования, относящимся к страховой деятель-? ности, не связанной со страхованием жизни. При таких вида^ страхования страховая сумма (плата за страховой полис) вносится один раз перед заключением договора страхования^ и после окончания действия договора страховая компания не возвращает страховой взнос и не выплачивает никакого вознаграждения. Мы будем оперировать следующими основ-* ными понятиями, используемыми в страховании. Страховая сумма—размер компенсации в случае наступления страхового события. Страховой тариф (брутто-ставка) — величина страхового взноса с единицы страховой суммы (или с объекта страхов вания). Страховой тариф состоит из нето-ставки и нагрузки. Нетто-ставка страхового тарифа—часть страхового тарифа| предназначенная для обеспечения текущих страховых выпла!1 по договорам страхования. Нагрузка—часть страхового тарифа, обеспечивающая прибыль от проведения страховых операций, а также предназначенная для покрытия затрат на проведение страхования и создания резервного фонда на случай экстремальных ситуаций. 7.1. Страховая компания заключила договор со спортсменом-теннисистом на 365 дней, предусматривающий выплату страхового возмещения клиенту в случае травмы специального вида. Из предыдущей практики известно, что вероятность получения такой травмы теннисистом в любой фиксированный день равна 0,00037. Вычислить вероятность того, что в течение срока действия договора а) не произойдет ни одного страхового случая; б) произойдет один страховой случай; в) произойдет два страховых случая. Вычислить указанные вероятности двумя разными способами, используя биномиальное распределение и распределение Пуассона. Решение. Пусть |i„—количество травм, полученных спортсменом за время действия договора. Предположим сначала, что имеет биномиальное распределение с вероятностью
«успеха» /7 = 0,00037 и вероятностью «неудачи», равной 1 — 0,00037 = 0,99963. Тогда по формуле (2.1) Р (ц„ = 0) = С3°65 (0,00037) ° (0,99963)365« 0,87365; Р (щ = 1) = Сз1^ (0,00037)1 (0,99963)364 № 0,11803; Р (ц„ = 2) = С3265 (0,00037)2 (0,99963)363 « 0,00795; а по формуле (5.2) с параметром Х=365 • 0,00037 = 0,13505 находим Р (Цл = о)^^е"0’13505 « 0,87367; Р (Цл = 1)« 2^1 е - о-13505« 0,11799; Р (р„ = 2)« °’002°372 е " °-13 5 05« 0,00797. 7.2. При расчете страхового тарифа по одному из видов страхования, страховая компания предполагала, что страховые случаи происходят с вероятностью 0,005, а средний размер выплат будет 1000 рублей. В 1998 году страховая компания заключила 2000 договоров по данному виду страхования, и за год произошло 15 страховых случаев со средним размером выплаты в 1010 рублей. Средний размер выплат вполне приемлем. Предполагая, что число ожидаемых страховых случаев имеет приближенно распределение Пуассона, обосновать, является ли факт наступления 15 страховых случаев за год (что на 50% больше ожидаемого среднего числа, равного 10) показателем того, что была допущена ошибка (в сторону занижения) вероятности наступления страхового случая или компания попала в полосу «невезения» по случайным причинам. Решение. Пусть р.„—количество страховых случаев за год при условии, что было заключено 2000 договоров. Поскольку 0,005 • 2000= 10, можно считать, что случайная величина цл имеет распределение Пуассона (см. (5.2)) с параметром А.= 10. Тогда Р(Ил^15)=1-Р(рл^14)«1/12. Таким образом, если предположение компании о вероятности наступления страхового случая верно, то ситуации, когда произойдет 15 и более страховых событий за год, случаются примерно раз в 12 лет. 3 8516 Ватутин 65
7.3. Планируя свою деятельность по одному из видоц рискового страхования с размером страховой суммы 1000 руб» лей, нетто-ставкой 0,02 и вероятностью наступления страхового события 0,01, страховая компания желала бы получить прибыли не менее 100000 рублей. Какое минимальное число договоров она должна заключить, чтобы получить указанный размер прибыли с вероятностью не менее 0,99, если размер страхового взноса равен 50 рублям. ; Решение. Пусть п—искомое число договоров. Тогда сумме страховых взносов равна 50и, а ожидаемый суммарный размер страховых выплат есть Ю00ц„, где —число успехов в схем< Бернулли с п испытаниями ир=0,01. Поскольку нетто-ставка равна 0,02, нас интересует такое количество договоров п, для которогс Р {50 • 0,98п -1000ц„ > 100 000} 0,99, или Р {49п - 1000р„ 100 000} < 0,01. Используя теорему Муавра—Лапласа (npq окажется большим) находим Р {49п -1000р„ 100 000} = Р {щ 0,049п -100} = pf ц„-0,01п >0,049п-100-0,01п| 1^/0,01 0,99и ./0,01 0,99и J - - Фо (°’°3^ < 0,01 = - - Фо (2,33). 2 I 0,099/n J 2 Следовательно, 0,039и-100>2 33 0,099 Решая это неравенство, находим п^2882. 7.4. (Сравните с задачей 7.3.) Планируя свою деятельност по одному из видов рискового страхования со средняя размером страховой суммы 1000, вероятностью наступлени страхового случая 0,05 и ожидаемым количеством договоро 1200, страховая компания желала бы получить доход не мене 100000. Какова должна быть минимальная величина страховог тарифа, чтобы компания могла получить указанный разме дохода с вероятностью не менее 0,99.
Решение. Пусть х—искомая величина страхового тарифа. Тогда сумма страховых взносов равна 1200х, а ожидаемый суммарный размер страховых выплат есть 1000ц„, где — число успехов в схеме Бернулли с и = 1200, р = 0,05. Нас интересует такая величина страхового тарифа х, для которого Р {1200% -1 000ц„ > 100 000} > 0,99, или Р{щ^1,2х-100} <0,01. Используя аппроксимацию нормальным распределением, находим pf щ-1200 0,05 > 1,2х-100-1200-0,051 С,/0’05 °’95'1200 V0,05- 0,95 -1200 ) Отсюда следует, что 1,2х-40 3 7,55 ’ или х 50 рублей. 7.5. Портфель страховой компании состоит из 1000 договоров, заключенных 1 января и действующих в течение текущего года. При наступлении страхового случая по каждому из договоров компания обязуется выплатить 2000 рублей. Вероятность наступления страхового события по каждому из договоров равна 0,05 и не зависит от наступления страховых событий по другим контрактам. Каков должен быть совокупный размер резерва страховой компании для того, чтобы с вероятностью 0,99 она могла бы удовлетворить требования, возникающие по указанным договорам. При вычислении числа страховых событий использовать нормальное распределение. Решение. Пусть S—искомый размер резерва. Тогда ожидаемый суммарный размер страховых выплат есть 2000ц„, где ци—число успехов в схеме Бернулли с п = 1000 р = 0,05. Нас интересует такая величина резерва S, для которой Р{2000ц„^5}^0,99, или Р{щ> 0,00055} <0,01.
Используя аппроксимацию нормальным распределением, на ходим р( ц„-1000 0,05 0,00055-1000 0,051 1 _ф f0,00055-501 (.^0,05 • 0,95 • 1000 V0’05 ’ °>95 ’1000 J °1 6,892 J =1-Ф0(2,33). Отсюда следует, что 0,00055- 50 или 132117 рублей.
ГЛАВА 7 ПОЛИНОМИАЛЬНАЯ СХЕМА § 1. Определение вероятности Полиномиальная схема является обобщением схемы Бернулли и описывает последовательность независимых испытаний, в каждом из которых число возможных исходов может быть больше двух; вероятности исходов в отдельных испытаниях одинаковы для всех испытаний. Для определения вероятности любого события в полиномиальной схеме так же, , как и в уже рассмотренных вероятностных моделях, нужно сначала задать элементарные исходы и их элементарные вероятности, после чего вероятность любого события вычисляется как сумма соответствующих элементарных вероятностей. Обозначим 1, 2, .... N (N^2) исходы, которые могут наступить в каждом испытании. Пусть р15 р2, ...,рм 1рг>0, N \ У. pt = 1 I — вероятности этих исходов. Элементарные исходы '=1 / (или элементарные события), которые могут реализоваться в результате п испытаний, будем обозначать цепочками длины п. На каждом месте таких цепочек может стоять любое из чисел 1, ..., N, означающее номер исхода соответствующего испытания. Вероятность любой цепочки, содержащей mt чисел 1, т2— чисел 2, ..., mN—чисел N, полагаем равной р™'р2г ... р™" (n’ii + m2+ ... +mN = ri). Это соответствует независимости событий, связанных с различными испытаниями. Вероятность любого события А определяем как сумму элементарных вероятностей, соответствующих исходам, которые благоприятствуют А (см. (1.2) гл. 5).
1.1. Выписать все элементарные события и их вероятности для полиномиальной схемы с и = 2, У=3 и вероятностям! исходов отдельных испытаний р1г р2, р3 = 1 — р2 — рг- Найт! вероятность события Л = {все исходы одинаковы}. Ответ: Р(Л)=Р1+р2+Рз, со ! п 12 13 21 22 23 31 \ 32 33 р(<») '] pl : Р1Р2 Р1РЗ Р2Р1 Р2 РзРз РзР1 РзР2 Рз 1.2. В условиях задачи 1.1 найти вероятность событи В —{в 1-м испытании появилась «3»}. Указание. Использовать равенства Б={31, 32, 33] Pi +Р2+Р3 = 1- Ответ: Р(Б)=р3. 1.3. В условиях задачи 1.1 найти вероятность события С = {ни в одном испытании не появилась «1»}. Указание. 1) Воспользоваться равенством С={22, 23, 32, 33}. 2) Поскольку нас интересует, появилась 1 или нет, исход! 2 и 3 можно не различать. Это позволяет применить схем Бернулли с p=Pi и д=Рг+Рз- Ответ: Р(С) = (р2+р3)2. § 2. Вероятность заданного набора исходов В вычислениях, связанных с полиномиальной схемой, час£ используются величины: Х2— число исходов «1» в п испытаниях; Х2— число исходов «2» в п испытаниях; XN—число исходов «N» в п испытаниях. Вероятность события {Х1=т1, Х2 = т2, ..., XN = mN}, где целые числа т1, mN неотрицательны и my + ... +mN=\ находится по формуле Р{Х1=7И1, ..., XN=mN}=——---------рТ>р? ... Рик- (2.1 ... тя!
Величины Хъ ..., XN удобно представить в виде суммы более простых величин: Х£=ГП+ ... + Yin, i=l, ..., N, (2.2) где fl, если в к-м испытании наступил исход «г», (О в противном случае. (23) 2.1. В полиномиальной схеме с У=3, и = 5 и вероятностями исходов р2, р3 найти вероятность события {Хк = 2, Х2 = 1, ЛГ3 = 2}. Ответ: 2.2. При встрече шахматистов Кк и К2 исходы одной партии «победа К2», «поражение и «ничья» имеют вероятности соответственно 0,1; 0,1; 0,8. Найти вероятность того, что матч из 10 партий закончится со следующим результатом: 2 победы Kk, 1 победа К2, а остальные ничьи. Указание. Применить формулу (2.1) с и =10, У=3, Pi =/’2 = 0,1, Дз = 0,8. Найти вероятность события {Хк=2, Х2 = 1, Х3 = 7}. Ответ: ^L(0,l)2 + 1 (0,8)7 = 360(0,1)3(0,8)7 = 0,075497... . 2.3. Найти вероятность того, что в компании из 12 человек все дни рождения приходятся на разные месяцы. Указание. Использовать полиномиальную схему с « = У=12, pi=p2= ... =р12 = 1/12. Найти вероятность события {лг1 = 1, г2=1, ..., Х12=1}. Ответ: 12!/1212. 2.4. Решить задачу 2.3, используя классическое определение вероятности. 2.5. В полиномиальной схеме с п = 2, У=3 и вероятностями исходов р1; р2, р3 найти законы распределения величин Ylk, Yik, Y3k, k=\, 2, определенных равенствами (2.3). Указание. Использовать решение задачи 1.1. Ответ: Р{Г1Л= 1}=Р1, Р{У2Л= 1}=р2, Р{УЗЛ= 1}=р3, Р{Ги=0} = 1-ръ P{Y2k = 0} = l-p2, P{Y3k=\} = = l-p3, £=1,2. 2.6. Для полиномиальной схемы с произвольными п, N ъ вероятностями исходов р!,..., pN найти закон распределения случайных величин Yik, определенных равенствами (2.3).
Ответ: Р{Гл=1}=Л, Р{Уй1 = 0} = 1-а, г=1, ..., N, к=1, ...»d 2.7. Брошено 10 игральных костей. Найти вероятное^ события А = {выпало ровно две «6» и ровно три «5»}. | Указание. Рассмотреть полиномиальную схему с N=| и =10; исход 1 соответствует «6», исход 2—«5», а исхси 1 4 1 3—любое другое число очков. Тогда Pi=P2 = _, Рз=7- i 6 6 I — ^G)W- 2.8. В таблице 11 приведена реализация испытаний, пр<| веденных в соответствии со следующей полиномиальной схв мой. В каждом испытании исходом является любая цифи 0, 1, 2, ..., 8, 9; вероятности исходов одинаковы Po=Pi = =Р9 = ^- Получить реализации испытаний по схе»( Бернулли с и =10, р=1/5. Указание. Выбрать десять цифр, начиная с любого меей таблицы; «успехом» считать, например, исход 0 или 1, а вд остальные исходы считать «неудачей». 2.9. Используя таблицу 9, выписать реализации полиномй альной схемы с и=10, N=3, р1 = 1/10, р2 = 2/10, р3 = 7/10. Указание. Считать, например, что цифра 0 соответствуй «1», цифры 1 или 2—исходу «2», а остальные цифры исходу «Зй 2.10. Используя таблицу 11, написать реализации испытана схемы Бернулли с и =10, р= 1/100. Указание. В таблице 11 сгруппировать цифры в пары успехом считать пару «00». 2.11. Фирма по продаже одежды изучает причины, га которым покупатели, пришедшие в магазины фирмы с намер^ нием что-то приобрести ушли без покупки. Оказалось, чФ 40% потенциальных покупателей отпугнули цены, 30% Й нашли подходящего фасона, 20% были неудовлетворены к^ чеством, а 10% не нашли нужного размера. а) Какова вероятность того, что в группе из 10 посетителе! ушедших без покупки, будет ровно два покупателя, которй отпугнули цены? 1 б) Какова вероятность того, что в группе из 10 посетителе! ушедших без покупки, будет по крайней мере два, не нашедшй нужного размера? ! в) Какова вероятность того, что в группе из 10 посетителе! ушедших бе.з покупки, будет ровно один покупатель, й
дашедщий подходящего фасона, два—не удовлетворенных качеством, пять—не удовлетворенных ценами и три—не нашедших нужного размера? О т в е т: а) (0,4)2 (0,6)8; б) 1 - С& (0,1)° (0,9)10 - С& (0,1)1 х х(0,9)9 —С2о(0,1)2(0,9)8; в) -^-(ОЗ)1^)2^)5^,!)2. § 3. Математическое ожидание, дисперсия, ковариация При решении задач данного параграфа нужно использовать соответствующие формулы главы 5. 3.1. Для величин Yik, определенных равенствами (2.3), найти МГ/ь DKik; cov(rib YJk), i^j; cov(Ylk, Yfl), k^l: Указание. При любом i величины Yik, ..., Yin независимы, поскольку связаны с разными испытаниями; независимы также любые наборы величин, у которых первые индексы (номера исходов) любые, а вторые индексы различные. Использовать формулы (2.2), (3.2), (3.6), (4.2) гл. 5 и решение задачи 2.6. Ответ: МУй=/»(; ПГЛ=р((1 -pt); cov(Ylk, Yjk)=-ptPj, i^J; cov(rit, У;/) = 0’ k*1- 3.2. Найти математическое ожидание и дисперсию числа исходов «г» в общей полиномиальной схеме с п испытаниями. Указание. 1) Использовать представления (2.2), решение задачи 3.1, а также свойства математического ожидания и дисперсии; 2) число Х{ исходов «»> в п испытаниях можно рассматривать как число успехов схемы Бернулли с p=pt и q=l — pi Ответ: MXi = npt, ОУ, = пр{(1 — />£). 3.3. Найти ковариацию числа исходов «г» и числа исходов «у» в общей полиномиальной схеме с п испытаниями. Указание. Воспользоваться формулой (4.2) гл. 5. Для вычисления M.XtXj использовать равенство п XXj=^k 1 YikYjk+^1 YlkYfl, являющееся следствием (2.2), и использовать независимость Yik, к=\,...,п (см. указание к задаче 3.1). Ответ: cov(Jf;, Xj)= — nptpj, i^j. 3.4. В общей полиномиальной схеме с п испытаниями для случайной величины Z„ = c1A’1+... +cNXN) где ct, ..., cN— постоянные, найти MZ„ и DZ„.
Указание; Использовать результаты задач 3.2, 3.3 и фор« мулу (4.4) гл. 5. Ответ: MZ„ = «a, DZ„ = racr2, где a=ckpY + ... + cNpNl сг2 = Ц, ciPi~a2-i — 1 3.5. В N ячеек независимо друг от друга брошено п частиад Вероятность попадания любой частицы в к-ю ячейку равно рк (fc = l, ..., N). Обозначим ц0 число пустых ячеек. Найти ЛДц, Указание. Использовать представление ц0 в виде суммы go = Z^i+ ... +ZN, (З.Д где Zk — 1, если к-я ячейка осталась пустой, и Zk = 0 в противно^ случае. | Ответ: (^~Рк)п- Отметим, что при рк=Р2— =Р№=| Л=1 / 1\" это выражение имеет более простой вид: У( 1 —) . Последнее \ w выражение совпадает с М\к0, найденным в задаче 2.9 гл. 5| 3.6. Для величины ц0, определенной в задаче 3.5, найтЦ lim — M|i0, если n=yN (у>0—некоторая постоянная), к_ N рк = J g(x)dx, к=1, N, к- 1 N функция g(x) = 0 при хф [0, 1], на [0, 1] функция g(jd дифференцируема и не равна тождественно 1. 1 Ответ: Je~Y9(x)dx. о 3.7. Для величины ц0, определенной в задаче 3.5, найти Ppd Указание. Использовать равенство N но= X zt+£zzy, Л=1 получающееся из (3.1), так как Zk—Zk (к= 1, ..., N). N / N Ответ: £>ц0= X 0-Рк)"+ X0-Pi-Pj)”-\ X (’“А)” Л=1 i^J \i = l
ГЛАВА 8 ЦЕПИ МАРКОВА § 1. Определение Цепь Маркова является моделью зависимых испытаний, в которых исход в данном испытании зависит лишь от последнего известного предшествующего исхода и не зависит от более далекого прошлого. Обычно исходы в марковских испытаниях называют состояниями цепи Маркова. Будем считать, что N состояний цепи Маркова занумерованы числами 1, 2, ..., N. Элементарным событием в п испытаниях цепи Маркова являются цепочки состояний, или исходов, длины п +1, описывающие начальное состояние и результаты п испытаний: (z0, z\, ..., z„). Здесь исход z( при любом t (z = 0, 1, ..., п) может принимать любое из значений 1, 2, ..., N. Таким образом, множество элементарных событий £2={(z0, z\, ..., z„):z(=l, ..., N; Z = 0, 1, ..., n}. (1.1) Если обозначить At исход в испытании t цепи Маркова, то условие независимости от более далекого прошлого можно записать в виде P(At+1\A0A1 ... Л,) = Р(Л,+ 1|Л), (1.2) / = 0, 1, 2, ..., и— 1. Пусть событием А, является наступление исхода z в t-м испытании, a At+1 — наступление исхода j в (/+1)-м испытании. Тогда правая часть (1.2) является функцией от z, j и t. Иногда номер испытания называют моментом времени. Мы будем предполагать, что цепь Маркова однородна по времени. В этом случае правая часть (1.2) не зависит от времени (номера испытания) и является функцией от z, j:P(At+l\At)=Pij, z = 0, 1, ..., и—1. Вероятность pi} является условной вероятностью того, что в испытании t +1 состоянием цепи Маркова
было j, если в момент t состоянием было i. Эти вероятности называются вероятностями перехода или переходными вероятностями. Если задать вероятности qu qN начальных состояний (состояний перед началом испытаний) цепи Маркова и переходные вероятности Ptj(i, j=l, ..., N), то по формуле (1.1) гл. 4 с учетом (1.2) вероятность любого элементарного события (z'o, ily ..., i„) запишется в виде P(zozi ... in^qi^Pi^ А..,/.- (1-3) Однородная по времени цепь Маркова с конечным множеством состояний является частным случаем конечной схемы, в которой элементарные события и соответствующие им вероятности определяются формулами (1.1) и (1.3). Для задания вероятности достаточно задать матрицу вероятностей перехода (Р11 Ра ••• Piw\ N Р13 Р22 - ^Ру=1, (1.4) I j = 1 Pni Pn2 ••• PnnI i, 7=1, N и вектор вероятностей начальных состояний (qr, ..., qN), q^O. i=l,...,N, £<7. = 1. i=l Отметим, что вероятность любой более короткой, чем п, цепочки (z’o, z’i, ..., z(), 1^?<п, определяется формулой (1.1) с заменой п на t. 1.1. В цепи Маркова с двумя состояниями 1 и 2 начальным состоянием является 1. Найти вероятности цепочек состояний 111, 122, 121, если вероятности переходов ру(г, 7=1, 2) 1 1 задаются равенствами: р 12=-, р21 = • Решение. Из (1.4) при N=2 следует, что 7’11+7’12= 1, 7’21+7’22=1- Отсюда Pii = l —2=р Р22 = 1—д = Так как вектор вероятностей начальных состояний q = (qi, qz) по условию задачи
определяется равенством ^1 = 1, <?2 = 0, т0 по формуле (1.3) находим Р(Ш) = 91р11р11=|.|=1, Р(122) = 91р12р22=1Л=1, Р(121) = ^1р12р21 1.2. В цепи Маркова с двумя состояниями 1 и 2 вектор распределения вероятностей по начальным состояниям и ве-1 6 роятности переходов определяются равенствами: ^1=-, Ри=-, 4 р21=-. Найти вероятности цепочек 121, 111, 222. Указание. Использовать равенства 471+472=1, Р11+Р12 = 1, Р21+Р22 = 1 и формулу (1.3). Ответ: Р(121) = 1.-.-, Р(Ш)=1.-.-, Р(222)=--1.-. ' ’ 3 7 5 v ' 3 7 7 v '355 1.3. Для цепи Маркова, определенной в задаче 1.1, найти вероятность того, что цепочка длины три начинается и кончается единицей. Указание. Событие, вероятность которого надо найти, состоит из двух элементарных событий 111, 121. Ответ: 19/36. 1.4. Для цепи Маркова, определенной в задаче 1.2, найти вероятности событий: А = {в цепочке длины 3 состояния чередуются} В={в цепочке длины 3 все состояния одинаковы}. Указание. Л = {121, 212}, В={111, 222}. Ответ: Р(Л)=^-, Р{В)=^-. v ’ 35 v ’ 3675 1.5. В цепи Маркова с тремя состояниями 1, 2 и 3 начальным состоянием является 1. Вероятности перехода за 12 1 один шаг определяются равенствами Ри=-, Pi2=-, p2i=~,
2 1 2 />22=р Рз1=р Рз2 = у- Найти вероятность того, что в цепочке. длины 3 не появится состояние 2. Указание. Событие, вероятность которого надо найтщ состоит из следующих элементарных событий: 111, 131, 113, 133. Ответ: 71/175 1.6. Найти матрицу вероятностей переходов цепи Маркова^ дающей упрощенное описание работы телефона-автомата. Рассматриваются следующие 4 состояния: телефон свободен (1ч| состояние); телефон занят и нет очереди (2-е состояние)! телефон занят и в очереди стоит 1 человек (3-е состояние! или 2 человека (4-е состояние). Предполагается, что третьи^ в очередь никто не встает, предпочитая искать другой автомат. В каждую единицу времени с вероятностью 1/10 может* подойти один человек; больше одного подойти не может.; С вероятностью 1/3 независимо от длительности ведущегося разговора и независимо от длины очереди разговор в данную единицу времени заканчивается. Решение. Из 1-го состояния (телефон свободен) можно перейти в 1-е состояние, если в данную единицу времени никто не придет. Следовательно, p1]L = l——=—. Из 1-го состояния во 2-е состояние переход происходит, 1 г» если пришел один человек, т. е. р12=—. В остальные состояния 3 и 4 попасть за единицу времени из 1-го состояния нельзя, так как по условию задачи в каждую единицу времени можете появиться не более одного человека. Из 2-го состояния возможны переходы в 1-е состояние (разговор окончился, и никто не пришел, или разговор кончился, и пришел один человек), во 2-е состояние (разговор не кончился, и никто не пришел), в 3-е состояние (разговор не кончился, и подошел один человек). Перемножая соот ветствующие вероятности, находим: _1Д А ЛЛ Ц.1 1 F21 3\ io/’ \ зД ю/ 3 10 Л Л 1 Р24 — 0.
Из 3-го состояния в 3-е состояние можно перейти двумя способами: 1) разговор кончился, и подошел один человек; 2) разговор не кончился, и никто не подошел. Аналогично рассматриваются остальные переходы из 3-го состояния и переходы из 4-го состояния. Получим следующие выражения: л 1 Zi 1 \ 1 1 , Л Л Л 1 Р31 ’ Рзз 10у> Рзз з‘10 + ^ зД 10/’ Рз4 \ 3/10’ Р41 — О, Р42~ Р43~ р Р44~ 1— р Таким образом, нашли все переходные вероятности: /’ll-де» Pl2~ йр Pl3~ О, Р14— V, _9 _ 19 _2 _ Р21-^, Р22-ЗЙ’ Р^~То' Р24~^ _п _9 _19 _2 Р31-0, Р32-^, Рзз-^, Р34-^, Р41—^1 Р42 = ®, P43 = j, Р44~у § 2. Марковское свойство Обозначим Xt (/ = 0, 1, 2, ...) состояние цепи Маркова в момент (или в испытании) t. В терминах случайных величин Xt марковское свойство может быть сформулировано следующим образом: равенство P{Xt+,=/Ms; Xt = i} = P{Xt+s=j\Xt = i} выполняется при любом Ol, Z>0 и любом событии As, которое может быть определено через случайные величины *о, Хг, Xs. Цепи Маркова, определенные в § 1, удовлетворяют этому условию. 2.1. Проверить, что независимые случайные величины Хо, Хк, Хп, для которых PP7 = 1}=P1, P{xk = 2}=p2, P{Xk = 3}=p3
(Р1+р2+Рз = L к = 0, 1, и), являются цепью Маркова. Найти начальное распределение вероятностей и матрицу вероятностей перехода. Решение. Для независимых случайных величин вероят» ность значений данной величины не зависит ни от значения предыдущей величины, ни от более далекой и, следовательнси марковское свойство выполняется. Покажем это более фор* мально. Из независимости случайных величин следует, что условные вероятности в равенстве, определяющем марковское свойство! равны безусловным: P{x(+S=;|A, x=i}=P{xt+s=j}=Pj, P{Xt+s=j\Xt = i} = P {Xt+s=j}=Pj при любых t и s. Отсюда следует, что марковское свойства выполняется. Из второго равенства при s = 1 получаем матрица вероятностей переходов: Pn=Pi, Pi2=p2, Рьз=Рз при любом z. Таким образом, /Pi Р2 Рз\ /’ = ( Pl Р2 Рз ) \Р1 Р2 РЗ' Начальные распределения вероятностей находим непосредствен^ но из условий задачи: 9i = P{X0 = z}=A, z=l, 2, 3. 2.2. Пусть случайная величина Х,= 1 (?=1, 2, ..., и), если в t-м испытании схемы Бернулли с вероятностью успеха р в отдельном испытании произошло четное число успехов! и Xt = 2 в противном случае. Показать, что Хо=\, Хи образуют цепь Маркова. Найти матрицу вероятностей nd реходов. Указание. Четность числа успехов к данному испытаний! зависит только от четности числа успехов к предыдущему испытанию. Ответ: Pu = q, р12=р, p2i=P, P22 = q, q=l~P- 2.3. Пусть Х1г Х2, Х„ независимые случайные величины^ для которых при любом к Р{Хк=1}=р, Р{^ = 0} = 9, q—1—р. Показать, что последовательность пар
(ад), (ад),..., (ад, х„) является цепью Маркова. Найти матрицу вероятностей переходов. Указание. Обозначим возможные значения пар (0,0), (0,1), (1,0), (1,1) числам 1, 2, 3, 4. Найти вероятности py=P{(Xt+1, Xt+2)=j|(Xt, Xt+1)=l}, i’ Ъ 3, 4- Часть из этих вероятностей равна 0. Например, из состояния 1=(0,0) нельзя попасть в состояние (1,0) = 3. Это означало бы, что Х( = 0, Xt+1=0 и Xt+1 = l, Xt+2 = 0. Таким образом, Pi3 = 0. Ответ: 1 q р 0 0\ 0 0 q р I q р 0 0 Г (0 0 q р/ 2.4. Матрица Р вероятностей перехода цепи Маркова с тремя состояниями 1, 2, 3 определяется равенством / 2 3 2\ 7 7 7 р= 3 2 2 7 7 7 ’ 2 2 3 17 7 7/ По последовательности состояний этой цепи Маркова определяется новая последовательность по следующему правилу: в исходной последовательности состояние 2 заменяется на 1, а 3—на 2; состояние 1 не меняется. Показать, что новая последовательность является цепью Маркова. Найти ее матрицу вероятностей переходов. Указание. Новая последовательность получается объединением состояний 1 и 2 исходной последовательности. При проверке марковского свойства нужно, в частности, для новой последовательности вычислить вероятность перехода из состояния 1 в состояние 2. Состояние 1 новой последовательности не определяет однозначно состояние старой последовательности; новому состоянию 1 может соответствовать старое состояние 1 или старое состояние 2. Однако вероятность
перехода в старое состояние 3 из этих состояний одинакова и равна Ijl. Ответ: , /5 2 I 7 7 I 4 3 \7 7 2.5. Матрица Р вероятностей перехода цепи Маркова с тремя состояниями 1, 2, 3 определяется равенством / 1/7 3/7 3/7 \ Р= 3/2 1/7 3/7 . \ 2/7 2/7 3/7 / По тому же правилу, что и в предыдущей задаче, определяется новая последовательность. Показать, что новая последовательность является схемой Бернулли. Найти вероятность успеха в отдельном испытании. Указание. Воспользовавшись указанием к задаче 2.4, доказать, что новая последовательность является цепью Маркова, и найти ее матрицу вероятностей перехода. См. также задачу 2.1. Ответ: 4/7. 2.6. Показать, что для цепи Маркова с двумя состояниями и матрицей вероятностей перехода Р=( ^12 ) последова- \Р21 Р22 / тельность переходов тоже является цепью Маркова. Найти ее матрицу вероятностей переходов. Указание. Состояниями новой цепи Маркова являются пары (1, 1), (1, 2), (2, 1), (2, 2). Из состояния (1, 1) и (2, 1) можно перейти только в (1, 1) или в (1, 2), так как в исходной цепи (1, 1) означает, что цепь попала в состояние 1 и следующий переход должен начинаться с 1. Из состояний (1, 2) и (2, 2) можно перейти только в (2, 1), (2, 2). Ответ: 1 Pll Р12 0 0 \ О 0 р21 Р22 I Р11 Р12 О О I \ О О Р21 Р22 /
§ 3. Уравнения Колмогорова Вероятности перехода Р{Xt+s=j\Xs=i} за t шагов из состояния i в состояние j для однородной цепи Маркова не зависят от s. Положим Py(/)=P{Xr=j|X0 = i}. Из основного марковского свойства нетрудно получить (см., например, [6], гл. 8 § 2) систему уравнений Колмогорова: N Pt^+S)= Z J=b > N). (3.1) *=1 Отсюда, в частности, получаем следующие две системы уравнений. При s=l PiAt+1)= £ о; j= ь ю- (з.2) t=l Полагая в (3.1) 1=1 и заменяя в получившемся равенстве s на t, получим другую систему N Pi}(t+ 1)= P*{t)Pkj, (i, j= 1, N). (3.3) t=i Обозначим P(t) матрицу вероятностей перехода Ру (Г): Равенства (3.1) можно переписать в матричном виде: P(t+s) = P(s)P(t). (3.4) Отсюда при 5=1 получим P(t+l)=P-P{t), (3.5) где Р= || ptj ||—матрица вероятностей перехода за один шаг Ру(1)=ру. Вычисление вероятностей перехода за t шагов сводится к вычислению t-й степени матрицы Р. Из (3.5) следует, что р(0=р‘. (з.б)
3.1. Найти вероятности переходов за 2 шага для цепи Маркова, определенной в задаче 1.1. Указание. Использовать формулу (3.6). Ответ: ?п(2)= 19/36, Р12(2)= 17/36, Р21 (2)= 17/48, Р22 (2) = 31/48. 3.2. В условиях задачи 1.6 найти вероятность того, что телефон-автомат через 2 единицы времени будет свободен^ если он был свободен в начальный момент. Указание. Нужно найти вероятность Р11(2) для цепи Маркова, определенной в задаче 1.6. Воспользоваться формулой (3.6). Ответ: 21/25. 3.3. Найти вероятности переходов за 2 шага в цепи Маркова, определенной в задаче 2.1. Указание. Воспользоваться решением задачи 2.1 и формулой (3.6). Ответ: Л1(2) = Л, Pk2(Z)=P2, Рк3(2)=Р3, к=\, 2, 3. 3.4. Найти вероятности переходов за t шагов в цепи Маркова, определенной в задаче 2.1. Ответ: Pki(t)=ph 1—1, 2, 3, к=1, 2, 3. 3.5. Найти вероятности переходов за t Шагов в цепи Маркова с двумя состояниями, если Pt 1 = 1 — а,, Р12 = а, Р21 = р^ р22 = 1-р; 0<а<1, 0<р<1. Указание. Доказать по индукции, что приведенное в ответе выражение является t-й степенью матрицы Р. Ответ: ( ЛИО л2(0\ \ 7*21 (0 7*^(0 / 1 /Р а\ (1_а_р)>/ а — а «+Р\Р а/ а+Р \ — р р § 4. Предельные вероятности Для важного класса цепей Маркова поведение их через большой промежуток времени не зависит от начального состояния. Теорема 4.1. Если при некотором tQ>О все элементы матрицы Р*° положительны, то существуют положительные пределы lim Pij(t)=itj, j= 1, ..., N; i=l, ..., N (4.1)
и не зависят от начального состояния. Предельные вероятности удовлетворяют системе уравнений N Kj= X nkPkj, j=l, N. (4.2) Л=1 Систему (4.2) можно получить переходом к пределу при /->оо в равенстве (3.3). Вероятность P{Xt=j} определяется по формуле N р Их =/} = Z Р № о р =j I Хо = i}. (4.3) i=l Если в качестве начального распределения Р {Xo = i} = qi (z=l, ..., N) взять предельные вероятности л((г= 1, ..., N), то из (4.3) и (4.2) следует, что Через один шаг распределение вероятностей не изменится: Р{У1=у}=Л;, 7=1, ..., N. Таким образом, распределение л15 ..., nN не меняется во времени. Эти вероятности называют стационарным распределением. Уравнения (4.2) всегда линейно зависимы. К этим уравнениям нужно еще добавить уравнение П1+Л2+ ... +7tjy=l. 4.1. Найти стационарное распределение вероятностей цепи Маркова, определенной в задаче 1.1. Решение. При решении задачи 1.1 были найдены вероятности перехода: Р р____I р _' р Гц--, Г12--, г21-~, Г22-^. Уравнения (4.2) в данном случае при N=2 имеют вид 7Г1 = 7Г1Рц+Л2Р21> Л2 = 7tl Р12 +’Jt2 Р22- Подставив сюда числовые значения, находим 2,1 1,3 П1— ^2—+ 3 4 3 4 ИЛИ 1111 -П1--Л2, -Л2--Л!.
Уравнения одинаковы. Добавив уравнение л1 + л2 = 1, находим! решение: 3 4 п1_р п2 — 4.2. Найти стационарное распределение вероятностей цепй Маркова, определенной в задаче 1.2. „ 28 5 Ответ: n,=—, тг2 = —. 1 33 2 33 4.3. Найти стационарное Маркова, использованной в ~ 45 15 Ответ: л2=—, л3=—, л4=— 1 64 2 64 ’ 3 96 96 распределение вероятностей цепи задаче 1.6. _ _ 5______1 “ 96’ "* 96 4.4. Используя цепь Маркова, определенную в задаче 1.б| найти приближенное значение вероятности того, что через большой промежуток времени телефон-автомат будет свободен^ Указание. Найти lim.Pu(f). Для вычисления предел® Г—*00 можно применить теорему 4.1, так как для этой цепи Маркова^ Р2>0. Воспользоваться решением задачи 4.3. Отметим, чтд условие Р’>0 означает, что через t шагов из любого состояний можно попасть с положительной вероятностью в любой состояние. В данной задаче нетрудно без перемножения матриц убедиться, что через 2 единицы времени с положительно^ вероятностью можно из любого состояния попасть в любое.’ Ответ: 45/64. 4.5. Показать, что цепь Маркова с двумя состояниями и матрицей вероятностей перехода p-f° п \1 о/ не имеет предельного распределения. Решение. Нетрудно проверить, что „2 Л Р 2 = \0 1/ и, следовательно, рЗ;=р2.р = р р4 = />2, р5 = р р6 = р2 и т д Таким образом,
p2'Jl 0\ P2t + 1 = P_H \о 1/’ v о/‘ Отсюда, например, для Pn(t) имеем: .. fl, если t четное, 10, если t нечетное. Следовательно, при ?->оо последовательность Рц(0 не имеет предела. Нетрудно заметить, что для данной цепи Маркова условия теоремы 4.1 не выполняются. 4.6. Найти стационарное распределение вероятностей для цепи Маркова с тремя состояниями и матрицей вероятностей переходов '1 1 1\ 2 4 4 Решение. Уравнения (4.2) запишутся в виде: 1 1.3.1 1. 1 . 3 Л1— -Л1, л2 —л2'-+n2--+л3 л3 —nt--+л2--+л3 2 4 4 4 4 4 4 Из 1-го уравнения следует, что Л! = 0, а два других уравнения преобразуются к одному и тому же уравнению 1 1 4П2~4Пз- Отсюда, учитывая, что Л!+л2 + л3 = 1, находим л2=- и л3=-. Таким образом, получили стационарное распределение вероятностей: Л -1 Л1—0, л2—-, л3—-. В этом случае условия теоремы 4.1 не выполняются, так как в 1-е состояние нельзя попасть ни из 2-го, ни из 3-го состояний. Пределы вероятностей перехода при ;-»оо существуют, но не все положительны (л1=0).
' -----------------------------------------------------1--~ 4.7. Найти стационарное распределение для цепи Маркова^ образованной последовательностью переходов в цепи Маркову с двумя состояниями (см. задачу 2.6). Решение. В задаче 2.6 найдена матрица цепи Маркова! образованной последовательностью переходов. Состояниями этой цепи Маркова являются пары: (1, 1), (1, 2), (2, 1), (2, 2); Уравнения (4.2) запишутся в виде: Л11 =Р11 (п11 + п21)> Я21 =/>21 (я12 + я22), п12 =Pl2 (п11 + п21), 7Г22 =Р12 (п12 + Л2г), где вероятности переходов ptJ относятся к исходной цепи Маркова с двумя состояниями. Отсюда с учетом условий нормировки 7Гц+7г12 + тг21 + тг22 = 1 получаем стационарное рас-; пределение вероятностей _ РиРи _ _ Р12Р21 _ Р22Р12 7Гц---------, 7ti2 — ТГ21------, 7Г22--------. Р12+Р21 Р12+Р21 Р12+Р21 4.8. По целым точкам отрезка [0, п] движется частица! Из любой точки к (0<к<п) частица независимо от прошлого движения переходит с вероятностью р в точку к+1 и с ве! роятностью q=l—p в точку к— 1. В точках Ойл частиц^ остается навсегда (поглощающие состояния). Составить сис! темы уравнений для вероятностей Pk0(t) (к = 0, 1, ..., и) и для вероятностей Pkn(t) (к —0, 1, п). Указание. Для составления уравнений, которым удовлетворяют вероятности Pk0(t) (к = 0, 1, ..., и), воспользоваться^ формулой полной вероятности (см. гл. 3, § 1, (1.1)): Р (А) = Р(В,) Р(А |Вк) + Р (В2) Р (А | В2), где (частица, вышедшая из состояния к, на 7+1 шагу) (находится в состоянии О J ’ (частица, вышедшая из состояния к, на первом) 1 — J f • (шагу перешла в к+ 1 J (частица, вышедшая из состояния к, на первом) (шагу перешла в к — 1 J Ответ: 1) Pk0(J+ l)=pPk+1,0(t) + qPk-1,0(t), к= 1, ..., л-к 2) Pkn(t+ l)=pPk + itn(t) +qPk~-k,n(t)’ k= 1, ..., л—к
4.9. Для цепи Маркова, определенной в задаче 4.8, составить уравнения для вероятностей поглощения nk0 = lim Рк0 (t), лАп= lim А„(/). Г—* оо Указание. Перейти к пределу при z-»oo в системах уравнений, приведенных в ответе к задаче 4.8. Ответ: 1) nko=pnk+uo + qл4_1>0, к= 1, ..., п-1, 2) ftkn~Р1,л4*Ч^к—1,л> к—\, ..., п 1. 4.10. Найти вероятности поглощения пк0, пк„, введенные в задаче 4.9 в случае, когда p=q=L, Указание. При p = q—^ вероятность nk0=fk, рассматриваемая как функция от к, удовлетворяет равенствам А=|(Л-1+Л+1), 2, ..., «-1 и очевидным граничным условиям /0=1, /,=о, так как частица, находившаяся в точке 0 в начальный момент, не выйдет из этой точки, а при начале дижения из точки п частица никогда не попадет в точку 0. Функция fk = Ck + C2k удовлетворяет приведенным выше равенствам. Используя граничные условия, подобрать Ск и С2. Для вероятности nkn=fk граничные условия имеют следующий вид: /о = 0, /„=1. к к Ответ: Лц0=1 —, якп=-. п п § 5. Математическое ожидание и дисперсия. Закон больших чисел Обозначим Z((t) время пребывания, или число попаданий в состояние i, цепи Маркова за время t. Будем говорить, что частота Z^t^t попадания в состояние i удовлетворяет закону больших чисел, если для любого е>0 при ?-»оо
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В ЗАДАЧАХ --------------------------------------:--------------------_д — Щ Р <е)-* 1, где я, (i=l, N) стационарные вероятности. При изучении величины Zt(t) часто оказывается полезным! следующее ее представление в виде суммы: Zf(?) = *М2)+ - + (511 где ’У,(5) = 1 (s= 1, ..., t), если в момент s состоянием цепй| Маркова было i, и Fi(s)=0 в противном случае. 5.1. Выразить через вероятности перехода Pki(s) матема-4 тическое ожидание числа Zt(t) попаданий в состояние i зш время t, если начальным состоянием цепи Маркова было fcl Решение. Из (5.1) и свойств математического ожидания! находим Мг,(?) = МУг(1) + ... + МУг(?). (5.21 Случайная величина У, (s) — 1 в том случае, когда в момент! s цепь Маркова находилась в состоянии i, т. е. в том случае! когда за время s произошел переход из состояния к в состоянием i. Отсюда Р{У4(«)= l} = PH(s) и, следовательно, МУ;(^)=Р1;(1).1 Подставив это выражение в (5.2), получим нужное нам! выражение: MZi(0= £ Ри(4 (5.3)1 5=1 • 5.2. Найти выражение для дисперсии числа появлений Zf(?H состояния i в цепи Маркова за время t, если в начальный! момент времени 1=0 состоянием цепи Маркова было к. | Решение. Найдем сначала MZf(t). Используя (5.1),| получим z?(0= i Y^Y^). Sj,S2 = 1 Величины У(з) принимают только значения 0 или 1, и, следовательно, У,2 (.v)= У;(.у). Используя это замечание преобразуем Z2(f) к следующему виду: Z?(f)=£ yf(s)+2 £ у£(л) Уг(«2). S=1 Отсюда MZ,? (?)= MZ, (?) + 2 £ М У; (sx) У, (j2).
Произведение УД^) К; («2) равно 1 в том случае, когда за время Sj произошел переход из А: в i, а за оставшееся время s2—Si переход из i в i. Отсюда Р{У;(S1) Yt(s2) =\} = Pki(S1)Pu(s2-Si). Подставляя это выражение в формулу для MZf(r), получим MZI?(/) = MZ,.(/)+2'i;1 £ Pki(Si)Pu(s2-Si). Sj = 1 S2—S1 + 1 Отсюда и из формулы DZ, (t) = MZ ? (t) - (MZf (г))2 находим окончательное выражение Dzf(4=Mz40+2'z 'f ры(и)ри(«)-(мг{(0)2. V— 1 и= 1 5.3. Для цепи Маркова с двумя состояниями (см. задачу 3.5) найти математическое ожидание числа попаданий Zi(t) в первое состояние за время t, если Х(0)=1. Указание. Воспользоваться решением задач 5.1 и 3.5. Ответ: M(Z1(O|X(0)=l) = m1+(l-JI1)^^(l-(l-a-₽)‘), а+ р р где Л1 = -^-. а+Р 5.4. Для цепи Маркова с двумя состояниями (см. задачу 3.5), найти lim-M(Z!(z)|y(0)=l). г— со t Указание. Воспользоваться решением задачи 5.3. Ответ: ——. а+Р 5.5. Для цепи Маркова с двумя состояниями (см. задачу 3.5) , найти lim-D(Zt (/)|У(0)= 1). г—.00 г Указание. Воспользоваться решениями задач 3.5, 5.2, 5.3. _ ар(2-а-р) Ответ: -4— (а+Р) 5.6. Доказать, что в цепи Маркова с двумя состояниями (см. задачу 3.5) число попаданий Zj(r) в первое состояние за время t удовлетворяет закону больших чисел: для любого £>0
lim Р lz1(z)-ftl|<eUi, Р где 74=—. а+р Решение. Согласно неравенству Чебышева Р Iz.M-ImZjW >C[<^DZ,(/). Из решения задачи 5.5 следует, что правая часть этой неравенства стремится к 0 при /-»оо. .Отсюда, воспользовав 1 шись тем, что (см. задачу 5.3) -MZt (Z) = 7C1 + о(1) при 7->оо получаем: для любого £>0 при 7-»оо Отсюда следует приведенное в задаче утверждение. 5.7. Для цепи Маркова, удовлетворяющей условиям теа ремы 4.1, найти lim-MZ,(z), где Zf(z)—число попаданий Z—СЮ t в состояние i за время t. Указание. Воспользоваться теоремой 4.1, решением задач чи 5.1 и следующим утверждением. Если последовательност! хп (и=1, 2, ...) имеет предел а = lim х„, то последовательност! Уп = (Х1+ +х„)/п имеет тот же предел lim y„ — a. и—* co Ответ: lim - MZ, (/) = где Я(=1ппРи(1). /—* со t t—* оо 5.8. В цепи Маркова с двумя состояниями (см. задачу 3.5 найти lim-MZ12(z), где Z12(z)— число переходов из 1-г< / — ОО t состояния во 2-е состояние за время t. Указание. Рассмотреть цепь Маркова, образованную переходами исходной цепи Маркова. Воспользоваться решена ями задач 4.7 и 5.7 так же. гл Ответ: -----. а+р
§ 6. Предельные теоремы для времени пребывания в состоянии Приведем теорему о числе попаданий Zf(Z) в z-e состояние за время t, обобщающую теорему Муавра—Лапласа. Теорема 6.1. Пусть цепь Маркова удовлетворяет условиям теоремы 4.1. Тогда при Z-»oo существуют пределы а{ =- lim - MZ; (z), or? = lim - DZ, (z), 1—* 00 t t 0<ai<oo, 0<o?<oo, и при любом x>0 lim P t—* oo CTi\A * u2. e-"2 du. — oo 6.1. Получить теорему Муавра—Лапласа как следствие теоремы 6.1. Указание. Рассмотреть цепь Маркова с двумя сотОяниями (У=2) и с Р11=р21=р, p12=p21 = l—p = q (a = q, |3 = г). Воспользоваться решением задач 5.4, 5.5 6.2. Для цепи Маркова с двумя состояниями (У=2) 1 1 с и с Ри=^ Ри — у наити приближенное значение вероятности того, что время Zt (z) пребывания в 1-м состоянии за время Z= 10000 не превосходит 4738. Решение. Воспользуемся решениями задач 5.4, 5.5 и тео- ремой 6.1. Параметры а и |3 определим из равенств = 1 — а, 1 3 2 1=1-|3:а = 2, 0=|. Тогда a1 = lim-MZ1 (f)=JL=JL=O,47058... z—»оо t ' ' а+р 17 а? = lim Inz, 1025S49... t—- oo » V* ' Pj 1' и Oj =0,320288... . Воспользуемся теоремой 6.1: P{Z,(,)<4738}-P| Д|.1ГО - 4738-4705,8... 32,0288...
— 1 е~ 2 ём=-+Ф0(1). По таблице 1 находим, что Фо(1)=0,3413 и, следовательно P{Z1(r)<4738}«0,8413. 6.3. Для цепи Маркова, определенной в задаче 6.2, найт] приближенное число испытаний t такое, что доля времен^ проведенного в первом состоянии Zx(z)/z отличается oi g предельной вероятности лх = — не больше чем на 0,01 с ве роятностью не меньшей 0,99. Указание. Воспользоваться теоремой 6.1 и равенством Ответ: 6828.
ГЛABA 9 ГЕОМЕТРИЧЕСКИЕ ВЕРОЯТНОСТИ § 1. Определение вероятности Геометрические вероятности являются вероятностной моделью с бесконечным числом исходов аналогичной классическому определению вероятности для опытов с конечным числом исходов. Элементарными исходами в схеме геометрических вероятностей являются, например, множества точек прямой либо какие-нибудь точки областей плоскости или трехмерного пространства; в качестве элементарных событий могут рассматриваться точки в пространствах любой размерности. Ограничимся для определенности рассмотрением в качестве элементарных событий точек (и, v) некоторой области Q в плоскости с заданной системой декартовых координат. Множество точек области Q бесконечно. События являются подмножествами области £1 При бесконечном числе исходов формула (1.2) гл. 5 уже не может быть использована. Однако сам принцип определения вероятности события посредством суммирования элементарных вероятностей сохраняется. Здесь мы будем «суммировать» элементарные площади dndu по точкам (и, и), составляющим событие А. Вероятностью события А в модели геометрических вероятностей называется число р / \ площадь A z। j) ' > площадь Й Эту формулу можно переписать в виде р^)=^ dndu. (1-2)
Элементарным вероятностям р(®) в (1.2) гл. 5 здесь в (1.2) dudv соответствуют элементарные площади —-, а суммирование заменяется интегрированием. Отметим, что уже эта простая модель приводит к некоторым осложнениям по сравнению с конечной схемой. В конечной схеме любое подмножество называли событием/ Здесь этого сделать нельзя, так как не для всех подмножеств; определена площадь; есть неквадрируемые фигуры. В даль-, нейшем мы не будем заниматься этими особенностями схем с бесконечным числом исходов. Для достаточно большого круга задач эти трудности не возникают. 1.1. Пассажир может ехать на любом из автобусов двух; маршрутов. Временные интервалы между моментами появлений автобусов этих маршрутов равны соответственно 5 мин. и 12 мин. Найти вероятность события А = {пассажир будет* ждать не более 3 мин.}. Решение. Элементарным событием будем считать точку (и, v): и—время до появления автобуса с 12 минутным интервал лом (0 ^п^12), a v—время до появления другого автобус® (О 5). Элементарные события образуют прямоугольник £) = {(«, и): O^t/^12, 0^и^5}. (см. рис. 2). Событие А определяется условием: наименьшая из координат не превосходит 3, т. ё^ А = {(и, и): min (и, и)<3}. На рис. 2 область прямоугольника Q, соответствующая At заштрихована. Нетрудно проверить, что пл. £2 = 60, а пл. А = 42. Таким образом, по формуле (1.1) находим: Р(А) = 42/60 = 0,7. 1.2. На квадрат £1 = {(п, и): O^u^l} брошена точка. Найти вероятность того, что точка будет удалена от центра квадрата не больше чем на 1/2. Ответ: л/4. 1.3. Двое договорились встретиться между 12 и 13 часами^ Пришедший первым ждет второго 10 мин. Найти вероятность того, что встреча произойдет. Указание. Элементарный исход (и, v): и—момент прихода первого из договаривающихся в минутах; v—момент прихода второго в минутах. Множество £2 = {(и, и): О^п^бО, 0v60} — квадрат. Определить точки квадрата, со-> ответствующие событию А = {встреча произошла}. Воспользоваться формулой (1.1).
Рис. 2 того, что ни одна из них не попадет другой. Ответ: 11/36. 1.4. К преподавателю для сдачи зачета с 9 до 10 часов должны прийти 2 студента: Николай и Егор. Николаю для сдачи зачета потребуется 20 минут, а Егору — 10 минут. Найти вероятность того, что ни одному из них не придется ждать. Указание. Элементарным событием считать точку (и, v): и—число минут, прошедших после 9 часов до прихода Егора, a v — число минут до прихода Николая. Ответ: 41/72. 1.5. К причалу между 8 и 18 часами должны подойти две баржи. Одна должна разгружаться 2 часа, а другая—3 часа. Какова вероятность во время разгрузки „ 113 Ответ: —. 200 1.6. В интервале появляется сигнал длительности А. Приемник в случайный момент на время t. Найти Вероятность обнаружения сигнала. „ Л+r г2 + Л2 Ответ: — Т времени [О, Т] в случайный момент включается 2Т2 4-8516 Ватутин 97
1.7. Во время экономического спада интервалы движени| автобусов возросли до 40 минут. Расстояние между остад новками С и D автобус проходит за 4 минуты, а пешеход за 24 минуты. Пассажир приходит на остановку С в случайны! момент времени. Найти вероятность того, что автобус н| обгонит пассажира, если пассажир сразу пойдет пешком из С в D. Указание. Принять за элементарное событие момен| и прихода пассажира на интервале (0,40). В этом случай множество Q = {u: 0<и<40}. Вероятность любого событий А определяется вместо формулы (1.1) формулой: 27/ чт< р М)=длина л ' ’ длина Q Автобус не обгонит пассажира, если и+24 <40+4. Ответ: 1/2. 1.8. Монета упала на дощатый пол. Ширина доски радиус монеты г (2г <2/7). Какова вероятность того, монета попадет на щель? Указание. Положить П = {п: и—расстояние Ц центра монеты до ближайшего края доски. ’’ 2 Ответ: —. 1.9. В задаче 1.8 рассмотреть случай более узкой доски, когда Н<г<2Н. Найти вероятность того, что монета накрое| к щелей (к =1,2). Ответ: 1) (1--1 к=1; 2) --1, к=2. \ НJ н 1.10. Монета радиуса г упала на пол, выложенный квад ратными плитками со стороной 2а (г<а). Какова вероятности того, что край монеты будет пересекать границы квадратор в четырех точках? Какова вероятность того, что монета буде! лежать внутри одного квадрата? Указание. В качестве множества D выбрать квадрат П = {(а, и): |а|^а, |и|^а}. Здесь (а, и)—координаты центре монеты. Начало координат—общая вершина четырех квад ратов. Край монеты пересечет границы квадратов в четыре^ точках, если центр монеты удален от начала координа! меньше чем на радиус монеты. / г\2 Ответ: лг2/4а2, (1 —) .
1.11. Задача Бюффона. На дощатый пол упала игла. Ширина доски—2L, длина иглы—21, (1<L). Найти вероятность того, что игла пересечет щель. Указание. В качестве элементарного события можно взять точки (ф, и): и—расстояние середины иглы до ближайшей щели; ф — угол наклона иглы. Тогда £1 = {(ф, и): О^ф^л, Q^u^L}. Ответ: —. Ln § 2. Случайные величины Случайные величины являются функциями от элементарных событий. Если Х=Х(и, v)—случайная величина, то событие {а<Х<Ь} является множеством тех (и, и), для которых эти неравенства выполняются: {a<X<b} = {(u, v): а<Х(и, и)<6}. 2.1. В задаче 1.1 обозначим X—время до прихода автобуса. Найти Р{У>2}. Решение. Случайная величина X определяется равенством Г(п, и)=min (и, и). Событие {Х>2} означает, что обе координаты больше 2: {У>2} = {(п, и): и>2, v>2}. Этому множеству соответствует прямоугольник со сторонами 3 и 10, расположенный в правом верхнем углу прямоугольника Q = {{и, v): Э«%и^12, 0^и^5}. По формуле (1.1) Р{2Г>2} = 30/60=1/2. 2.2. В задаче 1.1 определим Y расходы пассажира на проезд: если приходит автобус, имеющий интервал 5 мин., то пассажир ничего не платит (у него проездной), а если приходит другой автобус (загородный), то пассажир платит 10 коп. Определить Y как функцию от элементарного события. Найти закон распределения Y. Ответ: {У=0} = {(п, и): v<u}, {У=1} = {(п, v): v>u}', Р{у=0} = 19/24, Р{У=10} = 5/24. 2.3. На квадрат Q = {(tz, и): |и|1, |и|^1} брошена точка. Определим случайные величины X, У, Z: {1 / 2 . 2 1 1, если ^/и +v <-, ________________ J 0, если Ju2 + v2 >-, v 2
Z=Z(u, v) = ^/u2 + v1—расстояние между точкой и центров квадрата. Найти вероятности событий: Р{Х>0}, Р{У=1}, P{Z>1) Ответ: Р{Х>0} = 1/2; Р{Y= 1} = л/16; P{Z>1} = 1-^. § 3. Функция распределения и плотность распределения вероятностей Функцией распределения случайной величины X называете! функция Fx(x) = P{X^x}, — оо<х<оо. Зная функцию распре! деления, можно найти вероятности любых событий, связанны! со случайной величиной. Например, Р{Х>Л} = 1 — Fx(b), V{a<X^b}=Fx(b)-Fx(a). (3.1| Если случайная величина принимает только конечное ил| счетное число значений, т. е. существуют такие х15 х2, , х„, ..J для которых 00 £ Р{Х=ХЛ} = 1, п = 1 то случайная величина называется дискретной. Функция распределения дискретной величины ступенчата. Если функция распределения Fx (х) представляется при любом х в виде ^х(*) = J Px(w)dM, (3.2) — 00 то функция рх{й) называется плотностью распределения случайной величины X. В этом случае функция распределений непрерывна. Поскольку функция распределения дискретных случайных величин ступенчата, такие величины не имею! плотности распределения. Случайные величины, имеющие плотность распределения иногда называют непрерывными* Через плотность распределения просто выражается вероятность события ь Р{а<Х<Ь}^рх(и^и. (3.3)
В точках непрерывности плотность распределения px(x)=Fx(x). Функция распределения определяет закон распределения любой случайной величины. Однако для дискретных случайных величин закон распределения удобно задавать перечислением их значений хь х2, , х„, ... и указанием со- / 00 \ ответствующих вероятностей Р{Х=хп}=рп I рп^0, £ рп=1\. \ п = 1 ' Для непрерывных случайных величин закон распределения часто удобнее задавать плотностью распределения. 3.1. Найти функцию распределения и плотность распределения случайной величины X (времени ожидания автобуса), определенной в задачах 1.1 и 1.2. Решение. Очевидно, что Fx(x) = P{X<x} = 0 при х^О (отрицательным X не может быть) и Fx(x)=l при х>5 (X наверняка не превосходит 5); при любом исходе (и, v) значения Х=Х(и, v) удовлетворяют неравенствам 0<Х(и, и) <5. Если 0<х<5, то вероятность события Ах = {(и, и): min(u, и)<х} находится так же, как в задаче 1.1 вероятность А'. пл. Лх = 60—(5 —х)(12 —х), пл. £2 = 60, Fx(x)=P(A)=^=^^, 0<х<5. х' ’ v х' пл. Q 60 При тех же значениях х находим px(x) = Fx(x) = ———. Таким 60 образом, Fx(x)=< 0, если х^О, 17х — х2 „ , —----, если 0<х<5, 60 1, если х^5; Рх(х)= \l-2x „ - -----, если 0<х<5, 60 0 в остальных случаях.
3.2. Найти функцию распределения и плотность распре деления случайной величины X, определенной в задаче 2.3. Ответ: Fx(x)=~(-1 ^х^ 1); рх(х)='-(-1 ^х^ 1). 3.3. Указать значения и их вероятности дискретной случайной величины Y, определенной в задаче 2.3. Ответ: Р{У=1} = л/16, Р{У=0} = 1-4- 16 § 4. Математическое ожидание. Дисперсия Формула, аналогичная формуле (2.1) гл. 5, имеет вид j j w)dMdi;- (41) я Здесь так же, как в (2.1) гл. 5, значения случайной величины Х(и, v) при исходе (и, v) умножаются на элементарную вероятность dwdu/пл. О и «суммируется» по всем (и, v) из области £2. При вычислении дисперсии можно либо использовать равенство DX=—L_ j j (Х(и, v) -MX)2dudv, (4.2) n либо применить формулу (3.2) гл. 5, в которой МУ2 определяется из равенства Му2=_1_ JJy2(M, 0dwdy. (4.3) я Если величина X дискретна, то можно пользоваться формулами (2.2), (3.5), (3.6) гл. 5. Аналогичные соотношения для непрерывных величин будут приведены в главах 10 и 12. 4.1. Используя равенства (4.1) и (4.3), найти математическое ожидание времени ожидания первого пришедшего автобуса, определенного в задачах 1.1 и 1.2.
Решение. Случайная величина X=min(w, v). По формуле (4-1) МА"=^ JJmin(w, и) du du. я Область О разобьем на две области (см. рис. 3): £2x = {(w, и): v>u; 0^w^l2; 0^и^5}, <22 = {(и, и): v<u; 0<и<12; 0<ь><5}. Тогда Х=и в области £2t и Х=и в области Q2 и> следовательно, то МХ= 155/72 = 2,15277...
Аналогично находим 5 v 5 и 12 5 МХ2 = — I du I w2dw4—- I dw | u2du+ — | dw |u2du = 6,59722... 60 J J 60 J J 60 J J OO 0 0 5 0 и D^=M^2-(M^) 2 = 1,9627.... 4.2. В задаче 1.1 о двух автобусах обозначим Х5 время до прихода автобуса с пятиминутным интервалом и Х12— время до прихода автобуса с интервалом 12 мин. Найти MJf5, dx5, мх12, dx12. Указание. X5(u, v) = v, X12(u, v) = u. Ответ: MX5 = 5/2, DXS = 25/12, MX12 = 6, DX12 = 12. 4.3. Интервалы движения автобусов маршрутов № 1 и № 2 одинаковы и равны Т. Обозначим X время ожидания автобуса любого маршрута, X,— время ожидания автобуса маршрута № 1. Найти MX, МХГ. Указание. В качестве множества элементарных исходов выбрать квадрат Q = {(w, и): О^и^Г, где и—время ожидания автобуса маршрута № 1, а и—маршрута № 2. Тогда X (и, v) = min (и, v), Х2 (и, v) = и. Ответ: МХ=Т/3, МХ2 = Т/2. 4.4. В условиях задачи 4.3 пассажир пропускает первый пришедший автобус и ждет автобус другого маршрута. Пусть X—время ожидания желаемого автобуса этим пассажиром. Найти МТ. Указание. Х(и, u)=max(w, и). Ответ: МХ=-Т. 3 4.5. Найти математическое ожидание и дисперсию случайных величин X и Y, определенных в задаче 2.3. Указание. Для вычисления МУ и DK использовать решение задачи 3.3. Ответ: МХ=0, DX= 1/3; МГ=я/16, DT=(n/16)(l- (л/16)). 4.6. Продолжение задачи 1.4. Определим случайные величины Хн, ХЕ, Хп: Хн—время ожидания начала зачета Николаем, ХЕ— Егором, Хп—время ожидания преподавателем прихода студентов. Найти математическое ожидание и дисперсии этих величин.
Указание. Хн = О, если v<u или и>и+1О, 10+u — v, если w<y<w+10; __ (0, если u<v или u>v + 20, Е (20+у — и, если v<u<v + 20; •¥n = min{w, у}. Воспользоваться формулами (4.1) и (4.3); 60 и+10 = j (10 + w—v)dv, G Ou где G = {(u,v): 0^w^60, О^и^бО, u<v<u+10}. Ответ: MXH = |, DXH=^, MXE=-, DXE=—, MXn = 20, 6 36 3 3 DXn = 200. 4.7. Интервалы движения автобусов равны Т. Расстояние между остановками С и D автобус проходит за время Д1; пешеход проходит за До (Т+Д,—До>0). Обозначим Хг— время, затраченное пассажиром на достижение остановки D, если он сразу после прихода в С идет пешком, а догнавший его автобус подвозит его оставшуюся часть пути. Время, затраченное пассажиром на достижение остановки D в случае, когда он после прихода на остановку С ждет автобуса, обозначим Х2. Найти МХ1; МУ2. Указание. Обозначим и время, прошедшее от ухода автобуса до прихода пассажира. Тогда Х2 = Т— w + At, А\ = До, если Д0<Т—w+At; Хг = Т— ы+Д15 если Д0>Т—w + At. Ответ: = До(1 + + ±(Д^-Д?), МХ2 = Д1 + |г. § 5. Ковариация. Независимость случайных величин Для вычисления ковариации случайных величин X и Y в схеме геометрических вероятностей можно использовать формулу cov(X, У) = -1_ v)-MX)(Y(u, v) —MT)dwdy, (5.1) n
5, в которой MXY находится из либо формулу (4.2) гл. равенства мхг=-!-пл. Я п X (и, v) Y(и, и) dw du. (5.2) Случайные величины X и Y называются независимыми, если для любых интервалов (а15 Ь2), (а2, Ь2) выполняется равенство Р{а1<Х<й1, a2<Y<b2} = P{a1<X<b1}P{a2<Y<b2}.(5.3) Для дискретных величин это определение равносильно определению (1.4) гл. 5. Для случайных величин с непрерывной функцией распределения определение (1.4) гл. 5 непригодно, так как в этом случае вероятность любого события {Х=а, Y=b}, {Х=а}, {Y=b} равна нулю. Случайные величины Х2, ..., Х„ называются независимыми, если для любых интервалов (а;, bt), i=l,...,n выполняется равенство Р{а! <!;<£!, а2<Х2<Ь2, ап<Х„<Ьп} = (5.4) = Р {a^XiCb^P {а2<Х2<Ь2} ... Р{а„<Х„<Ь„}. 5.1. В квадрат £2 = {(м,и): | w|^ 1, | и|< 1} брошена точка. Её координаты Х(и, u) = w, Y {и, v) = v являются случайными величинами. Найти вероятности событий {a1<X<b1, a2<Y<b2}, {a1<X<bl}, {a2<Y<b2} и cov(X, У). Зависимы ли случайные величины? Указание (рис. 4а), б), в)). Ответ: P{a2<X<b2, а2< Y < Ь2} ~ (Ьг-(Ь2 —а2) / 4',
Рис. 5 Р{а1<Х<й2}=(й1-а1)/2; Р {dz< У< Z>2} = (Z>2 —а2)/2. Случайные величины независимы; cov(X, У) = 0. 5.2. В квадрат £2 (см. рис. 5), ограниченный прямыми y = w + l, v= — w+1, v= —и— 1, v = u— 1, брошена точка. Её координаты Х(и, v)=u, Y(u, v) = v являются случайными величинами. Найти 1) MX, 2) МУ, 3) cov(X, У), 4) р|1<Х< 11, 5) р(-<У<11, 6) р(-<Х<1, -<У<11. (2 J ' (2 2 J Решение. Пл.£2 = 2. По определению МУ= J Jwd udv = | О u-1 t>dt>+-2 О и-1 t»dy=O. Аналогично находим МХ=0, МХУ=0 и, следовательно, cov(X, У) = 0. Событию ||<Х< 1, |< У< 11 соответствует на рис. 5 заштрихованный квадрат, лежащий вне квадрата £2. Следовательно, это невозможное событие, и р(-<Х<1,-<У<11 = 0. (2 2 J Событию соответствует треугольник, отсеченный от £2 вертикальной прямой w=^. Вычислив площадь этого треугольника (пл. <Ц<Х< 1 >= 1/4J, по формуле (1.1) найдём
р]-<Х< 1 >=-. Аналогично находим Р<-<К<1) = ^. Таким (2 J 8 (2 J 8 образом, 0 = р(-<Х<1, -< Г<11^р(-<Ал<11’Р(-<Г<11 = -. (2 2 J |2 J (2 J 64 Следовательно, величины X и Y зависимы. Равенство нулю ковариации не является достаточным условием независимости. 5.3. В квадрат О = {(и, и): 0 и < 1, 0 и 1} брошена точка. Найти математические ожидания и ковариацию случайных величин: X(u, v) — u + v, Y(u, v) — u—v. Указание. Использовать формулы (4.1), (5.2). Ответ: МХ=1, МУ=0, cov(A”, У) = 0. 5.4. Решить задачу 5.3, введя вспомогательные случайные величины Zj (и, v) = u, Z2(u, v)~v. Указание. Использовать равенства Z=Z1 + Z2, Y=Zr — Z2. Найти необходимые числовые характеристики Zx и Z2 и воспользоваться свойствами математического ожидания.
ГЛАВА 10 ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ § 1. Закон распределения Определение дискретной случайной величины, данное в § 2 главы 9, сохраняется для любой вероятностной модели. Нередки ситуации, когда вся требующаяся от изучаемого случайного опыта информация содержится в значениях одной случайной величины X. В этом случае нет необходимости знать полностью все элементарные исходы (более подробно описывающие опыт) и их вероятности. Достаточно знать закон распределения случайной величины. Для дискретных величин наиболее удобная форма задания закона распределения — это указание любым подходящим способом числовых значений *1, Х2, Х„, ... (1.1) случайной величины X и соответствующих им вероятностей рп = Р{Х=хп}, и = 1, 2, .... Очевидно, что числа р„ должны удовлетворять условиям: 00 р„>0, и = 1,2, ...; £рп=1. (1.2) И = 1 К значениям (1.1) можно относиться как к элементарным исходам опыта с заданными вероятностями {p„}n=i, удовлетворяющими условиям (1.2). Для любого числового множества В вероятность события {Xе В} = {значение X попало в В} определяется формулой: ' Р{Хе5}= X (1-3) п:х„еВ где суммирование проводится по тем п, для которых х„ принадлежит В.
Приведенное правило вычисления определяет еще одну вероятностную модель. Приведем часто встречающиеся законы распределения дискретных случайных величин. Во всех этих примерах случайные величины будем обозначать X. 1°. Биномиальное распределение: Р{Х=те} = Сптрт(1-р)п“т, 0<р<1, (1.4) т = 0, 1, ..., п. Случайная величина, равная числу успехов в п испытаниях схемы Бернулли с вероятностью успеха р, имеет закон распределения (1.4) (см. (2.1) гл. 6). 2°. Гипергеометрическое распределение: P{X=m} = CSC^, т = 0, 1, ..., min (и, М). (1.5) CS Такое распределение имеет число X белых шаров среди п шаров, выбранных по схеме случайного выбора без возвращения (см. (2.3) гл. 4). 3°. Пуассоновское распределение: Р{Х=т}=—е~\ Х>0, да = 0, 1, .... (1.6) т\ Это распределение возникает при предельном переходе в условиях теоремы Пуассона из биномиального распределения (см. (5.1) гл. 6). 4°. Геометрическое распределение: P{X=w} = (l-p)'"-1A ш=1, 2, .... (1.7) 0<р<1. Такое распределение имеет число испытаний в схеме Бернулли, прошедших до первого успеха включительно (см. (1.6) гл. 6). Иногда геометрическим распределением называют распределение, получающееся из (1.7) заменой левой части равенства на Р{Х—т — 1}. Законы распределения, определяемые равенствами (1.4) и (1.6), часто обозначают символами Bi(n, р) и П(Х) соответственно. 1.1. Случайная величина X имеет геометрическое распределение вероятностей (см. (1.7)). Найти вероятность события {Х^к}.
Решение. В этом случае в формуле (1.3) имеем B={k, &+1, ...}, и поэтому 00 V{X^k} = V{XeB}=-- £ (l-p)'"-1p = (l-p)'t~1, т — к 1 так как £ ат =---(—1<а<1). Таким образом, т= 0 а P{X^k}=(l—p)k~l, &=1,2, .... 1.2. Для случайной величины X, имеющей пуассоновское распределение (см. (1.6)), найти Р{Х>0}. Указание. Найти вероятность противоположного события. Ответ: Р{Х>0} = 1 — е~\ 1.3. Найти вероятность события {2^Х^4}, если X имеет биномиальное распределение с и = 5, р=1/3. Указание. В формуле (1.3) 5={2, 3, 4}. /l\2/n\3 /1\3\2 /1\4/7\1 Ответ: Р{2^Х^4} = 052(|) (|) + С53(|) +С’4(|) (|) = 130 \ / \ / \ ) \ / \ / \ / 243’ п— 1, 2 1.4. Возможные значения х„ случайной величины X определяются равенствами: х„ = п, ; р„ = Р{Х=и} = С/и(и + 1). Найти С. с Решение. Воспользуемся условием (1.2): £ рп= £ ~7— Так как n=1 п=1””+ Известно, что то С = 1 и, следовательно, 1.5. Возможными значениями х„ случайной величины X являются значения Xj = —1, х2 = 0, х3 = 1. Вероятности этих значений равны С, 2 С, ЗС. Найти С. Ответ: 0=1/6. 1.6. Найти закон распределения случайной величины X, если Р {Х—п} — С/п (и+1) (п + 2), и=1,2, ....
Указание. См. решение задачи 1.4. Для суммирования использовать равенства 1 _ 1/ 1 _ 1 \ n(n+l)(n + 2) (n+l)(n + 2)/ Ответ: Р {X=n} = 4jn(n + 1)(« + 2). § 2. Математическое ожидание и дисперсия Будем считать, что известен закон распределения случайной величины Х\ Р{Х=хк}=рк, к=\,2,.... Математическое ожидание MX вычисляется по формуле 00 МХ= X х*Р{Х=х*}, (2.1) к = 1 если ряд абсолютно сходится. В противном случае математическое ожидание не существует. Если множество значений X конечно, то ряд (2.1) становится конечной суммой (см. (2.2) гл. 5). Дисперсия DX находится по формуле 00 DX= X (хк-МХ)2Р{Х=хЛ) (2.2) к = 1 или по формулам DX=MX2 —(MX)2 (2.3) и МХ2= J хкР{Х=хк}, (2.4) к=1 если ряды в (2.2) и (2.4) сходятся. В противном случае DX не существует. 2.1. Найти MX и DX случайной величины X, имеющей биномиальное распределение. Решение. 1-й способ. Обращаясь к (2.1), находим МХ= f тР{Х=т}= f тС^рт(1-р)П-т. т — О т = 1 Отсюда, используя равенства т С”' = п , х -рГт="х с„т_1рт(1-р)’’-т=(р+(1-р))'’-1 = 1, т=1 т=0
получаем MI=n f С”~11рт(1-р)п~т = пр X С”2~11рт~1 (1—р)п~т==пр. т = 1 m = 1. Для вычисления дисперсии найдем сначала MX2, представив X2 в виде: Х2 = Х(Х-1)+Х. Тогда МХ2=МХ(Х-1) +МХ, что в сочетании с (2.3) и (2.4) приводит к ещё одной формуле для вычисления дисперсии случайных величин: DX=MX(X-1) +МХ- (MX)2. (2.5) Эта формула особенно удобна при работе с целочисленными случайными величинами. Ясно, что МХ(Х-1)= f w(w-I)P{X=w}= £ т(т—1)Сптрт(1—р)п~т. т — 0 т = 0 Отсюда, используя равенство т[т— 1) С™ = п[п — 1)Слт_~22, получаем МХ(Х—1) = и(п —1) £ Спт_’22рт(1-р)п“т = и(и-1)р2. т~ 2 Это соотношение, в сочетании с равенством МХ=пр, даёт (см. (2.5)) DX=h(h — \)p2 + np—п2р2=пр(1 —р). 2-й способ. Поскольку число успехов в п испытаниях по схеме Бернулли имеет биномиальное распределение, то математическое ожидание и дисперсия р.„ совпадут с математическим ожиданием и дисперсией биномиально распределенной случайной величины X любого происхождения. Таким образом, можно вычислить Мц„ и Dp„, воспользовавшись ее представлением (3.1) гл. 6 (см. задачи 3.5, 3.6 гл. 6). Этот способ значительно проще первого. 2.2. Найти MX и DX, если X имеет пуассоновское распределение (1.6). Указание. Использовать формулу (2.5). Ответ: MX=DX=1. 2.3. Найти MX и DX, если X имеет гипергеометрическое распределение.
Указание. См. 2-й способ решения задачи 2.1. Рассмотреть^ закон распределения числа белых шаров в схеме выбора без возвращения. М г... , M\N—n Ответ: МХ=п —, DX=n( 1-------------. N N\ N)N— 1 2.4. Найти MX случайной величины с законом распре* деления Р{Х=и} = 1/и(и+1), и=1,2, .... Ответ: Математическое ожидание не существует. 2.5. Найти MX случайной величины X с законом распределения Р{Х=и} = 4/и(и+1)(и + 2), и = 1,2, ... . Указание. Использовать формулу (2.1) и равенство 1 _ 1_______1_ (п+ 1)(п + 2) п+1 п + 2 Ответ: МХ=2. 2.6. Найти MX и DX случайной величины X, закон распределения которой определен в задаче 1.5. Ответ: МХ=1/3, DX=5/9. § 3. Закон распределения функции от случайной величины Зная закон распределения Р[Х=хк}=рк, к=1,2, ... случайной величины X, можно найти закон распределения случайной величины У=ф(Х), являющейся функцией от X по следующей формуле: P{X=K.} = Z Р{Х=хк}, т = 1,2,..., (3.1) т. е. нужно просуммировать вероятности тех значений случайной величины X, функция от которых даёт заданное значение ут. 3.1. Закон распределения X задан таблицей: к 1 2 3 4 5 Xk —4 -1 0 1 2 1 1 1 1 1 P{JT=xt} 8 8 2 8 8 Найти закон распределения случайной величины Y=X2.
Решение. Значения случайной величины Y определяются по значениям случайной величины Х:у1=0 получается из значения х3=0; у2 = \—из значений х2=—\ и х4 = 1; уз = 4—из х5 = 2; у4 = 16—из xt = — 4. Сумма (3.1) во всех случаях, кроме у=у2 = 1, сводится к одному слагаемому; при У=у2=1—к 3.2. Найти закон распределения случайной величины Y= — X3, если закон распределения X определен в задаче 3.1. Ответ: т 1 2 3 4 5 ут -8 -1 0 1 64 Р{Х=ут} 1/8 1/8 1/2 1/8 1/8 3.3. Найти закон распределения y=sgnX, если закон распределения X определен в задаче 3.1. Указание. Функция sgnX— 1, если Х>0, sgnХ= 0, если Х=0, и sgnX=—1, если Х<0. Ответ: Р{У= 1} = Р{У= -1} =1, р{у=0}=^. 3.4. Случайная величина X имеет пуассоновское распределение (1.6). Найти закон распределения y=sgnX. Ответ: Р{У=0} = е~\ Р{У=1} = 1-е"\ § 4. Математическое ожидание и дисперсия функции от случайной величины Пусть х2, хп,...— значения дискретной случайной величины X. Если случайная величина Y=<p(X), то для вычисления МУ и ВУ можно не находить закон распределения У, а воспользоваться формулами: 00 М У= Мф (х) = I ф (а) р {Х=хк}, (4.1) к=1
ОУ=£>Ф(Х) = f (ф(х*)-МУ)2Р{Х=хк} (4.2) к=1 или формулой ВУ=МУ2—(МУ)2, в которой 00 МУ2 = X Ч>2(хк)Р{Х=хк}. (4.3) 4=1 > Математические ожидания некоторых функций от случайной величины часто используются и носят специальные названия: МХт—момент порядка т случайной величины X; М(Х—МХ)т—-центральный момент порядка w; М|Х—МХ|т—абсолютный центральный момент порядка т и т. д. 4.1. Закон распределения X задан таблицей: к 1 2 3 4 5 xk —4 -1 0 1 2 1/8 1/8 1/2 1/8 1/8 Найти МУ и ВУ, если Y=X2. Решение. По формулам (4.1) и (4.3) находим му-мх2=16.|+1 4+°4+14+44=т’ о о Z о о 4 МУ2 = МХ4 = 256 •-+1 -+0--+1.1+16-=—. 8 8 2 8 8 4 Отсюда ОУ=МУ2-(МУ)2=—. ' ' 4 16 16 4.2. Закон распределения X определен в задаче 4.1. Найти МУ, где У=-Х3. Ответ: МУ=7. 4.3. Закон распределения X определен в задаче 4.1. Найти МУ, ВУ, где У = sgnX. Ответ: МУ=0, ВУ=1. 2 4.4. Случайная величина X имеет пуассоновское распре- деление (1.6). Найти МУ, ВУ, где y=sgnX. Ответ; МУ=1—е-х, ВУ=е-х(1 — е~х).
§ 5. Производящая функция Целочисленной случайной величиной обычно называют случайную величину, значениями которой могут быть только числа 0, 1,2, ... . Пусть X—целочисленная случайная величина. Рассмотрим функцию Y—zx, где O^z^l. Производящей функцией cpy(z) целочисленной случайной величины X называется функция q>x(z) = Mz*. (5.1) Отсюда по формуле (4.1) 00 Фх(г)= X znY{X=n}. (5.2) n = 0 Дифференцируя (5.2) по z и полагая z= 1, нетрудно проверить, что МХ=ч4(1), МУ(Х-1)=<р^(1). (5-3) Отсюда и из (2.5) находим ПУ=фх(1) + фх(1)—(ф'х(1))2. (5.4) Если найдена производящая функция, то вычисление МУ и DX при помощи суммирования (по формулам (2.1):—(2.4)) можно заменить вычислением при помощи дифференцирования (по формулам (5.3), (5.4)). 5.1. Найти производящую функцию случайной величины X, имеющей биномиальное распределение. Решение. По формулам (5.2) и (1.4) находим Фх(*)= f zmP{X=m} = £ zmC^Pm(\-Py~m= т—0 т — 0 = X C-(zp)m(l-Jp)--’". т— О Отсюда Фх(г)=(рг+1-р)". (5.5) 5.2. Используя производящую функцию (5.5), найти математическое ожидание и дисперсию случайной величины, распределенной по биномиальному закону. Решение. Производные <p'x(z) и (px(z) равны: Фх(г)=пр(рг+1-р)л~1, ^(z) = n(n-\)P2(Pz+l-P)n~2.
Отсюда при 2=1 ф'лг(1)=ир, ф'^(1)=и(и-1)р2. По формулам (5.3) и (5.4) МЗГ=ф'х(1)=ир, ПУ=ф£(1)+ф^(1)-(ф^(1))2=и(и-1)р2+ир-п2р2=лр(1-/>). 5.3. Найти производящую функцию случайной величины X, имеющей пуассоновское распределение (1.6). Ответ: фх(2)=еК(2-1). 5.4. Найти математическое ожидание и дисперсию случайной величины X, имеющей пуассоновское распределение. Ответ: MJf=DA'=X. 5.5. Найти производящую функцию случайной величины X, имеющей геометрическое распределение (1.7). Ответ: a>x(z)=---—---. 5.6. Найти математическое ожидание и дисперсию случайной величины X, имеющей геометрическое распределение. Ответ: МХ=-, ПХ^—/. Р р2
ГЛАВА 11 АБСОЛЮТНО непрерывные случайные величины § 1. Функция распределения и плотность распределения вероятностей Случайные величины X, у которых функция распределения ед=р{л^х}, — оо<х<оо, (1.1) представляется в виде Fx(x)= J Px(w)dw, (1.2) — 00 называют абсолютно непрерывными (иногда просто непрерывными), а подынтегральную функцию рх(х) в (1.2) называют плотностью распределения вероятностей случайной величины X или просто плотностью. Вероятность любого события + оо, легко выражается через Fx(x) и рх(х)'. Y{a^X^b}=Fx(b)-Fx(a), (1.3) ь P{«^y^Z>} = fpjr(x)dx. (1.4) а Для случайных величин с непрерывной функцией распределения Р{У=с} = 0 при любом с. Поэтому вероятности любых событий вида: {а^Х^Ь}, {а^Х<Ь}, {а<Х^Ь}, {а<Х<Ь} равны правым частям (1.3) и (1.4). Если рассматривать значения случайной величины как элементарные события, а вероятность любого события {а<Х<Ь} определять формулой (1.4) с функцией рх(х), удовлетворяющей условиям ю Px(x)>0, f px(x)dx=l, (1.5) — со 119
Рис. 6 то получится еще одна вероятностная модель. Приведем часто встречающиеся законы распределения, опре деленные плотностью распределения. 1°. Равномерное распределение на [а, />]: ——, если а^х^б, ъ~а (1.61 О в остальных случаях. График плотности у=Рх(х) равномерного распределения при* веден на рис. 6. Равномерный закон распределения (1.6) часто обозначают символом R(a, b). 2°. Показательное распределение с параметром Х>0: . (Хе Хх, если х>0, Рх\х) =) л ( и, если (1.7) График у=Рх(х) см. на рис. 7. 3°. Нормальное, или гауссовское, распределение с парамет* рами а и о2 (—оо<а<оо, о2>0): 1 (*~а)2 рх(х) = —— е 2^ , — ОО <Х< 00. (1.8) График у=Рх(х) см. на рис. 8.
Рис. 7 Нормальный закон распределения (1.8) часто обозначают символом Ж (а, о2). Нормальное распределение с а — 0, о = 1 называют стандартным нормальным распределением, а соответствующую ему функцию распределения обозначают Ф(х). С функцией Ф0(х) (см. (6.4) гл. 6) Ф(х) связана следующим образом: С0,5 + Фо(х) при х^О, (0,5 —Ф0(х) при х<0. (1-9) 1.1. Случайная величина X равномерно распределена на отрезке [2, 4] (см. (1.6)). Найти P{2,5<Z<3,5}. Решение. По формулам (1.4) и (1.6) находим P{2,5<Z<3,5} 3,5 3,5 px(x)dx=| doc—^. 2,5 2,5 1.2. Плотность распределения случайной величины X имеет вид: рх(х) = С/х4 при х^1, и рх(х) = 0 при х<1. Найти: а) постоянную С; б)Р{А"<3}; в) Р{А">7}.
Рис. 8 Решение. По условию (1.5) 00 * px(x)dx = - со Отсюда С=3. По формуле (1.4) 26 27’ 1.3. Случайная величина X имеет показательное распределение (см. (1.7)). Найти: а) функцию распределения fx(x); б) Р{Х“1<^<2Х“1}. Ответ: а) 1— е"и при х>0; б) е”1(1—е-1). 1.4. Плотность распределения случайной величины X имеет вид: px(x) = Csinx при 0<х^л, и Рх(х) = 0 в остальных
случаях. Найти: а) постоянную С; б) Р|АГ>^ Ответ: а) С =1/2; б) у/2\. § 2. Математическое ожидание и дисперсия Математическое ожидание и дисперсия абсолютно непрерывной случайной величины X находятся по формулам МХ= f xpx(x)dx, (2.1) — оо DX= f (x-MJT)2px(x)dx. (2.2) — oo Дисперсию можно также найти по формуле DY=MY2- (MI)2, в которой МУ2= f x2px(x)dx. (2.3) — со 2.1. Найти математическое ожидание и дисперсию случайной величины X, имеющей нормальное распределение (1.8). Решение. По формуле (2.1) 2— 00 ’ (л-я)2 хе 2°2 dx. Заменой переменных у = (х — а)/а, находим v2 МХ=-^= -fix . 2 dy. J уе 2 dy=O. Отсюда МХ=а, так как 1 00 ..>’2 -4= [ е Tdy=l, х/2л -оо По формуле (2.2), используя ту же замену переменной, находим
Таким образом, для нормально распределенной величины X МХ=а, DT=o2. 2.2. Найти МТ и DT, если рх(х) определено в задаче 1.2. Ответ: МТ=3/2, DT=3/4. 2.3. Найти MX и DT случайной величины X, имеющей показательное распределение (1.7). Ответ: МТ=^, DT=-^. Л Л, 2.4. Плотность распределения рх(х) имеет вид: рх(х) — = С(х2+х+1), если 1, и рх(х)=0 в остальных случаях. Найти МТ и DT. Указание. Найти С из условия (1.5). „ 13 1AV 189 Ответ: МТ= —, DT=--------. 22 2420 2.5. Найти МТ и DT случайной величины Т, равномерно распределенной на отрезке [а, Ь] (см. (1.6)). Ответ: МТ= —, DT=^^. 2 12 § 3. Закон распределения функции от случайной величины Если случайная величина У=<р(Т), где Т—случайная величина с плотностью распределения рх (х), то функция распределения Y находится по формуле Fr(x) = p{y^x} = P{TeBx}== jpx(M)dw, (3.1) в, где в числовое множество Вх — {и:<р(и)^х} входят все решения и неравенства <p(w)^x. Случайная величина У может иметь любой тип распределения.
3.1. Найти плотность распределения случайной величины Y=AX+B, А^О, где X—случайная величина, распределенная нормально (см. (1.8)), с параметрами (а, о2). Решение. Пусть сначала А>0. Тогда FY (х) = Р {А Х+ В < х} = Р .х—Bl „ fx—B\ Х^----->=Fv ----- Л J \ A J и, следовательно, х-В 1 Г (ц-*)2 FY(x) =—— е 20 2 du. стх/2тг J — оо Производная этой функции существует при любом х. Дифференцируя равенство по х, получим Отсюда, используя формулу (1.8), найдем Если А<0, то fy(x)=p\x>^/]= 1 -р =1 -fJ—) ( А ) ( А ) \ A J и, следовательно, (х-Аа-ВУ / i 1 ~ 2AV pY (х) =---— е ’ (-А)^ Таким образом, случайная величина Y, являющаяся линейной функцией от нормально распределенной величины Y=AX+B, А^О, также распределена нормально; параметры Нормального распределения преобразуются по формулам: ai=Aa+B, c2 = J2o2. Если помнить, что Y распределено Нормально, то формулы для параметров помнить не нужно.
Эти параметры легко найти, используя свойства математического ожидания и дисперсии: fll =МУ= АМХ+В = Аа + В, о2 = ВУ=В(ЛУ)+ОВ==Л2ВХ=Л2о2. 3.2. Случайная величина X распределена нормально с параметрами а=1, с2 = 4. Найти Р{1,5< А"<3,0}. Решение. Событие {1,5 < X < 3,0} — У ——-< —-< ——-I. 1 ( о о о ) Согласно задаче 3.1, случайная величина У=(У— а)/а как линейная функция от X распределена нормально. Параметры ее нормального распределения ai = MY=^M(X-a) = Q, ст12=-^ВУ=1. а2 Таким образом, р {1,5 < х< 3,0}=р = 1 1 [ 2 2 2 J Последний интеграл выражается через функцию Фо (х) (см. (6.5) гл. 6), значения которой приведены в таблице 1: Р {1,5 < X< 3,0} = Фо (1) - Фо (0,25) = 0,3413 - 0,0987 = 0,2426. 3.3. Случайная величина X распределена нормально с параметрами а= — 1, с2==25. Найти: а) Р{ — 6<Х<6}; б) Р{-6<Х< -1}; в) Р{Х> - 1}. Ответ: а) 0,7605; б) 0,3413; в) 0,5000. 3.4. Случайная величина X распределена равномерно па отрезке [0, 1]. Найти плотность распределения случайной величины Y — 2Х +1. Указание. Выразить Fy(x) через Fx(x) и продифференцировать полученное равенство. См. решение задачи 3.1. Ответ: ру(х)=1 /2, если 1^х^3, и ру(х) = 0 в остальных случаях. 3.5. Случайная величина X равномерно распределена на отрезке [—1,1]. Найти плотность распределения случайной величины Y=X2. Указание. Событие {У<х} при 0<х<1 представляется в виде {У<х}={— у/х <Х<у/х}. Ответ: ру(х) = —, 0<х<1; ру(х) = 0 в остальных случаях. 2х/х 3.6. Случайная величина X имеет показательное распределение с параметром X = 1. Найти закон распределения дискретной величины У, определенной равенствами: У=1, если X > 1; У = — 1, если X < 1. Указание. Используйте соотношения Р{У=1}=Р{Х>1} = = Р{1<У<оо}, Р{У= -1}=Р{0<У<1}. Ответ: Р{У=1} = е~1, Р{У= - 1}= 1-е”1. 3.7. Случайная величина X равномерно распределена на отрезке [0, 1 ]. Найти плотность распределения случайной величины Y- — -ln(l — X). X Ответ: ру(х) = А.е“х* при х>0, и ру(х) = 0 при х<0. 3.8. Случайная величина X имеет непрерывную строго монотонную функцию распределения Fx(x). Найти закон распределения случайной величины Y=Fxl(X), где F/1— функция, обратная Fx(x): Ff1 (Fx(x))=x. Ответ: рх(х)=1. если 0^х^1. § 4. Математическое ожидание и дисперсия функции от случайной величины Если У=ф(У) и рх(х) — плотность распределения случайной величины X, то МУ и В У можно найти (не вычисляя плотность распределения /?у(х)) по формулам МУ=М<р(У)= J ф(х)рх(х)йх, (4.1) — со со ВУ=Вф(У) = J (ф(х)-МУ)2дх(х)йх, (4.2) или по формуле ВУ=МУ2-(МУ)2, в которой
МУ2 = J <p2(x)px(x)dx. (4.3) Моменты МУ"1 и центральные моменты М(У—МУ)"1 находятся по формулам МУт = J xmpx(x)dx, (4.4) М(У-МУ)т = J (х-МУ)трх(х)йх. (4.5) 4.1. Случайная величина X равномерно распределена на отрезке [0, 1 ]. Найти МУ3. Указание. Воспользоваться формулой (4.1) с <р(х) = х3 или формулой (4.4) с т = 3. Ответ: 1/4. 4.2. Плотность распределения случайной величины X определяется равенствами: рх(х) = 2х, если 0<х<1, и рх(х) = 0 в остальных случаях. Найти МУ5 и ВУ5. Ответ: МУ5 = 2/7; Dy5=l-f^ =—. 1 6 \7/ 294 4.3. Случайная величина У распределена нормально с параметрами а = 0, о2 = 1. Наити М|У|. Указание. Воспользоваться равенством О т в е г: ^/2/тс. 4.4. Случайная величина У распределена нормально с параметрами а = 0, о2 = 1. Найти МУ3, МУ4. Ответ: МУ3 = 0, МУ4 = 3.
ГЛАВА 12 ДВУМЕРНЫЕ ДИСКРЕТНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ § 1. Закон распределения двумерной дискретной случайной величины. Независимость Пусть случайная величина X может принимать лишь значения х1г х2, .... х„, а случайная величина Y—лишь значения у2, ут- Законом распределения случайного вектора (X, У) называется набор чисел Ptj^O, z=l,2, ..., п; j=\, 2, т; п т Е Е где = Закон распределения i=ij=i случайного вектора (У, У) удобно задавать таблицей: Г т \ 1’1 У2 Ут Xl Ри Pl2 Plm х2 Р21 Р22 Pirn •v„ Pnl Рп2 Рпт Зная двумерный закон распределения случайного вектора (X, У), можно найти одномерные законы распределения случайных величин X и У по формулам PfX-XiHA.-£ ру, z = l, 2, m; (1.1) j = i РФ (1.2) i= 1 Случайные величины X и У независимы, если для всех '=1, 2, ..., п; J= 1, 2, ..., т P{X=xt, Y^yj}^{X=xi}-P{Y=yj} (1.3) 5 - 8516 Ватутин 129
или, в терминах введённых выше величин, Pij=Pi--P-j- (1-4) Если равенство (1.3) нарушено хотя бы для одной пары то случайные величины X и Y называются зависимыми. Приведенные выше определения естественным образом переносятся на ^-мерные случайные величины. Определение независимости, например, совпадает с приведенным определением независимости в вероятностных моделях с конечным числом исходов (см. (1.6) гл. 5). 1.1. Закон распределения двумерного вектора (X, У) зада ется таблицей: -1 0 1 1/8 1/4 1/8 1/12 1/3 1/12 Найти закон распределения X и Р{У^0}. Решение. Используя исходные данные, находим Р{У=-2} = Р{Х=-2, У= — 1}+Р{У= —2, У=0} + + Р{Х=-2, У= 1} = 1/8 +1/4+1/8 = 1/2, Р{Х=2} = Р{У=2, У=-1} +Р{У=2, У=0} + +Р{У=2, У= 1} = 1/12+1/3 +1/12= 1/2. Таким образом, закон распределения X имеет вид: хк -1 2 P{X=xt} 1/2 1/2 Для получения ответа на вторую половину задачи заметим, что Р{У^0} = Р{У=0} + Р{У=1]. Аналогично вычислениям, проведённым для случайной величины X, получаем р{у=0}=Р{У=-2, У=0}+Р{Х=2, У=0} = 1/4+1/3 = 7/12, Р{У= 1}=Р{ЛГ= —2, У=1}+Р{У=2, У= 1} = 1/84-1/12 = 5/24, и, таким образом, Р{У^0} = 7/12 + 5/24= 19/24.
1.2. Закон распределения двумерного вектора (X, У) задается таблицей: 2 3 -1 2 1/6 О О 1/4 1/8 1/12 3/8 О Найти закон распределения X и Р{У<1}. Ответ: k -1 2 Р{Х=к} 13/24 11/24 Р 1} = 1/4. 1.3. В условиях задачи 1.1 найти закон распределения случайной величины Z = X+Y. Решение. Ясно, что случайная величина может принимать с положительной вероятностью лишь значения —3, —2, — 1, 1, 2, 3. Поскольку для любого целого к P{Z=k} = £ P{Z=k, Y=j} = j=-i = £ P{X+Y=k, Y=j}= £ P{X=k-j, Y=j], то, последовательно подставляя k= — 3, —2, — 1, 1, 2, 3, получаем P{Z=-3}= £ P{X=-3-j, Y=j} = P{X=-2, r=-l} + + P{Z=-3, Y=0} +P{X=-4, У—1} = P {.¥= — 2, У=-1} = 1/8, P{Z= — 2} = P{X= —1, У=-1}+P{Z=-2, У=0} + + P{Z=-3, У= 1} = P{X= —2, У=0} = 1/4 и т. д. Окончательные результаты вычислений собраны в таблице: -3 —2 -1 2 3 P{Z=k] 1/8 1/4 1/8 1/12 1/3 1/12 1.4. Закон распределения двумерного вектора (X, У) задайся равенствами Р{Х=к, Y=j}=pk(\-p)ye-\ к=0, 1, 2, ...; j = 0, 1, 2, ...,
где 0<р< 1, а Х>0. Найти законы распределения случайных величин X я Y. Решение. Для любого k = 0, 1, 2, ... имеем Р{Х=к}= X Р{*=к, Y=j} = j=o 00 IJ 00 > j = X р'с(1-р)-7ге-х=р'с(1-р)е-х X =рЩ-р), j = O J- j=QJ' 00 V поскольку £ — = ez. Аналогичные вычисления дают J = 07' p{y=/}= f /(1-Р)^е“Х = 7Ге-Х(1-Р) f / = 7Ге“Х- 1.5. В условиях задачи 1.2 найти закон распределения случайной величины Z = X+Y. Ответ: к -1 1 2 3 4 P{Z=fc} 1/6 1/4 1/8 1/12 3/8 1.6. В условиях задачи 1.1 найти закон распределения случайной величины Z = min{X, У}. Решение. Случайная величина Z с положительной вероятностью может принимать лишь значения —2, — 1, О, 1. При этом Р {Z= - 2} = Р {min {X, Y} = - 2} = Р {Х= - 2} = 1 /2, P{Z= — 1} = Р{min{X У}=-1} = = Р{К=—1, А>-1} = Р{У=-1, У=2} = 1/12, P{Z = 0} = P{y=0, У^0} = Р{Г=0, Х=2} = 1/3, P{Z=1} = P{K=1, X^1} = P{Y=1, Х=2} = 1/12. 1.7. В условиях задачи 1.1 найти закон распределения случайной величины Z=max [X, Y}. Ответ: к -1 о 1 2 P{Z = fc} 1/8 1/4 1/8 1/2
1.8. Закон распределения случайных величин X и Y задан таблицей; \ У х \ -1 0 2 -1 1/6 1/3 0 2 1/6 1/6 1/6 Найти законы распределения случайных величин Z, =max{Z, Y} и Z2 = max {1, Х+ У). Ответ: к -1 0 2 P{Zt = fc} 1/6 1/3 1/2 к 1 2 4 P{Z2=k} 2/3 1/6 1/6 1.9. В условиях задачи 1.1 найти законы распределения случайных величин Z2 = Y2, Z2 = X2+Y. Ответ: к 0 1 к 3 4 5 P{ZY=k} 7/12 5/12 P{Z2 = k} 5/24 7/12 5/24 1.10. Произведено 2м независимых подбрасываний правильной монеты. Пусть Х2п—количество испытаний, в которых выпал герб, а У2и— количество испытаний с чётным номером, в которых выпал герб. Найти совместный закон распределения случайных величин Х2п и Y2n. Решение. Ясно, что 0< У2„<У2н<2м. Поэтому вероятность Pij = P {X2„ — i, Y2„—j} равна нулю, если либо i<j, либо max {z, j} > 2п. Пусть теперь 0Д/ДД<2п. Представим случайную величину Х2п в виде суммы Х2п = Y2n + Z2n, где Z2„ — количество выпадений герба в испытаниях с нечётными номерами. Очевидно, что Aj = P{K2„ + Z2„ = z, У2„ =7} = Р {Z2„ = z—у, Y2„=j}. Поскольку подбрасывания монет независимы, то величины Z2„ и Y2„ независимы и, кроме того, законы распределения случайных величин Y2n и Z2„ совпадают с законом распределения случайной величины, равной числу успехов в п испытаниях по схеме Бернулли с вероятностью успеха р=1/2. Отсюда, с учётом формулы (2.1) гл. 6, получаем Рц = Р {Z2„ = z -/} Р {У2„ = /} = Р = /-/}• Р {У„ =./} =
= j^2n. 1.11. В условиях задачи 1.10 найти совместный закон распределения случайных величин Х2п и Т2п, где Т2п—количество испытаний с чётным номером, в которых выпала решетка. Указание: воспользоваться равенством Т2п = п—У2п. Ответ: P{X2n = i, T2n=j} = C/~(n~J) Cj —, если n^i+j,j^n. 1.12. Одновременно подбрасываются две игральные кости. Пусть Xt — количество очков, выпавших на z'-ой кости, а У=ХГ + Х2. Найти Р{У>9} и совместный закон распределения вектора (X2, У). Ответ: Р{У>9} = 1/6; P{Xr=j, Y=i} —1/36, если l<i-/<6, z = 2, 3, ..., И; У=1, 2, ..., 6. 1.13. В условиях задачи 1.12 найти закон распределения случайного вектора (У, Z), где Z = X1 — Х2. Зависимы дли нет случайные величины У и Z? Ответ: Р{У=г, Z=/} = 1 /36, если 2<z<12, —и величины и ~ принадлежат множеству {1, 2, 3, 4, 5, 6}. Случайные величины У и Z зависимы, поскольку 1/36 = Р{У=12, Z=0}#P{y=12} -Р{Z=0} = 1 /36 • 1/6. 1.14. В условиях задачи 1.12 вычислить Р{Х!>2, У>9}. Мы приведем два решения этой задачи. Первое решение. Для любых событий А и В справедливо соотношение Р{АВ} = Р{А + В} = 1-Р{А + В} = 1-Р{А}-Р{В} +Р{ЛВ} = = Р{В } — Р{А} +Р{ЛВ}. Пусть А = {Х1<2}, а 2?={У<9}. Тогда P{Zi^2, У>9}=Р{У>9} -P{Zi<2} +Р{АГ1<2, У<9}. Принимая во внимание результат задачи 1.14 и учитывая, что Р{А\<2, У<9}=Р{Х1 = 1, У<9}=Р{Х! = 1, Х2<8} = = Р{Х1 = 1} = Р{Х1<2}, получаем Р{Х!>2, У>9}=Р{У>9} -Р{А\<2} +Р{Хг<2} =
= Р{У>9} = 1/6. Второе решение. По формуле полной вероятности 1/6 = Р{У>9} = Р{^!^2, У>9}+Р{Х1<2, У>9} = = Р{Х1>2, Y>9} +Р{А\ = 1, У>9}=Р{Х1>2, У>9} + +Р{Х! = 1, Х2>8} = Р{Х1>2, У>9}. 1.15. В условиях задачи 1.12 вычислить Р{У<4}. Ответ: 1/6. 1.16. Игральная кость, грани которой занумерованы цифрами 1, 2, 3, 4, 5 и 6, подбрасывается 5 раз. Пусть —количество испытаний, в которых грань с номером i оказалась верхней. Найти совместный закон распределения случайных величин Х1 и Х2. Решение. Пусть pij = P{A'1 = z, X2=j}, i,j=0, 1, 2, ..., 5. Поскольку было произведено 5 опытов, то pi; = 0, если i+j>5. Обозначим Y = X3 + У4 + Х3 + Хь. Воспользовавшись при z+j<5 формулой (2.1) гл. 6, получаем Ра = Р {*1 = i, Х2 =j, Y= 5-i—j} = _ 5! _ 5! . -z!/!(5-z-j)! 6‘ 6> \6J “zly!(5-z-у)! 65 1.17. В условиях задачи 1.16 найти закон распределения случайного вектора (У15 Y2), где Y1 = X1+X2, а У2 = У3 + У4-1-+ У5. Ответ: 2’• "V PfK^z, Y2=j}=-~ <z+j<5. z'!j!(5-z-j)!’ 1.18. В условиях задачи 1.16 найти закон распределения случайного вектора (У^/), где Y1 = X1 + X2, a Y3 = X3 + X4 + + XS + X6. Ответ: V{Yv = i, У2=у} = СЦ-Н-) , если i+j=5. 1.19. В условиях задачи 1.16 найти закон распределения случайного вектора (У1; У4), где Y1 = X1+X2, Y4 = X2 + X3 + + Х4 + Х5 + Х6. Решение. Ясно, что Y1+Y4 = X1 + 2X2 + X3+X4 + Xs + X6 = 5 + X2. Поэтому (см. формулу (2.1) гл. 6) при 5<z+j<10, z<5,
Р{У1=/, Y2=j} = P{Y1 = i, Y2=j,5 + X2 = i+j} = = P{Z1 + X2 = i, Х2+Х3 +Х4 +X5 + X6=j, r2 = i+j-5} = = P{Xt = 5—j, X3 + X4 + X5 + X6 = 5-i, X2 = i+j-5} = 5! лу-</4\5-г /iy+7-5 (5-7)!(5-/)!(H-j-5)!^67 \б/ _ 5! 45-1 _(5-j)!(5-I)!(i+j-5)!'6r 1.20. В условиях задачи 1.16 найти закон распределения случайного вектора (Zx, Z2, Z3, Z4, Z5, Z6), где Z, = Xi+X6> z=l, 2, 3, 4, 5. Ответ: z= 1,2, 3,4, 5; X6=j} = P{Z,=7i, 5! (Л-j) ' (Л-j)! - Us-j) -V-' 1 б5’ если j2+j2 + ... +js = 5 + 5j и 1.21. Из урны, содержащей 5 красных, 2 белых и 1 чёрный шар, наудачу (с возвращением) вынимаются шары. Пусть Z—количество испытаний до появления черного шара, а X— количество испытаний среди первых Z, в которых появлялся красный шар. Найти закон распределения случайного вектора (Z, X). Решение. Пусть Y—количество испытаний (до появления чёрного шара), в которых появлялся белый шар. Ясно, что Y+X=Z. При т^п получаем P{Z=w, X=m} — P{Y=n—т, Х=т, Z=n} = = Р{У=л-ш, Х=т} = С„ 1.22. При проведении соревнований по парашютному спорту на точность приземления парашютист совершает п прыжков и с вероятностью р при каждом прыжке попадает в зачётную, зону (круг). Если парашютист попал в зачётную зону, то с вероятностью г расстояние от точки приземления до центра круга не превышает 1 м. Пусть Z—количество попаданий р зачётную зону после п прыжков, а X—количество приземлений, в которых расстояние от центра круга до точки приземления не превышает 1 м. Найти закон распределения случайного вектора (Z, X). Решение. При имеем P{Z=j, X=i}=P{Z=j} P{X=i\Z=j} = = Qp>(l-p)'I->-C/ri(l-r)>-i. § 2. Закон распределения функции от случайной величины Если случайные величины Х3 и Х2 дискретны и Y=tp(X1, Х2), где ф(х1,х2.)—некоторая функция, то Р{Г=У}= I P{Z1 = x1,Z2 = x2}, (2.1) (х,, x2):q>6„ x2)-y т. е. суммирование проводится по всем парам (х3, х2), для которых <р(хЛ, х2)=у. В частности, если ф(х2, х2) = х1 +х2, то P{Z=y}= £ Р{Х1 = х1,Х2^х2} = (х,, х2):х1+х2=>> = Е₽{Хг =х2, Х2=у —х2}, (2-2) Х1 где вторая сумма берётся по всем возможным значениям х1г для которых Р{У1 = х1}>0. Для независимых случайных величин формула (2.2) принимает вид P{Y=y}=YP{Xl=xl}P{X2=y-x2}^ =£P{Z1=y-x2}P{Z2 = x2}, (2.3) Х1 где суммирование ведётся по всем х2 (или х2), для которых Р{У1 = х1}>0 (Р{У2 = х2}>0). 2.1. Имеется набор из 4-х карточек, на которых написаны числа —1,0, 1,2. Игрок вытаскивает наудачу одну карточку, записывает число, которым помечена эта карточка, и возвращает карточку обратно. Затем повторяет упомянутую операцию ещё раз. Пусть Xi—число, записанное при i-м опыте (1=1, 2). 137
Найти законы распределения случайных величин Y=XkX2 и Z=Xk+X2. Решение. Ввиду (2.1) и независимости Хх и Х2 P{Y=y} = P{X1X2=y} = Z P{Xt=X1, Х2=х2} = (*1, Х2):Х2Х2=у = £ P{Z1 = X1}P{Z2 = X2} = £ (х„ x2):xlx2=y (*i> x2) x1x2 — y где А (у)—число пар (х15 х2), х,е{ — 1, 0, 1, 2}, для которых х1х2=у. Ясно, что А(у)^0 лишь для у= — 2, — 1, 0, 1, 2, 4. Кроме того, Л(-2) = 2, Я(-1)=2, Л(0) = 7, А (1) = 2, Я(2)=2, А (4) = 1. Отсюда получаем закон распределения случайной величины Y: У -2 -1 0 1 2 4 Р{У=т} 1/8 1/8 7/16 1/8 1/8 1/16 Для нахождения закона распределения случайной величины Z воспользуемся (2.2). Тогда P{Z=z}= X P{^1=x1}P{Z2 = z-x1}. (2.5) Xl+X2 = Z Ясно, что P{Z=z}>0 лишь для z= —2, —1, 0, 1, 2, 3, 4 и для этих значений P{Z=z}=±B(z), где B(z)—количество пар (х15 х2), х,-е{ —1, 0, 1, 2}, для которых х, + х2 = z. Проводя вычисления, получаем таблицу: Z -2-10 1 2 3 4 P{Z=z} 1/16 2/16 3/16 4/16 3/16 2/16 1/16 Z -1 0 1 2 3 P{Z=z) 1/6 1/6 2/6 1/6 1/6 2.3. Кости домино (28 штук) занумерованы упорядоченными парами чисел (i,j), i, je{0, 1, 2, 3, 4, 5, 6}. Из этого множества костей наудачу выбирается одна. Пусть Х1<2Х2 — пара чисел, соответствующая этой кости. Найти закон распределения случайных величин У1 = Х1+Х2 и Y2=X2 — X1. Ответ: у || 0 1 2 3 4 5 6 7 8 9 10 11 12 Р{П=т}||1/28 1/28 1/14 1/14 3/28 3/28 1/7 3/28 3/28 1/14 1/14 1/28 1/28 Т || 0 1 2 3 4 5 6 Р{У2=т}|| 1/4 3/14 5/28 1/7 3/28 1/14 1/28 2.4. Игральная кость подбрасывается к раз. Пусть Хь z=l,2, ..., к—число, появившееся на верхней грани кости при z-ом подбрасывании. Найти закон распределения случайной величины Yk = max{Xr, Хк}. Решение. Ясно, что для /=1,2, ..., 6 P{Yk=l} = P{Yk^l} -P{Yk<l-l}. Очевидно также, что {Yk^l} = {Xt^l при всех /= 1, 2, ..., к}. Поэтому Р{У*</} = Р{^/, Х2</, ..., Хк^1} или, с учётом независимости и одинаковой распределенности случайных величин Хк, Х2, ..., Хк, Р{Ук^1}=ПР{Х^1}=(Р{Х^1})к=^к. Следовательно, /-1,2,...,6. 2.2. Решить предыдущую задачу, предполагая, что взятые карточки обратно не возвращаются. Ответ: У -2 -1 0 2 Р{У=т} 1/6 1/6 3/6 1/6 2.5. В условиях задачи 2.4 найти закон случайной величины Zk = min {Хк, Х2, ..., Хк}. Указание: вычислить Р{Zk>I}. Ответ: распределения 2, ..., 6. P{Zk^l} = \- 1=\,
2.6. В условиях задачи 2.4 найти закон распределения случайной величины Т = max {4, Xt. Решение. Ясно, что Т может принимать лишь значения 4, 5, 6. Кроме того, {Т=4} = {Хг ^4}, в то время как {У=5} = {У1 = 5}, {Т=6} = {Х1 = 6}. Поэтому Р{Г=4} = Р{У1<4} = 4/6 = 2/3, р{Т--= 5} = Р(X, = 5} = 1/6, Р{Т=6} = Р{ЛГ1 = 6} = 1/6. 2.7. В условиях задачи 2.4 найти закон распределения случайной величины R = min {4, Х}}. Ответ: к || 1 2 3 4 Р{Л = А:}|| 1/6 1/6 1/6 1/2 2.8. В условиях задачи 2.4 найти закон случайной величины Т = max {9, + Х2}. Ответ: к || 9 10 11 12 1/12 1/18 1/36 2.9. В условиях задачи 2.4 найти закон случайной величины R = min {— 2, Х1~ Х-,}. Ответ: распределения распределения к || -5 -4 — 2 P{.R = fc}|| 1/3<Г 1/18 1/12 5/6 2.10. Законы распределения независимых случайных величий X и Y заданы таблицами к 1 2 3 P{2T=fc} 0,5 0,2 0,3 к II 0 1 2 Р{У = Д-}|| 0,2 0,3 0,5 Найти закон распределения случайной величины Z = max{Z, У}. Решение. Очевидно, что P{ZsSA;} = P{AX/t, Y^k,;=-P{X^k}P{Y^k}. В силу условий задачи случайная величина Z может принимать лишь значения 1,2,3. Ясно также, что P{Z^3} = 1 И P{Z^0} = 0, в то время как
P{Zs$l} = P{Xs$l}P{141} =0,5 0,5=0,25, P{Z^2} = P{A'<2}P{r<2}=0,7-1=0,7. Используя равенство P{Z=k} = P{Z^k} -P{Z^k-l}, находим p{Z=l}=0,25, P{Z=2} = P{Z^2} — Р {Z^ 1} = 0,7 —0,25 = 0,45, P{Z=3}=P{Z^3} -P{Zsj2} = 1-0,7 = 0,3. Ответ: P{Z = z} 0,25 0,45 3 0,3 z 1 2 2.11. В условиях задачи 2.10 найти закон распределения случайной величины Т = min {X, Y}. Указание. Воспользоваться равенствами P{T^k} = P{X^k}P{Y^k}, P{T=k}=P{T^k] -P{T^k+l}. Ответ: fc II 0 1 2 Р{Т=£}|| 0,2 0^55 0^25 2.12. В условиях задачи 2.10 найти закон распределения случайной величины W=X+Y. Решение. Ясно, что случайная величина W может принимать лишь значения 1, 2, 3, 4, 5. Используя (2.2) и независимость X и Y, находим P{^=w}= X P{2f=x}P{K=w-x}. х:Р{Т=х}>0 Поэтому P{^=l} = P.{Z=l}P{y=0} +Р {Х=2} Р{У= - 1} + +Р{Х=3}Р{У=-2}=Р{Х=1}Р{Г=0} = 0,5-0,2=0,1. Производя подсчёты для оставшихся значений, получаем II 1 2 3 4 5 Р{И/=А:}|| 0,1 0Д9 0^7 0J9 0Д5
2.13. В условиях задачи 2.10 найти закон распределения случайной величины V= X— Y. Ответ: А: | —1 0 1 2 3 Р{Г=А}| 0,25 0^25 031 ОДЗ 0Д6 2.14. Случайные величины Х2 и Х2 независимы и имеют распределение Пуассона с параметрами Zj и л, соответственно. Найти закон распределения случайной величины Х=Х1+Х2. Указание. Воспользоваться соотношениями (2.3) и равенством т 1 к ут-к 1 У ^•Д__ = ±(Х1+Х2)т. 1^ок1 (m-к)'. 1 27 Ответ: Р{Х= т] =—е-х, где Х = Х1 + Х2. § 3. Математическое ожидание и дисперсия функции от случайной величины. Ковариация Пусть Х1 и Х2— дискретные случайные величины и Y=(p(X1,X2). Тогда МУ= X ^xJP^x^X^xJ, (3.1) х15 х2 где суммирование ведется по всем возможным наборам х2, х2. Для вычисления дисперсии случайной величины Y используются соотношения DT= X (ф(х1,х2)-МУ)2Р{У1=х1) Х2 = х2} х15 х2 или DK= X Ф2(х15 х2)Р{Х2=х2, Х2 = х2] - (МУ)2. (3.2) х19 х2 Ковариация covfXj, Х2) случайных величин Х2 и Х2 вычисляется по формулам covpf,, У2) = £ (х1х2-МХ1-МХ2)2Р{Х1=х1,У2 = х2},
cov(X1; Х2) = МХ1Х2-МХ1 -МХ2, (3.3) где МХ1Х2 = X х1х2Р{Х1=х1,Х2 = х2}. xt, х2 Отметим, что для математического ожидания и дисперсии сохраняются свойства, сформулированные в гл. 5 (§ 2 и § 3). Ковариация является линейной функцией по каждому из своих аргументов: соч(Хг + Х2, X3) = cov(X1, Х3) + cov(X2, Х3), (3-4) cov(X15 X2+X3) = cov(X1, X2) + cov(X1, X3), кроме того, con(Xx, X2) — con{X2, X^). В случае, когда Y=Xr + X2, выполнено равенство DK=D(X1+X2) = DX1+DX2+2cov(X1, Х2\ (3.5) 3.1. Закон распределения случайных величин X и Y задан таблицей. Найти MXtX2, cov(X1, Х2), D(X1+X2). \ Х2 -1 0 1 — 2 0,2 о,1 0,2 1 0,1 0,2 0,2 Решение. По формуле (3.1) МХ1Х2 = (-2)(-1)-Р {Х, = -2, Х2= —1} + + ( —2)-0-Р{Х1= —2, Х2 = 0} + ( —2) • 1 • Р {А\ = —2, Х2 = 1} + + 1-(-1)-Р{Х1 = 1, Х2=-1}+1-0-Р{Х1 = 1, Х2 = 0} + + 1 -1 -Р{A'j = 1, Х2 = 1} = 2-0,2+0-0,1-2-0,2-1 -0,1 + + 00,2 + 1 -0,2 = 0,1. Для вычисления cov(X1;X2) необходимо, прежде всего, определить значения величин МХ3 и МХ2. Из таблицы находим законы распределения случайных величин Xt и Х2 (см. (1.1) и (1-2)): k Р{Х = ^} — 2 1 0,5 0,5 k Р{Х2 = к} -1 0,3 0 1 0,3 0,4
Отсюда МУ1=(-2)Р{У1 = -2} +1 •Р{У1 = 1}=-0,5; МУ2 = (-1)-Р{У2=-1} +0-Р{У2 = 0} +1 -Р{Х2=1} = 0,1. С учетом предыдущих вычислений получаем cov(Xls Х2) = МХ1Х2-МХ1 -МХ2 = 0,1 - (—0,5)-0,1 =0,15. Для вычисления В(Х1 + Х2) обратимся к формуле (3.5), в которой пока неизвестными для нас остаются величины DXj = МУ 2 - (МА\)2, DT2 = МТ22 - (МХ2)2. Используя законы распределения случайных величин Х2 и Х2, находим МЛ'12 = (-2)2-Р{А'1 = —2} + 12-Р{У1 = 1} = 2,5; МУ2=(—1)2Р{Х, = -1} + 02-Р{Х2 = 0} +12 • Р {Х2 = 1} = 0,7. Таким образом, ОУ1=2,5- (-0,5)2 = 2,25; Dy2 = 0,7- (0,1)2 = 0,69. Для завершения решения задачи обратимся к (3.5): О(У1+У2) = ОУ1 + 2соу(У1, Х2)+ПХ2 = = 2,25 + 2-0,15 + 0,69 = 3,24. 3.2. Закон распределения случайных величин Х2 и Х2 задан таблицей. Найти МХ1Х2, cov (Х1, Х2 ), D (Xt + Х2 ). А,1'Г.2 -1 3 0 1/3 1/6 2 1/4 1/4 Ответ: 1, 1/3, 50/9. 3.3. Правильная шестигранная кость подбрасывается 10 раз. Пусть Xt — количество опытов, в которых на верхней грани кости появилось число /. Найти Решение. Воспользуемся методом индикаторов и представим случайные величины Хг и Х2 в виде суммы случайных величин =Xi + Хг+ ••• +Хю’ Х2 = 1 j + 72+ ... + Т10,
где случайная величина Xj(Tp равна единице, если в у-м испытании выпала грань с цифрой 1 (2), и равна нулю в остальных случаях. Тогда (10 \ / 10 \ 10 10 LxJ L т; =М£ £хЛ= j — 1 / \ к — 1 / j = 1 к = 1 10 10 -И мх,г,. ;=1к=1 Если J^k, то случайные величины х;- и Тк независимы. Поэтому мх. тк=mZj- • м Тк=1 / 6 • 1 / 6=1 / 36. Если же j—к, то случайная величина XjTk всегда равна нулю, так как одновременно 1 и 2 выпасть не могут. Следовательно, MXjT =O. Таким образом, 10 10 МХ,Х2=^М^Тк=^ X 1/36 = 90• 1/36 = 21/2. j^k j~ 1 к~ 1 fc/j 3.4. В условиях предыдущей задачи обозначим через Yt количество опытов, в которых на верхней грани появилось нечётное число, а У2— количество опытов, в которых на верхней грани появилась либо цифра 2, либо цифра 4. Найти соу(У15 Y2). Указание. Представить величины Yk и У2 в виДе суммы индикаторов и воспользоваться тем фактом, что cov(A'+Z, Т) = = cov(X, Т) + cov(Z, Т). Ответ: 15. 3.5. Совместный закон распределения случайных величин Х2 и Х2 задан таблицей. Найти математическое ожидание и дисперсию случайной величины y=min {Хг, Х2}. 1 2 1/8 3/8 1/4 1/4 Решение. По формуле (3.1). My=min{0, 1}-Р{А\ = 0, Г2 = 1} +min{0, 2} • Р{Хк = О, Х2 = 2] + + min{3, 1}-P{Xj = 3, X2 = l} + min{3, 2}-Р{Хк = 3, Х> = 2} = = 0-1/8 + 0 -3/8 + 1 -1/4 + 2 -1/4=3/4.
Аналогично, МГ2 = 02-1/8 + 02 • 3/8 +12 1/4+22 • 1/4 = 5/4. Отсюда DT=5/4 — (3/4)2 = 11/16. 3.6. В условиях задачи 3.2 найти математическое ожидание и дисперсию случайной величины У=тах{Хг, Х2}. Ответ: МУ=13/4, DK=111/16. 3.7. В условиях задачи 3.5 найти математическое ожидание и дисперсию случайной величины Z=max {Хг, Х2}. Ответ: MZ=23/8, DZ=31/64. 3.8. В условиях задачи 3.5 найти М112(2+12). Ответ: 153/4. 3.9. В условиях задачи 3.5 найти соу(А\ — Х2, Xt + X2). Указание. Воспользуйтесь равенством cov— Х2, Х1 + Х2) = DA\ — DZ2. Ответ: 2х/64. 3.10. Случайные величины Х± и Х2 независимы и распределены по закону Пуассона с параметрами и Х2 соответственно. Найти производящую функцию <px(z) = Mzx случайной величины Х= Хг + Х2. Указание. Воспользоваться независимостью случайных величин zXl и z*2, а также решением задачи 5.3 гл. 10. Ответ: (px(z) = e(X1+X2)(z-1). 3.11. Найти закон распределения случайной величины X, для которой найдена производящая функция в задаче 3.10. Задачи 3.10 и 3.11 дают другой способ решения задачи 2.14. Указание. Вероятности Р{А=и} являются коэффициентами разложения <px(z) в ряд Тейлора в окрестности точки z = 0 (см. (5.2) гл. 10). Ответ: Р{А=и} = ^е-х, где Х = Х1+Х2. § 4. Условные распределения случайной величины. Условное математическое ожидание Пусть X и Y—две дискретные случайные величины. Условная вероятность события {У=у;} при условии, что произошло событие X=Xi, задается соотношением
P{Y=yj\X=Xi} = P{Y=yj, Х=Х1} (4.1) Вероятность (4.1) определяется лишь в случае P{A'=xi}>0. Условное математическое ожидание Y при условии X=Xi задается формулой М[У|У-^ = £у;Р{У=у;|У=х;} = j P{A'=xi} (4.2) Наряду с (4.1) и (4.2) можно рассматривать более общие величины: условную вероятность события {У=у/} при условии Хе В, где В—некоторое подмножество возможных значений Х(Р(В)>0): Р{Г=У;| ХеВ} = P{Y=yj, Хе В} Р{ХеВ} (4.3) и условное математическое ожидание Y при условии Хе В М[Г|ГеД]-^Р1^^ j Г ЬВ ] (4.4) при этом Р{У6В}=£Р{У=х;}, х^В (4.5) P{Y=yj, ХеВ} = у P{Y=yj, X=Xi}, (4.6) xtsB где суммирование проводится по всем х,, которые лежат в В. 4.1. Совместное распределение случайных величин X и У задано таблицей: Y X -1 0 1 1 1/6 1/4 1/6 2 1/8 1/6 1/8 Найти Р{У= 1 |Х= 1}, М[У|Х= 1], М[У| У^О], Р{У=1| У^О}.
Решение. Поскольку Р{У=1} = Р{У=1, У=-1} +Р{У=1, У=0} +Р{У=1, У=1} = = 1/6+1/4+1/6 = 7/12 и Р{Х=1, У=1} = 1/6, то (см. (4.1)) p{y=i |y=i} = pj2L_ULJI=_1ZL=2/7. 1 ’ Р{А"=1} 7/12 1 Далее, М[У|У=1] = =р7^в’^-1)р{у=“1’Х==1Н°-р{у=0, Х=1} + г 1Л “ ч + 1-P{y=i, X=1}]=J_[(-1). 1/6+0-1/4+1 -1/б]=о. ; Вновь обращаясь к исходным данным задачи, получаем закон распределения Y: к 0 \ P{Y=k} 7/24 5/12 7/24 Поэтому Р{У^0} = Р{У=-1} +Р{У=0} = 7/24 + 5/12= 17/24. Отсюда и из (4.3) (с точностью до обозначений) p{y=i । y^o}=p{jr;1-1l<o} = 1 1 ’ P{y=S0} = н|^ -р7я| Г=-Ч +р(-г-1.5-=0!]= =i2s'11/6+1'41_10/17- Для нахождения М[У|У^0] заметим, что Р{Х=2, У^0} = Р{Х=2, У=-1}+Р{^=2, У=0} = = 1/8 + 1/6 = 7/24.
Обращаясь к (4.4) (вновь с точностью до замены X на Y), находим М[Х| У^0] = 1 РрГ=1, Ks=0} Р{Х=2, Г^О} P{Ks=0} h P{Ks=0} .рю/п+г-^-!7/,,. 4.2. Совместный закон распределения случайных величин X и Y задан таблицей: -1 1 1/3 0 1/8 1/4 1/6 1/8 О 1 2 Найти Р{Х=-1|У=2}; Р{У= -11 Y^ 1}; М [Х| У= 1 ]; М [У| 1 ]. Ответ: Р {Х= - 11 У=2} = 1/2; Р {Х= - 11 Y^ 1} =3/10; М[Х|У=1] = 1; М [Х| У>1] = 2/5. 4.3. Случайные величины X и Y независимы, причем Р{Х=1} = р{у=1}=р, Р{Х=0} = Р{У=0} = 1-а Найти М[ХУ|Х=1]; М[Х+У|Х=0]; М [Х| Х+ У= 1 ]. Ответ: р; р; 1/2. 4.4. Случайные величины X и Y независимы и одинаково распределены. Найти М[Х|Х+У=г], если Р{У+У=г}>0. Решение. В силу симметрии M[X|X+r=z] = M[r|X+r=z]. (4.7) В то же время м[у+ пу+ г=г]=п^.-+л)|,(т~;у7/,.у>"г>= -------- У Р{Х=хь Y=yj} = z-P{X+Y~z] = z, (4.8) >{X+Y=z}.. ь 1 ” P{X+Y=z} ’ * ’ Xi+yj-z 4 f M[Y+ ПЛ-+ = +
у P{X=xi; Y=yj, X+Y=z}_y P{X=xt, X+Y=z} + f^.yi P{X+Y=z} ~Lxi P{x+Y=z} + YylPi^‘\^r"'l = M[X\X+Y^-]+M[T\X+Y=2-]. (4.9) j (A-+-Z — Z] Объединяя (4.7) — (4.9), получаем M[X|X+F=z] = z/2. 4.5. Пусть случайные величины X и Y независимы, одинаково распределены, причем Р{У=£} = Р{У=£}=^е"\ Х>0, £ = 0,1,.... Найти P{X=j\X+Y=n}, М[Х|Х+У=и]. Указание. Воспользоваться равенством Р{Х+У=и} = = 2^-е”21 (см. задачи 3.10 и 3.11). и! Ответ: j = 0, 1, ..., п; и/2. 4.6. Пусть случайные величины X и У независимы, причем Р{Х=£}=^е^, Р{У=£} = ^е-Ч Найти Р {X=j\X+Y-=n}, М[Х|X+Y=n], Указание. Воспользоваться равенством P{X+Y=n} = _(^1+^)"е-Х, -X, п! 4.7. Случайные величины X и У независимы, причем р <Х=к} = Р {Y=k}=pqk~1, Q<p<l, q=l—p, £=1,2,.... Найти P{X=j\X+Y=n}, P{X—j\X=Y}. Ответ: 1/(и —1); (1 -q2')q2{j1', j = 1, 2, .... 4.8. Из урны, содержащей 2 чёрных, 4 красных и 2 белых шара вытаскиваются (с возвращением) по одному п раз шары. Пусть X—количество чёрных, а У—количество красных шаров, появившихся в этих опытах. Найти Р {X=k\X+Y=z}. Ответ: С’/(1/3)к(2/3)2£=0, 1, ..., z.
ГЛАВА 13 ДВУМЕРНЫЕ АБСОЛЮТНО НЕПРЕРЫВНЫЕ СЛУЧАЙНЫЕ ВЕЛИЧИНЫ § 1. Двумерные плотности распределения. Независимость Функция Рх,г(х,у) называется двумерной плотностью (или совместной плотностью) распределения вероятностей случайных величин X и Y, если Р{(Х X)eB} = ffpx,y(x,y)dxdb (1.1) в где В—любое подмножество на плоскости, для которого левая часть (1.1) определена. Двумерная плотность распределения удовлетворяет условию + со + со f f Px.y(x, y)dxdy=l. (1.2) - СО - со Таким образом, зная совместную плотность, по формуле (1.1) можно для любого множества В на плоскости вычислить вероятность того, что случайная точка (X, Y) попадет в это множество. В частности, если В = {(х, у): а1^х<Ь1, а2^у<Ь2}, то Р{(Х, Y)eB} = P{a1^X<b1, a2^Y<b2} = $ fPx.r(x, y)dxdy. al a2 (1-3) Двумерная величина, имеющая плотность распределения, называется абсолютно непрерывной, а соответствующее ей распределение — абсолютно непрерывным распределением. Если вектор (X, Y) имеет абсолютно непрерывное распределение, то Рa2^Y^b2} = P{al<X<bl, a2<Y<b2} (1.4)
и значение как левой, так и правой частей этого равенства совпадает со значением правой части (1.3). Зная совместную плотность распределения г (х, у), можно найти рх(х) и ру(у'), используя соотношения рх(х)= f Рх,х(х, y)dy, pY(y)= f px,Y(x,y)dx. (1.5) — со — со Многие прикладные задачи формулируются в терминах случайных величин. В этом случае для ответа на поставленные вопросы как правило достаточно знать вероятности любых событий, выражающихся через упомянутые случайные величины. Указанные вероятности весьма удобно задавать при помощи (1.1), особенно тогда, когда плотность, входящая в (1.1), либо проста по своему виду, либо хорошо изучена. Приведем два часто встречающихся распределения, задаваемых плотностью совместного распределения. 1°. Равномерное распределение на множестве В: / \ если (х,у)еВ, Px.Y(x,y)=<W (16) 10, если (х, у) ф В. Здесь |5| — площадь множества В. 2°. Двумерное нормальное распределение: *ехр Ь + <' -7) Случайные величины X и Y называются независимыми, если для любых подмножеств В1,В2<^ (— оо, +оо) P{XeBi, Ye В2}=РР {XeBr}P {Ye В2}. (1.8) Аналогично определяется независимость «-мерных случайных величин (см. определение (5.4) гл. 8, сохраняющееся и в общем случае). Если случайные величины X, Y независимы, имеют плотности Рх(х) и (у) и совместную плотность Рх,х(х,у), то определение (1.8) эквивалентно следующему: Рх,у(х’ У)=Рх(х)рг(у) (1.9) в каждой точке, являющейся точкой непрерывности всех участвующих в (1.9) функций.
1.1. Случайная точка (X, Y) равномерно распределена в квадрате В = {0^х^4, 0^у^4}. Найти рхг(х, у), Fx(x), Р{-2<Х<2, 1 < У<3}. Решение. Поскольку площадь квадрата В равна 16, то , . I 1/16, если (х,у)еВ, = если Далее, 2 3 Р{ — 2<Х<2, 1 < У<3} = f r(x, y)dxdy = — 2 1 2 3 2 3 = J ]Px,y(x, y)dxdy = J J l/16dxdy 0 1 0 1 (в предпоследнем переходе было использовано равенство Рх, г (х, у) = 0, х < 0). Отсюда 2 з Р{-2<Х<2. 1 < У<3} = 1/16 fdxfdy= 1/4. о 1 Для вычисления Fx(x~) заметим, что Fx(x) = P{X^x}=0, если х^О. Если же х>0, то Гх(х) = Р{Х<х} = Р{Х<х, -оо<У< + оо} = х + со х + со = f f рх, y(w, v)dwdv= f du j Px,y(u, u)du = — co—co —co —co x 4 x 4 = f dujpY Y(u, v)dv = fdwfpx,y(u, u)du = — co 0 0 0 хл4 4 = f dwfpx y(w, v) du, о о где x л 4 = min {x, 4}. Но в области {0<и<хл4, 0<f<4}, Px, y (w, v) = 1 /16. Отсюда хл4 4 Fx(x) = 1 /16 J d«fdu=l/4(xA 4), x>0. о 0 1.2. Из квадрата размером 6x6 с центром в начале Координат и со сторонами, параллельными координатным осям х и у, вырезан квадрат размером 2x2 с центром
в начале координат и со сторонами, параллельными координатным осям. В указанную область наудачу брошена точка. Пусть (X, F)—координаты этой точки. Найти Px,v{x,y), рх(х), рг(у). Зависимы или нет случайные величины X и У? Решение. Очевидно, что площадь рассматриваемой фигуры В (см. рис. 9) равна 62 —22 = 32. Поэтому Г1/32, если (х, у)еВ-, 10, если (х, у) <£В. Так же, как и при решении задачи 1.1, получаем + со 3 Рх (х) = f Рх, Y(х, у) dy = f Рх у (х, у) dy. — со — 3 Если хф [ — 3, 3], то подынтегральная функция рх, у(х, у) равна нулю и, следовательно, в этом случае рх(х) = 0. Рассмотрим теперь отдельно случаи — З^х^ —1, — 1<х<1, 1^х^3. В первом и третьем случаях при — 3 <у С 3 плотность рх у (х, у) = = 1/32. А значит з рх(х)= f 1/32 dy = 6/32 = 3 /16, хе[-3, -l]U[h 3]. -з Если же — 1<х<1, то рх у(х, у)= 1/32 лишь при — З^у^—1 и 1<у^3, а в остальных случаях совместная плотность равна нулю. Поэтому 3 - 1 1 Рх(х)= f Px,y(x, y)dy= f Pxy(x, y)dy+ f px. y (x, y) dy + -3 -3 -1 3 -1 3 + fPx.y(^y)dy= f l/32dy + 0+ f 1/32 dy = 2/32 4-0 4-2/32 = I/8. 1 -3 1
g силу симметрии О, если —3, 3]; Рг(у)=т 3/16, если уе[—3, — 1](J[1, 3]; 1 /8, если уе(— 1, 1). Покажем, что случайные величины X и Y зависимы. В самом деле, пусть Вг = { — 1<х<1}, В2 = {— Тогда вероятность Р{ТеВ1, YeB2} есть вероятность попадания случайной точки внутрь квадрата — l^x^l, — l^y^l. Из рис. 9 ясно, что поскольку плотность рх у (х, у) равна нулю в этом квадрате, то указанная вероятность равна нулю. С другой стороны, Р{ХеВ1} = } px(x)dx= f l/8dx = 1/4, -1 -1 и в силу симметрии Р{УеВ2} = 1/4. Таким образом, Р{ХеВг, УеВ2} = 0^Р{ХеВ1}Р{УеВ2} = 1/4- I/4. Ввиду определения (1.8) случайные величины X и Y зависимы. 1.3. Случайная точка (X, У) равномерно распределена внутри круга радиуса R с центром в точке (0, 0). Найти рх(х) и Рх,г(х,у). Ответ: С 1 ---2’ еСЛИ Px,y(x, у)=^ ** I 0, если x2+y2^R2; x2+y2>R2. Рх(х)= если если |х|>R. 1.4. Из круга радиуса R с центром в начале координат вырезан круг радиуса г (центры кругов совпадают). В полученную область наудачу брошена точка. Пусть (X, У) — её Координаты. Найти Рх(х). Зависимы или нет случайные величины X и У?
Ответ: 2(y/R2 — x2 — у/г2 — х2) п(Р2 — г2) 2у/Я2-х2 л(Л2-г2)’ если |х|<г; если г<|х|<Л; если |х|>Л. Случайные величины X и Y зависимы. Указание. Использовать идеи решения задачи 1.2. 1.5. Совместная плотность распределения случайных в< чин X и Y имеет вид . . f с(х4-у), О^х^б, О^у^б; Рх y(x, У) = '\ ' ’ ' ’ ( 0, в остальных случаях. Найти с, Рх(х), Р{У>2}. Решение. Ввиду (1.2) + 00 + 00 1= f f Px,y(x, y)dxdy = — 00 — 00 6 6 6 6 = f f Px, y (x, y) dx dy = c f f (x+y) dx dy= 0 0 0 0 6 6 6 6 = cjxdx-jdy4-cfdxjydy = о о oo = c-18-6 + C-6-18 = 216c. Отсюда c= 1/216. Далее, + 00 6 Px(x)= f Px.y(x, y)dy=$px>Y(x, y)dy. — oo 0 Ясно, что px(x) = Q, если хф [0, 6]. Если же хе [0, 6], то б Рх(х) = с$ (x+y)dy = c(6x+18) = (6x4- 18)/216=(х4-3)/36. о Отсюда 6 6 Р{У>2} = Рх (х) dx = j рх (х) dx=j (х 4- 3) dx = 2 2 2
1 /б2 —42 36 \ 2 + 3-4 =11/18. Ответ: с=1/216; Р{Т>2} = 11/18; , . J (х+3)/36, если хе [0, 61; ft 1 Л I 0 , в остальных случаях. 1.6. Совместная плотность распределения случайных величин X и Y имеет вид . . (с(х2+у2), если 0^х^2, 0<у^2; Рх, у) = л п ( 0 , в остальных случаях. Найти с, рг(у), Р{У>1}. Ответ: с=3/32; Р{У> 1} = 11/16; , ._Jl/4+3/16y2, если0^у^2; /’г v) | 0 , если у ^[0,2]. 1.7. Совместная плотность распределения случайных величин X и Y имеет вид . . (3(х+у)/8, если ^2, х>0, у>0; Рх,у(х, у) — < [ 0 , в остальных случаях. Найти рх(х), Р{1/2^У<1, У<1}. Решение. На рис. 10 заштриховано множество, в котором Рх y(x, у)>0. Ясно, что рх(х) = 0, если хф [0, 2]. Если же хе [0, 2], то - J о 2-х О Для вычисления вероятности Р{1/2^У<1, У< 1} воспользуемся равенством (1.3), согласно которому Р{1/2^У<1, У<1}=Р{1/2<У<1, —оо<У<1} =
Рх,у(х> у) = 1.8. Совместная плотность распределения случайных величин X и Y имеет вид 2Ххе~1у, если О^х^ 1, у>0; О , в остальных случаях. Зависимы или нет случайные величины X и У? Решение. Найдем сначала рх(х) и рг(у). Имеем Рх (*) = f Рх, х(х, у) dy = f px, у(х, у) dy, — со О так как подынтегральная функция равна нулю при у<0 для всех х. Если х£ [О, 1 ], то, очевидно, px(x) = Q. Если же хе [0, 1 ], то рх(х)= f 2Xxe-k,,dy = 2x. (1.10) о Аналогично предыдущему получаем, что />у(у) = 0, если у<0. Если же у^О, то 1 (у) = j 2х/.e~udy = Ле~ь. (1.П) о
Заметим, наконец, что рх Y(x, y)=px(x')-pY(y') при всех х и у. В самом деле, если либо хф [0, 1], либо у<0, то как левая, так и правая части последнего равенства равны нулю. Если же и у^О, то ввиду (1.10) и (1.11) упомянутое равенство также справедливо. Таким образом, случайные величины X и Y независимы. 1.9. Совместная плотность распределения случайных величин X и Y имеет вид f—}=e~x2l2e~y, если у^О; Px.y(x, у) = < 72л I 0 , если у<0. Зависимы или нет случайные величины X и У? Указание. Воспользоваться (1.9) и тем, что функция <р(х) = —5=е”*2/2 является плотностью стандартного нормаль-72л 4- GO ного распределения и, следовательно, f cp(x)dx=l. Ответ: независимы. 1.10. Совместная плотность распределения случайных величин X и Y имеет вид Px,y(x, у) = 1е-(х2+у^'2. Найти Рх(х). Зависимы или нет случайные величины X и У? Указание. Воспользоваться указанием к предыдущей задаче. Ответ: ру(х) = —^=е~х2'2; независимы. у2л 1.11. Совместная плотность распределения случайных величин X и У имеет вид Рх у(х, у) =----е 2^а‘ а2Л 2тоТ1СТ2 Найти Рх(х). Зависимы или нет случайные величины X и У? Указание. При вычислении интеграла использовать замену 2=у/о2 и указание к задаче 1.9. _ X2 Ответ: рх(х) =-----— е 2ст*; независимы. Ст] 72л
1.12. Совместная плотность случайных величин X и Y имеет вид ^,4^J’) = r4=^e“2(1-p2)<X2’W+/) 2я71-р2 Найти рх(х), ру(у). Зависимы или нет случайные величины X и У? Указание. Воспользоваться равенством х2 — 2рху+у2~ = (1-р2)х2 + (у-рх)2, заменой z = y —рх и указанием к задаче 1.9, а также симметрией рх Y (х, у) относительно аргументов, Ответ: px(x) = -L:e12 2: pY(y) = ~^=e~y2/2; независимы, ее* 2тс у 2л ли р = 0, и зависимы, если 0 < | р | < 1. 1.13. Совместная плотность распределения случайных величин X и Y имеет вид Найти рх(х). Указание. Воспользоваться равенством СТ2 и заменой z=y — р — х. ^1 Ответ: Рх(х) =----— е ст । л/2л § 2. Закон распределения функции от случайных величин Пусть рх у(х, у) — совместная плотность распределения случайных величин X и Y, a Z=tp(X, У), где ср(х, у) — «хорошая» функция, т. е. такая, что Z также является случайной величиной (более подробно см. [6]). Функция распределения случайной величины Z находится по формуле fz(z)=p;z<z} = p{<p(x у)о} = = Р{(Х, Y)eBz}=^Px,y(x, y)dxdy, (2.0 где Bz = {(x, у): ср(х, y)^z}. В случае Z=cp(X, Y) = X+Y формула (2.1) принимает вид + 00 Z — X Fz(z) = P{X+ Y^z} = f dx f Px.y(x, y)dy= — oo — co = f dy f Px,y(x, y)dx. (2.2) — 00 — 00 Плотность случайной величины Z=X+Y вычисляется по формуле Pz(?)= f Px,y(x, z—x)dx = f pXY[z-y, y)dy. (2.3) “CO - 00 Если случайные величины X и У независимы и имеют плотности ру(х) и ру (у), то Px + r(z)= f рх(х)ру(z—x)dx= f px(z-y)pr(y)dy. (2.4) “CO - 00 2.1. Совместная плотность распределения случайных величин X и У имеет вид , \ (х+у, если 0<х<1, 0<у<1; Рхг\х,у] = < ( 0 , в остальных случаях. Найти функцию распределения случайной величины ?=тах{Х У}. Решение. В данном случае ср (х, у) = max {х, у} и, следовательно, Bz = {(x, у): max{x, y}^z} = {(x, у): x^z, y^z}. Отсюда, используя формулу (2.1), находим Fz(z) = P{Z<z} = J J ру у(х, y)dxdy. (2.5) — 00 — 00 Из определения случайной величины Z и условий задачи следует, что Fz(z) = 0, если z^O, и Fz(z)=l, если z>l. Рассмотрим значения ze(0, 1]. Преобразуя (2.5), получим 6-8516 Ватутин 161
Z z =z3. о рассмотрим, наконец, случай ze [О, 1]. Тогда 3 о Ответ: Рх, Y 2.2. вид {0, если z^O; z3, если ze(0, 1]; 1 , если z> 1. Совместная плотность случайных величин X и Y имеет Z Z Отсюда окончательно получаем Рх, У 0 , в остальных случаях. Найти Z=min{X У}. Ответ: функцию распределения случайной величины О, если z^O; 1 — (1 —z)2(l+z), если ze(0, 1]; 1, если z > 1. О, если Fz(z)=< 1-y^(3-z)(6-z)(9 + 2z), если ze(0, 3]; 2.4. Совместная плотность распределения случайных величин У и Y имеет вид 1, если 2.3. В условиях задачи 2.1 найти функцию распределения случайной величины Z=min{X Y}. Решение. Имеем Px,y{x, у) = в остальных случаях. (2.6) Найти px + Y(z). Решение. По формуле (2.3), с учётом условий находим задачи, и, следовательно, для нахождения Fz(z) необходимо вычислить вероятность P{X>z, Y>z}. По формуле (1.3) Z Z Ясно, что P(z) = 0, если z>l, поскольку pXY(x, у)=0, есЛ?; тах{х, >'}>1. По тем же соображениям P(z)=l, если z<0, так как в этом случае f f Px.y(x, y)dxdy= f f pX Y(x, y)dxdy=l. z z — co — co Px+y(z}= f Рх,т(х, z-x)dx=$px,у(х, z-x)dx. — co 0 В силу (2.6) плотность pXY(x, z—х)>0 лишь в к°гда х^О и O^z—х^л —х, или, что одно и 0^x^z<n. Таким образом, если z^ [0, л], Если же ze [0, л], то случае, то же, то px+y(z) = 0. Px+y JAr,r(x, z-x О п \Рх, y(x, z — x)dx =
z 2 Z = у(х, x)dx = - Jsin(x-|-z—x)dx = - Jsinzdx = -zsinz. ООО 2.5. Случайные величины X и Y имеют совместную плотность . . [-sin(x-by), если 0^х^л/2, О^у<л/2; Px,y\x, у)=Х 2 I 0, в остальных случаях. Найти px + y(z). Ответ: ^zsinz, если zg[0, л/2]; |(л — z)sinz, если zg(tc/2, л); .0, если z ф [0, л]. 2.6. Случайные величины X . . (е~х, х>0; = 1 О, х<0. и Y независимы, причем / х Je-5’, у^О; '”'W = 1o, j><0. Найти Px+y(z). Решение. Обратимся к формуле (2.4). С учётом условв® задачи находим + оо оо Px+y(z) = f Px(*)py(z-x)dx= f py(x)py(z-x)dx. (2.J — oo 0 Заметим, что py(z — x)>0 лишь x^z. С учётом (2.8) это означает, Если же z^O, то ввиду (2:8) тогда, когда O^z—х прЯ что py+y(z) = O, если z<l| 2 Z Z ру+у (z) = f py(x)py(z—x)dx = j e-x • e-(Z-X)dx = e-Z jdx = ze о Ответ: , . Jze z, если z>0; Px+y\Z) | q, если z<q 2.7. Случайные величины X и Y независимы, причем . (е-х, если х>0; (2е-2’’, еслиу^О; х * ( 0, если х<0. Р*'?' ( о, если у <0. Найти Px+y(z). Ответ: . (2(e-z — e-2z), если z^O; Px + y (z) = < ' 7 ( 0, если z<0. 2.8. Случайные величины X и Y независимы и равномерно распределены на отрезке [О, 1]. Найти px+Y(z). Решение. Поскольку случайные величины X и Y равномерно распределены на [О, 1 ], то . (1, если хе[0, 1]; . (1, если уе[О, 1]; ?х Х (0, если х<£[0, 1]. (0, если у<£[0, 1]. Воспользовавшись (2.4), находим Px + y(z)= f py(x)py(z-x)dx = fpy(x)py(z-x)dx = — оо О 1 2 = J 1 -Py(z-x)(Yx= f py(y)dy 0 z~ 1 (при переходе от предпоследнего к последнему равенству сделана замена y = z —х). Длина интервала [z— l,z] равна единице. График ру(у) и возможные расположения интервала [z— l,z] в зависимости от z изображены на рис. 11. Ясно, что случаи I и IV соответствуют значениям z<0 и z>2. При таких значениях z плотность Ру(у) = О для ye[z— 1, z] и, следовательно, px + Y(z) = O. Если zg [0,1] (случай II), то, как несложно понять из рис. 11, Px + y(z) = by(y)dy = f 1 -dy = z. О о Если же z—1g(0, 1], т. е. zg(1, 2] (случай III), то 1 1 Px + y(z)= f pr(y)dy= f l-dy = 2-z. z-l z-1
Р/У) Рис. 11 График функции рх+г(?) изображен на рис. 12. 2.9. Случайные величины X и Y независимы и равномерно распределены на отрезке [0,1]. Найти px_r(z). Решение. Так как случайные величины X и Y независимы, то независимы и случайные величины X и (—К). Найдем плотность распределения случайной величины (— У). Поскольку ^-г(у) = Р{-*Чу} = 1-Р{У< -у}, то /-.гЫ-М-г)-?’есл"_>,6[О’|]; ' ' ' [0, в остальных случаях. Поэтому . . (1, если уе Г— 1, 01; р _ у I VI л [0, в остальных случаях. Таким образом, + 00 Ar-r(z) = Px + (-r>y)= f px(x)p-Y(z-x)dx= — 00 1 1 z = fpx(x)p_r(z —x)dx = Jp_r(z—x)dx = f p_r(y)dy. 0 0 z-1 Отсюда, как и при решении задачи 2.8, получаем О, если z$[ — 1, 1]; Px-Y(z)= < z+1, если ze[—1,0); 1— z, если ze(0, 1].
2.10. В условиях задачи 2.6 найти px-Y(z). Ответ: (z) = ^e~^. 2.11. Случайная величина X равномерно распределена на отрезке [0, 1 ], а плотность случайной величины Y имеет вид , . Ге-у, если^^О; Prv) еслиу<0. Предполагая, что случайные величины X и вычислить px+Y(z). Ответ: Y независимы, если z<0; Px+r(z) = < 1-е z, е (z 1) —е z, если ze[0, 1]; если z> 1. 2.12. Пусть X и Y—независимые случайные величины с функциями распределения Fx(x) и FY(y) соответственно. Найти функцию распределения случайной величины Z=max{X, У}. Решение. Имеем Fz(z) = P{Z^z} = P{max{X, Y}^z} = = P{X^z, Y^z}. В силу независимости случайных величин X и Y P{X^z, y^z} = P{X^z}P{K^z}. Таким образом, Fz(z)-Fx(z)Fr(z). 2.13. В условиях предыдущей задачи найти функцию распределения случайной величины Т = min {X, Y }. Ответ: FT(x) = 1 - (1 -Fx(x)) (1 -FY (х)). 2.14. Случайные величины X и Y независимы и имеют соответственно нормальные распределения ,Л/'(а1,о?) и Л" (а2, Ог). Найти закон распределения случайной величины Z^X+Y.
Решение. По формуле (2.3) можно выписать выражен^ для плотности pz(z) случайной величины Z: + 00 Г _«.)2 _ (у-а2)2 Pz(?)= ----^=е 2а? •----— е м dy. J ст1Л/2к ст2ч/2л — 00 Отсюда, заменой переменной интегрирования u — (y — a2)/aIf! находим < + 00 /• (z —а2ы —а)2 и2 Pz(z) = ^— е 2ci 2 da, ' ’ 2ла1 J где а — а1+а2. Это равенство, используя тождество можно преобразовать к следующему виду Решение. Случайная величина ( — 2У) как линейная функция от нормально распределенной величины У имеет, согласно задаче 3.1 гл. 10, нормальное распределение. Случайная величина X-2Y=X+ ( — 2У) является суммой нормально распределенных величин и, согласно предыдущей задаче, тоже распределена нормально Л (а, ст2). Так как по условию задачи МХ=2, МУ=1, DX=9, DT=4, г0 параметры аист2 нетрудно найти, используя свойства математического ожидания и дисперсии: а = М(Х-2У) = МХ-2МУ=0, ст2 = D(X-2y) = DX+ (-2)2DT=25. Далее, нормируя и центрируя случайную величину X— 2 У, при помощи таблицы 1 получим Р{У-2У>5} = рН~2Г~°>—l = pfc^>l 1 J [ ст ст J ( 5 2 dx= 1/2 —Фо(1) = 0,5000 —0,3413 = 0,1587. Множитель в квадратных скобках равен 1, так как является интегралом по всей прямой от плотности нормального распре-: деления Л Таким образом, плотность распре-’ деления случайной величины Z равна , (г~а)2 Pz(z)=—2п" , о у/2л где a = at+a2, су2 = о2 + о2, т. е. случайная величина Z имеет нормальное распределение Л (а, ст2). Отметим, что параметры нормального распределения Z могут быть непосредственно вычислены при помощи свойств математического ожидания и дисперсии: a = MZ=MX+MY=al +а2, ст2 = DZ=DX+ D У= ст? + ст!. 2.15. Случайные величины X и Y независимы и имеют нормальные распределения Л (2, 9), Л (1, 4). Вычислить вероятность Р[Х~ 2У>5]. 2.16. Случайные величины X и У независимы и имеют нормальные распределения Л(— 1, 1), Л(1, 1). Найти вероятности: a) Р{-9<ЗХ+4У<5}; б) Р{4У-ЗУ>12}; в) Р{Х+У<0}. Указание. См. решение задачи 2.14. Ответ: а) 0,8185; б) 0,1587; в) 0,5000. § 3. Математическое ожидание и дисперсия функции 1 от случайных величин. Ковариация и корреляция Пусть рХу(х,у)—совместная плотность случайных величин У и У, a Z=<p(X У). Тогда + 00 + 00 MZ=Mcp(X, У)= f f ф(х, у)рх,у(х, y)dxdy (3.1) — 00 — 00 + 00 + 00 DZ= f f (cp(x, у)-Мф(Х, У))2ру,г(х, y)dxdy = ~ 00 — 00
= MZ2-(MZ)2= f J ф(х, у)Рх.у(х, y)dxdy-(MZ)2. (3.2) В частности, если Z=tp(X Y) = (X— MX)(К— МУ), Tft MZ=cov(X, У) (см. формулу (3.3) гл. 11). С учетом равенства cov(X, У) = МХУ-MX-МУ и формулы (3.1) cov(X, У)= f f хурх к(х, y)dxdy — МХ-МУ. (3.3) — оо — оо Коэффициентом корреляции случайных величин X и У на. зывается величина р(Х У)= ДД1. (3.4) Коэффициент корреляции величин X, У иногда обозначают согг(Х, У). 3.1. В круг радиуса R с центром в начале координат наудачу брошена точка. Пусть (X, У) — координата это! точки, a Z—расстояние от этой точки до начала координат. Найти MZ и DZ. Решение. Слово «наудачу» означает, что точка (X, У) распределена равномерно в круге х2 + у2 R 2. Поскольку площадь данного круга равна nR2, то в соответствии с (1.7) Г— Рх, г(х, у) = < яЯ2’ если x2+y2s$7?2; I 0, в остальных случаях. Пусть Z = <p(X, У) = v/x2+ У2—расстояние от случайной точки (X, У) до начала координат. Ввиду (3.1) MZ = J J Jx2+y2Рх,г (х, у)dxdy = = -Д J ^/х2+у2 dxdy. х2+уЧЯ2 Сделав замену x=pcoscp, y = psincp, 0^(р^2л, О^р^Л, (3-Я
л учитывая, что yjx2+y2 = ^/p2 cos2 ф+ р2 sin2 ср — р, получим 2п Я . - 1 С С 2 л j 2 л R3 2 п = Pd(PdP = ^'V = T7?' лк J J TtR 3 3 О о Для нахождения DK воспользуемся последним из соотношений в (3.2). Имеем Отсюда п 2 / 7 \ 2 ОГ=МГ2-(МГ)2 = 2у-(|7?) =7?2/18. 3.2. В плоском кольце с внутренним радиусом г и внешним радиусом R наудачу выбрана точка. Пусть Z—расстояние от этой точки до центра кольца. Найти MZ, DZ. 2 Ответ: 3.3. В условиях задачи 3.1 найти cov (У, У). Зависимы или нет случайные величины X и У? Решение. В силу (3.3) для вычисления cov(У, У) необходимо найти значения МУ У, МУ, МУ. Ввиду (3.1) МУУ= ху dx dy. Сделав замену (3.5), получаем
2я R MXY= р cos ср • р sin ср р dp = лЛ2 2я л cos ср sin ср dcp о 2я ,/ . V л4 R2 • 2 sin ср d (sin ср) • — = — sin ср о 2п = 0. Снова применяя (3.1) и замену (3.5), находим хрх,у(х, y)dxdy = — х dx dy = 2я R 2п R2 R , 1 pcosppdp-—-2 ПК о 2я\ р3 о / 3“ лЛ2 J о о 1 ( —----Z — sin ср лЛ2\ Y cos ср dcp R -0. о о о Ясно, что МУ=МУ=0 в силу симметрии случайных величин X и Y. Таким образом, cov(X, К) = 0. Для выяснения вопроса о независимости или зависимости случайных величин X и Y воспользуемся результатом задачи 1.3, где установлено, что Мх)=/Мх)= если |х|^R; если |х|>7?. Рассмотрим рис. 13. Ясно, что рх, т(х, у) = 0, если точка (х, у) лежит вне заштрихованного круга радиуса R, в то время как Дх(х)дг(у) = 0 для всех точек, лежащих внутри незаштрихованной области квадрата со стороной R. Таким образом, рх(х)ру(у)^рх, т(х, у) для всех точек указанной области. Случайные величины X и Y зависимы.
3.4. Совместная плотность распределения случайных величин X и Y имеет вид . . |4ху, 0х1, 0у1; Рх г(х, у) = 5 п ( 0, в остальных случаях. Найти математическое ожидание случайной величины Z=X2Y, а также ковариацию случайных величин X и Y. Решение. Имеем mz=mx2y= + 00+00 = f f X2ypx<r(x, y)dxdy = — 00 — CO 11 = f f X2ypx, Y(x, y)dx dy = f f x2y • 4xy dx dy = 0 0 0 0 1 1 = 4 Jx3dxf y2dy= 1 /3. о о Далее, ii ii МУУ={\xypx<Y(x, y)dxdy=f fxy-4xydxdy = 4/9, oo oo и 11 МУ= J f x -4xydxdy = 2/3. oo В силу симметрии МУ=2/3. Отсюда и из (3.3) cov(x У) = МУУ—МУ-МУ=4/9 —2/3-2/3 = 0. 3.5. Совместная плотность распределения случайных величин X и Y имеет вид 0<ys$ 1 —х; О, в остальных случаях. Найти МУ(1 — X). Ответ: 1/6.
3.6. Совместная плотность распределения случайных вед®, чин X и Y имеет вид Рх,у(х, у) = Найти Мл/А'2+ Y2. Указание. Сделать замену (3.5) и воспользоваться ра. венствами Г Г -- if-— 1 ,___________ Г р2е 2 dp= е 2dp = - е 2dp = -x/2n= /^. О О — GO Ответ: 3.7. Случайные величины X и Y имеют совместную плотность распределения вероятностей . . _ fsin(x+y), 0^х + у^л/2, х^О, у^О; Рх, У)=1 п (О, в остальных случаях. Найти М (cos X + cos У). Ответ: л/2. 3.8. Случайные величины X и У имеют совместную плотность распределения вероятностей , . [с|х—у|, 0^х^2, 0^у^2; Рх,у(х,у) = \ (О, в остальных случаях. Найти с; М(У2+У2). Ответ: с = 3/8; М(У2+У2) = 24/5. 3.9. Случайные величины X и У имеют совместную плотность распределения вероятностей / \ ^Х+У, O^x^l, O^y^l; Рх, у(х, у) = ) п ( 0, в остальных случаях. Найти ковариацию и корреляцию случайных величин X и Y- Решение. Имеем
МУУ= J J хуРх, у(х, y)dxdj> = 11 11 11 = J Jxy(x+y)dxdy = JJx2ydxdy+ J f xy2 dxdy= 0 0 00 0 0 11 к 1 — Jx2 dxf у dy + j xdxf y2 dy= 1/3. oo oo В то время как + co + co 11 MA"= J f xpx r(x, y)dxdy= J |x(x + y)dxdy = — co — co 0 0 1 = Jx(x+1 /2) dx = 7/12 о и, аналогично, МУ=7/12. Таким образом, cov(X, У) = МУУ-МУ-МУ=1/3-7/12-7/12= -1/144. Далее, 1 МУ2 = J х2 (х+1/2)dx = 5/12 = МУ2. о Таким образом, ОУ=ОУ=5/12— (7/12)2 = 11/144 и, окончательно, р(х, К),._‘°ИГ_П..= J — DxJdY 1 /144 yi 1/144 3.10. Совместная плотность случайных величин X и У имеет ВИД ^(х2+/), 0^х^1,0^у^1; О, в остальных случаях. Найти ковариацию и коэффициент корреляции случайных величин X и У. Ответ: соу(У, У)= - 1/64; р(Х, У)= - 15/73. Px.y{x, у) =
3.11. Совместная плотность распределения случайных величин X и Y имеет вид -2рху+/) Рх.г(х,у)=-^=е 2л 71- р2 Найти MX, МУ, cov (X У). Решение. Заметим, прежде всего, что х2 — 2рху+у2 = (1 — р2)х2 + (у—рх)2. Поэтому МУ хрх.у(х, y)dxdy = 1 f ~'1х3 A f л ----- — хе 2 ох е 2(1 р 1 dy. 2л J J (3.6) Вычислим внутренний интеграл, сделав в нём замену г» = (У~Рх)/у/1~р2. Тогда + СО __1 z _____ + СО _ 2 j е 2(1 —р2)^ dy = yi — р2 J е 2 dz = x/l — р2 • (3.7) так как 1 '2л (3.8) С учётом (3.7) равенство (3.6) преобразуется к виду хе 2 dx• ^/2?: • У1 — р2 = МУ= ,______ 2лУ1-р2 1 Sr хе 2 dx = 0, е 2 dz = 1. подынтегральная функция нечётна, а интеграл бе* поскольку рётся по промежутку, симметричному относительно оси ор* динат. Аналогичным образом, МУ=0.
Далее, MXY= ,_____ 2л — ~Х2-------rr(y — рх)2 хуе 2 2('-р) dxdy = Wi-p2 . хе 2 dx уе 2( р) dy. (3.9) Заметим теперь, что при фиксированном х функцию 1 (y-Р*)2 1 /l можно рассматривать как плотность нормально распределенной случайной величины с математическим ожиданием рх и дисперсией 1 — р2. Поэтому 1 /l 1 (j'-px)2 уе 2 1-р2 dy=px, поскольку левая часть этого равенства и есть математическое ожидание упоминавшейся выше случайной величины. Подставляя последнее равенство в (3.9) и учитывая (3.8), находим MXY=-^= </2л рх2е 2dx = p-—-— х2 е 2 dx = ,/2л J = р-—xd(e 2) = — х/2л I ,/2л е 2 dx = р. Таким образом, cov (У, У) = р — 0 0 = р. 3.12. Совместная плотность распределения случайных величин X и Y имеет вид 1 р2 2р % pXY(x,y\~--------- е 2лст1ст2 ^/l-p2 Найти МУ, МУ, Dy ОУ, cov (У, У), р(У, У).
Указание. При вычислении интегралов использовать представление 2 2р у1 х2, 2\ , 1 ( °2 т --ХУ + :Ч=-з(1-р ) + -ЛУ~р—х 1 ст2 оР ' ст2\ a, t 2 и замены z=\y— р — х^а2х/1 — р2 и v=x/ul. Ответ: МХ=МУ=0, ВУ=а2, ОУ=а2, cov(y, У) = рст1о2 р(Х У) = р. 3.13. Случайные величины Xlt ..., Хп независимы, и каждая из них имеет нормальное распределение Ж (О, 1). Случайная величина х2 = А'2 + У22+...+УП2 имеет по определению х2— распределение с п степенями свободы. Найти Мх„ и Dx„2. Указание. Использовать свойства математического ожидания и дисперсии; воспользоваться решением задач 2.1, 4.4 гл. 10. Ответ: Мх2 = п, Dx„2 = 2п. § 4. Условные плотности распределения. Условные математические ожидания Если задана совместная плотность случайных величин X и У, то условной плотностью рХ] Y(x | у) называется величина Рт|у(х| У=у)=Рх|г(*|у)=^фД Ме)>°- (41) Р-г\У) Аналогично, Рх(*)>0. (4.2) По определению будем считать, что рХ\ г(х | у) = 0, если Рг(у) = 0. Условным математическим ожиданием случайной величины У при условии Х=х называется величина + оо + оо М[У|У=х]= f ypy|x(y|x)dy= f yfar^dy- (4-3> J J P*\x) 4.1. Совместная плотность распределения случайных величин X и У задается формулой
Рх.г(х,у) = I лЛ 2’ о, если x2+y2^R2; если х2 +у2>R2. Найти prix(yl х). Решение. Как Рх(х)= показано в задаче 1.3, если |х|^А; если |х|>Л. Поэтому при x2+y2^R2 (см. (4.2)) Рг,ИЗ’1^)=^Фг = -74=^- (4-4) Рх(х) 2'/R2-x2 В остальных случаях pY\х(у | х) = 0. 4.2. Совместная плотность распределения случайных величин X и Y имеет вид , \ ](х+у)/216, если О^х^б, О^у^б; Рх.у(х, у =Л л О, в остальных случаях. Найти />у|Иу|х). Указание. Воспользоваться результатом задачи 1.5. Ответ: если О^х^б, О^у^б; Pnx(yk)=s 6хЛ+3 О, в остальных случаях. 4.3. В условиях задачи 4.1 найти М [У| А'=Лх/3/2]. Решение. Используя (4.4) и результат задачи 4.1, получаем (О, если у > R /4. Отсюда М[У|У=7\/з/2] = f ypYlx(y\R'/3l2)dy= г- Rl2 = f УРгх(у|ЛЛ/з/2)= f yldy = 0. у2=£Я2/4 -R/2 4.4. В условиях задачи 4.2 найти М[У|Х=3]. Ответ: 7/2.
4.5. Совместная плотность распределения случайных вели* чин X и Y имеет вид I р2 2р /I Рх.г(х,у) =-----------е 2(‘-P2)L~i ad. —р2 Найти Дг|л-(у|х) и М[У|У=х]. Указание. Воспользоваться результатом и указание»! задачи 1.13. Ответ: дГ1У(у|х)=----!—=е I 2al(l - Р2) МГУ|У=х] = р—х. а.
ГЛАВА 14 СЛУЧАЙНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ § 1. Закон больших чисел Пусть Хг, Х2, Хп—независимые одинаково распределенные случайные величины, причем МУ; = а, DX, = a2 <оо. Тогда для любого £>0 lim Р xl+x2+...+x„ а (1.1) п Соотношение (1.1) называется законом больших чисел. Закон больших чисел весьма часто (хотя и не всегда осознанно) используется на практике. Так, например, если проводится п независимых опытов в одинаковых условиях, а величина Xt равна единице, если опыт закончился успехом, и равна нулю, если опыт закончился неудачей, то а = МХ( есть вероятность успешного завершения опыта, а (Х1 + Х2+ ... + Хп)/п — относительная частота успехов. Таким образом, соотношение (1.1), грубо говоря, означает, что при увеличении количества испытаний относительная частота успешных испытаний будет стремиться к вероятности успеха. Аналогичная интерпретация может быть дана и в случае, когда величины Х{—независимые измерения неизвестного расстояния а до некоторого предмета. 1.1. Пусть Х1г Хп—последовательность независимых одинаково распределенных случайных величин, причем Гх>1; Ar,(x)=S х Со, х<1. Применим ли к этой последовательности закон больших чисел?
Решение. Имеем МТ,= хрх. (х) dx = 3 х • — dx = 3 'dx_3 j?~2 мх;2 = x2pA-.(x)dx = 3 —=3. /т\ 2 л Следовательно, DT) = МУ2 — (МХ;)2 = 3 — (- j — ~ < 00 • Поэтому закон больших чисел применим в виде (1.1) при а=МХ=-. ' 2 1.2. Пусть Xt, Х2, ..., Хп—последовательность независимых одинаково распределенных величин, имеющих плотность Удовлетворяет ли эта последовательность закону больших чисел? Ответ: удовлетворяет. 1.3. Справедлив ли для последовательности независимых случайных величин Хг, Х2, Хп закон больших чисел, если Р{^=1} = Р{У,.= -1} = А? Решение. Имеем МУ; = (-1)'Р{У,.= -1} +1 -Р{У;=1}=0, МУ12=(-1)2-Р{У,.= -1} + I2 -Р{Х;= 1} = 1. Таким образом, = МТ)2 — (МТ))2 = 1 < сс. Закон больших чисел справедлив. 1.4. Пусть Xt, Х2, Хп—последовательность независимых одинаково распределенных случайных величин с общей функцией распределения F(x)x Для каждого хе(—оо, +оо) определим случайную величину Fn(x) соотношением A(x)=^v„(x),
где v„(x)— количество значений Хк, к=\, 2, ..., п, удовлетворяющих неравенству Хк^х. Доказать, что для любого е>0 lim P{|F„ (x)-F(x)|>e} = 0. п—► со Указание. Представить величину v„(x) в виде суммы индикаторов независимых событий Ак(х) = {Хк^х} и воспользоваться равенствами М%Л>(Л) = F(х), Dx,, u) = F(x)(l — Е(х)) и законом больших чисел. § 2. Центральная предельная теорема Если Хк, Х2, ..., Хп — при любом п независимые одинаково распределенные случайные величины, МУ* = а, 0<В1^ = а2< оо, к=1,..., п, то справедлива центральная предельная теорема'. для любого хе(—оо, + х) lim Y^ + Xi+y+Xr-na п^со V &\/П и2 2 би = Ф(х). (2-1) Соотношение (2.1) может быть записано в эквивалентном виде: для любых —оо^х1<х2^ + оо lim Л=_L е 2 du. п-► ОП { ГТ /И I //IT (2-2) Естественно сравнить центральную предельную теорему с законом больших чисел. Для этого мы вновь воспользуемся примером, обсуждавшимся в начале предыдущего параграфа. Предположим, что величины Уг=1, если г-й опыт (из серии п однородных и независимых опытов) закончился успехом, и .Vf = 0 в ином случае. Согласно закону больших чисел ^+...+Хп к па (точное утверждение — формула (1.1)), в то время как центральная предельная теорема уточняет это соотношение: Хк + ... + Хп-па = О(^п) (точное утверждение — равенство (2.1)). В статистических исследованиях часто используется многомерная центральная предельная теорема. (См., например, [6], стр. 146, 119).
Если случайные векторы \к — {Хк1,...,Хкг), к=\,2, ... независимы, одинаково распределены и имеют конечные a(1=:MXlfc, Ьк1 — со\(Х1к, Хк), то законы распределения случайных векторов (Ynl, ..., Y„r), где сходятся при п -> оо к г-мер но му нормальному распределению с нулевым вектором математических ожиданий и матрицей ковариаций || bkl || 1. 2.1. Складываются и=12 104 чисел, каждое из которых округлено с точностью до Ю-"1. Предполагая, что ошибки округления независимы и равномерно распределены в интервале ( — 0,5 • 10~т, 0,5 • 10~т), найти, опираясь на центральную предельную теорему, пределы, в которых с вероятностью не меньшей 0,98 лежит суммарная ошибка. Решение. Пусть Хк — ошибка округления k-vo числа к = 1, 2, ..., п. Из условия задачи вытекает, что flOm, если хе[ —0,5 • 10-т, 0,5 • 10-т]; 0 если x£[_Oj5.10-т, 0,510-т]. Отсюда (см. задачу 2.5 гл. 10) a = MIt=0, а2 = ОХл = 1- 10-2т. к > 12 Учитывая равенство 12-104 1. Ю“2т = 10-т+2 12 и применяя центральную предельную теорему, получаем Найдем теперь х} и х2, для которых
= 0,98. (2-3) Естественно выбирать эти значения таким образом, чтобы длина интервала [xt, х2 ] была наименьшей. Оказывается, что такое условие выполнено при х2 = — х2, что в сочетании с (2.3) дает и2 е ~Т(Ь = 2Фо(х2) = 0,98. 1 J о Обращение к таблице 1 приводит к соотношению х2»2,33. Искомый интервал имеет вид [—2,33 • 10-т+2, 2,33 • 10-т+2 ]. 2.2. Случайная величина х2 задается равенством /2 = = Х2 + Х2 + ... +Х„2, где величины Х{ независимы и нормально распределены с параметрами а = 0 и а2 = 1. Доказать, что для любого хе(—оо, +оо) lim р(^<х1 = Ф(х). I x/2n J Указание. Воспользуйтесь равенствами (см. задачи 2.1, 4.4 гл. 10) МХ2 = 1, MXj4=3 и центральной предельной теоремой. 2.3. Случайная величина Y„ имеет распределение Пуассона с параметром п. Доказать, что для любого хе(—оо, +со) lim Р< ^х( = Ф(х). И—со ( J Указание. Воспользуйтесь равенством (см. задачу 2.14 гл. 11) где случайные величины X, независимы и имеют распределение Пуассона с параметром 1, а затем примените центральную предельную теорему. 2.4. Пусть Х\, ..., ХП — независимые случайные величины, равномерно распределенные на отрезке [0, 1 ], и S„=Xi+...+Хп. Убедиться в том, что с вероятностью приблизительно 0,98 значение 51200 будет лежать в пределах (600 + 23,3).
Указание. См. задачу 2.5 гл. 10. 2.5. Используя центральную предельную теорему, найти приближенное значение вероятности P{xioo> 127,6}, где xioo— случайная величина, имеющая х2 — распределение с и = 100 степенями свободы. Указание. Использовать решение задачи 3.14 гл. 12. Ответ: 0,025.
ГЛАВА 15 ПЕРВИЧНАЯ ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ § 1. Задачи математической статистики На практике мы редко обладаем полной информацией о модели изучаемого явления, описываемого в терминах некоторой случайной величины Чаще о законе распределения имеется лишь частичная информация; например, априори может быть известно, что 7^(х) = Р{^х} есть нормальное распределение ..К (а, ст2) с некоторыми неизвестными параметрами а = М£, и ct2 = D^. В ряде же случаев никакой априорной информации о распределении £, вообще нет. В таких ситуациях возникают задачи восстановления неизвестного закона распределения (или отдельных его характеристик) по результатам наблюдений над £, (по исходным статистическим данным). Круг подобных задач и составляет содержание математической статистики. Таким образом, если теория вероятностей позволяет при заданной вероятностной модели вычислять вероятности тех или иных случайных событий, то математическая статистика по результатам проводимых наблюдений (по исходам эксперимента) уточняет структуру вероятностной модели изучаемого явления. 1.1. В урне М белых и N—M черных шаров, при этом числа М и N неизвестны. Чтобы оценить неизвестную Долю p = M)N белых шаров в урне, проводится опыт, заключающийся в извлечении с возвращением из урны п шаров. Обозначим X—случайную величину, равную числу белых Шаров среди извлеченных, и будем в качестве приближенного значения {оценки) неизвестного параметра р использовать величину р„ = Х1п — относительное число наблюдавшихся 8 опыте белых шаров.
Вычислить Мрл и D^n. Доказать, что при любом e>q lim = п—► 00 Указание. См. задачи 2.5, 3.5, 3.9 гл. 5. Ответ: Мрп = р, Dpn = —— п Таким образом, среднее значение р„ совпадает с неизвестной долей р. Случайную величину р„ можно рассматривать в качестве «разумной оценки» для р. При большом числе извлечений п дисперсия этой оценки мала, что обеспечивает близость оценки к неизвестному значению р. 1.2. Получить реализации х случайной величины X, определенной в задаче 1.1, посредством реального извлечения «= 10, 20, 30, 40, 50 шаров, билетиков и т.п. при следующих значениях параметров: Л/ = 3, У=10. Для каждого указанного значения п найти отношение х/н, являющееся приближенным значением р = М/N = 0,3. 1.3. Вместо реального эксперимента, описанного в задаче 1.2, получить значения х при помощи таблиц случайных чисел. Для этого из таблицы II, начиная с любого места, выбрать п цифр, по полученной выборке подсчитать х, считая, например, цифры 0, 1, 2 «белыми шарами», и найти х/п. 1.4. Пусть общее число шаров в урне N известно, а неизвестным является число М белых шаров. Опыт заключается в извлечении без возвращения п шаров (и<ЛД. Пусть X означает число белых шаров в выборке и р„=Х/п. Найти и Dp„ и обосновать (как в задаче 1.1) использование случайной величины р„ в качестве приближенного значения неизвестной доли p = M/N белых шаров в урне. Доказать, что при любом £>0 lim Р{р\= 1. Указание. См. задачи 2.5, 4.4, 4.5 гл. 5. Ответ: Мр„=р, Dp п = 1.5. Пусть эксперимент состоит в многократном измерений некоторой физической величины а, точное значение которой неизвестно и в процессе измерений не меняется. На результат измерений влияют многие случайные факторы (точность й®' стройки измерительного прибора, погрешность округления HP11 Глава 15. Первичная обработка экспериментальных данных — считывании данных и т. д.), поэтому результат z'-ro измерения у. можно представить в виде Х{ = а + ^, где е,—случайная погрешность измерения. В теории ошибок измерений обычно считается, что случайные величины е15 е2, ... независимы и имеют одно и то же нормальное распределение с параметрами Msj = 0 (отсутствие систематической ошибки измерения) и Dsj = ct2 (равноточность измерений) при некотором неизвестном ст>0. В качестве приближенного значения для величины а по результатам п измерений используется их среднее арифметическое а„=-(Х1+ ... +Х„) = а+ -(^1+ — +е„)- Найти Ма„ и Dan и обосновать (как в задаче 1.1) такой способ оценивания. Доказать, что при любом е>0 lim Р{|а„ —а|г$£} = 1. л—* со Указание. Воспользоваться неравенством Чебышева (3.10) гл. 5. Ответ: Ма„ = а, Dan = cy2/п. § 2. Выборка В дальнейшем предполагается, что для получения исходных статистических данных осуществляется эксперимент, в котором проводится п повторных независимых наблюдений (испытаний) над некоторой случайной величиной Е,, закон распределения которой полностью или частично неизвестен. Пусть А) означает результат z-ro испытания, z=l,..., п. Тогда Хх, Хп можно рассматривать как п независимых копий или «экземпляров» величины Е- Р{А'1<х}=Р{^х} = /гДх), z=l,..., п. Таким образом, результат полного эксперимента описывается в этом случае и-мерным случайным вектором Х = (А\, ..., Хп), который называют выборкой, а число наблюдений п—её объемом. Часто используемое выражение «выборка Х = (А\, ..., ХД объема п из генеральной совокупности с функцией распределения /Дх)» (или, короче, «выборка из распределения F^») означает, что Xt, Х„ — независимые случайные величины, каждая из которых распределена так же, как Е,. В дальнейшем Индекс Е, у F, обычно опускается.
Реализации выборки Х = (Х15 Х„) обозначаются строчными буквами x = (xj, хп), множество всех возможных ре-ализаций ЗС = {х} называется выборочным пространством. 2.1. Используя таблицу 10, выписать реализацию выборке объема л =10 из нормального распределения J3 (а, <т2) с а = 0, о2 = 1. 2.2. Получить реализацию выборки объема п =10 из нор-мального распределения уК(п, о2) с а = 2, о2 = 4. Указание. Если случайная величина распределена нор-мально с параметрами М^ = 0, D^=l, то случайная величина т| = oq + а имеет нормальное распределение с параметрами Mr| = oM^ + a = a, Dr| = o2D^ = o2. Воспользоваться решением задачи 2.1. 2.3. Получить при помощи ЭВМ реализацию выборки объема л =100 из стандартного нормального распределения Ж(0, 1). Указание. Обычно в программном обеспечении ЭВМ есть датчик случайных чисел, который генерирует реализации последовательности независимых случайных величин, равномерно распределенных на отрезке [0, 1 ]; воспользоваться преобразованием т|! = ^/—21n cos(2л, Т|2 = у/-21п ^2 sin(2л, где ^2 — независимые равномерно распределенные на [0, 1] случайные величины,— тогда rii, т|2 — независимые случайные величины, имеющие распределение Ж (0, 1). 2.4. (Приближенно нормальные случайные числа.) Используя' независимые равномерно распределенные на [0, 1 ] случайные числа {Ut} (см. указание к задаче 2.3) и применяя центральную предельную теорему теории вероятностей, обосновать следующий алгоритм получения независимых приближенно нормальных случайных чисел: XNk=(uik-i)jv+1 + UkN~ 1’ 2, Замечание. Практически удовлетворительное приближение? к нормальному распределению уК(0, 1) получается уже при TV=12 — это значение параметра N в указанном алгоритме обычно и рекомендуется использовать для конкретных вычислений. 2.5. Получить при помощи ЭВМ три реализации (при у=2, 4, 12) выборок объемов л =100 приближенно нормальных случайных чисел {XNt} (см. задачу 2.4). 2.6. Пусть Е(х)— непрерывная и строго монотонная функция распределения, F~l(y) — обратная к ней функция и {Ц} — независимые равномерно распределенные на [0, 1 ] случайные числа. Обосновать следующий алгоритм получения выборки из распределения F: Х; = ^-1(Ц), i= Указание. Убедиться в том, что функция распределения случайной величины Х; равна F(x). 2.7. (Продолжение задачи 2.6.) Показать, что Х;=-а1пЦ, /=!,...,« (а>0) — выборка из показательного распределения f(x)=l-e“x/a, х^0. 2.8. Пусть Х = (Х15 ..., Хп)—выборка из непрерывного распределения F(x). Как из нее получить выборку из распре- деления F{ ), b > 0? \ b ) Ответ: искомая выборка имеет вид (6Хг+а, z= 1, ..., и). 2.9. Исходя из последовательности {t/J равномерных на [О, 1 ] случайных чисел, получить последовательность случайных чисел, равномерно распределенных на отрезке [а, b ], а<Ь. Указание. Воспользоваться задачей 2.8. Ответ: {(Ь — а) Ц + а}. 2.10. Пусть {?/,}” — независимые равномерные на [0,1] случайные числа и Х,= 1, если Ut^p, Х( = 0, еслй Ut>p, где ре(О, 1). Убедиться в том, что независимые случайные величины {X,}” есть последовательность Бернулли с Р{Х;=1} = 1-Р{Х( = 0}=р. 2.11. Используя последовательность Бернулли {XJ, полученную в задаче 2.10, построить выборку из биномиального Распределения Bi (к, р). Указание. Воспользоваться следующим свойством: если с,к— независимые бернуллиевские случайные величины с параметром р, то их сумма 7] = ^+...+^ имеет распределение Bi (к, р ). Ответ: искомая выборка имеет вид (X(i_1)t+1+ ... +Xik, г= 1, ..., п). 2.12. Пусть {X,}”— последовательность Бернулли С Р{Х;=1}= р (см. задачу 2.10). Тогда случайная величина
^ = min{z^O: X +1 = 0} — число единиц, предшествующих nejg вому нулю, имеет геометрическое распределение: Р {(; = &} q—l—p, k = 0, 1, 2, .... Исходя из этого, построить выбор^ из геометрического распределения. Ответ: искомая выборка (У15 ..., Уп) имеет вид У,-= min {у 0: Ху,_1+y+t = 0}, z=l,..., п (Уо = 0). 2.13. Пусть случайная величина U имеет равномерно? распределение на отрезке [0, 1 ] и для заданных чисе|, р2, ..., pN, где 0<Pj< 1, J= У , N, рх + ... +pN= 1, интервалу Ai= [0, Pi ], Д2 = (Р1’ Р1+Р2 L , &NMPi+ +Pn-i, И образу, ют разбиение отрезка [0, 1]. Положим ^ = /, если f/eAj 7=1, ..., N. Тогда Р{^ = /} =Р{UeД(} =р(, т. е. случайная ве? личина принимает значения 1, 2, ..., N с вероятностями соответственно рг, р2, , pN- Исходя из этого и используя независимые равномерно распределенные на [0, 1 ] случайны? числа {Ц}, построить п независимых копий случайной величины Ответ: положить Х{ = 1, если (7;еД(, 7=1, ..., N, z=l,..., л. где v„ (х) есть случайная величина, равная числу тех наблюдений ..., Хп, значения которых не превосходят х. Таким образом, эмпирическая функция распределения определена на всей числовой прямой, монотонно не убывает, является ступенчатой со скачками в точках Х(к}, при этом /п(х) = 0 при x<Xw и Г„(х)=1 при х~^Х(„} (см. рис. 14). Функция F п(х) при большом числе наблюдений п близка в каждой точке х к теоретической функции распределения F(x) наблюдаемой случайной величины (см. задачу 1.4 гл. 13). Поэтому для больших выборок график эмпирической функции распределения Г„(х) дает хорошее приближение к (неизвестной) теоретической функции распределения F(x). В этом смысле о функции Fn(x) говорят как о статистическом аналоге для F(x). 3.1. Реализацией выборки Х = (Хг, ..., Х6) являются следующие данные: —1,5; 2,6; 1,2; —2,1; 0,1; 0,9. Найти её основные характеристики и построить эмпирическую функцию распределения. § 3. Эмпирическая функция распределения Одним из стандартных способов представления выборки Х = (А\, ..., Х„) является её вариационный ряд У(1)^Х(2)^... ^Т(л), получаемый упорядочением наблюдений Хк, Х„ по возрастанию их значений, так что Xw = min Xh Xl2)— второе по 1 < I < п величине наблюдение и т. д., Х{„}— max ХР Величина X(ki называется k-й порядковой статистикой, Хщ и Х(п)— экстремальными (соответственно минимальным и максимальным) значениями выборки, а их разность Х(п) —Х(1)—её размахом. Важной характеристикой вариационного ряда выборки является его медиана (или середина), которая равна Х(т+1) при л = 2т+1 и (Х(т) + Х(т+ ц)/2 при и = 2т. В дальнейшем под термином «основные характеристики выборки» будем понимать совокупность её экстремальных значений, размаха и медианы. Другой сводной характеристикой выборки является эмпирическая функция распределения, которая определяется формулой F„(x) = v„(x)/n, — оо<х<оо, (3-1) Прежде всего строим вариационный ряд: —2,1; —1,5; 0,1; 0,9; 1,2; 2,6. Отсюда видно, что минимальное (максимальное) значение выборки равно —2,1 (2,6), размах равен 2,6—( —2,1) = 4,7, а медиана равна (Х(3)-1-х(4))/2 = = (0,1 н-0,9)/2 = 0,5. Эмпирическая функция распределения F6(x) является ступенчатой, возрастает скачками величиной 1/6 в точках вариационного ряда, при этом F6(x) = 0 при х<х(1)=—2,1 и Т6(х)=1 при х^х(6) = 2,6. Таким образом, С 0 при 192 < I ПРИ 5 ПРИ ’8516 Ватутин х<—2,1, — 2,1 ^х< —1,5, — 1,5<х<0,1, 0 0.1 0,9 1,2 Рис. 14 193 5 при 1 ПРИ I ПРИ . 1 при 0,1^х<0,9, 0,9^х<1,2, 1,2 ^х <2,6, х^2,6.
График этой функции изображен на рис. 14 #п(х). 3.2. Наблюденные значения случайной величины б, в 5 опытах оказались равными соответственно 0,9; 0,1; 0,6; 0,7; 0,4, Вычислить основные характеристики выборки и построить эмпирическую функцию распределения F 5(х). 3.3. Пусть ( — 0,8; 2,9; 4,4; —5,6; 1,1; —3,2)—наблюдавшиеся значения случайной величины Вычислить основные характеристики выборки, построитьд эмпирическуюл функцию распределения и проверить, что F6(—5) = 1/6, F6(0) = l/2, А (4) = 5/6. 3.4. В эксперименте наблюдалась целочисленная случайна^ величина £. Соответствующие выборочные значения оказались равными (3,0,4,3,6,0,3,1). Вычислить основные характеристики выборки, построить эмпирическую функцию распределения и проверить, что F8(l) = 3/8, F8(3) = 3/4, F8(5) = 7/8. 3.5. Пусть X = (Jf1, ..., Хп)—выборка из распределения Бер-1 нулли В1(1,р) (см. задачу 2.10). Как выглядит график эмпирической функции распределения в данном случае? Е Ответ: если v„ обозначает число единиц в выборке, то(! Г 0 при х<0, 1 при 3.6. Когда функция F„(x) будет иметь лишь скачки размера 1/п (или, что эквивалентно, будет иметь ровно п скачков)? Ответ: тогда и только тогда, когда все порядковые статистики выборки будут различны. л л 1 3.7. Пусть Xj <х2. Чему равна вероятность P(F„(xI)=F„(x2))? Ответ: Р"(£,^(х1, х2]) = (! —F(x2)+F(x1))n. 3.8. Пусть Р(^ = /)=р(, Z=0, 1, ..., N, и Х = (Хг, ...,лХп)-^ выборка из этого распределения. Найти вероятность P(F„(0-— F„(l—0) = k/n). Ответ: Спкр(к(1 —р()" к. 3.9. Показать, что распределение эмпирической функции распределения F„(x) в любой точке х, для которой 0<F(x)<l> имеет следующий вид: P^F„(x)=^ = C„tF'I(x)(l-F(x))n"\ Л=0, при этом MFn(x) = F(x), DF„(x) = F(x)(l —F(x))/h. Указание. Использовать то, что величина v„(x) в (3.1) распределена по биномиальному закону Bi(n,p) с p = F(x). 3.10. (Продолжение.) Воспользовавшись неравенством Чебышева, установить оценки: для любого г>0 p(|F„(x)-F(x)|>^)<F(x)(l-F(x))/r4^. \ -yj п / 3.11. (Продолжение.) Воспользовавшись теоремой Муавра— Лапласа, доказать, что при п -+ со Р(хЛ|АМ^Г(х)|«»)^1-2ф(--==Ц=1 \ ^F(x)(l-F(x))J где Ф(х)—функция распределения нормального закона Ж(0, 1). Замечание. Этот результат (так же, как и результат задачи 3.10) дает представление о характере сближения эмпирической функции распределения F„(x) с теоретической функцией распределения F(x) при больших объемах выборки п. 3.12. Пусть xt<x2 — заданные точки л такие, что 0<F(x!)<F(x2)< 1. Доказать формулу cov(F„(x1), F„(x2)) = = F(x1)(l-F(x2))/«. Указание. Учесть, что cov(F„(x1), F„(x2) — F„(xl)) — = cov(v„(x1), v„(x2) — v„(x1))/h2, использовать представления vn(xi)= £ ЦХ^х^, v„(x2) -vn(Xj) = £ 7(x1<Ari^x2), i=l i=l гДе 1(A)— индикатор события А, т. e. I(A)=1, если событие 4 произошло, и 1(A) равно 0 в противном случае. 3.13. Получить следующее представление для функции рас-пРеделения 4-й порядковой статистики Z(t): = £ C„mFm(x)(l-F(x))""m = p(F(x); k,n-k+l), m~k гДе
п/ Г(« + Ь) р(-'; “• 4>=гйт]' О (l-zf’M/, ze[0, 1], a, b>Q, есть так называемая неполная бета-функция Г(я)= J ta~1 e 'ciz, а>0,— гамма-функция (при целых a^Q о Г {а + 1) = а!). В частности, если существует плотность f (х) = F' (х), то для плотности распределения величины X(i) справедливо представление И = (*) = пСп~ 1 Fk ’1 (*) (1 - ’ kf^ • Указание. Использовать эквивалентность событий и {vn(x)^k} и указание к задаче 3.9. 3.14. Пусть Х = (А'1, ..., Хп)—выборка из равномерного на отрезке [0, 1] распределения Л (0, 1). Убедиться в том, что величина Х(к} имеет функцию распределения Р(х; к, п — к+\) (см. задачу 3.13). Вывести формулы 1г MX(t)=-----, () л+1’ DX(*) = к (и — к + 1) («+ 1 )2(л + 2) ’ 3.15. Получить следующие формулы для моментов экстремальных значений выборки из равномерного на [а, Ь ] распределения R{a, by. МУ(1)=^, * ’ и+1 DZ(1) = DX(„> = п(Ь — ф2 (и+1)2(« + 2)’ cov(Z(1), Х(п)) = (л+ 1)2(л + 2)’ Указание. Учесть, что случайная величина £'=-—- имей b — a t распределение Л (0, 1), следовательно Х{к) = (Ь — а) Х{к) + а, где Х(к}—порядковая статистика выборки объема п из распределения R(0, 1); использовать задачу 3.14. ; 3.16. Пусть Х = (Х'1, ..., Хп) — выборка из двухпараметрич? ского экспоненциального распределения Fab, функция распределения которого имеет вид х — а Fa b(x)= 1 — е h при х^а (6>0), 7?а Ь(х) = 0 при х<а.
Доказать, что случайная величина ~n(X(l} — а)/b имеет распределение F0,i, называемое стандартным экспоненциальным (или показательным) распределением. Получить отсюда формулы МАД) = a + hin, Т)Ха} — Ь2/п2. Указание. Вычислить вероятность Р{А)*1)>х} при х>0. § 4. Полигон частот, гистограмма Если наблюдаемая в эксперименте случайная величина £ дискретна и принимает значения а2, , то более наглядное представление о ее законе распределения дадут относительные частоты v’ = vr/«, где vr означает число элементов соответствующей выборки Х = (АГ1, ..., Хп), принявших значение аг (г =1,2, ...). В этом случае, согласно закону больших чисел, v‘ сближается при и-*оо с вероятностью Р{^ = аг}, т. е. относительные частоты v‘ можно рассматривать (по крайней мере при больших объемах выборки) в качестве приближенных значений (оценок) для неизвестных вероятностей Р{Д = аг}- Исходные данные для таких случаев обычно записывают в виде последовательности пар {(ar, vr)}, где vr>0, или в виде таблицы , называемой статистическим рядом (подчеркнем, что в этом случае '£уг = п). Г Наглядным представлением таких данных является полигон частот, который представляет собой ломаную с вершинами в точках (ar, vr), г=1, 2, ... (см. рис. 15). Можно рассматривать также статистический ряд {(ar, v*)} (здесь £v*=l) и соответствующий полигон относительных Г частот. 4.1. Наблюденные значения целочисленной величины £ для 12 опытов оказались равными 5, 1, 4, 0, 1,4, 3, 5, 0, 5, 5, 2- Построить статистические ряды этих данных и полигон частот. Ответ: vr О 2 £2 3 4 5 £ 2 1 1 2 4 12 аг О 1 6 12 3 4 1 1. 1 1 6 12 12 6 5 S
соответствующий полигон частот представлен на рис. 15. 4.2. Построить статистические ряды и полигоны частот1 для следующих данных: а) 1, 2, 5, 3, 0, 1, 2, 7, 5, 4, 9, 2, 3, 6, 4; б) 5, 1, 0, 2, 1, 4, 3, 0, 3, 1, 0, 4. 4.3. Из таблицы 11, начиная с любого места, выбрать 20 цифр и построить по полученной выборке статистические ряды и соответствующие полигоны частот (в данном случае речь идет о наблюдениях над случайной величиной, принимающей с равными вероятностями значения 0, 1, ..., 9). . ? 4.4. Выписать из таблицы 9 произвольные 100 цифр. Далее в полученной последовательности провести замену цифр по следующему правилу: {0, 1} -* 1, {2, 3} -» 2, {4, 5} -» 3, {6, 7} -»4^ {8, 9} -* 5. По полученной таким образом выборке, представляющей собой л =100 наблюдений над случайной величиной, принимающей с равными вероятностями значения 1, 2, 3, 4^ 5, построить статистический ряд {(г, v’), г=1, ..., 5} и полито^ относительных частот. у 4.5. Используя такие же исходные данные, как в задаче 4.4, провести их преобразование по правилу: {0, 1, 2, 3, 4}-»1> {5, 6} -» 2, {7, 8, 9} -> 3 (тем самым мы получим результат л =100 наблюдений над случайной величиной £,, принимающей 1 1 3 \ значения 1,2,3 с вероятностями соответственно 2’5’10/ Построить статистический ряд {(г, v^), r= 1, 2, 3} полученной выборки и соответствующий полигон относительных частот. Сравнить относительные частоты с теоретическими вероятностями. 4.6. Используя ЭВМ, смоделировать л =100 наблюдений над случайной величиной принимающей значения 1, 2, 3, 4 1 1 । 1 .. с вероятностями соответственно -, -, По полученным данным построить статистический ряд {(г, v’), r= 1, 2, 3, 4} и полигон относительных частот. Сравнить относительные частоты с теоретическими вероятностями. Указание. Использовать задачу 2.13. 4.7. Смоделировать выборку Х = (А'1, ..., Уп) из распределения Бернулли Bi(\,p) с параметром р = 0,5 и «=1000 (см. задачу 2.10). Вычислить частоты vk/k, где vk = X1 + ... + Xk, при k= 100, 200, ..., 1000 и построить график, соединив прямыми соседние точки (k, vk/k). 4.8. Пусть v„ есть число успехов в п испытаниях Бернулли с вероятностью успеха р (0 <р < 1). При больших п вычислить границу 5 такую, чтобы Р< — — /><83 [ п J у. Укладываются ли в эти границы при у = 0,98 результаты следующего эксперимента (Бюффон): при и = 4040 бросаниях монеты наблюдалось 2048 выпадений «герба»? Указание. Воспользоваться теоремой Муавра—Лапласа, монету считать симметричной. Ответ: 5у = суy/pq/n, q=l —р, с7 определяется уравнением Нк 1 “I- V Ф(су) = -у-; бо.98 = 0,0183 и соответствие данных теории хорошее. 4.9. Используя такой же подход, как в предыдущей задаче, проверить соответствие теории следующих данных: среди и =10 000 «случайных чисел» 0, 1, ..., 9 числа, не превосходящие 4, встретились 5089 раз. Ответ: 8о>98 = 0,0116 и соответствие данных теории хорошее. 4.10. Смоделировать выборку объема «=1000 из распределения Бернулли Bi (1, 3/5) и аналогично задаче 4.8 проверить соответствие экспериментальных данных предсказанию теории. Построить (аналогично задаче 4.7) соответствующий график Частот.
4.11. Смоделировать выборку объема 100 из биномй. ального распределения Bi (5, 1/2) (см. задачу 2.11). Построить статистический ряд и полигон частот для полученных данных, определить выборочную медиану. 4.12. Проводились опыты с бросанием одновременно 12 игральных костей, при этом наблюдалось число S, костей с числом очков 4, 5 или 6. Данные для и = 4096 опытов приведены в таблице, где vr обозначает число опытов, в которых наблюдалось значение ^ = г (г = 0, 1, ..., 12): 0 2 3 4 5 6 7 8 9 10 11 V, 0 7 60 198 430 731 948 847 536 257 71 11 О |409^ Построить полигон относительных частот этих данных^ Вычислить максимальное отклонение частоты v/ от вероятности^ Р{^ = г}, считая, что величина 6, имеет биномиальное распре^ деление Bi (12, 1/2). 4.13. Смоделировать выборку объема и = 100 из геометриче* ского распределения с параметром Р=^ (см. задачу 2.12); Построить статистический ряд и полигон частот для получен^ ных данных, определить основные характеристики выборки. 4.14. Смоделировать выборку объема и =100 из распре деления Пуассона П(1). Построить статистический ряд и по лигон частот для полученных данных, определить основные характеристики выборки. Указание. В основе алгоритма моделирования выборки: из распределения Пуассона П(Х) лежит следующий факт: если {} — независимые равномерно распределенные на [0, 1 ] слу-к чайные величины, то величина ^ = max{k: (7^е-к} (^=0, 1 = 1 если Су <е'") имеет распределение П(Х). 4.15. Наблюдались показания 500 наугад выбранных часов, выставленных в витринах магазинов. Пусть г—номер промежутка между (г—1)-м и г-м часом, г=1, ..., 12, a vr—числе часов, показания которых были в r-м промежутке. Результат^ наблюдений приведены в таблице: vr 1 41 2 3 4 34 54 39 5 49 6 7 8 45 41 33 9 10 11 37 41 47 12 39 х 500 Построить полигон относительных частот этих данных и сравнить его с графиком функции f(x) — c, 0^х^12. Для непрерывной случайной величины обладающей непрерывной плотностью распределения f(x), помимо эмпирической функции распределения F„(x), можно построить по соответствующей выборке Х = (А\, ..., Хп) статистический аналог f „ (х) и для плотности f (х), который называется гистограммой. Для этого используется метод группировки, в соответствии с которым область А возможных значений разбивают на некоторое число N непересекающихся интер-(N \ так что А = (J Дг I, подсчитывают числа г= 1 ' у,, ..., vN наблюдений Xt, ..., Хп, попавших в соответствующие / N \ интервалы (так что £уг = и), и строят кусочно-постоянную \ г= 1 / функцию A(*) = -~h ПРИ *еАг, г=1, ..., N (4.1) и | Дг I (здесь | Аг |—длина интервала Аг). То, что построенная по такому правилу гистограмма f „ (х) действительно дает некоторое представление о виде теоретической плотности /(х), следует из закона больших чисел, согласно которому при и~+оо относительная частота vr/« сближается с вероятностью Р(^е Ar)= J/(x)dx. Но этот интеграл по теореме о среднем д, равен /(аг)|Аг|, где аг — некоторая внутренняя точка Дг (при малом Аг в качестве аг можно взять, например, середину интервала). Таким образом, при больших п и достаточно «Мелком» разбиении {АД f п(х)«/(аД при хеДг, т. е. гистограмма f „ (х) будет достаточно хорошо приближать график плотности f (х). Наряду с гистограммой в качестве приближения для неизвестной теоретической плотности f (х) можно использовать кусочно-линейный график, называемый полигоном частот, который строится так: если построена гистограмма f л(х), то ординаты, соответствующие средним точкам интервалов, последовательно соединяют отрезками прямых (см. Рис. 16).
Рис. 16 ленные с точностью 10 Группированные данные удобно представлять в виде соответствую; щего статистического ряда {(ar, V,)}, где аг—середина r-го интервала группировки. Метод группировки применяете! и для дискретных данных, когда, например, множество возможных значений наблюдаемой случайной величины счетно. Относительные частоты vr/n в любом случае являютсм статистическими аналогами (оценками) для вероятностей Р(^еДг). 4.16. Наблюдения над непрерывной случайной величиной округ-2, оказались равными 0,59; 0,16; 0,44; 0,48; 0,90; 0,19; 0,65; 0,42; 0,35; 0,84; 0,28; 0,63; 0,54; 0,12; 0,18; 0,67; 0,94; 0,63; 0,33; 0,03. Построить гистограмму и полигон частот этих данных, взяв в качестве интервалов группировки Дг = (—, - , r= 1, 2, ..., 10. Частоты интервалов здесь равны г 1 2 3 vr | 1 j 4 I 1 9 Ю I 6 7 8 2 4 0 4 5 2 3 2 1 20 |ДГ | = 1/10, п | Дг | = 2, поэтому по формуле (4.1) значение гистограммы f 20(х) в r-м интервале равно vr/2. Вид гистограммы и полигона частот приведен на рис. 16. 4.17. Получить на ЭВМ выборки объемов п = 50, 80, 100 случайных 7?(0, 1) чисел и, группируя данные по интервалам r= 1, 2, ..., 10, построить соответствующие ги стограммы и полигоны частот. 4.18. Смоделировать выборку объема и = 500 из равномерного распределения Я(0, 12) (см. задачу 2.9). Группируя данные по интервалам Дг=(г—1, г], г = 1, 2, ..., 12, построить гистограмму и полигон частот. 4.19. Используя таблицу случайных чисел, смоделировать и = 50 значений случайной величины имеющей показательное распределение с параметром 1 (см. задачу 2.7), и построить
гистограмму и полигон частот полученных данных, взяв в качестве интервалов группировки Дг = (г— 1, г], г=1, 2, .... Определить основные характеристики выборки. 4.20. В опытах наблюдалась неотрицательная непрерывная случайная величина. Вариационный ряд выборки объема п = 50 оказался следующим (вычисления производились с точностью 102): 0,01 0,01 0,04 0,17 0,18 0,22 0,22 0,25 0,25. 0,29 0,42 0,46 0,47 0,47 0,56 0,59 0,67 0,68 0,70 0,72 0,76 0,78 0,83 0,85 0,87 0,93 1,00 1,01 1,01 1,02 1,03 1,05 1,32 1,34 1,37 1,47 1,50 1,52 1,54 1,59 1,71 1,90 2,10 2,35 2,46 2,46 2,50 3,73 4,07 6,03. Построить эмпирическую функцию распределения, гистограмму и полигон частот для этих данных с интервалами группировки Дг = (г—1,г], г=1,2, ...; определить выборочную медиану. 4.21. Получена следующая выборка объема п =100; 0,926 1,375 0,785-0,963 1,022-0,472 1,279 3,521 0,571 -1,851 0,194 1,192 1,394-0,555 0,046 0,321 2,945 1,974 -0,258 0,412 0,906-0,513-0,525 0,595 0,881 -0,934 1,579 0,161 1,179-1,055 0,007 0,769 0,971 0,712 1,090-0,631 -1,501 -0,488-0,162-0,136 1,033 0,303 0,448 0,748-0,690 0,756-1,618-0,345-0,511 -2,051 -0,457-0,218 1,372 0,225 0,378 0,761 0,181 -0,736 0,960-1,530-0,482 1,678-0,057 -1,229-0,486 0,856-0,491 -1,983-1,376-0,150 1,356-0,561 -0,256-0,212 0,219 0,779-1,010 0,598-0,918 1,598 1,065 0,415-0,169 0,313-0,005-0,899 0,012-0,725 0,147-0,121 1,096 0,181 1,393-1,163-0,911 1,231 -0,199-0,246 1,239 -2,574 Определить ее основные характеристики; построить эмпирическую функцию распределения, гистограмму и полигон Частот (точку х = 0 взять в качестве границы интервалов,
ширину которых положить равной 0,5), сравнить полигон частот с плотностью закона X' (0, 1). 4.22. Для каждой из выборок, полученных в задаче 2.5; построить эмпирическую функцию распределения и гистограмму (как в предыдущей задаче), а также определить их основные' характеристики. 4.23. Используя данные, полученные в задаче 2.3, и, проведи их группировку с интервалами Аг = (г —0,5; г + 0,5], г = 0, +1, ±2,..., построить соответствующие гистограмму и полигон частот; определить основные характеристики выборки. § 5. Выборочные моменты и квантили Наиболее важными характеристиками случайной величины являются ее моменты ак = М£,\ а также центральные моменты pjt = M(^-a1)fc (когда они существуют). Их статистическими аналогами, вычисляемыми по соответствующей выборке X = (Tt, ..., Хп), являются выборочные моменты = Х\ = ‘ (5.1) 1=1 1 = 1 Величина называется выборочным средним и обозначается — — Л 1 " Л X: X=at=~y Х:\ величина ц2 также имеет специальное ”i=l . название выборочная дисперсия и обозначение S : S2=p2=- У (Х-Х)2 = - £ Х2 — Х2. (5.2) И i =1 П i = 1 Если выборочные данные представлены в виде статистиче* ского ряда {(ar, vr)} (когда наблюдаемая величина £, дискретна или когда применяется метод группировки), то выборочные моменты вычисляются по формулам = pjt = -^(ar-a1)fcvr; п п г г в частности, «i=a=-^arvr, p2 = 52=l^(ar-a )2vr = -^a2vr-a 2. (5.3) П? пг В этом случае для упрощения вычислений исходные данные часто удобно преобразовать, положив br = (ar — a)/с, где сдвиг д есть значение аг с максимальной частотой vr и единица масштаба с>0 — произвольна. Средние а, b и дисперсии S2(a), S2(b) соответственно исходных и преобразованных данных связаны соотношениями a = cb+a, S2(a) = c2S2(b). (5.4) При достаточно общих предположениях выборочные моменты при больших объемах выборки близки к соответствующим теоретическим моментам и потому могут служить оценками последних, когда они неизвестны. 5.1. Вычислить выборочные среднее и дисперсию по исходным и группированным данным, приведенным в задаче 4.16. Решение. Вычисления по формулам (5.1) — (5.2) здесь дают: Т = — «0,468, 52«0,067. Далее, середины интервалов Аг равны аг = 0,1 г — 0,05, при этом <5=а7 = 0,65; кроме того, здесь удобно выбрать в качестве единицы масштаба с = 0,1. Таким образом, статистический ряд преобразованных по формуле br — (ar — a )jc = (0,1г—0,7) 10 = г — 7 данных имеет вид: Теперь уже вычисляем (см. (5.3) — (5.4)) ^brvr= — 37, b = =—37/20= — 1,85 и, следовательно, a = cb+a = 0,65 — 0,185 = 0,465. Аналогично, У/>2уг = 201, А2(Л) = -У b2vr — F2 = — —1,852« V v ’ п^Г 20 %6,628 и, следовательно, S2 (a) = c2S2 (/>)«0,066. 5.2. Вычислить выборочные среднее и дисперсию для данных задачи 4.12 и сравнить их с теоретическими значениями. Решение. Здесь мы имеем дело со статистическим рядом {(Е Ч-)}, поэтому вычисления производим по формулам (5.3) — (5.4), предварительно преобразовав данные, положив br = r—6 (поскольку здесь а — 6). Итак, статистический ряд преобразован-8ых данных имеет вид:
Ь, -5 —4 -3 —2 -1 О 2 3 4 5 V, 7 60 198 430 731 948 847 536 257 71 11 4096 Здесь £Z>rvr = 569, Л=-^-«0,14 и, следовательно, а^а+6% 12 «6,14, теоретическое же среднее «!=М^ = у = 6. Аналогично, £/>,4=12083 и \з2 — {Ь) = -^ЬгУг — />2«2,93, теоретическая же г п г Ы 12 , дисперсия ц2 = Щ= —= 3. 5.3. Убедиться в справедливости соотношений (5.4). 5.4. Вычислить выборочные среднее и дисперсию для данных, полученных в задаче 4.13, и сравнить их с теоретическими значениями ах=М^=1, p2 = D^ = 2. 5.5. Вычислить выборочные среднее и дисперсию для данных, полученных в задаче 4.14, и сравнить их с теоретическими значениями = ц2 = 1. 5.6. Рассматривая приведенные в задаче 4.15 данные как независимые наблюдения над дискретной случайной величиной £, принимающей значения, совпадающие с серединами соответствующих интервалов (т. е. значения 0,5; 1,5;...; 11,5), вычислить выборочные среднее и дисперсию и сравнить их с соответствующими моментами равномерного распределения Я(0, 12). 5.7. Для данных, полученных в задаче 4.18, вычислить основные характеристики выборки, а также выборочные средние и дисперсии по исходным и группированным данным и сравнить их с соответствующими теоретическими значениями «!=6, ц2 = 12. Для произвольного распределения F и произвольного числа />е(0, 1) уравнение F(x)=p определяет р-квантилъ £р, т. А F(^p)=p (чтобы решение было однозначно, график F(x) в точках разрыва (когда они есть) дополняется вертикальными отрезками, а в случаях, когда этому уравнению удовлетворяет много значений х, в качестве £р выбирается минимальное из них (см. рис. 17)). Выборочная р-квантиль £р определяется как р-квантиль эмпирической функции распределения F„ (х), т. ©• F„(£p)=/>, и является статистическим аналогом соответствую' щей теоретической р-квантили £р.
5.8. Убедиться в том, что выборочная /-квантиль £р выражается через порядковые статистики Х{к>, выборку Х = (А\, Х„) (см. § 3) следующим образом: £ _Ра"₽]+1) ПРИ пР ДРобном, р [У(лр) при пр целом, где [а] — целая часть числа а. Замечание. Несколько отличается от этого определение выборочной медианы £1/2, данное в §3 (при /7=1/2 соответствующая квантиль £1/2 называется медианой распределения F). 5.9. Вычислить первый и второй выборочные моменты ак, fc=l, 2 (см. (5.1)), а также выборочные /-квантили £р при / = 0,25; 0,5; 0,75 для данных, полученных в задаче 4.19, и сравнить их с соответствующими теоретическими характеристиками ак = /с!, £р= — In(1 — /). 5.10. Вычислить выборочные среднее, дисперсию и /-квантили при / = 0,25; 0,5; 0,75 для данных задачи 4.20. При исследовании свойств графика плотности распределения часто рассматривают такие характеристики, как коэффициенты асимметрии и эксцесса у2, определяемые формулами 71 = |Тз/|Т2/2, 72 = Ц4/Ц2-3.
Если график плотности симметричен, то yj=O, поэтому по значению У( судят о степени отклонения от симметрии. Аналогично, для нормального распределения у2 = 0, поэтому о кривых с у2 = 0 говорят, что они имеют нормальный эксцесс, если же у2>0 (у2<0), то считают, что эксцесс кривой положителен (отрицателен). Если наблюдаемая случайная величина £, абсолютно непрерывна и X = (A'i, ..., Х„)— выборка из ее распределения, то выборочные коэффициенты асимметрии и эксцесса определяются формулами соответственно Yi = A3/S3. y2 = p4/S4-3. (5.5) Если р2>0 и существует 4-й момент ц4, то для больших выборок у7- близки к у7. 5.11. Вычислить выборочные среднее, дисперсию, а также выборочные коэффициенты асимметрии и эксцесса (см. (5.5)) для данных задачи 4.2Е 5.12. Выполнить такое же задание, как в задаче 5.11, используя данные, полученные в задаче 2.5; сравнить выборочные характеристики с соответствующими значениями теоретических характеристик. 5.13. Для данных, полученных в задаче 2.3, вычислить выборочные среднее, дисперсию, коэффициенты асимметрии и эксцесса, а также квантили С,р при /> = 0,25; 0,5; 0,75 (см. задачу (5.8)) и сравнить их с теоретическими значениями. 5.14. Убедиться в том, что для величин щ (см. (5.1)) при к ^2 справедливо представление к-2 £ (-\)rC'kX ra4_r + (-l)fc-‘ (к- 1)Х к. г = 0 5.15. Доказать формулы Ма* = а*, Das = (ot2t-ott2)/n, cov(a*, as) = (a4+s-ata5)/« (предполагается, что моменты a2)k и ak+s конечны). Указание. Воспользоваться независимостью и одинаковой (с величиной £,) распределенностью элементов выборки Х = (А'1, ..., х„). 5.16. Воспользовавшись неравенством Чебышева, доказать, что при н->оо и любом 8>0 Р(|ак-аД>е)~»0.
Замечание. Этот результат говорит о том, что при больших объемах выборки выборочные моменты близки к соответствующим теоретическим моментам. 5.17. Вычислить математическое ожидание и дисперсию выборочной дисперсии (5.2). Указание. Перейти к центрированным величинам Yi = Xi — al и записать S2 в виде 52 = ^1(У1-У)2 = ’ J Yl-Y2. i — 1 i — 1 z-i -ЛЛО2 n~ 1 nc’ (n— I)2/ n~ 3 2*) Ответ: M5 =-----p2, щ------ц2 . n n \ n—1 / 5.18. Воспользовавшись центральной предельной теоремой и задачей 5.15, доказать, что при и->оо выборочный момент „ / a2)s—а А ак асимптотически нормален с параметрами (ак, ---1, т. е. \\ а2Л“аЛ / 5.19. Пусть наблюдаемая случайная величина. £ имеет нормальное распределение Л/'(а1, ц2). Найти распределение выборочного среднего X для выборки объема п и сравнить его с соответствующим результатом предыдущей задачи. Ответ: Для любого п величина X имеет распределение ^(а15 |х2/и). 5.20. Используя многомерную форму центральной предельной теоремы, показать, что при п -> оо совместное распределение любого конечного числа выборочных моментов Ал = (а!, ос2, ..., ak) асимптотически нормально с вектором средних значений a = («i, a2, ..., ak) и матрицей вторых моментов -Е=-|| гДе сти = а.+2-а.а2 (см- задачу (5.15)). п п Указание. Положить ^, = (Л-, X2, ..., X*), / = 1, ..., п, тогда иА„ = ^!+ ... +^л есть сумма независимых одинаково распределенных векторов. 5.21. При изучении асимптотических (при и->оо) распределений функций от выборочных моментов используется следующий общий результат: если <р(х), х = (х15 ..., хк),— любая дифференцируемая функция, то (в обозначениях предыдущей задачи) случайная величина г|л = <р(Ал) асимптотически нормальна с параметрами (<р(а), ст2/л), если величина
к стi 2 * * s= X СТуФ«Ф;>0, <0=1 где ср; 3<р(х) dxj i= 1, к. Доказать, что при и-*оо выборочная дисперсия S2 асимптотически нормальна с параметрами (ц2, (Цд—Ц2)/«). Указание. Воспользоваться представлением S2 = q>(a!, a2), где cp(Xi, х2) = х2—х2. § 6. Выборочный коэффициент корреляции В ряде случаев результат эксперимента описывается в терминах двумерной случайной величины £<=(£ь £2). Если проведено п независимых наблюдений над то соответствующие данные представляются выборкой ((Х{1, Xi2), 1=1, и). В этом случае совокупность (Хц, Хп1) можно рассматривать как выборочные данные для координаты а (Х12, Х„2) — как выборку для £2. Таким образом, величины i = l "i=l являются выборочными средним и дисперсией для координаты ^(/=1, 2). В этом случае статистическим аналогом для теоретической ковариации COV(^, ^2)=М(^-М^)(^-М^2)=М^Л2-М^М^2 является выборочная ковариация s^=-nt (Xi-X 2)(Xi2-X 2)=1 I Ы2-ХД2, (6.1) а статистическим аналогом для коэффициента корреляции p = corr(£i, £2)=cov(£i, Q/ является выборочный коэффициент корреляции pn — S12/S1S2. (6.2) Если М^1^2<оо и D£y>0, /=1, 2, то для больших выборок (при п-»оо) р„ является хорошим приближением (оценкой) для теоретической корреляции р.
Для упрощения вычисления величины рп часто бывает удобно предварительно преобразовать исходные данные с помощью линейного преобразования: Гн=(^1-а1М, ^i2 = (^i2 — a2)/^2, (6.3) где а2— действительные, а Ьг, Ь2— положительные числа. В этом случае при любом выборе at, а2, Ьг, Ь2 р„(Х) = рл(У). (6.4) 6.1. Доказать свойство (6.4). 6.2. Вычислить выборочный коэффициент корреляции для следующих данных и = 26 наблюдений над величиной ^ = (^1л £2), записанных в виде статистического ряда: 23,0 24,0 24,5 24,5 25,0 25,5 26,0 26,0 26,0 26,5 26,5 27,0 27,0 28,0 42 0,48 0,50 0,49 0,50 0,51 0,52 0,49 0,51 0,53 0,50 0,52 0,54 0,52 0,53 vr 2 4 3 2 1 1 2 1 2 1 1 2 1 3 Указание. Произвести линейное преобразование (6.3), выбрав а! = 26,0, />!=0,5, а2=0,50, 62 = 0,01. Ответ: р26 = 0,793. 6.3. Используя независимые равномерно распределенные на [0, 1] случайные числа {(7J, построить последовательность пар случайных чисел (Уп = У- 2 In U2i cos (2лC/2i _!), А)2 = V ~ 2 In U2i sin (2 л t/2i _ z=l, 2, ..., 50, вычислить для этих данных выборочный коэффициент корреляции и сравнить его с теоретическим значением р = 0 (см. задачу 2.3). 6.4. Используя данные, приведенные в задаче 4.21, образовать п = 50 пар последовательных чисел и, рассматривая их как реализацию выборки (<Хц, Xl2), z=l, ..., 50), вычислить выборочный коэффициент корреляции р50.
ГЛАВА 16 ТЕОРИЯ ОЦЕНОК § 1. Оценки, их состоятельность и несмещенность Одной из основных задач математической статистики является разработка рациональных методов оценивания неизвестных истинных значений тех или иных характеристик наблюдаемой в эксперименте случайной величины £, (или ее закона распределения F) по исходам эксперимента. Оценить истинное значение g0 некоторой характеристики g случайной величины по соответствующей выборке Х = (А\, Xi) означает построить такую функцию Г„ = Т„ (X), значение которой t при наблюдавшейся в эксперименте реализации выборки можно было бы считать разумным (в каком-то смысле) приближением для g0’.t~g0. В этом случае говорят, что статистика Т„ оценивает g или что Т„ есть оценка g (для g), и часто подчеркивают это обозначением g=Tn(X). Это понятие уже встречалось в гл. 15. Так, говорилось, что значение эмпирической функции распределения F„(x) (см. (3.1) гл. 15) в каждой точке можно рассматривать в качестве приближения (оценки) для теоретической функции распределения Т’(х), а различные выборочные характеристики (моменты ак и jit (см. (5.1) гл. 15), квантили и т. д.) — как оценки соответствующих теоретических характеристик. При этом в термин «оценка» вкладывался определенный асимптотический смысл. Именно на основании закона больших чисел (или неравенства Чебышева) в ряде случаев можно было утверждать, что при росте числа наблюдений (при и-»оо) значение оценки сближается со значением соответствующей теоретической характеристики (см., например, задачи 3.10, 5.16 гл. 15). Выражением этого «разумного» свойства оценки является понятие состоятельности
Определение 1. Статистика Т„ = Тп(Х1, Хп) является состоятельной оценкой для характеристики g наблюдаемой случайной величины £, если при п-»оо для любого е>0 выполняется условие Р{| g|>s}—>0. (1.1) Таким образом, свойство состоятельности означает, что для выборок большого объема значительная разница между значениями Оценки и оцениваемой характеристики маловероятна, и потому разумно (по крайней мере для больших выборок) принять статистику Т„ за приближенное значение неизвестной характеристики g. Определение 2. Оценка Т„ для g называется несмещенной, если MT„=g. (1.2) Для оценок, не удовлетворяющих условию (1.2), можно ввести величину b = MTn-g, называемую смещением оценки Тп. Таким образом, для несмещенных оценок их смещение равно нулю. Свойство несмещенности интуитивно привлекательно: оно означает, что по крайней мере «в среднем» используемая оценка приводит к желаемому результату. Поэтому часто ограничиваются рассмотрением класса несмещенных оценок. В то же время надо иметь в виду, что это свойство не всегда может быть обеспечено и не всегда «разумно» (см. далее задачу 1.15). Отметим, что для проверки состоятельности некоторой несмещенной оценки Т„ обычно достаточно вычислить ее дисперсию DT„: если DTn-»0 при n-юо, то (1.1) следует из неравенства Чебышёва. 1.1. Убедиться в том, что оценка рп для доли р белых шаров в урне (см. задачу 1.1 гл. 15) является несмещенной и состоятельной. 1.2. Проверить аналогичное утверждение в условиях задачи 1.4 гл. 15 при п, N-юо. 1.3. Доказать, что значение эмпирической функции распределения F„ (х) в каждой точке х является несмещенной и состоятельной оценкой Для теоретической функции распределения F(x).
Указание. Воспользоваться задачей 3.9 гл. 15. 1.4. Пусть случайная величина принимает значения 1, 2, ..., У с некоторыми вероятностями pt, ..., pN соответственно. Над £ проведено п независимых наблюдений, и пусть vr означает число тех из них, когда наблюдался исход «г» (г=1, ..., N, v1+...viV). Доказать, что относительная частота v* = vr/n является несмещенной и состоятельной оценкой для вероятности рг (см. § 4 гл. 15). Указание. Воспользоваться тем, что случайная величина vr имеет биномиальное распределение Bi(n, рг); применить неравенство Чебышева. 1.5. По п независимым наблюдениям Х1г Хв над случайной величиной £, требуется оценить неизвестную вероятность п р = Р{^еА}, где интервал А задан. Положим v„= £ /(А^еА)— i=l число попаданий в интервал А. Доказать, что статистика Tn — v„ln—несмещенная и состоятельная оценка р. При каком значении р дисперсия DT„ будет максимальной? Указание. Величина v„ имеет распределение Bi(n,p). Ответ: р=1/2. 1.6. Убедиться в том, что выборочный момент at при любом к=\, 2, ... является несмещенной и состоятельной оценкой теоретического момента аЛ = М%*. Указание. Воспользоваться задачами 5.15 и 5.16 гл. 15. 1.7. Пусть g — несмещенная оценка g с конечной положительной дисперсией Dg. Будет ли статистика g2 несмещенной оценкой для g2? Решение. Так как Dg =Mg2— (Mg)2 = Mg2— g2>0, то условие несмещенности (1.2) не выполняется, и смещение равно Dg. 1.8. По п независимым наблюдениям Хг, ...,,Х„ над £, требуется оценить неизвестную дисперсию ц2 = Щ, когда среднее «! — М£, известно. Убедиться в том, что несмещенной и состоятельной оценкой для ц2 является в данном случае статистика п i—1 1 " 1 Указание. Здесь МТ„ = - £ DXf = p2> DTn = -D(^ — 04)2 — _Н4-Н2 1-1 п
1.9. (Продолжение.) Для оценивания неизвестной дисперсии ц2 =Щ при неизвестном среднем =М£, используется выборочная дисперсия S2 (см. (5.2) гл. 15). Является ли эта оценка несмещенной и состоятельной? Построить несмещенную оценку вида XS2 в данной задаче. Указание. Воспользоваться результатом задачи 5.17 гл. 15. Ответ: смещение оценки S2 есть 6=—щ/и, несмещенная оценка имеет вид ЦЁ(л-,-Г)2; п— 1 п— 1 v 7 обе оценки состоятельны. 1.10. Пусть MT„=g +/>„, DTn-8n, где Ьп, 8„->0 при п -> со. Доказать, что Тп — состоятельная оценка g. Решение. Поскольку | Т„—МТВ|>| Тп— g| — |МТ„— g|, то событие {|Т„—g|>e} влечет событие {| Тп — МТ„|>е— |8„|}. Отсюда по неравенству Чебышева имеем Р{| Tn-g|>S}^P{| Т„-МТП|>8-|8Л|}<—_^0 при п —► 00. Замечания. 1) Оценка Тп, для которой смещение Ьп->0 при п -» оо, называется асимптотически несмещенной', примером такой оценки является выборочная дисперсия S'2 (см. предыдущую задачу). 2) При установлении свойства состоятельности важную роль играет также следующий простой критерий: если Т„ — состоятельная оценка g, то для любой непрерывной функции Ф статистика ф(Т„) является состоятельной оценкой 9(g). 1.11. Пусть над биномиальной Bi(n, 0) случайной величиной произведено одно наблюдение X (параметр 0 неизвестен). Показать, что статистика Т= Х(п — Х)/(п(п — 1)) является несмещенной оценкой функции g (0) = 0 (1 — 0). 1.12. Пусть Х = (А\, ..., ХП)—выборка из распределения Бернулли Bi(l, 0) с неизвестным параметром 0е(О, 1). Оценить функцию g(0) = 0(1—0). Указание. Заметить, что статистика T=Xt+ ... +Хп имеет распределение Bi(n, 0), и применить задачу 1.11. 1.13. Пусть произведено одно наблюдение X над случайной величиной с распределением Пуассона П(0) (параметр 0
неизвестен). Показать, что статистика Т= Х(Х— 1)... (X—к+1) является несмещенной оценкой для функции g (0) = 0* (fc=l, 2, ...). 1.14. Над случайной величиной с распределением П(0) произведено п независимых наблюдений. Будет ли выборочное среднее несмещенной и состоятельной оценкой параметра 0? Указание. Воспользоваться задачей 1.6. 1.15. Пусть в схеме Бернулли с неизвестной вероятностью «успеха» 0е(О, 1) испытания проводятся до первого «неуспеха» и пусть X есть наблюденное число «успехов». Убедиться в том, что статистика (0 при Х=0, (1 при Х~^ 1 есть единственная несмещенная оценка параметра 0. Указание. Учесть, что X имеет геометрическое распределение с параметром 0 (см. задачу 2.12 гл. 15), и решить уравнение несмещенности МТ(А") = 0, 0е(О, 1). Замечание. В данном случае оценка Т принимает значения, не принадлежащие множеству допустимых значений неизвестного параметра 0 (т. е. интервалу (0, 1)), поэтому требование несмещенности приводит здесь к бесполезной оценке. 1.16. Пусть Х = (А\, ..., Хп) — выборка из нормального распределения Ж(0, ст2) с неизвестным средним 0 и известной дисперсией ст2. Доказать, что несмещенной оценкой функции g(0) = 02 является статистика Т—Х2— —. Указание. Учесть, что величина X имеет распределение Ж(0, ст2/и) (см. задачу 5.19 гл. 15). 1.17. Пусть Х = (А\, ..., Хп)— выборка из нормального распределения Ж {а, 02) с известным средним а и неизвестной дисперсией 02. Доказать, что несмещенной и состоятельной оценкой параметра 0 является статистика Тп = \Х{ — а\. V2 ”i=i Указание. Вычислить М|£^а|== Д0, D|^ — а\=-—-Q2. У к к 1.18. Пусть Х = (А\, ..., Хп) — выборка из показательного распределения F(x)= 1 — е~х/в, х^О (параметр 0>О неизвестен).
Будет ли выборочное среднее X несмещенной и состоятельной оценкой 0? Указание. Вычислить М£ = 0 и воспользоваться задачей 1.6. 1.19. Пусть Х = (АГ1, ..., Х„)— выборка из равномерного на отрезке [02, 02 ] распределения 02). Воспользовавшись задачей 3.15 гл. 15, убедиться в том, что статистики Л=1(Х(Л) + У(1)) и г2=^|(х(в)-у(1)) являются несмещенными и состоятельными оценками соответственно для gj = (0j, + 02) /2 и g2 = 02 — 01 • 1.20. Основываясь на результатах задачи 3.16 гл. 15, построить несмещенную и состоятельную оценку неизвестного параметра сдвига а экспоненциального распределения F^(параметр масштаба Ь считается известным). Ответ: Tn = Xw--. ' п 1.21. В условиях предыдущей задачи оценить параметр Ь, считая известным а. Ответ: Тп = Х —а—несмещенная и состоятельная оценка Ь. 1.22. (Продолжение.) Пусть оба параметра а и b неизвестны. Доказать, что их несмещенные оценки имеют соответственно вид l\ = Xw-T2ln, T2=-^(X-XW). 1.23. Пусть (Xi2, Xi2), i=l, ..., п,— независимые наблюдения над двумерной случайной величиной ^ = (^, £2). Доказать, что несмещенной оценкой для ковариации cov(^15 S,2) является статистика T—-^S12, где S12 — выборочная ковариация (см. (6.1) гл. 15). Указание. Рассмотреть случайную величину ц = ^1 + ^2, выборочными данными для которой являются Yt = Xi2 + Xi2, z=l, ..., п, и построить несмещенную оценку для ее дисперсии Dr| = D^1 + D^2 + 2cov(^1, £2), применив задачу 1.9. 1.24. Пусть Х = (А\, ..., Х„) — выборка из распределения Коши А"(0), задаваемого плотностью f(x; 0) = - — оо<х<оо, 0е(—оо, оо). Основываясь на том, что статистика
X также имеет распределение ЛГ(0), показать, что X не является состоятельной оценкой параметра 0. Будет ли в данном случае состоятельной оценкой 0 выборочная квантиль £1/2 (см. задачу 5.8 гл. 15), относительно которой известно, что она асимптотически нормальна Ж(£1/2, л2/4п)?_ Указание. В данном случае вероятность Р(|.¥—0|>е) не зависит от п и С, 1/2 = 0. 1.25. Имеется урна с N занумерованными числами 1, 2, ..., N шарами. Число N шаров неизвестно, и чтобы его оценить, из урны наугад извлекается с возвращением п шаров. Пусть Х = (А\, ..., Х„)— номера извлеченных шаров и У(л) = max Xt— 1 максимальный наблюдавшийся номер. Проверить, что несмещенной оценкой N является статистика r=r(xw)=[x;r-(xw-О'*‘]/[ч,- (х,„- 0']= =л-„[1 - (1 -х„->1)'*,]/[| - (| (приближенное равенство справедливо при больших значениях АГ(И)). Указание. Поскольку выбор равновероятный, то Р(А'(л)<щ) = ( ) и, следовательно, распределение Xiny имеет вид: 4 РрГ(л)=т) = [т"-(т-1)',]/Л/г", т=1, ..., N. 1.26. (Продолжение.) Доказать, что если шары извлекаются без возвращения, то несмещенная оценка N имеет вид т=^±1у(л)-1. Указание. Здесь распределение статистики Xw имеет вид: P(Xw=m)=C^l/C^ т=п, п+1, ..., N. § 2. Среднеквадратическая ошибка и эффективность оценки Для оценивания заданной характеристики g наблюдаемой случайной величины можно использовать, вообще говоря, различные оценки, поэтому, чтобы выбрать лучшую из них, надо использовать какой-нибудь критерий сравнения качества {точности) оценок. Обычно в качестве меры точности оценки
Т(Х) используется ее среднеквадратическая ошибка М(Г(Х)-g)2, и из двух оценок g более точной (иногда говорят более эффективной) считается оценка с меньшей среднеквадратической ошибкой. Для несмещенных оценок (см. (1.2)) М(Т(Х) -g)2 = DT(X), т. е. их мерой точности является дисперсия. В ряде случаев удается построить несмещенную оценку (для g), дисперсия которой не больше дисперсии любой другой несмещенной оценки. Такая оценка Т* называется оптимальной (в классе несмещенных оценок g), и она единственна. 2.1. Пусть Х — ..., Х„)— выборка из распределения Бер- нулли Bi(\,p) с неизвестным параметром ре (О, 1). Требуется оценить параметр р. Рассмотрим класс статистик вида ГЛ = ГЛ(Х)=£ а>.Уь i= 1 где а1+...+а„=1 и а2 + ... +ал -»0 при и-»оо. Здесь МГ„= X aiP=P, DT„= X а2 р(1-р)->0, п-юо, i=i (=1 поэтому любая статистика из этого класса является несмещенной и состоятельной оценкой р. Но минимальную дисперсию среди них имеет статистика Тп при аг = ... =а„=)/п (доказать!), тем самым оптимальной в данном классе оценкой является выборочное среднее X =(Хг+ ... +Х„)/п. 2.2. Пусть Т=Т(Х)—оценка g и b = NlT—g—её смещение. Доказать формулу М(Т—g)2 = J)T+b2. 2.3. По выборке Х = (Х1, ..., Х„) из равномерного распределения R(0, 0) с неизвестным параметром 0>О требуется оценить 0. Убедиться в том, что оценки Т\ = 2Х, Т2 = п~Х{П) и Т3 — (п +1) Ха>— несмещенные, но наиболее точная из них — Т2, а состоятельными являются Т\ и Т2. Указание. Воспользоваться задачей 3.15 гл. 15. 2.4. В задаче 1.20 можно предложить также несмещенную и состоятельную оценку Т^ — Х — Ь. Показать, что оценка Т„ — Х(1} — - является более эффективной.
2.5. Пусть Х = (Х1, Х„)— выборка из нормального распре- деления -X (а, 02) с известным средним а и неизвестной дисперсией 02. Требуется оценить g=02. Рассмотрим три оценки: вы-л 1 " боронную дисперсию S2, 502 = («/(«—1))52 и g =-^ (Х^ — а)2 п t=i (две последние из них являются несмещенными (см. задачи 1.8 и 1.9)). Доказать, что по критерию среднеквадратической ошибки оценка 52 является наиболее точной из этих трех оценок, но в классе несмещенных оценок g точнее, чем Sq. Указание. Учесть, что в данном случае второй и четвертый центральные моменты равны ц2 = 02, ц4 = 304, и использовать задачи 5.17 гл. 15 и 1.8. 2.6. Рассматривается задача оценивания дисперсии 02 нормального распределения +К(015 02) (оба параметра неизвестны) по соответствующей выборке X = (Xj, ..., Х„). Рассмотрим класс оценок вида 7\ = kSo, где 502 — несмещенная оценка 02 (см. задачу 1.9). а) Доказать, что среднеквадратическая ошибка оценки Тх имеет вид М(7\ — 02)2 = <р(^)04, где <р(Х) = —Цх2+(X—I)2; б) убедиться в том, что при -—^<Х<1 оценка точнее, чем оценка 502; в) оптимальной в классе {7\} является оценка 7\-, где Л* = -—. (Воспользоваться указанием в задаче 2.5.) п+1 2.7. Объединение статистической информации. Имеются две независимые выборки объемов п1 и п2 из одной и той же совокупности с неизвестными средним ах и дисперсией p.j. Пусть Xj, S2, j=\,2,— соответствующие выборочные средние и дисперсии. Убедиться в том, что статистики X = (n,Xj + п2Х2), 502 =-----(«1 ^12 + «25/) пг+п2 ' п1+п2 — 2' ’ являются несмещенными и состоятельными оценками соответственно для otj и |12- Будут ли они более эффективными, чем соответствующие оценки, вычисленные по отдельным выборкам? Обобщить на случай произвольного числа выборок. Указание. Воспользоваться независимостью выборок и задачами 5.15 и 5.17 гл. 15. Ответ: Да.
Пусть наблюдаемая случайная величина имеет распределение F(x; 0), зависящее от неизвестного параметра 0, значения которого принадлежат некоторому множеству 0. Обозначим f(x; 0) плотность распределения для непрерывной „ г/ SF(x; 0) случайной величины: /(х;0) =—-—- и вероятность дх f(X- 0) = Р{^ = х}— в дискретном случае, и определим функцию (2.1) ' ’ V 30 J 302 v 7 называемую информацией Фишера (предполагается, что операции дифференцирования и взятия математического ожидания корректны). Если Г„=Г„(АГ1, ..., Хп)— произвольная несмещенная оценка дифференцируемой функции #(0), то для многих моделей имеет место неравенство Рао—Крамера для её дисперсии: DT (2 2) Определение 3. Оценка Т„, для которой в неравенстве (2.2) имеет место равенство (при всех 0е0), называется эффективной. Таким образом, эффективная оценка (когда она существует) является оптимальной (т. е. с минимальной дисперсией) среди всех несмещенных оценок параметрической функции g(0). При установлении свойства эффективности полезен следующий простой критерий: статистика Тп является эффективной оценкой g (0) тогда и только тогда, когда имеет место представление Г„-£(0) = а(0) £ а1п/^‘;Д (2.3) i= 1 где а(0) — некоторая функция от 0; в этом случае DT„ = a(0)g'(0). 2.8. Пусть в схеме Бернулли Bi(l, 0) (0е(О, 1)—неизвестно) проведено п испытаний, результаты которых представлены выборкой Х = (АГ1, ..., Хп). Требуется по этим данным оценить параметр 0. Здесь /(х; 0) = 0*(1 — 0)'~*, х = 0,1, и 31пДх; 0)_х 1— х_ х —0 30 0 ” Г2д)~0(1-0)-
Отсюда по формуле (2.1) находим информацию Фишера ,(в)-[9(1-е)]-гм(5-е)’=[е(1-в)]-’1>5-^. Следовательно, для любой несмещенной оценки 0 имеет место неравенство (см. (2.2)) D7’„^0(l — 0)/н. Поскольку 0(1-0) £ dMx,;g)= £ Xi-n$ = n(X-0), то по критерию (2.3) статистика Тп = X является в данном случае эффективной оценкой 0 и DX = 0 (1 — 0) / п — 1 / (ni (0)). Таким образом, для бернуллиевской модели среднее арифметическое наблюдений является оптимальной оценкой неизвестного параметра в классе всех несмещенных оценок 0 (сравни с задачей 2.1). 2.9. Пусть Х = (А\, ..., Хп)— выборка из биномиального распределения Bi (к, 0), и требуется оценить неизвестный параметр 0. Показать, что эффективной оценкой 0 является статистика Тп^Х1к. к Указание. Вычислить 1(9) = ;——— и проверить неравенство (2.2). 9( " } 2.10. Над пуассоновской случайной величиной с неизвестным параметром 0 произведено п независимых наблюдений Xt, ..., Х„. Показать, что статистика Т„ = Х является эффективной оценкой 0. Указание. Вычислить i(0) = 1 /0. 2.11. Доказать, что для геометрического распределения с неизвестным параметром 0=р (см. задачу 2.12 гл. 15) ин» формация Фишера г(0)= [0(1 — 0)2 ]-1, а эффективной оценкой функции g (0) = —— является статистика Тп = X. Вычислить 1 —0 дисперсию оценки Тп. Ответ: DT„ = 0/[и(1 -0)2]. 2.12. В условиях задачи 1.18 доказать, что X—эффективная оценка 0. Ответ: z(0) = 0-2. 2.13. Вычислить информацию Фишера для нормальной модели Ж(0, ст2) (дисперсия ст2 известна) и убедиться в том, что выборочное среднее X является эффективной оценкой теоретического среднего 0. Ответ: ?(0) = ст~2.
2.14. Пусть Х = (А'1, Х„)— выборка из нормального распределения -Х'(а, 02) с известным средним а. Требуется оценить функцию g(0) = 02. Доказать, что эффективной оценкой g(0) является статистика (сравни с задачей 1.8). Указание. Вычислить z(0) = 2/02, воспользоваться критерием (2.3). § 3. Метод максимального правдоподобия Одним из наиболее универсальных методов оценивания неизвестных параметров распределений является метод максимального правдоподобия, в соответствии с которым в качестве оценки ..., Хп) параметра 0 по выборке X = (X!, ..., Х„) из распределения F(x; 0) выбирается значение параметра, максимизирующее функцию правдоподобия £(Х; 0)=/(Хх; 0).../(Х„; 0) (функция /(х; 0) определена в (2.1)). Таким образом, £(Х; 0„)>Т(Х; 0), 0е0, или L(X; 0„) = supT(X; 0). (3.1) 0е0 Определение. Статистика 0„ = 0„(X), удовлетворяющая условию (3.1), называется оценкой максимального правдоподобия параметра 0. Если максимум Л(Х; 0) достигается во внутренней точке 0 и функция f (х; 0) дифференцируема по 0, то б„ удовлетворяет уравнению правдоподобия 9* = 0. (3 2) Для случая векторного параметра 0 = (015 ..., 0Г) это уравнение заменяется системой уравнений -1Ц^; 9) = 0, (3.3) Практически оценку максимального правдоподобия 0„ обычно находят, решая уравнения (3.2) (или (3.3)).
Если требуется оценить некоторую функцию g (0) от параметра 0, то ее оценкой максимального правдоподобия является gn=g(0„)—это так называемое свойство инвариантности оценок максимального правдоподобия. 3.1. Пусть Т„=Т„(Х) есть эффективная оценка 0. Тогда 0 = Т„. Действительно, в этом случае Т„ удовлетворяет соотношению (2.3) при g(0) = 0 и, следовательно, является решением уравнения правдоподобия (3.2). 3.2. Убедиться в том, что построенные в задачах 2.9, 2.10, 2.12 и 2.13 эффективные оценки являются одновременно оценками максимального правдоподобия 0„. Указание. Воспользоваться задачей 3.1. 3.3. Оценить по методу максимального правдоподобия теоретическую дисперсию g(0) = 0(1 — 0) распределения Бернулли Bi (1, 0). Указание. Воспользоваться задачами 2.8, 3.1 и свойством инвариантности. _ Ответ: gn — X(l—X). 3.4. В условиях задачи 2.11 найти оценку максимального правдоподобия 0„. _ Решение. В силу задачи 3.1 выборочное среднее X, будучи ,, е эффективной оценкой для g =-----, одновременно является 1 — 0 оценкой максимального правдоподобия gn. Но 0 = --поэтому 1+g _ в силу свойства инвариантности 0B=g„/(l+g„) = А"/(1 4-У ). 3.5. Оценить функцию g(0) = 1/0 в условиях задачи 1.18. Указание. Использовать задачи 2.12 и 3.2. Ответ: g„ — \/'X. 3.6. Оценить функцию g(0) = P(£,<c) по выборке Х = (А\, ..., Х„) из нормального распределения .1(0, ст2) при известном ст2. Указание. Использовать задачи 2.13 и 3.2. Ответ: g„ = ®|---- . \ а / 3.7. В условиях задачи 2.14 найти оценку максимального правдоподобия для функции g (0) = Р с). Ответ: §„=у/т„, £„ = Ф((с-а)/Ут;). 3.8. Построить оценку максимального правдоподобия 0„ для параметра 0 равномерного распределения Л(0, 0), вычис-
лить ее смещение и дисперсию. Является ли здесь 9„ решением уравнения правдоподобия? Указание. Записать функцию правдоподобия в виде А(Х; 0) = /(У(в)^0)/0п, воспользоваться задачей 3.15 гл. 15. Ответ: 0„ = Х1п}, смещение Ьп = ——, D0„=--: " п+1’ ” (п+1)2(п + 2) в точке 0„ функция А(Х; 0) разрывна. 3.9. Пусть Х = (Х15 ..., Х„)— выборка из равномерного распределения R (0,0+1) (параметр 0 неизвестен). Показать, что любое 0е [Х(в)—1, Х(1)] максимизирует функцию правдоподобия, но несмещенная оценка максимального правдоподобия единственна и имеет вид Q„=(X(1) + X(B) —1)/2. Указание. Здесь L(X; 0) = Z(0<Jf(B)^0+1), использовать задачу 3.15 гл. 15. 3.10. Доказать, что оценка максимального правдоподобия 0„ параметра сдвига 0 экспоненциального распределения Feb (см. задачу 3.16 гл. 15) совпадает с Xw. Является ли она несмещенной и состоятельной? Указание. Использовать задачи 1.20 и 1.10. Ответ: смещение bn — bln\ состоятельна. 3.11. Оценить по методу максимального правдоподобия неизвестные параметры 0 = (0Х, 02) нормальной модели ^•(01,0i). Решение. Здесь плотность Ж 0)=-7^-е~ , х/2^02 поэтому функция правдоподобия равна 1 f 1 rt 1 ЖЧ-Ж+(Т-е4 где X и S2—выборочные среднее и дисперсия. Легко заметить, что максимизация L(X; 0) по 0 эквивалентна здесь минимизации по 0 функции ф(Х; ' 201 8 - 85 ’. 6 Ватутин 225
(слагаемое — | — In 5 добавлено здесь для удобства дальнейших преобразований). Воспользуемся элементарным неравенством 1 при <з>0, откуда следует также, что 1па^(а2 —1)/2; знак равенства достигается лишь при а = 1. С учетом этого имеем ф(Х; 0)>О со знаком равенства в точке 0 = (Jf, 5). Следовательно, оценка максимального правдоподобия O„ = (0i„, 02п) в данном случае существует, единственна и при этом 0„ = (Г,5). 3.12 (Продолжение.) Убедиться в том, что в данном случае оценка максимального правдоподобия 0„ удовлетворяет уравнениям правдоподобия (3.3). Оценить теоретическую дисперсию 02 и функцию g(0) = P(^c). Ответ: Q22n = S2, gn = ®(~-\ \ о 1 3.13. Случайная величина ij, характеризующая срок службы элементов электронной аппаратуры, имеет распределение Релея: F(x) = 1 — e“'v2/0, х^О. Показать, что оценка максимального 1 " правдоподобия 0 равна 0„ = - £ X2. П i = 1 3.14. Пусть X = (Z1, ..., Х„)— выборка из двухпараметрического экспоненциального распределения F01 >02 с неизвестными параметрами 0 = (0Т, 02) (см. задачу 3.16 гл. 15). Убедиться в том, что оценки максимального правдоподобия 0Т и 02 равны 01п = У(1). 02п = Х—Х{1), и вычислить их смещения. Указание. Записать функцию правдоподобия в виде £(Х;0)=1ехр|-^[(Т-У(1))+(У(1)-01)]р(У(1)>01); воспользоваться результатом задачи 1.22. Ответ: М§1П — 0t =02/«, М§2п — 02= — ^г/п- 3.15. Пусть в эксперименте наблюдается случайная величина принимающая значения 1, 2, ..., N с неизвестными вероятностями Рг, , Pn соответственно (0<р,<1, у=1, ..., N, Pi+ ... +pN=V). Если произведено п независимых наблюдений над и Vj есть число реализаций исхода «у», то случайный вектор v = (v15 ..., vN) имеет полиномиальное распределение М{п', Pi,-,Pn)- Р{v = (А15 ..., = । •p'n > hi+ ... +hN = n.
Доказать, что оценки максимального правдоподобия ^п = {Р1п, PNn) параметров р = (рт, ..., pN\ максимизирующие вероятность P{v = h}, имеют вид p„ = v/n = ( —, —), т. е. \ п nJ являются относительными частотами реализаций соответствующих исходов. Будут ли эти оценки несмещенными и состоятельными? Указание. Решить задачу на условный экстремум функции N N £ hj\npj при условии у р,= 1; воспользоваться задачей 1.4. 3.16. Пусть Х = (А'1, ..., Х„) — выборка из нормального распределения ..4Z'(0, 20), параметр 0 неизвестен. Убедиться в том, что оценка максимального правдоподобия 0„ = ^/1 + Т„ — 1, 1 " где Т„ = - У X?, и обосновать ее состоятельность. л.=1 Указание. Применить к Т„ закон больших чисел. 3.17. По выборке (Хц, нормального распределения вестными о* 2 * * * * *>0 и ре(— 1, 1) правдоподобия ст2 и р„. АД), / = 1, ..., п, из двумерного 4'о)' 114' х построить оценки максимального с неиз- 1 2п2(1-Р2) Указание. Перейти к новым параметрам qt= — 2а2 (Lp2) и найти их оценки максимального правдоподобия Цгп- Так как о ------—г, р=——, то далее воспользо- 4ql-q22 2qi ваться свойством инвариантности. Ответ: ст2 = ^- £ (УД+Х22), Р„ = 2 £ Х{1Х121 £ (ХД + ХА). 3.18. Пусть Х = (А’1, ..., Хп)— выборка из логнормального распределения, т. е. Х, = еу', где Y, имеют нормальное распределение 02) (оба параметра неизвестны). Вычислить оценки максимального правдоподобия для функций g1(0) = MX1 = e8>+8^2 и g2(0) = DX1 = e28‘+8^(e8'-l). Указание. Воспользоваться задачей 3.11 и оценить 0j и 02 по данным (У15 ..., У„) = (1пХг, ..., InХ„), далее использовать свойство инвариантности.
3.19. Для оценки неизвестного числа N рыб в озере проводится (по схеме выбора без возвращения) контрольный отлов рыб, которые метятся и выпускаются обратно в озеро. Затем снова вылавливается т2 рыб и подсчитывается число ц оказавшихся среди них меченых рыб. Показать, что оценка максимального правдоподобия Лг= - 1-~ целая часть. Указание. Здесь функция правдоподобия где [•] — Р{ц = £} = = СДС”1~*/С7Г2, которую нужно максимизировать по N. 3.20. Имеется партия из N изделий, содержащая неизвестное число D дефектных изделий. Чтобы оценить параметр D, случайным образом без возвращения из всей партии извлекается n<N изделий и подсчитывается число d оказавшихся среди них дефектных. Показать, что оценка максимального правдоподобия D„= 2----. L п Указание. Здесь функция правдоподобия Р {d = k} = = Ср^*~р, которую нужно максимизировать по D. 3.21. Если модель зависит от многомерного параметра 0 = (0!,..., 0Д то аналогом информации Фишера (2.1) является информационная матрица Y (0)= || gij(0) Hi, элементы которой вычисляются по формулам Ы©)=м Д1пЖ 6). ain/fee)\ = г21п/д;9) \ <Ю, Sty J dQtdQj Доказать, что для нормальной модели 02 2 ционная матрица имеет вид Y (0) = ^(02,0^) о 2022 ’ информа- 3.22. Убедиться в том, что информационная матрица полиномиальной модели M(iv, рх, ..., pN) (см. задачу 3.15) имеет вид Y(0)=llgij(0)lli'”1, где 0 = (pj, ..., pN-i) и gii(Q)=pr1+pN \ gij(ty=PN l, i^J', при этом Y 1 (0) = || ctJ || f \ где стй = р;(1-р(), Указание. Учесть, что pN= 1 — pr — ... — pN-i, и использо-n вать представление ./(£,; 0)= р-('~J) (здесь —случайная 7=1 величина, описывающая исход отдельного испытания, т. е.
принимающая значения 1, 2, N с вероятностями соответственно р2, pN). При некоторых достаточно общих условиях оценки максимального правдоподобия 0„ = 0„(А’1, Хп) при большом числе наблюдений п имеют приблизительно нормальное распре-Л 1 \ деление с параметрами 0, —— , где i X (см. (2.1)), т. е. для Любого х (0)—информация Фишера ____ /• /2 P{vM0)(§„-0)^x}------->ф(х)=-2= e”ydr. п— ® д/Зл J — 00 В частности, они являются при этом состоятельными, а по- . 1 скольку их асимптотическая дисперсия —совпадает с границей Рао — Крамера (см. (2.2)), то они являются и асимптотически эффективными. Если оценивается непрерывно дифференцируемая функция g(0), то ее оценка максимального правдоподобия gB=g(0B) при и -> оо асимптотически нормальна с параметрами (g(9), <*« (g)), где o„(g)= [g'(0)]2/(ni(0)), и асимптотически эффективна. л 3.23. Доказать, что оценка максимального правдоподобия 0„ в схеме Бернулли Вг(1, 0) асимптотически нормальна .4'(0, 0(1 — 0)/и). Для какой функции g(0) асимптотическая дисперсия o„(g) ее оценки максимального правдоподобия g„ не зависит от неизвестного параметра 0? _ Решение. Согласно задачам 3.1 и 2.8, здесь 0„ = АГ. Но случайная величина пХ =Х1+ ... +Х„ имеет биномиальное распределение Bi(n, 0), поэтому при л->о0‘ по теореме Муавра— Лапласа Р{(л0в-л0)/ч/л0(1 -0) ->Ф(х), откуда и следует утверждение об асимптотической нормальности. Далее, асимптотическая дисперсия оценки максимального правдоподобия g„ равна в данном случае [g'(0) ]20(1 —0)/«, поэтому для нахождения функции g(0) имеем дифференциальное уравнение g' (0) ^/0(1—0) = const,
которому удовлетворяет функция g (0) = arc sin ^/0. Для этой функции n„2(g) = ^-. 4п 3.24. Доказать, что оценка максимального правдоподобия 0„ неизвестного параметра закона Пуассона П(0) асимптотически нормальна -У (0, 0/л). Для какой функции g(0) асимптотическая дисперсия ее оценки максимального правдоподобия g„ не зависит от 0? Указание. Использовать задачи 3.2 и 2.10 и применить центральную предельную теорему (или задачу 5.18 гл. 15). Ответ: g(Q) = y/O, cr„2(g) = l. v 4п 3.25. Убедиться в том, что оценка максимального правдоподобия 0Л параметра 0 показательного распределения F(x) = = 1—е”х/0, х^О, асимптотически нормальна Ж(0, 02/и), а для функции g (0) = In 0 асимптотическая дисперсия cr2(g) ее оценки максимального правдоподобия gn не зависит от 0. Указание. Использовать задачи 3.2, 2.12 и 5.18 гл. 15. 3.26. Воспользовавшись центральной предельной теоремой, доказать, что указанная в задаче 2.14 оценка максимального правдоподобия Тп для неизвестной дисперсии 02 нормального распределения .У (а, 02) асимптотически нормальна . 4 (02, 204/и). Определить функцию g(0), для которой асимптотическая дисперсия ст2 (g) её оценки максимального правдоподобия g„ не зависит от 0. Указание. Учесть, что здесь М(Х; —а)4 = 304. Ответ: g(0) = ln0, a2(g) = ^-. 2п 3.27. Убедиться в асимптотической нормальности оценки максимального правдоподобия 0„, указанной в задаче 3.13. Указание. Применить задачу 5.18 гл. 15. Ответ: .У(0, 02/и). 3.28. По выборке Х = (АГ1, ..., Хп) из распределения Коши АГ(0) (см. задачу 1.24) составить уравнение правдоподобия для отыскания оценки максимального правдоподобия 0„ и вычислить её асимптотическую дисперсию. Какая из двух оценок 0 — оценкад максимального правдоподобия 0„ или выборочная квантиль £1/2 — является более эффективной при больших я? Ответ: г(0) = р более эффективна 0„.
§ 4. Метод моментов Суть этого метода оценивания неизвестных параметров 0 = = (0j, 0Г) распределения F(x; 0) по соответствующей выборке Х = (АГ1, Х„) заключается в приравнивании некоторых г теоретических моментов = ак (0) = и соответствующих вы- борочных моментов (см. (5.1) гл. 15) с последующим разрешением полученной системы уравнений ak(0) = at, k=jx, относительно неизвестных 0^, ..., 0Г. В итоге получаются искомые оценки 9; = 0г(а71, ..., а,), г=1,..., г. Если получаемые решения являются непрерывными функциями своих аргументов, то оценки 9; состоятельны. 4.1. Найти методом моментов оценку параметра 0 равномерного распределения R (0, 0) и исследовать её на несмещенность, состоятельность и эффективность. Решение. Здесь cq (0) = М^ = 0/2, поэтому уравнение otj (0) = a j = X определяет единственное решение 9 = IX . Свойства этой оценки исследованы в задаче 2.3: она является несмещенной и состоятельной, но оценка T2=^i^X(n) (там же) более эффективна. 4.2. В схеме Бернулли с неизвестной вероятностью «успеха» О произведено п испытаний, в которых «успех» наблюдался v„ раз. Найти оценку 0 методом моментов и исследовать её свойства (как в предыдущей задаче). Указание. Использовать задачу 2.8. Ответ: 9 = v„/n. 4.3. Найти методом моментов оценку параметра 0 распределения Пуассона П(0) по соответствующей выборке и исследовать её свойства. Указание. См. задачу 2.10. Ответ: 9 = X . 4.4. Убедиться в том, что оценки по методу моментов параметров 0 = (015 02) нормального распределения Ж (0ПЛ02) совпадают с оценками максимального правдоподобия 0„ = ==(01п, 02п) = (А', S), полученными в задаче 3.11. 4.5. Число ё, столкновений с молекулами газа в камере Вильсона частиц, получающихся при распаде ядра урана в результате бомбардировки его нейтронами, имеет распределение
Р^=х}=Уе-°-^+е-е^\ х=0, 1, 2, О<0Х<02 («двойное» распределение Пуассона). Найти методом моментов оценки параметров 0Х, 02. Вычислить значения этих оценок для следующих данных, полученных при и = 327 наблюдениях над случайной величиной X 0 1 2 3 4 5 6 7 8 9 10 Vx 28 47 81 ' 67 53 . 24 13 8 3 2 1 327 Ответ: Sx 2 = Х + .Js2 — X . 4.6. Наблюдаемая случайная величина имеет гамма-распределение F(0j,02), плотность которого имеет вид f(x; 0) = 4-—е х^О, 0 = (0Х, 02), 0;>О, 1=1, 2. Доказать, что оценки по методу моментов параметров 0Х и 02 имеют здесь вид Sx=52/X, 32 = Х 2/S2. Указание. Здесь ах(0) = 0х02(02 + 1)...(02 + А:—1), к= = 1, 2, .... 4.7. Найти методом моментов оценку параметра 0 равномерного распределения Л( — 0, 0), 0>О. Указание. Рассмотреть уравнение a2(0) = a2. Ответ: S = ^За2. 4.8. Пусть X = (Jfx, ..., Х„)—выборка из распределения с плотностью /(х; 0)=% 0|х|, 0>О — неизвестно. Оценить 0 методом моментов, решив уравнение а2 (0) = а 2. Ответ: 0 = ^/2/а2. § 5. Доверительные интервалы Точечные оценки дают приближенные значения оцениваемых параметров, поэтому желательно знать и возможную погрешность, возникающую при использовании предлагаемой оценки. Наглядное представление о точности оценок дают доверительные интервалы. Пусть наблюдаемая в эксперименте случайная величина имеет распределение Т(х; 0), зависящее от неизвестного параметра 0еО, и Х = (А'1, ..., Х„)—выборка из этого распределения. При
интервальном оценивании ищут две такие статистики Г;=Г,(Х), /=1,2, что Т\<Т2 и при заданном уе(0, 1) выполняется условие Р{Т1(Х)<0<Т2(Х)}>у для всех 0е0. (5.1) В этом случае интервал (T^fX), Т2(Х)) называют "{-доверительным интервалом (для 0), число у—доверительным уровнем или доверительной вероятностью, Т\(Х) и Т2(Х)— нижней и верхней доверительными границами соответственно. Таким образом, у-доверительный интервал—это случайный интервал в параметрическом множестве 0, зависящий от выборки X, который с вероятностью не меньшей у накрывает истинное значение параметра 0. При заданном у длина Т2 — Т1 этого интервала характеризует точность, с которой локализовано значение параметра, а доверительный уровень у—его «надежность»: вероятность ошибиться, утверждая, что Ве(Тг, Т2), не превосходит 1—у. Поэтому величину у выбирают близкой к 1 (обычно полагают у = 0,9; 0,95; 0,99) и при заданном у стремятся построить доверительный интервал кратчайшей длины. Иногда рассматривают односторонние доверительные интервалы, соответственно верхний (при Т\ = — оо) и нижний (при Т2 = оо). Аналогично определяются доверительные интервалы для параметрических функций g(0). Общий прием, с помощью которого в ряде случаев можно построить доверительный интервал, состоит в следующем. Пусть случайная величина имеет плотность распределения, и существует такая функция G(X; 0) от выборки X и параметра 0, что 1) её распределение не зависит от 0 и 2) G(X; 0) непрерывна и строго монотонна по 0. Такую случайную величину (?(Х; 0) называют центральной статистикой (для 0). Пусть fG(t)—плотность распределения G(X; 0). Тогда для любого уе(0, 1) можно выбрать два числа g^<g2 так, чтобы выполнялось условие «2 P{gl<G(X; 0)<g2} = f/G(r)dr = y. (5.2) gl Чтобы эта процедура была однозначной, часто выбирают gt и g2, исходя из требования P{G(X; 0)^gl} = P{G(X; 0)>g2}=bl. (5.3)
Разрешая теперь относительно 0 неравенства gt <G(X; &)<g2, получим искомый у-доверительный интервал Т\ (Х)<0< Т2(Х); если при этом выполняется (5.3), то интервал (Т\, Т2) называют центральным. 5.1. Доверительные интервалы для параметров нормальных моделей. 5.1. Оценивание среднего нормального распределения при известной дисперсии. По выборке Х = (А'1, Х„) из распределения .Ж (0, ст2) (ст2 известно) построить доверительный интервал для неизвестного среднего 0. Решение. На основании задачи 5.19 гл. 15 заключаем, что в данном случае центральной статистикой является G(X; Q) = y/n (X — 0)/ст, так как она имеет распределение .Ж (О, 1). Неравенства <G(X; 0)<g2 эквивалентны здесь неравенствам Т\ = Х ~g2<Q<X ~gi = T2, Jn Jn поэтому у-доверительным интервалом для 0 является любой интервал Ат(Х) = (Т1, Т2), где gt <g2 — любые числа, удовлетворяющие, в силу (5.2), условию Ф(£2) — Ф(£1) = у. Центральным же, в силу (5.3), является интервал А* (Х) = (Х Тстс^/^/я), где ст определяется равенством Ф(ст) = (1 + у)/2*. Подчеркнем, что интервал А* (X) симметричен относительно случайной точки X и имеет фиксированную длину /=2стст/х/я. В частности, с0,99 = 2,5758, Cq,998 = 3,0902, подробные таблицы квантилей ир приведены в приложении (табл. 4). 5.2. (Продолжение.) 1) Доказать, что интервал А‘(Х) имеет наименьшую длину среди всех у-доверительных интервалов АТ(Х). 2) Сколько нужно произвести испытаний я = я(/; у), чтобы точность локализации параметра 0 при доверительном уровне у была < заданной величины I ? Считая ст = 1, вычислить я (0,5; 0,99) и я (0,1; 0,99). Указание. Минимизировать функцию l(gr, g2)~S2~Si при условии Ф(g2) — Ф(£1) = у. Ответ: я^(2стст//)2. * Если ир есть /7-квантиль распределения Ж (О, 1), т. е. решение уравнения Ф(х)=р, то с\ = w<i-ьт)/2-
5.3. В условиях задачи 5.1 построить верхний и нижний у-доверительные интервалы для 0. Ответ: ( — ос, X + <зиу/у/п) и (Т — <зиу/у/п, оо). 5.4. Смоделировать выборку объема л = 50 из распределения Л'(0, 1), положив при моделировании 0= —1, и рассчитать по ней 0,99-до верительные двусторонний и односторонние интервалы для 0. 5.5. Взять из таблицы 10 приложения и = 20 произвольных чисел и рассчитать по этой выборке 0,998-доверительный интервал для среднего. Расчеты доверительных интервалов часто основываются на использовании ряда стандартных распределений математической статистики, к числу которых, помимо нормального распределения ..К(0,1), относятся распределения хи-квадрат %2(и) = Г(2, и/2) (см. задачу 4.6), Стыодента S(n) и Снедекора S(n., п2). Дадим определения двух последних. Будем символом обозначать случайную величину с распределением /2 (« ), тогда распределение Стьюдента с п степенями свободы S(n) имеет случайная величина tn = ^/у/хГ/п, где случайная величина Е, имеет распределение Ж (0, 1) и Е, и %2 независимы (это распределение называют часто также t-распределениему. распределение же Снедекора с т и п степенями свободы S(m, п) (часто его называют также распределением Фишера или F-распределением) имеет случайная X X 9 9 величина Fm где случайные величины Хт и х„ независи- ’ т п мы. Для р-квантилей распределений .X (0,1), х2(и), S(n) и 5(т, п) используются стандартные обозначения кр, Хр,„, 1р-п и Fpmn соответственно. Отметим следующие простые (но полезные) соотношения для них: иг-р = — ир, t1_p „= — tp п, -р,т,п= 1 /Fp.n.m', используется также обозначение ст=ы(1+т)/2. Таблицы перечисленных квантилей приведены в приложении, более подробные таблицы имеются в [1 ]. В последующих задачах, связанных с анализом нормальных моделей, используются следующие важные утверждения: 1. Пусть ..., Е,„—независимые нормальные .Ж (0, 1) случайные величины. Тогда сумма их квадратов имеет распределение хи-квадрат с п степенями свободы х2 («)> что будем записывать в виде Ei + ... +^„ = Хп- Если две случайные величины независимы и имеют распределения %2 (и) и х2 (щ), то их сумма имеет распределение х2 (« + "?)•
Таблица доверительных интервалов для параметров нормальных моделей (неизвестные параметры обозначены символом 0)
2. (Теорема Фишера.) Если Х = (АГ1, Хп)—выборка из нормального распределения (а, о2), то выборочные среднее X =- £ Xi и дисперсия S2 = ~ £ (У, — X )2 независимы и при П1=_1 П1=1 этом X имеет распределение Ж (а, ст 2/и) (см. задачу 5.19 гл. 15), a «52/ct2 — распределение %2(л—1). 5.6. Оценивание дисперсии нормального распределения. Пусть Х = (А'1, ..., Х„) — выборка из нормального распределения Х" (а, 02) (а известно). 1) Убедиться в том, что центральной статистикой для оценивания дисперсии g = 02 является G(X; S) = lf (Х,-аУ^ТЦе к i=i и при этом G(X;g) = x2. 2) Основываясь на этом, показать, что у-доверительным интервалом для g является любой интервал вида Ду (X) = = (T2/g2, Т21ё\.\ где gi<g2 находятся из условия (5.2), в котором fG—плотность распределения /2(п). Центральный же доверительный интервал имеет вид Д’(Х) = (Т2/х21+т)/2,„, Т’2/Х(21-7)/2,п)- В частности, при у = 0,95 и п = 5 имеем Х(21-7)/2,п = 0,83, х21+т)/2,п = 12,83. 3) Является ли интервал А*(Х) кратчайшим среди всех интервалов Ау(Х)? Указания. 1) Воспользоваться тем, что случайные величины (Х, — а)/В, i=l, ..., п, независимы и нормальны Ж(0, 1). 3) Решить задачу на условный минимум функции l(gi, g2) = =g2lgi при условии (5.2). Ответ: нет. 5.7. (Продолжение.) Построить у-доверительный интервал для среднеквадратического отклонения 0, основываясь на центральной статистике G(X;0) = T/0. Ответ: (Т/^хК+ т)/2,в, 7’/х/х21-т)/2,п)- 5.8. (Продолжение.) Показать, что центральный у-доверительный интервал для дисперсии g = 02 общей нормальной модели Ж(015 02) (оба параметра неизвестны) по выборке объема п имеет вид ^y(^) = (nS2/х21+т)/2,п-1, nS2/Х21-7)/2,п-1)- Указание. Здесь центральная статистика G(X; g) = nS2/g = = X2-i и решение проводится по схеме задачи 5.6.
5.9. Оценивание среднего нормального распределения при неизвестной дисперсии. Рассматривается задача доверительного оценивания среднего 0! общей нормальной модели Ж(015 0^) по соответствующей выборке X = (Yj, ..., Х„). 1) Убедиться в том, что центральной статистикой в данном случае является G(X; ©xx-oj^-i)^2' и при этом G(X; 0j) = /„-!• 2) Основываясь на этом, получить вид центрального у-до-верительного интервала: Ау(Х) = 1А'’ -|--- +у)/2,п- 1 \ у/П — 1 В частности, при у = 0,95 и и=10 имеем А*(Х) = (Х + 0,7545). 3) Доказать, что интервал А*(Х) имеет кратчайшую длину среди всех у-доверительных интервалов вида (X —alS, X + a2S). Указания. 1) Воспользоваться задачей 5.19 гл. 15, определением распределения Стьюдента и теоремой Фишера. 2) См. задачу 5.1. 3) Решение аналогично задаче 5.2. 5.10. Смоделировать выборку из распределения Ж(—1, 1) объемом л = 20 и рассчитать по ней 0,95-доверительные интервалы для теоретических среднего и дисперсии в различных ситуациях (второй параметр считается либо известным, либо также неизвестным). 5.11. Наблюдавшиеся значения нормальной случайной величины в 16 опытах оказались следующими: 13,8; 11,9; 11,5; 10,6; 13,9; 12,8; 12,5; 13,1; 12,0; 13,5; 11,7; 12,4; 11,9; 12,4; 13,7; 13,5. Убедиться в том, что 0,95-доверительные интервалы для среднего и дисперсии, вычисленные по этим данным, равны соответственно (12,1; 13,1) и (0,5; 2,2). 5.12. Задана сравнения двух средних. Пусть Х = (2Г1, ..., Х„) и Y = (Kj, ..., Ут)—две независимые выборки, причем первая — из распределения Ж(0(1), ст2), а вторая — из распределения Ж(0(2), ст2) (дисперсии of и <з2 известны). Требуется построить доверительный интервал для разности т = 0(1) — 0(2) неизвестных средних. 1) Показать, что разность выборочных средних X — Y ст2 а2 имеет распределение Ж(т, ст2), где ст2=—+ —, и, следова-п т тельно, центральная статистика для т имеет вид G(X, Y; г) = (Г -Y-т)/ст.
2) Основываясь на этом, получить вид центрального у-до-верительного интервала для т: А*(Х, Y) = (X — Y +стс7). Указания. 1) Воспользоваться задачей 5.19 гл. 15. 2) См. задачу 5.1. 5.13. (Продолжение.) Пусть дисперсии совокупностей одинаковы, но также неизвестны, т. е. X—выборка из ЖСб*/’, 02), a Y — из ^(0(12), 02). По-прежнему оценивается т = 0(11) —0(2). 1) Убедиться в том, что центральной статистикой в данном случае является V- 1— Z"7”(w + n —2) _ X — Y — т ' ’ ’ m + 7i [nS2(X)+znS2(Y)]1/2 и при этом G(X, Y; r) = rm + „.2- 2) Основываясь на этом, получить вид центрального у-до-верительного интервала для т: д;(х, y)= (-] 1/2\ X -У+/(1+у)/2,т+„_2 —. (nS2(X)+/H52(Y)) . \_тп(т + п — 2)' ' ’ А ) Указания. 1) Учесть, что случайная величина (X — Y — . / L/'1 Л — т)/ /02(- Н—I имеет стандартное нормальное распределение .Ж(0, 1), a (nS2 (X) +mS2 (Y))/02 = %2 +„-2, и эти две величины независимы; далее воспользоваться определением распределения Стьюдента. 2) Решение аналогично задаче 5.9. 5.14. В условиях предыдущей задачи для выборок объемов п = 16 и т = 9 получены следующие значений выборочных средних и дисперсий: X =12,57, 52(Х) = 0,85; У = 11,87, S2(Y) = 0,84. 1) Убедиться в том, что 0,95-доверительный интервал для разности средних равен ( — 0,12; 1,53). 2) Считая, что эти данные—для выборок из одной и той же совокупности, вычислить оценки для среднего и дисперсии по объединенным данным (см. задачу 2.7) и построить соответствующие 0,95-доверительные интервалы. Ответ: (11,92; 12,72)—доверительный интервал для среднего, а (0,56; 1,82)—для дисперсии. 5.15. Смоделировать 20 стандартных нормальных случайных чисел и, образовав из них две выборки объемов п = т =10, выполнить для этих данных задание, аналогичное предыдущей задаче.
5.16. Задача сравнения дисперсий. Предполагается, что выборки Х = (Х1, Х„) и Y = (Kj, Ym) извлечены из совокупностей ^(Оц, 021) и .Ж (012, 0гг) соответственно (все параметры неизвестны). В этой ситуации требуется построить доверительный интервал для отношения дисперсий т = 021/022- О Убедиться в том, что центральная статистика здесь имеет вид: G(X, Y; т) = л(ю-1) S2(x) / т(п-1) 52(У)Г и при этом G(X, Y; T) = F„_ljm_i. 2) Основываясь на этом, получить вид центрального у-до-верительного интервала для т: 52(Х) / и(/п-1) 52(Х) \ [m(n~l)S2(Y)l Т m(,i-l)52(Y) В частности, F07o5;9,9 = ^O,95;9.9 = 3,18. Указания. 1) Учесть, что «52(X)/02i = Xn-i, hi5'2(Y)/022 = Xm-i, и воспользоваться определением распределения Снеде-кора. 2) Решение аналогично задаче 5.6. 5.17. Используя таблицу 12 приложения, образовать две выборки объемов п = т =10 и рассчитать по этим данным 0,9-доверительный интервал для отношения теоретических дисперсий. 5.18. В двух лабораториях определялась концентрация серы (в %) в стандартном образце дизельного топлива. Шесть независимых равноточных измерений в первой лаборатории дали следующие результаты: 0,869, 0,874, 0,867, 0,875, 0,870, 0,869. В результате аналогичных пяти равноточных измерений во второй лаборатории были получены такие значения: 0,865, 0,870, 0,866, 0,871, 0,868. Предполагая справедливым нормальный закон ошибок измерений, построить 0,9-доверительный интервал для отношения дисперсий измерений в 1-й и 2-й лабораториях. Если есть основания считать эти дисперсии одинаковыми, то рассчитать аналогичный интервал для разности систематических ошибок, допускаемых в обеих лабораториях. 5.19. Убедиться в том, что у-доверительный интервал для параметра 0 модели .Ж(0, 02) (0>О — неизвестно) по выборке Х = (Х15 ..., Хп) имеет вид (X/(1 + су/у/п), X /(1-с^/^/й)). Получить аналогичное решение для случая 0<О. Указание. Воспользоваться задачей 5.19 гл. 15.
5.2. Разные задачи 5.20. Оценивание параметра схемы Бернулли. Для нахождения доверительных границ Т1<Т2 для параметра 0 в схеме Бернулли Bz(l, 0) по п наблюдениям Хх, ..., Хп используются таблицы неполной бета-функции |3(z; а, Ь) в [1 ] (см. задачу 3.13 гл. 15). При этом центральный у-доверительный интервал (Г2, Т2) определяется соотношениями v„, H-V„+1), T2 = 1-z(~^-; n-v„, v„+l), где z(p-,a,b) есть р-квантиль функции |3(z; а, b), т. е. решение уравнения [3(z; a, b)=p, a v„ = X1+ ... + Хп—наблюденное число «успехов». В частности, z (0,025; 5,10) = 0,13, z (0,025; 9,6) = 0,35. Таблица некоторых значений 0,95-доверительных границ (7\, Т2) приведена в приложении (табл. 10). Из урны, содержащей черные и белые шары в неизвестной пропорции, по схеме случайного выбора с возвращением извлечено я =14 шаров, среди которых оказалось v„ = 5 черных. Убедиться в том, что 0,95-доверительный интервал для доли черных шаров по этим данным имеет вид (0,13; 0,65). Определить аналогичный интервал для данных «=20, v„ = 9. Ответ: (0,23; 0,69). 5.21. Оценивание параметра распределения Пуассона. Пусть Х = (А\, ..., Хп) — выборка из распределения Пуассона П(0), тогда центральный у-доверительный интервал (Тг, Т2) для 0 определяется соотношениями Л =^Х(21-У)/2,2пТ, Т2 = —Х(21+т)/2,2пУ +2- 1) Для двух ЭВМ число сбоев за сутки оказалось равным соответственно 2 и 3. Считая, что число сбоев за сутки в работе ЭВМ имеет некоторое распределение Пуассона П(0), получить, что 0,95-доверительный интервал для 0 по этим данным имеет вид (0,81; 5,83). 2) При стендовых испытаниях пяти приборов зафиксированы следующие количества неисправностей: (0, 2, 1,0, 1). Считая количество неисправностей для каждого прибора в течение испытаний распределенным по закону П(0), получить, что 0,9-доверительный интервал для 0 в данном случае имеет вид (0,27; 1,83).
5.22. Пусть Х = (Х1; Хп)— выборка из экспоненциального распределения с плотностью /(х; 0) = е0-*, х^0. Показать, что у-доверительным интервалом для неизвестного параметра 0 является интервал -1п(1 —у), Какой вид имеет здесь центральный у-доверительный интервал? Решение. Согласно задаче 3.16 гл. 15, случайная величина G(X; 0) = л(Х(1) —0) имеет стандартное показательное распределение FOjl, т. е. является центральной статистикой в данной задаче. Отсюда имеем, что Р{О<и(^(1)-0)^г} = 1-е-‘ = у при t= — 1п(1— у). Разрешая неравенства под знаком вероятности относительно 0, приходим к указанному результату. Чтобы получить вид центрального у-доверительного интервала, исходим из соотношения P{g1<«(X(1)-0)^g2} = y, где, в силу (5.3), 1— e-gl=^^, e_g2=^-^. Отсюда следует, (11 — у 11 + у\ Х(1) + - In—, Х(1) + -In^-i I. 5.23. Имеется выборка Х = (А\, ..., Х„) из показательного распределения Г(0, 1) (см. задачу 4.6). 1) Учитывая, что 2А)/0 = = Х2 и, следовательно, 2пХ /0 = х!п, построить центральный у-доверительный интервал (Тг, Т2) для 0. 2) Смоделировать выборку объема л =10 при 0=1 (см. задачу 2.7 гл. 15) и рассчитать по полученным данным 0,95-доверительный интервал для 0. Ответ: Т1>2 = 2«Г/хД ±т)/2,2„. 5.24. Пусть Х = (Х1, ..., Х„) и У = (У1; ..., Ym)—две независимые выборки из показательных распределений Г(02, 1) и Г(02, 1) соответственно. 1) Доказать, что центральный у-доверительный интервал для отношения т = 02/01 имеет вид (У(1_у)/2,2п>2тУ /X, +ч)/2,2п,2т¥/^ )• 2) Смоделировать выборки X и Y при п = т = 5, 0^ = 1, 02 = 2 и рассчитать по полученным данным 0,9-доверительный интервал для т.
Указание. Воспользоваться предыдущей задачей и определением распределения Снедекора; решение аналогично задаче 5.16. 5.25. Убедиться в том, что (Х(п), Х(п)/(1 — у)1/п) есть у-доверительный интервал для параметра 0 равномерного распределения Л (0, 0) по выборке объема п. Какой вид имеет здесь центральный у-доверительный интервал? Смоделировать выборку объема п — 10 при 0 = 2 (см. задачу 2.9 гл. 15) и рассчитать по полученным данным 0,95-доверительный интервал для 0. Указание. Поскольку Х;/0 имеет распределение Л(0, 1), то при t е [0, 1 ] т. е. Х(П)1& является здесь центральной статистикой. Ответ: центральный интервал есть (Х(п) ( 5.26. Прогнозирование будущих наблюдений. Пусть п, X, S2 — объем, выборочные среднее и дисперсия выборки из нормального распределения .уК (0А, 02) (оба параметра неизвестны). Доказать, что с вероятностью у результат следующего, (и+1)-го испытания Х„+1 попадет в интервал Указание. Установить сначала, что случайная величина X — Хп+1 распределена по закону уК^О, воспользоваться теоремой Фишера и определением распределения Стьюдента. 5.27. (Продолжение.) В результате пяти независимых взвешиваний одного и того же тела получены следующие результаты (в граммах): 4,12; 3,92; 4,55; 4,04; 4,35. Считая погрешности измерений нормальными случайными величинами, показать, что 0,95-доверительный интервал для результата шестого взвешивания имеет вид (3,43; 4,96). 5.28. Оценивание квантилей. Пусть Х = (А\, ..., Хп) — выборка из некоторого непрерывного распределения F(x). Требуется построить доверительный интервал для р-квантили при заданном ре(0, 1). Основываясь на задаче 3.13 гл. 15, убедиться в том, что:
1) порядковая статистика Х1к) является нижней у^довери-тельной границей, где = |3(р; k, п — к + 1); 2) порядковая статистика У(1) является верхней у2-довери-тельной границей, где у2 = 1 —|3(д; I, п — 1+1); 3) интервал (Х(к), Х(Г)), к<1, является двусторонним у-до-верительным интервалом для С,р при у = У1+у2~ 1- Указание. Использовать соотношение Р {хт<ъ<Х(1)} = 1 -Р {^р<Х{к)} -Р {хт^р}. 5.3. Приближенные доверительные интервалы для больших выборок. В ряде случаев, когда имеется состоятельная и асимптотически нормальная оценка Т„ = Тъ (X) для параметра 0 (например, оценка максимального правдоподобия 0„), можно построить приближенный (при больших объемах выборки п) доверительный интервал. Асимптотически эффективные оценки порождают при этом асимптотически кратчайшие интервалы. Если оценка Тп асимптотически нормальна с параметрами (0, о2(0)/и), причем функция ст(0) непрерывна, то асимптотическим у-доверительным интервалом для 0 является интервал (7; + суст(Тп)/х/и). в частности, если Т„ = 0„, то (см. § 3) получим асимптотически кратчайший у-доверительный интервал (0„ + с7/ ш(0„)), порождаемый оценкой максимального правдоподобия. Более того, если g(0)— непрерывно дифференцируемая функция и g'(0)^O, то (g„ + cYg'(0n)/v«f(0„)) — аналогичный интервал для g(0). 5.29. Пусть Х = (А\, ..., Х„) — выборка из нормального распределения .#'(«, 02) (а известно). Построить при больших п приближенные доверительные интервалы для параметра 0 и параметрической функции g(0) = ln0. Решение. Здесь оценка максимального правдоподобия 8п = -х/Тп и функция информации z(0) = 2/02 (см. задачу 2.14). Отсюда находим, что асимптотический у-доверительный интервал для 0 имеет вид ^//^(1+су/^/2л), а аналогичный интервал для g(0) = ln0 — вид Qin Т„ + су1у/2п^. Из последнего интервала можно получить новый доверительный интервал для 0. Именно разрешая относительно 0 неравенства
-In Т,- -^<1п0<-1п Т„ + 2 л/2п 2 yj2n находим, что они эквивалентны неравенствам у/Тп ехр {— су 1у/2п}<^<у/Тп ехр т. е. получаем другую форму приближенного доверительного интервала для 0. Однако так как при п -> оо ехр {с/х/2п} = 1 + —~ + of-Y 72Й W то, пренебрегая членами порядка 1/и, приходим к первоначальному интервалу (1 + су / у/1п). 5.30. Оценивание параметра схемы Бернулли. Построить асимптотический у-доверительный интервал для параметра 0 в схеме Бернулли Bz(l, 0). Применить этот результат к оцениванию теоретической функции распределения F(x) в заданной точке х0, в которой 0<F(xo)<l. Решение. Используя задачи 3.1 и 2.8, имеем, что в данном случае 0„ = Х » '«О’ёйЬг поэтому искомый интервал имеет вид (X +суУ/Х (1 — У )/и). Далее, если Х = (У1, ..., Хп) — выборка из распределения F(x), то индикаторы I(Xt^x0), 1=1, ..., п, имеют распределение Bz(l, F(x0)), а их среднее арифметическое есть F„(x0)— значение эмпирической функции распределения в точке х0. Поэтому асимптотический^ у-дове-рительный интервал для F(x0) имеет вид (F„(x0) + + Су 7А(х0)(1-/„(х0))/п). Замечание. Имеет место гораздо более сильный ре зультат: P{F„(x) -Zy/v4j^F(x)^F„(x) +tyly/n для всех х}--------> у, п—. 00 где ty определяется соотношением K(ty) = y, в котором 00 *(0 = Z (-1)'е-2'2'2. J= - со При этом предельную функцию распределения Колмогорова K(t) можно использовать для практических расчетов уже при и^20; при этом, например, ZOi9=1,23, ?0>95 = 1,36, Zo,99= 1,63.
Таким образом, при больших п график теоретической функции распределения F(x) с вероятностью, близкой к у, заключен в пределах max(0, Fn(x) — ?7/v/«)^F(x)^min(l, Fn(x) + которые образуют асимптотическую у-доверителъную зону для F(x). 5.31. (Продолжение.) 1. Показать, что из теоремы Муавра — Лапласа следует другая форма асимптотического у-доверитель-ного интервала для 0: (Т. г2)=(У + ‘1 + ^(1-J’) + O(1 + v)’ который сводится к предыдущему результату, если пренебречь членами порядка 1/и. Указание. Установить равенство Р{У^|Х-0|/V0(1-0)<C7} = P{T1 <0<Т2}. 2. Используя задачу 3.23, установить вид асимптотического у-доверительного интервала для функции g (0) — arc sin ^/О: (g(Jf) +сУ1(2у/п)). Получить отсюда вид приближенного у-доверительного интервала для параметра 0 и сравнить это решение с предыдущими. 5.32. Рассчитать асимптотические 0,99-доверительные интервалы (различные варианты, указанные в задачах 5.30 и 5.31) для неизвестных вероятностей «успеха» по данным, приведенным в задачах 4.8 и 4.9 гл. 15. 5.33. При 540 испытаниях в схеме Бернулли положительный результат наблюдался 216 раз. Рассчитать 0,99-доверительный интервал для дисперсии числа положительных исходов. Указание. Использовать задачу 5.30 и асмиптотическую теорию. 5.34. Оценивание параметра распределения Пуассона. Пусть Х = (А"1, ..., Хп)— выборка из распределения Пуассона П(0). Для быстрого расчета приближенных значений границ Тг и Т2 при больших объемах выборки п можно воспользоваться асимптотической теорией оценок максимального правдоподобия (здесь в силу задачи (3.2) 0n = Jf). Убедиться в том, что асимптотический у-доверительный интервал для 0 имеет в данном случае вид: (X + с./у/Х /п). Указание. Использовать задачу 3.24.
5.35 (Продолжение.) Установить вид асимптотического у-до-верительного интервала для функции £(0) = >Уб: (^/1^+-^=). \ 2,/л/ Получить отсюда вид приближенного у-доверительного интервала для 0 и сравнить его с указанным в предыдущей задаче. 5.36. По данным, полученным в задаче 4.14 гл. 15, рассчитать асимптотический 0,95-доверительный интервал для параметра распределения Пуассона. 5.37. Основываясь на результатах задачи 3.4, показать, что асимптотический у-доверительный интервал для параметра / X I у \ 0 геометрического распределения имеет вид ( 5.38. Построить асимптотический у-доверительный интервал для неизвестного параметра масштаба 0 гамма-распределения Г (0, X) (см. задачу 4.6). Указание. Сначала установить, что здесь оценка максимального правдоподобия 0„ = А"/X и z(0) = Х/02. Ответ: X-1 X (1+с7/х/Хп). 5.39 (Продолжение.) Построить асимптотический у-доверительный интервал для функции g(0) = ln0, получить отсюда другой вариант приближенного доверительного интервала для 0: (X-1 e-c’/vI", X-1 X ec’/vI") и сравнить это решение с предыдущим. 5.40. Оценивание коэффициента корреляции. Если (Xi{, Xi2), Z=l, ..., п,— независимые наблюдения над двумерной нормальной случайной величиной 5, = (^1; %2) и р„ — выборочный коэффициент корреляции (см. § 6 гл. 15), то уже для небольших значений числа наблюдений п статистика Z„ = ^ln ((1 + р„)/ (1 — р„)) распределена приблизительно нормально с параметрами ;=|1п((1 + р)/(1-р)) и (и —З)-1, где р = согг(^ Д2). Получить отсюда вид приближенного у-доверительного интервала для (Zn + ^/^/n —3), а из него — для самого коэффициента корреляции р. Рассчитать приближенный 0,99-доверитель-ный интервал для р по данным, полученным в задачах 6.3 и 6.4 гл. 15. 5.41. Доверительные интервалы для теоретических моментов. Пусть Ху, ..., Х„—независимые наблюдения над случайной
величиной £, с неизвестным распределением, дисперсия которой конечна. Основываясь на задаче 5.21 гл. 15, доказать, что при больших п статистика = , где а = асимптотически нормальна .Ж (О, 1), и получить отсюда вид асимптотического у-доверительного интервала для неизвестного среднего а\ (X +cyS/у/п). Обобщить этот результат на случай оценивания момента = M£k. Указание. Применить приведенный в задаче 5.21 гл. 15 результат к функции ф^, х2) = (х1—а)/у/х2 — х^. Ответ: если М%2к<оо, то асимптотический у-доверительный интервал для имеет вид (at+cTX/(a2t — «*)/«)•
ГЛАВА 17 СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ § 1. Постановка задачи В практических задачах часто требуется по эмпирическим данным проверить то или иное предположение относительно каких-нибудь свойств закона распределения наблюдаемых случайных величин. Например: 1) следует проверить, что выборочные данные получены из генеральной совокупности с функцией распределения Ё(х); 2) установить по выборке, имеет ли некоторый параметр распределения 0 определенное значение или множество значений; 3) по двум полученным при различных условиях выборкам установить, соответствуют ли они одному и тому же распределению или нет. Все эти предположения о виде или свойствах распределения наблюдаемых случайных величин называют статистическими гипотезами, или просто гипотезами, которые обозначаются Н, Но, Нг, .... 1. Если предположение однозначно фиксирует закон распределения случайной величины, то соответствующая гипотеза называется простой, в противном случае гипотеза называется сложной. Пусть, например, случайная величина £, распределена по нормальному закону ЛГ (а, о2). Предположим, что дисперсия о2 известна, а математическое ожидание а неизвестно. 1. Гипотеза Яо: {а = а0} — простая. 2. Гипотеза Но; {а>а0} — (или Но: {а<а0}) — сложная односторонняя гипотеза. 3. Гипотеза Но: {а0<а<а1} — сложная двусторонняя гипотеза. Предположим, что математическое ожидание и дисперсия неизвестны. 1. Гипотеза Но: {а = а0} — сложная, поскольку дисперсия неизвестна и, стало быть, закон распределения случайной величины не фиксирован однозначно.
Если закон распределения известен с точностью до некоторого параметра 0 (0 может быть и вектором), то всякое предположение о значении параметра называют параметрической гипотезой. В приведенных выше примерах все гипотезы Но — параметрические. 2. Рассмотрим случайную величину £ и случайную выборку X = (Jfj, Х„), полученную в результате п независимых испытаний над ней. Требуется проверить некоторую гипотезу Но о законе распределения Будем говорить, что задан некоторый статистический критерий для проверки гипотезы Но, если сформулировано правило, согласно которому принимается решение: согласуются ли наблюдаемые значения с гипотезой (обычно ее называют основной или нулевой гипотезой) или она должна быть отвергнута, как противоречащая статистическим данным. Для построения критерия обычно разбивают выборочное пространство ЗС на два непересекающихся множества R и S таких, что все значения выборки X, принадлежащие множеству R, считаются характерными для гипотезы Яо, а принадлежащие множеству 5—нехарактерными для гипотезы Но. В соответствии с этим гипотеза Но принимается, если конкретная реализация выборки будет принадлежать R, и отвергается, если она будет принадлежать 5. Таким образом, критерий можно определить с помощью множества 5 (множество R однозначно определяется как дополнительное к 5 множество в выборочном пространстве й"). Множество S называется критическим множеством, а статистический критерий, получаемый с помощью этого множества, называется 5 критерием. 3. Для каждого критерия возможны ошибки двух родов: 1. Гипотеза Но справедлива, но она отвергнута (реализация выборки X принадлежит множеству S), такая ошибка называется ошибкой первого рода. Вероятность ошибки первого рода обозначается а (Кратко говорят: ошибка первого рода равна а). По определению она равна: а = РНо(Хе5'). Ее выбирают обычно равной 0,01, 0,05, 0,1 и т. д. 2. Гипотеза Но ложна, но она принята (реализация выборки X принадлежит множеству R). Такая ошибка называется ошибкой второго рода. Вероятность ошибки второго рода обозначается 0. (Говорят: ошибка второго рода равна 0).
Её можно вычислить, если известно, какое распределение выборки в этом случае истинно. Критическое множество 5' критерия, обеспечивающее заданное значение ошибки первого рода а, можно выбрать многими способами. Эффективный ее выбор возникает в том случае, когда нам задана конкурирующая или альтернативная гипотеза Н1. Будем называть любое допустимое распределение FX = F выборки X, отличающееся от гипотетического (т. е. распределения при гипотезе Но), альтернативным распределением или альтернативой. Совокупность всех альтернатив называют альтернативной гипотезой Н1. Таким образом, Н1 также может быть простой или сложной гипотезой. Пусть FeH1 — некоторая альтернативная функция распределения. Мощностью критерия при альтернативе F называется вероятность попадания выборочной точки X в критическую область 5', когда истинным распределением является распределение F. W(F) = P(XeS\F). Эта величина характеризует вероятность принятия правильного решения (отклонение Яо) в ситуациях, когда Но ложна. Из двух критериев с одной и той же ошибкой первого рода а лучшим считается тот, мощность которого при альтернативах больше. В случае, когда альтернативная гипотеза Нх простая, функция мощности и ошибка второго рода 0 связаны очевидным соотношением 1 — р, и можно говорить об одной характеристике критерия: W или 0. Обычно последствия указанных ошибок неравнозначны. Что опаснее — зависит от конкретной постановки задачи и содержания основной гипотезы. Например, на предприятии необходимо оценить качество продукции по результатам выборочного контроля (т. е. по данным сравнительно небольшой выборки). Если выборочная доля брака не превышает некоторой нормативной величины р0, то вся партия принимается. То есть на основе выборки проверяется основная гипотеза Но о том, что доля брака в продукции не превосходит р0, и ошибка первого рода а означает, что мы забракуем качественную продукцию. Альтернативная гипотеза Нг состоит в том, что
доля брака продукции составляет величину, большую р0, и ошибка второго рода Р означает приемку негодной продукции. Что хуже или лучше и какие в этом случае возможно допускать ошибки а и 0 — решать естественно следует специалисту. Поскольку исключить ошибки аир невозможно, то естественно стремиться минимизировать потери от этих ошибок. Конечно, желательно уменьшить а и Р одновременно, но, как будет видно из дальнейшего, уменьшение одной из них, как правило, влечет за собой увеличение другой. В большинстве случаев одновременное уменьшение а и Р заключается в увеличении объема выборки п. В том случае, когда Но является сложной гипотезой, вероятность ошибки первого рода, вообще говоря, не определяется. Однако если рассматривать Но как множество простых гипотез А, то для каждой из них можно вычислить вероятность попадания выборки X в критическое множество S. В этом случае величина а= sup Ph(Xe5) играет ту же роль, что и вероятность ошибки первого рода в случае простой гипотезы. Её называют уровнем значимости или размером критерия. 1.1. Пусть абсолютно-непрерывная случайная величина имеет плотность распределения, сосредоточенную при гипотезе Но на отрезке [0, 1], а при гипотезе Нх — на отрезке [1; 2]. Очевидный критерий при одном испытании (п = 1) с критическим множеством S= [1, 2] имеет ошибки аир, равные нулю. 1.2. Пусть случайная величина ё, при гипотезе Но имеет / 0 1 \ и распределение , а при гипотезе — распределение \Ро Р1/ / । 2 \ L, а Ь Ро, Рп 9п 92>0; /’o+Z’i =91+92= 1-\9i 92/ 1) Зададим критерий (критическую область 5' для проверки основной гипотезы Но против альтернативы следующим образом: 5={Х: все z=l, ..., п]. Тогда а = РЯо {Хе S} = (1 —/10)"=/11, Р = РЯ1 {Хе R} = Р«1 {хотя бы одно из Xt равно 0} = 0. 2) Зададим критерий по-другому: 5 = {Х: хотя бы одно из Xt равно 2}. Тогда
oi = P„o{XeS} = 0, р = Р„1{ХеЯ} = Р„1 {все Х,<2, i= 1, n} = q". § 2. Наиболее мощный критерии Рассмотрим построение наиболее мощного критерия для различения двух простых гипотез. Пусть Х = (ХГ, Хп) — выборка, произведенная над случайной величиной £, х = (х15 х„)—ее конкретная реализация при испытаниях, и требуется различить две простые гипотезы Но и Нх, согласно которым £, абсолютно непрерывно распределена и имеет соответственно плотности распределения /0 (х) и /, (х). В условиях гипотезы Но Ряо(Х)=П/о(\). (2.1) 7=1 Для гипотезы Н, имеем Ря,(Х)=П/1(Х1)- (2.2) 7=1 Рассмотрим отношение двух «-мерных плотностей Z(X) = Ри.(Х) Рн0(Х) ПЛ (Ху) J=1 П/о(Х7) 7=1 (2-3) Это отношение позволяет разбивать выборочное пространство Ж” на два подмножества R и 5. Если величина /(X) «велика», то естественно отнести X к множеству 5—множеству отвержения гипотезы Но (и принятия Нг), если же эта величина «мала», то следует X отнести к множеству R — множеству принятия Но (и отвержения //,). Теорема Неймана—Пирсона. Наиболее мощный критерий для проверки простой гипотезы Но при простой альтернативе Нг с вероятностью ошибки первого рода а существует и задается критической областью ПлРб) ) П/oOG) J 7=1
где критическая граница с определяется из условия VHa(l(X)>c)=CL (2.5) Статистика /(X) называется статистикой отношения правдоподобия, а построенный критерий носит название критерия Неймана—Пирсона. Критерий Неймана — Пирсона можно построить и для дискретных распределений. В этом случае отношение правдоподобия определяется отношением вероятностей Р//о(Х) и Ptfi (X) при гипотезах Но и Нг: ПРя,(Х/) ИХ)=^——. Критерий имеет тот же вид, определяемый критическим множеством (2.4), и с по-прежнему определяется из условия (2.5), но в отличие от абсолютно-непрерывного случая уравнение (2.5) может не иметь решения. В этом случае часто добиваются решения этого уравнения за счет несущественного с практической точки зрения изменения величины а. Наиболее мощный критерий для проверки гипотез о параметрах нормального и биномиального распределений. 2. 1. Пусть X = (Jf1, ..., Х„) — выборка из нормальной совокупности, дисперсия которой известна и равна о2, а математическое ожидание 0 неизвестно. Относительно 0 выдвигаются две простые гипотезы: Но; 0 = 0О и 0 = 0Х. Для определенности предполагаем, что 01>0О. Требуется: а) построить наиболее мощный критерий с ошибкой первого рода а и найти ошибку второго рода 0. б) При заданных значениях а и 0 найти минимальный объем необходимого материала л‘ = и(а, 0) для того, чтобы ошибочные заключения могли быть сделаны с вероятностями, не большими, чем а и 0. в) Вычислить ошибку второго рода 0 по выборке объема л = 25 при значениях о2 = 25, 0о = О, при альтернативах 0! = 1, 0t = 5. Ошибку первого рода а взять равной 0,05. г) Пусть ст2 = 1, 0о = О, 0! = 1, а=0,05. Сколько необходимо произвести наблюдений, чтобы ошибка второго рода 0 не превосходила 0,1?
Решение: а) Критическая область критерия (2.4) имеет вид: или 1(Х\ — руп f®1 0°) 11 If)2 '>/• /(X) —exp-j--—----- где X —выборочное среднее. Логарифмируя обе части неравенства и перенося в правую часть все её элементы, кроме X, и учитывая при этом, что 01>0О, приходим к следующему эквивалентному неравенству Г Ssq, где Таким образом, критерий Неймана—Пирсона в данном случае свелся к подсчету значений статистики X, называемой статистикой критерия, и проверке одностороннего неравенства X^ct, где Cj — критическая граница, определяемая через ошибку первого рода а. Найдем теперь q и Р по заданной ошибке а. Как известно, среднее X распределено нормально с параметрами (0о, ст2fn) при гипотезе Но. Поэтому Если, как обычно, обозначить через и3 корень уравнения Ф(«,,) = а, то Г] 00 1 ст Отсюда находим критическую границу с( через значение а:
Заметим, что сг зависит от 0О, но не зависит от 0j. Учитывая, что случайная величина X в предположении справедливости гипотезы Нг распределена по нормальному закону с параметрами (0г, <з2!у/п), для вероятности ошибки второго рода Р получаем ₽(«.») = Р„](Т<Г1)=Р„,('^<^) = (2-7) б) Из (2.7) видно, что с ростом п ошибка второго рода монотонно убывает, поскольку Оо<01. Очевидно, что минимальное число л* = и(а, Р) необходимых испытаний для того, чтобы ошибки первого и второго рода могли быть сделаны не превышающими фиксированных значений аир, есть наименьшее из тех п, для которых Р(а, н)<р. Таким образом, для нахождения п по а и Р имеем два уравнения Ф(М1-«)= 1 и Ф -5---Jn + ux-о, =Р. \ ст / Отсюда 0о-01 Г = ~‘ Jn + Uy-, о или, поскольку и1^х=—и3, ст2(м„ + ир) (00-е.)2 Поскольку п — целое, то искомое решение имеет вид п' ст2(ц„ + Мр) (Оо-0.)2 (2.8) + 1 • (Здесь [х]— целая часть х). в) При 01 = 1, Р = ф(х/25^Ц +1,645 ( = 0,741. \ J25 /
При 0j = 5, р = ф(у25 ~ + l,645j = 0,001. Из приведенных данных видно, насколько существенно разнятся ошибки р при удалении 0t от 0о. г) п' = 9. 2.2. Пусть выборка Х = (АГ1, ..., Х„) производится из распределения Ж (а, О2), где математическое ожидание а—известно, а дисперсия 02—неизвестный параметр. Требуется проверить простую гипотезу Но: 02 = 0о против альтернативной простой гипотезы Н^. 02 = 02, при этом 02>0о- Решение. Критическое множество критерия Пирсона имеет вид ( 1 V f ’ (Tj-a)2] I ) exp) - E -~2~Г I 7=1 29? J>c 2*) ’ Ж) Неймана— ( 1 V f ’ (Xj-a) I -у^.- ехр) - S \^/2я90/ I j=i что эквивалентно n / v „\ 2 х? / i &\ 29? Известно, что если гипотеза Но верна, то П / Y л\ 7 = 1\ 0О / распределена по закону / (и)-хи-квадрат с п степенями свободы. Поэтому сх определяется из уравнения а=рм >с1 =1~j \> = Л «о / / где К„(х)—функция распределения %2(п). Отсюда получаем (2-9) C'l Х1 — а;п> т. е. Ci равна (1—а)—квантили распределения х2(п). ность ошибки второго рода р равна (2.Ю) Вероят- /И/ \2 \ /и/ \2 л2\ р=Ри.( ь (v) <c>)-p«.{Е (V) <c'?)= \;=X\ y0 / 7 / в1/ V p. (Xl-u;»9o\ 1 A— 9-8516 Ватутин 257
2.3. Рассмотрим схему Бернулли с числом испытаний п и неизвестной вероятностью успеха 0, о значении которой имеются две простые гипотезы: Но: 0 = 0О и Н^. 0 = 015 где 01>0О. Здесь для любой выборки Х = (У15 ..., Х„) (Уг—число успехов в z-м испытании, z=l, ..., и) РЯ1(Х) = 0?(1-0г)п-А, z = 0, 1, п где Л = Л(Х)= S —общее число успехов, а 7=1 1 ' е‘0(1-е0)”-‘ \i-ej ’ Функция ф(0) = 0/(1 — 0) на интервале (0, 1) возрастает, поэтому при 0!>0О Ф(01)/<Р(0О)> 1 и неравенство /(Х)>с эквивалентно неравенству где 1 л. 1 ’“’’о 1пс + и1п-— . 1—01 Постоянная с' определяется из условия Р„о(Л>с') = а, которое может быть представлено в следующем виде Z CnJ03(l-0o)n-j = a. (2.12) Как уже отмечалось, нахождение границы с' из этого уравнения являющейся по смыслу задачи целой величиной, как правило, невозможно, поэтому в этом случае, как уже отмечалось, или несколько «подправляют» а, увеличивая или уменьшая её значение, или же прибегают к так называемой процедуре рандомизации, если значение h попадает на границу критической области. Описание рандомизированного критерия выходит за рамки учебника, и мы на нем останавливаться не будем.
Если предположить гипотезу Но истинной, а п достаточно большой величиной, случайная величина Л, согласно теореме Муавра—Лапласа, приближенно распределена по нормальному закону и, стало быть, уравнение для с' можно записать в следующем виде а = Р„ (Л>с') = Р„ ( z h~n~° ..1 _фС О\уиео(1-ео) W«e0(i-e0)/ Отсюда получаем с'®и0о + нач/и0о(1 —0О). (2.13) Ошибка второго рода (3 в этом случае равна Е'] ₽ = £ C^'fl-Gj""*. (2.14) j-i 2.4. По выборке Х = (У15 ..., Х„) из пуассоновского распределения П(0) построить критерий Неймана — Пирсона для проверки гипотезы Но: 0 = 0О против альтернативы 0 = 015 (О<0о<01). (0 е"(0°-в1\ критическая граница с = с(а) ®о/ находится из уравнения £ е“л0'’^^, = а, Р= У г -j 1 т! _Л т! m = |/ej ~1 т = 0 2.5. (Продолжение 2.4.) Исследовать асимптотическое поведение характеристик критерия при больших объемах выборки (п -» оо) и при «близких» гипотезах: 0j=0o+-~, «>0 — \/п константа. Указание. Использовать нормальную аппроксимацию для пуассоновского распределения: если Е, имеет распределение Пуассона с М£ = Х, то ——^х> = Ф(х), — ООСХСОО. j Таким образом, можно считать, что при больших X величина Е, имеет приближенно нормальное распределение с М£ = X, DE,=X. Ответ: 5={Х: X >с], где c = 0o + w1_a /—,
lim £(и) = Ф( 2.6. По результатам одного наблюдения Х\(п=1) построить наиболее мощный критерий для проверки гипотезы Но: /(.т)=1 на отрезке [0, 1] против альтернативы Hr: f(x)=-—- на том же отрезке [0, 1 ] е1"”—1 Ответ: а=РНо(Х1>с0[), са=1-а, Р=~—р- 2.7. В последовательности независимых испытаний вероятности положительных исходов одинаковы и равны р. Построить критерий проверки гипотезы р = 0 против альтернативы р>0 и определить наименьший объем выборки, при котором вероятности ошибок первого и второго рода не превышают 0,01. Ответ: S={Tn>0}, Тп—число положительных исходов в п испытаниях; а = 0, £ = (0,99)", «^454. 2.8. Пусть для распределения Коши К (в) (см. задачу 1.24 гл. 16) проверяется гипотеза Но: 0 = 0 против альтернативы Ht: 0=1. Построить по одному наблюдению (и=1) критерий отношения правдоподобия: 5={Х: /(Х)^с}. Найти в явном; виде критическую область S и ошибки а и £ в случае выбора с: а) с =1, б) с = 2. Ответ: a) S= 1 /2}, a = i — -arctg^, £= — ^ —-arctgi; 2 л 2 2 л 2 б) 5={1^А'1^3}, T=-(arctg3 — arctg 1), £ = 1 — -arctg2. J л л § 3. Сложные гипотезы Случай, когда основная и альтернативная гипотезы просты, встречаются сравнительно редко. Чаще имеют место случаи, когда обе гипотезы (или одна из них) сложные. Рассмотрим наиболее часто встречающуюся ситуацию, когда обе гипотезы параметрические, при этом основная гипотеза Но — простая: 0 = 0о, а альтернатива —сложная: Нх\ Ое01; где 0, некоторое множество возможных значений 0, не содержащее точку 0О. В соответствии с леммой Неймана—Пирсона, для каждой пары точек (0о, 0х), Oje©!, можно построить наиболее мощный критерий для проверки гипотезы 0 = 0о, против альтернативы 0 = 0j при фиксированной вероятности ошибки первого рода
а. Если все эти наиболее мощные критерии будут обладать одним и тем же критическим множеством S, то это означает, что критерий S максимизирует мощность при любой допустимой альтернативе из множества 0t, и поэтому этот критерий можно назвать равномерно наиболее мощным (р. н. м.) критерием проверки гипотезы Но: 0 = 0О против альтернативы Нг: 0е0х при заданной вероятности ошибки первого рода а. Если же S зависит от альтернативы 015 то это означает, что не существует критической области, которая была бы наилучшей дл всех 01е01. Другими словами, в данной задаче не существует равномерно наиболее мощного критерия. Рассмотрим несколько задач на построение равномерно наиболее мощного критерия. 3.1. Пусть выборка Х = (А\, ..., Хп) получена из нормального распределения с параметрами (0, ст2), причем ст2 известно. Требуется проверить гипотезу Но: 0 = 0О против односторонней сложной конкурирующей гипотезы Н1: 0>0О. Решение: Применяя критерий Неймана—Пирсона для проверки двух простых гипотез Но: 0 = 0О и Н1: 0 = 0Х, где 0] >0О, как это было сделано в § 2, получаем, что критическая область S имеет вид X >ct, + т. е. Jn не зависит от альтернативы 0t. А это и означает, что критерий S является равномерно наиболее мощным критерием для проверки простой гипотезы Но: 0 = 0О против сложной альтернативы Н^. 0>0О. Функция мощности этого критерия ИД0; S) равна ЕГ(0)= РГ(0; 5)Н-Ф^7«)=1-ф(^^"+4 (3.1) Поскольку 0О —0<О, мощность 1Е(0, S) с ростом п стремится к 1 при любом 0>0О. Критерий, обладающий таким свойством, т. е. у которого мощность стремится к 1 при безгранично растущем числе п испытаний, называется состоятельным критерием. График функции мощности критерия (3.1) приведен на рис. 18. При стремлении 0 к 0О мощность уменьшается до величины ос. 1Г(0)- 1-Ф(ив)=1- (1-а) = а и ошибка второго рода 0 = 1 — 1Г(0) стремится к 1 — а.
Предоставляем читателям проверить, что равномерно наиболее мощным критерием для проверки простой гипотезы Но: 0 = 0О против сложной односторонней альтернативы Н^. G<01 является критерий, основанный на критическом множестве Т <с', где с' = 0о — (по-прежнему предполагается, что у/п выборка производится из нормального распределения с известным значением ст2 и неизвестным математическим ожиданием 0). 3.2. Пусть снова выборка получена из нормального распределения с параметрами (0, ст2) и ст2 известно. Требуется проверить гипотезу Но: 0 = 0О при конкурирующей гипотезе Нг- 0^0О. Решение. Конкурирующая гипотеза является двусторонней. В этом случае для значений 0<0О и 0>0О теорема Неймана — Пирсона дает разные критерии: Т <с' и X >с, т. е. не существует такого критерия с уровнем значимости а, который максимизировал бы функцию мощности W(Q) во всех точках 0/0о. Естественно здесь пользоваться двусторонним критерием, а именно задавать критическую область в виде | Т —а| (3.2) 2 V*
Задание квантили ив/2 обеспечивает значение ошибки первого рода, равной а. Функция мощности этого критерия равна Ж(0)=1-Ф^^+й,/2)+Ф^^-и./2). (3.3) График этой функции приведен на рис. 19. Критерий (3.2), очевидно, состоятелен. 3.3. В процессе производства изделия подвергают выборочному контролю. Пусть каждое изделие независимо от других может оказаться дефектным с некоторой одной и той же, но неизвестной вероятностью 6 (О<0<1). Пусть для контроля взято п изделий и результат описывается вектором Х = (Х1? ..., Х„), где Х=1, если г-е изделие дефектно, и Х, = 0 в противном случае. Проверяется гипотеза о том, что число дефектных изделий не превышает некоторой критической доли 0О, т. е. Но: 0<0О, конкурирующая гипотеза, очевидно, задается следующим образом: Нг: 0>0О. Решение. При указанных предположениях критическая п область задается неравенством r(X) = Е Х>гя, т. е. число г=1 дефектных изделий в выборке превышает некоторое критическое число га. Поскольку г(Х) подчиняется биномиальному закону,
то граница га определяется по заданному уровню значимости а из уравнения P„o(r(X)>ra)< Е Спк05(1-0о)п-к«а. к = Г'+ I Используя теорему Муавра—Лапласа, получаем р f г(х) ~”ео > г«~”ео \ да а и0о (1 — 0о) ибо О — ®о)' ИЛИ , л. ( Л,—лб0 \ 1 — Ф| *- - «а, \y«e0(i —о0)/ г»-”ео ,, ----- — а. 7"М1-ео) Таким образом, граница критической области равна r«=« 0О ~ «i - «чАМ1 -0О)• 3.4. Убедиться в том, что построенный в задаче 2.4 критерий Неймана — Пирсона (для пуассоновской модели П(0)) является одновременно р. н. м. критерием для проверки гипотезы Но: 0 = 0О против альтернативы 0>0О. Указание. См. решение задачи 3.3. 3.5. Для биномиальной модели Bi. (1с, 0) построить р. н. м. критерий по выборке объема п для проверки гипотезы Но: 0 = 0О против альтернативы Нг: 0>0О. 3.6. Показать, что построенный в задаче 2.1. критерий является р. н. м. критерием в задачах проверки сложных односторонних гипотез соответственно Но'. 0 = 0О против Нг\ 0>0О и Но: 0 = 0О против Нг: 0<0О. § 4. Проверка гипотез и доверительное оценивание Между задачей проверки простой гипотезы Но, состоящей в том, что некоторый параметр 0 принимает заданное значение 0О, и построением доверительной области (в частности, доверительного интервала) для этого параметра имеется тесная связь. Пусть, например, 0(х1; ..., х„), 0 (хг, ..., х„) — доверительный интервал для параметра 0, накрывающий его
истинное значение 0О с вероятностью 1—а (см. § 5 гл. 16). Определим критическое множество S как множество всех тех и только тех точек выборочного пространства, для которых 0О лежит вне указанного доверительного интервала. Тогда очевидно, что критерий Но с критическим множеством S будет обладать вероятностью ошибки первого рода, равной а. При этом вполне понятно, что одностороннему критерию значимости будет соответствовать односторонний доверительный интервал, а двустороннему критерию значимости—двусторонний доверительный интервал. 4.1. Рассмотрим ситуацию, когда выборка получена из нормального распределения, в которой дисперсия о2 известна, а математическое ожидание 0 неизвестно. Требуется построить критерий проверки простой гипотезы Но: 0 = 0О против сложной альтернативы 0/0о. Решение. В гл. 16, задача 5.1 был построен доверительный интервал (Тл . & Т7 I Л н--5=Wa/2> “~^wa/2 1з \/п у/п / накрывающий истинное значение математического ожидания 0 с вероятностью 1 — а. Относя к критическому множеству S' те и только те точки выборочного пространства, для которых 0О не принадлежит указанному доверительному интервалу, получим критерий для проверки гипотезы Но, обеспечивающий вероятность ошибки первого рода а. 4.2. Рассмотрим теперь другую ситуацию, когда выборка получена из нормального закона, в котором оба параметра — __________________________________ 2 математическое ожидание ц и дисперсия о — неизвестны. Пусть Но — сложная гипотеза, состоящая в том, что ц = 0о, 0<о2<оо (т. е. дисперсия о2 предполагается неизвестной). Требуется построить критерий с уровнем значимости а для проверки этой гипотезы. Решение. Как следует из гл. 16, задача 5.9, интервал (v S(X) . , SlXl \ IX-----и- > a+-j-2/i+y накрывает истинное зна- \ V^l -у1-"-' V" 2 ’n-1/ чение математического ожидания ц с вероятностью 1 — а. Относя к критическому множеству S точки выборочного пространства, не входящие в указанный интервал, получаем критерий для проверки гипотезы Но, обеспечивающий заданный
У): \X — Y уровень значимости а. Этот критерий иногда называют критерием Стьюдента. 4.3. (Гипотеза о равенстве средних двух нормальных распределений). Пусть имеются две независимые выборки Х = (Х15 Х„) и У = (У15 Уш) из нормальных распределений с одинаковыми (но неизвестными) дисперсиями и неизвестными средними Pi и ц2. Требуется проверить основную гипотезу Яо: р1 = р2 против конкурирующей гипотезы Нг: р1^ц2. Решение. В задаче 5.13 гл. 16 был построен доверительный интервал для оценки разности Д = ц1 — ц2. Из этого результата получаем, что критическая область критерия уровня значимости а для проверки гипотезы Но есть множество точек (X, У), лежащих вне указанного интервала, т. е. (m + n)(nS2 (X) + wiS,2(X)) тп (т+п — 2) 4.4. (Гипотеза о равенстве дисперсий двух нормальных распределений). Пусть снова имеются две выборки X = (Xj, ..., Х„) и ¥ = (У}, ..., Ут) из нормальных распределений, но уже с одинаковыми и неизвестными средними и неизвестными дисперсиями ст? и ст2. Требуется проверить основную гипотезу Но: Ст1 = ст2 против альтернативы ст?#ст2. Решение. Снова обращаемся к доверительным интервалам, а именно к задаче 5.16 гл. 16, где построен у-доверительный интервал для отношения cr^/cri при указанных в данной задаче условиях. Стало быть, критическая область критерия S с уровнем значимости а—совокупность точек (X, Y), не входящая в указанный интервал при значении у, равной 1 — а. § 5. Статистические критерии согласия. Критерий «хи-квадрат» Пирсона На практике часто требуется проверить гипотезу Но о том, что выборка X = (Xj, ..., Х„) получена из генеральной совокупности с функцией распределения Г(х). Относительно кон
курирующей гипотезы каких-нибудь предположений не делается. В этом случае применяются так называемые критерии согласия, которые строятся на основе выбора некоторой статистики T=T(X;F), характеризующей отклонение эмпирических данных от соответствующих гипотезе Но гипотетических значений. Обычно эта статистика положительна, и при любой конкурирующей гипотезе её значение возрастает. Она зависит от F, и распределение её при гипотезе Но должно быть известно точно или хотя бы асимптотически при п -» оо. Далее выбирается такая граница 1а, чтобы событие {Т(Х; при основной гипотезе выполнялось с вероятностью ошибки первого рода а. Гипотеза Но принимается, если Т(Х; F)<ta, и отвергается, если Т(Х; F)^^. Таким образом, множество значений X, при которых Т(Х; Fy^ta составляет критическое множество S критерия. Одним из наиболее известных таких критериев является Х2-критерий К. Пирсона. Критерий строится следующим образом. Разобьем прямую на интервалов: z0= — оо <zt < ... <zs-t <zs = оо. По известной функции F(x) вычисляем вероятности р, = Р(г,)—F(zi-1), i= 1, ..., 5. Пусть z=l, ..., —число тех Xj из выборки Х(у=1, ..., и), которые удовлетворяют условию zi_1<TJ^zi. Тогда при справедливости основной гипотезы случайные величины /г15 ..., hs имеют (см. § 2 гл. 7) полиномиальное распределение с числом испытаний п и вероятностями исходов р = (р15 ..., ps). ₽{/?!=«!, ..., hs = ns}=——-------р1‘ ... р^, nt + ... +ns = n. п, ! ... Тем самым первоначальную задачу мы свели к проверке гипотезы о том, что частоты Ь = (Л1( ..., hs) имеют полиномиальное распределение. В этом случае частоты h{ должны быть близки к среднему значению Мй; = и/>;, i= 1, ..., j. Общее отклонение всех можно измерять разными способами. Чаще всего в качестве меры отклонения используют величину, введенную К. Пирсоном, npj xi-x.^h)- i t--*-J=1 nPj j=lnPi Величина Х„ случайна и обладает тем важным свойством, что при справедливости нашей гипотезы распределение этой
величины в пределе при п -> оо не зависит от вектора р и имеет известное распределение хи-квадрат с s— 1 степенями свободы. Т. е. при п -> оо для любого х и постоянных Pj>Q, j=l, , s Р{Х2<х} -xP{iCs-i<x}. С помощью этого результата введем следующий критерий для проверки гипотезы Но: F^(x)=F(x). Зададим уровень значимости а>0, выберем значение величин s, zt, zs и найдем по ним значения вектора вероятностей р = (/\, ..., ps) и вектора частот h = (hl, hs). Считая, что X2 распределено по закону %2(s— 1), по таблице 5 находим такое число (границу критической области критерия), что P{X2>ta}=a. Стало быть, = s — 1 - (1 -а)—квантиль распределения Х2(л —1). Следовательно, граница критерия х2 с уровнем значимости а есть величина xi-«, s-i- Выбор точек разбиения прямой zx, ..., zs-t должен быть таким, чтобы, во-первых, вероятности рг, ..., ps в какой-то мере отражали вид функции распределения F(x), во-вторых, чтобы hj и npj были бы достаточно большими, чтобы можно было бы пользоваться предельной теоремой Пирсона. Практика показывает, что для этого требуется, чтобы и >50 и й2>5 для всех j. Таким образом, критерий согласия х2 имеет следующий вид. Пусть заданы уровень значимости а, объем выборки п и наблюдавшееся значение h = (/?!, ..., hs) вектора частот (при этом и>50, hj^5, у=1, ..., s); тогда если наблюдавшееся значение X2(h) удовлетворяет неравенству X2 s-i> то гипотезу Но отвергают; в противном случае гипотеза Но принимается. 5.1. При и = 4040 бросаниях монеты Бюффон получил /?! = 1992 выпадения «решетки» и й2 = 2048 выпадения «герба». Требуется проверить совместимость этих данных с гипотезой Но о том, что монета была симметричной, т. е. что вероятности выпадений решетки и герба равны р1=р=1/2, p2 = q= l —р = 1/2. Решение. Здесь s = 2, X2 (h) = = 0,776. ' ' пр nq npq
Выберем уровень значимости а равным 0,05. Число степеней свободы равно 1 = 1. По таблицам распределения X2 (1) находим Хо,95; 1 = 3,84. Сравниваем полученное значение X„2(h) с табличной величиной Xo,95;i- Так как X„2(h)<xo,95; i, то делаем вывод, что данные опыта Бюффона не противоречат гипотезе. 5.2. В десятичной записи числа л среди 10000 первых десятичных знаков после запятой цифры 0,1, ..., 9 встречаются соответственно h = (968, 1026, 1021, 574, 1014, 1046, 1021, 970, 948, 1014) раз [См. Бикел П., Доксам К. Математическая статистика. М., 1983, т. 2, с. 96]. Можно ли при уровне значимости 0,05 считать эти цифры случайными? Решение. Здесь число исходов s=10, при уровне значимости а = 0,05 критическая граница Хо,95;9=16,9 (находим по таблице распределения х2)- Подсчитываем значение статистики Хп2 (h) при />!=... =д10= 1/10. Неравенство Jf„2(h) = 9,37 < 16,7 = Хо,95; 9 свидетельствует, что данные согласуются с гипотезой Но о случайности цифр. 5.3. При « = 4000 независимых испытаний события А3, Аг, А3, составляющие полную группу событий, осуществились 1905, 1015 и 1080 раз соответственно. Проверить, согласуются ли эти данные при уровне значимости 0,05 с гипотезой Но: р2=р3=1/4, где Pi=p(Ai), /=1,2,3. Ответ: Х„2 = 11,13>Хо,95; 2 = 5,99. Гипотеза Но отвергается. 5.4. Согласуются ли данные задачи 4.15 гл. 15 при уровне значимости а = 0,1 с гипотезой Но о том, что показатели часов равномерно распределены на интервале (0, 12)? Ответ: Х„2 = 10,00<Хо,9; и = 17,3. Гипотеза Но принимается. 5.5. Группируя данные задачи 4.20 гл. 14 по s — 4 равновероятным (при гипотезе Но) интервалам, проверить гипотезу Но: 7^(х) = 1—е-х, х>0. Уровень значимости принять равным 0,1. Ответ: гипотеза Но не отвергается, поскольку Хп2 = 4,108<Хо,9; з = 6,25. (Здесь Zj =0,288, z2 = 0,693, z3 = 1,386.) 5.6. В экспериментах с селекцией гороха Мендель наблюдал частоты различных видов семян, полученных при скрещивании растений с круглыми желтыми семенами и растений с морщинистыми зелеными семенами. Эти данные и значения
теоретических вероятностей по теории наследственности приведены в следующей таблице (см. [4] стр. 112): Семена Частоты ht Вероятности р,- Круглые и желтые 315 9/16 Морщинистые и желтые 101 3/16 Круглые и зеленые 108 3/16 Морщинистые и зеленые 32 1/16 Проверить гипотезу Яо о согласии опытных данных с теорией (на уровне значимости а = 0,05). Ответ: согласие хорошее, поскольку Х„2 = 0,47<%о,95; з = = 7,82; гипотеза не отвергается. 5.7. Наблюдается число разладок станков на одном из производственных участков за смену. За каждый час смены наблюдалось следующее число разладок: 16, 17, 19, 16, 24, 19, 17, 16 (всего 144 разладки). Проверить гипотезу Но о том, что разладки следуют равномерному закону распределения (на уровне значимости а = 0,05). Ответ: Х„2 = 2,90<Хо,95,7 = 14,1. Таким образом гипотеза Но не отвергается. 5.8. Семь монет подбрасывались Одновременно 1536 раз, причем каждый раз отмечалось число £ выпавших гербов. Число hi случаев, когда число выпавших гербов равнялось г, приведено в таблице: 2 3 4 5 6 12 78 270 456 386 252 69 7 13 0 1 Проверить гипотезу Но о согласии опытных данных с биномиальным распределением; учесть при этом, что вероятность выпадения герба при бросании каждой из монет равна 1/2 (а = 0,1). Ответ: Х„= 10,32 < 12 = %о,9; т, следовательно, гипотеза Но не отвергается. § 6. Критерий согласия «хи-квадрат» при неизвестных параметрах распределения Изложенные ранее критерии согласия применимы лишь в случае, когда проверяемый закон распределения F(x) полностью определен. Однако чаще встречаются случаи, когда
бывает известен лишь тип распределения (например, нормальное), но неизвестны некоторые параметры распределения 0 = (9!, ..., 9Д и гипотеза Но состоит в проверке, что f’^(x) = F(x; 9). Пусть исходные данные сгруппированы (см. § 5) и Ь = (Л1; ..., hs)—вектор частот наблюдений, попавших в интервалы группировки. Вероятности попадания в эти интервалы при гипотезе Но будут равны pj=pj^)=F(^е) е)- Рассмотрим статистику ;=! «Л(0) Она зависит от неизвестного параметра 9, и поэтому вычислить ее по выборке X невозможно. В этом случае заменяют неизвестный параметр 9 некоторой оценкой 9Л = 9„(Х), и тогда статистику Х12 = Х12(9) Уже можно однозначно вычислить по выборке. Распределение этой случайной величины зависит от выбора оценки 9П. Оказывается, что в качестве такой оценки целесообразно использовать оценку максимального правдоподобия 9П, основанную на частотах Ь = (ЛХ, ..., /is) (см. § 3 гл. 16). В этом случае предельное распределение статистики Х„2(9„) при п -> со и при выполнении некоторых достаточно общих условий имеет простой вид, а именно — является распределением хи-квадрат с 5—1 —г степенями свободы, где г—число оцениваемых параметров. 6.1. (Радиоактивный распад.) В эксперименте было проведено « = 2608 опытов, в которых наблюдалось случайное число а-частиц, излучаемых за один и тот же период времени (7,5 сек.). Числа hi опытов, в которых наблюдалось ровно i частиц (i = 0, 1, ...), сведены в следующую таблицу (см. Крамер Г. Математические методы статистики. М., 1975, стр. 472): 10 12 57 203 383 525 408 273 139 45 27 10 Всего л = 2608 5Ъ1 Проверить гипотезу Н о том, что случайная величина 2, распределена по закону Пуассона. Уровень значимости а = 0,05.
Здесь значения с. в. £ уже сгруппированы, поскольку £, дискретна. Единственное, что следует здесь сделать—это сгруппировать значения ht при г> И в один интервал с тем, чтобы все hi были бы не меньше 5. Тогда число групп становится равным 12. Оценкой максимального правдоподобия единственного в данном случае неизвестного параметра 9 будет в этом случае 9п = Т=1£Х,.=1£7Л,. = 3,87. 7=1 7=1 Значения вероятностей р,(0„) подсчитываем по формулам: л -в 10 р;(9„) = е -ту,У=о, ..., ю, Рп(9„)=1- X Далее вычисля- J' , л j=o ем статистику Х„ (9„): +2-Х,2(в.)- ‘i при этом в качестве Лп дберем сгруппированное значение частоты 4 + 2 = 6. Здесь Х„ (0„) = 12,855. Сравниваем это число с квантилью %о,95; ю= 18,3. Получаем, что Х„ (0п)<%о,95; ю, т. е. согласие с проверяемой гипотезой хорошее. 6.2. Пусть имеется выборка из 200 изделий, сделанных на некотором станке. Требуется проверить гипотезу о нормальности закона распределения разброса размеров этих изделий. Уровень значимости а = 0,1. Разобьем множество значений размеров изделий на 10 интервалов. В приводимой ниже таблице приведены границы этих интервалов и количество выборочных изделий, попавших в эти интервалы. №№ интервалов i Границы z-i интервалов мк Числа hi попаданий в интервалы Pi=Pi$t, в2) 1 -20 -15 7 0,023 2 -15 -10 11 0,048 3 -10 -5 15 0,098 4 -5 0 24 0,162 5 0 5 49 0,198 6 5 10 41 0,194 7 10 15 26 0,142 8 15 20 17 0,083 9 20 25 7 lin 0,052 10 25 30 3 J10 Сумма 200 1,000
Здесь у нас два неизвестных параметра—математическое ожидание и дисперсия. Их оценками максимального правдоподобия являются величины 91=Х Ц ^*1 и ©2 = ‘S'2 — ~ £ Afx2 — X 2, где х,-—средние значения интервалов (xi = —17,5, х2 = — 12,5, ..., х8= 4-17,5, х9= 4-25). Численные расчеты дают X =4,30 мк, S2 = 94,26 мк2. Далее находим вероятности попадания размера детали в интервалы: если гипотеза о нормальности справедлива, то = 0,023, = 0,048, ... и т. д. Численные значения помещаем в 4-м столбце таблицы. Вычисляем значение статистики хи-квадрат: 1=1 ПР‘ и сравниваем ее со значением Хо,9;б = Ю.6. (Число степеней свободы равно s— 1 — r = 9— 1 — 2 = 6). Поскольку 7, 19 <10, 6, гипотеза Но о нормальности разброса размеров деталей не отвергается. 6.3. Через равные промежутки времени в тонком слое раствора золота регистрировалось число Е, частиц золота, попавших в поле зрения микроскопа.. По данным наблюдений, приведенных в следующей таблице, Число частиц 0 1 2 3 4 5 6 7 Итого К 112 168 130 68 32 5 1 1 £/г, = 518 проверить гипотезу Но о пуассоновском распределении случайной величины £. Ответ: 0П= 1,54, X2 (0П) = 7,95< 10,6=Хо,9; 6 — согласие имеет место. 6.4. В генетической модели Фишера [См. Бикел П., Доксам К. Математическая статистика. М., 1983, т. 2, с. 79] принимается, что вероятности появления потомства, классифицируемого по четырем типам, имеют вид
/>1(9) = ^ jP2(9)=/’3(9) = ^ />4(0Н’ где 9е(0, 1)—неизвестный параметр. Как выглядит критическая область критерия для проверки соответствия этой модели реальным данным? „ hl , hl+hj hi 1 , 2 , \ l Ответ: + -тт-д-т + -g->-(Xi-g; 2 + п), где ht — число и(2 + 0„) и(1-о„) И0„ 4 потомков z-ro типа из общего числа п потомков (i— 1, ..., 4), 9„— корень уравнения «92+ (h4 + 2h2 + 2h2 — Л,)0 — 2й4 = 0. 6.5. При 8002 независимых испытаний события А, В и С, составляющие полную группу, осуществились 2014, 5008 и 980 раз соответственно. Верна ли при уровне значимости 0,05 гипотеза: р(Л)=0,5 —29, р(Б)=0,5 + 9, р(С)=9 (0<9<0,25)? Ответ: 9п=0,12, (ё„) = 1,09<5,99 = х§,95; 2- 6.6. В таблице приведены числа ht участков равной площади 0,25 км2 южной части Лондона, на каждый из которых приходилось по i попаданий самолетов-снарядов во время второй мировой войны. Проверить согласие опытных данных с законом распределения Пуассона, приняв за уровень значимости а = 0,05. ([7] стр. 168). i 0 1 2 3 4 5 и более Итого hi 229 211 93 35 7 1 SA, = 576 Ответ: 9=0,928, Х„ (бп) = 2,172<9,49 = %о,95,-а- Согласие хорошее. 6.7. Среди 2020 семей, имеющих двух детей, 527 семей, в которых два мальчика, и 476—две девочки (в остальных 1017 семьях дети разного пола). Можно ли с уровнем значимости 0,05 считать, что количество мальчиков в семье с двумя детьми — биномиальная случайная величина? Ответ: 0п—Р = — = 0,513; р0 = (1 —р)2 = 0,237; pt=2p (1—р) — = 0,5; р2=р 2 = 0,363; % 2 = 0,1 <2,7 = %о,95; i- Согласие хорошее. 6.8. Во время эпидемии гриппа среди 2000 контролируемых индивидуумов одно заболевание наблюдалось у 181 человека,
дважды болели гриппом лишь 9 человек. У остальных 1810 человек заболевания не было. Согласуются ли при уровне значимости 0,1 эти данные с гипотезой, согласно которой число заболеваний отдельного индивидуума в течение эпидемии— биномиальная случайная величина? Ответ: ^=0,05; р0 = 0,903; рг =0,094, р2 = 0,025; X2 (Р)= 3,66 >2,71 = %о,9; 1 > гипотеза не подтверждается. § 7. Критерий согласия Колмогорова Другим критерием согласия выборки X = (Xj, ..., Хп) с гипотезой Но о том, что она получена из распределения с заданной функцией распределения F(x), является критерий Колмогорова. Его применяют, когда F(x) непрерывна. Статистикой критерия является величина Z)n = Z)„(X) = = sup |Fn(x) — F(x)|— максимальное отклонение эмпирической функции распределения Fn(x) от гипотетической F(x). Величину D„ легко определить непосредственным вычислением для каждого х (достаточно вычислить разность F„(x) — F(x} в точках x(Jt)—скачках функции F „(х) или графически, достроив графики кривых Fn(x) и F(x}}. При каждом х величина Е„(х) является оптимальной оценкой для Г(х) и с ростом п F„(x)~>F(x), поэтому, по крайней мере при больших п, в тех случаях, когда гипотеза Но истинна, значение D„ не должно существенно отклоняться от нуля. Отсюда следует, что критическую область критерия, основанного на статистике Dn, следует задавать в виде {7)„>с}. Точное распределение Р(х/лДп^ /) независимо от вида непрерывной функции F(x) уже при «>20 хорошо приближается предельным распределе-оо нием Колмогорова K(t}= £ (— 1)уехр{ — 2j2t2}, для кото- J= - 00 рого составлены таблицы. Это означает, что при «>20 критическую область критерия можно задавать в виде {^/w Z)„>Xa}, а значение критической границы находить из таблиц К(ХЛ) по заданному уровню значимости а:
В этом случае действительно P//o(v/«£>n>^01)^ 1 — Х’(Х01) = а. Так, при ос = О,О1, \= 1,628, а при ос = О,О5, \= 1,358. 7.1. Из таблицы случайных чисел выбрано «=150 двузначных чисел. Частоты Л,- чисел, попавших в интервал [Юг, Юг-1-9], (г = 0, 1, ..., 9) равны: (16, 15, 19, 13, 14, 19, 14, 11, 13, 16). Проверить, используя критерий Колмогорова, гипотезу Но о согласии выборки с законом равномерного распределения. Уровень значимости а равен 0,01. Ответ: £>„ = 0,041; ^/п D„ = 0,502 < 1,628 = Хв. Поскольку согласие с гипотезой имеет место. 7.2. Измерения длины X у п = 1000 деталей дали следующие результаты (округленные до 0,5 мм): / 123456789 10 х, 98,0 98,5 99 99,5 100 100,5 101 101,5 102 102,5 h, 21 47 87 158 181 201 142 97 41 25 hi—число деталий, имеющих размер х;. Проверить с помощью критерия Колмогорова гипотезу Но о согласии полученной выборки с нормальным законом распределения JF (100,25; 1). Уровень значимости а = 0,05. Ответ: y/nD„ = 0,281 < 1,358 — т. е. согласие с гипотезой хорошее. § 8. Критерий независимости «хи-квадрат» Пусть наблюдается двумерная случайная величина ^ = (^, £2) с неизвестной функцией распределения F^ (х, у), и есть основания предполагать, что её компоненты независимы. Таким образом, требуется проверить гипотезу независимости Но: F^(x, у) = = F^(x)- F^2(y), где Х(х) и F^ (у) — некоторые неизвестные одномерные функции распределения. Построим критерий согласия, основываясь на методике у2. Будем считать, что с самого начала (или после группировки, как это делали в предыдущих задачах) случайная величина принимает конечное число s некоторых значений, которые обозначим буквами аг, as, а случайная величина ё,2 принимает t значений, обозначенных Ьг, ..., bt. Таким образом, множество значений £ разбивается на st значений. Иногда вместо независимости компонент двумерной случайной величины говорят о независимости двух наблюдаемых
признаков (например, цвета волос и бровей у группы индивидуумов). Обозначим через htj число наблюдений пары (a., bj). Результаты наблюдений удобно расположить в виде таблицы, которую называют таблицей сопряженности двух признаков размера s х t bl b2 b, S h^h,. hn hi2 hi, hi. h2i h22 h2t h2. hsi bs2 hs, hs. 'LhtJ=h.J i — 1 h.i h.2 h., n^hi.=Xh.j i j Пусть pu = P(^1 = ai, ^2 = Z>?). Тогда гипотеза независимости эквивалентна гипотезе о существовании s+t постоянных pt и qj таких, что Pu=Pi<lr Y Pi=YJ4j=^-i=i j=i В соответствии с гипотезой совместное распределение двух величин содержит s+t—2 неизвестных параметров pt и q(, так как два из них можно выразить через остальные параметры. Известно, что статистика ”А£,)2 i=ij=i у имеет в пределе при п оо распределение % с st— 1-{s+t — 2) = (j— 1)(Z— 1) степенями свободы, если гипотеза Но справедлива и если pt и qj являются оценками максимального правдоподобия неизвестных параметров р, и qj. При этом Л hj. л h- . . . , Pi = —, = + J=l, ..., t. n J n
Таким образом, статистика критерия принимает вид Л2=» Е £ i=lJ=1 (hij-hj.h.jln)2 ht.h.j hl hi.h.j —n, и гипотезу /70 отвергают тогда и только тогда, когда вычисленное по фактическим данным значение статистики X* окажется больше Xi-«. («-и (»-ij. где Xi-a,(s-i)(t-i)~ (1 -а)— квантиль распределения %2 ((5—1)(/ — 1)), а—уровень значимости критерия. При s=t—2 статистику Х„ можно привести к виду 2 п n(hnh22 — ^i2^2i)2 Л1.Л2Л.1Л.2 8.1. Из 300 абитуриентов, поступивших в институт, 97 человек имели балл 5 в школе и 48 получили 5 на вступительных экзаменах по тому же предмету, причем только 18 человек имели 5 и в школе и на экзамене. С уровнем значимости 0,1 проверить гипотезу о независимости оценок 5 в школе и на экзамене. Ответ: Х„ = 2,32<2,71 =%o,9;i- Гипотеза Яо не отвергается. 8.2. Проверить гипотезу независимости для следующей таблицы сопряженности двух признаков (уровень значимости принять равным 0,05): *1 ьг ь3 j «1 3009 2832 3008 8849 «2 3047 3051 2997 9095 «3 2974 3038 3018 9030 Ау=ХАО 9030 8921 9023 26974 Ответ: Х„ = 8,09 < 9,49 = %о,95;4- Гипотеза не отвергается. 8.3. Имеются две группы данных в приеме в вуз, классифицированные по двум признакам: «принято (А)—не принято А )» и пол: «мужчины (В)—женщины (В )».
В В Е А 97 40 137 А 263 42 305 Е 360 82 п = 442 Проверить гипотезу Но о независимости признаков А и В (а = 0,0001). л Ответ: X„ —14,89 > 10,8=Хо_9999. i—гипотеза Но отвергается. 8.4. В следующей таблице (Кендалл М. Дж., Стюарт А. Статистические выводы и связи. М., 1973, с. 722) приведены 818 случаев, классифицированных по двум признакам: наличию прививки против холеры (признак А) и отсутствию заболевания (признак В): В В Е А 276 3 279 А 473 66 539 Е 749 69 818 Построить критерий проверки гипотезы Но о независимости признаков А и В, а=0,0001. Ответ: Jf„2 = 29,7> 10,8 = Хо 9999;1—гипотеза Но отклоняется. 8.5. В эксперименте каждый индивидуум классифицировался по двум признакам: цвету глаз и цвету волос; при этом по первому признаку индивидуум относился к одной из трех категорий а1г а2, а3, а по второму £2— к одной из четырех категорий bt, b2, Ь3, Ь^. Соответствующие данные для и = 6800 индивидуумов приведены в табл.: Цвет ¥ J волос Цвет глаз ь, *2 Ъз bt Сумма 1768 807 189 47 2811 а2 946 1387 746 53 3132 аз 115 438 288 16 857 Сумма 2829 2632 1223 116 6800
Проверить гипотезу Но о независимости двух признаков (а = 0,001). Ответ: ¥„2 = 1075>22,5 = Хо,999;в т. е. гипотеза Но отклоняется. § 9. Критерий однородности данных Важной является задача проверки однородности статистических данных. Пусть имеются две независимые выборки Х = (А\, ..., Хп) и ¥ = (7!,..., Ym), описывающие одно и то же явление или процесс, но полученные, вообще говоря, в разных условиях; требуется определить, являются ли они выборками из одного и того же распределения или нет. Задача естественно обобщается на случай произвольного числа t^2 независимых выборок. Пусть осуществлено t серий независимых наблюдений объемов п1; ..., nt. Пусть множество возможных значений рассматриваемых величин разбито на .v множеств без общих точек (или наблюдается в каждом опыте некоторый переменный признак, принимающий одно из 5 значений). Пусть hkj— количество наблюдаемых значений, принадлежащих множеству с номером i в у-й выборке, так что £ hij = nj, у=1, ..., t. Помещая числа /zi7 в таб-i = 1 лицу — в z-ю строку и у-й столбец, получим таблицу формально такого же вида, что и таблица сопряженности признаков (см. § 8). Требуется проверить гипотезу Но о том, что все наблюдения производились над одной и той же случайной величиной. Т. е. если р1}—неизвестная вероятность z-ro исхода в испытаниях у-й серии (i = l, ..., л;у=1, ..., t), то гипотеза Но означает утверждение: (pXj, ..., psj) = (Pl, ..., ps), где pt, i= 1, ..., 5, неко-S торые неизвестные вероятности, £ р{ — 1, j= 1, t, i= 1 t Обозначим через /zf.= £ htj. Если гипотеза Но справедлива, 7 = 1 Л то оценками максимального правдоподобия pt параметров р{ t будут p^hijn, п=£пь и статистика типа Х„ (р) будет i = i иметь вид:
i= 1 j= ! «Л- y^hi.j^nj ) Для нахождения критической границы критерия с уровнем значимости а применяют следующий результат: при п -> оо Ря0 (% п2 (£ К р (X(i - 1)(Г- и х). В силу этого соотношения можно полагать ?01 = %i-01;(S-i)((-i). Гипотезу Но отвергают тогда и только тогда, когда вычисленная по данным эксперимента статистика У„2(р) не меньше %1 -a;(s-l)(t-!)• д Для случая двух выборок (? = 2) статистика X2 (р) принимает следующий вид: v2/A\ V * (h'1 h{2\2 Х„2(р) = П1П2 X 7—-Г- —----• ;=! hn+hiz П2} 9.1. Поступающие в институт абитуриенты разбиты на два потока по 300 человек в каждом. Итоги экзамена по одному и тому же предмету на каждом потоке оказались следующими: на 1-м потоке баллы 2, 3, 4 и 5 получили соответственно 33, 43, 80 и 144 человека; соответствующие же данные для 2-го потока таковы: 39, 35, 72 и 154. Можно ли при уровне значимости 0,1 считать оба потока однородными? Ответ: можно, т. к. X2 (р) = 2,18<6,25 = %о,9;з (s=4, 1 = 2). 9.2. Следующая таблица содержит данные о смертности среди матерей, родивших первого ребенка, в четыре различных периода времени (Бикел П., Доксам К. Математическая статистика. М., 1983, т. 2, стр. 102) (и,—число матерей, /zv—число смертных: п1 1072 1133 2455 1995 22 23 49 33 Проверить гипотезу Но о том, что в уровнях смертности между этими периодами не существует различия (а = 0,05). Ответ: Z = 4, s — 2, h2j = nJ — h1j, /zi.= 127, h2. = 6528, X2(p) = = 0,89 <%o,95 = 7,82 — различия нет. 9.3. Утверждается, что результат действия лекарства зависит от способа его применения. Проверить это утверждение при a = 0,05 по следующим данным:
——-^Способ применения Результат ” ..... I II III Положительный 15 19 18 Отрицательный 26 25 22 Ответ: 5 = 2, t = 3, Х„2 = 0,66 < 5,99 = Хо95.2— не зависит.
ГЛАВА 18 РАНГОВЫЕ КРИТЕРИИ § 1. Критерий знаков Проводится п независимых испытаний, каждое из которых может завершиться лишь двумя исходами: успехом (этот факт отмечается знаком +) и неудачей (в этом случае ставится знак —). Пусть р — вероятность успеха в одном испытании. Требуется построить критерий с заданной ошибкой первого рода а, с помощью которого можно было бы отличить гипотезу Яо: Р = 0,5 от одной из следующих гипотез Н2: р>0,5; Н2: р<0,5; Я3: р=/=0,5. Напомним, что величина а—это вероятность отвергнуть гипотезу Но по результатам эксперимента, если она верна. Одним из критериев, используемых при решении упомянутых задач, является критерий знаков, схема построения которого такова. 1. Рассмотреть серию из п испытаний и подсчитать величину ц—количество успешных испытаний (количество знаков +). 2. Вычислить величину Ж(д, к), где 1 * W(n,k) = ±£ С', W(n,n)=\. Z i = 0 Для облегчения вычислений при 2ц > п воспользоваться равенством W(n, ц)=1-Ж(л, л-ц + 1).
3. Правила принятия (или отклонения) гипотезы Но при альтернативах Я,, г=1, 2, 3 собраны в таблице: Принимаем Но Принимаем Я; 1 2 3 W(e, ц) < 1 — а W (п, ц) > а а/2 < W(n, ц) < 1 — а/2 Win, ц)>1 — а W(n. Ш<а W(n, ц)е(а/2; 1—а/2) В каждом из упомянутых случаев гипотеза Яо принимается с уровнем значимости (т. е. вероятностью отвергнуть Яо, если она верна), не превосходящим а. 4. Если п велико (и >20), можно воспользоваться нормальной аппроксимацией величины W(п, ц). В частности, если истинное значение W(п, ц) принадлежит одному из промежутков (0,005; 0,05) или (0,93; 0,995), то ц)«Ф(У2ц+1,5-72(п-ц)-0,5) = Ф(х1), (1.1) если же 0,05 ц)^0,93, то W(n, ц)^Ф(72ц+1,25-72(п-ц)-0,75) = Ф(х2), (1.2) где Ф (%) = -4= х/2л е “2/2dw—функция распределения стандарт- случае, когда значение переменной кого нормального закона. При этом аппроксимация (1.2) используется в х2 = у/1^+1,25 —^/2(и — ц) —0,75 лежит в диапазоне (—1,64, 1,47), а аппроксимация (1.1)—если значение переменной Х1 = л/2ц+1,5 —^/2 (я —ц) —0,5, лежит в одном из промежутков (-2,58, -1,64) или (1,47, 2,58). 1. 1. Леди Гамильтон, сидя за чашкой чая с молоком в кругу друзей, утверждала, что она почти всегда на вкус может определить, что было налито в чашку раньше: чай или молоко. Было поставлено 10 экспериментов, результаты которых таковы: + + -I 1 Ь-Ы—, где знак + ставился, если леди Гамильтон давала правильный ответ, а знак —, если леди Гамильтон ошибалась. Проверить при помощи критерия знаков с уровнем значимости а = 0,05 гипотезу Но: вероятность р правильного ответа равна 0,5, против альтернативы Нр. р>0,5.
Решение. В данном случае п =10, д = 7. Так как 2д=14>«=10, то используем равенство W(п, к) = = 1 — IV(п, п — к— 1). Тогда 1 2 ^(10,7)= 1-^(10,2)= 1 ~ £ С*10. 2 i = 0 Вычисления дают 1Г(10,2) = 0,055 и 1Г(10,7) = 1—0,055 = 0,945. Поскольку 1 —а= 1—0,05 = 0,95, то 1Г(10,7) = 0,945 <0,95, и значит, у нас нет оснований отвергать (при уровне значимости а = 0,05) гипотезу Но. 1.2. Решить предыдущую задачу при и =10, д = 8 и а = 0,1. Ответ: 1Г(10,8) = 0,989 >0,9 = 1 — а. Гипотеза Но отвергается. 1.3. Для сравнения качества датчиков типов А и В было проведено 20 однородных испытаний, в ходе каждого из которых использовались 2 датчика (один типа А, а другой типа В). Эксперимент прекращался, как только отказывал один из датчиков. В результате испытаний в 6 случаях первым отказывал датчик типа А, а в оставшихся 14 случаях—датчик типа В. Можно ли утверждать, что первый датчик значительно надежнее второго? Для обоснования ответа проверить гипотезу Но; Р{Х> У} = Р{Х< У} =0,5, где X и У случайные длительности безотказной работы датчиков типа А и В соответственно, против альтернативы Н2. Р{У<У}<0,5 с уровнем значимости а = 0,01. Предполагается, что Р{Х=У} = 0. Решение. Пусть ( +, если Х> У; ( —, если Х< У. В этих терминах гипотезы Но и Н2 примут вид Ho:p = P{Z=+}=0,5-H2:p = P{Z=-}<0,5. Имеем и = 20, |i2o = 6. Далее, 1 6 >Г(20,6) = -^ £ С го = 0,058. 2 1 = 0 Поскольку альтернативной является гипотеза Н2, нужно сравнивать 1Г(20,6) с а = 0,01. Так как ИД20,6) = 0,058 >0,01, у нас нет оснований отвергать гипотезу Но. 1.4. Решить задачу 1.3 при а = 0,1. Ответ: 1Г(20,6)<0,1. Гипотеза Но отвергается.
1.5. Решить задачу 1.3, используя нормальную аппроксимацию функции к) и таблицу значений функции Ф0(х). Решение. Вычислим значения х 1 = 1,5 — у/2 (и —ц) —0,5; х2 = 5/2^1+1,25—у/2 («—ц) —0,75 при п = 20, ц = 6. Тогда хх = 72’6+1,5-У2-(20-6) -0,5= -1,57, х2 = 72-6+1,25-72-(20-6) -0,75 =-1,58. Так как Xj^[—2,58; —1,64] и хг ф [1,47 ; 2,58], а х2е[—1,64; 1,47] , мы должны воспользоваться формулой (1.2). Тогда 1К(20,б)«Ф(-1,58). Поскольку Ф(—1,58)=0,5 —ФО(1,58), то, обращаясь к таблице 1, находим Ф (-1,58)« 0,5 - 0,443 = 0,057. Так как И/(20,6)>а = 0,05, то гипотезу Но следует принять. 1.6. Для сравнения качества электрических чайников типов А и В одинаковой мощности было проведено 50 экспериментов. Качество чайников сравнивалось по скорости доведения до кипения определенного количества воды. При этом оказалось, что ровно в 30 случаях вода в чайнике типа А закипала быстрее, чем в чайнике типа В. Используя нормальную аппроксимацию, проверить с уровнем значимости а = 0,1 гипотезу Но: качество чайников не зависит от типа, против альтернативы Н3: качество чайника зависит от его типа. Решение. Будем считать эксперимент успешным, если вода в чайнике типа А закипела быстрее, чем в чайнике типа В. В данном случае и = 50, ц = 30. Для того, чтобы воспользоваться нормальным приближением, вычислим величины %! и х2 (см. (1.1), (1.2)) при этих значениях пир. Тогда х j. = 72’30 + 1,5 - 72'20-0,5 = 7^7 - 7^7 ® 1,5 57,
х2 = ^/2-30+1,25 - 7^20-0,5 = 761,25 - 739^5 «1,561, причем эсх£ [1,47; 2,58], а х2ф[—1,64; 1,47]. Следовательно, нужно применять приближенную формулу (1.1). Таким образом, W (50,30)« Ф (1,557) = 0,5 + Фо (1,557) = 0,5 + 0,442 = 0,942. Так как альтернативой является гипотеза Н3, нужно сравнить 1Р(50,30) с 1—а/2= 1 — 0,05 = 0,95 и а/2 = 0,05. Поскольку 0,05 < W(50,30) <0,95, гипотезу Но нужно принять. 1.7. В условиях задачи 1.6 проверить гипотезу Но: качество чайников не зависит от типа, против альтернативы Ях: вода в чайнике типа А закипает быстрее, чем в чайнике типа В. Ответ: 1Р(50,30) = 0,942 > 1 — а = 0,9. Гипотезу Но нужно отвергнуть. 1.8. Решить при а = 0,01 задачу 1.7 в случае, когда количество экспериментов равнялось 40, причем в 25 из них вода в чайнике типа А закипала быстрее, чем в чайнике типа В. При решении воспользоваться нормальной аппроксимацией. Ответ: гипотезу Но следует принять. 1.9. Будем считать прогноз погоды на следующий день относительно предсказываемой температуры удачным, если истинная температура отличалась от предсказанной не более чем на 5 градусов. За 100 дней было 60 удачных и 40 неудачных прогнозов. Проверить гипотезу Но: вероятность удачного предсказания р = 0,5, против альтернативы Н2: р^0,5 с уровнем значимости а=0,1. Решение. Воспользуемся нормальной аппроксимацией. Имеем: и =100, ц = 60 х1=7121,5-х/79?5 = 2,11б [1,47; 2,58]. Отсюда 1Р( 100,60) % Ф (2,11) = 0,9825. Поскольку W(100,60) ф (а/2, 1 — а/2) = (0,05; 0,95), гипотезу Но следует отвергнуть. 1.10. В условиях задачи 1.9 проверить гипотезу Но: р = 0,5, против альтернативы Нр. р>0,5 с уровнем значимости а = 0,01. Ответ: гипотеза Но принимается.
§ 2. Критерий Вилкоксона для проверки однородности двух выборок Критерий Вилкоксона используется при решении следующего класса задач. Имеется две выборки: выборка Хг, Х2, , Х„ с неизвестной функцией распределения Fx(x) и выборка У15 Y2, Ym с неизвестной функцией распределения Fy(x), причем т^п. Требуется указать правило, с помощью которого можно было бы с вероятностью ошибки первого рода, не превосходящей заданного значения а, отличать гипотезу Но: Fx (х) = FY (х) при всех хе ( — со, +оо) от одной из следующих гипотез Hr: Fx(x)>Fy(x) при всех хе( —оо, +оо); Н2. Fx(x)<FN(x) при всех хе( —оо, +оо); Я3: Fx(x)^Fv(x). В качестве критерия при решении указанных задач используется критерий Вилкоксона. Схема применения критерия Вилкоксона в предположении, что X Y} при всех i, j, такова. 1. Убедиться, что т^п, и, в случае альтернатив Нг и Н3, вычислить величину 2MH'=m(m + «4-1). 2. Записать данные 1|( Х2, ..., Хп и У1; Y2, ..., Ym в сводную таблицу в порядке возрастания Значение ai а2 а4 а5 - @т + п Выборка X Y Y Y X X (2-1) Ранг 1 2 3 4 5 т + п 3. Выписать все значения rt, подписанные под буквами Y в таблице (2.1), и найти сумму HZ=ri+r2+ ... + Гт, 4. По таблице 14 для критерия Вилкоксона вычислить для заданных п, т и а значение lVKp =-- WKp (т, п, а) в случае альтернатив Нх и Н2, WKp(m, п, а/2) в случае альтернативы Н3.
5. По выписанной ниже схеме принять или отклонить гипотезу Но: Принимаем Но Принимаем Н, 1 2 3 W < 2МIV — W*p (т, п, а) п, а) JV^(m, е, а;'2)т ^2MPF— Wtp(m, е, а/2) lV>2MW-fPtp(m, п, а) lV<lVtp(m, п, а) fV^[fV^(m, е, а/2); fVtp{m, п, а/2)]. 6. Если и>20, то при приближенной формулой а ^0,5 следует воспользоваться \ т(т + п+\)— 1 , , , пт(т + п+\) п, ---------—>-------L_------------------>= TKTTZ 1 , /, \ InMW = ми/------ф(1 - а) /——, 2 ' Лу 12 (2.2) где функция ф(х)—обратная к функции распределения Ф(х) стандартного нормального закона (таблица 4; ф (%) = их). Если Х{= Yj для некоторых г, j (или для групп значений i и у), то всем этим элементам присваивается ранг, равный среднему арифметическому тех мест, которые они делят. Например, для выборок X: 3, 4, 6, 7 и Y: 3, 3, 3, 4, 7 получаем: Значение 3 3 3 3 4 4 6 7 7 Выборка X Y Y Y X Y X X Y Ранг 2,5 2,5 2,5 2,5 5,5 5,5 7 8,5 8,5 Если в группу совпавших элементов входят величины только одной выборки, то пересчет производить не надо. Например, для выборок X: 3, 4, 4, 5; Y: 3, 5 получаем: Значения 3 3 4 4 5 5 Выборка X Y X X X Y Ранг 1,5 1,5 3 4 5,5 5,5 Если количество совпадений мало (число элементов, «вовлеченных» в группы с совпадениями не превосходит 25% от суммы N— п + т), то можно пользоваться критериями и формулами, применявшимися при отсутствии совпадений.
Если же количество совпадений в разных группах велико, то при а <0,5 и п >20 можно использовать приближенную формулу Wsp[m, п, а)«-3---------- , . . тп(п + т+1) f, . ч А , Д -ф(1-а)^-----------р(и, т) (2.3) где к—общее количество групп, состоящих из совпавших величин, —количество совпавших величин в группе с номером, i, а —!— = (п + т+\)(п + т)(п + т— 1). р(и, т) 2. 1. В ателье по ремонту телевизоров имеются данные о времени (в неделях) безотказной (до первого ремонта) работы 9 телевизоров марки Л и 8 телевизоров марки В. При этом для телевизоров марки А указанное время составило (в порядке возрастания) 5, 12, 26, 50, 57, 110, 200, 230, 270 недель, а для телевизоров марки В—1, 25, 31, 42, 54, 70, 250, 260 недель. Пусть FA(x)— функция распределения длительности безотказной работы телевизоров марки A, a FB(x)—функция распределения длительности безотказной работы телевизоров марки В. Используя критерий Вилкоксона, проверить с вероятностью ошибки первого рода, не превосходящей а = 0,1, гипотезу Но: FA(x) = FB(x), против альтернативы Нг: FA (х) > FB (х). Решение. В рассматриваемом случае п = 9, т = 8. Поскольку альтернативой является гипотеза Н1г вычисляем 2MH/=m(« + w+1) = 8 18= 144. 2. Записываем данные в сводную таблицу вида (2.1) в порядке возрастания: 1 5 12 25 26 31 42 50 54 57 70 ПО 200 230 250 260 270 в А А В А В В А В А В А А А В В А 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
3. Суммируем все числа последней строки, стоящие под буквами В: W= 1+4 + 6 + 7 + 9 + 11 + 15 +16 = 69. 4. По таблице 12 находим Wxp(8, 9, 0,1) = 58. 5. Вычисляем разность 2M1F-(FKp(8, 9, 0,1)= 144-58 = 86. Поскольку ИЛ=69<86, у нас нет оснований отвергать гипотезу Но. 2.2. Испытания электронных ламп типов А и В на долговечность дали следующие значения длительности их работы (в сотнях часов). Для 7 ламп типа А: 57, 58, 60, 63, 64, 100, ПО; для 10 ламп типа В-. 50, 52, 56, 59, 61, 65, 66, 67, 71, 76. Пусть FA(x)— функция распределения длительности безотказной работы ламп типа A, a FB(x)—функция распределения длительности безотказной работы ламп типа В. Проверить, используя критерий Вилкоксона с а = 0,05, гипотезу Но: FA(x) = FB(x), против альтернативы FA(x)> FB(x). Решение. 1. В данном случае т = 7, п =10. Ясно, что альтернативная гипотеза — это гипотеза Н2. 2. Составляем общий вариационный ряд: 50 52 56 57 58 59 60 61 63 64 65 66 67 71 76 100 НО В В В А А В А В А А В В В В В А А 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 3. Вычисляем W, выписывая все числа последней строки, стоящие под буквами Л: 1^=4 + 5 + 7 + 9 + 10+16 + 17 = 68. 4. По таблице 12 находим lFKp(7, 10, 0,05) = 45. 5. Поскольку 1^=68^45, у нас нет оснований отвергать гипотезу Но. 2. 3. Пять измерений гравитационной постоянной по способу А дали значения: 6,675, 6,676, 6,681, 6,683, 6,673, а четыре измерения по способу В дали значения: 6,674, 6,682, 6,664, 6,661. Используя критерий Вилкоксона, проверить с а = 0,05 гипотезу Но: FA(x) = FB(x), против альтернативы FA(x)<FB(x). Ответ: РИ=15, fFxp(4, 5, 0,05)= 12. Гипотеза Но принимается.
2А. При исследовании концентрации некоторого элемента в сплавах А и В были получены следующие результаты (в %). Для сплава А 1,0, 2,0, 1,6, 2,1, 2,8, 3,5, 3,9, 3,5, 2,5; для сплава В\ 2,5, 4,2, 1,2, 4,1, 1,1, 3,8, 1,0, 4,0, 1,5. Проверить гипотезу Hq. концентрация элемента в сплавах А и В одинакова, против альтернативы Н3: концентрация элемента в сплавах разная, используя критерий Вилкоксона с а = 0,05. Решение. 1. В данном случае т = п = 9 и 2МИл=9-(9 + 9 + +1) = 171 2. Составляем вариационный ряд и записываем ранги с учетом осреднения их значений при совпадении: 1,0 1,0 1,1 1,2 1,5 1,6 2,0 2,1 2,5 2,5 2,8 3,5 3,5 3,8 3,9 4,0 4,1 4,2 А В В В В А А А А В А А А В А В В В 1,5 1,5 3 4 5 6 7 8 9,5 9,5 11 12 13 14 15 16 17 18 Заметим, что одинаковым значениям 3,5 и 3,5 мы приписали различные ранги только потому, что оба эти значения получены для сплавов типа А и, следовательно, приписывание рангов 12 и 13 эквивалентно (с точки зрения вклада в окончательную сумму рангов) приписыванию рангов 12,5 и 12,5. Количество совпадений мало, и мы можем использовать формулы, применявшиеся при отсутствии таковых. 3. Вычисляем сумму рангов концентраций сплава типа В: 1С= 1,5 + 3 + 4 + 5 + 9,5+14+16+17+18 = 88. 4. РИкр(9, 9, а/2)=РИкр(9, 9, 0,025) = 62, 2M1K-H4P(9, 9, 0,025)= 171-62= 109. 5. Так как 1У=99е(62, 109), гипотеза Но принимается. 2. 5. При сравнении технологий А и В добычи некоторого металла из каждой тонны однородной партии руды было получено следующее количество продукта (в граммах). При применении технологии А: 4,0, 4,0, 4,1, 4,5, 4,8, 5,1, 5,1, 6,0, 6,2; при применении технологии В: 3,9, 4,1, 4,1, 4,4, 4,7, 5,0, 5,2, 5,9, 6,1. Проверить, используя критерий Вилкоксона с а = 0,1, гипотезу Но: технологии А и В дают одинаковый выход металла, против альтернативы Н2\ технология А предпочтительнее технологии В (Fa(x)<Fb(x)). Ответ: И/кр(9, 9, 0,1) = 70< WB. Нет оснований отвергать гипотезу Но.
2. 6. При сравнении скорости реакции двух пациентов на звуковой сигнал в различных условиях были получены следующие данные (в тысячных долях секунды): Номер опыта А В Ранг В Номер опыта А В Ранг В 1 140 142 2 16 290 285 28 2 163 159 3 17 302 300 33 3 171 173 6 18 321 317 35 4 182 185 8 19 329 334 41 5 190 186 9 20 330 336 42 6 209 213 14 21 331 333 40 7 217 220 17 22 338 340 44 8 218 208 12 23 341 343 47 9 223 205 11 24 344 342 46 10 241 244 20 25 345 357 53 11 265 259 21 26 350 343 48 12 270 279 26 27 355 358 54 13 274 288 30 28 361 390 58 14 275 281 27 29 372 383 57 15 287 289 31 При помощи критерия Вилкоксона проверить для а = 0,05 гипотезу Но, согласно которой скорости реакций пациентов одинаковы, против альтернативы согласно которой пациент А реагирует на звуковой сигнал быстрее, чем пациент В. Использовать приближенную формулу (2.2). Решение. 1. В данном случае и = т = 29, 2МИЛ=29-59 = = 1711. 2 и 3. Выписываем ранги пациента В (см. графу Ранг В из условия задачи) и вычисляем сумму fV= 863. 4. И;р(29, 29, 0,05) = 855,5-0,5-ф(0,95) j~2~— = 855--1,645-64,3=149,8. 5. Поскольку W— 863 > И/кр(29, 29, 0,05) = 749,8, то гипотезу Но следует отвергнуть. 2. 7. Решить задачу 2.6, используя критерий знаков с ошибкой первого рода а = 0,05 (см. § 1). Решение. Обозначим знаком + результаты тех опытов, в которых пациент А среагировал на звук быстрее пациента В. Из условия задачи 2.6 вытекает, что величина ц—количество знаков + равна 19. Используя (2.1) и (2.2), находим At = V%+1,5 - у2(л-ц)-0^ = ^397 - У197 = 1,869,
х2 =739,25- 719,25 = 1,877. Поскольку хг е [1,47; 2,58], применяем формулу (1.1) И'(29,19)хФ(72ц+1,5 - 72(и-и)-0,5) = Ф(1,869)х0,969. Так как IF(29, 19) = 0,969 > 1 — а = 0,95, гипотезу Но следует отвергнуть. 2. 8. При сравнении двух методов производства азотной кислоты путем окисления амина кислородом воздуха было получено (с точностью до десятых долей грамма) следующее количество продукта. При использовании метода А (22 опыта): 89,2, 89,3, 89,8, 89,8, 90,5, 90,5, 91,0, 91,0, 92,0, 93,0, 93,0, 94,0, 94,5, 94,5, 95,0, 96,0, 97,0, 97,5, 97,5, 98,0, 100,0, 101,0. При использовании метода В (18 опытов): 88,0, 89,3, 89,3, 89,3, 89,9, 90,5, 91,0, 91,5, 93,0, 93,5, 94,0, 94,5, 94,5, 95,0, 97,0, 97,5, 99,0, 99,0. Применяя метод Вилкоксона при а = 0,05 сравнить гипотезу Но: выход продукта не зависит от выбранного метода, с гипотезой Н2: выход продукта при использовании метода А больше, чем при использовании метода В. Решение. 1. В рассматриваемом случае и = 22, ш=18. 2. Объединяя результаты полученных измерений строим таблицу Результат Метод Ранг Результат Метод Ранг 88.0 В 1 93,5 В 21 89,2 А 2 94,0 А 22,5 89,3 А 4,5 94,0 В 22,5 89,3 В 4,5 94,5 А 25,5 89,3 В 4,5 94,5 А 25,5 89,3 В 4,5 94,5 В 25,5 89,8 А 7 94,5 В 25,5 89,8 А 8 95,0 А 28,5 89,9 В 9 95,0 В 28,5 90,5 А 11 96,0 А 30 90,5 А 11 97,0 А 31,5 90,5 В 11 97,0 В 31,5 91,0 А 14 97,5 А 34 91,0 А 14 97,5 А 34 91,0 В 14 97,5 В 34 91,5 В 16 98,0 А 36 92,0 А 17 99,0 В 37 93,0 А 19 99,0 В 38 93,0 А 19 100,0 А 39 93,0 В 19 101,0 А 40
Если через X обозначить количество продукта, получаемого по методу А, а через Y—по методу В, то наша задача примет вид Но- Fx(x) = Fr(x), Н2- Fx(x)<Fr(x). 3. Вычисляя величину IV, исходя из приведенной таблицы, получаем ИЛ= 342,5. 4. Поскольку количество совпадений велико, для вычисления lVKp(m, п, а) используем приближенную формулу (2.3). Имеем А = 9, zx = 4, t2 = t3 = t4 = 3, ts — 2, /6 = 4, /7 = /8 = 2, /9 = 3. 1) = 3-2(22 —1)+3 • 3(32 —1) +3 • 4(42-1) = 270, i= 1 ~-^ = (22 + 18 + 1)(22+18)(22+18-1) = 63960, и, таким образом, 1Г.Р(18, 22, 0,05)=^Ц^ -ф(о,95)^^(1-^) = = 368,5 - 1,645 • 36,705 = 308,12. Поскольку сравниваются гипотезы HQ и Н2, и W= 342,5>И\Р( 18, 22, 0,05) = 308,12, то, в соответствии с рекомендациями, изложенными в начале раздела, гипотезу Но следует принять. § 3. Ранговая корреляция по Спирмену Методы исследования зависимости тех или иных свойств или характеристик объектов или индивидуумов, опирающиеся на ранговую корреляцию, применяются в следующей ситуации. Имеется п объектов или индивидуумов, каждому из которых присущи два качественных признака (быть может, и не выраженных количественно). Совокупность индивидуумов может быть упорядочена как в порядке возрастания «качества» первого признака, так и в порядке возрастания «качества» второго признака. Требуется выяснить, кор-релированы или нет (зависимы или нет) указанные признаки. Для проверки такого рода предположений используется
критерий, опирающийся на коэффициенты ранговой корреляции Спирмена xs. Схема вычислений этих коэффициентов такова. 1. Занумеровать исследуемые объекты (индивидуумы) числами от 1 до и. 2. Упорядочить (ранжировать) индивидуумы в соответствии с убыванием «качества» первого признака, приписав им последовательно числа 1, 2, ..., п. В случае совпадения «качества» признака у двух или более индивидуумов приписать каждому индивидууму-однородной группы ранг (число), равный среднему арифметическому значений тех мест, которые они делят. 3. Выполнить пункт 2 для второго признака. 4. Записать данные в таблицу: Порядковый номер индивидуума I 2 3 п Ранг первого признака А'2 Ранг второго признака У1 У 2 Тз К 5. Пусть т1—количество различных рангов у первого признака (количество различных чисел среди х2, хп), а т2— количество различных рангов у второго признака (количество различных чисел среди уг, у2, уп). Если = = т. е. нет индивидуумов с совпадающими рангами хотя бы по одному признаку, то Ts=l--A- £ (х;-ул)2. (3.1) "-”z=l В противном случае необходимо сначала вычислить величины т2 Л = н Т2=± Е (n23t-n2t), (3.2) 12t=i 12t=i где nit, z=l, 2; z=l, 2, ..., m,—количество элементов, входящих в z-ю группу неразличимых относительно z-ro признака индивидуумов, а затем положить
Опишем теперь критерий, использующий величину т5. В основе этого критерия лежит следующая идея: если рассматриваемые признаки независимы, то величина ps = Mxs должна равняться нулю. Поэтому проверка с ошибкой первого рода а гипотезы Но о некоррелированности исследуемых признаков, против альтернатив Н3, Н2, Н3 соответственно о положительной, отрицательной коррелированное™ признаков и о наличии корреляции, сводится к проверке гипотез ps>0; Н2. ps<0; Н3: ps^0, принятие или отклонение которых производится в соответствии с таблицей: i Принимаем Но Принимаем 1 Ts > s 2 s 3 1 1 1 > Ua/2,s где величина uas находится при помощи таблицы 11. При и >10 распределение величины xs у/п — 1 практически не отличается от стандартного нормального распределения, и в этом случае для вычисления 5 можно воспользоваться соотношением not,s = voe/>/и— 1, где ия = м1_я—квантиль уровня 1—а для стандартного нормального распределения. 3.1. В приведенной ниже таблице указана относительная оценка знаний по математике и литературе 8 учеников, занумерованных числами от 1 до 8, причем лучшим знаниям соответствует меньший ранг: Ученик 1 2 3 4 5 6 7 8 Ранг знаний по математике 5 2 1 7 8 4 6 3 Ранг знаний по литературе 4 3 2 1 7 6 5 8 Проверить, используя коэффициент ранговой корреляции Спирмена, гипотезу Но: между успехами по математике и литературе нет корреляции, против альтернативы : успехи по математике и литературе положительно коррелированы. Взять а = 0,1.
Решение. В данном случае п = 8, повторений рангов нет, вычисления проводим по формуле (3.1). Составляем таблицу квадратов разностей соответствующих рангов: Ученик 1 2 3 4 5 6 7 8 X U/-T.)2 12 (-D2 (-1)2 62 I2 (~2)2 I2 (~5)2 70 Таким образом, ts — 1 - Д_ - 70= 1 - -=0,1667. s 83 —8 6 Поскольку альтернативной является гипотеза Нг, в таблице 11 находим M0,i,s = 0,4762. Ввиду неравенства ts = 0,1667<wOi1iS = 0,4762, у нас нет оснований отвергать гипотезу Но. 3.2. Относительная оценка знаний математики и физики в группе из 7 учеников дала следующие результаты: Ученик 1 2 3 4 5 6 7 Ранг знаний по математике 5 7 1 4 2 3 6 Ранг знаний по физике 4 6 3 5 1 2 7 Проверить с уровнем значимости а = 0,05 гипотезу Но: корреляция между успехами на уроках физики и математики равна нулю, против альтернативы Н3: успехи по математике и физике имеют ненулевую корреляцию. Решение. Ввиду отсутствия повторений рангов, используем формулу (3.1). Таблица квадратов разностей рангов имеет вид: Ученик 1 2 3 4 5 6 7 X U-Л)2 I2 I2 (-2)2 (-D2 I2 I2 (-1)2 10 Отсюда при п = 7 находим т,= 1- -Д— -10= 1 — — = 0,8214. 73 —7 28 Поскольку wa/2,s = Mo,o5.s = 0,7450 при п = 7 и |ts| = 0,8214>uo,o5.j, гипотеза Но отвергается.
3.3. В конкурсе красоты участвовало 10 девушек. Разыгрывались призы жюри и зрителей. Места, присужденные девушкам жюри и зрителями, записаны в таблицу в соответствии с номерами участниц: Участница 1 2 3 4 5 6 7 8 9 10 Место у зрителей 10 7 8 2 5 1 6 3 9 4 Место у жюри 8 2 9 6 4 5 3 7 10 1 Проверить с уровнем значимости а = 0,1, используя коэффициент ранговой корреляции по Спирмену, гипотезу Но: мнения членов жюри и зрителей независимы, против альтернативы Н2: мнения членов жюри и зрителей положительно коррелированы. Ответ: ts = 0,4061; uOtOl s — 0,4424. Гипотеза Но принимается. 3.4. При дегустации 9 видов напитков два дегустатора выставили следующие оценки анализируемым напиткам (в порядке дегустации), исходя из десятибальной шкалы: Напиток 1 2 3 4 5 6 7 8 9 Оценка первого дегустатора 6 5 2 8 9 5 6 7 7 Оценка второго дегустатора 5 8 3 7 8 6 6 6 7 Проверить, используя коэффициент ранговой корреляции Спирмена, гипотезу Но: оценки дегустаторов независимы, против альтернативы Яр оценки дегустаторов положительно коррелированы. Взять уровень значимости а = 0,05. Решение. Исходные данные необходимо проранжировать, учитывая совпадения некоторых оценок. Первый дегустатор выставил Wj=6 различных оценок. Ранжировка напитков по убыванию оценок с учетом совпадений дает таблицу: Напиток 1 2 3 4 5 6 7 8 9 Ранг 5,5 7,5 9 2 1 7,5 5,5 3,5 3,5 Второй дегустатор выставил т2 = 5 различных оценок, ранжировка в соответствии с которыми приводит к таблице:
Напиток 1 2 3 4 5 6 7 8 9 Ранг 8 1,5 9 3,5 1,5 6 6 6 3,5 Окончательно получаем: Напиток 1 2 3 4 5 6 7 8 9 Ранг у первого дегустатора 5,5 7,5 9 2 1 7,5 5,5 3,5 3,5 Ранг у второго дегустатора 8 1,5 9 3,5 1,5 6 6 6 3,5 Поскольку имеются совпадения рангов, вычисление т5 нужно проводить по формуле (3.3), учитывая при этом (3.2). Так как «;3 — nit = 0, если Пц = 1, то при вычислении Т\ и Т2 по формуле (3.2) нужно принимать во внимание лишь те слагаемые, для которых л,( 72. Ввиду того, что ранги 3,5, 5,5 и 7,5 встречаются у первого дегустатора по два раза, а ранги 1,5, 3,5 и 6 встречаются у второго дегустатора соответственно по два, два и три раза, вычисления дают Т1=±-3-(23-2)=1,5, Г2 = 1(2-(23-2)+(33-3)) = 3, S (х;-Л)2 = (-2,5)2 + 62 + 02+ (- 1,5)2+ (-0,5)2+ (1,5)2 + + ( —0,5)2+ (-2,5)2 + 02 = 53,5. Обращаясь к (3.3), находим 1(9^-9)-53,5-1,5-3 т, =____L_.... -------- == X0,5368. /1 . , . /I , , 7117 7114 ^-(93-9)-2-1,5-^-(93-9)-2-3 V V По таблице 11 находим, что для « = 9 и а = 0,05 величина Ma,s = «o,o5.s = 0,5833. Поскольку т5 = 0,5368 <Mo.o5,s = 0,5833, гипотеза /70 принимается.
3.5. Проверка готовности 7 школьных кабинетов к учебному году проводилась комиссией в составе двух человек. Каждый член комиссии оценивал готовность кабинета по десятибальной системе. Результаты их работы приведены в таблице: Номер кабинета 1 2 3 4 5 6 7 Оценка первого члена комиссии 8 7 10 7 3 8 9 Оценка второго члена комиссии 6 6 9 7 4 8 10 Проверить, используя коэффициент ранговой корреляции Спирмена, гипотезу 77О: оценки членов комиссии независимы, против альтернативы Н±. оценки членов комиссии положительно коррелированы. Взять уровень значимости а = 0,05. Ответ: ts = 0,8441, mOio5,s = O,6786. Гипотеза Но отвергается. 3.6. Двенадцать однородных предприятий были проран-жированы сначала по степени оснащенности их вычислительной техникой, а затем по степени эффективности их функционирования за рассматриваемый период: Предприятие 1 2 3 4 5 6 7 8 9 10 11 12 Оснащенность 1 2 3,5 3,5 6 6 6 8,5 8,5 10 11 12 Эффективность 2 4 1 6 3 6 9,5 9,5 12 8 11 6 Проверить, используя коэффициент ранговой корреляции Спирмена и нормальное приближение, гипотезу Но: оснащенность предприятий вычислительной техникой не влияет на эффективность работы предприятий, против альтернативы Нг: между оснащенностью предприятий вычислительной техникой и эффективностью их функционирования имеется положительная корреляция. Взять а = 0,05. Решение. Вычисления по формуле (3.3) с учетом (3.2) дают при и =12 Л=1(2-(23-2) + (33-3)) = 3, Г2 = 1((23-2) + (33-3)) = 2,5,
S (х;-д)2 = (-1)2+ (-2)2+ (2,5)2+ (-2,5)2 + 32 + 02 + ;=1 + (-3,5)2 + (-1)2 + (-3,5)2 + 22 + 02 + 62 =92, ^(123-12)-92-3-2,5 ts = — ......... .........-.....-=0,6720. ^1(12з_ 12)-2 3 -у|(123-12) -2 3,5 Как отмечалось в начале данного параграфа, при л >10, вычисляя w0i05 s, можно воспользоваться нормальной аппроксимацией, согласно которой 1, где va—находится по таблице 2. В нашем случае Wo,05,s« 1^0.05/V«-l = 1,645/УГГ = 0,4960. Поскольку ts = 0,6720 > и0 05 , = 0,4960, гипотеза HQ отвергается. 3.7. В одном из разделов выставки кошек были представлены одиннадцать животных, которым по жребию были присвоены номера от 1 до И. Их экстерьер оценивался двумя экспертами по десятибальной системе. Результаты работы экспертов приведены в таблице: Номера животного 1 2 3 4 5 6 7 8 9 10 11 Оценка первого эксперта 7 5 9 10 3 6 8 5 2 7 7 Оценка второго эксперта 8 8 9 7 6 4 7 7 5 3 5 Проверить с уровнем значимости а = 0,05 гипотезу Но: оценки экспертов статистически независимы, против альтернативы Н^. оценки экспертов отрицательно коррелированы. При вычислении иа s использовать нормальную аппроксимацию. ’ 11 Ответ: ^ = 2,5, Т2 = 3, S (Х;-л)2= 148, ts = 0,3100, > = 1 mBiS=0,5201. Гипотеза Но не отвергается. 3.8. В условиях предыдущей задачи проверить с уровнем значимости а = 0,1 гипотезу Но: оценки экспертов статистически независимы, против альтернативы Н3: оценки экспертов имеют ненулевую корреляцию. При вычислении was использовать нормальную аппроксимацию. Ответ: гипотеза Но не отвергается.
ГЛАВА 19 МЕТОД НАИМЕНЬШИХ КВАДРАТОВ И РЕГРЕССИЯ К кругу задач, решаемых по методу наименьших квадратов, относятся задачи следующего типа. Переменная у связана с переменной х функциональной зависимостью у —f (х). Однако эта зависимость известна с точностью до коэффициентов. Так, например, функция /(х) может иметь вид а0 + а1х, а0 + а1х+а2х2 и т. д., при этом конкретные значения а0, аг, аг неизвестны. Для определения явного вида зависимости в каждой из заданных точек xt, i—\, ..., п измеряется значение у,=/(х,), но не точно, а с ошибкой 8;, в результате чего наблюдатель имеет в своем распоряжении величины П>=У;+ 8. =/(*.)+8*’ |=1’ ’ п> используя которые необходимо построить оценки неизвестных коэффициентов. По методу наименьших квадратов в качестве оценок неизвестных коэффициентов выбираются такие числа, которые минимизируют величину I (п.-УЫ)2-;=1 § 1. Метод наименьших квадратов для простой линейной регрессии 1.1. Построение оценки простой линейной регрессии Простая линейная регрессия соответствует случаю /(х) = = а0 + а1х. Предполагается, что в представлении H^ao + aiXi + Si, г=1, ..., п, (1.1) случайные ошибки 8( независимы, М8, = 0, D8, = ct2. Иными словами, систематическая ошибка в измерениях отсутствует,
а разброс (дисперсия) ошибки измерения не зависит от точки, в которой проводятся измерения. В качестве оценок параметров а0 и аг берут величины а0 и минимизирующие сумму п Е (ni-ao-aix)2. i= 1 Такими значениями являются X (х- х)ч. X (х-*)2 i= 1 1 " й0 = - Е Bi•-ахх = Т| ,!/=1 — агх. Вместо (1.1) чаще используют запись регрессии в виде Т|, = ЛО + Л! (х,-х) + 8( (1.2) с очевидной связью av=Ai и а0 = А0 — Агх. Оценками параметров А 0 и Аг являются величины X (х-х)п,- --------, Л0 = П. (1.3) X (х-*)2 { = 1 Причина перехода от представления (1.1) к представлению (1.2) кроется в том, что если ошибки 8, имеют нормальное распределение с параметрами 0 и ст2, то случайные величины А о и At независимы и нормально распределены, причем п п X (Xi-x)yi ^(xi-x)(A0 + A1(xi-x)) МА^----------------= (1.4) X (х~ Х)2 X (х-х)2 i! = 1 i = 1 X (x-х)2 i= 1 МЛ0 = Л0, Djo = -. (1.5) п
1.1. В книге «Основы химии» Д. И. Менделеев приводит следующие экспериментальные данные о количестве Т] азотно-натриевой соли, которое можно растворить в 100 г воды в зависимости от температуры х: Xi 0 4 10 15 21 29 36 51 68 п. 66,7 71,0 76,3 80,6 85,7 92,9 99,4 113,6 125,1 Предполагая, что зависимость между рассматриваемыми величинами имеет вид у = а0 + а!Х, оценить параметры а0 и а^. Решение. В данном случае л = 9, х = 26. Запишем интересующую нас регрессию в виде у = Л0 + Л1(х — 26). (1.6) Воспользовавшись данными из условия задачи, находим по формулам (1.3) 1 4 9 ц = -£ Ц| = 90,15 = Ло, £ (х;-х)2=4060, yi=i t=i 9 £ (х, — х)г), = 3534,8, ^!=0,87. i= 1 Таким образом, у (х) = 90,15 + 0,87 (х- 26) = 67,53 + 0,87х. 1.2. При изучении характера влияния количества ингибитора (замедлителя реакции) на длительность процесса химической реакции получены следующие данные (в условных единицах): Количество ингибитора 11 15 17 19 22 25 29 30 Время до завершения реакции (сек) (П1) 11,55 15,50 17,95 18,30 23,00 23,90 28,00 29,70 Предполагая, что зависимость длительности реакции у от количества ингибитора х имеет вид у = а0 + а1х, оценить параметры а0 и аг. Ответ: у(х)= 1,64+0,92х.
1.2. Построение доверительных интервалов для параметров простой линейной регрессии Если ошибки измерений 81 в (1.2) распределены нормально с параметрами 0 и ст2, то Аг и Ао распределены соответственно (о2\ А о, —), где DJi вычисляется и у по (1.4), и, следовательно, доверительные интервалы для Ai и А 0 с уровнем доверия 1 —2а при известном ст2 имеют вид (см. задачу 5.1 гл. 15) Ai — UiЛд + ui-a—— (1.7) (1-8) где ир—квантиль стандартного нормального распределения уровня р. Пусть y(x) — A0 + AiX и ” 1=1 Если величина ст2 неизвестна, то (1.9) где, как и прежде, ти_2—случайная величина, имеющая распределение Стьюдента с л —2 степенями свободы. Поэтому (см. задачу 5.9 гл. 16) с вероятностью 1—2а интервал содержит параметр Аг, и с той же вероятностью 1 —2а интервал j 5 2 s Ао~~ ti-a,n-2—^! Aq+ ti-л<п~2~^ у/п ^/п накрывает неизвестный параметр Ао.
1.3. Предполагая, что величины р,- из задачи 1.1 имеют вид т] t = А о+А1 (х—26) + 8,-, где 8,- распределены нормально с параметрами 0 и о2, построить доверительные интервалы для параметров Ах и Ао с уровнем доверия 1 —2а=0,9, если известно, что о2 =4. Решение. В данном случае а = 0,05. Отсюда и из таблицы 6 находим и1_в = «0>95® 1,65. Используя результаты задачи 1.1, имеем 9 £ (х,—х)2 = 4060, Л=0,87, Ло = 90,15, 1=1 Mi-«4=1’65i=1’L х/Л Учитывая (1.7) и (1.8), находим искомые доверительные интервалы 0,87 - 0,06 = 0,81 < A j < 0,87 + 0,06=0,93, 90,15-1,1 = 89,5^ЛО <90,15 +1,1 = 91,25. 1.4. Решить задачу 1.3 в предположении, что дисперсия ошибок ст2 неизвестна. Решение. Будем использовать соотношение (1.9). В данном случае и = 9. Вычислим значения функции у(х) = Ло + Л1(х-26) = 9О,15 + 0,87(х-26) в точках Xi- Тогда xi 0 4 10 15 21 29 36 51 68 fa) 57,58 71,10 76,23 80,58 85,80 92,76 98,85 111,90 126,69 Оъ-Ж))2 83,17 10-4 510“3 4 10"4 10“2 210“2 ЗЮ"1 2,89 2,53 Отсюда 1 9 1 $2=^£(п<-+.))Ц-88,93-12,7. Пусть —квантиль уровня 1 —а для распределения Стьюдента с п степенями свободы. Ввиду (1.9) Р {х/й|Ло~ '4о1<'*^1-«,и-2} = 1 —2а,
рX (х<-*)2М1 -Л11 <St1-a<„-21= 1 -2а. По таблице 6 находим, что при п = 9 и а = 0,05 величина ;i-a,n-2 = ^o 95 7= 1,895. Таким образом, искомые доверительные интервалы с учетом результатов задачи 1.2 имеют вид Л с V Л0-1,895-^Л0^Л0 + 1,895--, Л ~ 1,895 • —Л! Л +1,895 • —, ,/4060 v4060 или 87,90^ Ло^ 92,40; 0,76^^0,98. 1.5. Предполагая, что величины г), из задачи 1.2 имеют вид т|| = Ло + Ах (х—26) +8f, где 8f распределены нормально с параметрами 0 и ст2, построить доверительные интервалы для Аг и Л о с уровнем доверия 0,95, если ст2 = 9. Ответ: 0,59^^1,25; 18,92 г$Л0 ^23,64. 1.3. Совместная доверительная область для параметров простой линейной регрессии Сумма л(Л0-Л0)2 “г 2 имеет распределение /2 с двумя степенями свободы, а величина— и(А0-л0)2 + X (х>—х)2(41-Л)2 __________1=1_____________ S2 распределение Снедекора с 2 и л —2 степенями свободы (см. § 5 гл. 15). Совместная доверительная область для парамет- ров Аг и Л о с уровнем доверия р будет иметь зид: а) если величина ст2 известна, то < И 'J S> = l(A0, Л!): (Ау-Аг)2 X (Xi-xy + n(Ao-Aoy^<y2Xp,2}', I 1=1 J (1.10)
б) если величина ст2 неизвестна, то ® = )(Ло, /11): (А-Л)2 Е (xi-x)2 + n(A0-A0)2^2S2FP'2'„_A. I i = 1 J (1.11) 1.6. В условиях задачи 1.1 построить совместную доверительную область для параметров Ао и Ai с уровнем доверия 0,95. Считать, что ст2 = 4. Решение. В данном случае /> = 0,95, п — 9 и (см. таблицу 5) Хо,95,2 = 5,99. Отсюда, с учетом результатов задачи 1.1 и соотношения (1.10), получаем 3> = {(А0, Л1):(^1-0,87)2-4060 + (Ло-90,15)2-9^23,96}. 1.7. Решить задачу 1.6 при неизвестном значении ст2. Решение. Имеем /> = 0,95, л = 9. По таблицам для распределения Снедекора (таблица 7) находим F0,95i2,7 = 4,74. Отсюда, с учетом (1.11), получаем & = {(А0, А):(/41 -0,87)2-4060 + (Ло-90,15)2-9<60,198}. 1.8. В условиях задачи 1.2 построить совместную доверительную область для параметров Ао и А\ с уровнем доверия 0,9. Величина ст2 = 0,5. Ответ: ® = {(Л0, А^.(Аг-0,92)2 • 318 + (Ло-21)2 • 8<2,91}. 1.9. В условиях задачи 1.2 построить совместную доверительную область для параметров Ао и Аг с уровнем доверия 0,9. Величина ст2 неизвестна. Ответ: & = {(А0, Ai):(Ai-0,92)2 318 + (Л0-21)2 • 8<3,78}. § 2. Проверка статистических гипотез о параметрах простой линейной регрессии Если нас интересует, принимают или нет параметры Аг и Ао какие-нибудь конкретные значения Вг и Во, то критерий (правило) принятия или отклонения гипотез Н0-.А1 = В1, Н*0.А0 = В0 ппотив альтернатив соответственно Нг'.Аг^В,, Н\:А0*В0 с ошибкой первого рода а выглядит следующим образом.
1) Если величина ст2 известна, то гипотеза Но принимается при и отвергается, если это неравенство не выполняется (как и прежде, ир—квантиль уровня р для стандартного нормального распределения). В тех же условиях (ст2 известно) гипотеза Н*о принимается, если | Во — Ао I у/п^ (УЫу — а/2, и отвергается, если это неравенство не выполняется. 2) Если величина ст2 неизвестна, то гипотеза Но принимается' при 1В1-Л\| (2-1), V i= 1 а гипотеза Н’а принимается, если IBo—Aoly/n^St1-af2,n-23 (2-2)> где 1Р'„—квантиль уровня р для распределения Стьюдента с п степенями свободы. Невыполнение неравенства (2.1) влечет принятие гипотезы а неравенства (2.2) — принятие гипотезы Н\. 2.1. В условиях задачи 1.1 проверить гипотезу Яо:Л!=0,9, против альтернатив Н^.А^Ъ,*) с ошибкой первого рода а = 0,2. Положить ст 2=4. Решение. Поскольку 10,9 - А! | 74060 = 0,02 • ^/4060 = 1,27 < и0,9 ст = 1,28 • 2 = 2,58, гипотеза Но принимается. 2.2. В условиях задачи 1.1 проверить гипотезу Н*о: ^4о = 91, против альтернативы Н1:Л0#91 с ошибкой первого рода а = 0,1. Положить ст2 = 1. Решение. В данном случае п = 9 и 191 — Ло| ч/й=2,55>мО195 • ст= 1,65 • 1 = 1,65. Гипотеза Н*о отвергается. 2.3. Решить задачу 2.1, считая, что значение ст2 неизвестно. Решение. Как показано в задаче 1.4, S'2 =12,7, кроме того, ?0 917 = 1,415. Поскольку
10,9-Л I ^4060 = 1,27</0,9,7 S= 5,04, гипотеза Но принимается. 2.4. Решить задачу 2.2, считая, что значение ст2 неизвестно. Решение. 191 - А01 УЗ = 2,55 < /0,95> 7 • S= 1,895 • 3,56 = 5,75. Гипотеза Н*о принимается. 2.5. В условиях задачи 1.2 проверить гипотезу 7/0:Л = 1, против альтернативы Hr.A^l с ошибкой первого рода а = 0,02. Ответ: гипотеза Но отвергается. 2.6. В условиях задачи 1.2 проверить гипотезу H*oiAo = 20, против альтернативы 771:Ло#20 с ошибкой первого рода а=0,02. Ответ: гипотеза Н*о принимается. 2.7. Решить задачу 2.5, считая значение величины ст2 неизвестным. Ответ: гипотеза Но отвергается. 2.8. Решить задачу 2.6, считая значение величины ст2 неизвестным. Ответ: гипотеза Н*о принимается.
Продолжение таблицы
Сотые доли
Таблица 3. Значения функции />*(Х)=—е X к 0,1 0,2 0,3 0,4 0,5 0 0,90484 0,81873 0,74082 0,67032 0,60653 1 0,09048 0,16375 0,22225 0,26813 0,30327 2 0,00452 0,01638 0,03334 0,05363 0,07582 3 0,00015 0,00109 0,00333 0,00715 0,01264 4 0,00006 0,00025 0,00072 0,00158 5 0,00002 0,00006 0,00016 6 0,00001 к X 0,6 0,7 0,8 0,9 0 0,54881 0,49659 0,44933 0,40657 1 0,32929 0,34761 0,35946 0,36591 2 0,09879 0,12166 0,14379 0,16466 3 0,01976 0,02839 0,03834 0,04940 4 0,00296 0,00497 0,00767 0,01112 5 0,00036 0,00070 0,00123 0,00200 6 0,00004 0,00008 0,00016 0,00030 7 0,00001 0,00002 0,00004 Таблица 3. (продолжение) X к 1,0 2,0 3,0 4,0 5,0 0 0,36788 0,13534 0,04979 0,01832 0,00674 1 0,36788 0,27067 0,14936 0,07326 0,03369 2 0,18394 0,27067 0,22404 0,14653 0,08422 3 0,06131 0,18045 0,22404 0,19537 0,14037 4 0,01533 0,09022 0,16803 0,19537 0,17547 5 0,00307 0,03609 0,10082 0,15629 0,17547 6 0,00051 0,1203 0,05041 0,10419 0,14622 7 0,00007 0,00344 0,02160 0,05954 0,10445 8 0,00001 0,00086 0,00810 0,02977 0,06528 9 0,00019 0,00270 0,01323 0,03627 10 0,00004 0,00081 0,00529 0,01813 11 0,00001 0,00022 0,00193 0,00824 12 0,00006 0,00064 0,00343 13 0,00001 0,00020 0,00132 14 0,00006 0,00047 15 0,00002 0,00016 16 0,00005 17 0,00001
Таблица 4. Квантили ир нормального распределения Ж(0,1) р 0,9 0,91 0,92 0,93 0,94 0,95 0,955 0,960 0,965 и_р 1,282 1,341 1,405 1,476 1,555 1,645 1,695 1,751 1,812 0,970 0,975 0,980 0,985 0,990 0,995 0,999 0,9995 0,9999 1,881- 1,960 2,054 2,170 2,326 2,576 3,090 3,291 3,720 Примечания: 1) Значения величины = ц(1 +7у2 находятся из этой таблицы на основании соотношения up = c2p-i. 2) Для малых значений р квантили и находятся по формуле Таблица 5. Квантили х₽.п распределения Х2(л) п 0,005 0,010 0,025 0,05 0,95 0,975 0,990 0,995 1 0,044 0,032 0,001 0,004 3,84 5,02 6,63 7,88 2 0,010 0,020 0,051 0,103 5,99 7,38 9,21 10,6 3 0,072 0,115 0,216 0,352 7,81 9,35 11,3 12,8 4 0,207 0,297 0,484 0,711 9,49 11,1 13,3 14,9 5 0,412 0,554 0,831 1,15 И,1 12,8 15,1 16,7 6 0,676 0,872 1,24 1,64 12,6 14,4 16,8 18,5 7 0,989 1,24 1,69 2,17 14,1 16,0 18,5 20,3 8 1,34 1,65 2,18 2,73 15,5 17,5 20,1 22,0 9 1,73 2,09 2,70 3,33 16,9 19,0 21,7 23,6 10 2,16 2,56 3,25 3,94 18,3 20,5 23,2 25,2 11 2,60 3,05 3,82 4,57 19,7 21,9 24,7 26,8 12 3,07 3,57 4,40 5,23 21,0 23,3 26,2 28,3 13 3,57 4,11 5,01 5,89 22,4 24,7 27,7 29,8 14 4,07 4,66 5,63 6,57 23,7 26,1 29,1 31,3 15 4,60 5,23 6,26 7,26 25,0 27,5 30,6 32,8 16 5,14 5,81 6,91 7,96 26,3 28,8 32,0 34,3 17 5,70 6,41 7,56 8,67 27,6 30,2 33,4 35,7 18 6,26 7,01 8,23 9,39 28,9 31,5 34,8 37,2 19 6,84 7,63 8,91 10,1 30,1 32,9 36,2 38,6 20 7,43 8,26 9,59 10,9 31,4 34,2 37,6 40,0 21 8,03 8,90 10,3 11,6 32,7 35,5 38,9 41,4 22 8,64 9,54 11,0 12,3 33,9 36,8 40,3 42,8 23 9,26 10,2 11,7 13,1 35,2 38,1 41,6 44,2 24 9,89 10,9 12,4 13,8 36,4 39,4 43,0 45,6 25 10,5 11,5 13,1 14,6 37,7 40,6 44,3 46,9 26 11,2 12,2 13,8 15,4 38,9 41,9 45,6 48,3 27 11,8 12,9 14,6 16,2 40,1 43,2 47,0 49,6 28 12,5 13,6 15,3 16,9 41,3 44,5 48,3 51,0 29 13,1 14,3 16,0 17,7 42,6 45,7 49,6 52,3 30 13,8 15,0 16,8 18,5 43,8 47,0 50,9 53,7 Примечание. При больших п (л>30) для вычисления квантилей х₽,п можно использовать приближенное соотношение «(ц^У2^Т)2/2.
Таблица 6. Квантили Zp.„ распределения Стьюдента S(n) р 0,900 0,950 0,975 0,990 0,995 1 3,073 6,314 12,706 31,821 63,657 2 1,886 2,920 4,303 6,965 9,925 3 1,638 2,353 3,182 4,541 5,841 4 1,533 2,132 2,776 3,747 4,604 5 1,476 2,015 2,571 3,365 4,032 6 1,440 1,943 2,447 3,143 3,707 7 1,415 1,895 2,365 2,998 3,499 8 1,397 1,860 2,306 2,896 3,355 9 1,383 1,833 2,262 2,821 3,250 10 1,372 1,812 2,228 2,764 3,169 11 1,363 1,796 2,201 2,718 3,106 12 1,356 1,782 2,179 2,681 3,055 13 1,350 1,771 2,160 2,650 3,012 14 1,345 1,761 2,145 2,624 2,977 15 1,341 1,753 2,131 2,602 2,947 16 1,337 1,746 2,120 2,583 2,921 17 1,333 1,740 2,110 2,567 2,898 18 1,330 1,734 2,101 2,552 2,878 19 1,328 1,729 2,093 2,639 2,861 20 1,325 1,725 2,086 2,528 2,845 21 1,323 1,721 2,080 2,518 2,831 22 1,321 1,717 2,074 2,508 2,819 23 1,319 1,714 2,069 2,500 2,807 24 1,318 1,711 2,064 2,492 2,797 25 1,316 1,708 2,060 2,485 2,787 26 1,315 1,706 2,056 2,479 2,779 27 1,314 1,703 2,052 2,473 2,771 28 1,313 1,701 2,048 2,467 2,763 29 1,311 1,699 2,045 2,462 2,756 30 1,310 1,697 2,042 2,457 2,750 Примечания: 1) Для малых значений р квантили zp „ находятся по формуле zp.„= —Zi-P.„. 2) При п>30 можно использовать приближенное соотношение 1р п ~ Up
Таблица 7. Квантили Fpm„ распределения Сиедекора S(m, л) при />=0,95 о Лт\О© -тГ SOQO SJoCcem ОЧ’* S© O* Tl“ тт}- <0 00^—Os^ тг'сп'сП гп'оч' О* mrj s© Os t"^'©m ^cn 04 04 04 04 04 CH 00 СП Os s© СПО4О4 — — О4ОЧО4 04 04 o4©> m cn — — <300^ 04 04 04 04 04* OS 0* SO tJ-©OsOsOs^^ 04—'— —Г,—T-T со Os© OsTj-r*oo ОЧтГ — ОЧ — SO Os тоЧ О тгЧгЧспФ oor*-s©mTt om —r**cn ^cncno4o4 ,20 ,18 ,15 ,13 ,11 Os O* s© т+- fn — OOOOOO 245 19 8 5 Tf CH СП CH cn О4О4О4О4ОЧ 04 04 04 04 04 О4ОЧО4О4О4 04 оч" 04'04'04" 04 os5?S coor^cor-S00mo40 — OsOsOcn Osr*-s©s©m ,48 ,42 .38 ,34 ,31 oomcnooo 04 04 04 04- S©mcno400s —————0 cn os об m ОЧ СП СП СП 04 04 04 04 04 04 04 04 04 04 O4r O4r O4r O4r O4r 04 04 04 04 04 04’ OOsS© OSTjr-OS ,74 ,06 ,64 ,35 ,14 oommr"0 OsOOO*-s©s© ,54 ,49 ,45 ,41 ,38 mo40r*-m cncnen 04 04 Tf 04 OOsOOs© 04 04 04 — — — ф — osodrn Tj-Tj- ch ch ch 04 04 04 04 04 04 04 04 04 04 О4О4ОЧО4 04 O4O4O4O4O4O4 оЧ^ 00-0 mcnooo 0*000 Os 00 o— \©CH — ГЧОО —m OOsOOO*-s© Os тГ Os 'O r4 Cs0*Tj-04O cncncncncn ООГ*-ттГо4 — O4O4O4O4O4O4 Os OOSOOS© Tj-Tj- ch ch ch CH 04 04 04 04 04 Г4 r4 O4r Г4 04 04’ ri 04 oi o4 04 04 оч 04 04 оЧ Os СП ООО ,82 ,15 ,73 ,44 ,23 г*ттг*О OOsOOh'O' ,64 ,59 ,55 ,51 ,48 .45 .42 .40 .37 ,36 Tj-04 — Os 00 0* cncncno4o4o4 оо 00 Os 00 s© СП — ОЧ Tj-Tj- ch ch ch СП 04 04 04 04 04 04 04 04 04 04 04 04 04 04 оч" rl 04 04 04 04 .8 ,35 .89 .09 00 —OsOOs ОООЧГ-тоЧ ^t —— CHs© — ©OsOOr* .71 ,66 ,61 ,58 ,54 — CssOTf 04 m Tj- Tj- Tj- ,40 ,39 ,37 ,36 ,35 ,33 Г- SDOsOOS© СП — ОЧ тГтГспспсп cn cn 04 04 04 04 04 04 04 04 О4ОЧОЧО4О4 04 04 04 04 04 04 СП^*'© Осп Os — СП 00 t"-00 Г"* 0s04 00mcn r4 0s0r4m •CNOOOsOO Os^t Os©cn r*. r*. r*. \© s© ,60 ,57 ,55 ,53 ,51 ,49 ,47 ,46 ,45 ,43 ,42 Tt OS 0©Г S© cn — ОЧ cn СП СП cn cn cn 04 04 04 04 04 04 O4r 04 04 04 04 04 04 04 04 04 04 04 О —SO оЧспОоЧ m Ost"-Os00 Осп Os S©Tj- eno —cns© cnr4 —OOs от — Г* Tics oo 00 r*r* ,71 ,68 ,66 ,64 .62 ,60 ,59 ,57 ,56 ,55 ,53 W OOsOss©r оЧ IZS^CHCHCH cn cn cn cn o4r 04 04 04 04 04 О4О4ОЧО4О4 O4O4O4O4O4O4 mo4Os s© ОЧ —1 CH Osc*so4tJ-c*s — m — oo s© 48 ,36 26 18 ,11 so — s©mo OOOsOsOs Г-тГОЧООО 00 00 00 00 r* ,76 ,74 ,73 ,71 ,70 ,69 тГ os Oss© ОЧ — ОЧ ттГ Tfcncn СПСПСПСПСП cHcno4o4o4 04 04 04 04 04 O4O4O4O4O4O4 SDOOOs Г"- — ОЧт — s© un O'- S© stOCHOCC — OsOs — Tj-Г* m tJ- tJ- cn Cs^osom 0404 04—— ,10 ,07 ,05 ,03 ,01 Osoos© men 04 Os Os Os Os Os Os СП m Os Os s©r оЧ m <H СПСПСПСПСП СПСПСПСПСП cncncncncn 04 04 04 04 04 04 ,5 ,00 ,55 .94 OsTj-Tj-sOs© O'- —O'-Tf 04 OOOOs — ^t — osocoor* oocnosmr4 soscmmm OS r-Tl- 04 О Tj- Tj- Tf Tj- Tj- Os Г--m Tf cn 04 СП СП СП cn cn cn гч Os Os Os'© OS — m m tJ- tJ- tJ- Tfcncncncn cncncncncn cn cn.cn cn cn cn cncncncncn ,4 ,51 .13 .71 — Os Os 04 04 sOOsmcn — ,96 ,84 ,75 ,67 ,60 ,54 .49 ,45 ,41 ,38 mo400©s© cn cnen 04 04 ^•СП — ОООГ*-04 04 04 04 — —_ —* ”00Ot* SO — — sommmm £ / — O4C*STj- ms© 0*00 os 10 11 12 13 14 ms©r*-ooos •—« •—« •—« •-*« •—« О — очсптГ 04 оч 04 04 04 ms©r*. ooosO 04 04 04 04 04 cn / с Примечание. Квантили уровней р и 1 — р связаны соотношением

Таблица 9. Равномерно распределенные случайные числа 65 48 11 76 74 17 46 85 09 50 58 04 77 69 74 45 80 12 43 56 35 17 72 70 80 15 45 31 82 23 74 45 74 35 09 98 17 77 40 27 72 14 43 23 60 02 10 19 69 91 62 68 03 66 25 22 91 48 36 93 68 72 03 37 09 89 32 05 05 14 22 56 85 14 46 42 75 67 88 93 34 07 27 68 50 36 69 73 61 70 65 81 33 98 85 56 45 57 18 24 06 35 30 34 26 14 86 79 90 74 39 82 02 05 16 56 92 68 66 57 48 18 73 05 38 52 47 89 05 32 54 70 48 90 55 35 75 48 28 46 82 87 09 75 06 52 96 47 78 35 80 83 42 82 60 93 52 03 44 76 22 10 94 05 58 60 97 09 34 33 50 50 07 39 98 23 50 72 56 82 48 29 40 52 42 01 52 77 56 78 51 98 13 74 67 00 78 18 47 54 06 10 68 71 17 78 17 49 36 76 66 79 51 90 36 47 64 93 29 60 91 10 62 42 91 82 60 89 28 93 78 56 13 68 23 47 83 41 13 29 68 47 92 76 86 46 16 28 35 54 94 75 08 99 23 45 26 94 03 68 58 70 29 73 41 35 53 14 03 33 40 45 85 15 74 79 54 32 97 92 65 75 57 60 04 08 81 19 11 10 00 20 40 12 86 07 46 97 96 64 48 94 39 37 16 50 53 44 84 40 21 95 25 65 43 65 17 70 82 93 10 09 73 25 33 76 52 01 35 86 34 67 35 48 76 07 37 54 20 48 05 64 89 47 42 96 24 80 52 40 37 32 08 42 26 89 53 19 64 50 93 03 23 20 90 25 60 47 99 01 90 25 29 09 37 67 07 15 38 31 13 11 65 09 12 80 79 99 70 80 15 73 61 47 64 03 23 66 53 53 80 95 90 91 17 39 29 27 49 45 66 06 57 47 17 56 20 63 61 04 02 00 82 29 16 65 31 06 01 08 05 82 15 95 33 47 64 35 08 03 36 06 85 26 97 76 02 89 88 67 67 43 97 04 43 62 76 59 63 57 33 21 35 75 98 95 11 68 77 12 17 17 68 33 73 79 64 57 53 76 Примечания: 1) Приведенные в таблице цифры можно рассматривать как реализации независимых одинаково распределенных случайных величин, принимающих значения 0, 1, .... 9 с одинаковой вероятностью 0,1. 2) Если взять из этой таблицы непересекающиеся группы из, скажем, четырех цифр at, а2, а3, а4 и образовать из них числа вида 0, at, а2, аэ, а4, то эти числа можно рассматривать в качестве значений (с точностью 10'4) равномерно распределенных на [0, 1 ] случайных величин. Таблица 10. Нормально распределённые Ж(0, 1) случайные числа -0,486 0,856 -0,491 -1,983 -1,787 -0,261 -0,256 -0,212 0,219 0,779 -0,105 -0,357 0,065 0,415 -0,169 0,313 -1,339 1,827 1,147 -0,121 1,096 0,181 1,041 0,535 -0,199 -0,246 1,239 -2,574 0,279 -2,056
Продолжение таблицы 10 1,237 1,046 -0,508 -1,630 -0,146 -0,392 -1,384 0,360 -0,992 -0,116 -1,698 -2,832 -0,959 0,424 0,969 -1,141 -1,041 0,362 0,731 1,377 0,983 -1,330 1,620 -1,040 0,717 -0,873 -1,096 -1,396 1,047 0,089 -1,805 -2,008 -1,633 0,542 0,250 -0,166 -1,186 1,180 1,114 0,882 1,265 -0,202 0,658 -1,141 1,151 -1,210 -0,927 0,425 -0,439 0,358 -1,939 0,891 -0,227 0,602 -1,399 -0,230 0,385 -0,649 -0,577 0,237 0,032 0,079 0,199 0,208 — 1,083 -0,219 0,151 -0,376 0,159 0,272 -0,313 0,084 0,290 -0,902 2,273 0,606 0,606 -0,747 0,873 -0,437 0,041 -0,307 0,121 0,790 -0,289 0,513 -1,132 -2,098 0,921 0,145 -0,291 1,122 1,119 0,004 0,768 0,079 -2,828 -0,439 -0,792 -1,275 0,375 -1,656 0,247 1,291 0,063 -1,793 -0,513 -0,344 -0,584 0,541 0,484 -0,986 0,292 -0,521 0,446 -1,661 1,045 -1,363 1,026 2,990 0,034 -2,127 0,665 0,084 -0,880 -1,473 0,234 -0,656 0,340 -0,086 -0,158 -0,851 -0,736 1,041 0,008 0,427 -0,831 0,210 -1,206 -0,899 0,110 -0,528 -0,813 1,266 -0,491 -1,114 1,297 -1,433 -1,345 -0,574 -1,334 1,278 -0,568 -0,109 -0,515 -0,566 -0,287 -0,144 -0,254 0,574 -0,451 -1,181 0,161 -0,886 -0,921 -0,509 1,410 -0,518 -1,346 0,193 -1,202 0,394 -1,045 0,843 1,250 -0,199 -0,288 1,810 1,378 0,584 2,923 0,500 0,630 -0,537 0,782 0,060 -1,190 -0,318 0,375 -1,941 0,247 -0,491 0,192 -0,432 -1,420 0,489 -1,711 -1,186 0,942 1,045 -0,151 -0,243 -0,430 -0,762 1,216 0,733 -0,309 0,531 0,416 -1,541 0,499 -0,431 1,705 1,164 0,424 -0,444 0,665 -0,135 -0,145 -0,498 0,593 0,658 0,754 -0,732 -0,066 1,006 0,862 -0,885 0,298 1,049 1,810 2,885 0,235 -0,628 1,456 2,040 -0,124 0,196 -0,853 0,402 0,593 0,993 -0,106 0,116 0,484 -1,272 -1,127 -1,407 -1,579 — 1,616 1,458 1,262 -0,142 -0,504 0,532 1,381 0,022 -0,281 -0,023 -0,463 -0,809 -0,394 -0,538 1,707 0,777 0,833 0,410 -0,349 -1,094 0,580 0,241 -0,957 -1,885 0,371 -2,830 -0,238 0,022 0,525 -0,255 -0,702 0,953 -0,869 -0,853 -1,865 -0,423 -0,973 -1,016 -1,726 -0,501 -0,273 0,857 -0,465 -1,691 0,417 0,439 -0,035 -0,260 0,120 -9,558 0,056 Таблица 11. Значения u,,s для коэффициента ранговой корреляции по Спирмену: Р {ts> иа ,} = а. п Уровень значимости а 0,01 0,025 0,05 0,1 7 0,8571 0,7450 0,6786 0,5357 8 0,8095 0,6905 0,5952 0,4762 9 0,7667 0,6833 0,5833 0,4667 10 0,7333 0,6364 0,5515 0,4424 11 0,7000 0,6091 0,5273 0,4182 Таблица 12. Критические значения Wlp(m, п, а.) статистики W критерия Вилкоксона т п Уровень значимости а 0,025 0,05 0,1 4 4 10 11 13 5 11 12 14 5 5 17 19 20 6 18 20 22 6 6 26 28 30 7 27 29 32 7 7 36 39 41 8 38 41 44 9 40 43 46 10 42 45 49 8 8 49 51 55 9 51 54 58 10 53 56 60 9 9 62 66 70 10 65 69 73
Литература 1. Большее Л. И., Смирнов Н. В. Таблицы математической статистики. М., 1983. 2. Захаров В. К., Севастьянов Б. А., Чистяков В. П. Теория вероятностей. М., 1983. 3. Зубков А. М., Севастьянов Б. А., Чистяков В. П. Сборник задач по теории вероятностей. М., 1989. 4. Ивченко Г. И., Медведев Ю. И. Теория вероятностей и математическая статистика. Ч. II. Математическая статистика. М., 2003. 5. Ивченко Г. И., Медведев Ю. И., Чистяков А. В. Сборник задач по математической статистике. М., 1989. 6. Чистяков В. П. Курс теории вероятностей. М., 2003. 7. Феллер В. Введение в теорию вероятностей и ее применения. Т. I. М., 1984.
СОДЕРЖАНИЕ Предисловие ....................................................... 3 Введение .......................................................... 5 Глава 1. Классическая вероятностнан модель .......................... 7 § 1. Определение вероятности. События ......................... 7 § 2. Вероятность суммы событий ................................ 9 § 3. Случайные величины ...................................... 12 § 4. Математическое ожидание ................................. 15 Глава 2. Простейшие вероятностные модели ........................... 18 § 1. Условные вероятности .................................... 18 § 2. Независимость событий ................................... 21 Глава 3. Вероятностные модели с усреднением вероятностен ........... 24 § 1. Формула полной вероятности .............................. 24 § 2. Формулы Байеса .......................................... 26 Глава 4. Урновые схемы ............................................. 28 § 1. Вероятность произведения событий ........................ 28 § 2. Две модели случайного выбора ............................ 30 § 3. Более общие модели случайного выбора .................... 36 Глава 5. Вероятностные модели с конечным числом исходов ............ 38 § 1. Определение вероятности. Случайные величины ............. 38 § 2. Математическое ожидание ................................. 41 § 3. Дисперсия. Неравенство Чебышева ......................... 45 § 4. Ковариация. Коэффициент корреляции ...................... 48 Глава 6. Схема Бернулли ............................................ 51 § 1. Определение вероятности ................................. 51 § 2. Вероятность заданного числа успехов ................... 53 § 3. Математическое ожидание и дисперсия ..................... 55 § 4. Закон больших чисел ..................................... 56 § 5. Теорема Пуассона ........................................ 57
§ 6. Теорема Муавра — Лапласа .................................... 59 § 7. Задачи из теории страхования ................................ 64 Глава 7. Полиномиальная схема ........................................ 69 § 1. Определение вероятности ..................................... 69 § 2. Вероятность заданного набора исходов ................... 70 § 3. Математическое ожидание, дисперсия и ковариация ............. 73 Глава 8. Цепа Маркова ................................................ 75 § 1. Определение ................................................. 75 § 2. Марковское свойство ......................................... 79 § 3. Уравнения Колмогорова ....................................... 83 § 4. Предельные вероятности ...................................... 84 § 5. Математическое ожидание и дисперсия. Закон больших чисел .... 89 § 6. Предельная теорема для времени пребывания в состоянии.. 93 Глава 9. Геометрические вероятности ................................. 95 § 1. Определение вероятности ..................................... 95 § 2. Случайные величины .......................................... 99 § 3. Функция распределения и плотность распределения вероятностей .................................................... 100 § 4. Математическое ожидание. Дисперсия ......................... 102 § 5. Ковариация. Независимость случайных величин ................ 105 Глава 10. Даскретные случайные величины ............................. 109 § 1. Закон распределения ........................................ 109 § 2. Математическое ожидание и дисперсия .................. 112 § 3. Закон распределения функции от случайной величины .......... 114 § 4. Математическое ожидание и дисперсия функций от случайной величины .................................................... 115 § 5. Производящая функция ....................................... 117 Глава И. Абсолютно непрерывные случайные величины .................. 119 § 1. Функция распределения и плотность распределения вероятностей ........................................................ 119 § 2. Математическое ожидание и дисперсия ........................ 123 § 3. Закон распределения функции от случайной величины .......... 124 § 4. Математическое ожидание и дисперсия функции от случайной величины .................................................... 127 Глава 12. Двумерные дискретные случайные величины ................... 129 § 1. Закон распределения двумерной дискретной случайной величины. Независимость .................................. 129 § 2. Закон распределения функции от случайной величины ........ 137 § 3. Математическое ожидание и дисперсия функции от случайной величины. Ковариация ........................................ 142
§ 4. Условные распределения случайной величины. Условное ма- тематическое ожидание .................................... 146 Глава 13. Двумерные абсолютно непрерывные случайные величины ...... 151 § 1. Двумерные плотности распределения. Независимость ........ 151 § 2. Закон распределения функций от случайных величин ....... 160 § 3. Математическое ожидание и дисперсия функции от случайных величин. Ковариация и корреляция ............................. 169 § 4. Условные плотности распределения. Условные математические ожидания ................................................ 178 Глава 14. Случайные последовательности ............................ 181 § 1. Закон больших чисел ..................................... 181 § 2. Центральная предельная теорема ......................... 183 Глава 15. Первичная обработка экспериментальных данных ............ 187 § 1. Задачи математической статистики ........................ 187 § 2. Выборка ................................................. 189 § 3. Эмпирическая функция распределения ...................... 192 § 4. Полигон частот, гистограмма ............................ 197 § 5. Выборочные моменты и квантили ........................... 204 § 6. Выборочный коэффициент корреляции ....................... 210 Глава 16. Теория оценок ........................................... 212 § 1. Оценки, их состоятельность и несмещенность .............. 212 § 2. Среднеквадратическая ошибка и эффективность оценки ..... 218 § 3. Метод максимального правдоподобия ...................... 223 § 4. Метод моментов ......................................... 231 § 5. Доверительные интервалы .............................. 232 Глава 17. Статистическая проверка гипотез ......................... 249 § 1. Постановка задачи ...................................... 249 § 2. Наиболее мощный критерий ............................... 253 § 3. Сложные гипотезы ..................................... 260 § 4. Проверка гипотез и доверительное оценивание ............ 264 § 5. Статистические критерии согласия. Критерий «хи-квадрат» Пирсона ............................................... 266 § 6. Критерий согласия «хи-квадрат» при неизвестных параметрах распределения ................................................ 270 § 7. Критерий согласия Колмогорова .......................... 275 § 8. Критерий независимости «хи-квадрат» .................... 276 § 9. Критерий однородности данных ....................... 280 Глава 18. Ранговые критерии ...................................... 283 § 1. Критерий знаков ........................................ 283 § 2. Критерий Вилкоксона для проверки однородности двух выборок ........................................................ 288
§ 3. Ранговая корреляция по Спирмену.............. 295 Глава 19. Метод наименьших квадратов и регрессия......... 303 § I. Метод наименьших квадратов для простой линейной регрессии............................................ 303 § 2. Проверка статистических гипотез о параметрах простой линейной регрессии................................ 309 Таблицы................................................ 312 Литература............................................... 322
Учебное издание Ватутин Владимир Алексеевич Ивченко Григорий Иванович Медведев Юрий Иванович Чистяков Владимир Павлович ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В ЗАДАЧАХ Учебное пособие для вузов Зав. редакцией Б. В. Панкратов Ответственный редактор Ж. И. Яковлева Художественное оформление О. В. Матоянц Изд. лиц. № 061622 от 07.10.97. Подписано к печати 17.09.03. Формат 60х901/16. Бумага типографская. Гарнитура «Таймс». Печать офсетная. Усл. печ. л. 20,5. Тираж 3 000 экз. Заказ № 8516. ООО «Дрофа». 127018, Москва, Сущевский вал, 49. По вопросам приобретения продукции издательства «Дрофа» обращаться по адресу: 127018, Москва, Сущевский вал, 49. Тел.: (095) 795-05-50, 795-05-51. Факс: (095) 795-05-52. Торговый дом «Школьник». 109172, Москва, ул. Малые Каменщики, д. 6, стр. 1А. Тел.: (095) 911-70-24, 912-15-16, 912-45-76. Магазин «Переплетные птицы». 127018,/Москва, ул. Октябрьская, д. 89, стр. 1. Тел.: (095) 912-45-76. Московская обл., г. Коломна, Голутвин, ул. Октябрьской революции, 366/2. Тел.: (095) 741-59-76. Отпечатано в полном соответствии с качеством предоставленных диапозитивов в Тульской типографии. 300600, г. Тула, пр. Ленина, 109.