/
Текст
Gerald J. Hahn & Samuel S. Shapiro
STATISTICAL MODELS IN ENGINEERING
Research and Development Center
General Electric Company
JOHN WILEY & SONS, INC.
NEW YORK - LONDON-SYDNEY 1967
Г. Хан. С. Шапиро
СТАТИСТИЧЕСКИЕ МОДЕЛИ В ИНЖЕНЕРНЫХ ЗАДАЧАХ
Перевод с английского е. г. коваленко Под редакцией в. в. НАЛИМОВА
ИЗДАТЕЛЬСТВО «МИР»
МОСКВА 1969
Г. Хан. С. Шапиро
СТАТИСТИЧЕСКИЕ
МОДЕЛИ В ИНЖЕНЕРНЫХ ЗАДАЧАХ
Редактор Л- ^кигинкп Художник Е. Золотарев Художественный редактор В. Варлашм Технический редактор Е. IlwnuuiHKMa
Корректор И. Миксина Сдпио и произподстпо 21/1 19(19 г.
Подписано к печати 17/VI 1939 г. Бумага № 2. 00x907ц. буи. а. 12,5.
Пен. л. 25.
Уч.-над. л. 23,7. ИЗД. № 20/5063 Цена I р. 82 к. Зак. » 52.
ИЗДАТЕЛЬСТВО «МИР» Москва, 1-й Рижский пер.. 2
Ярославский пояиграфкомбнилт Глявполн-графпрома Комитета по печати при Совете МпИистровСССР. Ярославль. ул.Сео6оды,97.
ИЗДАТЕЛЬСТВО «МИР»
Готовится к печати
Мидоу К., АНАЛИЗ ИНФОРМАЦИОННЫХ СИСТЕМ, мрев, с англ., 24 изд. л.
Вопросы организации информации с каждым годом приобретают все большее значение. Эта проблема возникает у биологов и физиков, работающих в информационных службах и конструкторских бюро. Трудно в настоящее время назвать область человеческой деятельности, где не решались бы вопросы создания информационно-поисковых систем и более эффективного информационного обслуживания.
В монографии рассмотрены основы анализа систем обработки информации и подробно изложены такие вопросы, как функционирование информации при включении человека в информационный контур управления, язык информационного поиска, индексирование информации, структура индексных записей, организация и хранение информационных массивов, организация систем массивов информации, стратегия поиска и оценка поисковых ошибок, функционирование информационно-поисковых систем. Для закрепления материала в конце каждой главы даны упражнения.
Кинга представит интерес для специалистов различных областей знаний, интересующихся вопросами обработки информации, а также может быть использована как учебное пособие для студентов.
УДК 519.241.27
Книга посвящена одной пз проблем математической статистики — функциям распределения. встречающимся а инженерной практике. Вначале приводятся элементарные сведения по теории вероятностей, а затем рассматриваются непрерывные и дискретные распределения и их применимость при решении различных инженерных задач. Две главы отведены эмпирическим распределениям. Отдельная глава посвящена анализу сложных систем. В конце монографии приводится систематизированная библиография по различным разделам математической статистики И смежным дисциплинам.
Кинга предназначена для широкого круга специалистов, интересующихся статистическими методами исследования.
Редакция литературы по новой технике
Инд. 3-3-14
166-69
ОТ РЕДАКТОРА РУССКОГО ИЗДАНИЯ
> Математическая статистика спала столь широко разветвленной отраслью науки, что теперь уже невозможно охватить все ее аспекты в едином, всеобъемлющем руководстве. Появилась необходимость в создании нескольких серий книг, освещающих различные разделы этой дисциплины. Такие книги должны быть написаны на (разном уровне в соответствии с запросами самого широкого круга специалистов. В США идея создания таких серий стала весьма Популярна — об этом свидетельствует, в частности, и хорошо систематизированная библиография, приведенная в конце этой книги, f У нас довольно хорошо обстоит дело с изданием книг по математической статистике, рассчитанных на читателя-математика, и ^совсем плохо — с изданием руководств для людей, имеющих депо
С реально наблюдаемыми процессами. Инженеры, научные работники различного профиля, врачи, агрономы и т. д. очень нуждаются в специализированных руководствах по математической статистике. Таких книг у нас мало. Издательство «Мир» пытается в какой-то степени восполнить этот пробел, переводя на русский язык Некоторые из руководств Такого типа. В 1964 г. была издана книга
Н. Бейли «Статистические методы в биологии», в 1968 г. вышла очень просто написанная монография Г. Хикса «Основные принци-пы планирования эксперимента». Готовится к печати вторая книга 11 Бейли «Математические методы' в биологии и медицине».
I Предлагаемая вниманию читателей книга Хана и Шапиро Июсвящена одной из проблем математической статистики — функциям распределения, встречающимся в инженерной практике. Через всю книгу проводится мысл ь о том. что выбор распределения /Должен базироваться прежде всего на понимании механизма изучаемого явления. Нередко же исследователи, применяя довольно шйожные статистические методы, не обращают должного внимания
На выбор распределения. Руководствуясь популярными пособиями, ® которых материал изложен некритически и подчас даже догматически. часто эмпирические распределения без достаточных оснований считают нормальными. Слишком большое значение придают «проверке гипотезы адекватности, забывая при этом, что наблюдае-•Цьге явления могут находиться в хорошем согласии с рядом различных моделей, особенно если наблюдений немного и они выбраны в
Предисловие к русском у изданию
узком интервале значений независимой переменной. Неудачный выбор распределения, сделанный без достаточно глубокого понимания изучаемого явления, может привести к очень большим ошибкам, особенно в задачах с экстраполяцией.
Достоинством данной книги является чрезвычайно критическое отношение авторов к излагаемому материалу, всестороннее обсуждение различных подходов к выбору функций распределения, доведенных до рецептурного описания, в том числе и методов, основанных на машинном моделировании задач, а также наличие множества интересных реальных примеров из инженерной практики. Можно утверждать, что в такой манере еще не было написано книг, посвященных распределениям.
В. Налимов
ПРЕДИСЛОВИЕ
Эта книга — результат консультаций, которые мы давали в течение многих лет инженерам-электрикам, инженерам-механикам, инженерам-химикам, специалистам в области промышленного производства и теории надежности по самым различным производственным вопросам в фирме «Дженерал электрик» и других организациях. В процессе работы часто ощущалась необходимость в детальном руководстве по применению статистических моделей для описания физических явлений, предназначенном для инженеров; в этой книге мы попытались удовлетворить эту потребность.
Наша главная цель состоит в том, чтобы показать инженерам, занимающимся выпуском некоторого продукта, характеристики которого подвержены случайным колебаниям, каким образом можно выбрать приемлемую статистическую модель и как использовать эту модель при решении практических задач. Выбор материала соответствует поставленной цели.
После некоторых вступительных замечаний, сделанных в гл. 1, в гл. 2 приводятся основные понятия теории вероятностей и распределения (статистические модели). В гл. 3 и 4, где рассматриваются соответственно непрерывные п дискретные распределения, описывается детальное построение многих моделей и показаны типичные случаи, в которых приемлема каждая из нпх. Рассматривается правомерность широкого использования (иногда ошибочно) нормального распределения, а также применимость столь же популярного (и также иногда используемого ошибочно) экспоненциального распределения в задачах теории надежности. Вводятся также и другие модели: гамма-распределение, бета-распределение, распределение Вепбулла, и рассматривается их применение. Сделана попытка представить материал, изложенный в этих двух главах, .графически и в сводных таблицах, что, как мы надеемся, позволит быстро получить необходимые сведения.
Предисловие
Выбор распределения Из числа рассмотренных в гл. 3 и 4 основывается главным образом на теоретических соображениях. Однако в некоторых случаях исследуемое физическое явление недостаточно известно и подбор распределения должен проводиться на основе полученных данных. В гл. 6 рассматриваются два распределения, принимающие самую разнообразную форму,— так называемые распределения Джонсона и Пирсона.
Часто инженера интересует система (будь то простая электрическая цепь или сложный космический корабль), в которой параметры всех компонентов1’ подвержены статистическим изменениям. Зная структуру системы и характер изменения параметров компонентов, можно сделать вывод о характеристике системы. Поскольку этот вопрос важен при решении технических задач, мы рассматри? ваем его более подробно, чем он освещался до сих пор в литературе, доступной (и понятной) инженерам-практикам. В частности, в гл. 5 описан точный метод, называемый преобразованием случайных величин. В гл. 7 рассматриваются приближенные методы получения моментов системы (называемые иногда «накоплением статистической ошибки») и моделирование методом Монте-Карло. Проводится сравнение этих методов и обсуждается практическая применимость каждого из них. При рассмотрении методов получения моментов системы приводятся выражения, позволяющие оценить среднее, рассеяние, симметрию и островершинность распределения характеристики системы. Эти выражения используются при подборе эмпирических моделей, получаемых в гл. 6. При изучении моделирования методом Монте-Карло дается описание методов генерирования случайных чисел с различными распределениями, рассмотренными в гл. 3, 4 и 6, а также определяется число испытаний при моделировании, необходимое для получения заданной точности.
Последняя глава посвящена методам опенки адекватности выбранной модели; здесь описываются как графические, так и аналитические методы. Для многих из рассмотренных ранее распределений (а не только нормального)’показано применение вероятностной бумаги для оценки параметров распределения, а также для выяснения вопроса о применимости модели. Чтобы проиллюстрировать
>) Под параметром компонента подразумевается переменная (случайная) величина, характеризующая компонент.— Прим- ред.
Предисловие
чувствительность метода, на нормальную вероятностную бумагу наносятся данные, имеющие другие известные нам распределения. Во второй части главы описываются некоторые новые мощные статистические критерии для проверки гипотез о нормальном и экспоненциальном распределениях, которые были недавно разработаны одним из авторов этой книги (Шапиро совместно с Уилком) и ранее опубликованы только в журналах по математической статистике. Е Области математической статистики, определяемой обычно как «статистический метод», отводится мало места. Включены лишь методы оценки параметров распределений и определения доверительных интервалов для некоторых из этих параметров. Эти вопросы превосходно изложены во многих книгах (см. библиографию). Исключение такого материала позволило более глубоко рассмотреть законы распределения в книге небольшого объема.
Предполагается, что читатель имеет математическую подготовку в объеме технического вуза и профессиональный опыт. Специальная подготовка в области математической статистики не требуется. Тому, кто прослушал вводный курс лекций по теории вероятностей и математической статистике, будут знакомы большая часть гл. 2 и частично гл. 3 и 4, однако остальная часть книги окажется новой. Мы старались давать теоретическое обоснование, необходимое для правильного применения рассматриваемых методов, однако в большинстве случаев вывод результатов либо опускается, либо выносится в приложения. Дается много иллюстративных примеров, большинство которых получено путем переделки реальных задач.
Хотя книга предназначена главным образом для инженеров-практиков, она с успехом использовалась в качестве дополнительного учебного пособия при чтении вводного курса лекций по .математической статистике для инженеров.
Мы благодарны, д-ру Франку Йетсу (Ротамстед) и издательству «Oliver and Boyd». Эдинбург, за разрешение перепечатать таблицу III из книги «Statistical Tables for Biological, Agricultural and Medical Research». Мы также благодарны профессору Пирсону и издателям журнала «Bionietrika» за разрешение перепечатать таблицы из книги Пирсона и Хартли «Bionietrika Tables for Statisticians», том I. д-ру Чесснату и издательству «John Wiley» за разрешение перепечатать некоторые рисунки из книги «Systems Engineering Tools»; д-ру Хальду и издательству «John Wiley» за разрешение
1° Предисловие
перепечатать материалы из книг «Statistical Theory with Engineering Applications» и «Statistical Tables and Formulas»; профессору Доджу, профессору Ромигу и издательству «John Wiley» за разрешение перепечатать материал из книги «Sampling Inspection Tables»; вычислительной лаборатории Гарвардского университета за разрешение перепечатать материал из книги «Tables of the Cumulative Binomial Probability Distribution»; фирме РЭНД и издательству «Free Press». Macmillan, за разрешение перепечатать материал из книги «А Million Random Digits with 100 000 Normal Deviates»; профессорам Джонсону и Пирсону за разрешение перепечатать дополнительные опубликованные и неопубликованные материалы.
Мы с удовольствием выражаем признательность многочисленным друзьям и коллегам, оказавшим существенную помощь при подготовке книги.
Скенектади. Пыо-Йорк Январь 1967 г.
Геральд Хан Сэмюэль Шапиро
Глава 1
ВВЕДЕНИЕ
Г Важным этапом развития современной науки и техники является переход к изучению систем не детерминистическими, а вероятностными методами. Современные инженеры, а также специалисты в других областях начинают все более осознавать, что детерминистические модели не подходят при проектировании и расчете сложных технических систем XX в. Рабочие характеристики предположительно одинаковых систем отличаются друг от друга вследствие влияния многих факторов, например, таких, как различие в параметрах компонентов и колебание рабочих условий. Следовательно, инженеру необходимо знать статистические модели, описывающие эти отклонения.
Если достигнуто понимание этих основных принципов, то, по-видимому. вполне естественно говорить о распределении выходного напряжения некоторой системы, а не задавать только величину расчетного напряжения или о вероятности того, что некоторый компонент не выйдет из строя в данном промежутке времени, а не утверждать, что его выход из строя не ожидается. По-видимому, целесообразно также вычислять допустимые пределы изменения параметров электрической цепи статистическими методами, а не задавать их, как обычно, с огромным запасом путем комбинирования самых неблагоприятных случаев.
Применение статистических моделей в технике началось недавно. До второй мировой войны роль математической статистики в промышленности была ограниченной. Однако широкое применение методов математической статистики при разработке военных программ привело к тому, что сразу же после окончания войны стали быстро развиваться такие области знаний, как контроль качества и статистическая теория связи. В настоящее время необходимость в высоконадежных сложных системах создает еще более реальные предпосылки Для более широкого применения математической статистики в промышленности.
Здесь, как и в других быстро развивающихся областях, уровень подготовки отстает от потребностей, и лишь в последние годы в программы высших технических учебных заведений были включены Хурсы лекций по математической статистике. Следует отметить, что Даже в настоящее время теория вероятностей и математическая ста
12
Г лава /
тистика вообще и применение статистических моделей в частности для многих инженеров-практиков окружены покровом таинственности. Этого не должно быть, поскольку освоить математическую статистику ничуть несложнее, чем многие другие технические дисциплины.
1.1. ПРИМЕНЕНИЕ ТЕОРИИ ВЕРОЯТНОСТЕЙ
И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Теория вероятностей и математическая статистика — области, тесно связанные друг с другом. В задачах теории вероятностей на основе принятой статистической модели рассматриваются вероятности появления различных событий, тогда как в задачах математической статистики мы имеем некоторые результаты наблюдений и необходимо найти модель, приемлемую для описания этих результатов. Обе эти задачи часто возникают в технике. Например. может потребоваться прогнозировать характеристики системы известной нам конструкции до того, как она будет создана, рассматривая различные вероятностные модели для параметров компонентов, составляющих систему. Для этого необходимо применение методов теории вероятностей. В других случаях могут быть заданы характеристики системы, полученные в результате испытаний. Тогда статистические методы используются для построения соответствующей вероятностной модели и оценки ее параметров. Когда модель получена, ее, разумеется, можно использовать для прогнозирования характеристик будущей системы.
Теория вероятностей и математическая статистика находят много важных приложений в науке и технике. В числе задач, при решении которых используются методы теории вероятностей и математической статистики (многие из них выходят за рамки данной книги), можно назвать следующие:
I. Разработка экономичных выборочных планов контроля качества продукции.
2. Определение оптимального резервирования компонентов сложной системы, например космического корабля, при ограничениях, налагаемых на вес системы.
3. Использование данных за прошлое время для отделения потенциально более способных от потенциально менее способных программистов вычислительных машин на основе проверки их способностей.
4. Разработка схемы выборочного обследования данных, гарантирующей, что основная масса счетов, посланных клиентам, несо-держит ошибок.
5. Использование отсчетов, полученных на различных станциях слежения, для определения области пространства, которую с доста
Введение
13
точной достоверностью можно считать местом расположения неко-иорого объекта.
К7 б. Определение условий начальной приработки и форсированного режима эксплуатации компонентов, позволяющих избежать значительной части отказов, обусловленных производственными дефектами, без повреждения исправных компонентов.
7. Отыскание соотношения между переменными параметрами .процесса и характеристиками продукции с целью установить пределы отклонений, допускаемых техническими условиями, для контроля качества будущей продукции.
*4 ,8. Планирование процесса, зависящего от нескольких параметров, для определения влияния условий протекания процесса на свойства химического вещества и объяснение получаемых результатов.
9. Оценка колебаний характеристик большой системы с использованием данных об изменчивости и взаимодействии параметров составляющих ее компонентов.
10. Выбор оптимальной стратегии в условиях конкурентного спроса и предложения, когда последовательные исходы испытывают Случайные колебания, и, в общем случае, принятие решений в условиях неопределенности.
II. Нахождение требуемой мощности генератора, с большой вероятностью обеспечивающей полное удовлетворение потребности в электроэнергии.
12. Сравнение последствий назначения различных гарантийных сроков службы изделия.
13. Выбор оптимального режима эксплуатации и составления календарных графиков замены оборудования.
14. Оценка влияния изменяющихся условий окружающей среды на характеристики изделия.
15. Калибровка прибора для получения несмещенных отсчетов.
1.2. СОДЕРЖАНИЕ КНИГИ
Нашей основной задачей является применение статистических моделей при решении технических задач. В гл. 2 вводятся некоторые важные понятия теории вероятностей, а также дается основное представление о случайных величинах и распределениях. В гл. 3 и 4 описаны конкретные статистические модели для непрерывных и дискретных случайных величин. В гл. 5 рассматриваются методы преобразования случайных величин для описания определенных физических явлений. В гл. 6 представлены эмпирические распределения, используемые при обработке экспериментальных данных. В гл. 7 рассматриваются главным образом два важных метода, позволяющих сделать вывод о характеристике системы на основании данных о параметрах составляющих ее компонентов: метод получения момен
тов системы и метод Монте-Карло. Последняя глава посвящена оценке соответствия выбранной статистической модели.
Основное внимание уделяется уяснению характера моделей и их применению. Хотя здесь и делается попытка дать некоторые теоретические обоснования с целью помочь опытному инженеру уяснить основные понятия, мы не претендуем на .математически строгое изложение. Сложные выкладки обычно опускаются или выносятся в приложения. С другой стороны, достаточно много места отводится здесь для примеров, иллюстрирующих рассматриваемые идеи. Таким образом, уровень изложения соответствует нашей основной цели — дать рабочий инструмент инженерам-практикам, которым приходится использовать статистические модели.
Обычно вопросы, связанные со статистическим выводом и статистическими методами, либо рассматриваются кратко, либо полностью опускаются. Для большинства важных моделей приводятся выражения для оценки параметров и в некоторых случаях указывается порядок нахождения доверительных интервалов для измерения точности таких оценок. Однако обоснованию этих формул уделяется мало внимания. Кроме того, не рассматривается проверка статистических гипотез относительно параметров распределения, а также не излагаются некоторые более современные методы, например дисперсионный анализ или регрессионный анализ с вычислением коэффициентов методом наименьших квадратов. Этот материал изложен во многих учебниках по математической статистике. Чтобы читатель смог легко найти его, в конце книги помещена обширная библиография. Названы также учебники в таких смежных областях, как теория вероятностей, планирование экспериментов в промышленности, статистический контроль качества и методы теории надежности. Наличие таких книг позволяет полностью сосредоточиться на вопросе, представляющем для нас основной интерес: статистических моделях в инженерных задачах.
Г лава 2
ВЕРОЯТНОСТЬ
И СЛУЧАЙНАЯ ВЕЛИЧИНА
В этой главе изложены некоторые основные понятая — как имеющие самостоятельное значение, так и те. которые потребуются в остальной части книги. Будет дано несколько определений термина «вероятность». Поскольку теоремы теории вероятностей можно лучше всего усвоить с помощью теории множеств, дается краткий обзор этого предмета, а затем формулируются некоторые основные законы теории вероятностей и указываются примеры и.х применения. Далее вводятся такие понятия, как случайная величина и распределение вероятностей. Затем рассматриваются различные способы краткого представления информации о распределениях и выводятся некоторые правила нахождения математических ожиданий и дисперсий. Поскольку паша задача состоит в том, чтобы показать технические приложения, а не излагать математическую теорию, то материал книги чаще будет носить описательный характер, не отличаясь математической строгостью. Для более детального изучения рассматриваемых далее вопросов читатель отсылается к некоторым учебникам по теории вероятностей и математической статистике (см., например. 12.1] — [2.51, а также некоторые книги из дополнительного списка литературы1’).
2.1. ОПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ
В книгах по математической статистике понятие вероятности иногда вводится на чисто аксиоматической основе. Для наших целей было бы более поучительно вначале несколько интуитивно постигнуть ее смысл. Далее рассматриваются три определения вероятности.
>> См. также Вентцел ьЕ. С.. Теория вероятностен, изд. 3-е. М-. нзд-во «Наука». 1964; Гнеденко Б. В.. Курс теории вероятностей, ИЗД. 4-с. М.. изд-во «Наука». 1965; П р о х о р о в IO. В.. Р о з а н о О Ю. А., Теория вероятпостей- Основные понятия. Предельные теоремы. Случайные процессы, М-. нзд-во «Наука», 1967; Смирнов Н. В.. Дуни н-Б а р к о в с к и н И. В., Курс теории вероятностей и математической статистики для технических приложений. М., изд-во «Наука», 1965.— Прим.
Глава 2
Классическое определение вероятности (принцип равных возможностей)
Если некоторое событие может произойти N различными одинаково возможными способами и если п этих способов имеют свойство .4. то вероятность появления свойства .4, обозначаемая через Р (Л), определяется как n/N.
Так, вероятность выпадения двух очков при подбрасывания геометрически правильной игральной кости равна в, так как имеются шесть одинаково возможных исходов—выпадение от одного до шести очков; только одним из исходов является выпадение двух очков.
Часто это определение не подходит в ситуациях, имеющих место в технических задачах. Например, не ясно, каким образом можно его использовать для определения вероятности выбора неисправного компонента на основе данных о том. что в прошлом на 10 000 компонентов приходилось 73 неисправных. В данном случае появление неисправного компонента и появление исправного компонента не являются одинаково возможными и не ясно, какие события одинаково возможны. Поэтому необходимо другое определение вероятности.
Частотное (или эмпирическое) определение вероятности
Если некоторый эксперимент проводится N раз и п раз появляется особое свойство А, то предел отношения п 'N при увеличении N определяется как вероятность события Л. обозначаемая через Р(Л).
Так, в предыдущем примере вероятность появления неисправного компонента равна 73/10 000, или 0,0073 (если считать 10 000 большим числом).
Частотное определение вероятности наиболее широко применяется в современной математической статистике. Однако некоторые утверждают, что даже это определение не является достаточно общим, поскольку оно нс охватывает случаи, когда имеется незначительное подтверждение, либо оно вообще отсутствует, а оценка исхода по существу является интуитивной. Это положение приводит к третьему определению вероятности.
Субъективное определение вероятности
Вероятность Р(Л) является показателем степени уверенности в справедливости данного суждения А.
Согласно этому определению, вероятность можно непосредственно связать с шансами выиграть пари, заключаемое на определенных условиях. Утверждение о том, что вероятность того, что определенное изменение конструкции приведет к улучшению характеристик данного изделия, равна 0,75 (или, что то же самое, что шансы на
Вероятность и! случайная величина
«спех составляют один к трем), является субъективным, поскольку .©до отражает степень нашей уверенности в эффекте изменений кон-ННтщии, основанной на инженерной оценке или личном опыте.
Такое утверждение не имеет смысла при первых двух определениях ^ЯЕюятности. Классическое определение вероятности не подходит, так как нет оснований считать, что при изменении конструкции из-*делнЯ улучшение его характеристик атакой же степени возможно, как и невозможно. Частотное определение также не подходит, так как у нас нет данных за прошлое время о том. в течение какого времени это конкретное изменение конструкции приводило к улучшению ^рактеристик изделия. Таким образом, субъективное определение 'вероятности является более общим, чем классическое и частотное, и оно охватывает оба эти определения.
В каждом из рассмотренных случаев вероятность появления события равна числу, значение которого заключено между нулем (это означает, что появление события невозможно) и единицей (это означает. что событие обязательно произойдет). Таким образом, 0 < < Р(Л) < 1. Основные правила, связывающие вероятности различных событий, и многие другие результаты остаются одинаковыми независимо от того, какое из сформулированных выше определений вероятности используется. И хотя математики много спорят о при--емлемости субъективного определения вероятности по сравнению с двумя другими, мы привели здесь все три определения для того, чтобы инженер не ограничивал себя догматически единственной точкой зрения.
2.2. ПОНЯТИЯ ТЕОРИИ МНОЖЕСТВ
Формальные выражения теории вероятностей можно получить с Помощью теории множеств. Поэтому мы приводим здесь краткий насыщенный обзор теории множеств.
.^Множеством является конечная или бесконечная совокупность Модельных объектов, или элементов, с некоторой общей отличительной характеристикой (или характеристиками). Примерами* множеств являются: совокупность всех инженеров; множество действительных чисел между нулем и единицей; совокупность всех лиц, зарабатывающих более 10 000 долл, в год и имеющих рыжие волосы. С понятием множества связано понятие подмножества — разбиение множества по некоторым дополнительным признакам, отличающим элементы подмножества от остальной части множества. Напри-Мер. множество всех инженеров можно разбить на подмножества, 'Состоящие из инженеров-электриков, инженеров-механиков и т. д.
Множество, содержащее все рассматриваемые элементы, называется множеством элементарных исходов н будет обозначаться бук
Глава 2
вой /. Буквой Z будем обозначать множество, не содержащее элементов и называемое пустым множеством.
Над множествами производятся три основные операции: объединение, пересечение и дополнение.
Объединение множеств (операция «или»)
Объединением двух множеств А и В является множество С1( ко торое состоит из различных элементов, содержащихся в А или В или в обоих множествах, и обозначается следующим образом:
= (2.1)
или, как в некоторых книгах,
С, = ЛиВ. (2.1а)
Поскольку мы рассматриваем лишь отдельные элементы, элемент, содержащийся как в множестве .4, так и в множестве В. входит в множество Ct только один. раз.
Пересечение множеств (операция «и»)
Пересечением двух множеств А и В является множество С.,, состоящее из элементов, которые являются общими для множества А и множества В. и обозначаемое через
С2 = АВ (2.2)
или, как в некоторых книгах, через
С2 = АПВ, (2.2а)
или
С2 = АхВ. (2.26)
Дополнение множества (операция «не»)
Дополнением множества А является множество Са, состоящее из всех элементов множества элементарных исходов, не содержащихся в множестве Я, и обозначаемое через
С, = А. (2.3)
Операции над множествами удобно проиллюстрировать графически с помощью диаграммы Венна, как показано на рис. 2.1 и 2.2. Прямоугольники, показанные на этих рисунках, изображают мио-
Вероятность и случайная величина
19
мгество элементарных исходов /. Область, заштрихованная вертикальными линиями, представляет множество Л. а область, заштри-«^ованная горизонтальными линиями, представляет второе множество В. Общая заштрихованная область па рис. 2.1 и 2.2, а изображает “Объединение Ct двух множеств, т. е.
с, = л + в.
^«заштрихованная область на рис. 2.1 и 2.2, б изображает дополнение С?множества Ct.Таким образом.
Рис. 2.1. Диаграмма Венна, показывающая два пересекающихся множества.
Область, заштрихованная на рис. 2.1 и 2.2, б в клеточку, является пересечением двух множеств, т. е.
Множества
С.-ЛВ.
С3 = А и С 4 = В
изображены заштрихованными областями на рис. 2.2, в и 2.2, г соответственно.
Для произвольного множества А справедливы следующие тождества. приводимые здесь без доказательства:
АZ =-A, Х=/, Л4-Л-/,
Л4-/ = /, 7 = Z. Л4-Л = Л, (2.4)
AZ = Z, АА = Z, АА = А,
Al = Л,
гДе, как и ранее, Z н / обозначают соответственно пустое множество и множество элементарных исходов.
« я 1'1
§. 7.
Вероятность и случайная величина
Число элементов множества .4 обозначается через т(Д). Так. для «Лйожества. состоящего из N элементов, гп(1) №. .Аналогично
m(Z) = 0.
К Понятие числа элементов множества и некоторые вытекающие из него правила иллюстрируются на следующем примере. Пусть в некоторой фирме работают десять неквалифицированных рабочих.
Рис. 2.3. Диаграмма Венна для неквалифицированных служащих фирмы.
Трое из них являются сборщиками (множество Л), пятеро — механиками (множество М), а двое — конторскими служащими (множество С), т. е. /п(Д) 3. гп(М) 5 и т(С) = 2. Множество элементар-
ных исходов для совокупности неквалифицированных рабочих фирмы состоит из 10 элементов; таким образом, т(1) 10. Соответст-
вующая диаграмма Венна показана на рис. 2.3. На этой диаграмме площадь, соответствующая каждому из трех множеств, пропорциональна числу элементов в множестве. Множество Q. состоящее из рабочих, которые являются одновременно и механиками, и сборщиками. не содержит ни одного элемента. т. е.
Q = AM = Z, где Z — пустое множество, определение которого давалось ранее, и
т (Q) = /п (Z) = 0.
Два или большее число множеств, не содержащих общих элементов. называются взаимно исключающими. Все множества в этом примере являются взаимно исключающими.
Множество F. состоящее из заводских рабочих (сборщиков и механиков). является объединением множеств А и М. т. е.
F = ДД-Л1.
Это множество содержит восемь различных элементов: три из мно жества .4 и пять из множества М. Так,
т (F) = т (Д + М) — 3 Д- 5 = 8.
22
Г.1 flea 2
Заметим, что в этом случае
т (/1 4-jM) = т (4) + т (№)•
Обобщение результатов позволяет найти следующее правило дЛя определения числа элементов множества, получаемого в результате объединения двух взаимно исключающих множеств А и В:
т (/1 + В) -= пг(А) 4- гп (В), если АВ = Z. (2.5)
Рис. 2.4. Диаграмма Венна для всех служащих фирмы.
Число элементов множества неквалифицированных работников, исключая сборщиков, т. е. множества Л, можно определить с помощью диаграммы Венна. Ясно, что
Л-М+ с.
Таким образом,
т (А) = m (/И + С) = m («) + т (С) i S + 2 - 7, или, что то же самое,
т (Л) = т (/) — /п (Л) = 10 — 3 = 7.
Обобщая, полу чаем второе правило для произвольного множества А:
т(А]~т(1) — т(А). (2.6)
Пусть, кроме того, в фирме работают полный рабочий день восемь инженеров» (множество £), три мастера, также занятые полный рабочий день (множество S), и два мастера, которые являются одновременно инженерами (множество ES). Изображенное на рис. 2.4 множество, охватывающее всех сотрудников данной фирмы, содержит 23 элемента.
При определении числа элементов множества всех квалифицированных работников (инженеров и мастеров) нельзя использовать формулу (2.5), так как ES ^== Z. Из условия задачи и заштрихованной части диаграммы, изображенной на рис. 2.4, видно, что rn(E -|- S) —
Вероятность и случайная величина
23-
ITKU13 а не 15, что можно было ба получить, используя ошибочно I *ЙОрмУлУ Очевидно, что, применяя в этом случае формулу (2.5),-йигдважды учитываем элементы, которые являются общими для обоих множеств, т. е. элементы множества ES. Таким образом, нужно вычесть двойные элементы. Находим следующее общее правило для Определения числа элементов множества, получаемого при объединении множеств А и В:
tn (Л + В) = m (Л1 -г ш (В) — гп (АВ). (2.7)
Заметим, что формула (2.5) является частным случаем выражения (2.7) при tn(AB) = 0.
2.3. ВЕРОЯТНОСТЬ И ТЕОРИЯ МНОЖЕСТВ
В теории вероятностей элементы множества являются исходами эксперимента. Таким образом, множество элементарных исходов / содержит все возможные всходы к называется пространством выборок эксперимента. Отдельный исход называется элементом выборки. Например, при бросании игральной кости пространство выборок состоит из шести элементов, обозначаемых числами: 1, 2, 3, 4, 5 и 6. Таким образом, т(1) = 6.
Часто нас интересует комбинация возможных исходов, называемая событием. Таким образом, событие является подмножеством пространства выборок. Примером события является получение четного числа очков при бросании игральной кости (обозначим его через Л). Это событие состоит из элементов выборки, обозначаемых числами 2, 4 и 6. Таким образом, т(Л) - 3. Аналогично событие В, которое заключается в выпадении нечетного числа очков, состоит из трех элементов выборки, обозначаемых числами!, 3 и 5. Эти два события исчерпывают пространство выборок. Отдельные исходы также могут рассматриваться как события. Так как события являются;'Множествами особого типа, то описанные ранее методы получения новых множеств из уже существующих применимы также и к событиям.
II. Когда элементы выборки одинаково возможны, как в предыдущем примере, нахождение вероятности появления некоторого события Л можно считать равносильным отысканию отношения подмножества. представляемого событием Л. к множеству элементарных исходов /. Так,
р(Л) (2.8)
ш(/)
1 Д^-Ж^Оятиость получения четного числа очков при бросании игральной кости, как известно, равна я/а, или 0,50.
Заметим, что
p,'»=^=1 <28а>
и
P(Z) i!a=0. (2.80)
Теперь мы видим, что относительная площадь какой-либо области па рис. 2.3 и 2.4 пропорциональна вероятности исхода, связанного с событием, которое изображает эта область.
Когда все элементы пространства выборок неравновозможны, порядок остается таким же, с тем лишь отличием, что элементам выборки больше не задаются одинаковые веса. Конкретное задание весов зависит от принятого определения вероятности и рассматриваемой реальной Ситуации-. Вес конкретного элемента выборки может быть пропорционален относительной частоте его появления при большом числе испытаний или степени нашей уверенности в шансах его появления в следующем испытании. Задание весов подчиняется условию, что при суммировании по всем элементам пространства выборок сумма весов должна равняться единице. В дальнейшем при выводе законов теории вероятностей обычно для упрощения будем считать, что имеем дело с одинаково возможными элементами. Однако полученные результаты справедливы независимо от того, каким образом первоначально были заданы веса. Часто бывает более удобно выражать вероятность не как долю единицы, а в процентах.
Рис. 215. Диаграмма Венна для двух независимых событий.
Так, иногда мы будем говорить, что вероятность появления некоторого события равна, например, 50%, а не 0,50.
Теперь введем понятие независимых событий. Более подробно этот вопрос рассматривается в разд. 2.5. Говорят, что два события независимы, если появление одного из них не изменяет вероятности появления другого. Примерами двух независимых событий являются результаты, полученные при последовательном подбрасывании
Вероятность и случайная величина
В х игральных костей; результаты последовательного вынимания ^Н^бным образом двух шаров из ящика, в котором находятся пять ,шаров различного цвета, при условия, что шар, вынутый первым, ^вращается обратно перед вытаскиванием второго шара. Если же Первый шар нс возвращается обратно, то исходы не являются I е-Ж^нсимыми, поскольку после первого вытаскивания изменяется со-Ллямкимое ящика перед вытаскиванием второго шара. В этом случае ’Вероятность того, что при втором вытаскивании будет вынут шар
Рис. 2.6. Диаграмма Венна для двух зависимых событий.
-определе!итого цвета, зависит от того, какой шар был вынут в первый раз.
Диаграмма Венна, изображенная на рис. 2.5. показывает два независимых события А и В. На этой диаграмме площадь, изображающая множества .4 и В, снова принята пропорциональной объему этих множеств. Заметим, что отношение объема множества АВ к объему множества .4 (множеству элементарных исходов, скорректированному после наблюдения события Л) равно отношению объема множества В к исходному множеству элементарных исходов /. Это условие не выполняется, когда события не являются независимыми (рис. 2.6). Отсюда следует также, что если события А и В независимы, то независимы также и события А и В.
2.4. ЗАКОНЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ
$ Теперь, основываясь на результатах, полученных нами при изучении теории множеств, выведем некоторые важные правила теории вероятностей.
р Правило 1. Если Р(Л) и Р(Л) обозначают соответственно вероятность появления события А и вероятность его непоявления, то
Р(Т) = 1-Р(Л). (26а>
А
26
Г да на 2
Этот результат следует непосредственно из формул (2.6) — (2.8) и .вытекает из диаграммы Венна, изображенной на рис’. 2.2, в.
Правило 2. Если А и В — два независимых события, то вероятность того, что произойдут оба эти события, называемая вероятностью их совместного появления, равна произведению вероятностей появления отдельных событий, т. е.
Р(Л и й) = Р(АВ) - Р(Л)Р(В), (2.9)
«ели события А и В независимы.
Р и с. 2.7. Диаграмма Венна, показывающая совместное появление событий А, В н С (заштрихованная область).
Этот результат следует непосредственно из предыдущего раздела. Действительно, формула (2.9) часто используется в качестве определения двух независимых событий А и В. В этом выражении вероятность совместного появления двух событий, обозначаемая через «и», эквивалентна операции пересечения множеств.
Правило 3. Вероятность совместного появления каждого из п независимых событий Дь А-,, . . ., равна произведению вероятностей появления каждого из них в отдельности, т. е.
РМ, и л. и ... л,) = р ПЛ 1=Р(Л.)Р(Лг)...Р(Л,). (2.9а)
Вероятности и случайная величина '1?
К Этот результат является обобщением правила 2 для случая более лвух событий. Совместное появление трех событий .4, В и С показано заштрихованной областью на рис. 2.7.
L Правило 4. Если А и В — два взаимно исключающих события, т. е. если гп(АВ) = 0 и. таким образом, Р(ЛВ) О, то вероятность того, что произойдет одно из этих двух событий, равна сумме вероятностей появления отдельных событий:
Р (.4 или В) = Р (А + В) = Р (Л) + Р (В). (2.5а)
(См. общую заштрихованную область на рис. 2.8.)
Р и'С. 2.8. Диаграмма Венна, показывающая два взаимно исключающих события А и В.
Этот результат следует из формул (2.5) и (2.8). В этом выражении операция «или» эквивалентна операции объединения множеств.
Правило 5. Вероятность появления одного из п взаимно исключающих событий At, Л2, . . .. Л« равна
₽(/?! или Л2 или... или Ля) = ₽(Да) = ^Р(Л)- (2.56) Этот результат является непосредственным обобщением правила 4 для случая более двух событий.
Правило 6. Если А и В — два события, которые не обязательно должны быть взаимно исключающими, т. е. если Р(ЛВ) =/= 0, то вероятность того, что по крайней мере одно из этих событий произойдет, равна сумме вероятностей появления отдельных событий минус вероятность их совместного появления1’:
Р(Л и/или В) = Р (Л + В) = Р (Л) + Р (В) - Р (АВ). (2.7а)
*) Определение вероятности совместного появления событий, которые не являются независимыми, рассматривается в следующем разделе.
(См. заштрихованную область на рис. 2.2, а.)
Этот результат следует из формул (2.7) и (2.8). Заметим, что точно так же, как выражение (2.5) является частным случаем выражения (2.7), так и правило 4 является частным случаем правила 6. Поскольку события не являются взаимно исключающими, операцию «или» заменяет более общая операция «и — или», которая эквивалентна операции объединения множеств.
Распространим теперь правило 6 на случай более двух событий. Если рассматривать событие «Л н'или В» как одно событие, то. введя новое событие С и применяя правило 6, получаем
Р (Л и, или В и или С) = Р (Л + В 4- С) =
= Р(Л) 4-Р(В) 4-Р(С) —Р(ЛВ)—
-Р(АС) — Р(ВС) — Р(АВС). (2.10)
Рис. 2.9. Диаграмма Венна, показывающая появление событий А и/нлн В п/нли С (заштрихованная область).
Аналогичный результат получаем для вероятности появления не менее одного из п событий. Это приводит нас к правилу 7.
Правило 7. Вероятность того, что произойдет по крайней мере одно из п событий Л Л2, . . ., Л„, равна
Вероятность и случайная величина
24
и/или А2 И или . . .И или
V р (л,)—v р <л,лд + £ ₽ (<МА> —
• _ V Р(Л,Л/Л)+--
1 * 1>! (2.11)
I-Lih, что то же самое,
р(Л,к(я™ Л, п'или... и/или Л,) = 1 — Р(АА-• -л«). (2.11а) , I внятность того, что произойдет хотя бы одно из л событий а л А. равна единице минус вероятность того, что не
шшнйлет ни одно га »"« событий. Если эти события нкшшаяы. то из формул (2.6»>, (2.9а) и (2.11а) следует, что
Р(Л, Жак Аг к/нлк... и/ила Л,) = 1 —П[1 —РИ/Л- (2.116)
[^^Йвоиллюстрируем некоторые из выведенных правил на следующем примере.
P(D)=O,3
Рис. 2.10. Система с параллельными и последователь™,’^ментами.
Р(.‘1)—вероятность успешной работы элемента .4. (Изкннгв Ch est nu t Н.. Sys terns Engineering Tools, John Wiley. New York. 1965.)
- Требуется определить надежность системы, состоящей из трех Вёньев, с параллельным резервированием. Вероятности успешного ^выполнения операции каждым элементом показаны на рис. 2.1U. Шгрихгер. вероятность безотказной работы элемента Л равна и,у, ^Соответствующая вероятность для элемента В равна 0,8 и т. д.
30
Глава 2
Какова надежность, т. е. вероятность безотказной работа сисц мы, если вероятности отказа для каждого элемента и каждого звон взаимно независимы?
Для успешной работы всей системы требуется, чтобы успешно р; -ботало каждое звено. Следовательно, согласно правилу 3, верой ность P(S) безотказной работы системы составляет
Р(5) = Р(1)Р(||)Р(Ш),
где Р(1), Р(П) и Р(П1) обозначают вероятности безотказной работ
1. II и III звеньев соответственно. В данном случае для безотказно: работы I звена необходимо, чтобы элемент А или элемент В (или об;н работали безотказно. Таким образом, если Р(Л) обозначает вероят ность безотказной работы элемента А, Р(В) — то же для элемент .
В и т. д., то, согласно правилу 6,
Р (I) = Р (Л) + Р (В) - Р (АВ) = 0,9 + 0.8 — 0,9 • 0,8 = 0,98,
или, что то же самое, согласно формуле (2.116),
' Р (I) - 1 — [1 _ Р(А)][1 _ р (В)] = 1 _ (1 _о,9) (| - 0.8) = 0,98.
Кроме того,
Р(П) = Р(С) = 0,95
и, согласно формуле (2.116),
Р(1П)= 1-[1-Рф)][1-Р(£)](1-Р(Г)] =
= I—(1—0,9) (1—0,9) (1 — 0,5) = 0,995.
Таким образом,
P(S) = 0,98 • 0,95 • 0,995 = 0,926.
Этот результат показывает, что шансы на безотказную работу системы составляют 93 к 100.
2.5. УСЛОВНАЯ ВЕРОЯТНОСТЬ И ТЕОРЕМА БАЙЕСА
Во многих задачах исследуются независимые события. Рассмотрим, например, систему из двух звеньев, изображенную на рис. 2.11.
Элемент G частично входит в звено I и частично в звено II. Следовательно, если этот элемент выходит из строя в звене 1, то он нс будет успешно работать и в звене II. Таким образом, согласно определению, приведенному в разд. 2.3, вероятности безотказной рабо
Вероятность и случайная величина 31
Sдля этих двух звеньев не являются независимыми, так как веро-агпихть безотказной работы звена II зависит от того, что происхо-1нт в звене I, в частности от того, не отказал ли элемент G в звене I. В этих случаях нас интересуют условные вероятности. В частности, ровной вероятностью Р(В|Л) появления события В относится!,-Кекогорого другого события Л является вероятность появления события В при условии, что происходит событие Л. В нашем приме-ре Р<1ЦВ обозначает вероятность безотказной работы звена II при условии безотказной работы звена I.
Звено I ’ Звено II
рис. 2.11. Система из двух звеньев, в которой элементы не являются независимыми. (Из кннп! Chestnut Н.. Systems Engineering Tools, John Wiley, New York. 1965.)
। Чтобы усвоить понятие условной вероятности, рассмотрим диаграмму Венна, изображенную на рнс. 2.6. Нас интересует вероятность появления события В при условии появления события Л. Если известно, что событие А произошло, то множество Л заменяет множество / в качестве рассматриваемого пространства выборок. Число элементов множества АВ. изображающего совместное появление событий Л и В относительного нового множества элементарных исходов, равно m(AB)/m(A). Чтобы перейти от этого выражения к вероятностям, нужно лишь в соответствии с формулой (2.8) разделить числитель и знаменатель на т(1). Получаем
Р1В\А)^т(АВ)'^ = (2.12)
' 1 ’ т[А)!т(П Р(Л)
Теперь можно заново сформулировать правило 2 в более общем виде, исключая требование о независимости событий:
Р(Л и В) = Р(ЛВ) = Р(Л)Р(В|Л)- (2.13)
Рассматривая три события А. В и С, аналогично получаем
Р(Л и В и С) = Р(ЛВС) = Р(Л)Р(В|Л)Р(С|ЛВ). (2.14)
|гДе Р(С|Л В) обозначает условную вероятность появления события при условии появления событий .4 и В. Уравнение (2.14) можно ")гко обобщить на случай вероятности совместного появления продольного числа событии.
Эти понятия иллюстрируются на следующем примере; Допу, тнм, что 75% транзисторов поступает от поставщика 1, а остальны 25% от поставщика 2 н что 99% приборов, поступающих от постав щнка 1, и 90% приборов, поступающих от поставщика 2, имею удовлетворительные характеристики. Если случайным образо выбирается один транзистор, то какова вероятность того, что будс выбран неисправный элемент, изготовленный поставщиком 1?'Ка кова вероятность того, что будет выбран неисправный элемент, не зависимо от того, кем он бы.т изготовлен?
Пусть
A j — событие «транзистор от поставщика 1», Az~ событие «Транзистор от поставщика 2», В । — событие «исправный транзистор», В2 — событие «неисправный транзистор».
В11Л1 — событие «транзистор от поставщика 1 исправен» и т. д. Тогда
Р(Л,) = 0.75. Р (Л,) = 0,25, Р(В,|Л,) = 0,99, Р(В»|Й = 0.01. Р(В,|Л2) =0,90, Р (fi21Л2) = 0,10.
Согласно выражению (2.13), вероятность того, что выбранный транзистор неисправен и изготовлен поставщиком 1. равна
P(A,fi2) = Р(Л,)Р(В21 Л,) = 0,75 • 0,01 =0.0075.
Аналогично вероятность того, что будет выбран неисправный транзистор, поступивший от поставщика 2, равна
Р(Лг5,) = Р(Л2)Р(В2| Л2) 0,25 • 0,10 = 0.025.
Поскольку выбор неисправного элемента, изготовленного поставщиком 1, и выбор неисправного элемента, изготовленного поставщиком 2, — взаимно исключающие события, из правила 4 следует, что вероятность выбора неисправного элемента независимо от того, кем он был изготовлен, равна сумме вероятностей выбора неисправного транзистора от поставщика 1 и неисправного транзистора от поставщика 2, т. е.
Р(S2) = Р(Л А) + Р(Л2Вг) ^Р(А1)Р(Вг\А,) +
+ Р(Л2)Р(В2|Л2). (2.14а)
Таким образом,
Р (В2) = 0,0075 0,0250 = 0,0325.
Вероятность и случайная величина
33
В Часто используется обобщенная форма выражения (2.14а). До-йустн.м, что вероятность появления события В зависит от появления Дйсоторого предыдущего события, которое может произойти одним из Казличных способов: А,, Аг, . . АТогда безусловную вероят-gocrb Р(В) можно выразить как сумму условных вероятностей, «Множенных на вероятности появления соответствующих событий Д, (где i = 1, 2...л), т. е.
P(fl) = VPOBIAJPM,), (2-15)
/ 1
где А, — взаимно исключающие события и
VP(A,)= 1.
В- Непосредственно из формулы (2.15) и понятия условной вероят-дости следует важный закон, называемый теоремой Байеса. Теорема "Байеса дает способ объединения начальной, или априорной, вероятности появления некоторого события с соответствующими экс-Кшментальными данными и позволяет получить уточненную, или фостериорную, вероятность. Рассмотрим следующую задачу:
I. Пусть имеются л взаимно исключающих событий, или состояний Л,.А 2, . . ., Л„. В примере с транзисторами таких состояний было два: Л( — «транзистор от поставщика 1» и Аг— «транзистор ^.поставщика 2». Имеющаяся начальная информация позволяет йайти априорные 'вероятности Р(Л(), Р(Л2.), • • Р(Л.Я) для каждогосостояния А/ при условии, что УР(Л?) =1. В нашем примере Р(.4,) = 0,75 и Р(Л2) = 0,25.
№2. Вероятность того, что произойдет некоторое событие В, определенным образом зависит от А„ т. е. вероятность появления события В при условии появления события Л! известна; вероятность Появления события В при условии появления события Л2 известна н в общем случае известны условные вероятности Р(В1Л,)для i = 1, 2......... В нашем примере В может означать выбор неисправного
транзистора. Тогда Р(В1Л() 0,01 и Р(В1Л2) = 0,10.
3. Нам нужно знать, каким образом информация о том, что событие В действительно произошло, изменяет вероятность каждого состояния Л,, т. е. необходимо оценить апостериорные' вероятности Р(Л(1В) для I = 1,2...л. В примере с транзисторами может по-
требоваться исправленная оценка вероятности того, что выбранный транзистор изготовлен поставщиком 1, после того как стало известно. что он неисправен.
2-52
34
Глава 2
Итак, пусть даны вероятности Р(ЛД для 4=1, 2, . , п . Р(В|4/) для i = 1,2,..., п; требуется найти Р(Л(|5) для i = 1,2, . ... п. Согласно формуле (2.13), вероятность совместного появлени i событий Л, и В равна
Р (А,В) = Р (В) Р (А, | В) = Р (Л,) Р (В | At), откуда
Р (Л I В) = р(^) = P(Af)P(g|4J
11 ' Р(В) P(S)
Далее из формулы (2.15) получаем
Р(В)=1Р(В|Л/)Р(Л,).
Подставив полученное значение в предыдущую формулу, находи:' выражение, называемое теоремой Байеса:
Р(Д,|В) = Р(Л,) —__-----------------д,я ( = 112......
2 Р(Л|4,)Р(Л,)
(2.1t
Правая часть формулы Байеса состоит из двух членов: Р(Л,) — априорной вероятности, и Р(В|Л()/£ Р(В|Л,)Р(Л() — коэффицнег та, уточняющего априорную вероятность на основе экспериментальных данных.
Возвращаясь к задаче о транзисторах, из формулы (2.16) видим, что уточненная вероятность того, что выбранный транзистор изготовлен поставщиком 1, после того как оказалось, что он неиспра вен, равна
Р(A,IВ2) = Р(ЛЛ ------------Р|0-!Л|1-----------=
Р(И,|Л,)Р(.<1)+Р(1!Д-Л!)Р(Л.)
= 0,75---------—----------= 0,23.
0.01 0.7S+0.10.0,23
Таким образом, после того как стало известно, что выбранный транзистор неисправен, априорная вероятность того, что транзистор изготовлен поставщиком 1, равная 0,75, превращается в апостерн орную вероятность, равную 0,23.
Рассмотрим еще один пример. Пропускная способность канала связи зависит от вероятности появления ошибки внутри канала.
Вероятность и случайная величина
35
рассмотрим канал с двумя возможными входными сигналами Xt и Хл И двумя возможными выходными сигналами Yt и У2. Допустим, uro сначала 40% времени канал принимает сигнал X,, а затем 6О?6 времени — сигнал Х2. Вероятность безошибочной передачи входного сигнала Xt как Ft равна 0,75. Вероятность того, что входной сигнал Xt будет ошибочно передан как У2, равна 0,25. Аналогично вероятность того, что сигнал, первоначально принятый как Х2, будет передан как Yz и Ylt равна соответственно 0,90 и 0,10. Схематически условие этой задачи показано на рис. 2.12.
Рис- 2.12. Канал связи с двумя возможными входными сигналами, двумя возможными выходными сигналами и известными вероятностями передачи. (Из книги Сhеs t n u-t И., Systems Engineering Tools. John Wiley. New
York, 1965.)
При заданных условиях получен выходной сигнал У1. Какова вероятность того, что исходным был сигнал Х(?
Априорные вероятности равны
Р(Х1) = 0,4, Р(Х2) = 0,6,
кроме того,
Р(У1|Х,) = 0,75 и Р(Г1|Х2) = 0,10.
Тогда из формулы (2.16) следует
Р(Х1|У1) = Р(Х1)
___________Р(У.|Х1)____________
Р(Г1|Х,)Р(,Х1) + Р(У>|Х,)Р1(ХЯ)
= 0,833.
К Таким образом, наличие информации о том, что выходным сигналом является У-!, меняет вероятность того, что входным сигналом является Xt, с 0,4 на 0,833.
В рассмотренных примерах предполагалось, что априорные вероятности можно получить, либо зная реальную ситуацию, либо, •утем анализа данных, полученных за прошлое время, используя
36
Глава 2
одно из двух определений вероятности, приведенных в начале этой главы. Во многих задачах невозможно получить также объективны.-априорные вероятности, и многие математики считают, что в этих случаях теорема Байеса неприменима. Однако, используя субъективное определение вероятности, мы не сталкиваемся с этим ограничением, поскольку здесь априорные вероятности могут быть основа ны на личном суждении. Теорема Байеса действительно является настолько важным инструментом при анализе таких ситуаций, когда рассматриваются субъективные вероятности, что все методы, ис пользующие такие вероятности, часто называются методами Байеса Более подробно эти вопросы изложены в книгах Линдли (2.61 и Шляйфера (2.71.
2.6. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ И ИХ РАСПРЕДЕЛЕНИЯ
Понятие случайной величины
В предыдущих разделах мы видели, что при использовании теории вероятностей необходимо определить число элементов множеств и подмножеств, изображающих рассматриваемые события, относительно числа элементов множества элементарных исходов, или пространства выборок. До сих пор это делалось путем группирования выборочных элементов, связанных с определенным событием и суммирования соответствующих вероятностей, чтобы получить вероятность появления данного события. При рассмотрении более сложных ситуаций необходимо ввести новое понятие — случайную величину.
Случайной величиной является функция, определяемая на пространстве выборок. Пусть, например, мы бросаем две игральные кости. В этом случае пространство выборок состоит из 36 возможных пар исходов: (1, 1), (1. 2).(6, 6). Здесь цифры показывают
число очков при бросании первой и второй игральных костей соответственно. Сумма очков, выпадающая при каждом бросании двух игральных костей, — случайная величина, поскольку она является функцией, определенной для каждого элемента пространства выборок. Точное соотношение между элементами пространства выборок и значениями случайной величины показано в табл. 2.1 Например, для элемента выборки (I, 1) случайная величина принимает значение 2, для элемента выборки (1. 2) — значение 3 и т. д. Таким образом, несмотря на то, что пространство выборок состоит из 36 элементов, случайная величина принимает только 11 целочисленных значений, лежащих в интервале от 2 до 12. Это происходит вследствие того, что некоторые элементы пространства выборок изображаются одними и теми же значениями случайной величины. Более абстрактно: пусть yt и уг обозначают соответственно результаты
Вероятность и случайная величина 37
бросаний первой и второй игральных костей. Тогда рассматривае-I мая случайная величина будет функцией
х = У1 + Уг-
I На этом же пространстве выборок можно определить многие другие случайные величины, например следующие:
1. Среднее число очков при бросании двух игральных костей, j т. el случайную величину ,
х = + у»
1 2
принимающую значения 1,-1 2, 3, -у, 4, -у, 5, -у, 6.
2. Квадрат суммы очков при бросании двух игральных костей
т. е. случайную величину
*2 = G/t + Уг)г
принимающую значения 4, 9, 16, 25, 36, 49, 64, 81, 100,121, 144.
Таблица 2.1
Соотношение между элементами выборки и случайной величиной, равной сумме очков при бросании двух игральных костей
Соответствующее Соответствующее
значение
случайной величины
1 1 2 4.1 5
1.2 3 4,2 6
1.3 4 4 3 7
1,4 5 4 4 8
1,5 6 4.5 9
1.6 7 4,6 10
2,1 3 5,1 6
2.2 4 5.2 7
2,3 5 5,3 8
2.4 6 5,4 9
2,5 7 5.5 10
2,6 8 5.6 11
3.1 4 6.1 7
3.2 5 6,2 8
3,3 6 6,3 9
3,4 7 6.4 10
3.5 8 6.5 II
3.6 9 6.6 12
38
Глава 2
3. Число очков только при первом бросании игральной косъ т. е. случайную величину
= У»
принимающую значения 1,2, 3, 4, 5, б. Эта случайная величина соо ветствует элементам пространства выборок при бросании одно; игральной кости (пример из разд. 2.3).
Понятие случайной величины позволяет отображать качестве! ные результаты эксперимента на количественной шкале. Рассмот рим, например, производственный процесс, когда за сутки изготав ливаются пять приборов. Каждый прибор классифицируется как исправный (G) или неисправный (D). В этом случае пространств, выборок состоит из всех возможных последовательных комбинации исправных и неисправных приборов, т. е. элементов (G, G, G, G, G) (G, G, G, G, D), (G, G, G, D, G).(D, D. D, D, D). Здесь первый
символ в каждой группе показывает, является исправным (G) или неисправным (D) первый прибор; второй символ обозначает состоя ние второго прибора и т. д. Можно видеть, что пространство выборок содержит 25 = 32 элемента. Случайной величиной, интересую щей нас в данном случае, является число неисправных приборов, изготовленных в определенный день. Эта случайная величина при ннмает значения 0, 1, 2, 3, 4, 5 и имеет следующее отображение
Соответствующее
выборок значение случайной величины
(G, G, 6. G, G) 0
(G, G, G, G, D) 1
(G, G, G, D, G) I
(D, D, D, D, D) 5
Таким образом, в рассмотренном примере введение случайной величины превратило элементы пространства выборок, определяемые качественно, в целочисленные случайные величины, имеющие физический смысл.
В двух последних примерах рассматривались пространства выборок, содержащие лишь конечное число элементов. Часто, когда имеют дело с результатами счета (например, числом дефектов в образце материала), наблюдаются случайные величины, которые мо-
Вероятность и случайная величина 39
гу г по крайней мере теоретически, принимать любое целочислеп-ноеЙиачение. В этом случае говорят, что пространство выборок состоит из счетного бесконечного множества элементов. Пространство выборок, содержащее конечное число или счетное бесконечное множество элементов, называется дискретным. Дискретной называется случайная величина, принимающая только счетное число значений- Другими примерами дискретных случайных величин являются число телефонных вызовов, поступающих на коммутатор за данный
чае; число единиц оборудования, прибывающего в ремонтную мастерскую в данный день; число баскетбольных матчей, сыгранных нью-йоркской командой «Мете» за сезон; число отказов, наблюдаемых при Испытании рабочих характеристик системы.
Другим типом случайных величин являются непрерывные. В отличие от дискретных непрерывные случайные величины могут принимать любое значение в одном или большем числе интервалов. Не-
прерывные случайные величины получают, когда имеют дело не с результатами счета, а с результатами измерений. Примерами непрерывных случайных величин являются время до момента выхода из строя электронной лампы; рост человека определенной возрастной группы; уровень шума, создаваемого при работе бытового электрического прибора, в децибелах; доля дефектного металла в стальной
отливке.
Распределение дискретной случайной величины
Так как случайная величина является функцией, определенной на пространстве выборок, значениям случайной величины можно поставить в соответствие определенные вероятности. Распределением дискретной случайной величины х является выражение p(xt), показывающее вероятность появления всех возможных значений случайной величины, т. е. р(х,) = Р(х= х,) для I = 1,2.....Заме-
тим, что
р(х4)>-0 для всех х,. (2.17)
г Распределение задает вес каждого значения случайной величины на основании вероятностного содержания подмножества пространства выборок, связанного с этим значением. В примере с бросанием Двух игральных костей вероятность каждого значения случайной величины х, представляющей собой сумму очков при бросании двух Игральных костей, согласно правилу 5, рассмотренному в разд. 2.3, находится путем сложения вероятностей соответствующих элементов пространства выборок. Поскольку каждый из 36 элементов ЫМЯнаково возможен и их общая вероятность должна в сумме сос-►ДВвлять единицу, каждому элементу ставится в соответствие верс-ыртиость, равная */ав.
40
Глава 2
Таким образом, получено распределение, показанное в табл. 2.2
Таблица 2 с
Вероятности появления определенной суммы очков при бросании двух игральных костей
Значение случайной величины 2 3 4 5 6 г В 9 10 JI 12
P(*l) 36 36 36 36 36 36 36 36 36 36 36
Таблица 2.4
Интегральная функция распределения суммы очков, выпадающих при бросании двух игральных костей
случайной
<2 2 3 4 5 6
10
F
36 36 36 36 36 36 36 36 36 36
и изображенное на рис. 2.13. Например, вероятность р (4) того, что х = 4, равна 3-^, поскольку имеются три элемента пространства выборок — (1, 3), (2, 2) и (3,1), для которых у{ + у2 = 4. Более компактно распределение можно записать в следующем виде:
, (2.18)
12-Ь. х, = 7. 8........... 12.
( 36 '
Во многих практических задачах вместо вероятности того, что случайная величина х принимает некоторое определенное значение х,, нас может интересовать вероятность того, что случайная величина х меньше или равна х,. Эта вероятность задается интегральной функцией распределения. Функция F (х(). показывающая вероятность того, что дискретная случайная величина х не превысит некоторое значение х„ называется интегральной функцией распределения. Функцию F (xt) можно получить, суммируя значения
Вероятность и случайная величина
41
двух игральных костей.
вероятностей по тем элементам пространства выборок, для которых случайная величина принимает значение, не превышающее xlt т. е.
Р(х<х,)= F(x,)= 2 <2 I9)
Ясно, что
0<F(x,)< 1 для всех х, и
F(x/)>F(xy) для xz>xy.
Интегральная функция распределения для задачи о бросании двух игральных костей записана в табл. 2.3, а ее график показан на рис. 2.14.
Эту функцию распределения можно также записать в виде формулы, аналогичной выражению (2.18).
) Дополнение интегральной функции распределения до единицы дает вероятность того, что случайная величина превышает заданное (Значение. т. е.
P(x>x,) = l-F(x,). (2.20)
I Кроме того,
УрШ-1, <2.21>
42
Г лава 2
поскольку вероятность, соответствующая всей совокупности элементов пространства выборок, равна единице, а определение случайной величины требует отображения каждого элемента пространства выборок.
Плотность распределения и интегральная функция распределения непрерывной случайной величины
Как и в случае дискретной случайной величины, интегральная функция распределения F (ху) непрерывной случайной величины х показывает вероятность того, что случайная величина х не превышает некоторое заданное значение х„ т. е.
F(xi) = P(x<x/).
Следовательно, вероятность того, что значение случайной величины х заключено между xt и х2, равна разности значений функции распределения, вычисленных в этих двух точках, т. е.
P(*i<*<x3) = F(x2)-F(xl). (2.22)
Аналогично
P(x>x/)=1-F(x,).
Огсюда следует, что если F (х,) — интегральная функция распределения непрерывной случайной величины х, то
Вероятность и случайная величина
43
lim F (х() = F (—со) = О,
lim F (х{) = F (со) = 1,
(2.22а)
F(x()>0 для всех xt
F(x()> F(xj), t если x(>xy.
В качестве примера рассмотрим время распада t радиоактивной частицы. Пусть из теоретических соображений нам известно, что
40г
М-
0.8
0.1
^0.0-
U 0,8-
0.4
0.3-
а'г
to 20 30 ЛО 80 Ы)
Рве. 2.15. Функция распределения Г(/)=е_°«1//.
вероятность того, что к моменту времени^, распад частицы не произойдет, равна e~ui, где /. — известная постоянная, т. е., что
₽«>'<) = 1-F(',)>*
Следовательно, интегральная функция распределения времени спада имеет вид
P(/<Q = F(Q=1-«
(2.226)
На рис. 2.15 показан вид этой функции распределения при ~ 0,1. Можно легко убедиться в том, что функция F (Q удовлетворяет требованиям, заданным формулой (2.22а). Заметим, что
пространство выборок для I включает все неотрицательные момент i4 времени tb т. е. теоретически возможно, что распад произойди в любой момент времени.
Вероятность того, что распад произойдет в интервале времс-(6. /2), можно получить из выражения (2.22):
P(/,</<^ = F((,)-F(y=
= (1 - е~ “) — (1 - <Г “) = Г “ — е~ *•. (2.22т,
Если, например, время выражается в часах и >. = 0,1, то, соглас но формуле (2.226), вероятность распада за первые два часа равн
P(i<2) = F(2) = 1 — е-0"” = 0,181,
а из выражения (2.22в) находим, что вероятность распада в некото рый момент пятого часа равна
P(4</<5) = F(5)-F(4)= [l-e-0J<5’] _ [!-«-•••«>] = = 0,063.
Поскольку пространство выборок непрерывной случайной величины содержит несчетное бесконечное множество точек, вероятность, соответствующая любому конкретному значению непрерывной случайной величины, равна нулю. Таким образом, левую часть формулы (2.22) можно записать как Р (Xi< х < х2) или как Р (х( ; х
Для дискретной случайной величины распределение р (х,) оп ределяется как вероятность, соответствующая значению ху случайной величины. Очевидно, что для непрерывной случайной величины такое определение не имеет смысла. Вместо этого мы определим плотность распределения (функцию плотности или плотность вероятности) f(x) непрерывной случайной величины х с помощью интегральной функции распределения следующим образом:
/М _ |1ш РЬК/о.+Д») = i[F(x)J. (2.23) Дх-.о Д.г dx
Термин плотность вероятности используется на том основании» что, хотя /(х) не является вероятностью, произведение /(х)Ах приближенно равно Р (х; х < Xj-f-Ax) при условии, что Ах — достаточно малая величина.
Так, в предыдущем примере плотность распределения времени распада равна
/(/)= А|1 —е“и] -- />0. (2.24)
Вероятность и случайная величина
45
Сравнение (2.24) называется плотностью экспоненциального распределения. Это распределение рассматривается в гл. 3 и в последу-кхцнх разделах данной главы.
Вероятность того, что случайная величина х примет значение, Не превышающее х1, можно найти с помощью плотности распределения следующим образом:
P(x<x,) = F<x,)~ '(l(y)du. (2.25)
Аналогично
P(x>^) = l-FW=|/Wd» (2.25а)
Р (х, < X < Х2) = F (х2) — F (хг) =
= j f (У) dy- j f (у) dy = J f (y) dy. (2.26)
Таким образом, для непрерывной случайной величины вероятность можно определить как относительную площадь под кривой плотности распределения. В частности, для непрерывной случайной величины х с плотностью распределения f(x):
. 1) вероятность того, что случайная величина х меньше х(, равна относительной площади под кривой f(x) влево от точки Xi (рис. 2.16,а);
2) вероятность того, что случайная величина х больше х2, равна относительной площади под кривой /(х) вправо от точки х2 (рис. 2.16,6);
3) вероятность того, что случайная величина х заключена между х, и х2, равна относительной площади под кривой /(х) между точками Xi и х2 (рис. 2.16,в).
Из формул (2.22а) и (2.23) следует также, что
j f(x)dx~F(co)—F(—со) = 1
(2.27)
f (х) > 0 для всех х.
(2.27а)
Таким образом, при выборе плотности распределения непрерывной случайной величины мы должны ограничиваться теми функция-Ми. принимающими неотрицательные значения, интеграл которых
f(X)
j. si вероятность того, что .v находится между xt и xt.
Вероятность и случайная величина
47
павен единице на заданном пространстве выборок или в заданной области изменения. Аналогичные требования для дискретной случайной величины заданы формулами (2.21) и (2.17).
Дополнительные замечания и определения
В этой главе мы использовали символ х (или I) для обозначения случайной величины, а значения, которые принимает случайная величина, обозначали через xt (или t,). Принято также обозначать случайную величину символом X, я ее значения символом х, или же для обозначения случайной величины использовать жирны») шрифт, а ее значений — обычный. Для простоты, особенно при рассмотрении непрерывных случайных величин, как случайная величина, так и ее значения часто обозначаются символом х. Точный смысл легко установить из контекста. Термин распределение используется также в общем смысле для обозначения как плотности распределения, так и интегральной функции распределения. Так, например, можно сказать, что время распада имеет экспоненциальное распределение, или что время распада — экспоненциально распределенная случайная величина.
Мы старались показать, что для описания случайных событий удобно использовать понятие случайной величины. Каждой случайной величине соответствует некоторое распределение, описывающее вероятностное поведение рассматриваемой системы. Обычно распределение определяется одной или большим числом постоянных, называемых параметрами, которые характеризуют центр распределения, масштаб и форму кривой распределения. Примером параметра масштаба является постоянная К в задаче о распаде радиоактивной частицы. Во многих задачах тип распределения известен из теоретических или технических соображений, однако параметры распределения необходимо определять на основе имеющихся экспериментальных данных. Обычно мы проводим различие между известным значением параметра и его оценкой, полученной на основании экспериментальных данных, помещая над символом «крышку». Так, /. обозначает оценку параметра X экспоненциального распределения.
При рассмотрении случайных величин и статистических моделей часто приходится иметь дело со случайными выборками для Оценки значения одного или большего числа параметров, оценки «ответствия статистической модели и т. д. Случайная выборка Избавляется таким образом, что каждый элемент имеет фиксированную известную вероятность быть выбранным. В этой книге мы Ограничимся случайными выборками, для которых выбор каждого яЯЛСМенга совокупности производится с одинаковой вероятностью
48 Глава 2
Такие случайные выборки можно получить из фиксированной о,, вокупности объема N следующим образом: каждому элемент ставятся в соответствие различные числа от I до jV и для выбор', элементов, включаемых в выборку, используется таблица равно мерно распределенных случайных чисел (см. гл. 7).
Сведенные в таблицы наблюдаемые значения случайной выбор ки, обычно сгруппированные по частоте появления, особенно дл । непрерывных случайных величин, будем называть эмпирически, плотностью распределения. График плотности распределения, пред ставленный в виде прямоугольников, высота которых (ординат; ! пропорциональна частоте появления в выборке, а по оси абсцис. отложены соответствующие значения случайной величины, назы вается гистограммой. Две следующие главы посвящены рассмотри нию различных распределений непрерывных и дискретных случай ных величин.
Функция случайной величины также является случайной вели чиной. Например, в задаче о бросании двух игральных костей функция и (х) = х2 (квадрат суммы очков, выпавших при бросании двух игральных костей) является случайной величиной. В гл. "> рассматриваются способы определения плотности распределения функций случайных величин.
2.7. ПАРАМЕТРЫ, ХАРАКТЕРИЗУЮЩИЕ ЦЕНТР
РАСПРЕДЕЛЕНИЯ
Часто инженеру бывает необходимо представить информацию о распределении случайной величины через несколько описывающих его параметров. В других случаях бывает неизвестна форма рассматриваемого распределения, однако все же представляет интерес вычислить главные показатели на основе имеющихся данных.
Одной из наиболее важных характеристик распределения является точка, вокруг которой группируется распределение. Укажем три различных способа задания этой точки.
Математическое ожидание, или среднее значение
Наиболее известной характеристикой центра распределения является математическое ожидание, часто называемое арифметическим средним, а иногда — средним значением или просто средним. Если х — непрерывная случайная величина с плотностью распределения f (х), то ее математическое ожидание определяется как
Е(х)= Jx/(x)dx.
(2.28а)
Вероятность и случайная величина
49
Если х—дискретная случайная величина с распределением р(х1),
£(i) = VxJ?(.,), (2.286)
Плотность распределения можно рассматривать как способ задания йвосительного веса различным значениям случайной величины. Тогда математическое ожидание можно рассматривать как центр тяжести распределения, поскольку оно является той точкой, относительно которой сумма произведений расстояний, отложенных влево, nd соответствующую вероятность в точности уравновешивается соответствующей суммой взвешенных значений, расположенных справа. Это положение иллюстрируется на рис. 2.17 и 2.18 для следующих двух примеров. Математическое ожидание числа очков, выпадающих при бросании игральной кости, находим, используя формулу (2.286):
£(») = jwW = l.f+2' -£- +
+ 3. J- + 4-- + 5.-1 +6 -L = 3,5.
6 6 6 6
(См. рис. 2.17.)
В этом примере случайная величина никогда не принимает значение, равное математическому ожиданию.
Аналогично математическое ожидание суммы очков при бросании двух игральных костей (см. табл. 2.2) равно
£(х).= V x,pW = 2.i + 3.^ + 4. А +
& Лшл 36 30 00
*/-2
+ 5.± + 6-—4-7'—Ч-8- —4-9 — +
, 36 36 Т 36 36 г 36
4-Ю. -4-11 . — 4-12 • — = 7.
1 36 Г 36 ' 36
(См. рис. 2.18.)
I Математическое ожидание экспоненциально распределенной случайной величины t, представляющей собой время распада час-дуицы, равно
£(() = J(/(/)« = J OZ" dl. (2.29)
50
Глава 2
Интегрируя по частям, получаем
£(0=т-
Таким образом, среднее время распада равно обратной величин параметра распределения л.
Математическое ожидание часто используется при статист; ческом анализе, и оно будет встречаться ниже.
Математическое ожидание
Рис. 2.17. Распределение числа очков при бросании игральной кости.
Вероятность и случайная величина
51
Медиана
» Другой характеристикой центра распределения является срединная точка, или медиана. Для плотности распределения f(x) непрерывной случайной величины медианой является такая точка г. что
[ /(*)<Ь=0,5.
(2.30)
Таким образом, медиана равна такому значению случайной величины, которое делит пополам площадь под кривой плотности распределения (рис. 2.19). Медиана распределения дискретной
Медиана
f(x)
Математическое оживание Медиана
« м“’“
’нс. 2.19. Соотношение между математическим ожиданием, медианой и "°ДОй дли трех различных распределений. (Из книги Chestnut Н., Systems Engineering Tools, John Wiley, New York, 1965.)
52
Глава 2
случайной величины определяется аналогично с тем лишь отличием, что интеграл заменяется суммой значений случайной величину
В задаче о распаде частицы медиана z называется период.,: полураспада, поскольку к этому времени произойдет распад около половины большого числа частиц. Значение медианы находи решая уравнение
[Хв-1'й=10,5.
Получаем z = (In 2)А. Таким образом, медиана экспоненциалы, распределенной случайной величины составляет чуть больше дв\ х третей ее математического ожидания.
Медиана часто является удобной характеристикой центра ра< пределения случайных величин, распределение которых не является симметричным. Например, медиана, по-видимому, даст «лучше, представление» о распределении суммы личных доходов группы семей, чем арифметическое среднее. Это объясняется тем, что медиа на не так чувствительна к небольшому числу крайних значения (например, таких, как семьи с очень большим доходом), как среднее значение.
Мода
Мода — третья характеристика центра распределения. Для дискретной случайной величины модой является значение случайно): величины, имеющее наибольшую вероятность. Мода непрерывное случайной величины равна значению, соответствующему максиму му плотности распределения (если имеется один максимум). Мода экспоненциально распределенной случайной величины находится в начальной точке, поскольку максимальному значению функции
/>0, Х>0, соответствует t = 0.
Сравнение параметров, характеризующих центр распределения
Из сказанного ранее можно заключить, что среднее арифметическое чувствительно к крайним значениям, медиана менее чувствительна к ним, а на моду эти значения вообще не оказывают влияния. Приближенное соотношение между этими тремя параметрами для трех гипотетических плотностей распределения показано графически на рис. 2.19. Очевидно, что для симметричного распределения с одним максимумом эти три показателя совпадают. В случае асимметричных распределений и распределений с несколькими максимумами эти параметры обычно не совпадают.
Вероятность и случайная величина
53
Определение математического ожидания, медианы и моды по результатам наблюдений
Предыдущее изложение было посвящено параметрам, характеризующим центр распределения, когда математическая форма распределения известна. Часто нас интересует оценка этих параметров, когда имеются лишь значения п наблюдений’>. В этих случаях применяются следующие правила:
Й-’’Вычислен не среднего. Эмпирическое среднее, обозначаемое через х, вычисляется как
- - £" (2.31)
где х, (г = 1,2,...,л) — значения п результатов наблюдений.
Вычисление медианы. Данные упорядочиваются по величине. Если п — нечетное число, то медиана равна значению Цп+1)/2]-го упорядоченного наблюдения, если же п — четное число, то медиана равна среднему значению между (в/2)-м и ((л/2) + 11-м упорядоченными наблюдениями.
Вычисление моды. Находим результат наблюдения, который встречается наиболее часто. В некоторых случаях может .оказаться целесообразным группировать данные по интервалам частот одинаковой длины. При этом мода берется как центральная точка частотного интервала, содержащего наибольшее число наблюдений.
Этц правила иллюстрируются на следующем примере. Были подвергнуты испытаниям 10 конденсаторов емкостью 5 лшр. Изменение емкости каждого из них через 100 час работы показано в табл. 2.4.
Используя формулу (2.31), находим среднее изменение емкости
ю
----0,04.
ю
Для вычисления медианы результаты наблюдений располагаются в порядке возрастания, как показано в табл. 2.4а. Так как
... " Когда данные группируются по частоте появления, то среднее значе-о каждой группы используется как значение, представляющее все наблю-Ивння Этой группы.
54
Глава 2
Таблица 2.4
Изменение емкости десяти конденсаторов после испытаний в течение 100 час
конденсатора Изменение емкости, мкф Номер конденсатора Изменение емкости, мкф
1 —0,10 6 -0,06
2 —0,01 7 0,00
3 0,00 8 —0,08
4 -1-0.02 9 -0,03
5 —0,15 10 +0,01
Таблица 2.4а
Упорядоченные значения, показывающие изменение емкости конденсаторов после испытаний в течение 100 час
ПорядкопыП номер Номер конденсатора Изменение емкости, мкф
1 5 —0,15
2 1 —0,10
3 8 —0,08
4 6 -0,06
5 9 —0,03
6 2 -0,01
7 и 8 3 и 7 0,00
9 10 +0,01
10 4 +0,02
п = 10, т. е. п — четное число, то медиана равна среднему значению между пятым и шестым наблюдениями, т. е. л/2 = 5 и [(п/2) + 1J = 6. Пятое наблюдение равно —0,03 мкф, а шестое —0,01 мкф. Средний результат равен —0,02 мкф; это и есть медиана, вычисленная для измеренных значений изменения емкости.
Мода, т. е. наиболее часто встречающееся значение изменения емкости, для полученных данных равна нулю, хотя для такого небольшого числа наблюдений вычисление моды не имеет очень большого смысла.
Прежде чем продолжать обсуждение способов краткого представления информации о распределениях, рассмотрим определение математических ожиданий в более сложных случаях.
Вероятность и случайная величина
. 81 МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ ФУНКЦИИ
Н СЛУЧАЙНОЙ ВЕЛИЧИНЫ
V Как уже указывалось ранее, если h (х) — функция случайной Ецнины х. то h (х)— также случайная величина. Процедура ^хождения распределения случайной величины h (х) рассматривается в гл. 5. Часто нет необходимости знать полное распределение случайной величины h(x), достаточно найти лишь ее математическое ожидание. Это можно сделать, найдя распределение новой случайной величины и взяв ее математическое ожидание. Однако нахождение распределения функции случайной величины часто бывает довольно утомительным. Поэтому в данном разделе мы рассмотрим случаи, когда математическое ожидание случайной величины h (х) можно найти непосредственно.
№<Йроил л юст р 11 р уем эту задачу па следующем примере. Каждый раз, когда оборудование выходит из строя, фирма обязана уплатить штраф, размеры которого в долларах равны квадрату числа часов /, (Я&соднмых для ремонта. Пусть i — экспоненциально распределенная случайная величина, а А. — интенсивность ремонта. Каково математическое ожидание размера штрафа за одну поломку?
.. Функция Л (х), связывающая продолжительность ремонта с размером штрафа в долларах, имеет вид
где случайная величина t имеет плотность распределения
<>0.
Требуется определить Е [h(t)).
Математическое ожидание функции h (х) определяется следующим образом.
Если х — непрерывная случайная величина с плотностью распределения / (х), то
J h(x)f(x)dx.
(2.32а)
Если х— дискретная случайная величина с распределением Р (хД, то
E[h(x)]=yih(xl)p(xl).
(2.326)
формулы (2.32) являются обобщением формул (2.28); здесь вместо Случайной величины х берется новая случайная величина h (х).
56
Глава 2
В рассматриваемой задаче математическое ожидание разм< , штрафа за выход оборудования из строя равно
£(/>) = С = (2..Я,
Если, например, >. — 0,1 единицы оборудования в час, то магматическое ожидание суммы штрафа составит 2/(0,1)2 = 200 дол
Из формул (2.32) вытекают также следующие важные резу. тэты:
1. Математическое ожидание постоянной с равно самой пост янной, т. е.
Е(с) = с. (2.341
Если х — непрерывная случайная величина, то
£(с) = J cf(x)dx=c j f(x)dx = c,
если л — дискретная случайная величина, то
Е(с) = Vcp(x,) = = С‘
2. Математическое ожидание произведения постоянной величины на случайную величину равно произведению постоянной и математическое ожидание случайной величины, т. е.
Е(сх) = сЕ(х), (2.361
так как, согласно формуле (2.32), для случая непрерывной случайной величины
Е(сх) = $cxf(x)dx = c J xf(x)dx-cE(x)
и для случая дискретной случайной величины
£ (м) = V сх,р (х,) = iVIf (*,) = сЕ (х). 2=1 /=ы
Иногда рассматривают функцию не одной, а нескольких случайных величин. В этом случае справедливы следующие два результата, которые мы докажем в разд. 2.11.
Вероятность и случайная величина
____ тематическое ожидание суммы п случайных величин х(, £ ,,,, x,i равно сумме математических ожиданий каждой из них в Кльности. т. е.
(2.36)
Н 4. В более общем случае для любой линейной комбинации .случайных величин имеем t
WM- (2.36а)
гделч, х2,.... хп— случайные величины, a blt Ьь .... Ьп — постоянные.
Так, если в задаче о штрафе за выход оборудования из строя фирма обязана платить штраф за простой (хО, оплачивать половину стоимости материала, израсходованного на ремонт (х2). и четверть трудозатрат на ремонт (ха), то каждый раз при выходе оборудования из строя математическое ожидание общей суммы затрат составит
* Е (х, 4- 0,5х2 + 0,25х3) = Е (xj 4- 0,5 Е (х2) 4- 0.25Е (х8).
Если каждая из этих составляющих имеет математическое ожидание, равное 1000, 500 и 300 долл, соответственно, то математическое ожидание общей суммы затрат составит
1000 4- 0,5 (500) 4- 0,25 (300) = 1325 долл.
Заметим, что выражения (2.34) — (2.36) являются частными случаями ,формулы (2.36а). Эти результаты справедливы независимо от характера распределения каждой случайной величины, конкретная форма которого может даже быть неизвестна, и независимо от того, являются ли случайные величины независимыми (определение независимых случайных величин см. в разд. 2.11).
Более подробно этот вопрос обсуждается в гл. 7, где рассматриваются приближенные методы нахождения математического ожидания более сложных функций случайных величин. Теперь мы ^обратимся к способам краткого представления информации о рас-пределепиях.
2.0. ДРУГИЕ ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЙ Моменты распределения
I Кроме центра распределения, часто бывает необходимо описать Ксеянне, симметрию н островершинность распределения. Эти йрактеристики можно кратко представить с помощью моментов
58
Гл а в а 2
распределения. Для упрощения обозначений вместо Е (х*) бу,;, , использовать р.'А. Так, обозначает математическое ожидание Е , случайной величины х1’. Величина р.'* называется также k-м мом . том распределения относительно произвольного начала или , моментом относительно нуля.
k-й момент относительно математического ожидания, ; । центральный момент, определяется как
= £)*. —l*i]‘= J (x—|*i )*/(**) dx, (2. '
если х — непрерывная случайная величина с плотностью раса, деления f (х), и как
и* = н;)‘рОч)>
(2.37. ,
если х —дискретная случайная величина с распределением р(х,)
Используя терминологию, введенную в предыдущем раздел (х — |х/)*можно рассматривать как функцию h (х) случайной величины х. Таким образом, выражения (2.37) являются частным сличаем формул (2.32).
Распределение является полностью заданным, если известны все его моменты2’. Однако многие распределения могут быть пол ностью описаны с помощью первых четырех моментов, и мы ограни чимся рассмотрением только этих моментов. Первые четыре момента не только являются параметрами, описывающими распре деление, но и играют важную роль при подборе эмпирически' распределений (гл. 6) и при приближенной оценке распределении случайной величины (гл. 7).
Первый центральный момент всегда равен нулю, т. е.
1*1 = 0.
так как
л=£р—л] =£w—£(,*;) =|«;—|*;=о.
Дисперсия и среднее квадратическое отклонение
Второй момент относительно среднего является показателем рассеяния. Он называется дисперсией и, согласно формуле (2.37), определяется как
’) Е(х) часто обозначается также через р.
2) Применение моментной производящей функция для нахождения всех необходимых моментов распределения описано в книгах по математической статистике, перечисленных в списке литературы.
Вероятность и случайная величина
59
дня непрерывной случайной величины и как |*!=
(2.386)
(дискретной случайной величины. Кроме того,
(2.39)
«*(»)-и»— М!.
^«Формула (2.39) получена следующим образом: e*(x) = Е (х-р',)2 = Е [ха- 2хр; + (|*;)2]=Е(х»)-2p;E(x)+(|i;)2,
откуда
"'W=!*;-( н;)!-
Дисперсия экспоненциально распределенной случайной величины I находится из формул (2.29), (2.33) и (2.39) как
<2Л°>
К'Хвадратпый корень из дисперсии называется средним квадратическим отклонением я обозначается символом в. Так, для экспоненциально распределенной случайной величины а = 1/Л. Среднее таадратическое отклонение выражается в тех же единицах, что и Исходная случайная величина. Как будет показано в гл. 3, для случайной величины, распределенной по нормальному закону, 68,3% значений случайной величины заключено в интервале р ± а, где р г— математическое ожидание, 95,5% значений — в интервале Р ± 2а, 99,7% в интервале р ± За (рис. 2.20). При рассмотрении Других распределений случайных величин иногда бывает целесообразно находить пределы (которые могут быть заданы с очень большим запасом), используя теорему, называемую неравенством Чебышева. Согласно этой теореме, для любого распределения с Конечными математическим ожиданием и дисперсией по крайней We [1 — (1//е2) 1 100% значений случайной величины находится в Интервале р ± ks. Так, для большинства распределений не менее 75% площади под кривой распределения лежит в интервале р ± 2о 11 яе менее 88,9% — в интервале р ± За.
Асимметрия
I Третий момент относительно среднего связан с асимметрией ^Распределения и, согласно формуле (2.37), определяется как
р, = Е(х-р;)3. (2.41)
р-ЗО р-20 р-0 р р+а p+Zff р+30 X
p-3ff р-20 р:-0 р р+0 р+20 р+30 X
Рис. 2.20. Площадь под кривой нормального распределения в следующн интервалах: а) |х±сг; б)р±2<т; в)р.±3о.
Вероятность и случайная величина
61
(2.42)
^Используется также формула
г.=£ 1* -1»; )•=14 - Зи>;+а (I*;)’.
вывод которой аналогичен выводу формулы (2.39).
Унимодальное (т. е. одновершинное) распределение с (л3 <0 ямеет левостороннюю (отрицательную) асимметрию, т. е. распределение имеет слева «хвост» (см. рис. 2.19,в). Если [л3 > 0, то распределение имеет правостороннюю (положительную) асимметрию (рис. 2.19,а). Для симметричного распределения (л3=0 (рис. 2.19,6). Величина
1/V — 1'3
Измеряет отношение асимметрии распределения к мере рассеяния. Этот нормированный показатель позволяет сравнивать асимметрию двух распределений, имеющих различный масштаб. Иногда показатель У обозначается ......... -
Ранее было найдено, случайной величины
(2.43)
как «3.
что для экспоненциально распределенной
1
И* = Т
Согласно формуле (2.32),
|x, = £(b-J Л
Используя соотношение (2.42), получаем
'-2(тр тг
[ Положительное значение [л3 (поскольку X > 0) показывает, что ГЙоненциальное распределение имеет правостороннюю симмет-
э. Согласно формуле (2.43),
Таким образом, значение j fh для экспоненциально распределенной случайной величины не зависит от значения параметра
(2.44)
(2.45)
Эксцесс
Четвертый момент относительно среднего связан с остро?/ . шинностью распределения и называется эксцессом. Он определясь , как
ii< = £(x—|»;)’. (2
Можно легко показать, что
и4 = £(х—= 4^;J2.1
Величина
<2.1
Р-2
обозначаемая также через а41 является относительным показате.ъ эксцесса. На рис. 2.21 показаны плотности двух распределен!!,
Рис. 2.21. Сравнение плотностей нормального н равномерного расиреде леиий.
/ — нормальное распределение 2 — раиномерное распределение (3,=1,8).
равномерного, или прямоугольного, и нормального, имеющего колоколообразную форму. Значения 32 для этих двух распределений равны соответственно 1,8 и 3,0. Нормальное распределена часто используется как стандарт, по которому сравнивается островершинность других распределений.
Для экспоненциально распределенной случайной величины
Вероятность и случайная величина
63
^Используя формулу (2.47), получаем
,ц из формулы (2.48)
(2.49)
9/Х-» (1/ху
(2.50)
?2-
Таким образом, значение fi2 для экспоненциально распределенной случайной величины не содержит К и плотность экспоненциального распределения является более островершинной, чем плотность нормального распределения.
Оценка центральных моментов по результатам наблюдений
г Если форма плотности распределения и ее параметры неизвестны, то оценки центральных моментов, обозначаемые через можно вычислить, заменяя в полученных ранее выражениях [*'л на
(*/а) У, где х, (1 = 1,2,— значения п полученных наблю-
дений б. Так,
является оценкой щ, или а2, и часто обозначается как а2.
Это выражение дает так называемую смещенную оценку. Соответствующая формула для несмещенной оценки имеет вид
(2.51а)
Эта формула часто используется вместо (2.51) в качестве оценки Дисперсии. Эмпирическая оценка а находится как квадратный корень нз за либо как квадратный корень из s2.
П Для сгруппированных данных среднее значение в каждой группе представляет все наблюдения этой группы. Некоторые корректирующие Множители, применение которых особенно целесообразно, когда группировка Шных произведена приближенно, рассматриваются и книге Кендалла и й-тюарта [2.8|.
64
Глава 2
Эмпирические оценки моментов [л3 и р.4 имеют вид
Эти уравнения записаны в форме, наиболее удобной для вычпс лений. Однако, если не принять необходимые меры, эти уравнен! могут давать значительные ошибки округления. Поэтому нног.!, целесообразно использовать эквивалентные выражения
т2 = а- —
"»•= ---------
(2.516)
(2.51В!
(2.51 и
(2.51 д)
где х — эмпирическое среднее.
Оценки для ) и обозначаемые соответственно через j bt и Ь», равны
(2.54)
(2.55)
Вероятность и случайная величина 65
1ля иллюстрации вычислим оценки tnz, ma, m4, у bt и Ьг для
1ых, приведенных в табл. 2.4. Имеем
У*,=—0,40, У 4=0,044, У 4 = — 0,005122,
У 4= 0,000661
к п 10.
[Таким образом, используя формулы (2.51) — (2.55), получаем
m=“2^i_IF(_0'40),'a0'0028'
L-O-OO5122 - 3.0.0044 • (-0,04)4-2(—0,04)* = -0,0001122, m4 = °|0^6-1- — 4 (— 0,04) • (- 0,0005122) +
I 4.6 • (—0,04)» (0,0044) —3 • (—0,04)« = 0,00001871,
,/£- _ —0,0001122 = —0,0001122 _ _ q yg
* 1 (0,0028)’/’ 0,000148 ’ ’
. = 0,00001871 _ 0,00001871 = 2 38
2 (0,0028)» 0,00000784
Эти оценки показывают, что данное распределение имеет левостороннюю асимметрию и является менее островершинным, чем нормальное распределение.
2.10. КВАНТИЛИ, ПРОЦЕНТИЛИ И СВЯЗАННЫЕ
С НИМИ ХАРАКТЕРИСТИКИ
I Еще одним способом краткого представления информации о > распределениях является применение квантилей, а-м квантилем является такое значение случайной величины, ниже которого рас-а-'-ПОлагается «-я часть функции распределения. Так, для непрерывной случайной величины с плотностью распределения / (х) а-м кван-|(Илем является такая точка z (а), что
I f(x)dx = a.
(2.56)
52
66
Глава 2
Например, квантиль 0,10, т. е. г (0,10), экспоненциалы!, распределения является решением уравнения
\е-иЛ = 0,10 или 2 = (0,Ю)-—.
S »
Определение квантиля для дискретной случайной величи производится аналогично и отличается лишь тем, что вместо ин ?, . рирования производится суммирование и чаще всего точное ре: ние получить невозможно.
Рис. 2.22. Плотность распределения с указанием квантилей 0,01 н 0,99
Нам уже встречался один квантиль при рассмотрении парамет ров, характеризующих центры распределений; это была медиа: Во многих задачах интерес представляют точки, далеко отстоят от среднего значения, например, такие, как квантили 0,01 или О,'1" (рис. 2.22). Например, квантиль 0,01 распределения времени безог-казной работы равен времени, когда шансы на то, что случайна выбранный элемент выйдет из строя, составляют 1 к 100.
Часто для обозначения квантилей 0,01, 0,02, 0,03 и т. д., вира жаемых в виде процентов, используется термин процентиль. Мы будем часто употреблять этот термин. Аналогично первый дециль соответствует десятому процентилю, второй дециль является двадцатым процентилем и т. д.
Разности между двумя процентилями иногда используются как показатели рассеяния. Так, разность между первым и девятым
Вероятность и случайная величина
Лелями иногда называется междецилееым размахом и является SSs3tc.i«m протяженности распределения. Разнести между зна-наименьшего и наиболгшею наблюдений называется и часто используется как характеристика разброса полученной группы данных.
4 (а 100)-й эмпирический процентиль вычисляется по данным п ИйЬдений как а (л + 1)-е упорядоченное значение. Например, если « = 99. 10 5Й и 95 й процентили являются соответственно значениями (0.05 • 100)-го, т. е. 5-^о. и (0.95 • 100)-го, т. е. 95-го, упорядоченных наблюдений. Часто при этом способе требуется применение интерполяции. Так, если л = 89. то 5-й эмпирический процентиль равен среднему между 4-м и 5-м упорядоченными значениями, а 90-й эмпирический процентиль равен среднему между 85-м и 86-м значениями. Заметим, что этот способ аналогичен рассмотренному ранее правилу нахождения эмпирической медианы.
В гл. 8 показаны методы оценки процентилей при графическом, представлении закона распределения.
2.11. ДВУМЕРНЫЕ И МНОГОМЕРНЫЕ РАСПРЕДЕЛЕНИЯ
Общие понятия
Элемент выборки может быть определен как одномерный или многомерный. Например, при бросании двух игральных костей получаем 36 элементов выборки, каждый типа (результат бросания первой кости, результат бросания второй кости], т. е. множество двумерных случайных величин. Сумма очков является одномерной случайной величиной, определенной на двумерном выборочном Пространстве. За исключением последней части разд. 2.8, до сих пор мы рассматривали лишь одномерные случайные величины.
Однако часто нас интересуют многомерные задачи, когда одновременно рассматриваются две или большее число функций, определенных на одном и том же выборочном пространстве. Мы будем изучать главным образом двумерные задачи, когда рассматриваются Две случайные величины. Более сложные многомерные случаи ДИВСывакпся путем непосредственного обобщения двумерного слу-
Рассмотренный ранее эксперимент с бросанием двух игральных Остей является элементарным примером двумерной случайной величины. В данном случае значения случайной величины иден-•тачны элементам пространства выборок.
Пусть из стандартной колоды случайным образом выбраны 13 арт. Число тузов и число карт червонной масти являются двумя Тайными величинами, определенными на пространстве выборок всех сдач. На промышленном предприятии продукция может
68
Глава 2
иметь электрические, механические либо те и другие дефекты Число отказов каждой категории за неделю является трехмерiIoj случайной величиной.
Многомерные случайные величины могут быть как иепрери,. ними, так и дискретными. При определении оптимального размеру запаса в магазине мужской одежды учитывается рост и полнота клиентов. Перед магазином женского платья стоит более сложна проблема, поскольку обычно для правильной спецификации здесь необходимо задание более двух параметров. При характеристике сплава обычно принимается во внимание ряд его свойств, напри.,;ер растяжение при действии нагрузки, сопротивление удару, сопротивление на разрыв, каждое из которых является случайной величиной.
Как и в случае одномерных случайных величин, с „дискретной многомерной случайной величиной часто связывают распределение, а с непрерывной случайной величиной —плотность распределения. Рассмотрим вначале дискретное распределение.
Совместным распределением двух дискретных случайных величин х и у является выражение р (xz, у), дающее вероятность, свя-। энную со всеми возможными парами значений случайной величины, т. е.
/>(*«, (**-*! 4=»;)
для всех возможных комбинаций xz и у}, где
р(*ц. ДЛЯ всех I, j (2.57)
2 !/,)=!• (2.58)
Функция F (xt, tjj), дающая вероятность того, что первая случайная величина принимает некоторое значение, меньшее или равное х,, а вторая случайная величина принимает значение, меньшее или равное у;, называется интегральной функцией совместного распределения двух случайных величин:
Pfe и «<«/(), (2'59>
Например, при бросании двух игральных костей можно рассматривать следующие две случайные величины:
х — результат первого бросания,
10, если число очков при бросании первой кости меньше, чем при бросании второй кости,
1 в противном случае.
Поскольку бросание двух игральных костей приводит к эксперт менту с 36 равновозможными элементами выборки, совместное
Вероятность и случайная величина
69
Таблица 2.5
Вероятности совместного появления случайных величин х и у в примере бросания двух игральных костей
у— число очков при бросании второй игральной кости1)
число очков при бросании второй игральной кости меньше, чем при бросании первой кости
число очков при бросании второй игральной кости не меньше, чем при бросании первой игральной кости
X — число очков 3 при бросании нерпой игральной кости
4, 2
36
36
36
™ 16, 61
'У.В-Квадратиых скобках показаны элементы выборки, цифры обозначают число очков TgffH Opgcaiiliii первой и второй костей соответственно.
^определение случайных величин х и у, показанное в табл. 2.5 и изображенное на рис. 2.23, находится путем определения доли ..Дементов выборки, связанных с каждой парой значений (xlt yt).
Соответствующая интегральная функция распределения пока:,.,, в табл. 2.6.
Понятия совместных вероятностей и функции совмести 0 распределения для трех и большего числа случайных величии
Рис. 2.23. Плотность совместного распределения случайных величин х и ’ приведенных в табл. 2.5.
совершенно аналогичны. В гл. 4 мы встретимся с важным дискре-1 ным многомерным распределением, называемым мультиномиальным распределением.
Две непрерывные случайные величины х и у имеют плотной: двумерного (или совместного) распределения [(х, у), если для двух пар значений (xn x.J и (ylt у2)
₽(*,<»<*! и »,<»<»,)=( f f(x, u)dxd</. (2.6П
Вероятность и случайная величина
Таблица 2.6 Значения интегральной функции совместного распределения, соответствующей вероятностям из табл. 2.5
у — число очков при бросании второй игральной КОСТИ
0 1
2 3 х — число очков при бро- U саиин первой игральной 4 кости 6 ° 36 1 12 36 36 3 18D 36 36 6 24 36 36 10 30 36 36 15 36 36 36
•) Пример вычисления функции:
21 = 0+-«- + -L 36 36 30
ЗВ
Требования к плотности распределения f(x, у) аналогичны требованиям, задаваемым формулами (2.57) и (2.58) к р(х, у), и имеют вид
(2.62)
f (х, //)>0 для всех хну
J Jf(x, y)dxdy=l.
/Функция двумерного (или совместного) распределения Ывных случайных величин х и у определяется как
F (*‘i. </i) =Р(*< *1 и !/<yi)= jj f(x, y)dxdy.
(2.63)
непре-
(2.64)
72
Глава 2
Аналогичные определения применимы и в более общем случае когда рассматриваются три или большее число случайных величи /
Рассмотрим следующий пример. Фирма гарантирует поставь’ товара в назначенный день, но в течение дня поставка может пр, изойти в любое время. Известно, что определенный клиент требу, чтобы товар был доставлен в день подачи заказа. Пусть х — вре.'и получения товара, выраженное через долю суток, т. е. Ох |. Пусть // — время подачи заказа, также выраженное через до. и, суток, т. е. 0<у<1.
Рис. 2.24. Плотность двумерного распределения f (х,у) времени получения товара х и времени подачи заказа у.
Из прошлого опыта известно, что товар может поступить с равной вероятностью в течение суток в любом из коротких интервалов времени равной длины. Все интервалы времени, в которых происходит подача заказа, также равновозможны. Легко показать что плотность совместного распределения случайных величин х и у равна
/(х, z/)= 1, где 0<х< 1 и 0< z/<l (2.65)
(см. рис. 2.24).
Это двумерное обобщение равномерного, или прямоугольного, распределения, о котором кратко упоминалось в разд. 2.9 и которое более детально будет рассматриваться в гл. 3. Очевидно, что условия (2.62) и (2.63) удовлетворяются.
Теперь можно дать ответ на некоторые вопросы практического характера о вероятностях, связанных с соотношением между вре
Вероятность и случайная величина
менем получения товара и временем подачи заказа. При этом будет Удобно показать на графике область в плоскости (х, у), по которой необходимо проинтегрировать функцию Дх, у).
* Вопрос 2.1. Какова вероятность того, что подача заказа И получение товара произойдут в первой половине дня?
Ответ. Согласно формулам (2.64) и (2.65),
I p(o<x<-i- к 0<(,< -2.) - (' j ldxdy = -L.
(Область, по которой производится интегрирование, изображена на рис. 2.25, а.)
Вопрос 2.2. Какова вероятность того, что заказ поступит после получения товара?
Ответ.
Р(0<х< 1 и г/ >х) = j 1 dydx = -у-
(см. рис. 2.25, б).
I Вопрос 2.3. Какова вероятность того, что заказ поступит не позднее половины суток поем получения товара? (Это исключительно важно знать, если товар скоропортящийся.)
Ответ. Из рис. 2.25, в ясно, что эту задачу необходимо разбить на две части. Таким образом, р(о<»<1 » 1) -
= p(o<x<-i- м х<»<л +-i-) + P(-i-<x<l
= J J jl^-4-+4- = T-
® гл. 3 мы рассмотрим еще одно совместное распределение двух ^чайных величин, а именно двумерное нормальное распределение.
Рис. 2.25. Площадь в плоскости (х. у), по которой необходимо проинтегрировать функцию / (х. у) для получения вероятности того, что: а) поступление товара (х) и подача заказа (у) происходят в первой половине дня; 6) заказ поступает после получения товара; н) заказ поступает в течение половины суток после получения товара.
Вероятность и случайная величина
75
словное распределение компоненты многомерной случайной ичины
^—Иногда бывает задано совместное распределение двух случайных величин, но нас интересует распределение лишь одной из них. Это распределение можно найти, суммируя или интегрируя по той случайной величине, которая нас не интересует. Так, если p(.t,, у;) — совместное распределение двух дискретных случайных величинх и у, то распределение pt(fj случайной величины х находится как
(2.66)
К распределение рг(у^ случайной величины у как = .«,')
(2.67)
К-Аналогично, если х и у — непрерывные случайные величины с плотностью совместного распределения f(x, у), то плотность распределения случайной величины х имеет вид
/iW= J Ж У)^у,
(2.68)
^ Плотность распределения случайной величины у имеет вид
/,(»)= f НА
(2.69)
В более общем случае, когда рассматривается совместное распределение $ случайных величин, можно найти совместное распределение подмножества 1г случайных величин, суммируя или интегрируя по тем случайным величинам, которые нам больше не нужны. Получаемое выражение называется плотностью безусловного распределен и.ч подмножества остальных случайных величин.
В рассмотренном ранее примере бросания двух игральных костей безусловные распределения случайных величия х и у находятся Путем суммирования соответственно по столбцам и строкам данных табл, 2.5. Результаты показаны в табл. 2.7. Заметим, что рг(х) “- вероятность, описывающая результат при бросании одной игральной кости, Ра(у) — вероятность того, что число очков при втором бросании меньше числа очков при первом бросании, т. е. Р?.(0) — вероятность того, что число очков при первом бросании не меньше числа очков при втором бросании, т. е. р3(1).
76
Глава 2
Таблица 2.7
Безусловные вероятности лля случайных величин X и у, вероятности совместного появления которых показаны в табл. 2.5
У
Pt (</)
О 1
5 7
12 12
В задаче о поставке товара плотности распределения времени получения товара и времени подачи заказа имеют вид
/» (х) = f \dy = 1, 0 <х< 1, (2.70)
6 и
Гг(у) = f'ldx=l, (2.71)
соответственно. В гл. 3 будет показано, что (2.70) и (2.71) — одномерные равномерные распределения.
Независимость случайных величин
Ранее в этой главе мы указывали, что вероятность совместного появления двух независимых событий А и В равна произведению вероятностей появления каждого из них в отдельности:
Р(ЛВ) = Р(Л) • Р(В). (2.9)
Две случайные величины являются независимыми в том и только в том случае, если плотность совместного распределения (или вероятность их совместного появления) равна произведению плотностей их безусловного распределения (или безусловных распределений), т. е. случайные величины х и у независимы в том и только в том случае, если
Р (*о «а = Pi W Ра Й,) (272)
Вероятность и случайная величина
77
для всех значений х{ и у} дискретных случайных величин х и у, где p(xi‘ У/'l ~ совместное распределение, pi(xt), р^У/) — безуслов
ные вероятности;
f(x, y) = fl(x)f2(y)
(2.73)
для всех значений непрерывных случайных величин хну, где f(x> У) — плотность совместного распределения; fi(x), [г(х) — плотности распределения.
^Случайные величины х и у, определяемые соотношениями (2.60), не являются независимым!!, так как
P(xf, y^-kPiix^Ptiy,)
для всех значений xt и yf. Например, pj(4) = 1/а
и Ps(O) - •/,„ а
pa, m = . Л
’ 36 6 12
(см. табл. 2.5 и 2.7).
* С другой стороны, в задаче о поставке товаров и подаче заказов хну — независимые случайные величины, поэтому
f(x,y) = l для0<х<1 и 0<z/<l,
Ш = 1 для0<х<1, fz(.y) = l Для0<у<1 и, таким образом,
Е /(*. лая 0<х<1 и 0<(г<1.
Условные распределения
В разд. 2.5 мы рассматривали зависимые события и ввели понятие условной вероятности. В частности, мы нашли соотношение
Р(в|Л)=гт, (2,12)
где Р(В|Д) — вероятность появления события В при условии появления события А.
При рассмотрении зависимых случайных величин аналогичным НЮнятием является условное распределение. Пусть хну — две ^дискретные случайные величины, имеющие совместное распределение р(х(, z/7). Тогда условнее распределение случайной величины У (при данном значениях), обозначаемое как р(у, |Х(), будет равно распределению случайной величины у, когда известно, что случай
78
Глава 2
ная величина х принимает значение х,. Используя соотношение (2.12), получаем
где Р1(л) — безусловное распределение случайной величины .г Если же х и у — непрерывные случайные величины, то плотносп: условного распределения случайной величины у при данном значении х имеет вид
Stol*)-V7-T- (2'
/1W
Совместное условное распределение s—k случайных величин при заданных значениях остальных k случайных величин определяете! аналогичным образом.
Вернемся к примеру бросания двух игральных костей, гд«-рассматривались две случайные величины х и у, заданные соотношением (2.60). Пусть известно, что при бросании первой игральной кости выпадают два очка, т. е. х,= 2. Из табл. 2.7 находим ля-4-
Используя выражение (2.74), получаем, что условное распределе ние случайной величины у при данном значении х(= 2 имеет ви;
юч Р(2. У/)
P»z|2>- —175— '
Из табл. 2.5 находим
Л(2.0)=^
₽(2. >-£•
Следовательно,
р(0|2) = -^-= 3-' 1 ' 1/в 6
Р(1|2) = ^-^ А. 1 ' 1/6 6
Таким образом, после того как при первом бросании выпадет два очка, вероятность того, что при втором бросании выпадет меньшее число очков, равна ’/в, а вероятность выпадения такого
Вероятность и случайная величина 79
we или большего числа очков равна 6/в. К этому результату можно прийти более непосредственно с помощью методов, рассмотренных ранее в дайной главе.
ИИаметнм, что если х и у — независимые случайные величины, ф условное распределение (или плотность условного распределения) случайной величины у при данном значении х равна Двуслойной вероятности (или плотности безусловного распределения) случайной величины у, т. е.
для Дискретных случайных величин и
g(a\*)-Mu)
дЛя непрерывных случайных величин. Эти выражения аналогичны приведенным нами ранее определениям независимых событий (см. разд. 2.3).
Характеристики многомерных распределений
Д Математические ожидания могут быть также определены и для .многомерных случайных величин. В частности, когда h(x, у) — функция случайных величин х и у,
E[h(x,y)]= J f Л(х, y)f(x, y)dxdy, (2.76а)
если х и у — непрерывные случайные величины с плотностью совместного распределения /(х, у), и
£ [Л (». Й] = V £ * »/> Р <'> (276б>
если хну — дискретные случайные величины с совместным распределением р(х;, у).
I В простейшем случае, когда й(х, у) = х, эти формулы принимают вид
£(*)- f I хЦх, д') dxilц - | g}dgdx =
•80
Глава 2
для непрерывных случайных величин и
Е (х) = V 2 Х1Р <*"' »/) = 2 *' 2 р =
II II
= 2i<PiW
(2.7;. ।
для дискретных случайных величин. Эти результаты совпади с соотношениями (2.28).
Проверим теперь справедливость соотношений (2.36) и (2.3(;„j для двух непрерывных случайных величин х и у с плотностью совместного распределения f(x, у).
Возьмем вначале А(х, у) = х 4- у. Тогда
£(* + »)= J + y)dxdy =
J *f (X, у) dxdy + I J yf(x, y)dxdy = E(x) + E(y).
Пусть теперь h(x, у) = бр: 4- b2y. Тогда
(•". .«)] = f J CV + М f (Л !/) dxdy =
= j f b,xf(x, у) dxdy + J J bj (x, y) ydxdy = = 4,E(x) + 6aEfo).
Вывод соотношений для дискретных случайных величин про изводится аналогично, с тем лишь отличием, что интегралы заменяются суммами.
Выражения (2.76) и (2.77) можно обобщить на случай, ког. • число случайных величин больше двух. Полученные выражения можно использовать для установления соотношений, аналогиям! (2.36) и (2.36а), для произвольного числа случайных величии
Заметим, что если х и у — независимые случайные величины то
£(х//) = £(х) £(«?). (2.78)
Используя соотношения (2.73), (2.76) и (2.77), для непрерывны^ случайных величин получаем
t
Вероятность и случайная величина
81
£(№)-] j *Ul HIdxdl/ - J I 4//iW fMdxdy =
— co —CO —00 —co
1“ j xhWdx f sfMdU-E(x}E(.u),
еда приняты те же обозначения, что и ранее. Аналогичный результат можно получить для двух независимых дискретных случайных величин.
^Параметром, аналогичным дисперсии в одномерном случае, Цвлястся ковариация между двумя случайными величинами хну
Cov(x, //) = Е|[х-Е(х)][0-Е(у)]|, (2.79)
Или
Cov(x, у) = Е(х у) — Е(х)Е(у). (2.79а)
Заметим, что если х и у — независимые случайные величины, то
Cov (х, у) = Е (х) Е(у) - Е(х) Е (у) = 0. (2.80)
В Нормированным показателем линейного соотношения между двумя случайными величинами является коэффициент корреляции
. ~ Соу(*' У) = С(”(х. У) (2 81)
Н»(х)в»(Г)Г'» 3(х)а(!/) '
.Разделив ковариацию на среднее квадратическое отклонение каждой из случайных величин, получаем безразмерную величину. При р — 1,0 случайные величины полностью положительно корродированы, т. е. у х kx 4- с, где k и с — постоянные. Если р = —1, то «случайные величины полностью отрицательно коррелированы, т. е. у' —kx 4* с. Если р = О, то говорят, что случайные величины
3,0г
” М
: •••
. f О Г.‘‘‘•‘Г________
до -ал •-i.il "I •'-° й*
.-’4.. '
•2,0|-
•4flL
10b
-3,0 -Z.0\-l,0
-1,0
-3.0L
6
Рн с, 2.26. Данные наблюдений, полученные когда значение г близко к нулю. '4—52
3,0
з,ог
=”2,0
1,0
-3,0 -2,0 -1,0 / г-1,0
-2,0-
-3,oL
-3,0L
а
3,0
=» 2,0 - .
3,0
=”2,0 1.0
-3,0 -2,0 -1,0, . 1,0 '2,0 3.0
.. .’А»- X
1-
. ^2,0
*' . '-°
Рис. 2.27. Данные наблюдений, полученные при: а) г=1,0;б) г-= — 1.". в) г=0,9; г) г=0,66; д) г=0,33.
Вероятность и случайная величина
,(х1 — х) (ill— у)
Часто р обозначается также через г.
г результаты наблюдений при коэффициенте корреляции.
^Ьуррел и рованы. Оценка коэффициента корреляции р по п парам наблюдений (х„ у,), (х„ ....(х„, уп) определяется следующим
(2.82)
____________________________, , , I, близком К нулю, показаны на рис. 2.26, а и б. Последний рисунок иллюстрирует тот факт, что коэффициент корреляции измеряет лишь линейное соотношение между двумя величинами. Хотя независимость КЙучайных величин означает отсутствие корреляции, обратное утверждение не справедливо. На рис. 2.27, а, б, в, г и д представлены данные с коэффициентом корреляции, равным соответственно 1 + 1,0, -1,0, +0,9. +0,66 и +0,33.
212. ДИСПЕРСИЯ ЛИНЕЙНОЙ ФУНКЦИИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
f Часто бывает необходимо получить дисперсию функции одной или большего числа случайных величин, нс находя распределение самой функции. Приближенные методы вычисления дисперсии функции случайных величин приводятся в гл. 7. В этом разделе мы дадим «очный результат для линейной функции.
Пусть xt, х,.х„ — п случайных величин с математическими
^^Ккдаяиями £(Xj), Е(х2)..... Е(хп), дисперсиями a2(xi), o3(xj), ...
(L*aS(x„) и ковариацией Cov (х(. xz). Тогда дисперсия линейной функции этих случайных величин будет иметь вид
(ху) + 2 V Vfe^yCovCx,-, xj), (2.83)
.... Ьп — постоянные.
84
Глава 2
Используя формулы (2.35), (2.39) и (2.79а), докажем, что Jl;| соотношение справедливо и для двух случайных величин:
°2 (ь А + ^г*г) = Е (Mi + Ма)* — [£ (Mi + М2)р =
= В, (й 4 + !>i xl + 2», МА) - [М (*,) + ЬгЕ (хг)]> =
= ь?1«(х!)- [е(х,)]’| + й:|£(хй-[г(х>)]’1+-
+ 2Z>,62 [£ (xtx2) — Е (жх) Е (х2)] =
= &)а2 (л'1) -}- dla2(x2)4-2i»ACov(x1, хг).
Справедливость соотношения (2.83) для линейной функции п случайных величин вытекает непосредственно из соотношения для функции двух случайных величин.
Полученный результат можно использовать в примере о выходе из строя оборудования, рассмотренном в конце разд. 2.8, для нахождения дисперсии общих затрат, полагая, что дисперсии и ковариации для размера штрафа за простой оборудования, стоимосн. материала и стоимости трудозатрат известны.
Заметим, что если п случайных величин некоррелированы, то формула (2.83) принимает вид
(2.84)
Рассмотрим некоторые частные случаи формулы (2.83), соответствующие соотношениям (2.34) — (2.36) для математического ожидания:
<з2(с) = О, (2.85)
где с — постоянная,
а2 (сх) = с2о2 (х)
(2.86)
( У Xj К. У (х;) + 2 У VCov (х„ х,). (2.87)
Теперь перейдем к детальному рассмотрению конкретных распределений.
Вероятность и случайная величина
ЛИТЕРАТУРА
Ми pel । е r W., Ап Introduction to Probability Theory and Its Applica-B" Hon. John Wiley, New York. 1957. Имеется русский перевод: 'Фел-К лер В., Введение в теорию вероятностей и ее приложения, т. Г, 2-е И. Изд., изд-во «Мир», 1964.
•2:2. РиггёпЕ.. Modern Probability Theory and Its Applications, John Wiley, New York, 1960.
И± M о о d A. M., G г a у b i I I F.. Introduction to the Theory of Statis-s* lies, McGraw-Hill, New York, 1963.
И». H 0 e 1 P. G,, Introduction, to Mathematical Statistics, 2nd ed., John . '.Wiley, New York. 1962.
2.5t Hog g R. V., Cr a i g A. T., Introduction to Mathematical Statls-K tics, 2nd ed., Macmillan, New York, 1965.
2;6k Li n d 1 e у D. V., Introduction to Probability and Statistics froma Baye- siaii Viewpoint, I—2. Cambridge University Press, Cambridge, 1965. 2,7. S c h I a i f e r R., Probability and Statistics for Business Decisions, McGraw-Hill, New York. 1959.
Kg n d n I 1 M. G., St u a r t A., The Advanced Theory of Statistics, у. 1. Distribution Theory, Hafner Publishing Co., New York. 1958.
Ь Имеется русский перевод: Кендалл М., Стьюарт А., Теория ' распределений, изд-во «Наука», 1966.
Глава 3
НЕПРЕРЫВНЫЕ РАСПРЕДЕЛЕНИЯ
В этой главе изучаются распределения непрерывных случаи ных величин, используемые для описания реальных процессов явлений, встречающихся в технике. В гл. 4 рассматриваются распределения дискретных случайных величин.
Наиболее известной статистической моделью является норма.п иое, или гауссово, распределение. Мы рассмотрим применен;: этого распределения как для одномерного, так и двумерного сл\ чаев. Однако многие явления не могут быть достаточно точно описаны с помощью нормального распределения. Поэтому вводите еще две общие статистические модели: гамма-распределение и бета распределение. Рассматриваются также некоторые частные случаи распределение Эрланга, распределение хи-квадрат, экспонент! алыюе, равномерное, треугольное и параболическое.
Затем описываются три распределения, тесно связанные < нормальным: логарифмически нормальное, релеевское н распре деление Коши. Далее рассматриваются распределения, используя мые для описания времени безотказной работы компонентов : систем. Сюда относятся некоторые из упомянутых ранее статистических моделей, а также распределение Вейбулла и распределение экстремальных значений типа!. Глава завершается сводными таблицами, где показаны форма и применение непрерывных распре делений, и, кроме того, приводятся их математические ожидания, дисперсии, а также третий и четвертый нормированные момент:
(г 57 « ?,)
Выбор распределения, описывающего физическую систему, обычно диктуется пониманием характера рассматриваемого явле ння и проверяется с помощью имеющихся экспериментальных данных. После того как статистическая модель выбрана, необходимо определить ее параметры. Мы будем рассматривать непрерывные распределения, имеющие три вида параметров, определяющих соответственно центр распределения, его масштаб и форму. Для обоз качения параметров, характеризующих центр распределения, используется греческая буква [л, параметры масштаба обозначаются символами а и К, а параметры формы — символами и ).. Не все распределения содержат каждый из этих параметров. Например, нормальное распределение не имеет параметра формы, а у бета-
Непрерывные распределения
^Определения два таких параметра. Для некоторых распределений приводятся методы оценки параметров по имеющимся экспериментальным данным. Проверки адекватности выбранной статистической модели рассматриваются в гл. 8. В гл. 6 изучаются эмпирические распределения, которые иногда используются для предоставления данных, когда нет реальных оснований для применения одной из моделей, рассматриваемых в данной главе.
3.1, НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
Характер модели
Неформальное (или гауссово) распределение — наиболее часто ^используемая статистическая модель. Плотность нормального распределения имеет вид
f (х- ft ») = —у=. exp [------,И)*1
а )/2к L J
(3.1)
— ОО < х <С ОО , — оо < (Л < оо , о > О,
где р ио — соответственно параметры, характеризующие центр распределения и его масштаб.
I Согласно формуле (2.28), среднее значение, или математическое ожидание, нормального распределения равно
£(») = J*/(* ft J X ехр ]dx ft (3.2)
** о,г
о\^._____।-1 Xj
-4.0 -3.0 -2.0 -1,0 0 1,0 2,0 3.0 4,0
"С. 3.1. Нормальные распределения с различными значениями «и одинаковыми значениями о.
^алогично из соотношения (2.38) или (2.39) находим, что дис-И»?СНЯ ноРмалыюго распределения равна оа. Так™ образом, сред-ВС Квадратическое отклонение случайной величины х равно з
88
Глава Я
Следовательно, два параметра нормального распределения ч. , о являются соответственно математическим ожиданием и средни : квадратическим отклонением. На рис. 3.1 показаны нормальные распределения с различными значениями р. и одинаковыми значениями а, а на рис. 3.2 — нормальные распределения с различными I значениями о и одинаковыми значениями р. Все нормальные распределения симметричны и имеют одинаковую форму, т. е. это ра< ' пределение не имеет параметра формы. Поэтому показатель асимметрии рз равен нулю независимо от значений р н а, в чем можг
Рис. 3.2. Нормальные распределения с различными ей одинаковыми р.
убедиться с помощью формулы (2.42). Как указывалось в гл. 2. все нормальные распределения имеют безразмерный показатель эксцесса р, равный 3.
Согласно формуле (2.25), интегральная функция нормальною распределения имеет вид
Ffor; В. »)= f —^expl—(3.31
-со ° V-~ L 25 а
Это выражение показывает вероятность того, что случайно выбранное значение из нормально распределенной совокупности с параметрами |i н о меньше х, или, что то же самое, оно дает долю наблюдений в совокупное™ со значениями, меньшими х.
Непрерывные распределения
89
^уравнение (3.3) можно решить приближенными методами. Ре-Е,пьтяты могут быть представлены в виде таблицы значений при Калийных р и з, однако нам нужна лишь таблица значений инте-Вральной функции нормального распределения F(x) при р= 0 и lB U 1 (см. табл. 1 в конце книги). Эту таблицу можно использовать тля вычисления интегральной функции нормального распределения ЕГдюбыми ;i и з, поскольку, как будет показано в гл. 5, если х — формально распределенная случайная величина с произвольными I» и з, то случайная величина ,
(3.4)
’распределена по нормальному закону с р = О и о= 1. Случайная величина у называется нормированной нормально распределенной случайной величиной.
Е Таблицы дают значения функции F(y, 0, 1) только для первой части распределения, т. е. для у^-0. Соответствующие значения для </<0 находятся исходя из симметрии нормального распределения с помощью соотношения
F(— У, О, 1)=1-F(//; 0, 1).
(3.5)
Например, из табл. I находим, что вероятность того, что у меньше 2,5, т. е. F(+ 2,5; 0, 1). равна 0,9938. Следовательно, согласно ^соотношению (3.5),
F(—2,5; 0, 1) = 1 —0,9938 = 0,0062.
Использование этой таблицы проиллюстрируем на следующем примере. Техническими условиями задано, что длина некоторой детали должна лежать между 24 и 25 см. Если длина детали — нормально распределенная случайная величина с р. = 24,6 см из 0,4 см, то какая доля изготовленных на заводе деталей будет иметь длину, Выходящую за пределы, заданные техническими условиями?
Использование формулы (3.4) сводит эту задачу к нахождению вероятности того, что нормированная нормально распределенная Случайная величина с (л = 0 из = I превысит значение (25,0— ~~24,6)/0,4 = 1 или будет меньше (24,0 — 24,6)/0,4 = —1,5 (Рис. 3.3). Из табл. I находим, что F(l,0; 0,1) = 0,841. Это вероятность того, что значение нормированной случайной величины ока-*кется меньше 1,0. Поэтому вероятность того,что ее значение пре-1,0, равна 1 — 0,841 = 0,159. Аналогично F( 1,5; 1,0) = 0,933. гдаатем с помощью соотношения (3.5) находим
Г (—1,5; 0, 1) = 1 —0,933 = 0,067.
90
Это вероятность того, что значение нормированной случайной величины будет ниже —1,5. Следовательно, если рассматривать большую партию, то 15,9% деталей будут иметь длину выше, а 6,7% — ниже пределов, заданных техническими условиями, и в среднем 22,6% деталей будут иметь размеры, выходящие за допустимые пределы.
Р н с. 3.3. Площади под выбранными участками кривой нормального распределения с параметрами ;>=24,6 и а=0,4 и соответствующими участками под кривой нормированного нормального распределения. (Из книги Ch е s t n u I H., Systems Engineering Tools. John Wiley, New York, 1965.)
I —6.7% площади.под кривой; 2— 15,9% площади под кривой
Таблица значений интегральной функции нормального распределения может использоваться для проверки справедливости сделанных в гл. 2 утверждений, что в интервалах [л±о, p.±2s и [*±3о расположено соответственно 68,5; 95,5 и 99,7% площади под кривой нормального распределения. Например, шансы на то, что выбранная случайным образом нормально распределенная случайная величина окажется в интервале р.±3з, составляют 997 к 1000 (см. рис. 2.20).
Непрерывные распределения
91
Адекватность нормального распределения как физической модели
Нормальное распределение используется наиболее часто. Долгое время его важность переоценивалась вследствие ошибочного представления о том, будто оно является основным распределением в природе и что, согласно теории ошибок, нормальному закону подчиняются все измерения. В начале XX в. с помощью статистического анализа испытаний было показано, что это допущение не является справедливым во всех случаях.
Теоретическим обоснованней роли нормального распределения является центральная предельная теорема"—один из наиболее важных результатов математической статистики. Согласно этой теореме, распределение среднего п независимых случайных величин, распределенных по любому закону или даже имеющих до п различных распределений с конечными математическим ожиданием и дисперсией, при увеличении числа наблюдений в выборке (т. е. когда п стремится к бесконечности) приближается к нормальному. Этот результат справедлив независимо от того, по какому закону распределена каждая из п случайных величин, среднее которых рассматривается.
Хотя центральная предельная теорема связана с большими выборками, распределение выборочного среднего стремится к нормальному даже при относительно небольших значениях п, если значение дисперсии какого-либо элемента или небольшой группы элементов не является преобладающим и распределение элементов не слишком Отклоняется от нормального.
Центральная предельная теорема используется для получения случайных чисел, распределенных по нормальному закону. В одной из таких схем производится усреднение семи равномерно распределенных случайных величин, т. е. семи случайных выборок из равномерно распределенной совокупности (см. разд. 3.3), чтобы получить случайную величину, имеющую почти нормальное распределение. Применение центральной предельной теоремы иллюстрируется в гл. 7 на примере, где рассматривается общее время, необходимое для обслуживания системы при проверке ее на нескольких пунктах.
Когда случайная величина представляет собой общий результат большого числа независимых «небольших» воздействий, то, согласно центральной предельной теореме, можно ожидать, что эта случайная величина будет распределена по нормальному закону. Кроме того, эмпирические результаты свидетельствуют о том, что нормальный закон удовлетворительно описывает многие реальные случайные
I) Точнее одна из центральных предельных теорем, поскольку в математической статистике известно несколько таких теорем.
92
Глава 3
величины. Примерами могут служите измерения, проводимые на живых организмах, скорость движения молекул в газе, число баллов при проверке умственных способностей, средняя температура воздуха в данном районе, уровень случайных шумов в электрическом цепи. Инструментальные ошибки также часто имеют нормальное распределение относительно истинного значения либо относительно некоторой средней систематической ошибки. Во многих задачах нормальное распределение имеет то преимущество, что его легко выразить математически. Многие методы статистического вывода, например дисперсионный анализ, разработаны при допущении, что рассматриваемые данные имеют нормальное распределение.
Вследствие широкой распространенности нормального распределения и, возможно, благодаря его названию иногда полагают, что случайная величина имеет нормальное распределение, если не доказано обратное утверждение. Следует ясно представлять себе, что многие случайные величины нельзя рассматривать как результат воздействия большого числа мелких факторов и, следовательно, нет теоретических оснований омсидать появления нормального распределения. Возможно такое положение, когда будет преобладать какой-либо один эффект, не подчиняющийся нормальному закону.
Область изменения нормально распределенной случайной величины лежит в интервале от минус бесконечности до плюс бесконечности. Однако большинство реальных величии имеют верхний или нижний предел, а иногда и оба1'. Это обстоятельство не мешает использовать нормальное распределение для описания такой случайной величины, как рост взрослого человека, где среднее отстоит от нуля на большое число средних квадратических отклонений и ошибка принятия в качестве пределов ±оо пренебрежимо мала. Однако существуют другие случайные величины, для которых обычным является группирование значений вблизи некоторого физического предела, например выпуск продукции в процентах на некотором предприятии или время безотказной работы системы. В таких случаях нормальный закон или какое-либо иное симметричное распределение не подходит. Наконец, следует указать, что для некоторых случайных величин нормальное распределение дает приемлемую аппроксимацию в центре, но не подходит для значений, лежащих в одной или в обеих областях больших отклонений.
Погрешность вследствие ошибочно принятого допущения о нормальности распределения будет различной в каждом конкретном
О В некоторых приложениях встречается так называемое усеченное нормальное распределение, т. е. нормальное распределение, в котором отсутствует один или оба «хвоста» распределения. Такая модель применима, например, к выборке из нормально распределенной совокупности, из которой первоначально были изъяты все элементы, имеющие значения, большие и (или) меньшие некоторых заданных предельных значений. Более подробно этот вопрос освещен в книгах Джонсона и Леона [3.491 и Хальда [3.521.
Непрерывные распределения
93
случае. Многие статистические методы, разработанные при этом допущении, остаются справедливыми в случае умеренных отклонении; говорят, что эти методы являются устойчивыми. Примером метода, который является устойчивым при отклонениях распределения от нормального, может служить дисперсионный анализ. В то же время, если допущение о нормальности распределения ошибочно используется в таких задачах, как определение процента продукции выше или ниже некоторого расчетного предельного значения, лежащего в области больших отклонений от среднего, то могут возникать серьезные ошибки.
Оценка параметров нормального распределения и доверительный интервал для
[ Во многих задачах ц и о неизвестны и должны оцениваться на основе имеющихся экспериментальных данных. В случае нормального распределения параметр р. — среднее совокупности. Для оценки pt можно использовать формулу (2.31):
. _ 2*
р = ж = -^-, (2.31)
где х, (1=1, 2, .... и) — значения п отсчетов, а крышка над [л означает, что берется оценка.
Параметр с является средним квадратическим отклонением нормального распределения. С помощью формулы (2.51) находим оценку дисперсии:
или, используя формулу (2.51а), получаем
(3.7)
По теоретическим соображениям (см. гл. 2) формула (3.7) используется чаще, чем формула (3.6). При больших п безразлично, какое из этих выражений использовать.
Еще один графический метод получения оценок для и и а дается в гл. 8 при рассмотрении вопроса о графическом представлении вероятностей.
94
Глава ?
Эмпирическое среднее X является случайной величиной, дисперсия которой зависит от числа наблюдений п и дисперсии совокупности, оценка которой равна s2. Показатель точности х как оценку неизвестного параметра р можно получить с помощью доверительного интервала. Точное определение (1—я)- 100%-ного доверительного интервала для [л состоит в следующем: «Если при выполнении большого числа повторяющихся экспериментов будет получен такой же интервал, что и вычисленный, то, рассматривая большой промежуток времени, в (1—х)-100% случаев мы будем правы, утверждая, что [х находится в этом интервале (и в 100а% случаев ошибемся)». К сожалению, такое утверждение иногда бывает трудно понять нематематику, и его сложно объяснить на практике. Поэтому(1 — я)- 100%-ный доверительный интервал мы будем рассматривать как область, в которой с гарантией (1 - а)-100% находится истинное значение параметра, признавая при этом, что такое определение является весьма вольным по сравнению со строгим классическим определением (поскольку обычно истинное значение параметра не считается случайной величиной). Наиболее часто используются такие значения 1 — а: 0,90; 0,95 и 0,99. Эти значения называются доверительными уровнями, соответствующими интервалу.
Вернемся к вопросу определения точности нашей оценки параметра р. нормального распределения. Доверительный интервал для р. вычисляется как
(3.8)
где х и s определяются по п наблюдениям с помощью формул (2.31) и (3.7) соответственно, и где /ду, ,1_1 находится из табл. II, приведенной в конце книги, при различных значениях я—1 для доверительных уровней: ДУ = 1 — я = 0,90; 0,95 и 0,99". Проиллюстрируем этот метод на следующем примере.
Пусть определяется вязкость девяти случайным образом выбранных опытных образцов матерела. На основе имеющихся данных вычисляется среднее значение х = 10 и среднее квадратическое отклонение s — 2. Полагая, что вязкость — нормально распределенная случайная величина, определим доверительный интервал для неизвестного истинного среднего р.
Обращаясь к табл. II, при п — 1 =8 и доверительном уровне ДУ = 1 — я = 0,95, получаем /ду,п_| - й,®;8 = 2,31. С помощью формулы (3.8) находим доверительный интервал 104:2,31(2/» 9).
" Эти значения находятся с помощью процентилей /-распределения Стьюдснта (см. гл. 6).
Непрерывные распределения
95
Таким образом, получен 95%-ный доверительный интервал (8,46; 11,54), т. е. мы на 95% уверены в том, что значение р находится ' между 8,46 и 11,54. Чтобы получить более узкие пределы, необходимы дополнительные данные.
I Если нас интересует только нижний предел хн (т. е. значение, ниже которого с вероятностью (1 —а) -100% не может находиться I истинное значение среднего) или верхний предел Хв, то соответствую-I щие формулы имеют вид
Т„ = *-(5да.^,) (3.9)
]/ п
И
+ (/ду, (3.10)
у л
где значения Гду,я_| берутся из табл. III, помещенной в конце ккниги, для различных значений п— 1 и доверительных уровней ' ДУ = 1 —а = 0,90; 0,95 и 0,99. Таким образом, формулы (3.9) и (3,10) позволяют получить интервалы, расположенные по одну .сторону от среднего, в отличие от двустороннего интервала, опре-I деляемого по формуле (3.8).
В предыдущем примере из табл. Ill находим, что = I = 1,86. Следовательно, согласно формуле (3.9), 95%-ный нижний доверительный предел для р равен 10—1,86 (2/j 9), т. е. односторонний 95%-ный доверительный интервал имеет вид (8,76,со). Таким образом, мы на 95% уверены в том, что р. не меньше 8,76. Аналогичным образом находим, что 95%-ный еерхнйй доверительный предел для р, определяемый по формуле (3.10), равен 11,24, 'Откуда получаем односторонний 95%-ный доверительный интервал КЙ-со. 11,24).
Мы не будем показывать, как производится вычисление доверительных интервалов для всех распределений, рассматриваемых в данной и следующей главах, а остановимся лишь на простых, наиболее важных случаях1). Эти вопросы подробно и более строго рассматриваются в учебниках по математической статистике 13.11 — Предыдущее изложение было посвящено интервалу, содержащему информацию о некотором параметре. Например, в задаче о вязкости мы были на 95% уверены в том, что истинное значение Iх заключено между 8,46 и 11,54. Ясно, что это не то же самое, что 95% наблюдений совокупности расположено в этом интервале. Действительно, как можно видеть из выражения (3.8), интервал
) Например, мы не показываем, каким образом найти доверительный Интервал дли параметра о нормального распределения.
96
для |л можно сделать сколь угодно малым при достаточном увеличении объема выборки. Таким образом, возросшую точность информации о параметре не следует смешивать с улучшением качества продукции. При получении большего числа данных о вязкости уточняется оценка средней вязкости, но распределение вязкости остается таким же. Интервал, в котором с заданной вероятностью находится не менее определенной доли элементов совокупности, называется статистическим толерантным интервалом. Таблицы коэффициентов для вычисления таких интервалов в случае нормального распределения на основе х их, вычисленных по п наблюдениям, приводятся в книгах Диксона и Массе 13.51 и Оуэна [3.501. В разд. 3.3 рассматривается способ получения толерантного интервала, когда не принимается допущений о форме распределения рассматриваемой совокупности.
Полунормальное распределение
В некоторых приложениях рассматриваются нормально распределенные случайные величины, для которых известны лишь абсолютные значения отклонений относительно среднего. С помощью методов, рассматриваемых в гл. 5, можно показать, что в этом случае получаем так называемое полунормальное распределение'', плотность которого имеет вид
/И «) = [ »>о. «>о, (310а)
I 0 в противном случае,
где з — параметр масштаба, который, однако, не равен среднему квадратическому отклонению. Плотность этого распределения показана на рис. 3.4.
Типичной иллюстрацией применения полунормалыюго распределения может служить следующий пример. Маховое колесо двигателя состоит из двух одинаковых деталей. Важно, чтобы эти детали имели примерно одинаковый вес, с тем чтобы колесо было сбалансировано. Таким образом, необходимо знать распределение разности в весе этих двух деталей. Поскольку эти детали подбираются произвольно, фиксируется лишь разность их весов. Если веса первоначально выбранных колес распределены по нормальному закону, то абсолютное значение разности в весе имеет полу-нормальное распределение.
Другие примеры использования полу нормального распределения, а также таблицы значений интегральной функции распреде-
I) В отечественной литературе а этом случае принято говорить о распределении существенно положительных величин.— Прим. ред.
Непрерывные распределения
97
гения и методы оценки параметров приводятся в статье Леона, Нелина и Ноттингхэма [3.511. В этой работе рассматривается более >бщее так называемое свернутое нормальное распределение, при фтором зафиксированные отклонения возникают относительно
.некоторой произвольной точки, а не относительно среднего значе-v ння первоначального распределения. Это приводит к наложению f «хвоста» кривой первоначального распределения на остальную часть у 'распределения. Свернутое нормальное распределение получим, если в предыдущей задаче две детали, разность веса которых нас ^интересует. будут иметь нормальное распределение с различными математическими ожиданиями.
Двумерное нормальное распределение
Обобщение одномерного нормального распределения на много-- мерный случай называется многомерным нормальным распределением и часто используется для описания совместного поведения Двух или большего числа случайных величин. Детальное рассмот-L рейне этого распределения выходит за рамки нашей книги. Читатель, । интересующийся этим вопросом, отсылается к книге Андерсона
98
Рис. 3.5. Двумерное нормальное распределение. (Из книги Хальда А. Математическая статистика с техническими приложениями, ИЛ, 1956.)
[3.461. Ниже приводится краткое описание двумерного нормального распределения.
Плотность двумерного распределения случайных величин ,г и у имеет вид
f(x, у; |AV, |Лу, ал, ау, р) = [4п2а; 0.^(1— р2)]"7* X
— — оо<[1у<оо, Од.>0, 3 >0,
-1<Р<1. (3.106)
Двумерное нормальное распределение показано па рис. 3.5. Параметры рл., ,и.?, ал, ау и р имеют следующий смысл. Согласно формулам (3.2) и (3.2 а), математическое ожидание и дисперсия случайной величины, имеющей одномерное нормальное распределение, равны соответственно |л и о2. Еслих и у — случайные величины, совместно
Непрерывные распределения
99
^распределенные по двумерному нормальному закону, то [л, и ау — Еатематические ожидания этих двух случайных величин. Исполь-№гя формулу (2.77), получаем .
£й= j J х/ (д, »; ft,. р) вхЛц = ц.
Е (ft) = J j Ilf (X, у ft,,’ я,, я,, ft) dxdy = ft,.
Ьалогично н — дисперсии случайных величин х и у. Неволь-»уя формулу (2.76), получаем
о=(х) = £|[х-адп=
I = J j (х—ftj’ffx. у; ft,, I»,. ft) dxdy-=s>
J f (ft — ft,)2 / (x. У. ft,, ft,, o,, ft) dxdy
Можно также показать, что ковариация между х и у [см. формулу В (2.79)1 равна
Cov (х, у) = рздау
и, таким образом,
р ._ Cov (х, у)
Му
тде р — коэффициент корреляции между случайными величинами х и у [см. формулу (2.81) I, показывающий соотношение между этими двумя случайными величинами.
~ При р = 0 формулу (3.106) можно записать как
f (х< У, !*х. а.,., Оу, 0) =
“ '’«р [- V ('xLt)’]) X
х {(fee; г exp Г—L- ((х: ft,. ’,) /, to ft,. »,)•
100
Глава 3
Здесь 1*х, st) и f2(y; |ху, ау) — плотности одномерного нормального распределения. Таким образом, если х и у — случайные величины, имеющие двумерное нормальное распределение с коэффициентом корреляции р = 0, то плотность их совместного распределения равна произведению плотностей безусловного распределения каждой из этих случайных величин. Случайные величины х и у независимы в том и только в том случае, если р - 0. Следовательно, для нормального распределения отсутствие корреляции означает независимость случайных величия. Как указывалось в гл. 2, в общем случае отсутствие корреляции не означает независимости совместно распределенных случайных величин.
Параметры |ал. и ях можно оценить по результатам наблюдений, используя формулы (2.31) и (3.7). Аналогично, используя наблюденные значения у, находят [А}, и з}1. Для оценки р обычно применяется формула (2.82).
Совместное распределение роста и веса людей, распределение координат х и у пробоин в мишени и распределение действительной и мнимой составляющих суммы электрических импедансов — вот несколько примеров практического применения двумерного нормального распределения.
Вероятности, связанные со случайными величинами, имеющими двумерное нормальное распределение, можно найти с помощью соответствующих таблиц. Например, может потребоваться определить следующие величины:
1. Значение I—а, удовлетворяющее соотношению
Р + - 1-«
при заданных значениях bt, Ь2н к. Это вероятность того, что значение, случайным образом выбранное из совокупности, имеющей данное двумерное нормальное распределение, будет находиться внутри заданного эллипса с центром в точке (|xv, |xv), лежащего в плоскости X, у.
2. Значение k, дающее такой эллипс, что P|[Z»i(x — [лх)2---г b2(y—(*у)21 k = 1 — а| для данных значений Z>t и Ь2, где I — а. равно 0,50; 0,75; 0,90 или 0,99. Это дает эллипс с центром и точке ([Аг, ру), и с определенной вероятностью можно утверждать, что произвольно выбранное значение случайной величины, имеющей заданное двумерное нормальное распределение, будет находиться внутри данного эллипса.
Таблицы дляэтих двух случаев приводятся в книге Оуэна 13.5011
1) При = />«а| = 1 и р = 0 применимы более простые методы, поскольку в этом частном случае величина ЬДх — p.x)2-f- Л3(у |*у)’ имеет распределение хи-квадрат с двумя степенями свободы; этот вопрос обсуждается далее в данной главе, в гл. 5 и в книгах Беннетта и Франклина [3.1 | и Хальда [3.52 |.
Непрерывные распределения
101
Вти таблицы применяются при решении таких задач, как опреде-Епенне вероятности того, что пуля, направленная в цель, попадает в заданный эллипс, или нахождение такой окружности вокруг Почки прицеливания (в этом случае b\= bz= 1), что вероятность попадания пули в круг составит 0,9. В книге Оуэна [3.501 приводятся также другие таблицы, в том числе для случая смещенного Ьллипса [т. е. для эллипса, центр которого не находится в точке Г(!Ч. 1\)1-
I В других случаях может потребоваться найти
р*
и | ух, у. 5,. a,, flllrfs,
т. е. вероятность того, что некоторое значение случайной велн-Ж'чнны, имеющей двумерное нормальное распределение, находится «внутри данного прямоугольника или, в более общем случае, внутри Жданного многоугольника. Эти вероятности можно также найти с Впомощью таблиц [3.501, [3.591.
В Рассмотрим следующий пример. Обратное напряжение пробоя х и прямое напряжение у в некоторых заданных точках полупровод-Имикового диода определенного типа имеют двумерное нормальное ^Распределение с |*у = 100 в, ру = 0,7 в, ах = 5 в, оу = 0,07 в и Ер — 0,5. Результаты, полученные для выборки объемом 100 диодов, ‘. показаны па рис. 3.6.
В Допустим, что все диоды, имеющие обратное напряжение про-# боя ниже 95 в или прямое напряжение ниже 0,65 в, бракуются и Ж требуется определить долю непринимаемых диодов. Необходимо Д» найти относительную площадь под поверхностью двумерного нор-И'Малыюго распределения, в которой находится область отбрасываемых значений, изображенная на рис. 3.6.
помощью таблиц из разд. 8.5 книги Оуэна [3.501 находим, что эта вероятность равна 0,08. Можно показать, что в данной задаче необходимо рассматривать двумерное распределение с уче-. Том корреляции между этими двумя случайными величинами. Если бы при определении доли бракованных диодов мы рассматривали отдельно обратное напряжение пробоя и отдельно прямое напря-| Женне, используя два одномерных нормальных распределения, а | затем объединили эти результаты, приняв ошибочное допущение о Ж независимости этих случайных величин, то получили бы пепра- вильный результат.
Рассмотренное двумерное нормальное распределение нетрудно & обобщить и перейти к многомерному нормальном)' распределению 3 ДЯч трех или большего числа случайных величин. Например, трех- Мерное нормальное распределение случайных величин х, у и z ^Ь^Одержит девять параметров: (1,., |ху, (*,, ах, ау, аг, pry, р„ и ру2.
1
102
Глава 3
Эта модель часто применяется при описании положения объс,, в пространстве, точные координаты которого подвержены случ,1:, ным изменениям, например при определении траектории kocmii»
Рис. З.б. Случайная выборка данных об обратном напряжении пробе прямом напряжении, имеющих совместное нормальное распределение, дли 1 полупроводниковых диодов с указанием критической области.
Значения параметрон для двумерны» нормального риспраделс-
Оцрнки нарлмотрон
распределении на ос-
нове данных для 100 диодов
99.5 0,705
4.09 0.067 0,409
кого аппарата, или в задачах, где рассматриваются три характерна тики, например это имело бы место в предыдущем случае при вк.и" чении в условие задачи дополнительно третьего свойства, скажо сопротивления. Вероятности для трехмерного нормального рас
Непрерывные распределения
103
тления. аналогичные вероятностям для двумерного нормально-0 распределения, можно получить из таблиц, приведенных в азд. 8.7, 8.8 и 8.9 книги Оуэна [3.50].
3.2. ГАММА-РАСПРЕДЕЛЕНИЕ И СВЯЗАННЫЕ J С НИМ РАСПРЕДЕЛЕНИЯ
Характер модели
Галина-распределение используется для описания случайных величин, ограниченных с одной стороны. Бета-распределение, Есрматриваемое в следующем разделе, описывает случайные величины, которые изменяются в некотором интервале.
ДРадлотность гамма-распределения имеет вид
|U; TWX'” >>»• ’»"• (3.11)
I 0 в остальных случаях,
Ив_Д'(т|) — хорошо известная гамма-функция:
Г(’1)= (et-1 <r‘dx.
(3.12)
«Если — положительное целое число, то Г(т|) = (-q—1)!
I Трафики для плотностей гамма-распределения при различных .значениях т( и общем значении X показаны на рис. 3.7. Построенные .'кривые имеют самую различную форму. В частности, при -q I график плотности распределения имеет вид кривой убывающей функции, а при т(>1 представляет собой одновершинную кривую “Максимумом в точке х = (vj — 1)/Х. Влияние изменения X при постоянном т| показано на рис. 3.8. При изменении параметра X форма распределения не изменяется, а меняется только его масштаб. Следовательно. — параметр формы, а X — параметр масштаба. В; Тамма-распределение описывает время, необходимое для появления ровно ц независимых событий, если эти события происходят Постоянной интенсивностью X. Это свойство обеспечивает широ-И Применение гамма-распределения. Если, например, поставка
РТОрой летали производится партиями объемом т], а заявки на единые детали поступают независимо друг от друга с постоянной Йнсивиостью X единиц в неделю, то промежуток времени, за >рый будет израсходована вся партия, является случайной верной, имеющей гамма-распределение. Аналогично время безот-юй работы системы имеет гамма-распределение, если система
Глава 3
выходит из строя, когда в ней произойдет v( независимых частичных отказов, имеющих постоянную интенсивность (Гамма-распре деление длительности безотказной работы рассматривается в разд.
3.5.) Кроме того, время между последовательными операциями по
Рис. 3.7. Гамма-распределения с Л=1 и различными значениями »].
обслуживанию некоторого прибора, требующего повторной калибровки после ровно т( измерений, или время между последовательными осмотрами самолета, который проверяется после каждых полетов, при соответствующих условиях являются случайными величинами, имеющими гамма-распределение. Гамма-распределение играет важную роль в теории массового обслуживания, где рассматриваются задачи, связанные с ожиданием в очереди п обслуживанием клиентов 13.71 — [3.91.
Непрерывные распределения 105
Ш, Опытным путем обнаружено, что многие случайные величины, для которых невозможно теоретически обосновать применимость йдама-распределения, хорошо аппроксимируются этой статистической моделью. В числе примеров можно назвать распределение размера доходов семей и времени безотказной работы конденсатора. Кроме того, гамма-распределение часто используется в байесовском анализе как априорная модель, описывающая интенсивность [некоторого процесса, когда вначале точная форма распределения неизвестна, например интенсивность отказов некоторой системы. Более иодробно этот вопрос рассматривается в книге Шляйфера 13.101, | Широкое применение этой статистической модели можно объяснить тем, что гамма-распределение принимает самые разнообразные формы.
I Однако в гл. 6 мы увидим, что гамма-распределение является частным случаем еще более широкого семейства распределений. Интегральная функция гамма-распределения
Л* I. >) e"ai. *>о. (3.13)
I ° о, х<0,
Называется неполной гамма-функцией', таблицы для этого распределения приводятся в книгах Хартера [3.15] и Пирсона [3.54].
106
Глава 3
При использовании этих таблиц для определения вероятности того, что случайная величина, имеющая гамма-распределение с парамет рами X и т], принимает значение, меньшее х, вначале определяем
(3.14)
а затем полагаем
р = Ч-1. (3.15)
После этого из таблиц находим I (и, р). Эта величина и является искомой интегральной функцией распределения F(x-, 7|, ).). Использование таблиц иллюстрируется на следующем примере.
Паром отправляется в рейс через реку, как только к пристани прибывают ровно девять автомобилей. В течение определенного периода автомобили прибывают к парому независимо друг от друга со средней интенсивностью шесть автомобилей в час. Требуется определить: 1) вероятность того, что время между последовательными рейсами парома будет менее одного часа; 2) время t между последовательными отправлениями парома, вероятность превышения которого составляет 1%.
Из предыдущего изложения следует, что время между последовательными отправлениями парома является случайной величиной, имеющей гамма-распределение с параметрами •/] = 9 п X = 6. Таким образом, в первой части задачи требуется вычислить F (Г, 9, 6) по формуле (3.13). Из выражения (3.14) следует, что
и = = 2,0.
VT V9-
Полагая р = ц — 1 = 8, из таблиц, помещенных в книге Хартера 13.15] или Пирсона [3.54], находим, что
/(2,0; 8) = F(l; 9,6) = 0,153.
Таким образом, вероятность того, что время между последовательными отправлениями парома будет меньше одного часа, равна 0,153.
Второй вопрос задачи требует определить 99-й процентиль распределения, т. е. найти значение х, удовлетворяющее уравнению
0,99 = F(x; 9, 6) = t‘ г" dt.
Для этого необходимо выполнить действия в обратном порядке, используя табличные значения. В частности, находим /(и, 8) = 0,99 при и = 5,8. Из уравнения (3.14) получаем 5,8 = 6х/>. 9? следо-
Непрерывные распределения
107
кательно, х = 2,90 час, т. е. с вероятностью 0,01 время между от-иравлениями парома превысит 2,9 час. Это значение можно было бы найти непосредственно из таблиц процентилей гамма-распределе-шия, опубликованных в журнале Technometrics 13. 111.
^Аппроксимация гамма-распределения нормальным распределением Из определения гамма-распределения как статистической мотели для времени, необходимого для появления ровно -q событий, Ери допущении, что события происходят независимо друг от друга с постоянной интенсивностью, с помощью центральной предельной реоремы можно показать, что при увеличении -q гамма-распределение приближается к нормальному. Математическое ожидание и дисперсия случайной величины х, имеющей гамма-распределение, равны соответственно ift. и т(/Х3. Отсюда следует, что при боль-
Вшляется почти нормированной нормально распределенной случайной величиной. Так, в предыдущей задаче вероятность ожидания менее одного часа, согласно формуле (3.3), приближенно равна [ F (1; и --= 4 , = = 4^1 = ехр [ - '1(7;">’]
‘Поскольку -q = 9 и X = 6, нормированной нормально распределенной случайной величиной является
Из табл. 1 находим, что искомая вероятность приближенно равна F(— 1; 0, 1) = 0,159, что лишь незначительно отличается от предыдущего более точного результата.
Во второй части задачи требуется найти 99-й процентиль для распределения интервалов времени между моментами отправления парома. Используя аппроксимирующее нормальное распределение, полагаем F(y; 0, 1) = 0,99. Из табл. 1 находим у = 2,33. Спедова-телыю, искомое время х является решением уравнения
\ Откуда х.= 3,16 час, что почти на 10% отличается от предыдущего точного ответа. Для значений, не лежащих в области больших от-кКлонепий, можно ожидать, что соответствие будет лучшим.
108
Оценка параметров гамма-распределения
Часто по экспериментальным данным бывает необходимо оценить один или оба параметра гамма-распределения. Для этого существует несколько методов. Первый из них — метод максимального правдоподобия— рассматривается в статье Гринвуда и Дуранда [3.12]. где даются также диаграммы, упрощающие вычисления, и изложен метод получения доверительных интервалов для параметров. Для многих практических задач можно использовать следующее более простое и менее точное выражение основанное на методе моментов:
где х определяется по формуле (2.31), a sz по формуле (2.51а); х, (i = 1, 2, .... п) — наблюденные значения. Это выражение эквивалентно следующему:
) = (л — 1)
S xi
(3.16а)
Оценка параметра т| равна
ж*(Я—1)
(З.Г7)
ИЛИ
(3.17а)
I) Метод максимального правдоподобия предполагает принятие в качестве оценки каждого неизвестного параметра такого значения, появление которого на основе полученных данных наиболее вероятно. Метод моментов требует представления параметров распределения через моменты низких порядков, замены их оценкамп моментов, полученных на основе имеющих ся данных, и решения полученного уравнения для нахождения оценок параметров. Для гамма-распределения математическое ожидание и дисперсия равны соответственно т)/А Иц/А®. Полагая эти параметры равными соответст пенно эмпирическому среднему и эмпирической дисперсии [ используется несмещенная оценка дисперсии, см. уравнение (2.51а)]. получаем два уран-нения, решив которые, находим оценки для к и т]. Если распределение содержит три параметра, третье уравнение можно получить, приравнивая третий момент распределения третьему вычисленному моменту и т. д.
Непрерывные распределения
109
Описанный выше метод иллюстрируется на следующем примере.
Пусть время от момента подачи заказа до момента его получения (время доставки) имеет гамма-распределение. Время доставки для 20 случайно выбранных заказов показано в табл. 3.1. На основе этих данных необходимо получить оценки параметров р. и X.
Таблица 3.1
Время доставки каждого из 20 заказов
Номер Время достав, кв. сутки ай я Время доспи». ХИ. сутки
1 10 II н 10
2 10 12 6
3 6 13 13
4 11 14 8
5 8 15 12
6 7 16 7
7 17 6
8 12 18 16
9 12 19 9
10 6 1 20 5
В Из имеющихся данных получаем
л = 20, — Xj=185, \ х*=1875. /=! i=i
Таким образом, из формул (3.16а) и (3.17а) следует, что
' -19 го.Хг^"1-07
Ч “ TSF '»Ч * * * 8=9'99-
Во многих задачах параметр -q гамма-распределения бывает
параметр X требуется оценить на основе экспе-
нных. Например, при описании времени, необхо-ления т( независимых событий, может быть неиз-генсивность появления событий X. Когда гамма-
пользуется как статистическая модель для времени >ты, параметр X может быть одинаков для компо-з и его можно определить из теоретических сообра-:нове прошлого опыта. В таких случаях оценку X
помощью формулы (3.17а) или при графическом ;роятностей (см. гл. 8).
no
Г ла в а 3
Иногда точные значения результатов наблюдений, превышают;: некоторое предельное значение, бывают неизвестны, как, например, при испытаниях на долговечность, когда в заданный момент времени Т прекращаются испытания всех изделий, не вышедших и строя, или когда проверка заканчивается при появлении ровно отказов. Такая выборка называется цензурированной *>. Метод:, оценки параметров распределения на основе цензурированных дан ных приводят Уилк и др. (3.13].
Обобщенная форма гамма-распределения
До сих пор мы предполагали, что случайная величина, имеющая гамма-распределение, принимает любые значения от нуля до бес конечности. Однако гамма-распределение можно определить па некотором другом интервале, например от р. до бесконечности. В этом случае получаем гамма-распределение с тремя параметра.': и
/ (*; Ч Iх)
71>0, (3.18)
( Ь‘> в остальных случаях.
Интегральную функцию этого распределения можно найти, по лагая х'= х — р и действуя, как в случае гамма-распределения с двумя параметрами.
Частные случаи гамма-распределения: эрланговское, хи-квадрат и экспоненциальное распределения
В выражении (3.11) для плотности гамма-распределения параметр т; может принимать любое положительное значение, хотя определение случайной величины, имеющей гамма-распределение, как времени, необходимого для появления ровно ц событий, означает
') Между цензурированным и усеченным распределениями существуй определенное различие. Усеченное распределение обрывается в точке усе чения. Поэтому невозможно получить выборку, элементы которой лежат за этой точкой. В сл учае же цензурированного распределения, кроме выборок, значения которых записаны, существует определенное число точек, относи тельно которых ничего не известно, кроме того, что они превышают некоторое значение. Цензурированные данные получают, когда в процессе производства регистрируются лишь те параметры изделий, которые не выходят за пределы, заданные техническими условиями, а изделия, характеристики кото рых выходят за эти пределы, не рассматриваются и подсчитывается лишь число таких забракованных изделий. Клиент, получающий лишь принятые изделия п регистрирующий их характеристики, имеет дело с усеченным распределением.
Непрерывные распределения
что т) — положительное целое число. Когда параметр ц ограни-чен положительными целыми числами, гамма-распределение назы-
1 вается распределение.» Эрланга. Такое название наиболее распро-Вргранено в теории массового обслуживания.
' Распределение хи-квадрат является частным случаем гамма-^Ьаспределения, когда X = */2, а значение кратно */2. Это распре-Кделение имеет только один параметр. Целое число f = 2 обычно Вмазывается числом степеней свободы. Применение этого распреде-Ииения вызывается тем, что сумма квадратов 7 значений случайной ^величины, имеющей нормированное нормальное распределение, Ииспределена по закону хи-квадрат с 7 степенями свободы. Этот I результат выводится в гл. 5.
ИрЭкспоненциальное распределение (или, точнее, отрицательное «..экспоненциальное распределение), рассмотренное в гл. 2 и изображенное на рис. 3.7, является гамма-рас пределением с параметром т| — 1. Плотность экспоненциального распределения имеет вид
/(х; X) = Хе-Ч*> 0,Х>0.
(3.19)
I Интегральная функция экспоненциального распределения имеет вид
F(x; X) = I l-e-'W = 1 — ।
(3.20)
Значения функции легко вычислить с помощью таблиц для отрицательного экспоненциального распределения.
Из вывода гамма-распределения следует, что экспоненциальное распределение описывает время до момента появления одного события, если события появляются независимо друг от друга с постоянной средней интенсивностью, или, что то же самое, это распределение интервала времени между моментами появления независимых случайных событий с постоянной средней интенсивностью. Например, если частицы попадают в счетчик независимо друг от друга со средней интенсивностью X = 2 частицы в секунду, то, согласно формуле (3.20), вероятность того, что частица поступит в счетчик не позже, чем через секунду после предыдущей, будет равна
F(l)= 1 — е-2<'> = 0,865.
Экспоненциальное распределение часто используется как статическая модель для времени безотказной работы компонента и системы, когда интенсивность отказов считается постоянной, от случай подробно рассматривается в разд. 3.5.
112
Оценку параметра л экспоненциального распределения на основе экспериментальных данных можно найти, положив в формуле (3.17а) 7j = 1:
X = -jr-= • (3.21)
S X/
3.3. БЕТА-РАСПРЕДЕЛЕИИЕ И СВЯЗАННЫЕ С НИМ РАСПРЕДЕЛЕНИЯ
Характер модели
Точно так же как гамма-распределение, принимающее самые разнообразные формы в интервале от нуля или некоторого произвольного начального значения до бесконечности, бета-распределение представляет собой важную статистическую модель для случайных величин, значения которых ограничены конечным интервалом. Плотность бета-распределения, определенная в интервале (0,1). имеет вид
ргыт(') л’-'о-х)’-'. !. О<Т, (Х-п, (3.22)
I 0 в остальных случаях
Графики плотности бета-распределения при различных значениях параметров 7 и Tj показаны на рис. 3.9. Заметим, что:
1. При •[>! и т}>1 распределение является одновершинным с максимумом в точке х = (7 — 1)/(т+71—2).
2. При •[< 1 и 7)<1 распределение имеет U-образную форму.
3. При (<! ит|>1 распределение имеет вид убывающей функции, а при Т|< 1 и 7^-1 оно имеет J-образиую форму.
4. При 7 = т( распределение является симметричным. Дале в этом разделе рассматривается частный случай, когда 7 = т( - - I.
Таким образом, значения обоих параметров влияют на форм} распределения, т. е. 7 и являются параметрами формы.
Интегральная функция бета-распределения
1 0 ,л х х< 0,
F(X: Ъ 0<х<1, (3.23)
' 1. х>1,°
называется неполной бета-функцией, таблицы которой приводятся в книге Пирсона 13.14].
Для применения этих таблиц при 7>-т( полагаем -Л
р = ги?-Ч. ₽ (3.2-0
Непрерывные распределения ИЗ
I
|а затем из таблиц находим Iх(р, q) = F(x; 7, f|). При f<vj пола-гаем
р = q = f и х' = 1 — х, (3.25)
|а затем из таблиц находим /х-(р, q). Искомой интегральной функцией распределения является
F(x-, Т, 7|)= 1 я). (3.26)
Иалее мы покажем, как пользоваться этой таблицей. Когда не-Кбходимы только процентили, их также можно получить пепосред-Кгвеи по из таблиц в книгах Хартера 13.151 и Пирсона и Хартли , (3.161.
Вследствие того что бета-распределение может иметь различную форму, оно используется для описания большого числа реальных случайных величин, значения которых ограничены определенным интервалом. Примером такой случайной величины может служить доля дефектных изделий на производственной линии за сутки. Бега-распределение описывает также оценки продолжительности определенного этапа работы при календарном планировании по методу ПЕРТ1’. Инженер выбирает оптимистическую (о), пессимистическую (р) и наиболее вероятную (т) оценки времени, необходимого для выполнения каждой операции. На основе этой информации принимается, что время завершения операции имеет бета-распределение в интервале (о, р); наиболее вероятное значение равно т, а среднее квадратическое отклонение равно Чв(р — о). В этом случае применимо бета-распределение общего вида, определенное в интервале (|*0, pt) (см. далее). Более подробно этот вопрос рассматривается в работе Малколма и др. [3.171.
Бета-распределение часто используется также при байесовском анализе в качестве исходной информации о вероятности успеха, например о вероятности того, что космический аппарат успешно выполнит определенную задачу. Этот метод описан в книге Шляй-фера [3.101.
Бета-распределение применимо также в следующей задаче. Допустим, что получены п независимых случайных наблюдений некоторого явления у с произвольной плотностью распределения. Полученные значения располагаются в порядке возрастания. Пусть Уг и Уп-М — соответственно значения г-го наименьшего и «-го наибольшего значений. Можно показать [3.181, что долях значений исходной совокупности, заключенных между уг и yn-i+i> имеет бета-распределение с параметрами 7 п—г—s-H и т( = г + s,
1 ’ PERT — Program Evaluation and Review Technique (англ.) — метод ,к" и пересмотра планов. — Прим, перев.
1
Рн с. 3,9. Бета-распределение с различными значениями параметров.
116
Глава 3
f(x-, n-r-s+1, г+s) - r^-JXorfr-W ‘ <’
0<x<l. (3.27)
Этот результат справедлив независимо от формы распределения случайной величины у и иллюстрируется на следующем примеру.
Радиоприемник предназначен для приема сигналов различной мощности. От каждого нового источника случайным образом принимаются 50 независимых сигналов. После этого приемник настраивается для приема тех сигналов, мощность которых лежит в интервале между самым низким п самым высоким значениями выборки. Какова вероятность того, что после настройки приемник примет не менее 95% большого числа сигналов от данного источника?
Из предыдущего изложения следует, что доля х значений совокупности, заключенных между наименьшим и наибольшим значениями случайной выборки объемом 50 элементов, является случайной величиной, имеющей бета-распределение с параметрами 7 - 50 — I — 1 -г 1 = 49 и т| = Г4- 1 = 2. Следовательно, вероятность того, что доля принятых сигналов превысит 0,95, равна
Р(х>0,95) = 1 — F(0,95; 49, 2) =
twWT'4’-1
о
(3.28)
Так как для нахождения F (0,95; 49, 2) можно использовать формулу (3.24); таким образом, р = 49 и q = 2. Из таблиц, приведенных в книге Пирсона [3.141, находим
/о.м (49,2) = F (0,95; 49, 2) = 0,279.
Следовательно, вероятность того, что будет принято не менее 95% сигналов, равна 0,721.
Бета-распределение широко используется при статистическом контроле качества и в теории надежности. Можно привести сле-
дующие примеры:
1. Измерительный прибор позволяет регистрировать длину только самой короткой и самой длинной детали. Из очень большой партии случайным образом выбраны 15 детален. Какова вероятность того, что не менее 90% деталей в партии будут иметь длину, заключенную между этими двумя фиксированными значениями?
2. Двадцать электронных ламп проверяются в течение времени t до тех пор, пока первая лампа не выйдет из строя. Какова верояг вость того, что срок службы не менее 75% ламп превысит /? В этой задаче г = 1 и s = 0.
Непрерывные распределения
117
Эти приложения бета-распределения связаны с нахождением толерантных пределов (см. разд. 3.1) без принятия допущения о том, что рассматриваемая совокупность имеет нормальное распределение.
Оценка параметров бета-распределения
, Как и в случае гамма-распределения, оценки параметров бета-распределения методом максимального правдоподобия получить трудно. Для больших выборок и в данном случае проще применить метод моментов, при этом потеря точности невелика. Этот метод Приводит к следующим уравнениям:
(3.28а)
(3.286)
где л- и з2 находятся по формулам (2.31) и (2.51а).
Обобщенная форма бета-распределения
Бета-распределение можно обобщить па случай интервала (рв, nJ. При этом плотность бета-распределення принимает вид
/(*; т, 7j. р0, и,) =
1 Г(т + д) / х-р, у-1/, _ х-р0 л-| (Р-1 —Но) Г(7)Г(г(Ц Р1 —РО ) Pi— Ро ) •
Но<х<И1. 0<7, 0<тр О в остальных случаях.
Интегральную функцию распределения можно получить путем перехода к слуЧаййой величине, имеющей бета-распределение в интервале (0,1), полагая х'= (х— po)/(pi—р0) и используя ту же методику, что и при выводе функции бета-распределения с двумя параметрами. Доказательство такого преобразования и вывод формулы (3.29) даются в гл. 5.
Частный случай бета-распределения: равномерное распределение
L При f == -г, = 1 бета-распределение принимает вид
f (x- I П — 1 1’ Ь
'к ' 1 ~ I 0 в остальных случаях.
(3.30)
118
Глава 3
При обобщении бета-распределения для интервала (р0, щ) плотность распределения принимает вид
/(*; |*«. и.) = !’ ’* (а з,)
| 0 в остальных случаях.
Это равномерное, или прямоугольное, распределение, плотность которого имеет вид горизонтальной прямой (рис. 3.9, г).
Вероятность того, что равномерно распределенная случайная величина принимает некоторое значение в интервале (xj, х2), где Xi2>|*0 и Х2,С|Л1> пропорциональна относительной длине интервала:
= \---------dx= ——— . /3 32)
,) Hi — l*a 1Ч — 1*о '° '
Xi
Следовательно, равномерное распределение является статистической моделью, описывающей момент появления события, которое с равной вероятностью может появиться в любой момент данного интервала. Например, если прием некоторого сигнала одинаково возможен в любой момент х в интервале длительностью 5 сек, то плотность распределения случайной величины х будет равна
/ (х; 0, 5)=-^-, 0<х<5.
Вероятность того, что сигнал будет принят в первую секунду, равна
Г(Г. 0,5)- ('-!• Лг-0,2.
5
Пример обобщения равномерного распределения для двумерного случая рассматривался в разд. 2.11. В гл. 7 показано применение дискретной аппроксимации равномерного распределения для получения случайных чисел, имеющих любое распределение.
Частные случаи бета-распределения: треугольное и параболическое распределения
Еще двумя частными случаями бета-распределения являются треугольное и параболическое распределения. Треугольное распределение получаем, полагая 7 = 2 и т) = 1. Плотность треугольного распределения имеет вид
Непрерывные распределении
119
с гх. о 1 \ f > О С х С I •
I и- ч | 0 в остальных случаях
(3.32а)
или, полагая у = 1 и -ц = 2, получаем1’
/(*; 1> 2) = | в остальных случаях. (3.326)
Форма этого распределения показана на рис. 3.9, в.
Параболическое распределение получаем, полагая в формуле (3.22) 1 = 7| = 2. Форма этого распределения показана на рис. 3.9, г. Плотность параболического распределения имеет вид
е, п л\ _ / 6х(1 х), 0<х^1, И 32в1
/ (х, z, zj — у о в остальных случаях. (о.олв)
Эти распределения иногда применяются в качестве простых аппроксимаций более сложных симметричных и асимметричных распределений. Так, параболическое распределение можно использовать как очень простую аппроксимацию нормального распределения, а треугольное распределение позволяет весьма приближенно описать некоторые случайные величины, имеющие гамма-распределение.
3.4. СТАТИСТИЧЕСКИЕ МОДЕЛИ. СВЯЗАННЫЕ С НОРМАЛЬНЫМ РАСПРЕДЕЛЕНИЕМ: ЛОГАРИФМИЧЕСКИ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ. РАСПРЕДЕЛЕНИЕ РЕЛЕЯ И РАСПРЕДЕЛЕНИЕ КОШИ
Общий характер моделей
С нормальным распределением связаны некоторые другие распределения, используемые во многих инженерных задачах. В этом разделе рассматриваются три такие модели — логарифмически нормальное распределение, распределение Релея и распределение Коши. Вывод формул здесь не дается, однако общая методика объясняется в гл. 5.
Логарифмически нормальное распределение
Логарифмически нормальное распределение описывает случайную величину, логарифм которой распределен по нормальному закону с параметрами |х и а. Таким образом, плотность распределения Случайной величины tj = In х имеет вид
8 = ~;/25 еХР [ “ ~ — °° <^< 00 ’ <3133)
Эго распределение называют также полутреугольным.
120
Глава 3
Методами, изложенными в гл. 5, находим, что плотность распределения случайной величины х имеет вид
----W" exp [ — тз- (In X— u)1] „
ax l'2rc I. J
X > 0, — oo < p. < oo ,o > 0, О в остальных случаях.
/(*; h =)-
(3.34)
Это распределение принимает различные формы для неотрицательных случайных величин, что видно из графиков плотности логарифмически нормального распределения при различных значениях и □ (рис. 3.10). Распределение имеет правостороннюю асимметрию, степень асимметрии возрастает с увеличением я. Заметим, что и и о не являются соответственно параметрами, характеризующими центр распределения и его масштаб, как это имело место в случае нормального распределения. Таким образом, сделано исключение из схемы обозначения параметров, принятой в начале главы.
Логарифмически нормальное распределение можно обобщить на случай интервала, отличного от (0, оо), введя параметр е, характеризующий центр распределения
/(х; |х, а, е) = -----—— ехр । — -J5-[In (х—е)—[*]»), (3.34а)
5(х-е)]/2г. I J
— 00<р.<<®, Я>0, —оо<а<оо.
Логарифмически нормальное распределение можно вывести как статистическую модель для случайной величины, значения которой получаются в результате умножения большого числа небольших ошибок, аналогично тому как нормальное распределение имеет место при сложении ошибок. С помощью центральной предельной теоремы можно показать, что распределение произведения п независимых положительных случайных величин приближается к логарифмически нормальному распределению при самых общих условиях. Вывод этого результата дается в книге Эйтчисона и Брауна [3.19], где достаточно подробно рассматриваются теория и приложения этого распределения.
Логарифмически нормальное распределение применяется в самых различных областях — от экономики до биологии для описания процессов, в которых наблюдаемое значение составляет случайную долю предыдущего значения. Примерами могут служить распределение суммы личных доходов, размеров наследства, суммы банковских вкладов; распределение размеров организма, развитие которого происходит под влиянием большого числа незначительных воздействий. эффект каждого из которых пропорционален мгновенному значению размера организма. Логарифмически нормальное распре-
Рис. 3.10. Логарифмически нормальное распределение с различными значениями р. II о’.
122
Глава 3
деление используется также для описания размеров частиц, получаемых в процессе дробления породы (3.20I. В разд. 3.5 показано применение этого распределения при испытаниях на долговечность.
Популярность логарифмически нормального распределения частично обусловлена тем, что найти его процентили несложно, поскольку значения интегральной функции распределения случайной величины у = 1п х можно получить с помощью таблиц нормированного нормального распределения, а соответствующие значения х находятся путем взятия антилогарифмов. Методы оценки параметров логарифмически нормального распределения на основе полученных данных описаны в гл. 6 и 8.
Распределение Релея
Распределение Релея используется для описания радиальной ошибки на плоскости, когда ошибки по каждой оси координат независимы и распределены по нормальному закону с одинаковой дисперсией и нулевым математическим ожиданием. Так, если ух и
Рис. 3.11. Релеевское распределение с различными значениями «г.
//а— независимые случайные величины, распределенные по нормальному закону, каждая с р = 0 и одинаковыми значениями а, то случайная величина
(3.351
имеет распределение Релея
Непрерывные распределения
123
/(*;»)-
[4 х>0, «>0,
[ 0 в остальных случаях.
(3.36)
Это распределение содержит только параметр масштаба а. График Рдлотности распределения Релея показан на рис. 3.11.
Б Основное применение распределение Релея находит в таких задачах, как определение распределения величины промаха бомбы /относительно цели, когда ошибки Прицеливания в направлениях х и у независимы и распределены по нормальному закону с одинаковыми дисперсиями. Второй областью применения этого распределения является статистическая теория связи. В книге Миддлтона I [3.211 показано, что если случайный шум выделяется линейным детектором, то огибающая шума имеет распределение Релея.
К Интегральную функцию распределения Релея
F(x; а) =
$ (£) '4>[т£] = »—ехР[-5^-} О в остальных случаях.
южно легко вычислить.
определение Коши
Плотность распределения Коши имеет вид
Ни и, «)= --Г.нД)щг-•
х>0, (3.37)
(3.38)
— оа<.Х<оо, — оо<[Л<оо, 3 > О,
где ij. и з — соответственно параметры, характеризующие центр распределения и его масштаб.
R-. Интегральная функция распределения Коши имеет вид
J (3.39)
= 4-+4-агс tg •
Ь Отношение двух независимых случайных величин, распреде-, ленных по нормальному закону с нулевым математическим ожи-^Вжннем, имеет распределение Коши с параметрами р. = 0 и в = 1. Ь Кроме того, отношение х/у двух независимых нормально распре
124
Глава 3
деленных случайных величин с нулевыми математическими ожи даниями и дисперсиями, равными соответственно <гх и ау, име-.; распределение Коши с параметрами [л = 0 и а = ac/av.
Рис. 3.12. Сравнение распределения Коши с нормальным распределением
I — распределение Коши; 2 — нормальное распределение.
Рассмотрим следующий пример. Передающее устройство гене рирует нормально распределенный шум при среднем уровне 20 J6 со средним квадратическим отклонением 2 дб. Случайным образом выбраны два отсчета: u'I и w2. Вычисляется нормированное от ношение
(^-гоуг „ г, Л (и?,-20)/2 г,
Какова вероятность того, что величина этого отношения заключен, между —1 и 1?
Из сказанного ранее следует, что х — случайная величина имеющая распределение Коши с параметрами ц = 0 и а = 1. Та ким образом, получаем
P(-l<x<l) = F(l; 0, 1)-F(-1; 0, 1) =
dy = J-arctgx | = o,3o.
Как видно из рис. 3.12, распределение Коши является симмет ричным, с длинным «хвостом». Для сравнения рядом показано нор мальное распределение. Следовательно, эта статистическая модель используется для описания случайных величин, для которых могут быть получены значения, отстоящие очень далеко от центра
Непрерывные распределения
125
чайная величина 0 имеет равномерное распределение в интервале т/2, тг/2), то методами, изложенными в гл. 5, можно показать, что tg0 распределен по закону Коши.
| Распределение Коши не имеет конечных моментов. Так, применяя ^формулу (2.28) для нахождения математического ожидания случайной величины, имеющей распределение Коши, получаем выражение, которое не сходится. По этой причине для оценки параметра р. на основе экспериментальных данные используется выборочная медиана. В этом отношении распределение Коши отличается от всех остальных распределений, рассматриваемых в данной книге.
3.5. СТАТИСТИЧЕСКИЕ МОДЕЛИ, ИСПОЛЬЗУЕМЫЕ
ПРИ ИСПЫТАНИЯХ НА ДОЛГОВЕЧНОСТЬ И В ТЕОРИИ НАДЕЖНОСТИ
Характер задачи
Распределения вероятностей находят важное применение в качестве статистических моделей, описывающих длительность безотказной работы компонентов или систем. Длительность безотказной работы, выражаемая в часах, годах или через число циклов, является случайной величиной, точное значение которой зависит от большого числа факторов, например, таких, как производственные допуски, свойства материалов и изменение условий окружающей среды. После того как будет построена соответствующая вероятностная модель для длительности безотказной работы и получены оценки ее параметров, эту информацию можно использовать для прогнозирования надежности, разработки оптимальной методики начальной приработки, составления календарных графиков замены деталей и правил регулирования запасов, планирования программ испытаний на надежность и т. д. Большой обзор литературы по математической статистике, связанной с испытаниями на надежность, приводится в книге Бакленда 13.471.
В этом разделе мы рассмотрим распределение времени безотказной работы. Некоторые из них — экспоненциальное, гамма-распределение и логарифмически нормальное — уже рассматривались. Два других — распределение Вейбулла и распределение Экстремальных значений типа I — вводятся впервые.
Интенсивность отказов
I Часто имеет смысл рассматривать функцию, дающую вероятность отказа за очень короткий промежуток времени при условии, то До этого момента отказов не было. Эта функция, называемая
126
Глава 3
интенсивностью отказов (ее называют также условной функцией отказов или интенсивностью выхода из строя), имеет вид
й(')=т=^. (3.40)
где f(t) — плотность распределения, a F(l) — функция распределения длительности безотказной работы. Следовательно, 11 —F(l) |-вероятность безотказной работы до момента t, a h(t)dt обозначает долю элементов, безотказно работавших до .момента времени /. которые выйдут из строя в промежутке времени (t, t + dt).
h(t)
Рис. 3.13. Типичная форма интенсивности отказов.
Интенсивность отказов, свойственная многим явлениям, включая человеческую жизнь, имеет «корытообразную» форму, показанную на рис. 3.13. Для начального периода, включая момент времени /0, интенсивность отказов h (t ) относительно велика вследствие так называемых приработочных отказов, т. е. ранних отказов, зачастую вызываемых производственными дефектами. За тем интенсивность отказов ft(i) убывает и остается почти постоянной до момента времени после которого она возрастает вследствие появления износовых отказов. Для изделий с такой интенсивность!' отказов можно оптимизировать надежность на период эксплуатации путем 1) начальной приработки до момента времени /а с целью исключить ранние отказы и 2) замены изделий в момент времени с целью избежать износовых отказов.
Интенсивность отказов, соответствующую определенной плот ности распределения, можно найти непосредственно с помощью фор мулы (3.40). Например, для равномерного распределения с плот ностыо
f(f, о, 10)=^.
интенсивность отказов равна
Непрерывные распределения
12?
= ---------
1-fO.l dy
? На рис. 3.14 показаны интенсивности отказов для следующих рас-Ьределений: 1) нормальное распределение с параметрами у. = 5
Рис. 3.14. Интенсивности отказов, соответствующие нормальному, равно мерному и экспоненциальному распределениям.
il.— рйВйомерное распределен™!; 2 — нормальное распределение; 3— экспоненциальное распределение.
и о = 1; 2) равномерное распределение в интервале (0, 10); 3) эк-> .споненциальное распределение с X = 0,2. Нормальное распределение может оказаться неприемлемым в качестве статистической * Модели для времени безотказной работы, поскольку нормально рас-К Пределснная случайная величина может принимать отрицательные И Значения, в то время как время безотказной работы, которое вслед-К ствне приработочных отказов может оказаться близким к нулю, не К Может быть отрицательным. Применение равномерного распределе-К ния в качестве статистической модели для времени безотказной рабо-- ограничено, поскольку существует определенный верхний пре-
Дел, до которого должен произойти отказ. Таким образом, когда t ^ стремится к верхнему пределу, интенсивность отказов будет стре-
128
Глава 3
миться к бесконечности, так как все те элементы, которые еще не вышли из строя, должны выходить из строя во все уменьшающемся промежутке времени.
В случае экспоненциального распределения интенсивность отказов постоянна. Этот результат и его смысл рассматриваются ниже.
Экспоненциальное распределение как статистическая модель для времени безотказной работы
Экспоненциальное распределение с плотностью (см. разд. 3.2)
f и. 1У = ( О' *О’ 14 41»
1 ( 0 в остальных случаях V-*-1'/
наиболее широко используется в качестве статистической модели для времени безотказной работы. Оно играет основную роль в теории надежности, подобно тому как нормальное распределение играет основную роль в других областях.
С помощью формул (3.40) и (3.41) находим, что для экспоненциально распределенной случайной величины интенсивность отказов имеет вид
Л (0-----= <?Л2)
Таким образом, вероятность появления отказа в определенном промежутке времени постоянна и зависит только от длительности интервала и не зависит от того, рассматривается ли первый час работы компонента или же до этого он проработал уже 100, 1000 или 1 000 000 час. Параметр ). называется интенсивностью отказов.
Из разд. 3.2 следует, что время безотказной работы компонента распределено по экспоненциальному закону, если компонент выходит из строя, как только происходит некоторое одиночное событие (например, распад частицы) при условии, что такие события происходят независимо друг от друга с постоянной интенсивностью. Часто распределение времени безотказной работы компонента является экспоненциальным не на протяжении всего срока службы, а только в период его эксплуатации.
Допустим, например, что двигатель, интенсивность отказов которого можно представить кривой, изображенной на рис. 3.13, установлен в некоторой системе после успешной «приработки» в течение промежутка времени t0. Кроме того, через (1,— /0) часов
Непрерывные распределения
129
{.•данный двигатель заменяется другим, взятым из той же партии и также прошедшим к этому времени этап приработки. Этот процесс продолжается бесконечно. Время безотказной работы двигателя I при эксплуатации системы распределено по экспоненциальному г закону, поскольку интенсивность отказов постоянна. Это условие в справедливо даже в том случае, если распределение времени без-Г отказной работы за весь срок службы двигателя значительно отли-[ чается от экспоненциального.
L Экспоненциальное распределедие более приемлемо в качестве статистической модели для времени безотказной работы сложной системы, чем отдельных компонентов. В статье Дреника [3.221 к показано, что «в пределе» это распределение является статистичес-V жой моделью времени безотказной работы для системы с большим В _числом последовательно соединенных компонентов, каждый из V которых в отдельности не оказывает очень большого влияния на • 'Вероятность выхода из строя всей системы, даже если распределе-I ние времени безотказной работы отдельных компонентов не являет-| ся экспоненциальным. Этот результат соответствует центральной '.предельной теореме, которая во многих задачах, не связанных С и испытаниями на долговечность, устанавливает нормальное распре-I деление в качестве приемлемой статистической модели. Это отно-I сится также и к распределению времени безотказной работы таких г систем, где каждый неисправный компонент немедленно заменяется другим исправным компонентом.
Применение экспоненциального распределения в задачах теории надежности имеет также строгое эмпирическое обоснование. , В статье Дэйвиса [3.23[ приводится ряд примеров, в которых рас- сматривается надежность электронных ламп, резисторов, конденсаторов и т. д. Однако простота теории и необходимых вычислений I (см. последующее изложение) не должна создавать впечатления, что время безотказной работы любых компонентов имеет экспоненциальное распределение. Во многих случаях нет реальных оснований ожидать, что время безотказной работы будет иметь экспо-•,* денциальное распределение. Такое допущение может быть так же ошибочным, как и допущение об универсальности нормального распределения в задачах, не связанных с испытаниями на долго-• -вечность, и даже более ошибочным, поскольку во многих случаях экс-jk .потенциальное распределение не обладает такими устойчивыми № свойствами, как нормальное распределение. В гл. 8 рассматри-| ваются методы оценки справедливости допущения об экспоненциальном распределении.
Значения интегральной функции экспоненциально распределен-Г. Кой случайной величины можно найти с помощью формулы (3.20). ^Например, если время безотказной работы некоторого оборудования имеет экспоненциальное распределение с интенсивностью X = 0.1
130
Глава 3
отказа в год, то вероятность выхода оборудования из строя за первый год равна
F(l; 0,1) = 1 —е-0,1 = 0,095.
Заметим, что если ХГ мало, что имеет место в большинстве задач теории надежности, то
F(t- ).) = 1-е->'=ХЛ
В некоторых случаях параметр X известен из физических соображений, однако чаще всего его значение необходимо оценивать на основе экспериментальных данных с помощью следующего выражения (получаемого методом максимального правдоподобия):
X = , (3,43)
где F — общее число отказов, Т — общее время испытаний исправных и вышедших из строя компонентов. Допустим, например, что при испытаниях на долговечность четырех аккумуляторных элементов выход их из строя наблюдался через 10, 40 и 60 час.Четвертый элемент проверялся в течение 70 час и не вышел из строя; на этом испытания прекратились. Таким образом, F = 3, Т = 180 и
Часто представляет также интерес математическое ожидание времени безотказной работы t, называемое средним временем безотказной работы и обозначаемое через 0. Согласно формуле (2.29),
£(!) = » = 4'
Соответствующей оценкой выборочного среднего является
£ =А-, (3.45)
К
Таким образом, в данном примере оценка среднего времени безотказной работы равна
• - Ш' -60 ,шс-
Полагая, что общая длительность испытаний задается заранее (и что, таким образом, наблюдаемое число отказов является слу
Непрерывные распределения
131
чайной величиной), находим, что нижний доверительный предел для 0 при (I—я)100%-ном доверительном уровне равен
«д =-----, (3.46)
где т = 2F 4- 2, а значения x-i-»: г для различных значений а приводятся в табл. IV, помещенной в конце книги1».
В предыдущем примере 7=8. Цз табл. IV находим, что xVre; 8= = 15,5. Нижний предел 95%-ного доверительного уровня для среднего времени безотказной работы равен
в*”тЙг ” 21'2
i Таким образом, при допущении об экспоненциальном распределении времени безотказной работы точечная оценка среднего времени безотказной работы, полученная на основе экспериментальных данных, равна 60 час. Однако с вероятностью 95% можно утверждать, что среднее время безотказной работы составит не менее 23,2 час.
В некоторых случаях значение - в формуле (3.46) является несколько иным и зависит от конкретного правила, определяющего Момент окончания испытаний. Более подробно этот вопрос освещается в работах Эпштейна [3.24] и Базовского 13.251.
Заметим, что при использовании формул (3.43), (3.45) и (3.46) безразлично, какое число компонентов подвергается испытаниям общей продолжительностью Т. Если, например, за период испыта-
ний, равный 100 час, выходят из строя три компонента, то к = ==? 0,03 независимо от того, получены ли эти 100 час при испытании каждого из 100 компонентов в среднем й течение часа или же при испытании каждого из 10 компонентов в среднем в течение 10 час. Этот результат является непосредственным следствием допущения об экспоненциальном распределении времени безотказной работы,
когда вероятность выхода из строя исправного компонента не за-
висит от его предыстории.
Простота этих выражений является основной причиной широкого использования (в том числе и ошибочного) экспоненциального рас
пределения. Можно получить ту же самую информацию о вероятности безотказной работы одного компонента в течение 100 час, Испытывая каждый из 100 компонентов в течение одного часа или ис-
пытывая один компонент в течение 100 час, если вышедший из строя компонент сразу же заменяется исправным. Такой способ прием-
О Величины, входящие в табл. IV, являются процентилями распределе-ХИ квадрат с т степенями свободы (см. разд- 3.2).
132
Глава 3
лем, когда справедливо допущение об экспоненциальном распределении времени безотказной работы, а в остальных случаях он может приводить к ошибочным результатам.
Обратимся теперь к более общим статистическим моделям теории надежности. Эти модели часто более реальны, хотя и более сложны, чем экспоненциальное распределение.
Распределение Вейбулла
Во многих случаях неадекватность экспоненциального распределения как статистической модели для времени безотказной работы обусловлено ограничительным допущением о постоянстве интенсивности отказов. Следовательно, в тех случаях, когда вероятность отказов меняется с течением времени, необходимы более общие распределения.
Распределению Вейбулла соответствует интенсивность отказов
<3-47>
Плотность распределения Вейбулла имеет вид
/('; ч. ») =
“>0' ”>0’(3.48) I 0 в остальных случаях,
где а — параметр масштаба, а Т| — параметр формы. Интенсивность отказов и плотность распределения Вейбулла принимают самые разнообразные формы, что можно видеть из графиков на рис. 3.15 и 3.16, построенных для различных значений ц. В частности, при т|>1 распределение Вейбулла является одновершинным и интенсивность отказов возрастает с течением времени. При 7j<l распределение Вейбулла имеет вид кривой убывающей функции и с течением времени интенсивность отказов уменьшается. Прит; = 1 интенсивность отказов постоянна и распределение Вейбулла совпадает с экспоненциальным. В данном случае параметр масштаба а распределения Вейбулла равен обратному значению параметра к экспоненциального распределения. Распределение Релея [см формулу (3.36)1 является распределением Вейбулла при = 2. Из выражения (3.47) следует, что соответствующая интенсивность отказов является линейно возрастающей функцией времени t
Распределение Вейбулла часто принимается в качестве статистп ческой модели для времени безотказной работы на основе экспериментальных данных; удовлетворительные результаты получены для электронных ламп, реле и шариковых подшипников [3.261 —
Ofl -
Ндо -
zfl
______I__________:-----------1 I* - 1,0 2,0 3,0 4.0
Рис. 3.15. Интенсивности отказов для распределений Вейбулла с а=
различными значениями ц.
2,0
1.8
1,6
/,4
1,2
*1,0
0,8
0,6
'?-О5
О 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0
рис. 3.16. Распределения Вейбулла для а=1 и различных значений
13.31 ]. Время безотказной работы некоторых видов промышленного оборудования также имеет распределение Вейбулла.
Теоретическое обоснование распределения Вейбулла на основе теории экстремальных значений будет показано в следующем разделе.
Интегральную функцию распределения Вейбулла
о[-«]«»=
-.1—ехр[ —(Т-)'], />0, (3.49)
можно легко вычислить. Допустим, например, что время безотказной работы электронной лампы определенного типа имеет распределение Вейбулла с параметрами т( = 2 ив - 8; время испытаний выражено через число лет. Тогда вероятность появления отказа в первые два года будет равна
Р ((< 2) = F (2; 2, 8) = 1 - ехр [ — = 0,06.
Распределение Вейбулла можно обобщить на случай произвольного начала отсчета, введя параметр ц, характеризующий центр распределения. Таким образом, плотность распределения имеет вид
К1. — оо<1х<оо, а > 0, 7J>0, (3.50)
[ 0 в остальных случаях.
При испытаниях на долговечность параметр р. обозначает длительность начального периода, в течение которого отказы не происходят.
Оценка параметров распределения Вейбулла по результатам испытаний обычно предполагает решение нелинейных уравнений. Метод оценки параметров описан в работах Као Г3.341 и Хана и Годфри (3.35 J. В гл. 8 рассматривается более простой графический способ оценки, который часто приемлем для решения практических задач. Методы получения доверительных пределов описаны в работах Джонса и Либермана (3.60) и Майна (3.611.
Распределения экстремальных значений
Выход из строя компонента или системы часто можно связать с экстремальными значениями, зависящими непосредственно от наибольшего или наименьшего значений в выборке случайных
Непрерывные распределения
135
величий, распределенных по определенному закону. Рассмотрим, /например, две электрические цепи, содержащие по п компонентов, выбранных случайным образом из одной и той же партии. В перовой цепи компоненты соединены последовательно, и цепь выходит рз строя при отказе первого компонента. Во второй цепи компоненты соединены параллельно, и цепь выходит из строя при отказевсех компонентов. При испытаниях на усталость при постоянном напряжении выход из строя испытываемого образца может иепосред-гвенно зависеть от прочности самого слабого из большого числа Цементов» данного вещества. При анализе бумажных конденсато-эв предполагается, что в материале случайным образом распре-глено очень большое число дефектов и что напряжение пробоя зависит непосредственно от дефекта, имеющего самые крупные размеры.
, В этих случаях нас интересует распределение наименьшего элемента (минимального значения) или наибольшего элемента (максимального значения) в выборке, взятой из совокупности, имеющей Некоторое исходное распределение. Часто это исходное распреде--ление неизвестно и невозможно получить выборку непосредственно, I как при испытаниях на усталость и в примере с напряжением про-; боя конденсатора, где наблюдаются лишь минимальное или максимальное значения. В общем случае распределение минимального | или максимального значения зависит от объема выборки п и характера исходного распределения. Однако если п велико, то можно использовать некоторые общие асимптотические результаты, которые зависят от некоторых ограничительных допущений относительно 'исходного распределения.
» Известны три типа асимптотических распределений как для минимальных, так и максимальных значений, основанных на различных исходных распределениях (не все из которых возможны).
Особый интерес представляют следующие случаи:
g 1. Асимптотическое распределение типа I для максимальных ‘значений.
к 2. Асимптотическое распределение типа I для минимальных значений.
I? 3. Асимптотическое распределение типа III для минимальных значений.
I Асимптотическое распределение типа I называется распределением экстремальных значений типа I, распределением экстремальных значений Гумбеля или просто распределением экстремальных значений. Асимптотическое распределение для минимальных значений типа III является распределением Вейбулла. Теперь рассмотрим эти три случая.
j Асимптотическое распределение максимальных значений типа 1 является предельной моделью при я->оо для распределения макси
136
Г лава 3
мального числа п независимых случайных величин, имеющих исходное распределение, правый «хвост» которого неограничен и имеет вид экспоненты, т. е. значение интегральной функции исходного распределения приближается к единице при возрастании значений с интенсивностью, соответствующей функции экспоненциального распределения (более полное определение дается в работах Гумбеля [3.36] и [3.371). Так как гамма-распределение (частный случай экспоненциального распределения), нормальное и логарифмически нормальное распределения не ограничены справа и имеют вид экспоненты, то это дает широкий выбор возможных исходных распределений.
Таким образом, асимптотическое распределение максимальных значений типа 1 может использоваться для описания времени безотказной работы электрической цепи, состоящей из п параллельно соединенных компонентов. Если п — большое число, то длительности безотказной работы распределены по одному и тому же закону, имеющему вид экспоненты, и отказы происходят независимо друг от друга. Однако применение этой модели не ограничивается испытаниями на долговечность и теорией надежности. Например, асимптотическое распределение типа 1 успешно используется для описания годового дебита воды определенной реки в заданном пункте измерения. Как показал Гумбель [3.371, в этом случае принимаются следующие допущения:
1. Суточный дебит имеет распределение типа экспоненциального.
2. Исходное число элементов — 365 суток — достаточно велико для применения асимптотической теории.
3. Суточные дебиты взаимно независимы.
Хотя очевидно, что последнее допущение несправедливо, графическое представление распределения по экспериментальным данным (см. гл. 8) показывает, что в данном случае асимптотическое распределение типа I вполне приемлемо, и эта модель использовалась при проектировании плотин.
К другим величинам, описываемым асимптотическим распределением' максимальных значений типа I, относятся: скорость порывов ветра, испытываемых самолетами; длительность вымирания популяций; максимальные индексы фондовой биржи за год и глубина коррозионных язвин в металле [3.361 — [3.411, [3.621. [3.631.
Асимптотическое распределение минимальных значений типа I является предельной моделью при н-»-оо для распределения минимального числа п независимых случайных величин, исходное распределение которых имеет вид экспоненты и не ограничено слева. Как уже указывалось, нормальное распределение имеет вид экспоненты и ие ограничено ни справа, ни слева. Таким, образом, асимптотическое распределение минимальных значений типа I приемлемо
Непрерывные распределения
137
в качестве статистической модели для времени безотказной работы | цепи, состоящей из большого числа последовательно соединенных I компонентов при допущении, что длительности безотказной работы | отдельных компонентов — независимые случайные величины, К распределенные по нормальному закону с одинаковыми математи- ческими ожиданиями и дисперсиями.
Интенсивности отказов и плотности распределений соответ-I ственно максимального и минимального значений типа I имеют I вид
h lt\ — expt—(l/q)(f — ti)| ,o е I „X
h ~ 9{e‘xpb-<W'»-^-1| ’ (3 51a)
Л (/) = -y- exp j, (3.516)
/(/; ft a) «.-J-exp [-1 (/ -•'-»» ] ,
— oo < /<«», —roo<p<oo, o>0, (3.52a)
/ (*’, I*. a) = 4*exp [4~~,
— Op <t < 00, —оо<;(1<ао, O>0. (3.526)
Интенсивности отказов и плотности распределений для ц = 5 и а — 1 показаны на рис. 3.17 и 3.18.
Из формул (3.52а) и (3.526) и рис. 3.18 видно, что плотности асимптотических распределений типа 1 для максимальных и минимальных значений являются зеркальными отражениями друг друга. Первое распределение имеет правостороннюю отрицательную асимметрию, а второе — положительную. Интенсивность отказов для минимального элемента возрастает с течением времени как экспоненциальная функция; для максимального элемента это возрастание происходит с убывающей интенсивностью и интенсивность отказов асимптотически приближается к некоторому постоянному значению (рис. 3.17).
Заметим, что, как и в случае нормального распределения, параметры |л и з асимптотического распределения типа Г являются .'Соответственно параметрами, характеризующими центр распределения и его масштаб; однако в данном случае ц и □ не являются соответственно математическим ожиданием и средним квадратическим отклонением. Параметр р является модой распределения и ЕЯязан с математическим ожиданием следующим образом.
10,0-
9,0 -
8,0-
7,0 -
6,0-
5ft~
4,0-
3,0 -
2,0-
1.0-
Рис. 3.17. Интенсивности отказов для распределений экстре;,ильных зил ний типа 1 с ]j-==5 и /т=1.
I — распределении минимальных зппчониЛ типа I; 2—распред.'леиие пдксаллльиых ды -нив типа I.
Рис. 3.18. Распределения экстремальных значений при р>=5 и <г=1.
— распределение минимальных аиачспнП типа 1: 3 — распределение максимальных зьа‘-е
Непрерывные распределения
139
Для асимптотического распределения максимальных значений типа 1 математическое ожидание равно
0,577 а.
Для асимптотического распределения минимальных значений Типа 1 математическое ожидание равно
[л-0,577 а.
Среднее квадратическое отклонение для обоих асимптотических >аспределений типа I равно 1,283 о. Поскольку у распределения 1того типа отсутствует параметр формы, то оно имеет только одну Юрму. Следовательно, это распределение не приводит к таким разнообразным интенсивностям отказов, как это имеет место в случае распределения Вейбулла. Заметим также, что это распределение не ограничивается неотрицательными значениями случайных реличин [хотя в случае испытаний на долговечность для /<0 функция /1(0 не имеет смысла].
f Имеются таблицы 13.481 значений и плотности асимптотического . распределения типа I и соответствующей ей интегральной функции —
распределения
F(y, 0; 1) == j ехр [—(x4-r-')l dx = ехр[— е~>] (3.53а) для нормированной, или «приведенной», случайной величины
у = (3.54)
Здесь приводятся также процентили распределения, т. е. значения функции
*(«)»-In [in (4)]
Гем. формулы (2.56) и (2.53а)] для различных значений а. Заменяя у на —у в выражении для плотности и F(y) на 1 — F(—y) в выражении для интегральной функции распределения, эти таб-I лицы можно использовать для асимптотического распределения уинимальпых значений типа I. Последняя замена обусловлена тем, ,|То интегральная функция асимптотического распределения мини-ДМальных значений типа 1 нормированной случайной величины имеет
F(w) = l—ехр(—в>).
(3.536)
140
Применение этих таблиц иллюстрируется на следующем примере.
Максимальное потребление электрической энергии в данной местности в любое время года связано с резкими колебаниями метеорологических условий и имеет асимптотическое распределение максимальных значений типа I с параметрами [л = 2000 и а = 1000. При оценке соответствия нового генератора требуется определить 1) вероятность того, что в каком-либо из периодов в течение года потребление электрической энергии превысит 4000 кет-, 2) требуемую мощность, вероятность превышения которой в данном году составляет лишь 0,05.
По формуле (3.54) определяем значение у, соответствующее t = 4000 кет:
а из табл. 1 Национального бюро стандартов [3.48 I находим
F(2; 0; 1) = 0,873.
Таким образом, вероятность того, что требуемая мощность превысит 4000 кет, равна одной восьмой.
Чтобы ответить на вторую часть вопроса, необходимо определить 95-й процентиль годового спроса, т. е. найти такое значение у, для которого
F(y,0, 1) = 0,95.
Пользуясь табл. 1 в обратном порядке (или табл. 2 в обычном порядке) Национального бюро стандартов [3.481, находим, что у = — 2,97. С помощью формулы (3.54) находим 95-й процентиль:
t — ay -)- гл = 4970 кет.
Оценки параметров распределения экстремальных значений на основе имеющихся экспериментальных данных можно получить путем графического представления распределений (см. гл. 8). Кроме того, приведенные выше соотношения между математическим ожиданием и средним квадратическим отклонением распределения и его параметрами могут быть использованы путем приравнивания моментов, т. е. приравнивая математическое ожидание и среднее квадратическое отклонение соответствующим выборочным значениям, находим следующие оценки:
а = 1,283 s, (3.55)
£ = 7—0,577 а (3.56а)
Непрерывные распределения
для распределения максимальных значений и
|* = х 4- 0,577 а (3.566)
для распределения минимальных значений, где х и s получены на основе экспериментальных данных с помощью формул (2.31) и (2.51а). Существуют также методы, обеспечивающие более точные оценки, которые применимы при небольшом числе наблюдений или в случйе цензурированных выборок (13.27 ], [3.371, [3.38]. [3.421, 13.43 1).
Как уже указывалось ранее, асимптотическое распределение минимальных значений типа III эквивалентно распределению Вей-булла (см. выше). Это предельная модель при «->«> для распределения минимальных значений п случайных величин, имеющих различные исходные распределения, ограниченные слева. Одним из таких исходных распределений является гамма-распределение. Так, если в некоторой цепи одинаковые элементы соединены последовательно н если их время безотказной работы имеет гамма-распределение, то время безотказной работы цепи имеет асимптотическое распределение типа III, или распределение Вейбулла, а не асимптотическое распределение типа I, как в случае, когда исходным распределением является нормальное [3.55]. В работе Фройденталя и Гумбеля [3.331 с помощью теории экстремальных значений обосновано применение распределения Вейбулла в качестве статистической модели для прочности материалов на разрыв. Эта модель использовалась также при анализе засухи, проводившемся аналогично исследованию наводнений. Однако при изучении засухи представляют интерес не максимальные, а минимальные значения.
Мы завершим этот вопрос следующими общими замечаниями относительно распределений экстремальных значений:
1. На примере гамма-распределения видно, что асимптотические распределения минимальных и максимальных значений, имеющих одно и то же исходное распределение, не обязательно будут Одинакового типа. Как уже указывалось выше, минимальные значения случайных величин с исходным гамма-распределением имеют распределение типа III, а максимальные значения — распределение типа I.
2. Выбор минимального значения из выборки, имеющей асимптотическое распределение минимальных значений типа I или типа 41, приводит к асимптотическому распределению того же типа. Аналогичный результат справедлив при взятии максимального значе-11Ни в выборке, имеющей асимптотическое распределение максимальных значений. Однако асимптотическое распределение мини-МПльных значений случайных величин, имеющих асимптотическое В₽ определение максимальных значений, и распределение макси
142
Г ла в а 3
мальных значений случайных величин, имеющих асимптотическое распределение минимальных значений, будут распределениями типа I (соответственно минимальных и максимальных значений) независимо от того, является ли исходным распределение типа I или типа III.
3. Распределения экстремальных значений различного типа тесно связаны друг с другом. Например, методами, изложенными в гл. 5, легко показать, что логарифм случайной величины, распределенной по закону Вейбулла, имеет распределение минимальных значений типа I. Этот результат использовался при выводе методики оценки параметров распределения Вейбулла (см., например, 13.271 и 13.431).
4. В этой книге изучались асимптотические распределения минимальных и максимальных значений. В литературе рассматриваются асимптотические распределения /n-го наибольшего и т-го наименьшего значений. Имеются таблицы процентилей асимптотического распределения типа I т-го наибольшего значения [3.481
5. Рассмотренные выше результаты являются асимптотическими, т. е. они выведены для случая, когда Скорость сходимости к этому асимптотическому результату, т, е. степень его применимости при не очень большом значении п, зависит от исходного распределения. Например, если исходным распределением является экспоненциальное, то для того, чтобы распределение максимальных значений приблизилось к асимптотическому распределению типа I, необходимо меньшее число наблюдений, чем в том случае, когда исходным распределением является нормальное. Так, Гумбель 13.371 приводит графики, показывающие, что хорошая сходимость к асимптотическому распределению достигается для 10 выборок с исходным экспоненциальным распределением, тогда как совпадение в «хвосте» асимптотического распределения сомнительно даже при взятии 100 экстремальных значений нормально распределенной случайной величины. В тоже время, если исход ным является распределение экстремальных значений того же типа, что и асимптотическое распределение, то асимптотический результат применим для любых п.
Теория, лежащая в основе точного (в отличие от асимптотического) распределения максимальных, минимальных или /n-х наибольших значений, взятых из выборок объемом п, хорошо известна [3.361, [3.371, [3.551, и для некоторых распределений получены полезные таблицы. Наиболее важными из них являются таблинь процентилей распределения максимальных значений в выборках объемом п — 3, 5, 10, 20, 30, 50, 100, 200, .... 1000 из нормальной совокупности, приведенные в книге Пирсона [3.57]; частично эти таблицы представлены графически в книге Гумбеля 13.37). Имеютс я также таблицы процентилей распределения /н-х наибольших зна
Непрерывные распределения
143
чений в выборках объемом от 1 до 10, взятых из совокупности, имеющей гамма-распределение с tq — 1, .... 5 13.56], 13.58]. Когда п относительно мало и характер рассматриваемого распределения известен, более предпочтительно по возможности использовать точные результаты. Например, так следовало бы поступить при вычислении времени безотказной работы в задаче об электрической цепи, если бы цепь содержала пять компонентов и было известно, что длительности их безотказной работы имеют одинаковое нормальное или гамма-распределение с определенными значениями параметров.
Однако во многих случах исходное распределение не известно и его невозможно наблюдать, поэтому часто приходится обращаться к асимптотической теории.
6. Кроме асимптотических распределений типа I и асимптотического распределения минимальных значений типа Ill, рассмотренных в этом разделе, существуют также асимптотические распределения типа II и асимптотическое распределение максимальных значений типа 1.11. Последнее распределение связано с асимптотическим распределением минимальных значений типа III аналогично тому, как связаны между собой асимптотические распределения минимальных и максимальных значений типа 1. Таким образом, это предельная модель распределения максимальных значений при различных исходных распределениях, ограниченных справа. Асимптотические распределения минимальных и максимальных значений типа II появляются в случае таких исходных распределений, как распределение Коши, у которого нет конечных моментов. Поскольку такие исходные распределения встречаются в практической деятельности редко, применение асимптотического распределения максимальных значений типа I и асимптотических распределений типа II ограничено. Более подробно этот вопрос рассматривается в книге Гумбеля (3.37 J.
Гамма-распределение и логарифмически нормальное распределение как статистические модели для времени безотказной работы
Как было показано в предыдущих разделах, гамма-распределение и логарифмически нормальное распределение позволяют описать самые различные случайные величины со значениями от нуля до бесконечности. Естественно, что благодаря такому свойству эти распределения можно рассматривать как возможные статистические модели для времени безотказной работы.
. Как и другие статистические модели, описывающие испытания ^Долговечность, гамма-распределение и логарифмически нормаль-ое Распределение приняты в качестве распределений времени без-Ьов3'3"?^ Работы как на теоретической, так и эмпирической ос-с- Гамма-распределение можно рассматривать как обобщение
Непрерывные распределения
экспоненциального распределения для случая, когда отказ происходит при появлении ровно k событий, при условии, что события появляются независимо друг от друга с постоянной интенсивностью. Такпм образом, это распределение приемлемо в качестве модели для времени безотказной работы системы с одним действующим и k—I резервными компонентами, когда новый компонент начинает работать сразу же после отказа предыдущего компонента и когда время безотказной работы каждого компонента распределено по экспоненциальному закону. В этом случае система выходит из строя при отказе последнего компонента. При увеличении k гамма-распределение приближается к нормальному (см. разд. 3.2). В данном случае время безотказной работы системы обычно не имеет максимума вблизи нуля, и, следовательно, высказанное ранее возражение против нормального распределения как статистической рмодели для времени безотказной работы не справедливо.
I Обоснование применимости логарифмически нормального распределения для описания времени безотказной работы основано на «свойстве умножения эффектов, присущем данному распределению |(о чем говорилось ранее). Однако из этого свойства логарифмически нормальное распределение более непосредственно вытекает для [степени износа к определенному моменту времени, чем для времени [безотказной работы.
| Теоретическое обоснование применимости гамма-распределения 'и логарифмически нормального распределения в качестве статистических моделей для времени безотказной работы подтверждается и эмпирическими результатами. Например, в работе Пека [3.45] •Приводится пример, в котором наблюденные длительности безотказной работы транзисторов хорошо описываются логарифмически нормальным распределением.
Г 'Сравнение интенсивностей отказов для гамма-распределения и логарифмически нормального распределения (рис. 3.19 и 3.20) показывает, что в некоторых случаях кривые аналогичны. Таким Образом, эмпирические данные иногда могут быть почти так же хорошо описаны с помощью любой из этих моделей или, возможно. другим из рассмотренных ранее распределений. Поэтому важно, чтобы выбор распределения времени безотказной работы основывался на понимании физических механизмов отказов, особенно когда модель будет использоваться для экстраполяции за пределами области полученных данных.
3-е. СВОДКА НЕПРЕРЫВНЫХ РАСПРЕДЕЛЕНИЙ
Сведения о распределениях, рассмотренных в данной главе, кратко обобщены на рис. 3.21 и в табл. 3.2. На рис. 3.21 показаны также математическое ожидание, дисперсия и нормированные третий и четвертый моменты (У£| и (Э2) Для каждого распределения. 6—52
146
147
Параметры
Плотность распределения
цх\ _ ----!----e-tx-u)*/2»*
'W“ s/йГ
/(*) =
(^У'1 *>«.
Х>0, Ч>0
/(•V)
х>0
в остальных случаях
148
1-19
Название распределения
Параметры
Плотность распределения
Параметр
Г (•>! + 7) /Г-1 (1—хр-1 , 0 < X < 1, Г.МШ)
О в остальных случаях
т|7
(тгг7)а (1 + 7 4-1)
(л0, [*!, где !*о < И1
О в остальных случаях
2
g(T-T) + (то'МИ-ч-гЯ)
з (n 4- т + 1) |2 (7 -H)a 4- пт (n 4- т—6)1 . ПТ (П 4*Т + 2) (" 4~ 7 +3)
*** 31 = 34-(ш— l)(u?4-3wJ4-to4-.6); ш = в°’
Рис. 3.21 (продолжение}
153
154
Параметры
Плотность распределении
Рис. 3.21 (продолжение)
155
Математическое С 0ЖИДИНПС Дисперсия 15.
('ЪУ', г ут 0,429s5 • 0,63 3,26
Конечное значение отсутствует Конечное значение отсутствует Конечное значение отсутствует Конечное значение отсутствует
гН »в[г(— 4-l) - -Н»Г1 »♦
Для максимальных значений Ё н +0,5776 Для минимальных Н — 0,5776 1,645т5 Для максимальных значений: 1.14 Для минимальных значений: -1,14 5.4
Распределение Применение Примеры Примечание
Нормальное Основное распределение математической статистики. Многие применения обусловлены центральной предельной теоремой (распределение среднего п наблюдений стремится к нормальному независимо от формы исходного распределения при довольно общих условиях). Вследствие этого нормальное распределение является приемлемой моделью для многих (но не для всех) физических явлений Распределение физических свойств живых организмов, значений коэффициента умственного развития, размеров' изделия, средней температуры и т. д. Имеются таблицы значений интегральной функции нормированного нормального распределения. Многие методы статистического анализа основаны на допущении о нормальном распределении
Гамма-распределе- Основное распределение мате-. Распределение времени между Имеются таблицы значений ин-
ние магической статистики для случайных величин, ограниченных с одной стороны, например 0 < оо. Описывает время, необходимое для появления ровной независимых событий при условии появления событий с постоянной интенсивностью. Часто используется в теории массового обслуживания, теории надежности н других технических приложениях повторными калибровками прибора , требующего повторной калибровки после пользования нм k раз; распределение времени между моментами пополнения запасов; распределение времени безотказной работы системы с резервными компонентами тегральной функции распределения. Частными случаями являются распределения: Эрланга, экспоненциальное и хи-квадрат
Экспоненциальное Распределение времени между независимыми событиями, появляющимися с постоянной интен- Распределение времени между моментами поступления частиц в счетчик. Кроме того, распре- Частный случай распределения Вейбулла и гамма-распределения
Продолжение табл. 3.2
Распределение
Применение
Примеры
Примечание
Бета-распределение
Равномерное
сивиостью. Распределение времени безотказной работы при постоянной интенсивности отказов. Вследствие этого широко применяется во многих (но не во всех) задачах теории надежности
Основное распределение математической статистики для случайных величин, ограниченных с обеих сторон, например 0 х< 1. Применяется во многих областях при решении как теоретических, так и прикладных задач
Дает вероятность того, что наблюдение будет лежать в определенном интервале, когда вероятность того, что наблюдение принадлежит данному интервалу, прямо пропорциональна длине интервала
деление времени безотказной работы сложных нерезервированных систем и времени использования некоторых компонентов, в частности, когда они подвергаются начальной приработке, а профилактическое обслуживание позволяет заменять детали до полного износа
Распределение доли совокупности, заключенной между наименьшим и наибольшим значениями выборки. -Распределение суточного производства продукции на промышленном предприятии. Распределение времени. оставшегося до завершения работы (система ПЕРТ)
Используется для генерирования случайных чисел
Имеются таблицы значений интегральной функции распределения. Частными случаями являются равномерное, треугольное и параболическое распределения
Частный случай бета-распределения
Логарифмически
Позволяет описать случайные величины, логарифм которых распределен по нормальному закону. Модель длд процесса, появляю-
Релеевское
Распределеййе размеров кусков породы при ее дроблении. Распределение размера дохода, размера наследства и суммы
щегося в результате большого числа небольших мультипликативных ошибок. Применимо, когда наблюдаемое значение случайной величины составляет случайную долю ранее наблюденного значения
банковских вкладов. Распределение различных биологических явлений. Распределение времени безотказной работы транзисторов некоторых Типов
Распределение радиальной ошибки, когда ошибки по двум взаимно перпендикулярным осям взаимно независимы и нормально распределены относительно нуля с одинаковыми дисперсиями
Задачи прицеливания при бомбометании. Амплитуда огибающей шума при использовании линейного Детектора
Частный случай распределения Вейбулла
Распределение Ко- Распределение отношения Распределение отношения нор- Распределение не имеет конеч
ши двух независимых нормированных нормальных случайных величии мированных отсчетов шума. Распределение tg в, когда 0 имеет равномерное распределение пых моментов
Распределение Общее распределение времени Распределение времени безот- Частными случаями являются
Вейбулла Распределение эк- безотказной работы при самых разнообразных интенсивностях отказов. Распределение экстремальных значений для минимальных элементов, взятых из Означений, имеющих распределение, ограниченное слева казной работы для некоторых конденсаторов, шариковых подшипников, реле и т. д. релеевское и экспоненциальное распределения
стремальных Предельная модель для распре- Распределение прочности на Имеются таблицы значений ин-
значений деления максимальных пли минимальных значений, взятых из N наблюдений, имеющих распределение «типа экспоненты», например, нормальное, гамма-распределение или экспоненциальное разрыв для некоторых материалов: распределенпе напряжения пробоя конденсаторов; распределение силы порывов ветра, встречаемых самолетами; распределение времени вымирания бактерий тегральной функции распределения
ЛИТЕРАТУРА
3.1. В е п n е t t С. A., F г а п к I i п N. L., Statistical Analysis in Chemistry and the Chemical Industry, John Wiley, New York, 1954.
3.2. Bowker A. H . Lieberman G. J., Engineering Statistics, Prentice-Hall, Englewood Cliffs, New Jersey, 1959.
3.3. Brownlee K- A., Statistical Theory and Methodology in Science and Engineering, 2nd ed., John Wiley, New York, 1965.
3.4. D a v i s O. L. (ed.), Statistical Methods in Research and Production 3rd ed., Hafner Publishing Co., New York, 1961.
3.5. D i x о n W. J., M a s s e у F. J., Jr., Introduction to Statistical Analysis. 2nd ed . McGraw-Hill, New York, 1957.
3.6. Volk W., Applied Statistics for Engineers, McGraw-Hill, New York. 1958.
3.7. Co x D. R.. S m i t h W. L.. Queues. John Wiley, New York, 1961. Имеется русский перевод: К о к с Д. Р., Теория очередей, М., изд-во «Мир», 1966.
3.8. Morse Р. М., Queues, Inventories and Maintenance, John Wilev, New York, 1958.
3.9. S a a t у T. L., Elements of Queueing Theory with Application, McGraw-Hill, New York, 1961. Имеется русский перевод: Саати Т. Л., Элементы теории массового обслуживания и ее приложения. М.. изд-во «Советское радио». 1965.
3.10. Schlaifer R.. Probability and Statistics for Business Decisions. McGraw-Hill, New York, 1959'.
3.11. W i I k M. B., G n a n a d e s i k a n R., H u у e t t M. J.. Probability Plots for the Gamma Distribution, Technometrics, 4, 1 (1962),
3.12. Green wood J. A., Durand D., Aids for Fitting the Garnnia Distribution by Maximum Likelihood, Technometrics, 2, 55 (1960).
3.13. W i 1 k M. B.. GnanadesikanR., H U у e t t M. J., Estimation of Parameters of the Gamma Distribution Using Order Statistics. Biometrika, 49. 525 (1962).
3.14. Pearson K-, Tables‘Of the Incomplete Beta-Function, Biometrika Office, University College, London, 1948.
3.15. Harter H. L.. New Tables of the Incomplete Gamma-Function Ratio and of Percentage Points of the Chi-square and Beta Distributions. Aerospace Research Laboratories, U. S. Air Force, 1964.
3.16. Pear s o n E. S., II aril e у H. O., Biometrika Tables for Statisticians, v. 1, Cambridge University Press, Cambridge, 1954.
3.17. M a I с о I m D. G., Roscboom J. H., C 1 a r k С. E., F a z a r W., Application of a Technique for Research and Development Program Evaluation, Operations Research, 7, 646 (1959).
3.18. W i I k s S., Statistical Prediction with Special Reference to the prob lem of Tolerance Limits, Ann. Math. Statist,. 13, 400 (1942).
3.19. A i t c h i s о n J , Brown J. A. C., The Log-normal Distribu tion, Cambridge University Press, Cambridge, 1957.
3.20. Epstein B., The Mathematical Description of Certain Breakage Mechanisms Leading to the Logarithmic-Normal Distribution, J. Franklin Inst., 244. 471 (1947).
Непрерывные распределения
161
3.21. Middleton D.. An Introduction to Statistical Communication Theory, McGraw-Hill, New York, 1960. Имеется русский перевод: M ИДДЛТО и Д-, Введение в статистическую теорию связи, т. 1 —2, М., изд-во «Советское радио», 1961.
3.22. Dre nick R. F., The Failure Law of Complex Equipment, J. Soc. [ Ind. Appl. Math., 8. 680 (1960).
3.23. Da vis D. J., An Analysis of Some Failure Data, J. Am. Statist. Assoc., 47, 113 (1952).
3.24. Epstein B., Estimation from Life Test Data, Technometrics, 2, 447 (1960).
3.25. Basov sky I., Reliability‘Theory and Practice. Prentice Hall, Englewood Cliffs, New Jersey, 1961. Имеется русский перевод: Б а-з о в с к и fl И-, Надежность. Теория и практика. М., изд-во «Мир», | 1965.
3.26. W е i b u I I W., A Statistical Distribution Function of Wide Applicability. J. Appl. Meeh., 18, 293 (1951).
3.27. 1. i e b I e I n J., Zelen M., Statistical Investigation of the Fatigue ' Life of Deep-Groove Ball Bearings, J. Res. Nat. Bur. St., 57, 273 F (1956).
3.28. Kao J. H. K-, A New Life Quality Measure for Electron Tubes. IRE Trans. Reliability Quality Control. 7, 1 (1956).
3.29. К a о J. H. K-. A Summary of Some New Techniques on Failure Anas’ lysis, Proc. 6th Nat. Symp. Reliability and Quality Control in Electronics, 190—201, 1960.
3.30. Perry .1. N., Semiconductor Burn-in and Weibull Statistics, Semiconductor Reliability, v. 2, Engineering Publishers, Elizabeth, New Jersey, 80-90, 1962.
3.31. Procassini A.. R о m a n о A., Weibull Distribution Function in Reliability Analysis, Semiconductor Reliability, v. 2, Engineering Publishers. Elizabeth. New Jersey. 29—34, 1962.
3.32. Fisher R. Л., T i p p e 11 L. H. C.. Limiting Forms of the Fre-r ’ fluency Distribution of the Largest or Smallest Member of a Sample, Proc Cambridge Phil. Soc., 24 (2). 180 (1928). Эта статья перепечатана в книге: Fisher R. A.. Contributions to Mathematical Statistics, John Wiley. New York. 1950.
3,33. Freudenthal Л. M., G u m b e I E. J., On the Statistical Interpretation of Fatigue Tests, Proc. Royal Soc., Ser. A.. 216, 309 (1953).
3.34, Kao .1. H. K-. Computer Methods for Estimating Weibull Parameters in Reliability Studies. IRE Trans. Reliability Quality Control., 13. 15 (1958).
3.35. HahnG. J.. Godfrey J. T., Estimation of Weibull Distribu-> tion Parameters with Differing Test Tinies for Unfailed Units. Technometrics. 6, 118 (1964) (реферат).
3-36. G ti m b e I E. J.. Statistical Theory of Extreme Values and Some Practical Applications, Nat. Bur. Std., Appl. Math. Ser. 33.
8-37. Gumbel E. J., Statistics of Extremes, Columbia University Press.
L New York, 1958. Имеется русский перевод: Г у M б e л ь Э., Статнсти-ка экстремальных значении, М.. изд-во «Мир», 1965.
S’®®- L i е b I е i n J., A New Method for Analysing Extreme Value Data, • National Advisory Committee for Aeronautics Technical Note 3053, в January 1954.
162
Глава 3
3.39. Press Н., The .Application of Statistical Theory of Extreme Values to Gust-Load Problems. National Advisory Committee for Aeronautics, Report 991, I960.
3.40. Epstein B., Application of the Theory of Extreme Values in Fracture Problems, J. Amer. Statist. Assoc., 43, 403 (1948).
3.41. Epstein В.. В г о о к s H., The Theory of Extreme Values and Its Implications in the Study of the Dielectric Strength of Paper Capacitors, J. Appt. Phys., 19, 544 (1948).
3.42. К i m b a 1 1 B. F., Sufficient Statistical Estimation Functions for the Parameters of the Distribution of Maximum Values, Ann. Math. Statist., 17. 299 (1946).
3.43. Downton F., Linear Estimates of Parameters in the Extreme Value Distribution, Technometrics, 8, 3 (1966).
3.44. Mather K., The Analysis of Extinction Time Data in Bioassay, Biometrics. 5, 127 (1949).
3.45. Peck D. S., Uses of Semiconductor Life Distributions. Semiconductor Reliability, v. 2, Engineering Publishers, Elizabeth, New Jersey, 10-28, 1962.
3.46. Anderson T. W., An Introduction to Multivariate Stalisticfil Analysis, John Wiley, New York, 1958. Имеется русский перевод: А н д е р-с о н Т., Введение в многомерный статистический анализ, М.. Физ-матгиз, 1963.
3.47. В и с k 1 a n d W. R., Statistical Assessment of the Life Characteristic, Hafner Publishing Co.. New York, 1964.
3.48. Probability Tables for the Analysis of Extreme-Value Data, Nat. Bur. Std., Appl. Math. Ser. 22.
3.49. Johnson N. L.. L e о n e F. C.. Statistics and Experimental Design in Engineering and the Physical Sciences, v. 1, John Wiley. New York, 1964.
3.50. Owen D., Handbook of Statistical Tables, Addison-Wesley Publishing Co.. Reading, Massachusetts, 1962. Имеется русский перевод: Оуэ н Д- Б., Сборник статистических таблиц, ВЦ АН СССР, М., 1966.
3.51. LeoneF. С., N е I s о п L. S.. N о t t i n g h a m R. B., The Folded Normal Distribution, Technometrics, 3, 543 (1961).
3.52. H a I d A., Statistical Theory with Engineering Applications, John Wiley, New York, 1952. Имеется русский перевод: Хальд А., Математическая статистика с техническими приложениями, М-, ИЛ. 1956.
3.53. Epstein В., Elements of the Theory of Extreme Values, Technometrics. 2. 27 (1960.)
3.54. Pearson K., Tables of the Incomplete Г-Function, Biometrica Office, University College, London, 1957.
3.55. Pieruschka E., Principles of Reliability, Prentice-Hall. Englewood Cliffs, New Jersey, 1963.
3.56. SarhanA. E., Greenberg B. G., Contributions to Order Statistics, John Wiley, New York, 1962.
3.57. Pearson K-. Tables for Statisticians and Biometricians, v. 2, Cam bridge University Press, Cambridge, 1931.
3.58. GuptaS. S., Order Statistics from the Gamma Distribution, Technometrics, 2. 243 (I960).
Непрерывные распределения 163
3.59. Tables of the Bivariate Normal Distribution Function and Related Fun-£ ctions. Nat. Bur. Std., Appl. Math. Ser. 50.
3.60. .1 о h as M. V., Jr., Lieberman G. J., An Exact Asympto-r ideally Efficient Confidence Bound for Reliability in the Case of the Wei-| bull Distribution, Technometrics,. 8, 135 (1966).
3;61. Mann N. R., Exact Three-Order-Statistic Confidence Bounds on Reliability Parameters under Weibull Assumptions, 126th Annual Mee-f ting of the American Statistical Association, Los Angeles. California, 1966.
3.62. Aziz P. M., Application of the Statistical Theory of Extreme Values to the Analysis of Maximum Pit Depth Data for Aluminum, Corrosion, 12, 495 (1956).
Д63. Eldredge G. G., Analysis of Corrosion Pitting by Extreme-Value Statistics and Its Application to Oil Well Tubing Caliper Surveys, Cor-rosion, 13, 51 (1957).
Глава 4
ДИСКРЕТНЫЕ РАСПРЕДЕЛЕНИЯ
В этой главе рассматриваются распределения случайных величин, определенных на дискретном пространстве выборок. Как уже указывалось в гл. 2, для дискретной случайной величины х функция f(xz) представляет собой вероятность того, что х принимает значение х,1*.
Будут рассмотрены характер и применение следующих распределений: биномиального, мультиномиального, гипер геометрического, геометрического, Паскаля, отрицательного биномиального и пуассоновского. Для двух наиболее важных распределений — биномиального и пуассоновского — будут показаны методы оценки параметров распределения и нахождения доверительных интервалов на основе экспериментальных данных. В сводной таб лице, помещенной в конце главы, для каждого распределения при водятся математическое ожидание, дисперсия и нормированные моменты.
4.1. БИНОМИАЛЬНОЕ И МУЛЬТИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЯ
Биномиальное распределение
Во многих инженерных задачах рассматриваются независимы! многократно повторяемые испытания, называемые испытаниями Бернулли. Каждое такое испытание приводит к одному из двух возможных исходов, называемых часто успехом и неудачей, и ве роятность успеха р не меняется от одного опыта к другому. Наиболее знаком нам пример многократного подбрасывания монеты. Если монета является геометрически правильной, то р = 0,5. Часто бывает необходимо знать вероятность появления ровно х (или не менее х) успешных исходов при п независимых испытаниях. Примерами испытаний Бернулли являются также следующие:
О В гл. 2 вероятность того, что дискретная случайная величинахприш' мает определенное значение xt. обозначалась через p(xz). В этой главе и- '1 удобнее принять обозначение /(хД.
Дискретные распределения
165
Е .1. Запланирован запуск десяти космических аппаратов. Веро-ятность успешного запуска каждого аппарата равна 0,95. Какова Вероятность того, что запуск не менее девяти космических аппаратов будет успешным?
Е*2. На регистр цифровой вычислительной машины поступает команда на округление чисел в большую или меньшую сторону до ^ближайшего целого числа. Какова вероятность того, что при обработке десяти случайных чисел ровно половина их будет округлена в большую сторону и ровно половина в меньшую сторону? |Г 3. Планируется размещение двадцати заказов на производство продукции. Вероятность получения заказа данной фирмой в каждом случае оценивается как ’/8. Какова вероятность получения не менее десяти заказов?
R Согласно закону умножения независимых событий (формула (2.9а)], вероятность появления определенной последовательности х'успешных и (п—х) неудачных исходов в п испытаниях равна Р’(1 — р}п~х> где р — вероятность успеха при одном испытании. Из теории сочетаний (4.11 известно, что при п испытаниях х успешных и (п — х) неудачных исходов могут появиться л!/1x1 (п — х)! I различными одинаково возможными способами. Используется следующее обозначение:
Следовательно, согласно закону сложения взаимно исключающих событий (формула (2.56) ], вероятность появления ровно х успешный исходов в п независимых испытаниях определяется биномиальным распределением
Пк р. п) = ( " ) If (1-Р)--', х = 0, 1,2.л;
0<Р<1.
(4.1)
где р вероятность успеха при одном испытании. Используя биномиальное разложение, находим
St(»; р. п) = £( ’ ) р- (1 -р)—’ = г"",‘
= (1 -Р)" + »р(1-р)"-'+ I?! р’(1-р)"-’+ ... +р"=
= (1—Р+Р)"
n=10, p=0,25
n=5, p=0,25
СГ 0,2
Рис. 4.1. Биномиальные распределения при различных значениях п и Г
Дискретные распределения
167
(4-2)
Это необходимое свойство функции распределения1’. Графики би-гдомиальпого распределения для различных значений параметров пир показаны на рис. 4.1.
Вероятность появления не более г успешных исходов в п незави-f симых испытаниях задается интегральной функцией биномиального распределения
Р (х < г) = F (г; р, п) = S (") р>(1— Р)"-', *=0
где р — вероятность успеха при одном испытании.
Имеются следующие таблицы значений интегральной функции биномиального распределения для различных значений р, п и г.
В книге [4.2] для
г = 0(1) л2’;
п = 1 (1)50(2) 100 (10) 200 (20) 500 (50) 1000:
р = 0,01 (0.01) 0.50; А, 4, 4-. 4-. 4,4, 4.
В книге [4.31 для
г = 0Н)л;
п = 2(1)49;
р = 0,01 (0,01) 0,50.
В книге [4.4 1 для
3 5 7_
8 ' 12 ’ 16 *
г = 0(1) л;
л = 50(5) 100;
Р = 0,01 (0,01)0,50.
I В книге [4.16] для
г =0(1)л;
« --= 1 (1)100;
Р --= 0,0001 (0,0001)0,0009; 0,001 (0,001)0,100.
.Примером такой таблицы значений функции Р(х > г] [4.2] явля-
ется табл. 4.1. Чтобы найти P|x<r]=F(r; р, л), заметим, что
Р [х<г) + Р (х>г + 1) = 1.
РчДОвательно,
Р[х<г| = 1 -P|x>r-J- 1|.
п^₽°Ве₽ку справедливости этого свойства для остальных распределе-
BCTOnTeiTp,tBaeMI,IX В даиаой главе1 предлагается выполнить читателю
То есть для всех целых значений г от 0 до л — Прим, ред-
Таблица значений интегральной функции биномиального распределения
для л = 16, 17, , 20 и различных значений р
v(» у и-рг-'
Таблица 4.1
Р = 0,09 р = 0.10 р = 0,|| р«=0,12
Р = 0.14 р = 0,15 р = 0,16
1,00000 1,00000
0,77886 0,81470
0,42893 0,48527
0,16937 0.21075
0,04957 0,06841
0.01106 0,01700
0,00192 0,00330
0,00026 0,00050
0,00003 0,00006
0,00000 0.00001
0,00000
1,00000 1,00000
0,84503 0,87066
0,53858 0,58847
0,25451 0,29987
0,09066 0,11621
0,02485 0,03482
0,00533 0,00818
0,00090 0,00152
0,00012 0,00023
0,00001 0,00003
0,00000 0,00000
1,00000 1,00000 0,88193 0.89228 0,61207 0,63473 0,32292 0,34611 0,13016 0,14484
0,04066 0,04710 0,00998 0,01205 0,00194 0,00245 0.00030 0,00040 0,00004 0,00005
0,00000 0,00001
0,00000
1.00000 0,91047 0,67727 0,39255 0,17625
0,06182 0,01711 0,00376 0,00066 0,00009
0,00001 0,00000
17 0 1,00000 1,00000
1 0,79876 0,83323
2 0,46042 0,51821
3 0,19273 0,23820
4 0,06035 0,08264
0,02214
0,00-167
0.00078
0,01453
0,00274
0,00041
0.00000
0,00005
0,00000
1,00000 0,84991 0,54972 0,26620 0,09820
0,01865
0,00380
0,00062
0,00008
1,00000
0.81688
0,49088
0,21682
0,07226
0,02819
0,00642
0,00117
0,00017
0,00001
1,00000 1,00000 1,00000
0,86208 0,88618 0.89669
0,57229 0.62234 0.64580
0,28576 0,33450 0,35906
0,10869 0,13825 0,15425
0,03209 0.04459 0,05185
0.00747 0,01138 0,01381
0,00139 0,00232 0.00295
1,00000 0,90628 0,6682!
0,38363 0,17100
0.05981 0,01660 0.00369
1,00000 0.92300
0,70992 0,43241 0,20654
0,07784 0,02337
0,00563
1,00000 1,00000 1,00000
0,92575 0,93856 0,94591
0,71610 0,75130 0,77283
0,43862 0,48380 0,51321
0,21011 0,24602 0,27090
0,07905 0,09882 0,11339
0,02354 0,03153 0,03779
0,00559 0,00803 0,01007
0,00106 0,00164 0,00215
0,00016 0,00027 0,00037
0,00002 0,00003 0,00005
0,00000 0,00000 0,00001
0,00000
1,00000 1,00000 1,00000
0,93689 0,94839 0,95493
0,74755 0,78126 0,80168
0,48024 0,52660 0,55648
0,24439 0,28406 0,31128
0,09871 0.1223J 0,13964
0,03187 0,04230 0.05039
0,00828 0,01179 0.01469
19
0,00011 0,00001
0,00002
10
11
12
0.00000 0,00000
1,00000 1,00000
0,83336 0.86491
0,52022 0,57974
0,24148 0,29456
0,08527 0,11500
0,00021 0,00002
0,00000
0.00038
0,00005
0,00001
0,00000
0,00051
0,00007
0,00001
0,00000
0,00066
0,00010
0,00001
0,00000
0,00110
0,00017
0,00002
0,00000
0,00174
0,00030
0,00004
0,00000
5
6
7
8
9
0,02347 0,03519
0,00514 0,00859
0.00091 0,00170
0,00013 0.00027
0,00002 0,00004
1,00000 0,87725 0,60417 0,31728 0,12816
0,04051 0,01018 0,00206 0,00034 0,00005
1,00000
0,89984
0,65400
0,36904
0,16180
0,05583
0,01536
0,00341
0,00061
0,00009
1,00000 0,90960 0,67716 0,39491
0,17986
0,06465
0,01857
0,00430
0,00081
0,00012
1,00000 0,91846 0,69916 0,42062 0.19865
0,07426 0,02222 0,00537 0,00106 0,00017
1,00000
0,93378
0,73975
0,47126
0,23816
0,09586 0,03099
0,00812 0,00173
0,00030
1,00000 0,94635 0,77595 0,52034 0,27976
0,12056 0,04190 0,01182 0,00272 0,00051
0,00266 0,00049
0,00007 0,00001
0,00000
1,00000 0,95665 0,80800 0,56735 0,32287
0,14824 0,0551I 0,01667 0,00412 0,00083
0,00010 0,00001 0,60000
1.00000 0,96244 0,82722 0,59735 0,35215
0,16825 0,06527 0,02064 0,00534 0,00113
0,00000 0,00001
0,00000
0.00002 0,00002
0,00000 0,00000
0,00004 o.oootte
0,00000 0,00001
0,00000
0,00014 0,00020
0,00002 0,00003
0,00000 0,00000
1,00000 0,89075 0,63421 0,34883 0,14897
1,00000
0,91186
0,68350
0,40324
0,18667
1,00000 0,92090 0,70622 0,43019 0,20674
1.00000 0,92906 0,72767 0.45683 0,22750
1,00000 1,00000 1,00000 1,00000
0,94305 0,95440 0,96358 0,96870
0,76691 0.80151 0,83179 0,84976
0,50885 0,55868 0.60585 0,63566
0,27079 0,31585 0.36199 0,39301
0,05016 0,06854
0,01352 0,02022
0.00295 0,00484
0,00053 0,00095
0,00008 0,00015
0,07905 0,09043
0,02433 0,02899
0,00609 0,00756
0,00125 0,00162
0,00021 0,00028
0,11578 0,14444
0,04007 0,05370
0,01132 0.01633
0,00262 0,00408
0,00050 0,00084
0,17618 0,19890
0.07001 0,08243
0,02282 0,02808
0,00613 0,00789
0,00136 0,00183
10 0,00000 0,00000 0,00001 0,00002 0,00003 0,00004 0,00008 0,00014 0.00025 0,00035
11 0,00000 0,00000 0,00000 0,00000 0.00001 0,00002 0,00004 0.00006
12 0,00000 0,00000 0,00000 0,00001
13 0.00000
Продолжение табл. 4.1
t III.lt still till
а. — о o' о о’ о’ о о* о" о о о" о" о*
7 IIIII IIIII НН
Q. — oooo ooooo о о" о о
2 S3? 2 Й 2 « 3 S й S 3 8
7 I 8 I S I 8 § 8 8 I I I
О. о' о" о' о о" о о' о о о о о*
г 83&82 ? !о 5 3 S 2 g S
7 I § ё S й S 8 I г I I i I ч — о* о" о' о" с’ о* о" о" о' o' о’ о'
= 1Ш1 till I III
о. -.о* o’ o' о* о о’ о" о’ о о' о о"
t Hill IIIII III
°- — о’ о’ о o' о' о" о’ о о о’ а о
? ШИШИН
d — о’ о’ о' о о о' о" о" о’ о' о’
= 8 t 3 g S s s = g 2 g 8
7 8 § 8 S I 8 S 8 В i i I
a, — oooo ooooo oo
? illllHIH H
а -ООО \o/ooooo oo
= Hiii it Sil i
II О OO 1П <N О OOOOO- о
a — oooo ooooo c
О — О» « ч- Ю О t- 00 О О — МОП
e 8
Дискретные распределения
171
Например,
Р|х<3| = 1 — Р|х>4|.
ли решении многих задач вместо выполнения вычислений непосредственно по формуле (4.2) удобно обращаться к этим таблицам, г Рассмотрим типичный пример применения биномиального распределении. Промышленная продукция определенного вида изготавливается крупными партиями. Из каждой партии случайным [©бразом выбирается 20 изделии. Партия принимается, если выборка содержит не более трех дефектных изделий. Какова вероятность принятия партии, если в процессе производства в среднем (10% изделий получаются дефектными?
Г Эту задачу можно сформулировать иначе: «Какова вероятность •появления не более трех успешных исходов в 20 независимых ис-Кплтаниях Бернулли, если вероятность успешного исхода при одном испытании составляет 0,1?» По формуле (4.2) при р = 0,1 и п = 20 получаем з
f P(x<3) = F(3; 0,l,20) = £(“j(0.1)'W-'=0.867.
Такой же результат можно получить непосредственно с помощью таблиц 14.2 I:
Р(х>4) = S( г° )(0,1)'(0.9)“>--'= | —F(3;01, 20) = 0,133 Ж=4
(см. значение в табл. 4.1, отмеченное овалом). Следовательно, F(3; 0,1, 20) = 0,867.
^Биномиальное распределение находит применение в теории надежности, при статистическом контроле качества, выборочном обследовании и во многих других областях.
Математическое ожидание и дисперсия биномиального распределения и аппроксимация биномиального распределения нормальным
В приложении 4А показано, что математическое ожидание и ЬДнсперсия биномиального распределения имеют вид
Е (х) = пр ea(x) = np(I—р).
Биномиальное распределение симметрично при р — 0,5 [рис. 4.1). При р 0,5 распределение приближается к симметричному при увеличении п; приближение будет происходить тем быст-ipce. чем ближе значение р к 0,5. Кроме того, при увеличении п
172
Глава 4
биномиальное распределение можно аппроксимировать нормальным распределением с теми же математическим ожиданием и дисперсией, т. е. |i = пр и о® = пр (1—р) [4.51, [4.111, [4.12). Это аппроксимирующее распределение дает приемлемые результаты, если пр и п (1—р) не менее 5.
Процентили нормального распределения более доступны, и их удобнее использовать, чем таблицы интегральной функции биномиального распределения, поскольку для нормального распределения нужна только одна таблица, а для биномиального распределения — целая книга. Поэтому в задачах, аналогичных рассматриваемой далее, часто используется аппроксимация биномиального распределения нормальным.
Пусть 40% рабочих большого завода являются членами профсоюза. При обследовании, проводимом газетой, случайным образом были выбраны 100 рабочих. Какова вероятность того, что в этой группе находится не менее 50 членов профсоюза?
Эта задача по существу эквивалентна проведению ЮОпспытавий Бернулли с вероятностью успеха при одном испытании р = 0,4. Так как пр = 40 и п (1—р) = 60, нормальное распределение с |х = пр = 40 и а- = пр (1—р) = 24 или а = 4,9 даст удовлетво рительную аппроксимацию. Требуется определить вероятность нахождения в выборке из нормально распределенной совокупности с [х = 40 и з = 4,9 значения, превышающего 49,5. Значение 49,5 используется вместо 50 по той причине, что для обеспечения непрерывности при аппроксимации дискретного биномиального распре деления непрерывным нормальным распределением точка х = '»i заменяется интервалом (xt = 49,5; х2 = 50,5). Требуется найти долю площади, лежащей под кривой нормированного нормального распределения, т. е. нормального распределения с ц = 0 и о = I. вправо от точки
‘7“ 1.939.
Из табл. I, приведенной в конце книги, находим, что эта величине равна 0,0263. Таким образом, вероятность того, что в выборке окажется не менее 50 членов профсоюза, составляет 0,03.
Результат, полученный с помощью таблиц биномиального рас-пределения 14.21, равен
100
Р(*>50)= 2 ('“) (0,4) >(0,6)‘"“-'= 0,0271
и близок к результату, полученному при использовании аппроксимации биномиального распределения нормальным. Если бы нужно было найти вероятность того, что в выборке окажется не бо.и'е
Дискретные распределения
173
60 членов профсоюза, то нам потребовалась бы площадь под кри-|вдй нормированного нормального распределения, лежащая влево gf точки (ха — (л)/а = (50,5—40)/4,9 = 2,14.
V Аналогичным образом аппроксимацию нормальным распреде-[енисм можно использовать для нахождения предельных значений IHCJia членов профсоюза, ожидаемых в выборке. Поскольку 90% [Лошади под кривой нормального распределения лежит над интер-Залом 1,645а, то с вероятностью 0,9 число членов профсоюза te выборке объемом 100 человек находится в интервале40 ± 1,645 X Jx4,9, т. е. составляет приблизительно от 32 до 48 человек. Аналогично вероятность того, что число членов профсоюза не превышает 48, составляет около 0,95, а вероятность того, что в выборке будет менее 32 членов профсоюза, равна около 0,05. Этот результат можно также получить с помощью таблиц биномиального распределения (4.21, 14.31, [4.41, действуя в обратном порядке, т. е. отыскивая столбце для р = 0,4 и п = 100 такие значения rj и г2, что
2 (Т)(WOW"-'= 0,95
2 (™) (0,4)'(0,6)1и-' « 0,05.
Эти выражения представляют собой приближенные равенства, поскольку имея дело с дискретным распределением, маловероятно, что мы.сможем найти значения г{ и г2, дающие точные значения вероятностей. В частности,
2 С?) (0,4)* (0,6)‘“>-' = 0,960.
У (’“) (0,4)'(О,6),“--* = 0,939.
Кроме того,
S (’“) (0,4)' (0,6;'"<-<. 0,064
S ('“) (0.4>'(в.С)'00-' - 0,042,
Рис. 4.2а. Графики, дающие 95%-ные доверительные пределы для р при заданном значении доли выборки .г/н в случае биномиального распределении. I азлнчные кривые соответствуют различным объемам выборки п. По оси ординат отложены 95%-ные доверительные пределы для р. (Из книги Pearson Е. S., Н а г 11 е у Н. О.. Biometrika Tables for Statisticians, vol. 1.
Cambridge University Press, Cambridge, England, 1954.)
г Нс. 4.26. Графики. даюн(иё 99%-ные доверительные пределы для р при ФВДанном значении доли выборки х/п в случае биномиального распределения. Различии. кривые соответствуют различным объемам выборки л. По оси ГОДИнат отложены 99%-ные доверительные пределы для р. (Из книги Pear-P<,n Е. S., Hartley Н. О.. Biometrika Tables for Statisticians, vol. 1, Cambridge University Press, Cambridge, England, 1954.)
176
Глава 4
что также хорошо согласуется с результатами, полученными путем аппроксимации биномиального распределения нормальным. Описанный выше способ может использоваться, когда аппроксимация нормальным распределением невозхожна. В разд. 4.4 рассматривается другая аппроксимация — с помощью пуассоновского распределения, которая часто применяется в тех случаях, когда не применима аппроксимация нормальным распределением.
Оценка параметра р биномиального распределения
Часто значение р бывает неизвестно и вместо отыскания ожидаемого числа успешных исходов в п испытаниях приходится решать обратную задачу, когда экспериментальны.м путем получено х успешных исходов в п испытаниях, в с помощью этой информации требуется оценить р. Пусть, например, при взятии выборки из большой партии было обнаружено, что из десяти изделий три являются дефектными. Что можно сказать о проценте дефектных изделий в партии?
Оценкой для р является отношение числа успешных исходов к числу всех испытаний:
Ц- <43>
Доверительные пределы для р можно найти путем интерполяции значений, взятых из таблиц биномиального распределения [4.21. [4.31, [4.41, либо, когда это возможно, используя аппроксимирую щее нормальное распределение. Кроме того, можно использовать изображенные на рис. 4.2а и 4.26 кривые, построенные с помощь!' таких таблиц для доверительных пределов 1 — а = 0,95 и 0,99, как в следующем примере.
При изучении возможностей рынка 34 из 100 случайным образом выбранных лиц заявило, что они рассмотрят возможность приобретения телевизора новой модели. Можно ли на основании этой информации определить, какой процент лиц из рассматриваемой совокупности приобретет новый телевизор? Итак, была взята выборка объемом п = 100 из совокупности, распределенной по биномиальному закону, и получено х — 34 успешных исхода. Согласно формуле (4.3),
95%-ные доверительные пределы для р можно найти с помощью графиков, изображенных на рис. 4.2а, беря отсчеты на левой оси ординат, соответствующие абсциссе х/п = 0,34 на кривых Д’1Я п = 100. Находим, что доверительным интервалом для р является
Дискретные распределения
интервал (0,25; 0,44), т. е. с вероятностью 0,95 можно утверждать, что процент лиц, собирающихся приобрести телевизор, находится между 25 и 44. Если требуются более жесткие пределы, то дополнительно нужно взять другие выборки. Аналогичным образом ожно вычислить односторонний предел.
В гл. 7 рассматривается применение этих способов при модели-вании методом Монте-Карло, а также обсуждается определение ъема выборки, необходимого для оценки р с заданной точностью.
Влияние объема совокупности
1 Биномиальное распределение описывает вероятность появления определенного числа успешных исходов, когда выборка берется из Иесконечной совокупности. В каждом из трех примеров, рассмотренных в начале этого раздела, совокупность можно считать бес-вонечной. Например, запуск десяти космических аппаратов представляет собой выборку из бесконечного числа возможных запусков;: десять случайных чисел представляют собой выборку из всех случайных чисел и т. д.
В тех случаях, когда имеется лишь конечное число объектов, бесконечную совокупность получают путем «взятия выборки с возвращением». Пусть, например, в мастерской имеется 20 инструмент тов определенного типа. Каждое утро рабочий случайным образом рыбирает один инструмент и возвращает его на место вечером того же дня. На следующий день инструмент снова выбирается случайным образом из восполненной совокупности. В данном случае совокупность можно считать бесконечной, так как этот процесс может продолжаться сколь угодно долго. Если 4 инструмента изго-.'товлепы фирмой А, а 16 инструментов — фирмой В, то для определения вероятности того, что в течение более 25 дней из 100 рабочий будет пользоваться лишь инструментом, изготовленным фирмой А, применимо биномиальное распределение. Поскольку взятый [рабочим инструмент возвращается на место, прежде чем произво-Iднтся следующая выборка, параметр р биномиального распределения ['сохраняет постоянное значение, равное */го.
г Во многих практических случаях совокупность не является бесконечной. Если бы рабочий в конце каждого дня сдавал инструмент в ремонт и брал новый, то через 20 дней «эксперимент» должен -.был бы завершиться. В данном случае результаты уже будут зависеть от результатов, полученных в другие дни. Вероятность того, во второй день будет взят инструмент, изготовленный фирмой » равна 4/„ либо3/18 в зависимости от того, был ли взят в первый нь инструмент, изготовленный фирмой А. Исход испытания в , день полностью зависит от исходов, имевших место в предыду-ге *9 дней. Следовательно, значение р изменяется день ото дня
178
и очевидно, что условия применения биномиального распределения (р постоянно и испытания независимы) не выполняются.
И все-таки биномиальное распределение обеспечивает аппроксимацию, удовлетворительную для практических целей, когда объем выборки п мал по сравнению с объемом совокупности. Если бы в мастерской было 2000 инструментов, 400 из которых изготовлены фирмой А и 1600 фирмой В, и если бы нас интересовал выбор инструмента в течение 20 последовательных дней, то изменение р с течением времени и вытекающая отсюда некоторая зависимость исходов были бы настолько малы, что на практике ими можно было бы пренебречь. По этой причине мы не смогли воспользоваться биномиальным распределением в примере обследования группы рабочих численностью 100 человек, взятой из совокупности всех рабочих крупного промышленного предприятия, и при оценке результатов опроса 100 потенциальных покупателей телевизоров, проживающих в определенном районе. Обычно при взятии выборки из конечной совокупности применение биномиального распределения допустимо, если объем выборки не превышает 10% объема совокупности.
Независимость от объема совокупности при указанных выше ограничениях обычно не принимается во внимание в таких случаях, как оценка результатов голосования в масштабе страны до проведения выборов и обследования телевизионной аудитории. Например, случайная выборка объемом 1000 человек при оценке доли голосов, поданных за кандидата в округе со 100 000 избирателей, по существу даст такую же точность, что и в округе со 100 млн. избирателей. Единственное практическое различие состоит в том, что из большей совокупности труднее получить случайную выбор ку. Доверительные пределы в обоих случаях можно найти непосредственно из графиков, изображенных на рис. 4.2а и 4.26, и они не зависят от объема совокупности.
Обобщение на случай k возможных исходов: мультиномиальное распределение
Во многих задачах вместо только двух исходов возможно появление любого из k > 2 исходов. Например, промышленные пз;в лия могут быть хорошего качества, удовлетворительного качесп-,1 или бракованными. Лина, фигурирующие в обследовании, про- -димом газетой, могут быть членами профсоюза, служащими - е членами профсоюза, безработными — не членами профсоюза. веты на вопрос о намерении приобрести телевизор новой моде .и могут подразделяться следующим образом: 1) безусловно. куп.н<>, 2) возможно, куплю; 3) по-видимому, не куплю; 4) определенно. , не куплю.
Дискретные распределения
179
I Пусть в общем случае каждому из k различных исходов ставят* ся в соответствие вероятности pit р2,... , pft, где Vp<= 1. Теперь, для п независимых испытаний найдем вероятности появления ровно xt случаев исхода 1, хг случаев исхода 2,..., и xk случаев исхода /г. ^Согласно формуле (2.9а), вероятность появления определенной пос-ледоваше.И'Носпш. исходов равна
pi' р?1 ₽;* •
i Существует п!/(хч! хг1 ... xftl) одинаково возможных способов, появления этой последовательности. Поскольку эти способы являются взаимно исключающими, из формулы (2.56) находим, что вероятность появления исхода 1 ровно х, раз, исхода 2 ровно х2 раз.....исхода k ровно хк раз в п испытаниях равна
«......". Pi. Рг.........р.) =
= J..„i <4-4)
Xlt Хг, .... хЙ = 0, 1, 2....п; 0<рх, рг......рА < 1.J
где х„ = п — £ xt и рА = 1 — ^р,. 3 t
'^Обобщение биномиального распределения для многомерного случая Называется мультиномиальным распределением.
gl ’Пусть, например, вероятности получения фирмами А. В п С определенного заказа равны соответственно 0,4; 0,4 и 0,2. Четыре заказа размещаются независимо друг от друга. Какова вероятность того, что одна из фирм получит все четыре заказа? Существуют три взаимно исключающих способа появления этого события. Сле-Довательно, по формуле (4.4) находим, что искомая вероятность равна
/<4, 0, <0; 4, 0,4, 0,4, 0,2) + /(0, 4, 0; 4. 0,4, 0,4, 0,2) +
+/(0, 0,4; 4, 0. 4. 0,4, 0,2) -(0,4)* (0.4)" (0,2)" +
+ ТОDT <0’4)" <°'4>* <°.2)" + +ППГ <°'4>" <0.4)»(0.2)" =
- 0,020(1 4. 0,0256 + 0,0016 = 0,0528.
4.2. ГИПЕРГЕОМЕТРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ
Гипергеометрическое распределение описывает вероятность появления ровно х успешных исходов в п испытаниях, когда значение п не мало по сравнению с объемом совокупности. Это распределен ние часто находит применение в задачах, когда выборка берется из небольших партий продукции. Вероятность того, что из п изделий, выбранных случайным образом из партии объемом N, ровно х окажутся дефектными, имеет гипергеометрическое распределение. Выбрать п элементов из N можно ) различными способами, каждый из которых одинаково возможен. Аналогично х из k дефектных изделий можно выбрать различными способами. Кроме того, для каждой такой комбинации имеют место („Z*) различных способов выбора п— х изделий из числа N -г- It исправных. Таким образом, общее число способов выбора х дефектных изделий и N — k исправных равно («Z*) •
Поскольку мы имеем дело с равновозможными событиями, применимо первое определение вероятности, данное в гл. 2. Общее число элементов рассматриваемой совокупности, т. е. число возможных исходов, равно а число элементов, соответствующих событию «выбор х из k дефектных изделий ял — х из /V — k исправных изделий», равно Таким образом, согласно фор-
муле (2.8), вероятность появления этого события имеет гипергеометрическое расп ределение
/(х; N, п, k) = { , х = О, I, 2....и;
х<А, Л —Х<АГ—А. (4 г>
Кривая этого распределения для N = 25, п — 10 п k = 8 и" казана па рис. 4.3. Имеются таблицы гнпергёометрического рас пределения для различных значений /V, п, It и х [4.61, составлен!. также сокращённые таблицы [4.71. Применение гипергеометричс ского распределения иллюстрируется на следующем примере.
Из партии, содержащей 25 высоконадежных электронных ламп, случайным образом выбраны и подвергнуты испытаниям на долг<’-вечность пять ламп. Если в процессе испытаний ни одна лампа выйдет из строя или выйдет из строя только одна лампа, то оста ль-ные 20 ламп принимаются. В противном случае вся партия бр '• куется. Какова вероятность того, что партия будет принята, если из 25 ламп четыре являются дефектными?
Дискретные распределения
181
Партия будет принята, если взятая выборка не содержит дебитных ламп или содержит только одну дефектную лампу. Соот-«тствуюшая вероятность, определяемая по формуле (4.5), равна
j / (х; 25, 5, 4) =; = 0,834.
х=о ( 5) ( 5)
Гаким образом, с вероятностью» в/0 данная партия будет принята.
Р ис. 4,3. Гипергеометрическое распределение при jV=25, /1=10 и А=8.
При уменьшении отношения n/N гипергеометрическое распределение стремится к биномиальному распределению с параметрами п и ,р. = W. Если в предыдущем примере использовать биномиальное распределение с параметрами р =- */& = 0,16, то вероятность принятия партии будет равна не 0,834, а 0,817. Поскольку в данном /Примере выборка составляет 20% совокупности, то нельзя ожидать, что бивомпальное распределение обеспечит очень хорошую аппрок-дамацню.
4.3. ГЕОМЕТРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ,
РАСПР Е ТЕЛЕНКЕ ПАСКАЛЯ И ОТРИЦАТЕЛЬНОЕ
Ь БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
В некоторых задачах бывает необходимо найти вероятность -ТОГО, -что потребуется проведение ровно х независимых опытов Бернулли, каждый с вероятностью успеха р, до появления первого ^спешного исхода.
[ По формуле (2.9а) находим, что вероятность последовательного Ирония ровно х — 1 неудачных исходов, каждый с вероятностью ~~Р'. равна (I — р)“~'. Таким образом, вероятность того, что х — 1 неудачных исходов появится успешный исход, равна г~ Р)х~1 р. Получаемая функция
/(х; р) — (1 — pY'1 Р, х= 1. 2, 3, ..0<р< I, (4.6)
182
Глааа 4
называется геометрическим распределением. График этого распределения при р = 1/а показан на рис. 4.4. Если нас интересует вероятность появления первого неудачного исхода при х-м опыте, то получаем
/(х; 1-р) = Д-’(1-р), х=1, 2, 3. 0<р<1. (4.7)
Рассмотрим следующий пример. Построено пять космических аппаратов. Четыре из них должны быть выбраны случайным образом и выведены на орбиты без экипажа. Если все четыре запуска
0.6
0.5 go/ fo,3
0,2
0,1 о
Рис. 4.4. Геометрическое распределение при p^lt.
будут успешными, то оставшийся космический аппарат будет запущен с экипажем. Какова вероятность того, что при данной вероятности р успешного запуска одного космического аппарата за
Рис. 4.5. Вероятность первого неудачного исхода при пятом испытании как функция р—вероятности успешного исхода при одном испытании.
успешным запуском первых четырех космических аппаратов после дует неудачный запуск?
По формуле (4.7) находим, что вероятность неудачного исхода после четырех успешных исходов равна f (5; I — р) = рл (I — /" График зависимости/(5; 1 — р) огр показан на рис. 4.5. Заметим, что
Дискретные распределения
f (5; 1 —р) — 0 при р ~ О и р = 1, поскольку при р = О запуск космических аппаратов без экипажа будет неудачным и полет экипажем не состоится, а при р = 1 запуск космических аппаратов как без экипажа, так и с экипажем будет успешным.
[Вероятность того, что после успешного запуска четырех космических аппаратов будет иметь место неудачный запуск, максимальна, когда р является корнем уравнения
= 0.
Находим, что р = 0,8. Таким образом, появление неудачного исхода после четырех удачных наиболее вероятно при р = 0,8, чем при других значениях р. Из формулы (4.7) находим, что [ (5; 1 — 0,8)= = (0.8)5-1 (0,2) = 0,082.
ь, Распределение Паскаля дает вероятность того, что при проведений независимых испытаний Бернулли, каждое с вероятностью успеха р, до появления ровно s успешных исходов произойдет х неудачных исходов (или, что то же самое, потребуется всего х +s испытаний). Распределение Паскаля имеет вид
f\x\ s, р) = ('г+Л! ') ps(\— р)А'; х — 0, 1, 2, . . .; s= I, 2 . . .,
0<р<1.
(4-8)
Геометрическое распределение является частным случаем распределения Паскаля при s = I. Заметим, однако, что в случае геометрического распределения берется х — 1 неудачных исходов, а при определении распределения Паскаля рассматриваются х неудачных исходов. Например, вероятность того, что третий удачный исход появится при десятом испытании, если вероятность р удачного исхода при одном испытании равна 0,4, находится по формуле
(4.8):
/(7; 3, 0,4) = ( ) (0.4)’ (0,6)’ - 0,0645.
Имеются таблицы геометрического распределения [4.18].
Обобщение распределения Паскаля на случай, когда s не являет-1 Целым числом и факториалы в формуле (4.8) заменяются гамма-П<кииями, называется отрицательным биномиальным распределяем''. О применении отрицательного биномиального распреде-|ИНя кратко говорится в разд. 4.4.
. ®днако многие авторы не проводят различия между распределением . «аля и отрицательным биномиальным распределением.
184
Глава 4
4.4. ПУАССОНОВСКОЕ РАСПРЕДЕЛЕНИЕ
Статистическая модель
Вероятность того, что за определенный промежуток времени в магазин прибудет ровно х клиентов, невозможно описать биномиальным распределением. Одной из причин этого является отсутствие четкого задания «объема выборки». Могут рассматриваться все жители города, в котором находится магазин; жители города и прилегающих к нему районов или даже все жители штата или страны. Кроме того, некоторые клиенты могут приходить в магазин более одного раза. Так, вместо вероятности для одного испытания и общего числа испытаний могут быть известны среднее число посещений за определенный промежуток времени. Именно эта информация используется при определении статистической модели, называемой распределением Пуассона. Это распределение описывает число событий, происходящих в одинаковых промежутках времени или на одинаковых отрезках пространства при условии, что события происходят независимо друг от друга с постоянной средней интенсивностью.
Распределение Пуассона имеет вид
/(х;).) - ~-г> , х = 0, 1, 2, 3,...; >,>0; (4.9)
вывод этой формулы дается в приложении 4Б. Здесь f (х; X) — вероятность появления ровно х событий в определенном промежутке времени, а параметр X — интенсивность появления событий. Распределение Пуассона для различных значений X показана на рис. 4.6.
Во времеинбй области пуассоновское распределение используется как статистическая модель для числа альфа-частиц, испускаемых радиоактивным источником за определенный промежуток времени; числа требований на выплату страховых сумм за год; числ < вызовов, поступающих на телефонную станцию за определенное время суток. Описываемые пуассоновским распределением события, происходящие на постоянной площади или в постоянном объеме, включают: число дефектов на одинаковых образцах вещества количество бактерий на предметном стекле нескольких микросно пов; число авиационных бомб, упавших на одинаковые площади Лондона в годы второй мировой войны. Имеются следующие таблицы пуассоновского распределения:
1. Таблицы вероятностей и значений функции распределения для >. = 0,001 (0.001)0,01 (0,01)0.3 (0,1) 13 (1) 100 [4.8].
2. Таблицы вероятностей и значений функции распределения для Х= 0,00000010 (0,0000001) 0,0000015 (0,000000’) 0,000015 (0,000001) 0,00005 (0,000005) 0,0005 (0,00001) 0,001 1
Дискретные распределения
185
(0,00005)0,005 (0,0001)0,01 (0,0005) 0,2 (0,001)) 0.4 (0,005) 0,5 (0,01) 1 (0,05) 2 (0,1) 5 (0,5) 10 (1) 100(5) 205 14.91.
Г 3. Таблицы вероятностей для X = 0,0005 (0,0005) 0,005 (0,005) 0,05 (0,05) 1.0 (0.1) 5 (0,25) 10 (0,5) 20 (1) 60 и значений функ-в ции распределения для к = 0,1 (0,1) 15 [4.101.
Рис. 4.6. Пуассоновское распределение с различными значениями Л.
Кроме того, значения интегральной функции распределения для /. от 0.1 до 30 можно найти с помощью графика, изображенного на рис. 4.7.
Применение пуассоновского распределения иллюстрируется на следующем примере. При определенном типе сварки в металле независимо друг от друга образуются трещины в среднем по две трещины на сварное соединение. Какова вероятность того, что сварное соединение будет иметь 0, 1, 2, 3, ... трещин?
Г. Беря X = 2 н подставляя в формулу (4.9) значения х = 0, 1,2, 3, ... , получаем следующие вероятности:
" трещин X Вероятность Функция трещин х Вероятность Функция распределения
1 0 0,1353 0,1353 5 0,0361 0,9834
0,2707 0,4060 6 0,0121 0,9955
К 2 0,2707 0,6767 7 0,0034 0,9989
1 3 0,1804 0.8571 8 0,0009 0,9998
0,0902 0.9473 9 0,0002 0,99995
Дискретные распределения
187
Здесь показана также вероятность появления не менее х трещин. Эти значения функции распределения можно найти также с помощью таблиц пуассоновского распределения [4.81, [4.9], [4.101 либо с помощью графика, изображенного на рис. 4.7, беря значения ординат соответствующих кривых для х = 0, 1,2.....при значе-
нии абсциссы X = 2.
I Математическое ожидание и дисперсия пуассоновского распределения равны X, т. е. Е (х) = \ и а2 (х) = X. Этот результат выво-даггся в приложении 4В.
Оценка параметра X
» Оценку параметра X на основе экспериментальных данных можно получить как
(4.Ю)
где k — наблюденное число событий в п интервалах (или на п образцах материала).
Доверительные пределы для X при различных доверительных уровнях можно получить из табл. 4.2 следующим образом. Пусть в десяти случайных поездках из Чикаго в Сан-Франциско в общей сложности было зафиксировано 15 случаев независимых задержек. Предполагается, что число задержек является случайной величиной, распределенной по закону Пуассона, параметр X которого — среднее число задержек на поездку. Железнодорожная компания утверждает, что значение X, взятое по большому интервалу, или истинное значение X, равно 1,2. Противоречат ли полученные данные этому утверждению?
Из табл. 4,2 находим, что двусторонние 99%-ные доверительные пределы для среднего числа задержек в десяти поездках при х = 15 составляют 6,89 и 28,16. Таким образом, 99%-ные доверительные пределы для X — среднего числа задержек на одну поездку, составляют 6,89/10 = 0,689 и 28,16/10 = 2,816, т. е. с вероятностью 99% можно быть уверенным в том, что неизвестное истинное значение лежит между 0,689 в 2,816. Следовательно, полученные данные не противоречат утверждению компании о том, что *• ~ 1.2, поскольку это значение находится в 99%-ном доверительном интервале (0,689; 2,816). Однако утверждение фирмы о том, что ? — 0,5, следовало бы отвергнуть как необоснованное и противоречащее имеющимся данным. Односторонние доверительные пределы
X можно получить аналогичным образом, используя соответст-Ующне данные из табл. 4.2.
Таблица 4.2
Доверительные пределы для лк в выборке из совокупности, распределенной по закону Пуассона
Двусторонний доверительный уровень 0,998 0,99 0,98 0.95 0.90
Односторонний доверительный уровень 0,990 0,995 0,99 0,975 0,95
Нижний Верхний Нижний Верхний Нижний Верхний Нцжйий
предел предел предел предел
0 0,00000 6,91 0,00000 5,30 0,0000 4,61 0,0000 3,69 0,0000 3,00
1 0,00100 9,23 0,00501 7,43 0,0101 6,64 0,0253 5.57 0,0513 4,74
2 0,0454 11,23 0,103 9,27 0,149 8,41 0,242 7,22 0,355 6,30
3 0,191 13,06 0,338 10,98 0,436 10,05 0,619 8,77 0,818 7,75
4 0,429 14,79 0.672 12,59 0,823 11,60 1,09 10,24 1.37 9,15
5 0,739 16,45 1,08 14,15 1,28 13,11 1,62 11,67 1.97 10,51
6 1.Н 18,06 1,54 15,66 1,79 14,57 2,20 13,06 2,61 11,84
7 1,52 19,63 2,04 17,13 2,33 16,00 2,81 14,42 3,29 13,15
8 1,97 21,16 2,57 18,58 2,91 17,40 3,45 15,76 3,98 14,43
9 2,45 22,66 3,13 20,00 3,51 18,78 4,12 17,08 4,70 15,71
10 2,96 24,13 3,72 21,40 4,13 20,14 4,80 18,39 5,43 16,96
и 3,49 25,59 4,32 22,78 4,77 21,49 5,49 19,68 6,17 18,21
12 4,04 27,03 4,94 24,14 5,43 22,82 6.20 20,96 6,92 19,44
13 4,61 28,45 5,58. 25,50 6,10 24,14 6,92 22,23 7,69 20,67
U 5,20 29,85 6,23 26,84 6,78 25,45 7,65 23,49 - 8,46 21,89
5.79 31,24 6.89 28.16 7,48 26,74 8.40 24,74 9,25 23,10
6,41 32,62 7,57 29,48 8,18 28,03 9,15 25,98 10,04 24,30
7,03 33,99 8,25 30,79 8,89 29,31 9,90 27,22 10,83 25,50
7,66 35.35 8,94 32.09 9,62 30,58 10,67 28,45 11,63 26,69
8,31 36,70 9,64 33,38 10,35 31,85 11,44 29,67 12,44 27,88
8,96 38,04 10,35 34,67 11 ,’08 33,10 12,22 30.89 13,25 29.06
9,62 39,38 11,07 35,95 11,82 34,36 13,00 32,10 14,07 30,24
10,29 40,70 .11,79 37,22 12,57 35,60 13,79 33,31 14,89 31,42
10,96 42,02 12,52 38,48 13,33 36,84 14,58 34,51 15,72 32,59
11,65 43,33 13,25 39,74 14,09 38,08 15,38 35,71 16,55 33,75
12,34 44,64 14,00 41,00 14,85 39,31 16,18 36,90 ’ 17,38 34,92
13,03 45,94 14,74 42,25 15,62 40,53 16,98 38,10 18,22 36,08
13,73 47,23 15,49 43,50 16,40 41,76 17,79 39,28 19,06 37,23
14,44 48,52 16,24 44,74 17,17 42,98 18,61 40,47 19,90 38,39
15,15 49,80 17,00 45,98 17,96 44,19 19,42 41,65 20,75 39,54
15,87 51,08 17,77 47,21 18,74 45,40 20,24 42,83 21,59 40,69
19,52 57,42 21,64 53,32 22,72 51,41 24,38 48,68 25,87 46,40
23,26 63,66 25,59 59,36 26,77 57,35 28,58 54,47 30,20 52,07
27,08 69,83 29,60 65,34 30,88 63,23 32,82 60.21 34.56 57.69
30,96 75,94 33,66 71,27 35,03 69,07 37,11 65,92 38.96 63,29
iera. Нижний и верхний дсверительные пределы для л X поквзпиы в основ .юй части таблицы. , Bfometrika Tables tor Statisticians, vol. I, Cambridge University press. 1804.)
190 '
Глава 4
Адекватность пуассоновского распределения
Пуассоновское распределение может описывать независимые события, происходящие с постоянной интенсивностью. Если это условие пе выполняется (например, когда клиенты прибывают группами либо когда появление дефектов в веществе более вероятно при одних условиях, чем при других), то использование в качестве статистической модели пуассоновского распределения не даст точных значений вероятности.
Часто, когда неизвестно, справедливо ли допущение о пуассоновском распределении, имеющиеся данные можно использовать для оценки степени адекватности этой статистической модели (см. гл. 8). Если пуассоновское распределение не обеспечивает достаточно точного описания данных, то следует поискать другую модель. Хотя подробное рассмотрение этого вопроса выходит за рамки данной книги, все же укажем, что одним из возможных распределений является отрицательное биномиальное, с которым мы познакомились в разд. 4.3. Эта модель используется в тех случаях, когда интенсивность появления событий к не является постоянной. Примером может служить распределение числа пораженных зубов у одного человека, так как у одних людей зубы более подвержены порче, чем у других, т. е. интенсивность появления пораженных зубов л варьируется от одного человека к другому. Если значения >. для различных лиц можно рассматривать как случайную величину, ........ то можно показать {4.13], [4.141, числа событий вместо пуассонов-отрицательное биномиальное рас-
имеющую гамма-распределение, 14.17], что здесь для описания ского распределения подходит пределение.
Аппроксимация биномиального и другие соотношения
распределения пуассоновским
13 приложении 4Г показано, что если п возрастает и р (или 1— р) стремится к нулю, то биномиальное распределение стремится к пуассоновскому с параметром /> = пр. Этот результат можно использовать для вычисления функции биномиального распределения, когда аппроксимирующее нормальное распределение не приемлемо или когда отсутствуют таблицы биномиального распределения для требуемых значений р. Этот метод иллюстрируется на следующем примере.
По каналу связи передается ложный сигнал в среднем в одном из 100 случаев. Какова вероятность появления не менее пяти ошибок при передаче 200 независимых сигналов?
Эта задача эквивалентна нахождению вероятности появления не менее пяти успешных исходов в 200 испытаниях Бернулли, когда вероятность успеха в каждом испытании р = 0,01.
Дискретные распределения
191
Используя аппроксимирующее пуассоновское распределение с
= 200-0,01 = 2, из таблиц пуассоновского распределения
пр
[4.8] находим, что
Р (х> 4) = 2 "ТГ г"' = °.0527-
[ Используя таблицы для биномиального распределения [4.2], получаем •
Р(х>4)= 1—Р(4; 0,01,200)= 2 (Т) (0,01)'(0.99)2"> > = 0.0518.
I Результат, полученный с помощью аппроксимирующего пуассонов-ского распределения, хорошо согласуется со значением, вычисленным точными методами. Если бы значение р было равно 0,005, а не *. 0,01, то использовать точные таблицы биномиального распределения [4.21 было бы невозможно, поскольку вероятности биномиального распределения, соответствующие р = 0,005, в таблице не приводятся. Данная аппроксимация дает достаточно точные результаты при р < 0,1 или р 0,9 независимо от п.
Еу Пуассоновское распределение связано с экспоненциальным рас-i пределением, рассмотренным в гл. 3. Если длительность промежутка времени между последовательными событиями распределена по экспоненциальному закону с параметром X, то число событий, Ж происходящих в фиксированном промежутке времени Т, рас-Д лределено по закону Пуассона с параметром КГ, и наоборот 14.151.
Т Можно также показать, что для случайной величины, распределенной по закону Пуассона с параметром |х,
Р(х<х,)
(4.11)
Из формулы (3.13) видно, что правая часть этого выражения представляет собой вероятность того, что значение случайной величины, I имеющей гамма-распределение с параметрами 7] = х;1 + 1 и X = 1, 'превышает р.. Аналогичное соотношение существует между биномиальным и бета-распределением. Если х — случайная величина, "йРЦределенная по биномиальному закону с параметрами р и п, то
D Zv \ г (л+1)
F <*<*») = ГГл-Х.)Г(Ж.+ 1)
|(1—(4.12)
Таблица 4.3
Применение дискретных распределений
Распределение Применение Примеры Примечание
Биномиальное Дает вероятность появления ровно х успешных исходов в п независимых испытаниях, когда вероятность р успешного исхода прн одном испытании постоянна. Часто применяется в теории надежности, при статистическом контроле качества, выборочном обследовании и в других технических задачах Какова вероятность выпадения цифры не менее семи раз при десяти бросаниях геометрически правильной монеты? Иногда может аппроксимироваться нормальным или пуассоновским распределением
Мультиномиальное Дает вероятность появления ровно Xj исходов i (i = 1, 2, ... , k) в п испытаниях, когда вероятность Pi появления исхода i прн одном испытании постоянна. Часто используется при статистическом контроле качества я в других технических задачах Четыре фирмы претендуют на получение каждого из трех контрактов с определенными вероятностями успеха. Какова вероятность того, что все заказы получит одна фирма? Обобщение биномиального распределения на случай, когда число исходов больше двух
Гипергеометрическое Дает вероятность появления ровно .т исправных изделий в выборке объемом л. взятой из сово--купности объемом N, содержащей k неисправных изделий. Исйойьзует-си прн статистическом контроле качества и в смежных областях В партии содержится 21 исправное и 4 дефектных изделия. Какова вероятность того, что в выборке из пяти изделий будет не более одного дефектного? Может аппроксимироваться биномиальным распределением, когда значение я мало по сравнению с N
Г“ Геометрическое Дает вероятность того, что потребуется ровно х испытаний Бернулли, прежде чем будет получен успешный исход. Используется прн статистическом контроле качества, в теории надежности и других технических приложениях Определение вероятности того, что потребуется ровно пять испытательных пусков, прежде чем будет получен первый успешный пуск
Паскаля Дает вероятность появления ровно х неудачных исходов до появления sго успешного исхода Какова вероятность того, что третий успешный исход появится при десятом испытании?
Отрицательное биномиальное Распределение, подобное пуассоновскому (см. ниже), когда события не появляются с постоянной интенсивностью, а интенсивность появления событий — случайная величина, имеющая гамма-распределение Распределение числа пораженных зубов у группы пациентов в зубоврачебном кабинете Обобщение распределения Паскаля на случай, когда s не является целым числом. Многие авторы не проводят различия между распределением Паскаля и отрицательным биномиальным распределением
Пуассоновское Дает вероятность появления ровно х независимых событий в данном интервале времени, когда события происходят независимо друг от друга п с постоянной интенсивностью. Может также описывать число событий на постоянной площади или в постоянней объеме. Часто применяется прн статистическом контроле качества, в теории надежности, теории массового обслуживания и т. д. Используется для описания числа дефектов в образце материала; числа прибывакщнх клиентов; числа заявок на получение страховой премии; числа телефонных вызовов, поступающих на коммутатор; числа испускаемых альфа-частиц и т. д. Часто используется как аппроксимация биномиального распределения
19-1
Нлзвпвио распределения
Биномиальное
Мультиномиальное
195
Параметры
Распределение
стельное целое число п,
Положительное целое число п,
Pl > 0. Рл > 0, ... , Рь > 0,
л!
I П----------Pi' • • • Pkk •
х>1 х»! .. . хА!
альные целые числа
,Ых распределений.
196
лр/ для лрН1 — Pl) /=1.2....k для /=1.2...fr
I—2->, lflpj(l— p,)|‘/« для / = 1,2,... , k
I —6pt(l - j r npt{\ — PJ
для < = 1,2,.,*
(/V-2W/V—глИ/У-П7'
(/V-2)ln*(iV-fe)(/V-n;l '•
_________/V» IN — I) (Д'—'2){N—А)ПЯ{1>1— k) (H—n)
{л'(А'+1)-6л(Л/-л)+3 (N - k) (№ (n— 2)- — /Vn* 4-6л (# — «)]) .
198
Параметры Распределение
0<р < 1 (1-р/-«р, г«|,2,...
р< 1; отрицательное биномиальное, если s> 0; Паскаля, если s — положительное целое число »-0. 1. 2,...
Х>0 ^1, ,_о. 1,2,... *1
199
Р)
s(l — р) Р9
2- Р
(s(l-p))1''
р= — 6р + G s(l — Р)
200
Глава 4
Из формулы (3.23) видно, что правая часть этого выражения представляет собой вероятность того, что случайная величина, имеющая бета-распределение с параметрами j = п — >'
ц = хг 4- 1, принимает значение, меньшее 1—р.
Формулы (4.11) и (4.12) можно использовать для нахождения значений интегральных функций пуассоновского и биномиального распределений с помощью таблиц для интегральных функций гам ма- и бета-распределения. Эти результаты можно также использовать и в обратном порядке для нахождения значений интегральных функций гамма- и бета-распределения с целочисленными парамег рамп формы с помощью таблиц для пуассоновского и биномиальной распределений, которые обычно более доступны.
4.6. СВОДКА ДИСКРЕТНЫХ РАСПРЕДЕЛЕНИЙ
Сведения о распределениях, рассмотренных в данной главе, кратко обобщены на рис. 4.8 и в табл. 4.3. На рис. 4.8 показаны также математическое ожидание, дисперсия и нормированные моменты для каждого распределения.
Приложение 4А. Вывод выражений для математического ожидания и дисперсии случайной величины, распределенной по биномиал/ ному закону
Пусть х — случайная величина, распределенная по биномиаль ному закону с параметрами п и р:
ЦК Р, ") = (!) Р*(1—Р)'“Х л « О, 1, 2......п; 0<р<1.
Тогда, согласно формуле (2.28 а),
Е W = 2 X f(x) = V х («) рх (1_рГ-х =
= So Х **(л-х)1 Р
Поскольку первый член суммы равен нулю, начнем суммиргя ние с х = 1 и вынесем п и р за знак суммы. Таким образом,
Е W : - пр V, У (!-₽)- ,
Изменяем индекс суммы, полагая у — х— 1 и т = п— 1. Пс г чаем
Дискретные распределения
201
I Е w = "Р 2 „ Д,)Г Р’ <1 -Р)’-> = р=О
L=4>2 (”) Р’
и=о
рльку суммирование производится по всем членам биномиального распределения. Согласно формуле (2.39),
а’(х) = Е(х’)-[£«р.
Теперь
I ем = 2*а/w “2*(*—
** „ ””
2*/И = Е(х) = лр.
Действуя, как и выше, получаем
2х(ж^0л7^пр'(1-р)'"-
=')₽’ i ст-Лй^Ь' =
= п(п — 1)р“ 2 (“) Р’ I1 — Р)"‘‘>=п (в — 1)р’-
Таким образом,
Е (xs) = п (п — 1) рг + пр н
i а»(х) = п(п— 1) ра + пр — п?рг = пр —пр3 = пр(1 —р).
Приложение 4Б. Вывод формулы, задающей пуассоновское распределение.
^Покажем, что пуассоновское распределение является статисти-^ской моделью, описывающей число событий, появляющихся в Всированном интервале времени, если события происходят ^зависимо друг от друга с постоянной интенсивностью. Вывод для
202
Глава 4
числа событий, появляющихся на постоянной площади или в постоянном объеме, производится аналогично.
Пусть X* обозначает интенсивность появления некоторого события. Таким образом, вероятность появления одиночного события в малом интервале времени dt равна K*dt при условии, что интервал времени dt берется настолько малым, что вероятность появления в интервале dt двух или большего числа событий пренебрежимо мала. Вероятность РЛ. (/ + dt) появления в произвольном интервале (/ +- dt) ровно х событий равна сумме вероятностей для следующих двух взаимно исключающих случаев:
1. К моменту времени I с вероятностью Рг(/) происходят х событий, а в промежутке времени dt не происходит пн одного события. Вероятность этого равна 1—l*dt. Вследствие независимости этих двух событий вероятность их совместного появления равна (1 — X*d/) Pt(Z).
2. К моменту времени t с вероятностью Рх—1(0 происходят х— 1 событий, и в промежутке времени dt с вероятностью >.*dt происходит одно событие. Вследствие независимости этих двух событий вероятность их совместного появления равна \*dt.Px-i(t).
Таким образом,
Рr (/ + dt) = (I - X* dt) Pr (/) + X* dt P^j (/) или
P'11+*>1~ P'111 = x* [P.-t (0—Р. (01-
Полагая dt -> 0, получаем
При x = 0
р;(о=к*[рЛ(/)-р,«]. ₽; (о =•->-• р.(о.
так как Р_( (t) = 0. Решение полученного дифференциально; т уравнения при граничном условии Ро(О) = 1 имеет вид
Р,й-Ги.
Аналогично решением дифференциального уравнении ₽; (О = V [Р. (О — Р, (01 = X* [ е~ и - Р, (/)] при граничном условии Р((0)=0 является
РГ(/) = Х*
Продолжая этот процесс, легко находим, что
Дискретные распределения
203
)лагая X*/ = X, получаем выражение для пуассоновского распре-ления
/(« ч=
Ъ Приложение 4В. Вывод выражений для математического ожидания и дисперсии случайной величины, распределенной по пуассоновскому закону
К 'Пусть х — случайная величина, распределенная по закону Пуассона с параметром X, т. е.
/(*;>.) = >лг*~ , х = 0, 1, 2, 3,...; >.>0.
Тогда, согласно формуле (2.286),
е (х)=2х —[— х=0
№ йрекольку первый член этого ряда равен нулю,
Пусть у = х — I, тогда
. -v ХУе“Х 1
= ТГ"=Х’
11=0
Поскольку суммирование производится по всем членам пуассоновского распределения.
'Согласно формуле (2.29),
а«(х) = Е(х»)-[Е(х)]\
а из выражений (2.326) и (4.9) следует, что
_ Vx- - Vx(x- 1) + V х .
х=0 х=0 л=0
получаем
:кольку два первых члена суммы равны пулю, имеем
204
Глава 4
£(х«)=Х»4-Х и, следовательно,
*’(*) = *.
Приложение 4Г. Пуассоновское распределение как аппроксима ция биномиального распределения.
Когда п произвольно возрастает, а р произвольно уменьшаете и при этом их произведение пр остается постоянным, биномиально распределение стремится к пуассоновскому. Докажем этот результат.
Согласно формуле (4.1), биномиальное распределение имеет ви /(* ». Й = (;)й(!-й"-' = +
Умножая н деля на пх и полагая пр = X, получаем
Теперь
(1 - rt- = [(1 - РГ= [(1- РГ J-1 И
lim Г(1-р)-1/'’]“* = е-х.
₽г*0
Кроме того.
Таким образом, lim?(« п, й = -*,|-' • р-и>
Полученное выражение является распределением Пуассон X = пр.
Дискретные распределения
205
ЛИТЕРАТУРА
Volk W., Applied Statistics for Engineers, McGraw-Hill, New York, К 1958.
4.2. Tables of the Cumulative Binomial Probability Distribution, Harvard University Press, Cambridge. Massachusetts, 1955.
Tables of the Binomial Probability Distribution, Nat. Bur. Std., Appl.
Math., Ser. 6. 1950
4Л- Romig H. G., 50—100 Binomial Tables, John Wiley. New York, BL 1953'
4.5. Cramer H., Mathematical Me'h »ds of Statistics, Princeton Unlver-[ sity Press, Princeton, New Jerse/, 1946. Имеется русский перевод: а, К p а м e p Г., Математические методы статистики, ИЛ, 1948.
4.6. L I е b с г m a n G. J., О w е n D. В.. Tables of the Hypergeometric E' Probability Distribution. Stanford University Press, Stanford. Califor- nia. 1961.
Owen D. B.. Handbook of Statistical Tables. Addison-Wesley Publi-shing. Reading. Massachusetts. 1962. Имеется русский перевод: . - О у э и Д. Б., Сбооннк статистических таблиц, ВЦ АН СССР. 1966. 4,8. Molina Е. С.. Poisson's Exponential Binomial Limit, Van Nostrand, |К* Princeton, New Jersey, 1949.
4.9. Tables of the Individual'and Cumulative Terms of Poisson Distribution. Van Nostrand. Princeton, New Jersey, 1962.
4.10. Pearson E. S., Harl ley H. O., Biometrika Tables for Sta-tisticians. v. 1. Cambridge University Press. Cambridge, 1954.
4.11. Brownlee K- A., Statistical Theory and Methodology in Science I and Engineering. 2nd ed.. John Wiley. New York. 1965.
4.12. Feller W., An Introduction to Prob ability Theory and Its Applies* Вт tions, v. I, 2nd ed.. John Wiley. New York. 1957. Имеется русский пе-Ki ревод: Ф е л л е о В.. Ваедеине в теолню веооятпостей и ее прилову женин, т. I. 2-е изд., М . изд-во «Мил», 1964.
4.13. Freeman Н.. Introduction to Statistical Inference, Addison-Wes-ley Publishing Co.. Reading. Massachusetts. 1963.
4.14. Johnson N. L. Leone F. C, Statistics and Experimental De-I. Sign in Engineering and the Physical Sciences, v. I, John Wiley. New I York. 1934.
4.15. Parzen E., Stochastic Processes, Holden-Day. San Francisco, 1962. 4,16. Weintraub S., Tables of the Cumulative Binomial Probability ft Distribution for Small Values of n. Free Press of Glencoe. Macmillan, New York. 1963.
<•17. II a I d A.. Statistical Theory with Engineering Applications. John Wiley, New York. 1952. Имеется русский пелевод: Хальд A..
Математическая статистика с техническими приложениями. ИЛ. 1956. 4.18. Williamson Е.. В г е t h е г t о n М. Н . Tables of the Nega* j tlve Binomial Probability Distribution, John Wiley, New York. 1963
/лава 5
ПРЕОБРАЗОВАНИЕ
СЛУЧАЙНЫХ ВЕЛИЧИН ')
В двух предыдущих главах мы рассматривали распределения описывающие простые события. Однако нередко характеристик; системы бывает обусловлена влиянием многих факторов, Каждый из которых может быть описан одним из основных распределений и которые сочетаются друг с другом определенным образом. Напри мер, выходной параметр реальной системы может быть функцие случайных параметров отдельных компонентов. В данном случа нас интересует определение распределения некоторой функции
Примером может служить распределение общего времени, не обходимого для выполнения на станке определенного задания.
Допустим, что это время определяется как сумма длительностс двух операций. Длительности каждой из этих операций можн представить как независимые случайные величины хну, распреде ленные по экспоненциальному закону с плотностями f (х)= kte-и ё (У) — Распределение общего времени является распре делением случайной величины х + у.
Приемы построения функций случайных величин были сфор мулированы в гл. 3, например, при обосновании распределена Релея, гамма-распределения и логарифмически нормального распределения, а также при обсуждении центральной предельной теоремы. В данной главе описывается метод, называемый преобрл зованием случайных величин, который использовался для полу чения этих результатов и который можно применить для нахождения распределения простых функций случайных величин.. Это: метод можно использовать только в относительно простых случаях. В более сложных случаях должны применяться такие приближен ные методы, как получение моментов системы и моделирование методом Монте-Карло (см. гл. 7).
1) В отдельных местах этой главы используется более сложный математический аппарат, чем в остальной части книги. Некоторые читатели пр»« первом чтении могут опустить эти трудные места, находящиеся главным е'1' разом в конце главы- Те. кто пожелает дополнительно ознакомиться с методами преобразования случайных величии, могут обратиться к литера! У-:”31 список которой дается в конце главы.
Преобразование случайных величин
207
5,1. ФУНКЦИИ ДИСКРЕТНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН
Пусть х — дискретная случайная величина, заданная на некотором определенном пространстве выборок, для которого требуется найти распределение функции случайной величины х, обозначаемой через w = Л (х). Так как х — случайная величина, то и ш — л-ракжё случайная величина. Чтобы найти распределение’1 р (до) случайной величины до, необходимо определить пространство выборок для w и найти значения «функции р (w), соответствующие каждой точке нового пространства выборок.
Б Рассмотрим пример. Фирма выплачивает следующие гарантийные издержки за каждый случай выхода системы из строя в первый год службы: С долл, за первый отказ, С2 долл, за второй отказ и в общем случае Сх долл, за х-й отказ, где С> 1. Время между моментами выхода системы из строя распределено по экспоненциальному закону с параметром X, и следовательно, число отказов в любом фиксированном промежутке времени Т является случайной величиной, распределенной по закону Пуассона с параметром кТ (см. гл. 4). Фирма желает определить распределение гарантийных издержек за время Т = I год.
Эту задачу можно сформулировать иначе. Пусть х — случайная величина, распределенная по закону Пуассона,
/(х) = -^Х*, х = 0, 1,2,.... (5.1)
Найти распределение р (до) случайной величины
(0, х = 0.
= х=1, 2,...;С>1. ’(5-2)
«Пространство выборок для размера штрафа состоит из точек до = = Л (х) = 0, С, С\ С3, ... и связано с пространством выборок для X следующим образом:
X—>-ДО, 0->0, 1 — С, 2—С*. 3->С»
” ;Т. д. Элементы нового пространства выборок имеют те же ве-ИТностн, что и соответствующие элементы прежнего пространства -^Ророк. Так, вероятность пулевых издержек та же, что и вероят-
1 Й >Той главе удобно обозначить распределение (или плотность распре-^'сходной и преобразованной случайных величин соответственно
208
ность отсутствия отказов, вероятность того, что издержки составят С долл., та же, что и вероятность появления одного отказа и т. д. Следовательно, распределение гарантийных издержек фирмы находится путем замены х в формуле (5.1) соответствующим значе нием w.
Из формулы (5.2) следует, что
если
если
w = 0,
w = С, С2,
следовательно,
w = 0,
I (In К1/1П С) I
, w = С, С2, С3,...
(5.4)
Формулу (5.4) можно обобщить на случай любого взаимно одно значного преобразования tv = h (х) для дискретной случайной величины х с распределением f (х), записав ее в виде
р(ш)=/[х(ш)], (5.5
где пространство выборок для w находится из пространства выборок для х с помощью выражения и> = й (х). Формула (5.5) требует определения обратной функции х (w) преобразования w = и подстановки ее в выражение для распределения вместо исходной случайной величины х.
Если преобразование не является взаимно однозначным и в исходном пространстве выборок имеется несколько значений х, соответствующих одной и той же точке w нового пространства выборок, то для получения вероятности для w необходимо просуммировать соответствующие вероятности для х. В следующем разделе будг: показано аналогичное преобразование непрерывной случайной величины.
Нахождение функции двух и большего числа дискретных случайных величин здесь подробно не описывается. Методика анал гична подробно рассматриваемой в разд. 5.3 для непрерывны ч случайных величин.
5.2. ФУНКЦИЯ ОДНОЙ НЕПРЕРЫВНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Пусть х — непрерывная случайная величина с плотностью распределения f (х), определенной на некотором пространстве выборок, a w = h (х) — строго возрастающая или строго убывай ;!у:Я функция случайной величины х на пространстве выборок. Тогда!
Преобразование случайных величин
209
’плотность распределения случайной величины ьу будет иметь вид р(ш)=.№(<||^.|. (5.6)
где пространство выборок для w определяется из пространства вы-Юорок для х с помощью соотношения и> = h (х); f lx (и) I означает, что х (и>) [функция, обратная функции h (х) 1 подставляется в / (х) вместо х; \dx/da | обозначает абсолютное значение произвольной dxldw. •
К Заметим, что формула (5.5) для функции дискретной случайной величины и формула (5.6) для функции непрерывной случайной величины идентичны с тем лишь отличием, что в последней формуле имеется коэффициент |dx/dtc|. Этот коэффициент, называемый якобианом преобразования, необходим для отображения непрерывной .'функции таким образом, чтобы интеграл новой плотности распределения по ее пространству выборок был равен единице. Этот метод иллюстрируется на следующем примере.
I В гл. 3 мы рассматривали функцию
и, = Л(х)=*2Л, (5.7)
где х — нормально распределенная случайная величина с математическим ожиданием |i и средним квадратическим отклонением а, т. е.
/<<>= 7Й?С’‘Р1 ]’ ~ °° <х<°°- <5’8)
При нахождении распределения случайной величины w прежде всего заметим, что w — строго возрастающая функция х. Из формулы (5.7) видно, что область изменения w та же, что и область изменения х, т. е. (—оо, Н-оо), а также что
х(ш) = са?-[-н. (5.9)
-Следовательно,
|£Н <6Л<”
Таким образом, согласно формуле (5.6), плотность распределений случайной величины w принимает вид
210
Глава 5
Заметим, что р (и>) — плотность нормального распределения с |л = 0 и 1. Таким образом, мы проверили справедливость высказанного в гл. 3 утверждения о том, что нормированная случайная величина w = (х — [л)/з распределена по нормальному закону с {* = 0 и о — 1, если случайная величина х распределена по нормальному закону с произвольными р. ио.
Поступая аналогичным образом, можно вывести следующий более общин результат. Если х — случайная величина с плотностью распределения f (х), а а и b — постоянные, то случайная величина
w = х ь° имеет плотность распределения (5.12)
р(&у) = 161 /(*txv Н-а). (5.12а)
где пространство выборок для w определяется из пространства вы борок для х с помощью соотношения (5.12). Отсюда следует, что, например, функция оу = сх имеет плотность распределения
(S,126,
- Формула (5.12а) подтверждает справедливость применения нормированного гамма-распределения с параметром ц = 0 для нахож дения любого трехпараметрического гамма-распределения с произвольным |* и применения нормированного бета-распределения для нахождения любого трехпараметрического бета-распределения -произвольными р.ои (х, (см. гл. 3). Используемые в формулах (5.12) и (5.12а) постоянные ан b являются соответственно параметрами, характеризующими центр распределения случайной величины л и его масштаб.
С помощью формулы (5.6) можно также показать, что если случайная величина х распределена по нормальному закону е параметрами [А и о и
= h (х) ' = 6х, (5.М)
то
р(ш) =---------ехр Г .1 ^>0, (5.1 0
аа> УШ L л J
т. е. имеем логарифмически нормальное распределение, рассмот! репное в гл. 3.
Если h (х) — строго возрастающая функция в одних частях области изменения и строго убывающая функция в других частя? области изменения, то р (ш) можно найти, рассматривая каждую из этих частей в отдельности, а затем суммируя значения х, <-'оОЧ
Преобразование случайных величин
211
(етствующие определенным значениям |х. Этот способ иллюстри-jyeTCii на следующем примере.
3 Трещины, образуемые внутри длинных прямоугольных пластин (истового металла, можно рассматривать как отрезки прямой по-згоящтой длины L, расположенные внутри металла случайным >бразом (рис. 5.1). Пусть О—угол, образуемый отрезком прямой, характеризующим данную трещину, с прямой, перпендикулярной
Р и с. 5.1. Схематическое изображение трещины в материале длиной L. образующей угол П с прямой, перпендикулярной сторонам пластины. Пунктирными линиями показана полоса' материала, которая должна удаляться вследствие образования трещины.
/.сторонам пластины. Так как трещины появляются внутри металла Случайным образом, случайная величина 0 имеет равномерное распределение в интервале (0, г.), т. е., согласно формуле (З.З!)",
/(0) = —, О<0<тг. (5.15)
При появлении трещины необходимо вырезать полосу, ограпн-Wnyjo прямыми, перпендикулярными сторонам пластины и ка-ЯрИЦИмися обоих концов трещины (пунктирные линии на рис. 5.1). образом, длина оу бракованного куска может изменяться от Win, когда трещина перпендикулярна сторонам пластины (пред-i 1Ж?г|гастся' чт0 ширина трещины по существу равна нулю), до L, 44111 Трещина параллельна сторонам пластины. В частности,
ш = /ЦО) = L sinO. (5.16)
;] Заметим, что эту задачу можно упростить, ограничивая 0 интервалом. ' ); это приведет к взаимно однозначному преобразованию.
212
Глава 5
Задача заключается в определении плотности распределения р (w) ширины бракованной полосы w при длине трещины L.
Формула (5.16) преобразует пространство выборок, определяе мое интервалом 0 < 0 < я, в пространство выборок, определяемое интервалом 0 < w < L. Однако каждому значению w соответ ствуют два значения 0; w — строго возрастающая функция случай ной величины 0 в интервале 0 "/2 и строго убывающая функ
ция случайной величины 0 в интервале п/2 С 0 что показан. •
Р и с. 5.2. Зависимость ш от О в задаче о трещине в материале.
на рис. 5.2. Таким образом, интервалы 0 0 < тс/2 и «/2 < б < -
необходимо рассматривать в отдельности, а затем просуммирован результаты, полученные для соответствующих значений w.
Из формулы (5.16) находим, что
О (ву) =аге sin (у-). (5.KI
Таким образом,
Используя формулы (5.6), (5.15) и (5.18), получаем, что для инь : -вала 0 < 9 < тт/2
Л(»)-Д-0<ш<£, <
и для интервала ~/2 0 < к.
»и=т — «'Г1'1. (’ 11 .
Плотность распределения ширины бракованной полосы, с'иЛ*И ветствующей случайному расположению трещины, находим, 1
Преобразование случайных величин 213
,мируя выражения (5.19) и (5.20) для одинаковых значений ю: p(u») = pl(w)4-p2(w) (5.21)
пли _,
Р (w) = V (L2 — ш2)"0 < w < L. (5.22)
.Интеграл от р (w) по пространству выборок должен равняться единице. Таким образом,
J р (а>) dw = J (L2 — w2) /'dw=-^- arcsin (£ = 1, (5.23)
что и требовалось получить.
Иногда вместо формулы (5.6) проще использовать другое эквивалентное соотношение:
р (»)=f [* w] | -^г '• (5-ба)
Применяя в данном примере формулу (5.6а), получаем
. (5.24)
Таким образом,
|.-згг* -«* —“Г* <5-25»
Как и ранее,
р,(и)
S 3. ФУНКЦИИ ДВУХ И БОЛЕЕ НЕПРЕРЫВНЫХ
В .СЛУЧАЙНЫХ ВЕЛИЧИН
Основной метод
| Во многих случаях, аналогичных упомянутому в начале этой <йавы, требуется найти функцию двух' и более непрерывных слу-Чайиых величин. Рассматриваемые методы являются обобщением методов нахождения функции одной случайной величины.
® данной книге рассматриваются лишь случаи, когда 1) после [^образования имеется столько же случайных величин, сколько ” До преобразования (как будет показано далее, ненужные случай-величины исключаются путем интегрирования), и 2) преобра-Р^Дпие является взаимно однозначным, т. е. каждой комбинации
214
Глава 5
значений исходных случайных величин соответствует единственная комбинация значений новых случайных величин, и наоборот. Эти допущения станут ясны при последующем изложении. С боле» сложными случаями читатель может познакомиться в книге Хогга и Крейга [5.1].
Рассмотрим вначале функцию двух случайных величин. Dept ход к трем и большему числу случайных величин не представляв труда и рассматривается далее. Пусть
w = h(x, у) (5.251
обозначает искомую функцию двух случайных величин х и у, имен щих плотности распределения f (х) и g (у) соответственно на за данных пространствах выборок. Пусть tn (х, у) обозначает плот носгь совместного распределения случайных величин хну. Еслг хи у — независимые случайные величины, то из соотношени (2.73) следует, что
я(*.«)=ТИг(Й. <s-2<
Плотность распределения случайной величины w находим следующим образом:
1. Выбираем вторую функцию случайных величин х и у, обоз качаемую как
z = k(x, у), (5.28
где z— вспомогательная случайная величина, которая позво.п после преобразования получить первоначальное число случайны', величин (а именно две случайные величины). Поскольку впосле.к вии функция z исключается Из рассмотрения, выбор ее прон.зы дится произвольно и она вводится лишь для того, чтобы облегчи1 интегрирование.
2. Определяем пространство выборок для w и z из пространен выборок для х и у с помощью соотношений (5.26) и (5.28). Эти иг странства выборок (или области) обозначим соответственно чс| D и R.
3. Решаем уравнения (5.26) и (5.28) для хну относительно к | г, т. е. находим х (w, z) и у (щ, г).
4. Находим плотность совместного распределения случаГш I величин w и г;
п(ш, г) = т[х(и», z)у(w, z)]|J|, cw€D, z€R, (5I где mfx (w, z), у (w, z) ] представляет собой функцию, ©предел ‘ fl мую формулой (5.27), при замене х на х (до, z), ay — на у (к\ ' I u>(zD и zc/? обозначают точки на пространствах выборок D " А соответственно, а якобиан преобразования J является опре.в I телем
Преобразование случайных величин
215
dx di
dy dy dw dz
(5.30)
Рассматривая лишь взаимно однозначные преобразования, поучаем якобиан, знак которого не меняется на пространствах вы->рок случайных величин w и г. «Это является обобщением требо-1ний «строгого возрастания» и «строгого убывания» функции, рас-Йтренных в начале разд. 5.2. Якобиан J, определяемый форму-)й (5.30), является обобщением члена dx/dw в формуле (5.6). аметим также, что в формуле (5.29) берется абсолютное значение , В некоторых задачах более удобно вычислять
dw jlz_
dx dx
dy dy
(5.31)
а1затем использовать соотношение J =
5. После того как будет получена плотность распределения случайных величин w и z, т. е. формула (5.29), плотность распределения случайной величины w находится путем исключения г при интегрировании. Таким образом, плотность распределения случайной величины w имеет вид
p(w) = J n(w, z)dz,
w D.
(5.32)
В некоторых случаях при надлежащем выборе z случайные величины z и и можно сделать независимыми. В этом случае
I Л(ш, z) = m[x(to, z), y(w, z)] | J1 = p* (to) q (г), wzD, z£R.
,, (5-33)
Используя формулу (5.32), находим плотность распределения №иайиой величины ю
p(w) = p*(w) $ q(z)dz, w^D. (5.34)
|Пример
осмотрим простую электрическую цепь, изображенную на |Р*3» с двумя резисторами, соединенными последовательно. й*обой такой цепи общее сопротивление равно сумме сопро
216
Г ла в а 5
тивлений резисторов А и В. Два резистора, используемые в данной цепи, выбраны случайным образом из двух больших партий резисторов со средними сопротивлениями 10 и 20 ом. В обеих партия сопротивления резисторов распределены по нормальному закон со средним квадратическим отклонением а = 1 ом. Необходим, определить распределение сопротивления цепи.
Р и с. 5.3. Цепь с двумя последовательно соединенными резисторами.
В принятых ранее обозначениях интересующая нас функии имеет вид
ьу = й(х, у) = х + у. (5.26;. •
Выбор второй случайной величины производится произвольно, од нако если выбрать
2 = k (х, у) = х — у, (5.28а •
то, как будет показано далее, w и z окажутся независимыми и, с.’п довательно, вычисления будут проще. Поскольку случайные ы личиных и у независимы, плотность их совместного распределен, имеет вид
т (х, у) ----- / (х) g (у) = -- exp j-[(х - 10)’ + (у — 20)2] |,
(5.27: где
/(х) = (2я) ,г ехр |--|<(х—I0)aj, — оо<х<о° (5.3.r’i
и
Я(1/) = (2я) "ехр[------'—(У~ 20)=j, —<*><//<«.,
Формула (5.27а) представляет собой плотность двумерного |"’Г мальиого распределения с р = 0 (см. гл. 3). Так как значения х и 1' лежат в интервале (•—оо„ -Too), из формул (5.26а) и (5,28 а) следует.! что w и z могут принимать значения, лежащие в интервале от —°°1 до + то независимо друг от друга.
Преобразование случайных величин 217
Решая уравнения (5.26а) и (5.28а) относительно х и у, получаем
(5.36)
(5-37)
Кледователыю, согласно формуле (5.29), плотность совместного Определения случайных величин w я г имеет вид L, г) - 2-ехр + -20;]}Р|,
(5.29а)
— оо < Ш оо, —• оо Z < о° .
Кроме того,
dx
I dx • > 4у - I dy , I
2 ’ dz 2 ' dw 2 ' de 2
1 I
2 2 .
(5.30a)
Пйдставляя значение J в формулу (5.29a) и производя группировку Членов под знаком экспоненты, получаем
z)„iexp + М]}. (5.38)
--оо < а/ <" оо , - СО < Z < ОО .
•^ГО выражение можно записать как |п(и,г).Амр[_^^мр[_Х<^Ь
= <7р*(И>)?(г),
— оо <" W со, — оо < Z <С оо , (5.39)
подтверждает справедливость допущения о независимости слу-етйнных величин w и г.
218
Г лава 5
Последним этаном является исключение z путем интегриров; ния (см. формулу (5.34) 1. Получаем
— оо<ц><со. (5.4(11
Из определения плотности нормального распределения И тон, обстоятельства, что площадь под кривой плотности любого распределения равна единице, следует, что
Полагая z = о и принимая в формуле (5.41) р. = —10 и а = । получаем
Подставляя выражение (5.42) в формулу (5.40), находим
р(ы>) = (4л) /fexpJ----L j, — оо <ьу < оо. (5.43)
Это плотность нормального распределения с |* = 30 и а = । т. е. сопротивление цепи распределено по нормальному закону математическим ожиданием 30 ом и средним квадратическим отк нением j 2 ом.
Обобщив данный пример, можно показать, что сумма незави< мых нормально распределенных случайных величин также и-нормальное распределение с математическим ожиданием, равн. сумме отдельных математических ожиданий, и дисперсией, равн сумме отдельных дисперсий. Согласно центральной предельно! теореме (см. гл. 3), для больших выборок, взятых из совокупностей.! распределенных по любому закону, сумма случайных величин! имеет нормальное распределение. Теперь мы нашли,что если отдс 1 ные случайные величины распределены по нормальному зако1'-то их сумма также распределена по нормальному закону при л/<-" 1 размере выборки. Этот результат справедлив даже для завись ' 4 случайных величин, однако в этом случае дисперсия должна б скорректирована с учетом наличия корреляции между случайш :|1 величинами [см. формулу (2.87) L
Преобразование случайных величин
219
гой способ исключения z
В предыдущем примере исключение z из формулы (5.40) путем егрирования выполнялось просто. В других задачах дело мо-I обстоять иначе. Поэтому иногда используется другой способ ^„лючения случайной величины z, когда ее выбор производится Ким образом, что она не зависит от ш. Так как в формуле (5.34) ттеграл (q(z)dz не является функцией w, то при нахождении к
«определения случайной величины w его можно рассматривать сак постоянную. Пусть
K=\q(z)dz, (5.44)
k
«пишем формулу (5.34) как
р (ш) = Кр* (w), w£D. (5.45)
Постоянную К можно определить из условия
f p(w)dw = 1, (5.46)
где D — область, в которой определена случайная величина w. Следовательно,
К £ р* (w) dw = 1 (5.47)
к
(5.47а)
Применяя этот метод к примеру о сопротивлении электрической Цепи, формулу (5.40) можно переписать в виде
Затем из формулы (5.47) следует, что
‘’являя в соотношение (5.41) |* = 30 и а = > 2, получаем
(Ч-'- рхрГ-4-^j’l^-l. (5.50)
220
Глава 5
Следовательно,
К - •
J
Таким образом, из формул (5.48) и (5.51) следует, чт^
,л 1 Г 1 И —30)«1 .и
pW„ —eXp^__L__LJ,
Этот же результат был получен и ранее. Таким обр\ , правочный коэффициент, гарантирующий, что действ у чена плотность распределения, т. е. что интеграл <ji взятый по пространству выборок, равен единице. iK'
Теперь нам понятно преимущество выбора случай >. z таким образом, чтобы она была независимой от w. ь являются независимыми, то описанный здесь мето, так как могут возникнуть трудности при интегрирова. канИя конкретного значения z, независимого от гл», л -ваться применение метода проб и ошибок, чтб не все В нашем примере лишь после получения формулы (' новпли, что г действительно не зависит от ж
Наконец, важно заметить, что для независимости । личин w и z необходимо, чтобы были независимы их ,1 i пения. Когда это условие не выполняется, форму. . ) (5.47) неприменимы, даже если выражение (5.34) я j ностью распределения, и необходимо внимательно с.И( > чтобы использовать надлежащее пространство выбо--иовлепии пределов интегрирования при исключении с ‘ь’ в конце этой главы). т <
Пример функции трех случайных величин ‘\1 -
Не представляет труда распространить изложение \ь дику на случай отыскания распределения функции тр 'ц числа случайных величин. Если нас интересует фу| случайных величин, введем г — 1 вспомогател! ных величии с тем, чтобы после преобразования чис величин равнялось г. Совместное распределение нов , величин находится путем обобщения формулы (5.29 страиство выборок находится на основе определен и = чайных величин и пространства выборок для прежи величин. По тем же причинам, что и ранее, желателт пости иметь вспомогательные случайные величины, г от су. В этом случае вспомогательные случайные вел чаются путем интегрирования или другими способам
| полу]
>.44) -'1 ПЛОЯ да тем. Г Уста приме]!
f3M=-y=
-г./а
.е мете jfiMuero ЗУ ОТ ' случай-яайнпх .•тайных де про-случайных
I Вследствие независимости случайных величш дХ совместного распределения имеет вид
(« у. б = h W б (й fi U) = ‘
Это трехмерное нормальное распределение с i ми р. Первым этапом при отыскании распре, | величины г является выбор двух вспомогатель личин. Поскольку нас интересует расстояние, рейти к полярным координатам и в качестве вс/ Чайных величин использовать углы 0 и </>, связ;’ I ром. Так как г не зависит от 0 и </•, так< ходимое интегрирование. Область изменения е от нуля до бесконечности, а 0 и </> изменяк ,
Преобразование случайных величин
(5.5J.
(5.43
(V — по-;О полу
Р1ИЧИШ. v и г !!.' цемлем. ТЯ ОТЫС гатребо-шожно. ы уста
пых ве-
.чаем плотность распределения -случайной величи тод иллюстрируется на следующем примере.
Hr Требуется оценить точность системы прот I жив. Система разработана таким образом, что 1П ошибки положения точки взрыва по каждой из । глубине, долготе и широте, равно нулю, а средь
^отклонение равно единице измерения. Предва[.; ' ния показывают, что нормальное распределение I ^Кр хорошей аппроксимацией распределения отклс ; ва от цели по каждой координате и что ошибки «друга. Требуется найти распределение расстояни
ва до цели для этой системы оружия, т. е. распре j величины ।
где х. у и z — ошибки по глубине, долготе и шир- j все ошибки независимы и нормально распределен I и а = 1. Таким образом,
/.(*) =-7=r /2»
fs. (У) —
- »*/2
!формулу (5.32), получаем
(5.55)
(5.56) I
Теперь, обо
(змепения этих трех новых случайных величин
₽(<) =
Согласно форм;
О
cos О
sin О
cos О cos ф —г sin 0 sin ф
sin Geosф
sin 8 sin ф
= г® sin О,
Так как 0 и ф (5.45) и записав
Лные величины записываются как функции но-ичин следующим образом:
х(г, 0, ф) = гсозО,
У (г, о, ф) = г sin О cos ф,
z(r, 0, ф) = rsin 0 sin 4*.
0<ф<к.
(5.54)
cos 0 sin ф г sin 0 cos ф
S)-Ke~r‘nr'. 0<r
АЛ7а)'
,К=П е"'1' гЧг)
видно, что об.' независимы.
Исходные < вых случайны
Таким образа
S3 0 = 1. Кроме того, для 0 0 < it
|,/1 = .7 = r2sin 0.
I Г
<гниё формулы (5.29) и тот факт, что х2 + у2 +
। плотность совместного распределения слу-
- V +
(г, 1. ф}. «('• ®. Ф). г(г. О, Ф)]|71 = 'sinO, О<
аисят от г, можно использовать соотношение
так как sin"
Используя ' г = г2, на чайных величи
п(г, 0, ф)
(5.57)
5— квадрата случайной величины, распределение которой было ==’ олысо что найдено. Производя замену случайных величин и = г~ выражении для плотности распределения случайной величины г |юрмула (5.58) 1 методом, изложенным ранее в этой главе, получаем
/И- ' <•
(5.59)
Данное выражение можно также записать как /(«)-[ 2‘'Т(3/2)|-'Г а7-'1, О
(5.60)
Это распределение хи-квадрат с тремя степенями свободы (см. гл. 3). Можно показать, что в более общем случае случайная величина
=2 4 /=1
(5.61)
ТДе хь хг, ... , xv — * независимых случайных величин, распреде Ленных по нормальному закону с нулевым математическим ожиданием и средним квадратическим отклонением, равным единице, Определена по закону
(5.62)
р распределение хи-квадрат с v степенями свободы.
Преобразование случайных величин
гегрируя по частям, получаем
аким образом, плотность распределения радиальной ошибки сиены оружия имеет вид
е
(5.58)
В гл. 3 указывалось, что для описания двумерной радиальной лшбки используется распределение Релея. Данный пример приводит к обобщению распределения Релея для трехмерного случая при о = 1.
бобщение предыдущего примера к выводу формулы, задающей Определение хи-квадрат
Особый интерес во многих задачах представляет распределение
Пример использования зависимых вспомогательных случайных величин
В рассмотренных ранее примерах можно было использовать формулу (5.45) и избежать исключения вспомогательных случайных величин путем интегрирования, поскольку они не зависели от случайной величины, распределение которой требовалось найти. В рассматриваемом далее примере невозможно найти простые вспомогательные случайные величины, для которых было бы справед ливо это условие.
При профилактическом обслуживании оборудования мастер осматривает и, если необходимо, ремонтирует k станков. Из данных за прошлое время известно, что длительность ремонта одного стан ка является случайной величиной, распределенной ио экспонеп циальному закону с параметром X, т. е.
/(<,) = Кг-1'., <)<(,<» для 1=1, 2..... h.
Требуется определить распределение общей длительности обслуживания k станков, т. е. найти распределение суммы k случайных величин, распределенных по экспоненциальному закону.
Пусть
ее» = ^4-4+... + ^. (5.63)
Поскольку k случайных величин, распределенных по экспоненциальному закону, независимы, их совместное распределение имеет плотность
m(tx, t2,..., Q — Х*ехр —X V tt . (5.64)
Введем теперь k — 1 вспомогательных случайных величин:
«1 =
t5'1"
2k-l = ^1 + ^2 ++ lfr-Г
Используя обобщение формулы (5.31), легко видеть, что якобиан преобразования равен единице.
Таким образом, с помощью формул (5.63) и (5.64) и обобщи н формулы (5.29) находим, что совместное распределение случайных величин w, Zi, г2, ... , z*-i имеет вид
л(г1( zw, tv) = X*e“’*, (5.6t>)
Преобразование случайных величин 225
--------------------------------
^Заметим, что вспомогательные случайные величины не входят неявном виде в выражение для плотности совместного распределения и все же их необходимо исключить путем интегрирования. Заметим также, что область изменения каждой случайной величины ^Ьисит от других случайных величин и, следовательно, случайные величины нс являются независимыми. Требуемое интегрирование «водится последовательно от наименьшей вспомогательной случайной величины zt до наибольшей Zk-\. Пределы интегрирования определяются неравенством» (5.66). Так, пределами для zt дЬляюгся (I и z3, пределами для г2 после исключения zt являются О и г3 и т. д. до Zk-\. Пределами для z*_i являются 0 и w.
Л Таким образом, обобщая формулу (5.32), получаем
_ хщ » z»-t «»
р(оО=Х*е I [ •••( | dzldz2... dzk-v (5.67) об о б
)Сяедовате.т1.н<>,
— х» w. г‘
p(w)=k*e J I* ... ^z2dz2dzi...dz^l.
Продолжая интегрирование, находим
XЛ р— ’•“’гаЛ-1
' 0 <“><»• (5-68)
W 'Если, например. X = 2, то плотность распределения времени, необходимого для обслуживания десяти станков, имеет вид
р(w) = e-2w w9, 0 < w < оо. (5.69)
^Формулу (5.68) можно записать как
X* - >.w wk-i Р&) = г (к)----------•
Это плотность гамма-распределения с параметрами X и ч) = й.
В чтом примере мы доказали справедливость высказанного в гл. 3 i У^Р*1^111111 ° том- ,,то время, необходимое для появления ц не-I уДИсимыд событии, имеет гамма-рас пределен не, если каждое со-происходит с постоянной интенсивностью X.
[ НЕКОТОРЫЕ ПОЛЕЗНЫЕ ОБЩИЕ РЕЗУЛЬТАТЫ
0о.Л Табл' 5’1 приводятся выражения, с помощью которых можно L ДКУ1|>1ГЬ 1'ас11 ределение часто встречающихся функций одной не-ВРывнон случайной величины и двух независимых непрерывных
Таблица 5.1
Формулы для вычисления плотностей распределения наиболее распространенных функций независимых непрерывных случайных величин |/(х) и g (у) — плотности безусловного распределения случайных величин х и у соответственно]
Функция случайной величины Плотность расиределедНя
w = a -|- bx (в н Ь—постоянные)
w = — X '«-V'lD
ш=ех pH = 1 ~ |/(1пи))
«1 = 1пх р(ш) = е“'/(е®)
Ч> = Л'1 Р (») = 7=7" [/ (+ Vw) + [ (— Yw )] 2уа>
ш = Л- + У ₽(“') = ] /(г)г(ш— г) dz = = J dz
w—xy Р М = J | | f (г) 8 (-y-j dz = -Лт|/(т)‘МЛ
W = — р (ш) = f | г | / (wz) g (z) dz =
Преобразований случайных величин
227
Ивчайных величий. Пространство выборок, на котором определена новая случайная величина, необходимо найти из пространства вы-борок исходной случайной величины с помощью преобразования. Если, например, случайная величина к имеет плотность распределения
= (2х, 0<х<1,
I 0 в остальных случаях,
тоВиспользуя первый результат в* табл. 5.1 [приводившийся ранее в виде формулы (5.12а) 1, находим, что функция w = 2х + 3 имеет плотность распределения
р(и>) =
Н[2М] = ^
I 0 в остальных случаях
Чтобы убедиться в том, что р (ю) действительно является плотностью распределения, получаем
f {w)dw — J2 3)(^w ~ *
Выражения, содержащие две случайные величины, необходимо интегрировать по пространству выборок случайной величины, которая должна исключаться. Во многих случаях это невозможно ‘Вынолнить в явном виде.
& Плотность распределения суммы х + у называется сверткой случайных величин х и у. Свертка известна тем, кто знаком с магматической теорией преобразований. Свертка п случайных величин находится путем повторного применения данного результата, "PH этом по-прежнему предполагается, что можно выполнить требуемое интегрирование.4Из центральной предельной теоремы слезет, что при увеличении п получаемое распределение будет стремиться к нормальному.
Л ИТЕРАТУРА
К V, °8 8 R- V., С г a i g А. Т., Introduction to Mathematical Stalls-Щ ,VCS- 2nd ed., Macmillan, Mew York, 1965.
J?’ W a d s w о r t h G. P., В г у a n J. G., Introduction to Probability ИИ “l,(l Random Variables. McGraw-Hill, New York. I960.
5д' Munroe M. E.. Theory of Probability. McGraw-Hill, New York. 1951.
^Ий’в е?гпап Introduction to Statistical Inference. Addison-Wesley, Reading, Massachusetts. 1963.
5.5. F г у Т. С., Probability and Its Engineering Uses, Van Nostrand, 2n<! ed., Princeton, New Jersey, 1955» Имеется русский перевод: Фраи Т. Теория вероятностей для инженеров, Гостехиздат, М.—Д., 1934.
5.6. Johnson N. L., Т е t I е у II,, Statistics, Лп Intermediate Text, v. 2, Cambridge University Press, Cambridge, 1950.
5.7. Mood A. M., Graybill F, A., Introduction to the Theory i! Statistics, 2nd ed.. McGraw-Hill, New York, 1963.
5.8. Meyer P. L., Introductory Probability and Statistical Applications. Addison-Wesley, Reading, Massachusetts, 1965,
5.9. Birnbaum Z. W., introduction to Probability and Mathematic?.: Statistics, Harper and Brothers, New York, 1962.
Г лава 6
АППРОКСИМАЦИЯ ЭМПИРИЧЕСКИМИ РАСПРЕДЕЛЕНИЯМИ
К, В предыдущих главах давалось теоретическое обоснование применения определенных распределений, описывающих реальные явления. Например, были указаны системы, которые могут быть описаны нормальным распределением, гамма-распределением и распределением экстремальных значений. Часто инженер не имеет достаточно надежных теоретических оснований для выбора той или иной статистической модели. Он получает экспериментальные данные и, используя эмпирические методы, должен сделать выводы относительно изучаемого явления. Иногда достаточно представить имеющуюся информацию в виде гистограммы и, возможно, 'Несколько сгладить ее от руки. В других случаях бывает желательно представить данный формально через эмпирические распределения. В числе причин, по которым это делается, можно назвать следующие:
F 1. Желание достигнуть объективности. При сглаживании одних ктех Же экспериментальных зависимостей вручную у разных людей будут получаться различные кривые. Применение эмпирического распределения исключает такую произвольность. Объективность важна, например, для поставщиков, представляющих данные своим клиентам или в правительственную организацию. Математическое выражение иногда необходимо и по другим причинам, например Когда для моделирования методом Монте-Карло (гл. 7) нужно выбрать случайные числа, имеющие данное распределение, или когда Для дальнейшего статистического анализа нужно знать процентили распределения, как, например, для проверки с помощью критерия 17 справедливости допущения о распределении (гл. 8).
2. Необходимость автоматизации процесса анализа данных. Когда аналогичные совокупности данных должны анализироваться Част», и особенно когда требуется выполнять интерполяцию в не-^Олысих заданных точках, может оказаться более экономичным Место подбора кривых распределения вручную использовать быстродействующую вычислительную машину.
t Необходимость знать параметры распределения. Оценки па-ММетров эмпирических распределений часто дают важную обобщен-информацию и могут использоваться при интерполяции. До-
230
Глава 6
пустим, например, что при испытаниях материала на усталость получены данные о числе циклов до момента выхода детали из строя при нескольких уровнях нагрузки. Если число циклов до выхода детали из строя при каждом значении нагрузки можно описать одним и тем же семейством распределений, то можно получить оценки параметров эмпирического распределения при каждом значении нагрузки и построить графики зависимости их от нагрузки. С помощью этих графиков получают информацию о параметрах распределения числа циклов до выхода детали из строя при промежуточ них значениях нагрузки. Следовательно, можно прогнозирован, число циклов при промежуточных значениях нагрузки, а также получить лучшие оценки при заданных значениях нагрузки.
В гл. 7 будет показано применение эмпирических распределе-ний для оценки характеристики системы, когда имеются лишь данные о параметрах составляющих ее компонентов. Такие распределения позволяют получить аппроксимации в тех случаях, когда некоторые моменты распределения определены теоретически, аточ ное распределение неизвестно. Такой пример приводят Мерри нг-тон и Пирсон [6.1].
Подбор распределений для экспериментальных данных имее! долгую историю; было предложено много различных методов. Наиболее распространенным из них является применение нормаль ного распределения. Как указывалось в гл. 3, из центральной предельной теоремы следует, что нормальное распределение дает приемлемое описание многих (хотя и не всех) реальных явлений. Ан логично гамма-распределение и логарифмически нормальное рас пределение использовались для описания случайных величин, ограниченных с одной стороны, так же как бета-распределение — для описания случайных величин, ограниченных сверху и снизу Хотя эти модели приводят к распределениям самой различной фор мы, все же они не дают той степени обобщения, которая часто бывает необходима. Это иллюстрируется на рис. 6.1, где показаны области в плоскости (0Ь р2 ) для различных распределений — нор малыюго, бета-распределения (частный случай — равномерное распределение), гамма-распределения (частный случай — экспотв циальное распределение) и логарифмически нормального, где pi квадрат нормированного показателя асимметрии, а р2— норми; ванный показатель островершинности (см. гл. 2). Сюда входит i же /-распределение Стьюдента — симметричное распределение, сходящееся к нормальному, когда его параметр (число степеней свобо-1 ды) произвольно увеличивается.
Для любого нормального распределения pt = 0 и р2 = 3. По*1 этому на рис. 6.1, это распределение представлено одной mow11'! так же как экспоненциальное и равномерное распределения. Эт01 объясняется тем, что у этих распределений нет параметра формЫ|
Аппроксимация эмпирическими распределениями
231
it. поэтому они имеют единственную форму. Гамма-распределение, логарифмически нормальное распределение и /-распределение Стьюдента представлены кривыми. Таким образом, гамма-распреде-(еиия можно подобрать для всех значений р| и лежащих вблизи
Средней кривой. Заметим также, что кривая для гамма-рас преде-•Леиия находится вблизи кривой для логарифмически нормального ^сп ределен и я. Это помогает объяснить тот факт, что эмпирические данные часто могут быть одинаково хорошо (или одинаково плохо) как гамма-распределением, так и логарифмически нор-Р»ным распределением. Бета-распределение, имеющее два па-отра формы, занимает на рис. 6.1 определенную область и,
232
следовательно, оно является более общим, чем любое другое распределение. Однако большая область значений и р2 не охвачена ни одним из рассмотренных ранее распределений. Целью этой главы является рассмотрение семейств распределений, позволяю щих описать эмпирические данные для всей области, изображенно): на рис. 6.1.
Для применения графиков, изображенных на рис. 6.1, необхо димо знать значения и р2. которые обычно бывают неизвестны Однако эти кривые можно использовать и для того, чтобы узнать будут ли надлежащим образом описаны полученные данные одним из показанных на рис. 6.1 распределений. Это выполняется пу тем нахождения выборочных оценок bt и 62 с помощью форм;. (2.51)—(2.55) и нанесения этой точки на рис. 6.1. Если эта точк. будет лежать достаточно близко от точки, кривой или области, соответствующей одной из названных нами моделей, то это распре деление может быть использовано для описания эмпирических дан ных. Затем можно приступить к нахождению оценок для парами ров распределения, используя соответствующие формулы, част> которых приводится в гл. 3. Аналогичный метод используется далее в этой главе для более общих моделей.
При применении этого метода необходимо учитывать два важны ограничения. Прежде всего заметим, что для любого множеси. данных bt и 6г являются лишь оценками для и И подвержен колебаниям от выборки к выборке. Действительно, изучая форму лы (2.51)—(2.55), видим, что эти оценки очень чувствительны к небольшому числу крайних значений. Поэтому методы, изложен ные в данной главе, необходимо использовать с осторожное и . особенно когда число наблюдений невелико, например меньше 20и. Во-вторых, в общем случае форма распределения не определяется однозначно его нормированными показателями асимметрии и островершинности. Таким образом, подбор распределения для олнеа-ния определенного множества эмпирических данных с помою рис. 6.1 не гарантирует адекватности выбранной модели. Обы. требуется составлять таблицу частот и сравнивать подбирас распределение с фактическими данными. В гл. 8 описаны стати» ческие методы оценки адекватности выбираемой модели.
Более общими методами описания эмпирических данных яь. ; ются применение распределений Джонсона или Пирсона, раэло/ ' ния Корниша — Фишера, разложения в ряд Грема — Шар. ! • । разложения в ряд Эджворта и т. д. В данной главе будут расе'!..г-1 риваться лишь распределение Джонсона и распределение Пирсона! Изложение других методов можно найти в книге Кендалла и Спао-а арта 16.2].
Аппроксимация эмпирическими распределениями
233
в.1. РАСПРЕДЕЛЕНИЯ ДЖОНСОНА
Общие положения
Ж Джонсон 16.3] предложил находить эмпирические распределения путем преобразования нормированной нормально распределенной случайной величины. Преимущество такого преобразования Включается в том, что оценки процентилей эмпирических распределений можно получить, используя таблицу площадей под кривой нормированного нормального распределения, например, такую, как табл. I в конце данной книги. Пусть х — случайная величина, для которой требуется подобрать распределение Джонсона. В общем случае преобразование имеет вид
г = f 4- т/т (х; е, К); т}>0, —оо<7<оо, X > О, — оо<е<оо, (6/|)
.где т — произвольная функция; 7, tj, е и X — параметры распределения, az - нормированная случайная величина, распределенная по Нормальному закону. Джонсон предложил следующие три различные формы или семейства функций т:
I 1) тд(х; е, Х) = 1п х>е, (6.2)
| 2) (х; е, X) = 1п х х ') ’ е^АГ<е+)'1 (6-3)
В 3) т3(х; е, X) = Arsh °J , —«><х<оо. (6.4)
ЭС помощью формул (6.1) и (6.2) находим, что для первой из этих функций
[Др^еняя методы, изложенные в гл. 5, и имея в виду, что г — нормированная нормально распределенная случайная величина, на-*°ДЧМ следующую плотность распределения:
г’
®ДЯ обозначение
7* = 7 —Т|1пХ,
(6.7)
234
Г лава б
получаем
/1 W - ~~--------- exp I- V '.'Г—+1" (»-•)
l/2^(.v —е). I 2 [ 1
х^-е, Т|2>0, —оо <'[ * <" 6а, —-со <*£ <оо. (6.8)
Это логарифмически нормальное распределение с тремя параметрами, заданное формулой (3.34а), с
Vi = J_H 7* = _л_, (69)
называемое также семейством распределений SL Джонсона.
Для функции, определяемой формулой (6.3), аналогичным образом находим
,м=pb <?- .> i»- «+)ех11 (- Я7+л| |п •
e-^X-^E-f-X, Т|>0, — со<-[<ос, Х>0, -— со<е<оо. (6.10) Это выражение, содержащее четыре параметра, является семейством распределений SB Джонсона. Наконец, для функции, определяемой формулой (6.4), имеем
/,(*) =
У2»
хмр[_ц(7+г11п{т + к^>+1га,
— о°<СХ <оо , 7) > 0, —<» < f <С оо, )> 0, — оо<£ <оо . (6.11) Это выражение с четырьмя параметрами является семейством распределений Su Джонсона.
Область в плоскости (р(1 р2) лля трех семейств распределений Джонсона показана на рис. 6.2. Так, распределения, у которых значения и р2 лежат вблизи линии Sl, можно представить логарифмически нормальным законом; распределения << значениями pt и р2> лежащими выше линии S/., можно представите семейством SB Джонсона, а распределения со значениями pi и Р?-лежащими ниже линии St, — семейством распределений Sv Джонсона. Сравнение рцс. 6.2 и 6.1 показывает, что семейства распределений Джонсона могут принимать более разнообразные формы-чем распределения, рассмотренные в гл. 3.
Заметим, что семейства распределений Sb и Sy Джонсона имеют два параметра формы т и -q, один параметр, характеризующий центр I распределения е, и один параметр масштаба X. Плотности распре- I
Аппроксимация эмпирическими распределениями
235
^Велений SB и Sy Джонсона с различными параметрами показаны со-В#тветственно на рис. 6.3 и 6.4. Графики для плотности логариф-^Кдачески нормального распределения были приведены ранее на рис. 3.10.
Pi
Рис. 6.2. Графики для выбора соответствующего аппроксимирующего рас-Вйеделення Джонсона. (Из статьи Johnson N. L., Systems of Frequency Clirves Generated by Methods of Translation, Biometrika. vol, 36. 1949. pp.
148-176.)
К Из формул (5.11), (6.8) в (6.10) следует, что распределения Sy , St, и Sjj Джонсона определяются соответственно для неограниченных случайных величин, случайных величин; ограниченных с одной стороны, и случайных величин, ограниченных сверху и снизу. Однако не следует строго придерживаться этих ограничений. На-Пример, семейство распределений Sy Джонсона может служить Удовлетворительной аппроксимацией распределения ограниченной КЙучайной величины. Это положение аналогично широкому применению нормального распределения, которое также является не-рраннченным, для описания таких физических величин, лак рост Иовека.
Подбор распределения Джонсона для совокупности экспериментальных данных выполняется в два этапа: 1) определяем, ка-*Ое из трех семейств распределений приемлемо; 2) получаем оцен-'1 Параметров выбранного семейства распределений и находим
ИЩрическпе вероятности подбираемого распределения.
240
Выбор семейства распределений Джонсона
Чтобы решить, какое из трех семейств распределений Джонсон следует использовать для полученной совокупности экспериме, тальных данных, обычно с помощью формул (2.51)—(2.55) наход; эмпирические оценки bt и Ь2 и используют их вместо р, и р2 i рис. 6.2. Если точка (Ь, , Ь2) находится вблизи кривой, изображу ной на рис. 6.2, то выбирается семейство распределений . Ес.т эта точка находится над кривой, то выбирается семейство Sg, есл: же эта точка находится под кривой, то используется семейство S,
Кривую, изображенную на рис. 6.2, можно продолжить, испо.и зуя параметрические уравнения
?>=<“-1)(»+2>*.
рг = «‘ + 2», + 3»1—3. 1
Эти дополнительные точки находятся путем выбора значений , и решения уравнений относительно соответствующих значений |-и рг-
Проиллюстрируем определение надлежащего семейства распре делений Джонсона на следующем примере. Партия из 500 резисторов сопротивлением 0,5 ом была подвергнута испытаниям на воздействие коррозионной среды в течение 100 час и после испытаю было измерено сопротивление каждого резистора. Полученные р-зультаты приводятся в табл. 6.1. Используя формулы (2.51)—(2.55) получаем следующие значения: i = 0,976 и Ь2 = 4,68. Такт образом, Ь, = 0,953.
Точка (&!, 62), используемая вместо (|Jt, р2), оказывается вбли ' кривой St на рис. 6.2, и, следовательно, для описания экспериментальных данных должно выбираться семейство распределений 5,-
Оценка параметров семейства распределений St (Джонсона (логарифмически нормального распределения)
Рассмотрим два случая: 1) когда известен параметре, хараь ризующий центр распределения, 2) когда он неизвестен и д<‘: жен оцениваться на основе экспериментальных данных. Поскольку । с — нижний предел случайной величины, распределение которой 1 подбирается, он часто бывает известен из физических соображен:1 •’ 1 Например, при анализе результатов испытаний на долговечно. 1 часто г = 0. Более детальное изложение рассматриваемого з-)"1, и других методов оценки дается в работах Джонсона [6.3] и Эйтчнн- I сона и Брауна [6.4]. I
Значение е известно. Полагая, что плотность логарнфмическ нормального распределения с параметрами у. и а выражается Ф"-’1
Аппроксимация эмпирическими распределениями
241
Таблица 6.1
Результаты испытаний 500 резисторов с сопротивлением 0,5 ом в течение 100 час на воздействие окружающей среды, сгруппированные по плотности распределения
Сопротивление, ом Число компонентов Сопротивление, ом компонентов
Ниже 0,350 1 0,675-0,699 29
0,350-0,374 1 0,700-0,724 21
0,375-0,399 2 0,725-0,749 11
0,400-0,424 9 0.750-0.774 14
0,425-0,449 24 0.775—0,799 7
0,450—0,474 34 0,800—0,824 4.
0,475-0,499 44 0,825—0,8-19 3
0,500-0,524 43 0,850-0,874 4
0,525—0,549 56 0,875—0,899 |
0,550-0,574 41 0,900—0,924 2
0,575-0,599 46 0,925—0,949 1
0,600—0,624 44 0,950-0,974 0
0,625-0,649 32 0,975-0,999 1
0,650-0,674 22 свыше 1,000 а
мулой (3.34а), способом, аналогичным использованному при получении оценок для параметров нормального распределения [см. формулы (2.31), (3.6) н (3.7)], получаем следующие оценки:
?= 4- )• <6ЛЗа)
l-л Is И" («,-.>! [I>Т Г'
° “Iй—»-------------^-4=--------=4 (6.136)
Или
$= (^2[,n(x‘—е)]г—[21п^'~e)J I/в| (6-13в)
I n ( n—1) )
lion*'* = *• 2> ••••«) — наблюдаемые значения. Оценки парамет-m f 11 Tl- входящих в формулу (6.8), имеют вид
242
Глаоа 6
л I л 1
7) = — или vj = —
(6.1b
(6.15)
Другой метод получения ц и о, а именно путем графического прел ставления вероятностей, описан в гл. 8.
Используя оценки параметров, можно найти ожидаемую до. л , наблюдений, лежащих в определенных интервалах частот, т. получить эмпирическое распределение, и сравнить получешп \ результаты с фактическими данными. Данный метод будет он. сан и проиллюстрирован для случая, когда все три парамег( логарифмически нормального распределения должны оценивать ся на основе экспериментальных данных.
Значение е неизвестно. Используя соотношения (6.2) и (6.7 запишем формулу (6.1) как
z = у* 4-Tjln(x—е), (6.161
где г — нормированная нормально распределенная случайная г» личина. Оценки трех неизвестных параметров у*, ц и е логарифмически нормального распределения находятся путем прирав, и ваиня трех процентилей, вычисленных на основе эксперимента, ных данных, трем соответствующим процентилям нормально р. пределенной случайной величины г [формула (6.16]. Получаем три уравнения и, решая их относительпо неизвестных параметров, ходим искомые оценки. Эти три уравнения имеют вид
z« = 7* +1п (хя — s). (6.1")
где г« представляет собой а 100-й процентиль нормированной нормально распределенной случайной величины, а хв —соотг.- < ствующий процентиль, вычисленный на основе экспериментальных! данных. Если, например, для этой цели используются 5-й. 50-и и 95-й процентили, то этими тремя уравнениями являются
— 1,645 = 7* 4- ’l (лго.об — е),
О = 7*4-т}1п(хо.5о—е), (6-|8|
-
1,645 — 7* 4- -г; 1п (Xo.gr, — е).
так как гь.ов — —1,645, zo.so = 0 н Zo.95 = 1.645.
Аппроксимация эмпирическими распределениями
243
I Решая эти уравнения, получаем
<619)
) (6-20)
И
Ц Л _ У1/Л
е = Хо,5 — * 7 4 • (6.21)
I В более общем случае, когда вместо 5-го и 95-го процентилей Дёпользуются два любых симметричных процентиля, например alOO-й и (1—а) 100-й, получаем следующие уравнения:
(6.22)
(6.23)
(6.24)
где z' — zi-,, = z„— 100я-й процентиль нормального распределения, а и Х]_а — соответственно а100-й и (1—а)100-й процентили*. вычисленные на основе экспериментальных данных. Когда выбираются несимметричные процентили, уравнение Ловится нелинейным и принимает следующий вид:
ДЛЯ
,/п
(6.25)
FAB Z|_a. —(1—а')100-й процентиль нормированного нормального ^определения, а Х\-Л>— (1—а') 100-й процентиль, полученный на
Ренове экспериментальных данных. Выражения для-(*и е остаются ' «Кими же, за исключением того, что в формуле (6.23) — г' заме-«ЙИется на г, . ►
ле , 9°Р конкретных процентилей до некоторой степени произво-ьа-1 Иеп&льзование различных процентилей приведет к несколько ДУМичпым оценкам для параметров, хотя обычно можно ожидать, £Различия будут невелики. Когда мы заинтересованы в том, чтобы
244
Г лава 6
получить хорошую аппроксимацию в области больших отклонений, следует выбирать процентили, лежащие в этой области, например 5-й и 95-й. Однако использование слишком крайних значений про центилей приведет к потере точности при подборе распределения вследствие большой изменчивости оценки процентиля.
Заметим, что а 100-й эмпирический процентиль находится как а (п. + 1 )-е по порядку значение из п упорядоченных наблюдений, при этом в случае необходимости применяется интерполяция (см. гл. 2).
Описанная выше методика применима к подбору распределения для сопротивлений, значения которых приводятся в табл. 6.1. В качестве аппроксимации предлагается логарифмически нормально», распределение, и оценки параметров необходимо найти путем при равннвания 5-го, 50-го и 95-го эмпирических процентилей соответствующим процентилям подбираемого распределения.
Так как п — 500, оценка для 5-го процентиля находится путем интерполяции между значениями 25-го и 26-го упорядоченных наблюдений; 50-й процентиль, или медиана, является средним значений 250-го и 251-го наблюдений, а 95-й процентиль находится путем интерполяции между 475-м и 476-м по порядку наблюдения ми. Таким образом, с помощью данных, приведенных в табл. 6.2. получаем
0,439, V» = 0,569 xw = 0,777.
Таблица 6.2
Выбранные упорядоченные значения, полученные в результате испытаний на воздействие окружаюцей среды
в течение 100 час 500 резисторов с сопротивлением 0,5 ом
Аппроксимация эмпирическими распределениями
245
уставляя эти значения в формулы (6.19) — (6.21), находим
т? = 1,645
0,569 — 0,439 | _ е- 1.645/3.5
0,569-0,439
Л — 3,707/3.5
е = 0,569 — е
0,222.
Таким образом, аппроксимирующее логарифмически нормальное распределение для сопротивления х имеет вид
да=
К Если бы вместо 5-го, 50-го и 95-го процентилей приравнивались 20-н, 50-й и 80-й процентили, то из табл. 6.2 были бы взяты сле-дуцэщие значения:
= 0,488,
= 0,569
0,677.
'Гавляя их в формулы (6.22)—(6.24) и используя соотношение zo.eo = —Z6.20 = 0,842, имеем
= 2,975,
7* =3,311
« = 0,240.
Для подбора распределения находим ожидаемую долю (или число) наблюдений, лежащих в определенных интервалах частот, Используя оценки параметров. Ожидаемые значения можно сравнить с фактической долей (или числом) наблюдений в этих интервалах частот. Ожидаемая доля наблюдений, лежащих ниже не-Которого значения х, определяется путем подстановки в формулу
7*. Т|, е и х вместо 7*, т;, s и ха, а после вычисления га из табл. I родится площадь а под кривой нормированного нормального расселения, лежащая слева от точки г, . Ожидаемая доля наблю-
246
Глава 6
деннй, лежащих в данном интервале частот, равна разности между ожидаемыми долями наблюдений, лежащих ниже каждого из граничных значений интервала. Так, в предыдущем примере при подборе распределения путем приравнивания 5-го, 50-го и 95-гп процентилей ожидаемая доля сопротивлений ниже х — 0,40 ом равна доле площади под кривой нормального распределения, л< жащей слева от точки а» = 3,707 + 3,5 1л (0,4—0,222) = —2,333. и составляет 0,010.
Аналогично находим, что доля сопротивлений ниже х = 0,45 о.-, равна 0,071. Таким образом, ожидаемая доля сопротивлений, лежащих в интервале от 0,40 до 0,45 ом, равна 0,061, тогда как фактическое значение составляет 0,066. Сравнение фактическое процента наблюдений с ожидаемым на основе полученных ранее дву \ групп оценок для параметров проводится в табл. 6.3 и иллюстрг руется на рис. 6.5 и 6.6. В обоих случаях логарифмически норма.)> ное распределение служит отличной аппроксимацией для экспериментальных данных. Более объективную оцегпсу адекватности распределения экспериментальным данным можно получить с ги -мощью критерия хи-квадрат (см. гл. 8).
Таблица 6.3
Сравнение фактических данных о сопротивлениях резисторов с теоретическими при выборе распределения SL Джонсона (логарифмически нормального распределении)1'
Сопротивление, ом Фактический процент наблюдений Предсказанный процент наблюдений, полученный на основе приравнивания 5-го, 50-го н 95-го процентилей Предсказанный процент наблюдений, полученный на ос-нпвб Приравнивавед 20-го, 50-го н 80-го ДроДентиле»
Менее 0,400 0,8 1.0 1.6
0,400—0.449 6.6 6,1 7.8
0,450—0,499 15,6 14,8 14,9
0,500—0,549 19,8 20,3 18,9
0,550—0,599 17.4 19,6 17,5
0,600-0,649 15,2 15,0 13,7
0,650-0,699 10,2 10,0 9,7
0,700—0.749 6,4 6.0 6,3
0,750—0,799 4,2 3,4 4.0
0,800-0,849 1.4 1,3 2,3
0,850-0,899 1.0 1.0 1,4
0,900 и более 1.4 1.0 1,9
Предполагается. что* все три параметра неизвестны.
247
Сопротивление, ом
Рис. 6.5. Фактический (Я) и предсказанный (Р) проценты наблюдений при выборе распределения Sl Джонсона (логарифмически нормального распределения) для данных о сопротивлении резисторов на основе приравнивания 5-го. БО-го и 95-го процентилей. (Предполагается, что все три параметра неизвестны.)
Сопротивление,ом
^бопрб’б' ®актнческий 0) 11 предсказанный (Р) проценты наблюдений при Kpim-.n Ра®ЦреДеления Sl Джонсона (логарифмически нормального распреде-
20 к. '.fin MHoAux 0 сопротивлении резисторов на основе приравнивания ov-го ц то-го процентилей. (Предполагается, что все три параметра неизвестны.)
248
Глава 6
Оценка параметров семейства распределений Sb Джонсона
Случайная величина, имеющая распределение SB Джонсон,; теоретически ограничена пределами г и е + X. Эго условие приво дит к следующим случаям:
1. Оба крайних значения известны. Этот случай будет имен место, например, при подборе распределения процента изделий принятых за сутки после выполнения определенной операции
2. Известно только одно крайнее значение, как, например при испытаниях на долговечность, когда время безотказной рабон не может быть отрицательным.
3. Ни одно крайнее значение не известно.
Здесь рассматриваются методы оценки параметров для каждог из этих трех случаев. Более подробно с этим вопросом можно поз накомиться в работах [6.31—16.5].
Область изменения случайной величины известна. Так как паи меньшее возможное значение в случайной величины и наибольш,. возможное значение е 4-X известны, необходимо лишь получи, оценки для f и -г). Оценки для 7 и т) находятся путем приравниваю,1 двух процентилей, вычисленных на основе экспериментальны данных, соответствующим процентилям нормального распреде.т ния, определяемым по формуле (6.1), и решения двух полученных уравнений относительно 7 и т). Действуя как и в случае логарифм,, чески нормального распределения с тремя параметрами, получас'..
(6.26>
^,,--^,(.^•1^;). О-
где г. и Z|—а' представляют собой а100-й и (1 —а')100-й процент' и нормированного нормального распределения, ахя и xt_e> — соответ-1 ствующие эмпирические процентили. Таким образом, х, является я(п 4- 1)-м упорядоченным значением эмпирических данных, в I случае необходимости используется интерполяция.
Такой способ используется, например, при выборе pacnpc.'iefl ления Sg Джонсона для описания данных, характеризующих вР*-"и мя, оставшееся до момента изготовления детали на автомат,, |ЧР°‘и ванной производственной линии. Это время меняется от одной .в’- тали к другой вследствие различий в качестве материала и г 1 твердости. Допустим, что для идеального материала минима > время обработки составляет 0,5 мин. Верхняя граница равна fl
Аппроксимация эмпирическими распределениями
249
при такой длительности обработки материал автоматически бракуется. В первых двух столбцах табл. 6.4 показано время, потребовавшееся для успешного завершения обработки 1000 случайным образом выбранных деталей.
Таблица 6.4
^равнение фактических и теоретических данных о времени производства 1000 случайным образом выбранных изделий при выборе распределения SB Джонсона
1г... вделия. мин Фоктнче- Предсказанный процент наблюдений, когда границами являются 0,5 и 2,0 Предсказанный процент наблюдений, когда границами являются Он 3,0 Предсказанный2’ процент наблюдений. когда нижняя граница равна 0,5, а верхняя граница неизвестна
наблюде-
Менее 0,70 0,9 0,9 1,7 0,4
К* 0,70-0.79 3.7 4,7 4,3 4.5
F 0,80-0,89 12,6 10,3 9.2 12,8
•0,90-0.99 18,4 15,2 14,4 18,7
f 1,00—1,09 18.8 17.4 17,7 19,1
.1,10-1,19 15,8 16,9 17,6 15,7
1,20-1.29 12,2 13,9 14,5 11,3
1,30—1,39 7,6 10,2 10,1 7,4
1,40-1.49 5,0 6.1 5.9 4.5
1,50-1.59 2,8 3.1 2.8 2.6
1,60-1.69 >,1 1,0 1.2 1,4
1,70—1,79 0,9 0,3 0,5 0.8
1,80 и более 0,2 0,0 0,1 0,8
Г ’Полученный на основе приравнивания 9-го и 91-го эмпирического н теоретического П№ап<лей.
if 2) „
Полученный на основе приравнивания 9-го, SO-го и 91-го эмпирического и теоретн-'«Крго процентилей.
На основе полученных данных с помощью формул (2.51) — (2.55) вычисляются bt = 0,406 и Ьг = 3,28. Нанесение этих значений вместо pj и р2 на рис. 6.2 показывает, что в качестве аппроксимирующего распределения следует выбрать распределение SB КЖонсона. Принимается решение приравнять 9-й и 91-й эмпири-Юские процентили соответствующим процентилям выбираемого рас-РЦеления (выбор самих процентилей несколько произволен). И^ки.м образом, получаем хо.оэ = 0,84, xo.oi = 1,42 и —z0.os =
~ Условия задачи имеем» = 0,5 и к = 2,0 — 0,5 =
-*ь**'^' Подставляя эти значения в формулы (6.26) и (6.27), полу-
250
Глава б
1,34 4- 1,34 , ео,
|д Г(1,42— 0,5) (0,5 4- 1,5 — 0,84)1 = П 1(0,84 — 0,5) (0,5 4- 1,5 — 1,42) J
и
7 = 1,34 - 1,587 In = ода-
Исследуем влияние крайних значений на оценки параметров и по лучаемое соответствие. Допустим, что использовались нижняя i верхняя границы, равные соответственно 0 и 3 мин, а не 0,5 и 2 мин Таким образом, s = 0 и к = 3,0.
Получаем такие оценки параметров: -ц = 3,199 и 7 = 1,681.
Используя соотношение между нормальным распределением : распределением SB Джонсона 1см. формулы (6.1) и (6.3)], как , ранее, можно найти ожидаемую долю наблюдений, лежащих в <л. ределенных интервалах вероятностей. Для каждого из двух выс ранных распределений фактический процент наблюдений сравни вается с ожидаемым (табл. 6.4). Графически это показано на рис. 6.7 и 6.8. В обоих случаях получаем очень хорошее соответствп фактическим данным, несмотря на различные значения оценок дл параметров.
Известно одно крайнее значение. Для получения оценок пар. метров распределения So Джонсона, когда известно лишь одно ни/, нее крайнее значение е, кроме формул (6.26) и (6.27), дополните н но используется еще одно уравнение, полученное путем приравш: вания эмпирической медианы хо.в медиане нормального распре.и ления zo.5 = 0. При использовании симметричных процентили т. е. когда а = а', получаем
к==(*о,8—®) X
Если а=£=а', необходимо решить следующее уравнение для
время производства, мин
Рис. 6.7. Фактический (Л) и предсказанный (Р) проценты наблюдений прп (выборе распределения Sb Джонсона для времени производства продукции на основе приравнивания 9-го и 91-го процентилей и принятия в качестве крайних значений 0,5 н 2,0.
*с. 6.8. Фактический (Л) и предсказанный (Р) проценты наблюдений при
“9ре распределения Зв Джонсона для времени производства продукции Ренове приравнивания 9-го и 91-го процентилей и принятия в качестве крайних значений 0 и 3,0.
252
Глава 6
В обоих случаях оценки для т) и 7 находятся путем подстанон ки X вместо X в формулы (6.26) и (6.27).
Если бы для данных, приведенных в табл. 6.4, была неизвестн верхняя граница, то описанный порядок вычислений использовал ся бы для нахождения ее оценки. Получаем, что эмпирическая медиана равна xo.so = 1.07. Таким образом, подставляя в формул,
Время произеоИства.мин
Рис. 6.9. Фактический (4) и предсказанный (Р) проценты наблюдений пр. выборе распределения Sb Джонсона для времени производства продукшп на основе приравнивания 9-го. 50-го н 91-го процентилей и принятия в к? честве нижней границы 0,5 при неизвестной верхней границе.
(6.28) 9-й, 50-й и 91-й процентили и полагая е = 0,50, находи’
X = (1,07-0,5) х
у fl ,07—0,5) (0,84—0,5)-f-(l ,07—0,5) (1,42-0,5)—2 (0,84—0,5)(1,42—0 5) (1,07 — 0,5)а —(0,84—0,5) (1,42—0,5)
= 4,36.
Подстановка этого значения X в формулы (6.26) и (6.27) дает >, = 2,328 и 7 = 4,411.
Ожидаемый процент наблюдений показан в последнем столбце табл. 6.4 п графически представлен на рис. 6.9. И снова получено i отличное соответствие.
Аппроксимация эмпирическими распределениями
253
К Ни одно крайнее значение неизвестно. В том случае, когда неизвестно ни одно крайнее значение, четыре эмпирических процен-тиля должны приравниваться соответствующим процентилям нормированного нормального распределения.
к Получаемые четыре уравнения
г, = £ + £ In ‘ - 1 • 2. 3, 4, : <6.30)
Нелинейны и должны решаться численными методами.
Г К счастью, в большинстве технических задач одна граница, на-Ьример нижняя нулевая граница, известна, и поэтому используются более простые методы.
4 Оценка параметров семейства распределений Su Джонсона
Случайная величина, имеющая распределение Sy Джонсона, Теоретически не ограничена, и в общем случае все четыре пара-,метра •(, т), К и е неизвестны. Однако оценки этих параметров можно Найти с помощью табл. V, помещенной в конце книги1’. Порядок Вычислений основан на методе моментов (т. е. первые четыре момента выбираемого распределения приравниваются соответствующим эмпирическим моментам) и состоит в следующем:
1. На основе эмпирических данных, используя формулы (2.31)
.Я (2,51)— (2.55), находим х, о, । bt и bz. Последние две величины были получены ранее при выборе нужного семейства распределений Джонсона.
’ 2. С помощью табл. V находим оценки 7 (в таблице даны зна-
чения —7) и т) из । bt и bz, в случае необходимости прибегая к Йгерполяции. Если требуются более точные результаты, когда Имеется большое число наблюдений (и оценки являются статистически более точными), можно использовать итерационный метод, описанный Джонсоном 16.6].
3. Вычисляем
X -------------------х-------- (6.31)
Первоначально эту таблицу опубликовал Джонсон [6.6].
54
Глава 6
И
где
(6.32.
(6.33.1
Данный метод иллюстрируется на следующем примере. На 250 образцах металла были проведены измерения коэффициента трения. Полученные значения приведены в первых двух столбцах табл. 6.5. Было решено аппроксимировать экспериментальные данные распределением Джонсона. С помощью исходных данных были вычислены следующие значения: х = 0,0345, а = 0,0098, 1 = 0,87 и Ь2 = 4,92.
Таблица 6.5
Сравнение фактических и теоретических данных о коэффициенте трения для 250 образцов материалов при выборе распределения 5и Джонсона
I Коэффициент трели я Фактический процент наблю- Предсказанный процент наблюдений
Менее 0,0150 0.4 0.7
0,0150—0,0199 3.6 3,3
0,0200-0,0249 12,0 10,8
0,0250—0,0299 17.6 20,0'
0,0300—0.0349 23,2 22,5
0,0350-0,0399 18,0 17,9
0,0400-0,0449 11,6 11.5
0,0450—0,0499 6,8 6,4
0,0500-0,0549 3,6 3.5
0,0550—0,0599 1,6 1.7
6,0600 и более 1.6 1.7
Нанесение точки (Z>j, 62) на рис. 6.2 показывает, что необходим" использовать распределение Зи Джонсона, несмотря на то, что наблюдаемая случайная величина может принимать только положительные значения и, следовательно, ограничена с одной стороны.
С помощью значений bt п Ь2 путем интерполяции из табл. V Л Л
находим т| = 2,433 и 7 = —1,783. Подставляя полученные оценки в формулы (6.31)—(6,33), имеем
Аппроксимация эмпирическими распределениями
255
ш = exp [(2.433)-2] = 1,184, 0,0098
= 0,0169
, 184 — 1) 1,184 ch
Рис. 6.10. Фактический (4) п предсказанный (Р) проценты наблюдений при В выборе распределения Джонсона для данных о коэффициенте трения.
^АСравнение ожидаемого и фактического процента наблюдений вобранных интервалах частот с использованием полученных оценок показывает отличное соответствие (см. табл. 6.5 и рис. 6.10).
6.2. РАСПРЕДЕЛЕНИЯ ПИРСОНАХ
I Еще одну группу семейств распределений предложил Карл Цнрсон. Каждое семейство распределений в системе Пирсона может
I быть получено как решение дифференциального уравнения
df (.у) = (х — 't'J f М ,g 34)
th' -|- Ф,Л' -|- фал;а
^ДДя случайной величины х с плотностью распределения [ (х) путем Надлежащего выбора параметров 0О. 0i. Фг и Фз- Решение этого «.Равнения приводит к большому числу семейств распределений, включая рассмотренные в гл. 3 нормальное, бета-распределение
(распределение Пирсона типа I) и гамма-распределение (распределение Пирсона типа III). Области в плоскости (jjb р2), соответствую щие различным распределениям Пирсона, показаны па рис. 6.11
Рис. 6.11. Область в плоскости (3lt fi,) для распределений Пирсона различного типа. Буквами U и J обозначены U-образная и J-образная формы рас пределений.
Эти графики аналогичны изображенным на рис. 6.1 и 6.2. Они свидетельствуют о широком разнообразии форм распределения Пир сона и могут использоваться для выбора соответствующего аппроксимирующего распределения для данной случайной величины на основе знания или оценок параметров pt и р2. В ряде работ 16.7 I; [6.91; [6.101 приводятся выражения для плотностей различных распределений Пирсона.
Аппроксимация эмпирическими распределениями
257
^ Описание методов подбора распределений Пирсона для эмпирических данных потребует очень много места, поскольку получение каждого семейства распределений связано с решением различных систем уравнений. Принципы, лежащие в основе этих методов, осматриваются в книге Кендалла и Стьюарта [6.21, а в книге Элдертона 16.7] приводятся формулы для каждого семейства распределений. Эти выражения совместно с выражениями для первых четырех моментов, а также параметров и могут использоваться для составления программы вычислительной машины при подборе Определения Пирсона для данной совокупности данных. Затем выбранное распределение можно сравнить с фактическими данными Аналогично тому, как это делалось для распределений Джонсона. /Иногда вместо получения выражения для аппроксимирующего непределен и я Пирсона достаточно лишь оценить его процентили.
Это можно сделать, зная первые четыре момента или их оценки, безподбора распределения, лишь используя таблицы, приведенные 5 статье Джонсона и др. [6.81. Эти таблицы позволяют определить следующие а 100-е процентили аппроксимирующего распределения Пирсона: 0,25; 0,50; 1,0; 2,5; 5.0; 10,0; 25,0; 50,0; 75,0; 90,0; 95,0; 97,5; 99,0; 99,5 и 99,75. Менее обширные таблицы, первоначально опубликованные в книге Пирсона и Хартли [6.91, которые содержат только восемь процентилей и охватывают меньшую область В плоскости (0j, р2), приводятся в данной книге (табл. VII). Порядок применения этих таблиц для оценки процентилей аппроксимирующего распределения Пирсона на основе эмпирических данных состоит в следующем:
I. Вычисляем х, а, Ьх и Ьг.
Т 2. Находим табличные нормированные процентили z„ для выбранного значения я, беря Ьх и Ь2 вместо ₽, и ра при обращении к Таблицам в статье Джонсона и др. [6.81 или к табл. VII.
3. Определяем оценку «100-го процентиля как
а га х • (6.35)
В упоминавшейся статье Джонсона и др. [6.8] изложена методика использования таблиц для получения процентилей, значения дОТорых не даются в таблице, и указывается возможность их ис-иЙЯЬЗования при решении обратной задачи — отыскании значений “1?гегральной функции распределения, соответствующих опреде-•^Нным значениям случайной величины.
применение этих методов иллюстрируется для данных о коэф-ЯИЦнепте трения, приведенных в первых двух столбцах табл. 6.5.
Основе этих данных были получены следующие значения: bt = ^В.76, ЬЛ — 4,92, х = 0,0345 и □' = 0,0098. Путем интерполяции
258
Г лава б
данных из таблиц Джонсона и др. [6.811) с помощью соотношения (6.35) находим следующие результаты:
100 в Оценка «100-го процентиля, полученная с помощью аппроксимирующего распределения Пирсона
5 —1,405 0,021
10 —1,148 0,023
50 —0,116 0,033
95 1,797 0,052
99 2,961 0,064 1
Фактический процент наблюдений, лежащих ниже вычисленных процентилей, показан в табл. 6.6. (В таблице приводятся также соответствующие значения, полученные при выборе распредели ния Sy Джонсона.) Из таблицы видно, что в данном случае аппроксимирующее распределение Пирсона вполне подходит и дает результаты, близкие к полученным при использовании распределения Sy Джонсона.
6.3. НЕКОТОРЫЕ ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ
В данной главе рассматривался главным образом подбор эмпирических распределений для описания экспериментальных данных Этот материал отличается от изложенного в предыдущих главах, где мы старались показать теоретические основы различных статистических моделей. Эмпирические распределения являются важным средством обобщенного представления данных, когда, отсутствует четкое теоретическое обоснование.
Подбор распределений Джонсона можно произвести относительно легко, используя выражения, приведенные в разд. 6.1. Если нас . интересуют только процентили подбираемого распределения и точная форма распределения не требуется, то процентили можно очень! просто найти посредством аппроксимирующего распределения Пир-1 сона с помощью таблиц в статье Джонсона и др. [6.81 и табл. VII.1
Следует четко представлять себе, что эмпирическая аппроксимация определенной совокупности данных обычно не является столь удовлетворительной, как хорошо обоснованное теоретическое опи| сание. Необходимо иметь в виду ограничения, о которых говорил0! в начале главы, — чувствительность эмпирических оценок к слУ чайным колебаниям выборок и возможность ошибочного выб01
Оценки 5-го, 95-го и 99-го процентилей можно получить также | табл. VII, помещенной а конце данной книги.
Аппроксимация эмпирическими распределениями
259
Таблица 6.6
Сравнение фактических данных о коэффициенте трения с данными для аппроксимирующих распределений
Пирсона и Su Джонсона
Накопленпая частота фактических данных, % Соответствующая па- Соответствующая на-
предсказанная аппроксимирующим распределенном Парсона, % сказанная аппроксимирующим распределением Д'у Джонсона. %
6,4 1 5,0 5,4
11,2 10,0 9,3
47,6 50,0 48,5
94,8 95,0 94,8
99,2 99,0 99,0
аппроксимирующего распределения при рассмотрении моментов распределений только низких порядков. Обычно для оценки соответствия аппроксимирующего распределения желательно сравни-ЯЙТЬ теоретические значения с фактическими наблюдениями. Методика проверки случайности этих отклонений изложена в гл. 8.
ЛИТЕРАТУРА
6.1, Мёг г i п g t о п М., Pearson E.S., An Approximation to the ^/ Distribution of Non-central t. Biometrika, 45, 484 (1958).
fi-2. Kendall M. G., Stuart A., The Advanced Theory of Statistics, К v. 1: Distribution Theory, Hafner, New York, 1958. Имеется русский пе-в февод: Кендалл М., С Т ь ю а р т А., Теория распределений, ►изд-во «Наука», 1966.
«•о. J o h п s о n N. L., Systems of Frequency Curves Generated by Methods of Translation, Biometrica, 36, 149 (1949).
Aitchi so n J„ Brown J. A. C., The Lognormal Distribution, - Cambridge University Press, Cambridge, 1957.
o-5. Draper J., Properties of Distributions Resulting from Certain Simple Transformation of the Normal Distribution, Biometrika, 39, 290 (1952).
Jftbgsa'a N. L.. Tables to Facilitate Fitting Sv Frequency Curves, fifiZonietriAa. 52, 547 (1965).
№• E I de r t о n W. P., Frequency Curves and Correlation, 4th ed., Cam-J (bridge University Press, Cambridge, 1953. Имеется русский перевод: Эль дер тон В. П.. Кривые распределения численностей и кор-кФелнция, М., ЦСУ, 1924.
Ц*' J о 11 п s о n N. L., N i х о n Е., A m о s D. Е.» Table of Percentage ^'Poinls of Pearson Curves, for Given j/Л], В2, Expressed in Standard Mea-в.We, Biometrika. 50, 459 (1953).
। '! a г s о n E. S., H а г t I e у II. O., Biometrika Tables for Statisticians, v. 1, Cambridge University Press, Cambridge, 1954.
Jeffreys H., Theory of Probability, 3rd ed., Oxford University Press. Oxford, 1961.
Глава 7
ПОЛУЧЕНИЕ ВЫВОДОВ
О ХАРАКТЕРИСТИКЕ СИСТЕМЫ НА ОСНОВЕ ДАННЫХ О ПАРАМЕТРАХ КОМПОНЕНТОВ
Во многих инженерных задачах рассматриваются сложные с, стемы, характеристики которых меняются при изменении парамеров компонентов. Зная эти изменения и понимая структуру систем!, необходимо сделать вывод о характеристике системы. Рассматр! ваемые системы могут быть совершенно общего типа, а не ограни чиваться механическими или электрическими схемами. Приведи* несколько примеров.
I. Оборудование, состоящее из жести испытательных стендов используется для проверки некоторых систем. Каждая систем должна пройти через все стенды. Время, затрачиваемое на обслх живанне на определенном стенде, является случайной величиной, распределение которой оценивается на основе имеющихся дайны,' и не зависит от времени пребывания на других стендах. Располагая этой информацией, необходимо найти оценку максимальной длительности проверки случайно выбранной системы.
2. Срок службы двигателя зависит от: 1) механических свойст; двигателя, например прочности материала на разрыв; 2) условии в которых работает двигатель, например рабочей температуры 3) частоты текущего обслуживания, выражаемой через интерна л времени между смазкой двигателя. Выведено теоретическое со отношение, связывающее эти случайные величины со сроком служ бы двигателя. Если для каждого из этих факторов принимаете определенная статистическая модель, то какие выводы можно еде лать относительно времени выхода двигателя из строя?
3. Три резистора с номинальными сопротивлениями /?я , Rb и Rc , соединенные параллельно, подключены к источнику питания с номинальным напряжением V, как показано на рис. 7.1. Согласно закону Ома, номинальное значение полного тока в цепи равно
+~k+-k)-
Ток, протекающий в цепи, будет отличаться от номинального вследствие того, что фактические сопротивления и напряжения отклоняются от своих номинальных значений. Если имеется
Получение характеристики системы
261
(формация об изменении параметров компонентов (например, «ученная на основе данных об испытаниях компонентов) н депоненты, составляющие цепь, выбраны случайным образом, > в каком интервале значений может находиться фактическое доение тока в 95% всех рассматриваемых цепей?
Рис. 7.1. Цепь с источником питания и тремя резисторами.
В 4. Годовую прибыль на определенном промышленном предприятия приближенно можно выразить следующим образом: Йрибыль = (Общий объем сбыта промышленной продукции) X
X (Доля рынка в процентах) X (Реализационная цена единицы Кюдукции — Стоимость производства единицы продукции) — Фик-Ированные издержки.
В Каждый член, записанный в правой части этого выражения, йвляется случайной величиной, распределение которой должно оце-шиваться. Что можно сказать на основе этой информации об изменении прибыли?
• Вследствие сложности этих задач их редко можно решить путем непосредственного применения таких аналитических методов, как преобразование случайных величин, рассмотренное в гл. 5. По этой причине в данной главе описываются три других метода, которые хотя и являются приближенными, часто обеспечивают тре-№емую точность.
7.1. ПРИМЕНЕНИЕ ЦЕНТРАЛЬНОЙ ПРЕДЕЛЬНОЙ ТЕОРЕМЫ
I ДЛЯ ЛИНЕЙНЫХ СИСТЕМ
Согласно центральной предельной теореме (рассмотренной в Гл. 3), распределение среднего (и, следовательно, распределение Крлмы) независимых случайных величин с конечными математическим ожиданием и дисперсией приближается к нормальному при увеличении числа наблюдений. Следовательно, эта теорема рримёнима для таких линейных систем, как упоминавшееся в предыдущем разделе испытательное оборудование, где общая длитель
262
Г лава 7
ность проверки равна сумме длительностей обслуживания на каж дом из п стендов (если п велико).
В гл. 3 было также показано, что нормальное распределена полностью задано, если известны математическое ожидание р и среднее квадратическое отклонение з. Эти параметры можно пол чить с помощью формул (2.36) и (2.87). Так, для любых случайны величин х1г х,, ... , хп
Е (xt 4~*г + ... 4- х„) = Е (х,) + Е(х2) 4- ... 4* Е (х„) = р, (7.1
и если случайные величины некоррелироваиы, то
3*(*х 4-4- - 4- хп) = О»(xj 4- 0»(х2) 4- •4- W = а’. (7.2)
Допустим, что в примере с испытательным оборудованием распределение времени, затраченного на обслуживание на »-м стенде (i — 1, 2, ... ,6), является таким, как показано в табл. 7.1
Таблица 7л
Распределения длительности проверки в часах на каждом из шести испытательных стендов
Стенд 1 Стенд 2 ы,0.. • , "'А г 2Л у'2 у 2л Нормальное распредели ние с [х = 10 и s = 1 Нормальное распрад ление с [* — 20 и -=/г
Стенд 3 Гамма-распределение , = 9 и X = 6
Стенд 4 1,м~ Ж '*** Гамма-распределенне т] = 10 и X = 1
Стенд 5 Стенд 6 = »Г(5) Ё Экспоненциальное распределение с Х = а Распределение хи-квадрат с v= 10
В качестве статистических моделей для времени обслуживания на отдельных стендах приняты нормальное распределение, гамма-рас-пределение, распределение хи-квадрат и экспоненциальное распределение, и в каждом случае заданы их параметры. (Графики этих распределений приведены на рис. 7.3.)
Нас интересует распределение общего времени Т = хг 4- х« -г 4- хя 4- 4- хй 4- хв, затрачиваемого на проверку системы. Ма-
тематические ожидания н средние квадратические отклонения.
Получение характеристики системы
263
Выраженные в часах для каждого стенда, были получены с помощью Выражений, приведенных в гл. 3. Например, из табл. 3.21 находим, что математическое ожидание и дисперсия случайной величины, Вмекяцей гамма-распределение, равны соответственно т/Х и т/Х®. Таким образом, математическое ожидание и дисперсия длительности; (обслуживания на пункте 3 составляют соответственно 3 и 1,5 и 10,25 час.
Параметр Номе стенда
1 2 3 4. б 6
Математическое ожидание ВДнсперсИИ 10 20 2 1.5 0,25 10 10 сч 3 о* о' 10
ЙЬздставляя в формулы (7.1) и (7.2) математические ожидания и. йсперспи по каждому стенду, получаем математическое ожида-;®ie для системы, равное (10 + 20 4* 1,5 4- 10 4- 0,2 4- 10) = =:51.7 час, и дисперсию для системы, равную 14-2 + 0,25 + ;+ 10 + 0,04 + 20 = 33,29. Согласно центральной предельной фёореме. общую длительность проверки можно приближенно считать нормально распределенной случайной величиной с математи-ЦКЖИм ожиданием р. = 51,7 час и средним квадратическим отклонением а = 33,29 = 5,8 час. В случае нормального распределения шансы на то, что время проверки для случайным образом выбранной системы не превысит (ц. + 1,28а) час, равны 9 к 10; 95 к 1X10, что оно не превысит ([л+ 1,65а) час, и 99 к 100, что оно не превысит (а -I- 2,33а) час. Следовательно, приближенные 90%-, 95%- и
Вшб-ные верхние доверительные пределы равны соответственно 59.1. 61.2 и 65,2 час.
Вт В этой задаче рассматривается система, состоящая всего из Шести элементов, а несистемас«очень большим» числом элементов. Важно иметь ввиду, что дисперсии отдельных элементов существен-nd отличаются друг от друга и суммарная дисперсия в значительной мере определяется дисперсиями длительности обслуживания на+тендах 4 и 6. (Вспомним из гл. 3, что одним из факторов, вли-Ирцих на скорость сходимости к нормальному распределению, яв-•Дяется относительная величина дисперсий отдельных компонентов.) роэтому применимость центральной предельной теоремы в этой Вадачс сомнительна. Адекватность аппроксимации нормального распределения можно оценить путем сравнения этих результатов с те-sfe которые будут получены далее в данной главе с помощью более ВНкых методов.
264
Глава 7
Наконец, заметим, что точное знание распределения случайны параметров каждого компонента необязательно, поскольку для применения формул (7.1) и (7.2) требуется лишь знание математи ческих ожидании и дисперсий.
7.2. ПОЛУЧЕНИЕ МОМЕНТОВ СИСТЕМЫ
Постановка задачи
В гл. 6 указывалось, что для оценки процентилей распределен!! рассматриваемой случайной величины можно использовать аппрок симацию распределения Пирсона, основанную на оценках первы четырех моментов. Поскольку распределение Пирсона имеет са мне различные формы, этот метод часто позволяет получить доста точно точные аппроксимации. Таким образом, если можно опреде лить моменты распределения характеристики системы, то такой же подход можно использовать и при решении задач, рассматривас мых в данной главе. Далее будет описан метод получения момент системы, называемый иногда распространением статистически ошибки, или дельта-методом.
Пусть соотношение между характеристикой системы г и сл\ чайными параметрами отдельных компонентов хп х2....х, задаю
функцией г= h (х„ х», ... , х„). Например, в случае оборудова ния с шестью испытательными стендами z = хх -j- х2 + х3 4- х., 4-х6 + хп, т, е. общее время проверки равно сумме длительности обслуживания на каждом стенде.
Пусть Е (х,) — среднее значение или математическое ожидаии случайного параметра i-ro компонента, а рДх,-) обозначает ее /г-н центральный момент (или момент относительно математическое ожидания). Аналогично Е (г) и (г) обозначают соответствен н« математическое ожидание и k -й момент относительно математи ческого ожидания характеристики системы. Задача состоит в том чтобы найти оценки Е (z) и ps(z) для k = 2, 3 и 4 па основе: 1) дан ных о случайных параметрах компонентов, с помощью которые можно получить оценки Е (xz) и pfc(xz) для i = 1,2.л; 2) зна
ния структуры системы h (xj. х«, ... , х„).
Вычисление математического ожидания характеристики системы
Данный метод состоит в разложении функции h (х„ хъ,....'
в многомерный ряд Тейлора относительно |£ (х,)./? (х2), ..., £(х.,)1 т. е. точки, в которой случайный параметр каждого компонента при нимает значение, равное его математическому ожиданию. В этом случае математическое ожидание характеристики системы нам’ дится с помощью некоторых простых алгебраических действии над математическими ожиданиями параметров компонентов. Пол
Получение характеристики системы
265
лый вывод выражений дается в приложении 7А. Полагая, что случайные параметры компонентов некоррелированы, и сохраняя чле-ны до второго порядка включительно'», находим окончательное выражение для математического ожидания характеристики системы:
В £ (г) - Л [£ (ж,), £ М..... £ (х.)| +' V «* (xj, (7.3)
где d*hJdx2i обозначает значение ‘производной d2hldx] в точке £(х,). т. е. вместо хг (г = 1, 2..п) подставляется Е (хг). На-
пример , если й (z) = Хх,Х2*з > то
2S- = [£(x,)][£te)y[6£(x^.
Далее д*1йдх* будем записывать без черточки над Л, т. е. как
В формуле (7.3) требуются точные значения или оценки матема-Вйческих ожиданий и дисперсий случайных параметров каждого Дрмпонента.
f Заметим, что оценка математического ожидания характеристики, полученная путем подстановки математических ожиданий параметров компонентов в уравнение для системы, т. е. задание функции
£(x)-ft[£(xj, £fe)...... £(*„)],
дает точный результат, когда все частные производные второго и более высоких порядков равны нулю; это имеет место, например, когда характеристика системы является линейной функцией случайных параметров компонентов, как в примере с испытательным „Оборудованием. Однако в общем случае это выражение является лишь приближенным.
Пример вычисления математического ожидания
•Характеристики системы
В Оценка математического ожидания характеристики системы ил-люстрируется на примере с электрической цепью, приведенном в начале главы (рис. 7.1). Допустим, что на основе имеющихся дан-Щых с помощью формул (2.31) и (2.51а) были получены следующие Выражение «сохранить члены до ft-го порядка включительно» означа* р. что рассматриваются псе члены, у которых сумма показателей степеней Кри математическом ожидании не превышает k. а те члены, у которых сумма жИбКз.зателей степеней превышает k. опускаются, т. е. для сохранения члена jflgllГ;— £(X/)]r| xj— £(Ху))<..( xm— £(хт)]11 необходимо, чтобы r + s 4-...-Г
I •+ f < k. Следовательно, получаем лишь приближенные равенства.
266
оценки математического ожидания и дисперсии параметров каж дого компонента:
Мптематвчес-кое ожидание Дисперсия
V 120 15
10
15 ]
ис 20 2
Имеем
i = H(v.RA.KB.Kc^v^+^ + ^y
Тогда '
3ft V 1 а’Л av '
и
дл _ — V_ ff'-h _ 2V
mi ' м‘ ~ в> (/
где I = А, В, С. Подстановка этих величин в формулу (7.3) даст
E(I) = E(V) V f—!_]+JL V asw ~А. с U W J + 2 с (Е(«,))> (R,)-
Подставляя полученные оценки математических ожиданий и ли.- персик в выведенные ранее выражения для соответствующих раметров, получаем
Оценка Е(1)=
Заметим, что если в формуле (/.3) оставить только первый ч;н . то вместо 26,19а получим 26,00 а.
Вычисление дисперсии характеристики системы
Вывод разложения в ряд Тейлора для дисперсии характеристики системы при допущении, что случайные параметры компонентов некоррелированы, дается в приложении 7А. Полученное ураВ*1
267
Получение характеристики системы
ие, содержащее члены до третьего порядка включительно, имеет
где p3(*i) ~ третий центральный момент для i-й случайной величины: как и ранее, все значения производных вычисляются в точке, Кответствующей математическомуЪжиданию параметра. В большинстве учебников, где рассматривается этот вопрос (например, 17.11 и [7.4]), последний член в формуле (7.6) опускается и получаемое Выражение
=’(г) =£(^-)'<“(*,) (7.7)
|асто является удовлетворительной аппроксимацией.
| Допустим, что в примере с электрической цепью оценки третье-о и четвертого центральных моментов (последний вскоре будет ими использован) определены по формулам (2.52) и (2.53) с по-Ьщыо экспериментальных данных для п компонентов и имеют следующие значения:
»>•(*<)
V RA *В Rc 25 5 100 5 3 5
1одставляя выражения (7.4) и (7.5) в формулу (7.6), получаем
I /=Л. В,С с J i=A, В. С ( Iе J
У (-Е(У) ) ( 2£(У) ) 8,р + /=жв.с|[£(Л/)1а1 |lWf *'
КИспользуя оценки математического ожидания, дисперсии и егьего центрального момента для компонентов, полученные на Иове экспериментальных данных, находим, что оценка дисперсии \f) равна
268
Глава 7
+/^20)^5=2,32.
\ 20’ /Д 21)з /
Если вместо соотношения (7.6) использовать менее точную формул} (7.7), то при вычислении дисперсии потребуются лишь первые четыре члена. При этом оценка дисперсии тока в цепи окажется рав ной не 2,32, а 2,61.
Вычисление третьего и четвертого центральных моментов характеристики системы
Выражения для третьего и четвертого центральных момёнто: характеристики системы, т. е. р3(г) и ц4(г), выводятся аналогично. Окончательные выражения, содержащие лишь ненулевые члены самых низких порядков, имеют вид
^<2> = 2(-^>м.
И здесь все производные вычисляются при математических ожиданиях.
В примере с электрической цепью, рассматривая совместно выражения (7.4), (7.5) и (7.8), получаем
мо=Г 2 F^Tl’i‘.w+ 2
[й=Л, fl. С* J /=Л. в, с ()
Подставляя в это выражение оценки для параметров компонентов, получаем [л3(/) =— 1,457. Оценка нормированного показателя асимметрии /р, (см. гл. 2) равна (—1,457)/(2,32)*',« =—0.41. Таким образом, согласно оценке, распределение тока, протекающего в цепи, имеет отрицательную асимметрию.
Аналогично, рассматривая совместно выражения (7.4), (7.5) и (7.9), получаем
269
Получение характеристики системы
(') = ! 2 Г|л‘(1') + -
[л=А, В. С&| /=л. в. cL lfc (а/Н J
+ 6 V ( У _!_Н-ДЩ.1',.(Ио.да +
,-Л. сV-Го. с [1««М
уставляя сюда величины, вычисленные с помощью данных для [аметров отдельных компонентов, находим р.4(/) = 23,24. Сле-йтельио, оценка нормированного показателя островершинности равна 23,20/(2,32)2 = 4,34. Таким образом, распределение тока, текающего в цепи, оказывается более островершинным, чем мальное распределение.
В гл. 6 указывалось, что использование оценок моментов |a3(xJ L(X(), полученных на основе ограниченных данных, может при-hi к неудовлетворительным оценкам для |x3(z) и p4(z).
:пределенне тока в электрической цепи
Итак, оценки математического ожидания, дисперсии, нормиро-
Гного показателя асимметрии и нормированного показателя ост-щшнности для распределения тока в электрической цепи имеют пощие значения:
оценка математического ожидания = 26,19;
оценка дисперсии = 2,32;
оценка ₽х = ^-0,41;
оценка J3a = 4,34.
перь с помощью методов, рассмотренных в гл. 6, можно найти нкн процентилей. Используя аппроксимирующее распределе-i Пирсона, из табл. IV, помещенной в конце книги, находим, с вероятностью 0.95 величина тока в случайным образом выб-июй электрической цепи находится между 22,92 и 29,01а. алогично с вероятностью 0.99 величина тока лежит между 21,36 0,03а. Если допустить, что ток цепи распределен по нормаль-IV закону, то 95% всех значений будет заключено в интервале 23,24 до 29,01а, а 99% — в интервале от 22,30 до 30.16а. Сле-ателъно, в данном случае очевидно, что допущение о нормаль-!' распределении не приведет к большим погрешностям.
Из рис. 6.2 видно, что при fl, = 0.17 и 3, = 4.34 распределение а можно аппроксимировать распределетием Sy Джонсона и для
270
Глава 7
оценки параметров этого распределения можно использовать рассмотренные в гл. 6 методы, основанные па использований вычислю,, пых моментов. Если из рис. 6.2 следует, что подходит распреде. к пне SB Джонсона, то методы, рассмотренные в гл. 6, нельзя приме нять непосредственно для оценки параметров, поскольку необходим информация о процентилях характеристики системы. Оценю параметров можно получить путем приравнивания вычислю, пых моментов теоретическим моментам распределения SB , ка. рекомендует Джонсон (6.31. Однако эта процедура является д< вольно сложной.
Вычисление моментов в примере о проверке системы
Применим теперь рассмотренные выше методы к примеру с ис питательным оборудованием. Общее время проверки г выражаете линейной функцией г = Xj 4- х, + х3 4- х4 + х5 4- х0, где х время обслуживания на Лм испытательном стенде (i = 1, 2, ... распределения этих случайных величин показаны втабл. 7.1. Тог.:
1, (=1. 2......6,
dxi
И «?“0, 2.................................6-
Таким образом, формулы (7.3), (7.6). (7.8) и (7.9) принимают в,..
«•(г) = 2 *(*,), Z=l
IS (а) = VlSW
И
6
W = V 8. W +6 22»* W »* (*,)•
Третий и четвертый центральные моменты распределений длительности обслуживания на каждом стенде можно найти из табл-7.1 с помощью методов, изложенных в гл. 2. Получаем следуют"1' значения:
Получение характеристики системы
271
Стенды
Я 2 ы 4 ы 6
Математическое ожидание 10 20 1,5 10 0,2 1°>
Дисперсия 1 2 0,23 10 0,04 20
В».(хт) 0 0 0,08 20 0,02 80
• 3 12 0,23 360 0,01 1680»]
Следовательно,
(Ег) = 10 4-20 4-1,5 4-10 4-0,2 4-10 = 51,7,
а2 (г) = 1 4- 2 4- о,25 4- 10 4- 0,04 4- 20 = 33,3,
l*,(z) = 0 4- 0 4- 0,08 4- 20 4- 0.02 4-80= 100,1,
U) = (3 4- 12 4- 0,23 4- 360 4- 0,01 4-1680) 4-
f4-6[l (2 4-0.25 4- 10 4-0,04 4-20)4-2(0,25 4- 10 4-0,04 4-20)4-
I + 0,25 (10 + 0,04 + 20) + 10 (0,04 + 20) + 0,04 х 20] = 3864,7
= 0,52,
’ ri (33,3)J>
?l = ^ = 3.49.
Г (33,3)2
I Используя лишь верхнюю часть кривой аппроксимирующего ^определения Пирсона, находим [6.81, что общее время проверки йревыспт: 1) 59,4 час в 10% случаев, 2) 62,0 час в 5% случаев и 3) 67,4 час в 1 % случаев.
Сравним эти результаты с соответствующими значениями, равными 59,1; 61,2 и 65,2 час, которые были получены в разд. 7.1, -ГДё предполагалось, что общее время проверки распределено по формальному закону, и использовалась центральная предельная Ййорема. Заметим, что, хотя для 90-го и 95-го процентилей имеет место близкое соответствие, для 99-го процентиля расхождение Возрастает; это свидетельствует о том, что часто аппроксимация Нормальным распределением в области крайних знаний функции распределения наименее приемлема.
Коррелированные случайные величины
. До сих пор предполагалось, что случайные параметры компонентов некоррелированы. Корреляция между параметрами компонентов системы наблюдается в тех случаях, когда случайное зна-
272
Глава 7
чеиие, принимаемое параметром одного или большего числа компо нентов системы, связано со случайным значением параметра одного или большего числа других компонентов той же системы. Напри мер, в примере с испытательным оборудованием длительности обслуживания на отдельных стендах будут коррелированы, если неисправность, на устранение которой на одном из стендов требу ется время, превышающее среднее значение, приводит к тому, что и на других стендах длительности обслуживания превысят сред ние значения.
Выражения для характеристики системы при коррелированных случайных параметрах компонентов находятся аналогично, как и в случае, когда корреляция отсутствует. Результаты приводятся i приложении 7Б.
Обзор метода
Вычисление моментов системы является не точным, а прибли женным методом вследствие опускания членов более высоких порядков в разложении в ряд Тейлора. (В частном случае, когда функция является линейной, выражение становится точным, поскольку все производные более высоких порядков равны нулю, как в примере с испытательным оборудованием.) Изучая o6uiv адекватность этого метода, Тыоки (7.51 показал, что достигается «лучшая аппроксимация, чем ожидалось» и что часто достаточно оставлять члены лишь самых низких порядков. Тьюки приводи! также выражения, содержащие дополнительно члены более вы-
соких порядков для математического ожидания, второго, третьего и четвертого центральных моментов как для некоррелированных так и для коррелированных случайных величин. Эти выражени можно использовать, когда требуется более высокая точность В примере с электрической цепью опускание даже первых членов более высоких порядков в выражении для математического ожил; ния не оказывает существенного влияния на результат. Таким •<' разом, опускание дополнительных членов в разложении в ряд Тен лора не приводит к значительному снижению точности. Погрев ность вычисления дисперсии составит 10% при опускании членов более высоких порядков. В данном примере математическое ожила-ние, дисперсия и центральные моменты более высоких порядков оценивались на основе экспериментальных данных, что вноси г дополнительную ошибку выборочного обследования. Если чис"° наблюдений невелико, то такая ошибка может значительно пре
вышать ошибку вследствие опускания членов более высоких '' рядков. Часто это имеет место при решении практических задач.
Таким образом, используя метол получения моментов системы совместно с методами, рассмотренными в гл. 6, можно сделать вы
Получение характеристики системы
273
»д о характеристике системы на основе информации о параметрах гомпонешов. Однако применимость этого метода ограничена функ-1ЙЯМН. для которых существует разложение в ряд Тейлора отно-детально математического ожидания и получается не слишком Громоздкое выражение, т. е. когда частные производные получить, це слишком трудно н их не слишком много. В этом случае часто аожно получить производные численными методами с пьмощыо йектронной вычислительной машины.
1.3. МОДЕЛИРОВАНИЕ МЕТОДОМ МОНТЕ-КАРЛО
о харак-данных яв-Зтот метод
Обшие положения
Вше одним способом получения информации Дгёрвстнке системы на основе экспериментальных Кается моделирование методом Монте-Карло. ____„
Называют также синтетическим или эмпирическим еыбором. Дан-
Ht-iii метол состоите «построении»большого числа системе помощью вычислительной машины и численной оценке характеристик таких моделированных систем.
и Рассмотрим систему, состоящую из большого числа компонентов. Допустим, что имеется no 1 ОСО единиц каждого из компонентов, Костанляк ших систему. Можно построить 1ССО систем и получить 100(1 измерений характеристики системы. Однако если структура ИЙгстемы, т. е. соотношение между случайными параметрами компонентов и характеристикой системы, известна, то характеристику I Артемы можно вычислить, используя измерения параметров ком-
Понентов без фактического построения систем. Если вместо того, ЛДобы иметь 1000 единиц каждого из компонентов, мы будем знать ^ВЬпрелелеиие случайных параметров каждого компонента, то можно получить измерения параметров этих компонентов модели-д^ванш м путем выбора 1000 случайных чисел, имеющих эта же Ккпрелеления. Этот способ, называемый методом Монте-Карло, ^шазан графически на рис. 7.2. Наличие быстродействующих вы-^клнгельных машин, позеолякщих экономично и быстро модели-йрвать характеристики сложных систем, привело к широкому рас-ИКЁостранению метода Монте-Карло.
Прежде чем рассматривать детали, связанные с получением нгчайных чисел, имеющих заданные распределения, воспользуйся .этим метолом для решения задачи о работе шести испытатель-ИЬртендов. Длительность проверки па первом стенде распределе-“ Цо нормальному закону с математическим ожиданием 10 час «средним квадратическим отклонением 1 час. Из нормально рас-ренной совокупности выбирается случайное число, например а? Час. Это величина показывает длительность проверки первой
274
Г t а в а 7
моделируемой системы на стенде I Авалей пым образом находятся случайные числа, характеризующие длительности обслуживания на каждом из остальных стен • в- с>енд 2— 17.5 час. стенд 3 — 1,9 час, стенд 4 —6,3 час, cte*u о — 0.3 час; стенд 6 — 9,2 час.
Рис. 7.2. Логическая программа моделирования методом Монте-Карло.
Таким образом, общее время обслуживания для первой моделируемой системы составляет 46,5 час. Этот процесс иллюстрируется на рис. 7.3. Данная процедура повторяется в целом 109 рт^>. п каждый раз берутся новые случайные числа. Упорядоченные по величине значения, полученные с помощью быстродействующей вычислительной машины, показаны на рис. 7.4. Эта гистограмма , позволяет найти аппроксимирующее распределение длительности , обслуживания системы. С помощью полученных случайных чисел I можно найти оценку максимальной длительности обслуживания- , Например, 90-я и 91-я по величине длительности обслуживания 1 составляют соответственно 58,8 и 59,4 час и. следовательно, оценка 90-го процентиля, полученная способом, описанным в разд. --|и,1
ля каждого стенда находится случайное значение времени проверки имеющее соответствующее распределение.
2. Время проверки системы составляет 46,5 час.
Юный процесс повторяется многократно, Полученный график хй,.актс. Н рпстнки системы аппроксимирует истинное распределение.
Рис. 7.3. Этапы моделирования в задаче о проверке системы.
276
Г-iatta 7
равна 59,3 час. 95-й процентиль находится аналогичным образ< и составляет 61.0 час. Полученные значения сравнимы с соотвен: вугощями значениями, вычисленными методами, изложенными двух предыдущих разделах.
Рис. 7.4. Длительности проверки для 100 моделированных систем,
Моменты распределения длительности обслуживания можно оценить также с помощью метода Монте-Карло и использовать их j в качестве моментов аппроксимирующих распределений Пире > или Джонсона, т. е. получить эмпирическое распределение дан> ' । изображенных на рис. 7.4. .Моменты, вычисленные методом Монте-1 Карло, очень близки по величине к моментам, определяемым m?toj дом получения моментов системы, и, следовательно, аппрокси | цня будет иметь такую же точность.
Методы получения случайных чисел
Составлены таблицы случайных чисел, равномерно распре.к 1 ных в интервале (0, 1). и случайных чисел, имеющих норм;’ распределение с параметрами |* = 0 И а = I 17.61, 17.7 I. '
ные числа записываются также на перфокартах и магнитных л тах. В табл. VIII и IX, помещенных в конце этой книги, npm1'1'1 м
Получение характеристики системы
277
|ся 500 равномерно распределенных и 500 нормально распределенных случайных чисел.
Вначале случайные числа генерировались с помощью различ-Кшх механических или электронных устройств. Так, таблицы равномерно распределенных случайных чисел были получены с по-Дкицью диска, приводимого во вращательное движение мотором, Кейсгвующим подобно колесу рулетки 17.61, и с помощью электрон-r jioro устройства, входным сигналом для которого являлся источник Случайного шума. Методы генерирования случайных чисел под-Дробно рассматриваются в книге Точера [7.81.
I Несмотря на наличие случайных чисел, имеющих равномерное ненормальное распределение, на перфокартах и магнитных лентах, иногда с точки зрения экономии рабочего времени машины и ем-Кости запоминающего устройства бывает более целесообразно получать такие числа непосредственно в машине; для этой цели разработаны специальные программы. Получаемые числа часто называются «псевдослучайными», поскольку они находятся с помощью ^терминированного математического выражения, а не посредством Некоторого физического процесса. Соответствующая теория из-иржена в книге Точера [7.81, а также в работе Халла и Добелла №7.91.
f Методом статистических испытаний (см. гл. 8) можно определить Соответствие полученных случайных чисел данному распределению. Егатист ическне испытания показали, что имеющиеся таблицы 17.61; '47.71 отвечают требованиям для большинства практических целей. К Чтобы получить случайную величину ¥и (|*0. [*,). равномерно таспределенную в интервале (;ifl,и. р. из данной случайной величины
, равномерно распределенной в интервале (0, 1), используется Бедующее преобразование;
У и (1*в. (Ч) = (Н — Но) Яу Ч- Но- (7-10)
Еправетливость этого преобразования можно легко проверить методом. изложенным в гл. 5. Аналогично случайная величина VN (що), взятая из совокупности, имеющей нормальное распределение с па-Вйметрами р и о, находится как
Yn(jx, «)=a₽v4-p, (7.11)
Где Z?,v — случайная величина нз нормально распределенной совокупности с параметрами ц = 0ив = 1.
Методика получения случайных величин, имеющих другие распределения, с помощью нормированных случайных величин, рас-Ииределенных по равномерному или нормальному законам, показана и табл. 7.2. Эта методика использовалась в задаче о проверке Системы для генерирования случайных величин, имеющих гамма-^йпределение, распределение хи-квадрат и экспоненциальное рас-
Таблица 7.2
Получение случайных величин с различными распределениями с помощью нормированных случайных величин, имеющих нормальное (RN ) н равномерное (/?у) распределения11
Распределение, которое необходимо получить
Плотность распределения
Способ получения случайной величины ц‘
Экспоненциальное
Гамма - раеп рсделешге (целочисленные значения 1))
Распределение хн-квадрат
р < У < “
f (у)= е . О у < ОО
/(?)-
У' =---— 1И(1—/?у) +|Х
11 /=|
2,/2Г(7/2)
у<Т/2) - 1
280
Г ла и a 7
пределение. Например, длительность обслуживания на стенде имеет гамма-распределение с параметрами т/ = 9 и к — 6. Чь получить случайную величину, имеющую это распределение, , бнрается девять независимых случайных величин /?и,, Яо,.../<
равномерно распределенных в интервале (0,1). Искомая случат,
величина с гамма-распределением имеет вид —’.„V in (1—Rui)3,.
процедура повторяется с использованием девяти новых равмомср распределенных случайных величин для получения каждой ног. случайной величины, имеющей гамма-распределение. Теоретю ское обоснование методики, показанной в табл. 7.2, дается в при женин 7В.
Объем выборки и интервал между доверительными границами
Так как при моделировании методом Монте-Карло нспользуь ся случайные числа, получаемые результаты подвержены стали--ческим колебаниям. Поэтому любая оценка не является точш ей соответствует определенный интервал между доверители!, границами. Чем больше число испытаний при моделировании, более точным будет окончательный результат и при достаю1 большом числе испытаний можно получить сколь угодно ма. ошибку. На практике обычно задается допустимая ошибка, и информация используется для определения требуемого числа пытаний.
Рассмотрим снова задачу о проверке системы. Допустим, нам необходимо знать долю р систем, проверка которых зай не менее 60 час. Это условие типично для многих задач, решаем'-' методом Монте-Карло, когда на основе результатов п испыта : требуется получить оценку для доли совокупности, заключен' 1 между двумя крайними значениями либо лежащей выше или ш некоторого заданного значения. Эта задача аналогична отыска: оценки для параметра р биномиального распределения (гл.
Из рис. 7.4 видно, что в 100 испытаниях методом Монте-Ка, ' шесть моделированных систем имели время обслуживания 60 чс '
более. Так, согласно формуле (4.3), оценка р равна 0.06. Доверьт ные пределы для этой оценки можно найти с помощью рис. 4.2а и i: 4.26. Например, из рис. 4.2а видно, что 95%-ный доверите,и !
интервал для р равен (0,02; 0.13). Если параметр р должен one ; | ваться более точно, то потребуются дополнительные испыта!' I Рис. 4.2а и 4.26 можно использовать также «в обратном поря.:' I для определения приближенного объема выборки при модели!1 ' I нии методом Монте-Карло. При этом вначале необходимо ‘ I
Получение характеристики системы
2Я1
— максимальную допустимую ошибку при оценке параметра р; -а — доверительный предел или искомую вероятность того, что еинваемый параметр р не отличается от р больше, чем на ±£, р — первоначальную оценку р.
[Например, может потребоваться провести достаточное число ис-гганий Монте-Карло, чтобы на 95%, т. е. с вероятностью 1—а = Ю.95, быть уверенным в том, что доля р совокупности, заключен-я между двумя заданными значениями (либо лежащая выше или же некоторого заданного значения), не отличается более чем на ' = 0.05 от окончательной оценки, принимая за первоначальную вику р' 0.80. Затем для определения п можно использовать год проб и ошибок.
Если при моделировании методом Монте-Карло проведено 1000 пытаний и 800 из них, т. е. 80%, попадают в первоначально за-IHHUii интервал, то из рис. 4.2а видно, что 95%-ным довернтель-ым интервалом для р является (0.755; 0,825). Аналогичными ин-йалами для 400 и 200 испытаний, содержащими 80% наблюде-и в заданной области значений, являются соответственно (0,755; 54) и (0.74; 0,85). Поскольку нам необходимо оценить р с ошиб-й ±0,05, лежащей в 95%-ном доверительном интервале, то Гребуегся число испытаний, несколько превышающее 200. За-етнм. что интервал между доверительными границами будет мень-. если доля выборки составит более 80%, и больше, если она [дючена между 50 и 80%. Таким образом, после того как испы-иия закончатся, может оказаться, что была взята слишком боль-ая или слишком малая выборка (этот вопрос будет рассмотрен
ирафикн на рис. -1.2а и 4.26 часто требуют применения пнтерпо-цим. Здесь нет кривых для значении л, превышающих 1000. ля оценки числа испытаний можно также использовать следую-ее выражение, основанное на аппроксимации биномиального рас-гделения нормальным (см. гл. 4):
(7.12)
£’
е Е и р' были определены ранее, a Z]-,/» обозначает (1—а/2)100%-'ю точку нормированного нормального распределения. Напри-tep. если требуется доверительный уровень 1—а = 0.95, то з= №05 в Z|_,/2= 1,96; если же I—а = 0.99? то а = 0,01 и Z|_.,2 = г’2,58. Так, в рассматриваемом примере опенка требуемого Й»ема выборки равна
(1,96)* = 246.
(0.05)’
282
Г лава 7
Обычно эта аппроксимация обеспечивает требуемую точное и если пр или п(1—р) меньше пяти.
Как при использовании рис. 4.2а и 4.26 в обратном порядке так и при использовании формулы (7.12) для нахождения ,п. требуется первоначальная оценка р. т. е. та самая величина, котор,--.. должна определяться методом Монте-Карло. Это объясняется и .
что размер доверительного интервала является функцией р, чк видно из рис. 4.2а и 4.26. Из графиков на рис. 4.2а и 4.26 и форму, н, (7.12) следует, что наибольший объем выборки требуется, кои,. р = 0.5. Таким образом, когда первоначально ничего не известь.
о величине р, опенка р' = 0,5 приводит к объему выборки, опреде ляемому с большим запасом. Иногда вместо этого целесообразна провести предварительные испытания методом Монте-Карло, что бы получить оценку р', которую можно затем использовать для он ределепия необходимого дополнительного числа испытаний.
В некоторых задачах требуется находить лишь односторонии. предел для р. В этих случаях для выбора п используется лишь раз ность между верхней (или нижней) кривой и диагональной линии на рис. 4.2а или 4.26. Если объем выборки определяется по форм\ ле (7.12), то величина а,_ 7/2заменяется на г,-,, т. е. на 1,65 при 95%-ном и на 2,33 при 99%-ном доверительном уровне.
После того как при моделировании методом Монте-Карло буд< проведено требуемое число испытаний, описанные выше метод,.
используются непосредственно для установления надлежащей интервала между доверительными границами.
Если вместо отыскания оценки параметра р вычисляется истин ное среднее р с помощью оценки х математического ожидания, полученной методом Монте-Карло, то для получения доверительною интервала можно использовать формулу (3.8). Чтобы сразу определить требуемое число испытании, необходимо задать:
Е — максимально допустимую ошибку при оценке р;
1—а — вероятность (доверительный уровень) того, что л ю будет отличаться от р больше, чем на ±Е\
а — первоначальную оценку среднего квадратического отк.ю нения.
Тогда приближенное число испытаний при моделировании мете дом Монте-Карло находится как
п =
(7.12а)
где Z|_,/2, каки ранее, (I — «/2)100% -пая точка нормированного нормального распределения.
Соответствие этого выражения зависит от того, насколько б.ти < ка оценка а' к истинному среднему квадратическому отклонению з.
Получение характеристики системы
283
Аналогично тому как формула (7.12) зависит от начальной оценки Б' ДЛЯ [).
Из сказанного очевидно, что при анализе методом Монте-Карло Применимы обычные статистические методы нахождения доверительных интервалов для оценок параметров и определения необходимого числа наблюдений, обеспечивающего требуемую точность1).
Г.4. СРАВНЕНИЕ МЕТОДОВ
К Рассмотренное в гл. 5 преобразование случайных величин имеет ио преимущество, что является точным методом, т. е. оно позволяет Канти точное распределение характеристики системы, когда из-Кестны распределения параметров отдельных компонентов. Недостаток этого метода состоит в том, что его можно применять только непростых задачах, и, следовательно, он не подходит в большинстве Кассмо грен пых нами ситуаций. Например, задача о проверке си-Кгемы значительно усложнилась бы при использовании метода преобразования случайных величин вследствие того, что на каждом Ктункте длительность обслуживания имеет различное распреде-tПение.
J Допущение о нормальности распределения характеристики си-^Кёмы, основанное на центральной предельной теореме, непосреД-Ктвенно применимо лишь в том случае, когда характеристика систе-мы является суммой эффектов случайных параметров большого Кисла компонентов, когда ни один из параметров не имеет преобла-Кающеи дисперсии. Мы видели, что для задачи о проверке системы это допущение справедливо, за исключением лишь таких крайних Кначенип распределения, как 99%-ная точка. Даже для неаддитив-Iиых систем формулы (7.3) и (7.6) или (7.7) часто используются для Вычисления среднего значения и дисперсии характеристики систе-8 МЫ, которая затем предполагается нормально распределенной. Это Июпущение иногда приемлемо и в том случае, когда на характеристику системы оказывает влияние ряд случайных факторов, воздействие которых на характеристику системы примерно одинаково, |« когда функциональное соотношение является «не слишком нели-ИшЬйным». В примере с электрической цепью при допущении о ИЙ)рмалыюм распределении тока были получены те же результаты, •.Что и при использовании более сложного аппроксимирующего распределения Пирсона. Однако огульное принятие допущений о
f1) Соотношение (7.12а) получено из формулы (3.8) при допущении, что Йуемое число испытаний при моделировании методом Монте-Карло п дос-очно велико и поэтому вместо (i-ai/2может использоваться нормально гарсделенпая случайная величина Ошибка, получаемая при этом
Й|цении, невелика, если л > 50.
нормальности может привести к ошибочным выводам. В конкре ном случае без получения моментов системы более высоких поря ков не всегда ясно, даст ли нормальное распределение приемлем\ аппроксимацию.
Моделирование методом Монте-Карло интуитивно более пр, влекательно. чем получение моментов системы, и, следователь! его легче усвоить. Требуемую точность можно получить, провед достаточное число испытании. Кроме того, метод Монте-Кар. । является очень гибким н его можно применять во многих исключи тельно сложных случаях, когда метод получения моментов систем: становится слишком громоздким. Это особенно относится к те случаям, когда случайные параметры компонентов взаимось: заны.
Основной недостаток метода Монте-Карло состоит в том, чъ часто нельзя определить, является ли какая-либо случайная вели чина преобладающей или более важной, чем другие. Кроме тог< если одна случайная величина изменяется, то весь процесс мол< лнрования должен повторяться заново. Обычно этот метод требуv разработки сложной программы для вычислительной машины, если нужно проводить большое число испытаний, то для полученн необходимых результатов может потребоваться очень много машш кого времени.
Таким образом, нахождение моментов системы совместно аппроксимирующими распределениями Пирсона или Джонсона ино да является наиболее экономичным методом. Хотя обычно точное! результатов, получаемых при использовании этого метода, он, нить нелегко, результаты исследований, о которых упоминалось • разд. 7.2, показывают, что данный метод часто обеспечивает а проксимациютребуемой точности. Кроме того, метод получения к ментов системы позволяет анализировать относительную важное: параметра каждого компонента путем изучения величины его час ной производной. В результате может потребоваться установи более жесткие допуски для параметров тех компонентов, котор!" вносят наибольший вклад в дисперсию системы.
Кроме того, в отличие от метода Монте-Карло при полученн моментов системы не обязательно принимать какие-либо допуш-ния о форме распределений параметров компонентов. Так, в п: мере с электрической цепью были нужны лишь оценки момеш-распределений параметров компонентов и не требовалась полна-' информация об их распределениях.
По этим причинам, прежде чем прибегать к методу Монте-Кар •" для вычисления характеристики системы на основе данных о параметрах компонентов, необходимо изучить целесообразность применения способа, описанного в разд. 7.2. Однако рассматриваемы!' случай настолько сложен, что моделирование методом Монте-Кар' ]
Получение характеристики системы
285
I является единствейным рабочим инструментом. В то же время, уш возможно применение метода получения моментов системы, рои оказывается более дешевым и более точным.
F.5- ДРУГИЕ СЛУЧАИ ПРИМЕНЕНИЯ МЕТОДА МОНТЕ-КАРЛО
►Одним из важных случаев применения моделирования методом >нте-Карло является оценка надежности сложных систем. Рас-Ьтрим снова изображенную н^ рис. 7.5 систему, которая уже
P(DJ=O,9
fuc. 7.5. Система с параллельными и последовательными элементами. Р(А)~ Еритпостъ успешной работы эжмипа Л; Р(А) = 0.9. (Из книги Cliest-I ' nut Н.i bystems Engineering Tools, John Wiley. New York, 1965.)
рссматривалась в гл. 2. Чтобы система действовала успешно, все |три звена должны работать. Первое звено выходит из строя лишь [случае неисправности обоих компонентов А и В, имеющих надеж-рсть соответственно 0,9 и 0,8. Второе звено выходит из строя, ртда компонент С. имеющий надежность 0,95, оказывается неис-равным. Выход из строя третьего звена происходит лишь в том иучае, когда неисправны все его компоненты — D, Е и F. На-ЕКность этих компонентов равна соответственно 0,9; 0,9 и 0.5. 1утем обычного вероятностного анализа в гл. 2 было найдено, то надежность этой системы равна 0,926.
Г Эту же задачу можно решить методом Монте-Карло, используя [ля «построения» большого числа моделированных систем вычислительную машину. Для каждой системы вычисляется параметр каж-ргр компонента путем выбора случайной величины, равномерно Еепрелеленной в интервале (0, 1), и сравнения ее с требуемой на-гасиостыо. Например, надежность 0,9 моделируется следующим Срезом: каждый раз. когда выбирается случайное число, равное 1,9 или превышающее это значение, отмечается отказ; в противном Иучае отмечается успешная работа. После того как это будет проделано для каждого компонента, находится вероятность безотказной работы и вероятность отказа для каждого из трех звеньев, 1 затем и для всей системы. Эта процедура повторяется большое чис-
Глава 7
Результаты оценки надежности системы
СлучаЛиоя величина, полученная ДЛЯ Komioncirra®) Результат для I звена1) Случайная нелнчи-на. полученная для компонента®) Резул, ДЛЯ 1 1 ли.ч
Л в
0,22 0,17 3 0,68 S
0,93 0,22 3 0,53 S
0.78 0,76 3 0,58 3
0,58 0.71 3 0,96 F
0,18 0,87 3 0,01
’ S —успешная работа, F — выход и» строя. * Подчеркнутые значения показывают выход
ло раз, и оценка надежности системы находится как отношение т ла безотказно работающих систем к общему числу систем.
Методика оценки надежности системы, изображенной на рис. 7 путем моделирования методом Монте-Карло состоит в следу юн.
1. Получаем шесть независимых случайных величин, pai мерно распределенных в интервале (0,1). Обозначим их значе через А, В, С, D, Е и /•'.
2. Если А > 0,9 и В 0,8, то в звене 1 происходит отк
3. Если С 0,95, то в звене II происходит отказ.
4. Если D - 0,90, Е>-0,90 и £ : 0,50, то в звене Ш пр<н
ходит отказ.
5. Моделируемая система выходит из строя, если пронсхо отказ в звене 1, или в звене II, или в звене III. Если ни
из звеньев не выходит из строя, то вся система работает безотки
6. Этапы 1—5 повторяются многократно, и каждый раз : стрируется выход из строя или безотказная работа системы. В случае надежность оценивается как отношение числа случаен зотказной работы системы к общему числу испытаний меп< Монте-Карло.
Эти правила нетрудно запрограммировать для быстроденств? 1 щей вычислительной машины. Результаты пяти испытании пока-1 заны в табл. 7.3. После пяти испытаний оценка надежности сне н 11 I оказалась равной 0,8. После 100 испытаний методом Монте-!'' .' ] ло оценка стала равной 0,91 (что уже сравнимо с точным резх татом, равным 0,926). Способом, описанным ранее, можно вычислить также доверительный интервал.
Изучение характеристики системы
287
Таблица 7.3
Изображенной на рис. 7.5, методом Монте-Карло
случайней велкчннп. полученная или компонента2' Результат для 111 звена Результат для
Б | О Е нссП системы
I 0,65 0,84 0.68 3 3
1 0,04 0.39 0,07 3 S
I 0.54 0.74 0,92 3 S
I 0,30 0,24 0,18 3 р
I 0,42 0,31 0,57 3 3
^^Приведенный здесь пример является искусственным, так как тарный результат можно легко получить аналитическим путем. Кшако если бы система насчитывала не шесть, а 6000 компонентов к если бы параметры некоторых из них не были независимыми, (омналитическнн подход мог оказапся очень сложным и задачу
fHpuui.uiCh бы решать методом Монте-Карло.
^^Моделирование методом Монте-Карло часто применяется при «призе задач, связанных с обслуживанием клиентов и образованием очередей. Теория массового обслуживания является анали-тайеским (г. е. не связанным с моделированием) методом решения таких задач, однако эта теория еще не получила развития в такой Келенн. чтобы обеспечить решение многих сложных практических Вдач. Например, в теории массового обслуживания часто необходимо принимать допущение о том, что интервалы времени между Икледовательпыми моментами прибытия клиентов распределены «юкэкспоненинальному закону. На практике, когда это допущение •(-выполняется, мы часто должны обращаться к моделированию
Ивтодом Монте-Карло.
^«Примером применения метода Монте-Карло в задаче массового МЕлуживання является моделирование работы ремонтной мастер-Кой. В этой задаче нас интересует обработка заказов различных Клиентов в срок и при минимальных затратах. Заказы, поступающие от клиентов, образуют очередь и обрабатываются в соответствии Киекоторым правилом назначения приоритета, например, по принципу «первым прибыл — первым обслужен». Длительность ожн-Нния в очереди конкретного заказа зависит от многих факторов.
288
Глава 7
в том числе от наличия станков и обслуживающего персонала. Если станков много, то обычно все заказы обрабатываются своевременно, однако в этом случае велики издержки. Если станков меньше, то издержки снижаются, однако растет вероятность того, что зака клиента не будет выполнен. Задача усложняется еще и тем, что для выполнения различных операций на разных рабочих местах необходимо иметь станки различного рода. Статистические колеба ния вносятся за счет изменения числа и характера заказов, типа неисправности, допустимой длительности задержки выполнения за каза и т. д.
Управляющий желает выбрать оптимальный режим работы своей мастерской. Например, он должен решить, сколько станков должно быть занято на каждом этапе операции. Эта задача может усложняться еще и тем, что последствия при принятии большого числа решений можно оценить лишь методом проб и ошибок.
Вместо того чтобы проводить сравнение при реальных условиях работы (в общем случае это нецелесообразно делать в большом масштабе), для моделирования работы мастерской управляющий может использовать вычислительную машину. В этом случае вместо фактических заказов рассматриваются случайные числа, имею щие то же самое распределение. Вычислительная машина будет генерировать случайные числа, описывающие выход станков из строя задержку заказов и другие процессы. Каждая группа испытании может описывать работу мастерской за год и давать моделирован ные данные о времени простоя, числе потерянных заказов и т. д.
Таким способом можно получить моделированные данные <а много лет и найти распределение характеристики, описывающей ра-боту ремонтной мастерской при определенном комплекте оборудо вания. Затем, изменяя некоторые параметры программы вычисти тельной машины, можно изучить работу прн другом комплекте обо рудоваиия. Таким образом, сравниваются последствия различных политик. Эта методика показана схематически на рис. 7.6.
Моделирование методом Монте-Карло применяется прн решении многих других сложных задач управления, например при сбставле нии правил регулирования запасов или организации работы дорожных сооружений.
Эти методы используются также и в теоретических статнстнчес ких исследованиях, когда невозможно найти непосредственно распределение некоторой случайной величины. Например, описанное в гл. 8 распределение критерия IV' было получено методом Мош Карло.
В этой главе мы кратко познакомились с методом Монте-Кар в-Более подробно данный вопрос рассматривается в книгах Точера 17.81, Хаммерсли и Хендкоума 17.101 и Ю. Л. Шрейдера (pci > [7.11]. Вряде работ [7.121—17.15]даются специальные приложения.
Получение характеристики системы
289
Имеется библиография по применению моделирования в задачах дминистратнвного управления [7.16]. Другие примеры можно най-й в журналах Operations Research, Management Science и Manage-tent Technology за последние годы. Описаны также методы уменьшения числа испытаний прн моделировании методом Мопте-Карло
•Рис, 7.6. Логическая программа для моделирования работы ремонтной мастерской методом Монте-Карло.
идя получения требуемой точности ([7.8], [7.101, [7.111, [7.17] — (7.191). Кроме того, часто могут оказаться очень полезными программы вычислительных машин и машинные языки, используемые при решении общих задач моделирования, например GPSS (17.201, j 17.21 1) или SIMSCRIPT [7.221. и поэтому перед составлением программы моделирования необходимо изучать возможность их исполь-Июванпя.
Ясно, что моделирование методом Монте-Карло может быть мот-Иным инструментом. Как и при любом другом методе, справедливость Результатов зависит от точности входных данных. Поэтому необходи-КМо 'уделять серьезное внимание получению реалистического описа-
290
Глава 7
ння рассматриваемой физической задачи, дающей входные данны. для анализа методом Монте-Карло.
Приложение 7А. Вывод формул (7.3) и (7.6)
Пусть соотношение между характеристикой системы г и случай ними параметрами компопен!гов xlr х2, . . х„ имеет вид
г*-Л(х„ х,....х„).
Пусть
£(хг) — математическое ожидание параметра г-н компонента (I = 1, 2,..., п);
Е [х,- — Е (х/)]Г —г-й момент относительно математической. ожидания для параметра Z-ro компонент. (Z=l, 2...................л; Г=2, 3. 4);
Е (г) — математическое ожидание характеристики системы;
£[г— £(г)]Г—r-й момент относительно математической-ожидания для характеристики системы (г =2, 3. 4).
Допустим, что случайные параметры компонентов некоррелиро-ваны. Следовательно, действуя, как в при проверке справедливости формулы (2.78), можно легко показать, что
Е |[х( — Е (х,)]' [х;. - Е (ху)р| - £ [х( - Е (xi)]’’ £ [л , — £ (х,)]'.
i-hj. (7Л. 1
Разложим вначале функцию /цл,. х2, .... сл) в многомерный ряд Тейлора до членов второго порядка включительно" отно- и тельпо [£(х(), £(х«),... , £(х„)], т. е. точки, в которой случавши параметр каждого компонента принимает свое среднее значени Таким образом,
/i(xt, х2,..., хл) = й[£(х1), £(х-1. £Ц,)] +
+ 2^- t*<-wi+” <»<-'wr+
+ 2 WIB/ - C(x,lll (7А
и,' )
’> Это означает сохранение членов до второй- порядка включнт<л-и в том смысле, как это было определено ранее.
291
Получение характеристики системы
де все значения производных вычисляются для математических «киданий, т. е. dh/dx, обозначает dh(z)/dx,, а значения хп (Л = I, К . . п) заменяются их математическими ожиданиями Е(хк). Беря ватематические ожидания обеих частей уравнения (7А.2), получаем №(*,. *«.....*„)]“£I*[£(*Л +
+ £
+ £
iv^[.v.,_£w]J + £|2.y^.[x,_£WP| +
(7Л.З)
В формуле (7А.З) было использовано следующее свойство опе-атора математического ожидания, установленное в гл. 2:
Е (Л + иг + - + ».) = Е (у,) + Е{Цг)+- + Е (nJ. (7А. 4)
I В гл. 2 было найдено также, что для любой постоянной с и лю-юой случайной величины х
Е (с) = с (7А. 5)
Е(сх) = сЕ(х). (7А.6)
I Таким образом, Б|Л[£*(Х^, ЕМ..... Е(х.)]|=Л[£(х,), ад...Е(х„)](7А,7)
= r,^[Elxt-B(x^~0. (7Л.8)
Диалогично
(7Л.9)
Скольку, no определению,
Е^-ЕШГ-^х,).
292
Глаиа 7
Кроме того,
£ {2 2 tSt i*< - £ wfe -£ wi}
₽ 2 2~^г в11Х| ~ Е <х,)||Ху - £ wh = °, рл- к»
так как, согласно формуле (7A.I),
Е((х{ —Е(х()][ху —E(xz)]) = E[xf —E(x,)]E[xy—£(ху)] = 0. Подставляя выражения (7А.7) — (7А.10) в формулу (7А 2), получ, ем
£(г) = I, (£ (х,), Б(ха).£(X.)] + Д. У ™ <,«(х(>.
- ах~,
т. е. формулу (7.3).
Теперь выведем формулу (7.6). В гл. 2 мы нашли, что c*(z) = Е(г^ — 1£(г) Is. Подставляя в это соотношение значение г = Л(хь ха, .... х„), находим
o’[A(-«i. х2..х„)] = Е Цй (х„ хг..x„)]2J -
— (Е[Л(х1, х2, .... х„)]13. (7А. И
Чтобы найти аппроксимацию первого члена правой части фору лы (7А.11), возведем обе части уравнения (7А.2) в квадрат, прим? ним к каждому члену оператор математического ожидания и оставим члены до третьего порядка включительно. Получим следу юн и выражение:
£H''to. Ъ.....х,)Л - Ц(£(х,), Е(ха)......£to)ll' +
+ ij(^-)‘£h-£<t.)I’ + ''r£W.£ta).........£to)]x
* 2#£^£МГ + 2(>)(<)£^-£М)3-
(7A. •
Второй член правой части выражения (7A.1I) равен квадро правой части формулы (7.3). Таким образом, сохраняя только чин 1 до третьего порядка включительно, получаем
Получение характеристики системы
293
!Р>С*1. “г.Х.)Г,*-
U[£(xJ. ЕЫ.......£(х,)] + 42-£г“
Ьл[£(х,), £(х3)..£(x„)]l‘ +
L[£(x,), £fe)....£(х,)]У§-£[*^£«Г; (ТА, В)
[Подстановка соотношений (7А.12) и (7А.13) в формулу (7A.11) ст
«
Л (х„ х....х,)] = v (-£)’ £ [х, - £ (х,)]« +
+ 2(<)(тт)£|х'-£(х,)1’'
и, что то же самое, поскольку — E(xt) Is = Р-»(*,).
е. получена формула (7.6).
Приложение 7Б. Выражения для моментов характеристики си-^^емы, когда случайные параметры компонентов коррелированы
При выводе формул (7.3), (7.6). (7.8) и (7.9) для получения момен-в характеристики системы с помощью моментов для случайных •аметров компонентов предполагалось, что случайные параметры шонептов не коррелированы. Соответствующие моменты корре-Юванных случайных параметров компонентов имеют следующий
294
Глава 7
Е (г) =7i [£(»,). Е(*,) £ (х,)] + -i- V (х,) +
+ 22~i3», £|[х,-£Wltj-WII- рв. 1
’!w=i«)^w+
+ 222«1(Д)£ Цх,-Е(х,)][л7-Е(х;)]| + i<J 7
+S(^)(#)hfei+|JFX#)-
х £ |[x,-E(x,)][x,-£(.<,)]*; +
+ 77~.!".,.77 1 I' I'.jll-r, —E(xp]j-j-
-i-2I22«i(^).U-eW]x
/ s
x[jr—EfX/JIx, —E(xs)]|. (-i.
+ 3 2 2 E l[x, - EU№; - E(,t,)|| -
Получение характеристики систему
295
I хВ|[ж,-Л(х,)][^-е^)][ж^£(ха)]|. (7В.З)
+ 42Z«)’«)£И«.-ewn< -*<« .1 +
+6 S - E WJfo -E «да +
+^222(£У(Ж)*
i + 11 s
I X E |[*(— E (»,)]-[.r, - E (x,)][x — £ ia- JII +
/</<»</
X E |[х, - E (x,)P; - E (xy)]K - E (xs)][x, - E (x,)]) . (75. 4)
В Члены этих выражении можно оценить с помощью имеющихся ванных обычным способом. Например, оценка для
Е|[х,-£ад=[х,-£(А-,)У|
I ваходится на основе R наблюдений путем определения
«
S^r—ХгЖху,-Ху)«
R •
I Эю выражение можно также записать в форме, более удобной для |^Киислепин.
Н При.южение7В. Методы получения случайных величин, имеющих ^^ka.wiHbie распределения, с помощью таблиц нормированных случай-I Фых величин с равномерным и нормальным распределениями
^КСпособы получения случайных величин с различными законами ^^Ьпределения приведены в табл. 7.2. В этих методах использу-I 1огея нормированные случайные величины, имеющие равномерное ^^ПШределение в интервале (0, 1) и нормальное распределение с
2<jC
Глава 7
jx = 0 и s = 1. Как указывалось в этой главе, уже составлены таг лицы случайных величин, имеющих такие распределения, или ;+ они могут быть получены с помощью вычислительной машины. М, тодика преобразования, описанная в табл. 7.2, основана на одно' или на обоих описываемых далее подходах.
Рис. 7В.1. Генерирование случайных чисел путем преобразования равно мерно распределенной случайной величины.
Порядок работы:
1. Получаем случайную величину RtJ , равномерно распределенную в интерг.-. ле (0. I).
2. Полагаем Е(у)=Ки
3. Находим значение у. соответствующее F(y).
f(y)— плотность распределения случайной величины у; F(y)— интегральн функция распределения случайной величины у.
В первом способе, называемом преобразованием равномерно put пределенной случайной величины, используется тот факт, что интч ральная функция распределения любой непрерывной случайна величины равномерно распределена в интервале (0,1), т. е. для лк -'-случайной величины у с плотностью распределения /(у) случаю ; величина
ТЫ = |/(л)Лг (717.
имеет равномерное распределение в интервале (0, I), или функпи*1 F(y) соответствует плотность распределения
Получение характеристики системы 297
Таким образом, случайную величин}' у с произвольной плот-Ьстыо распределения /(у) можно найти следующим образом: К 1. Получаем случайную величину Ru , имеющую равномерное распределение в интервале (6.1).
I 2. Полагаем в формуле (7B.I) Ru = F(y).
I 3. Решаем полученное уравнение относительно у.
Этот метод иллюстрируется на рнс. 7В.1.
К В качестве примера рассмотрим получение случайной величины, Веющей экспоненциальное распределение с двумя параметрами [см. гл. 8) с плотностью
НГ. =
каким образом,
F (#) _ J dx = 1 - е
81 I'
следовательно,
ln[l-F(sH”“ Hy-V-)
ИЛИ
У =----|-ln[l — F (!/)]-h‘.
Гак как функция F(y) равномерно распределена в интервале (0, 1). врем нормированную случайную величину Ru , имеющую равномер-юе распределение, и находим искомую случайную величину, распределенную по экспоненциальному закону:
у = —R„)l-|-!*.
Преобразование равномерно распределенной случайной вели-шны особенно приемлемо в том случае, когда, как в данном примере. Интегрирование можно выполнить в явном виден получаемое уравнение легко разрешимо. В других случаях для решения уравнения [7В.1) относительно у необходимо прибегать к численным методам. [ Второй подход состоит в использовании известных соотношений иежду распределением случайной величины, которое должно быть [Мучено, и случайными величинами, имеющими нормальное и равномерное распределения.
i Например, плотность гамма-распределения
/(»; ч.
!ыла выведена в гл. 5 как сумма т; экспоненциально распределениях случайных величин, каждая с параметром X. Следовательно,
298
Глава 7
случайную величину, имеющую это распределение, можно получит!, генерируя т) соответствующих независимых экспоненциально распределенных случайных величин описанным ранее способом и суммируя их. Случайные величины, имеющие распределен;!, Вейбулла, хн-квадрат, бета, пуассоновское, биномиальное, логарифмически нормальное, ДжонсонаЗв и Sy , находятся с помощью ан,т логичных соотношений.
ЛИТЕРАТУРА
7.1. Davies О. L. (Ed.). Statistical Methods in Research and Production Hafner Publishing Co , New York, 1957.
7.2. V i 1 I a г s D. S.. Statistical Design and Analysis of Experiments f ; Development Research, William C. Brown Co., Dubuque. Iowa 1951.
7.3. Volk W., Applied Statistics for Engineers, McGraw-Hill, New York 1958.
7.4. D^m ' n 6 W. E., Some Theory of Sampling, John Wiley, New York, 7.5. TukeyJ. W., „The Propagation of Errors, Fluctuations and Tole rances — Basic Generalized Formulas"; ..The Propagation of Errors. Flue tuations and Tolerances—Supplementary Formulas,,; „The Propagation of Errors. Fluctuations and Tolerances — An Exercise in Partial Differei: tiation1*,—Technical Reports 10. 11. 12; Statistical Techniques Researcn Group, Princeton University, Princeton, New Jersey.
7.6. Kendall M. G., В a bi ng to n- S m I t h B., Tracts for Сотри tens, №24, Cambridge University Press, Cambridge. 1939.
7.7. The RAND Corporation, One Million Random Digits and 100 000 Nor mal Deviates, The Free Press, Cambridge Glencoe. Illinois, 1955.
7.8. Tocher K. D.. The Art of Simulation, Van Nostrand, Princeton New Jersey, 1963.
7.9. H u 1 I T. E., D о be 1 I A. R.. Random Number Generators, S/.4.VI Rev., 4. 230 (1962).
7.10. Ha mmersley J. M., Handscomb D. C-, Monte Carlo Methods, John Wiley, New York. 1964.
7.11. Шрейдер IO. А. (ред.), Метод статистических испытаний (метол Монте-Карло), М.. Фнзматгнз, 1962.
7.12. Goetz В. Е., Monte Carlo Solution of Waiting Line Problem;-. Management Technology. 1, 2 (I960).
7.13. Harling J.. Simulation Techniques in Operations Research — A Review, Operations Research, 8. 307 (1958).
7.14. Jessop W. N., Monte Carlo Methods and Industrial Problems, Appt. Stat., 5, 156 (1956).
7.15. Y о u 1 e P. V.. Toe her K. D., Jessop J. W.. Musk F. । Simulation Studies of Industrial Operations. J. Roy. Statist. Soc., Ser A. 122. 484 (1959).
7.16. Ma I koi m D. G.. Bibliography on the Use of Simulation in Management Analysis, Operations Research. 8. 169 (1960).
7.17. К a h п H.. Marshall A. W., Methods of Reducing Sample Size In Monte Carlo Computations, Operations Research. 1. 263 (1953).
Получение характеристики системы
S'|8. Moshman J.. The Application of Seqential Estimation to Compu-’Г ter Simulation and Monte Carlo Procedures. J. Assoc. Comp. Mach., I S. 343 (1958).
«19, ClarkC. E.. The Utility of Statistics of Random Numbers, Opera- Hons Research. 8. 185 (1960).
S20. Efron R., Gordon G., A General Purpose Digital Simulator and S Examples of Its Application. Part I. Description of the Simulator. /SAI I Systems J., 3. 22 (1964).
Kl. Hersco vilcb H., Schneider 1., GPSS III — An Expanded Г General Purpose Simulator, IBM Systems J.. 4. 174 (1966).
7 22 Mar ко vi tz H- M.. Simulating with SIMSCR1PT. Management К Science. 12. B-395 (1966).
Глава 8
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЕРОЯТНОСТЕЙ И ПРОВЕРКА ДОПУЩЕНИЙ О РАСПРЕДЕЛЕНИЯХ
В предыдущих главах основное внимание уделялось выбору сi. диетических моделей, описывающих физические явления. В дани । главе рассматриваются методы, позволяющие оценить на основе лученных данных приемлемость выбранной модели. Такие оцен: особенно важны, когда модель должна использоваться для проге зирования. Если, например, при прогнозировании вероятности пешного выполнения некоторой задачи допущение об экспонен альном распределении как статистической модели для времени б-отказной работы неверно, то прогнозирование может быть сопряжено с серьезными ошибками. (См. пример в разд. 8.2.)
Рассматриваются два различных подхода: графическое предо и.-лепие вероятностей и статистические проверки. Графическое щь ставление вероятностей является субъективным методом, поско. i определение того, не противоречат ли полученные данные приня: статистической модели, основывается на визуальном наблюди..i.
а не на статистическом расчёте. Этот метод очень прост и, кроме - । ределения приемлемости выбранной модели, может дать очень .. го полезной информации. Статистические испытания являются б‘ объективным подходом, позволяющим вероятностными метод.-; ы оценить адекватность выбранной модели. Поэтому они часто него зуются в дополнение к графическому представлению вероятно! ; особенно когда графический метод не позволяет принять оп релейного решения. Здесь рассматриваются проверки двух типов: щ"-верка с помощью критерия W, позволяющая весьма эффекп " проверить допущения о нормальном, логарифмически норм-пом и экспоненциальном распределениях, и проверка с полю ’ критерия хи-квадрат, которая может использоваться для провиси адекватности любой статистической модели.
Возможно, нз данной главы читатель сделает вывод, что । р1' вильный способ выбора распределения состоит в рассмотрении ' шого числа возможных моделей, оценке каждой из них описать • здесь методами и принятии за правильную той из них, которая и печивает наилучшее соответствие экспериментальным данным нако ничего подобного здесь не предлагается. Невозможности ! статистической модели должен основываться на понимании ;
Графическое представление вероятностей
йтриваемого физического явления и применении критериев, вве-шных в предыдущих главах. В этом случае критерии для проверки «определения служит важным средством оценки адекватности мо-едн, описывающей физическое явление. Лишь в крайнем случае сет быть принят обратный порядок, да н то с большой осторож-
стыо, поскольку, несмотря на то что многие модели могут оказать-приемлемыми в интервале значений экспериментальных данных, и будут ошибочными в интервале, для которого необходимо вы-лнять прогнозирование. *
1. ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЕРОЯТНОСТЕЙ ведение
Есть поговорка, что лучше один раз увидеть, чем сто раз услы-:ать. Это утверждение особенно справедливо в отношении графичес->го представления вероятностей. Этот метод позволяет наглядно 1едставнть имеющиеся экспериментальные данные, а также I) опре-Лйты адекватность принятой вероятностной модели; 2) оцешггь (оцентилн распределения; 3) оценить параметры распределения.
Эту информацию можно получить даже в том случае, когда из-етны значения лишь k из п наблюдений, т. е. в случае цензуриро-|нных выборок. Как указывалось в гл. 3. такие выборки имеют кето при испытаниях на долговечность, которые прекращаются )Сле появления k отказов, или при пользований измерительным прибором, когда отсчеты, превышающие некоторое предельное значение, неизвестны, поскольку они лежат за пределами измеритель-бй шкалы прибора.
Рассматриваемый метод очень прост. Полученные эксперймен-альные данные наносятся на специальную графическую бумагу, Ьедназначенную для определенного распределения. Если статис-цческая модель выбрана правильно, то точки образуют прямую линю. Если модель не подходит, то график не будет линейным и мож-о наблюдать степень и характер отклонений от прямой. Если окажется. что модель достаточно хорошо соответствует экспернменталь-^1м данным, то с помощью графика можно оценить процентили и наченпя параметров. Вначале этот метод иллюстрируется для слу-ая нормального распределения. Затем рассматривается графичес-ре представление вероятностей для оценки некоторых других модё-ей. Теоретическое обоснование метода дается в конце раздела.
1орядок работы в случае нормального распределения
Графическое представление вероятностей на основе определенной ©купностн данных включает следующие этапы:
302
Глава 8
Квантили нормального распределения
Lt/ммарный ппоиент наблюдений
Рис. 8.1. Данные о весе пакетов с химическим веществом, нанесенные ил нормальную вероятностную бумагу.
Этап 1. Выбираем так называемую вероятностную бумагу, предка < каченную для рассматриваемого распределения. Бумага для нормального распределения показана на рис. 8.1, и ее легко достать. Вероятностную бумагу для других распределении можно получить из различных источников1 >. Способ изго-товлеиия этой бумаги будет показан далее.
Этап 2. Упорядочиваем все-наблюдения от наименьшего до наибольшего по величине. Так, если х(1)> х(2), ..д-(п)—первоначальные неупорядоченные наблюдения, то упорядочение hoo.w-оенияхь х2, . . ., х(п) удовлетворяют условию х, < х2< .
• • • ^*71 •
мниД,^М,ап" рааН°°браЗНП? веРоят,,оетная бумага имеется в'магазипе те,-ннческих средств для административного управления в г. Лоуэлл, шт. Массачусетс (Белроз авеню, 104),
Графическое представление вероятностей
ап 3. Наносим значения xt на вероятностную бумагу против соответствующих значений (i--------^-)100/п или (i—^-)/л в зависи-
мости оттого, рассматривается процент или доля наблюдений.
[ Далее будем считать, что у нас имеется бумага, на которую I нужно наносить процент наблюдений. Так, первое наимень-f шее наблюдение наносится против (4*) 100/л, второе наимень-[ шее наблюдение против (^100/л и т. д.
I Для цензурированных данных п обозначает общее число элементов, независимо оттого, все ли их значения известны. Ось графической бумаги, на которую наносятся значения xt, будем называть шкалой наблюдений, а ось для (i-------^-) 100/л—
I шкалой интегральной функции распределения. На вероятност-i ной бумаге по оси абсцисс может лежать как шкала наблюдений, так и шкала интегральной функции распределения. Однако шкалу интегральной функции распределения легко узнать потому, что ее значения начинаются от малых положи-I тельных чисел, например от 0,01% (или 0,0001), и идут до j некоторого значения, близкого к 100%, например 99,99% (или 1 0,9999). Так, на рис. 8.1, видно, что шкала интегральной
функции распределения нанесена по осн абсцисс, а шкала наблюдений — по осн ординат.
’ап 4. Если окажется, что данным соответствует прямая линия, ’ проводим эту линию «на глаз».
Если выбранная модель верна, то точки должны группироваться лнзи прямой, хотя и будут некоторые отклонения вследствие слу-йных колебаний выборки. Если же график существенно отличает-от прямолинейного, то выбранная модель не подходит для опиши рассматриваемых данных. Систематические отклонения сви-ельствуют о том, что модель не удовлетворительна. Вопрос о том, ;ую линию считать прямой, является субъективным делом, и два овека, рассматривающие один и тот же график, могут прийти к личным заключениям. Однако чем больше число выборок и чем ьше отклонение от принятой модели, тем легче отделить нстин- отклонение от случайного.
В качестве примера графической оценки нормального закона рас-ртрнм пять случайных выборок, содержащих 20 и 50 нормирование нормально распределенных случайных величин. На рис. 8.2 8.3 показаны соответствующие данные для нормального распре* 1ения. Эти данные дают некоторое представление об отклонении йрямой для случайных выборок объемом 20 и 50 элементов, взятых брвокупности, распределенной по нормальному закону. Для срав-
308
Квантили нормального распределения
309
Квантили нормального распределения
Проценты г
iH’iiiiffiiiiiiBiiiii
мом 20 элементов, взятых из равномерно распределенной совокупности.
310
пения на рис. 8.4и 8.5 показаны точки, нанесенные на нормальную' вероятностную бумагу для выборок объемом 20 и 50 элементов с. ответственно, взятых из совокупности, имеющей равномерное рас пределение, которое, как и нормальное, симметрично, но являете" плоским. Наконец, на рис. 8.6 и 8.7 показаны данные, нанесены на нормальную вероятностную бумагу для выборок объемом 20 и 50 элементов из совокупности, распределенной по экспоненциально- > закону: форма этого распределения существенно отличается от формы нормального распределения. Здесь наглядно показаны типичш • отклонения от прямой при нанесении на нормальную вероятности} к> бумагу каждой из выборок двух различных объемов, взятых из • вокупностей с распределениями, различным образом отличающими < от нормального. Заметим, что в некоторых случаях для выборок, взятых из нормально распределенных совокупностей, особенно дли выборок объемом 20 элементов, вследствие наличия случайных колебаний графики заметно отклоняются от прямой. Однако для выборок из совокупностей, распределенных по экспоненциальному закону. почти все графики отклоняются от прямой более значительно, чем в случае нормального распределения. Графики для выборок расно-мерно распределенных случайных величин обычно не отклоняют1-
Графическое представление вероятностей
311
г прямой так сильно, как в случае экспоненциального распределена, однако для выборок объемом 50 элементов они уже отличаются Е графиков для нормальных случайных величин.
Изучая рис. 8.2 — 8.7, можно сделать следующие замечания:
1. Отклонение точек в области очень больших или очень малых аченин больше, чем в средней части распределения. Относнтель-я линейность графика вблизи предельных значений распределения сто оказывается хуже, чем в средней части распределения, даже пн модель выбрана правильно1’.
2. Точки, нанесенные на вероятностную бумагу, упорядочены и, едовательно, не являются независимыми. Поэтому не следует ожить, что они будут группироваться относительно прямой случай-м образом. Например, точки, непосредственно следующие за иной точкой, лежащей над прямой, также могут оказаться над ямой. Следовательно, даже в том случае, если выбрана правиль-я модель, ряд последовательных точек будет лежать над (или под) ямой.
3. На основе выборочных данных никогда нельзя доказать ‘кватность модели. Поэтому график, построенный для небольшой борки, взятой из совокупности, имеющей почти нормальное расселение, часто не отличается существенно от графика для выбор-случайных величин, распределенных по нормальному закону, что Глядно иллюстрируется графиками для выборок равномерно рас-еделенных случайных величин.
Руководствуясь этими результатами и приобретя некоторый опыт, 1чно с помощью графиков можно сделать один из следующих трех юдов: 1) выбранная модель оказывается правильной; 2) адекват-Ть модели не доказана; 3) модель выбрана неправильно. Если неодима объективная оценка, то наряду с графическим представле-!М вероятностей может быть использована методика проверки кватности, описываемая далее в этой главе.
|Изучение графика, когда имеется систематическое отклонение от Ямой, может дать некоторую информацию о форме более приемле-й модели. Например, на рис. 8.4 и 8.5 почти все точки в области ых значений лежат значительно выше, а в области больших зна-нй значительно ниже, чем ожидается для выбранной модели.
указывает на то, что используемые данные имеют распределе-менее островершинное, чем нормальное. Графики, построенные нормальной вероятностной бумаге, подобные изображенным рис. 8.4 и 8.5, могут быть получены также в случае усеченного мального распределения, т. е. когда выборка берется из сово-(ностп, из которой первоначально были исключены все значения, ищие выше н ниже некоторых заданных пределов. Если усе-
” Это не относится к распределению с ограниченным «хвостом».
312
Квантили нормального распределения
Рис. 8.5. Нанесенные на нормальную вероятностную бумагу пять слу купности. (На
313
г
объемом 50 элементов, взятых из равномерно распределенной сово-не все трчкн.)
314
Г лава 8
Рис. 8.5. (продолжение)
чение данных производится только с одной стороны, то на график, нелинейность будет ясно наблюдаться только в этой области.
На рис. 8.6 и 8.7 значения на обоих краях распределения слиш ком велики. Это показывает, что следует выбирать модель, имею щую правостороннюю асимметрию. Если на обоих краях распреде ления, построенного на нормальной вероятностной бумаге, значеви: будут слишком малы, следует выбирать распределение с левост. ровней асимметрией. Теперь проиллюстрируем графическое прел ставление вероятностей на примере.
Химический продукт расфасован в пакеты весом один фу и Стоимость этого продукта довольно высока, н поэтому важно. чтоб1 вес каждого пакета был близок к одному фунту. Упорядочен!!, значения весов 25 случайно выбранных пакетов показаны i табл. 8.1.
Вследствие того что колебания веса возникают в результате воздействия большого числа незначительных отклонений, ожида ется, что нормальное распределение обеспечит приемлемое описание данных. Чтобы оценить адекватность данной модели, на нормам ной вероятностной бумаге построен график, показанный на рис. 8.1. Упорядоченные значения весов нанесены против значений
—
315
320
Е
CU
Графическое представление вероятностей
321
!— 1/2) 100/п, т. е. наименьшее значение 0,9473 наносится на шка-у наблюдений против значения 2,0 на шкале интегральной функции аспределения; второе по порядку значение 0,955 наносится против ,0 и т. д. Наибольшее значение 1,0396 наносптся против 98,0. очки, нанесенные на вероятностную бумагу, группируются вблизи рочерченной прямой, и, следовательно, нельзя считать, что нормальное распределение неприемлемо в качестве статистической рдели.
Таблица fi.l
Упорядоченные значения веса пакетов с химическим веществом
0,9473 0,9775 0,9964 1,0077 1,0182
0,9655 0.9788 0,9974 1,0084 1,0225
0,9703 0,986) 1,0002 1,0102 1,0248
0.9757 0,9887 1,0016 1,0132 1,0306
0,9770 0,9958 1,0058 1,0173 1,0396
' С помощью графиков можно оценить процентили распределения, [апрнмер, 50-й процентиль, пли медиана, оценивается следующим Эразом:
[ 1) Находим на шкале интегральной функции распределения )чку, соответствующую 50%.
I 2) Находим точку пересечения построенной прямой и ордина-й, соответствующей 50%.
Г 3) Считываем соответствующее значение на шкале наблюдений.
Например, из рис. 8.1 находим, что оценка для медианы веса Экета составляет 0,998 фунта.
[ Аналогичным образом можно оценить любые другие процентили, 1же те, которые находятся за пределами значений, нанесенных а график. Например, продолжив прямую в нижнюю часть рис. 8.1, аходим. что только 0,5% пакетов будут иметь вес меньше ©39 фунта. Можно было бы получить даже более крайние значе-Ия, например 0,01%. Однако следует подчеркнуть, что экстрапо-йция справедлива лишь в том случае, если выбранная модель ина н за пределами области имеющихся данных. К сожалению, кто можно подобрать несколько моделей, соответствующих экспе-вментальным данным в средней части распределения, но значи-1льно отклоняющихся в области крайних значений. Таким обра->м, нельзя быть уверенным в том, что выбранная модель подходит пя крайних значений, даже если на вероятностной бумаге можно довести довольно прямую линию. Следовательно. к выводам, бнованным на экстраполяции графиков, построенных на вероят-встпон бумаге, необходимо подходить очень критически.
322
Г лава 8
Графики можно использовать также в обратном порядке и цг ходить оценку вероятности того, что будет превышено некоторое определенное значение. Например, согласно рис. 8.1, вероятное!, того, что вес пакета с химическим продуктом превысит 1.02 фунт,! равна 0.18. Методика оценки параметров на основе графиков д.; различных распределений рассматривается ниже. В случае нор мального распределения медиана служит оценкой параметра, рактеризующего центр распределения или математического ожила ния [1, поскольку для симметричных распределений математически ожидание и медиана совпадают. Так, в задаче о весе пакетов с хи мическим продуктом оценка математического ожидания p par на 0,998. Оценку для s находим, используя тот факт, что для люо-нормального распределения среднее квадратическое отклонен?-равно примерно двум пятым разности между 90-м и 10-м процен лямя. В задаче о весе пакетов с помощью рис. 8.1 находим, что точки соответствуют 0,968 и 1,028, и. следовательно, а =|- (1,028 — 0,968) = 0,024. Аналогичным образом о можно найти с помощьк других процентилей.
Графики вероятностей для других распределений
Логарифмически нормальное распределение. Вероятностная г мага для логарифмически нормального распределения отличат от бумаги для нормального распределения тем, что шкала наблю деинй является не арифметической, а логарифмической (рис. 8.81 График логарифмически нормального распределения можно г-строить также на нормальной вероятностной бумаге, беря логарифмы наблюдений и нанося их против (i — 14)100/л. Методика опей параметров аналогична методике, используемой в случае норма ного распределения, с тем отличием, что используются логарпф -наблюдаемых значений. Так, оценка параметра р логарифмине? ? нормального распределения находится как логарифм 50-го прошн тиля, а оценка параметра о равна двум пятым разности меж тс логарифмами 90-го и 10-го процентилей. Эта методика иллюс, руется на следующей задаче.
Новый контрольный прибор был испытан на 96 дизельных ' ловозах. Когда прибор выходит из строя, записывается пройден. • расстояние и прибор возвращается на завод для анализа неисп| -ности. Через 135 тыс. км каждый не вышедший нз строя приоор снимался с тепловоза. Предполагалось, что если можно гарантарп‘ вать безотказную работу прибора на 80 тыс. мп то его будут охотно I покупать. Изучение механизма отказов показало, что время безотказной работы имеет логарифмически нормальное распределение- 1
Графическое представление вероятностей 323
i табл. 8.2 показаны упорядоченные расстояния безотказной рабо-ы для 37 приборов. Эти данные являются цензурированными, (скольку для 59 наибольших значений известно лишь, что они >евышают 135 тыс. /си. График для логарифмически нормального аспределения показан на рис. 8.8. Наименьшее наблюдение нане-ено против значения (1 — Уг) 100/96, второе по порядку значе-
Таблица 8.2
Расстояние, пройденное тепловозами до выхода из строя контрольного прибора (тыс.
22,5 69,5 93,5 120,0
37,5 76,5 102,5 122,5
46,0 77,0 107,0 123,0
48,5 78,5 108,5 127,5
51,5 80,0 112,5 131,0
53,0 81,5 113,5 132,0
54,5 82,0 116,0 134,0
57,5 83,0 117,0
66,5 84,0 118,5
68,0 91,6 119,0
) Остальные 59 приборов безотказно работали 1.35 000 км.
324
Г лава 8
ние — против (2—Уг) 100/96, а наибольшее значение -про-,. (37 — Уг) 100/96.
Из рис. 8.8 видно, что логарифмически нормальное распредели ние приемлемо, поскольку точки лежат вблизи построенной п: мой (на график нанесены не все точки).
Вероятность выхода из строя прибора раньше, чем теплоы. пройдет 80 тыс. км, находится по шкале интегральной функи; распределения как величина, соответствующая точке пересечен;, значения 80 тыс. км на шкале наблюдений с построенной прямо;:. Эта величина составляет около 15%, или 0,15. Таким образ,.' оценка надежности прибора (т. е. вероятность безотказной работ на первых 80 тыс. км пути равна 0,85. Кроме того, с помощью 50-i
процентиля находим ц = In 165 000 = 12,01, а беря логарифм 2
90-го и 10-го процентилей, получаем а =-§• |1п (400 000) -— 1п (66 000) I = 0,72.
Этот расчет показывает, что с экономической точки зрения пр,, бор не способен удовлетворить требуемый гарантийный срок г что необходим тщательный анализ отказов и переделка прибора
Данный анализ не усложнился от того, что рассматривал!!, цензурированные данные. Это общее свойство метода графически представления вероятностей в отличие от методов статистической оценки, которые в случае цензурированных данных часто етаиовяг ся громоздкими.
Гамма-распределение, распределение хи-квадрат и экспонента ное распределение. Гамма-распределение рассматривалось в гл. Плотность гамма-распределения имеет вид
ч. 4 = 0<х<~, k>0, 1>о. г:
Поскольку форма этого распределения зависит от т(, невоз.мл. изготовить вероятностную бумагу, на которой выборки случаи! величин, имеющих любое гамма-распределение, дадут прямолик ные графики. Поэтому построение графика для гамма-распредс < ния возможно только при определенных значениях ?|. Имес", я специальная вероятностная бумага для случаев, когда параметр ч равен 0,5; 1,0; 1,5; 2,0; 3,0; 4,0 или 5,0. Поскольку распределение хн-квадрат является частным случаем гамма-распределения с п;:. метром масштаба к = Ни параметром формы-j (называемым и'с’I лом степеней свободы), равным 2т( (см. гл. 3), то эта бумага под*-1 н Г! также для нанесения случайных величин, имеющих распределен ние хи-квадрат с 1, 2, 3, 4. 6, 8 и 10 степенями свободы. Эта веро’1 ятностная бумага называется бумагой для распределения •ч,,’| квадрат, а не бумагой для гамма-распределения. Для графически о .
Графическое представление вероятностей
325
представления случайной величины, имеющей гамма-распределение с параметром к = Уг, используется вероятностная бумага для аспределения хи-квадрат с одной степенью свободы. На вероят-остной бумаге для распределения хи-квадрат с двумя степенями вободы можно построить график для случайной величины, распре-еленной по экспоненциальному закону, так как экспоненциальное аспределение является частным случаем гамма-распределения Т] = 1.
Данные, нанесенные на вероятностную бумагу для распределена хи-квадрат, должны образовывать почти прямую линию, если 1мма-распределение при выбранном значении -q точно описывает ги данные. Отклонение от линейности может быть обусловлено at, что данные не следуют гамма-распределению, или тем, что стинное значение т( отличается от выбранного.
В том случае, когда отсутствует необходимая вероятностная умага, т. е. когда параметр т( отличается от значений, которые ыли указаны, можно использовать методику построения графиков эмма-распределения, описанную в работе Уилка и др. (8.1 J.
Оценка для параметра к гамма-распределения при известном rt аходится из графика для распределения хи-квадрат как половина глового коэффициента построенной прямой, т. е.
<8-2’
ie ух и у2— два значения на шкале наблюдении, a zt и г, — соот-тствующне значения, полученные на специальной шкале, помненной в верхней части листа вероятностной бумаги. Заметим, что частном случае, когда случайная величина с гамма-распределенн-I имеет также распределение хи-квадрат, при к = Уг угловой еффицнент прямой приближенно равен единице.
Данный метод иллюстрируется на следующем примере. При »мическом анализе количество данной примеси можно измерить галнтически в том случае, если она составляет не менее 0,01%. ыло взято 16 проб и в 12 случаях содержание примеси превышало 101 %. Таким образом, имеем цензурированную выборку с опущен-1ми четырьмя наименьшими значениями. Упорядоченные данные казаны в табл. 8.3.
Из опыта предполагается, что содержание примеси имеет экспо-нциальное распределение, т. е. гамма-распределение с = 1. афик вероятностей для этого распределения показан на рис. 8.9. !рвая точка соответствует пятому по порядку наблюдению и на-сена против (5— %)100/16; следующее значение наносится про-В (6— 54)100/16 и т. д.
Расположение точек вблизи прямой показывает, что выбранная дель достаточно точно описывает данные. Значения опущенных
326
Таблица 8.3
Процент примеси в химическом соединении
Номер упорядоченного наблюдения Процент примеси Номер упорядоченного наблюдения
1. 2. 3, 4 Менее 0,0100 1! 0,0305
5 0,0120 12 0,0363
6 0,0128 13 0,0402
7 0,0139 14 0,0503
8 0,0171 15 0,0689
9 0,0231 16 0,0968
10 0,0250
Суммарный процент
Рис. 8.9. Данные о содержании примеси в химическом соединении, сенные на вероятностную бумагу для распределения хи-квадрат с степенями свободы.
нэпе дв>
Графическов представление вероятностей
327
(блюдений можно оценить, определяя на прямой значения, соот-тствующие (/ — %) 100/л для I = 1, 2, 3 и 4, т. е. те значения на кале наблюдений, которые соответствуют значениям 3,1; 9,4; >,6 и 21,9 на шкале интегральной функции распределения. Полу-|ем следующие результаты: 0.0005; 0,0028; 0,0045 и 0,0065%. ценка для параметра масштаба находится по двум точкам прямой помощью формулы (8.2) как
I / 3,80—1.84 \
А ~ *F\ 0,063—о,/= 36,7-
Распределение Вейбулла. В гл. 3 функция распределения Вей-лла была определена как
(х) = 1— expl — М-Г1. Т!>0, а>0, (8.3)
,е а и т( — параметры масштаба и формы соответственно. Ранее мечалось, что для распределений, имеющих параметр формы, !льзя изготовить вероятностную бумагу для всего распределения, цнако параметр формы и параметр масштаба распределения Вей-'лла по существу мозАно преобразовать соответственно в параметр кгштаба и параметр, характеризующий центр распределения, и, ким образом, можно изготовить вероятностную бумагу для по-роения графиков распределения Вейбулла с любыми параметра-I. Из формулы (8.3) получаем
1п1п[1-?(,|]~т||пх—<8'5)
жим образом, для любой случайной величины, распределенной 1 закону Вейбулла, график для In |п| 1/|1 —/^(х) || как функции дуральных логарифмов будет иметь вид прямой. Чтобы избежать обходнмости вычисления In In 11/11 — F(x)J| н 1 п х, осн вероят-стиой бумаги проградуированы таким образом, что по оси ординат, атветствующей In ln|l/[l — F(x) 1|, можно наносить значения — 54)1ОО/п, а по оси абсцисс, соответствующей In х, можно нано-ть результаты наблюдений. Вероятностная бумага для распреде-ния Вейбулла показана на рис. 8.10.
I Уравнение (8.5) можно записать как
W = а + Ьг,
(8.6)
330
Глава 8
полагаем, что эта случайная величина может иметь распределение Вейбулла, и поэтому результаты испытаний нанесены на вероятностную бумагу для распределения Вейбулла, изображенную на рис. 8.10. Расположение точек вблизи прямой показывает, что вы бранная модель дает приемлемое описание данных.
Для оценки углового коэффициента построенной прямой, были выбраны два значения для In In |l/[l —F(x)l|: IT, = 2.0 и W'i = —8,0. Соответствующие значения In х равны: zt = 7,98 и Zi = 2,88. Таким образом, согласно формуле (8.13),
Отрезок, отсекаемый прямой па осн ординат, равен — 13,5. Таким образом, согласно формуле (8.12),
а = в-<-’3-6>/Ь9в = д80
Более летально построение графиков для распределения Вейбулла описано в работе Као [8.21.
Распределение экстремальных значений типа I. Функция распределения экстремальных значений для наибольших элементов имеет вид
F(x) = ехр|—— оо <х<оо, —оо<р<оо, а>0.
(8.14) где |х и о — соответственно параметр, характеризующий центр распределения, и параметр формы. Таким образом, при нанесении на вероятностную бумагу значении приведенной случайной вели чины
>•- — Inf- Inf(х)] = -j.1 (8 I..
против наблюдений, имеющих данное распределение, получаем прямую линию. Шкалы вероятностной бумаги для распределения экстремальных значений проградуированы таким образом.
значения (I — %)100/п можно наносить непосредственно против значений упорядоченных наблюдений. Такая вероятностная бума ’ показана на рис. 8.11, где проведена прямая, вокруг которой группируются точки, имеющие распределение минимальных значеш ; типа I с параметрами р. = 5 и о = 1.
Уравнение (8.15) можно записать как
у = Ьх — а,
(8.16)
332
Глава 8
Таким образом, оценки параметров распределения экстремальны значений .можно получить с помощью углового коэффициента Ь и отрезка, отсекаемого прямой на оси ординат (а):
Для нахождения b используется самая левая шкала на осн о; динат у, соответствующая
— In [ — ln[F(x)]|.
Выбираются два значения у: уг и уг, и находятся соответствуют,ш значения хг и х2. Тогда
Ь =
Отрезок, отсекаемый прямой па осн ординат,
находится
значение у, соответствующее х — 0. Для этого иногда может пот ре боваться экстраполяция данных. Так, для прямой, изображенаm на рис. 8.11, выбирая уа = 2 и yL = 0, находим соответствующе значения х. — 7 и хх = 5, путем экстраполяции определяет:
а = —5 и с помощью формул (8.19) — (8.21) получаем, что и |х = 5.
Поскольку распределение минимальных значений типа 1
явля-
ется зеркальным отражением распределения максимальных зна ний, Для обоих распределений применяется одна и та же вероятностная бумага. Однако при построении графика для распределения минимальных значений упорядоченные наблюдения необходимо
располагать в обратном порядке, т. е. наибольшее значение наносится против (1 — Уа) 100/п, второе по величине значение — проги0 (2 — %)100/п и т. д. Оценки для параметров распределения находятся из графика как
Графическое представление вероятностей
333
(8.19а)
Н= —<
(8.20а)
1 этом случае значения у берутся по крайней левой шкале (в дан-( случае значение b будет отрицательным). При изучении полу-ного графика вероятностей и оценивании процентилей необхо-«о иметь в виду, что график дает значения функции 1 — F(x). s. вероятности появления наблюдений, превышающих х, а не тения функции F (х).
На рис. 8.11 показана также прямая, около которой группиру-:я наблюдения, имеющие распределение минимальных значений ia I с параметрами р. = 5 и а = 1. Проверяя метод нахождения шок для параметров, берем ух = 4 и уг = 0 и получаем х, = 1, = 5, считываем со шкалы а = 5, а затем с помощью формул
19а), (8.20а) и (8.21) находим, что а = 1 и ц = 5.
Более подробно построение графиков для распределения экст-лальных значений типа 1 рассматривается в книге Гумбеля [8.31. Бета-распределение и равномерное распределение. Поскольку а-распределение имеет два параметра формы, невозможно нзго-1ить универсальную вероятностную бумагу для бета-распределе-1, если не известны значения обоих параметров. Одним из частных гчаев является равномерное распределение, для которого вероят-:тную бумагу можно изготовить, просто взяв тетрадь в клеточку, я равномерного распределения предпочтительнее наносить >рядочеиные наблюдения против 100»7(л 4- 1), а не против - ’/а)100/л, по причинам, которые будут здесь изложены.
*
1овы построения графиков вероятностей
Для обсуждения основных принципов построения графиков оятностей необходимо уяснение смысла математического ожи-шя упорядоченного наблюдения. Допустим, что из совокупности 1лотностыо f (х) и интегральной функцией распределения F (х) то большое число выборок объемом л. После взятия каждой 5орки наблюдения упорядочиваются и обозначаются как х, = 1, 2,..., л), где ху —значение i-ro по величине наблюдения, пример, х3— значение третьего по величине наблюдения в дан-i выборке.
Так как х, — случайная величина, ее значение колеблется от гой выборки к другой в соответствии с некоторым распределени-математическое ожидание которого, обозначаемое как Е (х/,п).
334
Глава 8
называется математическим ожиданием i-ro по порядку наблюдения в выборке объемом п. Можно показать, что
£ К.) = J *•[f [1 - F W‘dF
4=1,2....n\ — CO <Х1<Ха<...<Хя < oo. ‘(8.22)
Например, если x — случайная величина, равномерно распредс ленная в интервале (0;1), т. е.
£(х) = х, 0<х<1, то формула (8.22) принимает вид
Е«фр ‘= I. 2,.. л.
Для многих распределений составлены таблицы математически:, ожиданий упорядоченных наблюдений (8.181. В тех случаях, когда невозможно точно определить £ часто используется следую щая аппроксимация:
'•у...) а-«-1.2................................».
(8.23 )
где£_| — такое значение х, что
т. е. это ^_2C.|,.jJ -й квантиль распределения, а с — число, зависящее от л и f(x) (см. далее).
Для одной выборки объемом п первое упорядоченное наблюдение х, является оценкой Е (х|.л) по одной выборке, хг являе: оценкой £ (х2.п) по одной выборке и т. д. Таким образом, упорядоченные наблюденные значения, нанесенные на график против своих математических ожиданий1’, будут располагаться почти по прямой с угловым коэффициентом, равным единице, проходящей через начало координат2’. Отклонения от прямой обусловливаются стаН
Ч Иногда вместо математического ожидания используются другие характеристики центра распределения, например медиана или мода.
!> Если для удобства графического построения производится линейное преобразование случайной величины, то начало координат н угловой коэф-фи цнент построенной прямой изменятся, однако сам график останется прямолинейным.
Графическое представление вероятностей
335
истическимн колебаниями выборок. Например, упорядоченные 1аблюдения в выборке равномерно распределенных случайных еличин, нанесенные на график против значений i/(n + 1), обра-уют почти прямую линию. Если берется выборка случайных вели-шн, имеющих не равномерное, а какое-либо иное распределение, Го нельзя ожидать, что график будет прямолинейным, так как Г(п 4- 1) уже не будет математическим ожиданием i-ro упорядо-енного наблюдения. Таким образом, линейность графика, на ко-ором наблюдения наносятся против’их математических ожида-ий, позволяет оценить адекватность выбранной модели.
Изготовление графической бумаги со специальными шкалами убавляет от необходимости вычислять математические ожидания ля многих распределений. Такая бумага имеет шкалы, позволимте наносить упорядоченные наблюдения на график непосредст-(/—с) 100
енно против значений без необходимости определять
; В предыдущих примерах, за исключением случая равно-1ерного распределения, подразумевалось, что с = Уг. В общем тучае точное значение с зависит от f (х) и п, однако для самых азличных распределений при различном объеме выборок оказа-юсь приемлемым значение с — Уг. Существует определенное проти-оречие, связанное с выбором с. Так, некоторые авторы предпочи-нот брать с = 0, что также имеет определенный смысл, Более одробмо этот вопрос рассматривается в других работах [8.3 ] —
Иногда вместо вычерчивания прямой па глаз рекомендуется существлятъ подбор прямой, соответствующей точкам на графике, етодом наименьших квадратов. Простой метод наименьших квад-атов в таком виде, как он описан в большинстве учебников по ^тематической статистике (18.8), [8.9]), не подходит в данном иучае, так как упорядоченные наблюдения не являются независимый вследствие ограничения: Х/+|> х, для всех I. Необходимо спользовать более сложный, так называемый обобщенный метод аименьших квадратов [8.101, [8.181. Однако обычно такие до лол-нтельпые усилия не оправданы, так как в конечном счете должно сниматься субъективное решение.
.2. ПРОВЕРКИ ДОПУЩЕНИЙ О РАСПРЕДЕЛЕНИЯХ
ведение
Статистическая проверка допущения о распределении позволяет бъективно оценить, обеспечивает ли принятая модель достаточно Очное описание наблюдаемых данных. Обычно проверка включает ледующие основные этапы:
336
Глава 8
1. На основе полученных данных вычисляется некоторое числи называемое критерием согласил.
2. Определяется вероятность получения вычисленного критерия при условии, что модель выбрана правильно. Часто это выполняется путем обращения к таблице процентилей распределен;! критерия.
3. Если вероятность получить вычисленное значение критери мала, мы заключаем, что принятая статистическая модель Не даен правильного описания данных. Что означают слова «малая вероятность», зависит от мнения потребителя н последствий, вызываемы отклонением модели. Часто считается «малой» вероятность, равная 0.10, 0,05 или даже меньше. Если же вероятность получен;; вычисленного критерия, не «мала», то данные не дают оснований счи тать, что принятая модель не подходит.
Следует четко представлять себе, что хотя эта методика позволь ет отвергнуть модель как неправильную, она не позволяет доказана что модель верна. Исход статистического испытания в значите, и ной мере зависит от количества имеющихся данных: чем больше данных, тем больше шансов отвергнуть неправильную модель Если данных очень мало, то часто бывает невозможно установить неадекватность даже такой модели, которая существенно отличается от принятой.
Разработано множество критериев для оценки справедливое; п принятых допущений о распределениях. Некоторые критерии справедливы лишь для определенных моделей, другие применимы для широкого круга распределений. Многие методы требуют точного знания каждого параметра статистической модели. Поскольку в большинстве технических задач параметры неизвестны, яО должны оцениваться, такие критерии здесь не рассматриваются. Из остальных методов мы рассмотрим только два: так называемый критерий F, который разработали Шапиро и Уилк, и критерий хи-квад| ы Шапиро и Уилк [8.11 ] приводят библиографию по другим критериям.
Здесь будет показана проверка допущений о нормальном (или логарифмически нормальном) и экспоненциальном распределениях с помощью критерия IF. Критерий хи-квадрат можно использовать для проверки любого распределения, в том числе нормального и экспоненциального. Однако для этих двух статистических моделей критерий IF обычно является более мощным, т. е. он обеспечивает большую вероятность отбросить неправильную модель. Таким образом, когда имеются ограниченные данные, обычно для оценки справедливости допущения о нормальном или экспоненциальном распределении вместо критерия хи-квадрат целесообразно использовать критерий IF.
Графическое превставление вероятностей
роверки с помощью критерия W
Проверка допущения о нормальном или логарифмически нормаль->м распределении. В работе Шапиро и Уилка [8.11] показано, о проверка с помощью критерия W является эффективным мето-»м оценки справедливости допущения о нормальности для широко-। спектра ненормальных альтернатив, даже если число наблюдений •носительно невелико. Например, если берется 20 выборок из 1вокупности, имеющей экспоненциальное распределение, то, прн-;няя критерий W, с вероятностью 0,8 мы сделаем правильный овод, что в качестве статистической модели нельзя выбрать нор-тльное распределение1’.
Чтобы использовать критерий для случайной выборки объемом когда п'< 50, с наблюдаемьъми значениями Х(п,х(2), ..., л(я) поступи следующим образом:
ran 1. Располагаем полученные наблюдения таким образом, чтобы получить упорядоченную выборку значений xlt хг, .... хп, где х, <х2 <... <хп.
ran 2. Вычисляем
s У х:-----*^- . (8.24)
где х — эмпирическое среднее.
ran 3. Если п — четное число, принимаем k = л/2; если п — нечетное число, принимаем k = (л — 1)/2. Затем вычисляем
ь = О,, I*. - х.) + а„ (х._, - X,) + ... + (xw„ — x,J -
k
' = (8.25)
где значения а„_/. । для i= 1..... k берутся из табл. <Х,
помещенной в конце книги, для л = 3.....50. Заметим, что,
когда п — нечетное число, х*+1 не используется при вычислении.
:ап 4. Вычисляем критерий
&=-& (8.26)
’) Это результат для 5%-ного критерия, т. е. с вероятностью, равной 0.05, « можем ошибочно считать модель неадекватной, когда в действительности Усматриваемое распределение является нормальным.
г-52
338
Глава 8
Этап 5. Сравниваем вычисленное значение W с процентилями распределения этого критерия, показанными в табл. XI, приведенной в конце книги. Эта таблица дает минимальные значения IV', которые мы получили бы для вероятностей 1, 2, 5, 10 и 50"., при различных значениях п, если бы данные действительно имели нормальное распределение. Таким образом, малые значения W указывают на отсутствие нормальности. Напри мер, если значение W, вычисленное но формуле (8.26), меньше 5%-ного табличного значения, то вероятность того, >гт<. выборка взята из совокупности, распределенной по нормаль ному закону, не превышает 0,05. В этом случае можно еде лать вывод о том, что допущение о нормальном распределении не приемлемо.
Этап 6 (необязательный). Приближенную вероятность получен!!я вычисленного значения W при допущении о нормальном распределении случайной величины можно найти по формуле г = Т + ч1"(-Г=Т-)> <8-'7'
беря из табл. XI, помещенной в конце книги, значения . и е для соответствующего размера выборки, а затем с помощью табл. I определяется вероятность получить значение нормированной нормальной случайной величины, меньшее или равное г. Полученная величина и есть приближенна;; вероятность того, что такая выборка могла быть взята из нормально распределенной совокупности1).
Применение критерия W иллюстрируется па следующем примере. Были получены следующие данные о расходе бензина случайно выбранными десятью автомобилями стандартных размеров при поездке из Нью-Йорка в Сан-Франциско и обратно по стандартному маршруту: 474, 303, 461, 457, 583, 469, 406, 515, 338 и 48? галлонов. Для оценки допущения о нормальности распределения количества потребляемого бензина на основе данной выборки использовался критерий 117.
Этап 1. Располагаем полученные значения в порядке возрастания: хг = 303; ха = 338; х3 = 406; х4 = 457; х5 =461; хв = 469; х, = 474; х8 = 489; х# = 515; х10 =583.
Этап 2. С помощью формулы (8.24) вычисляем
S*=208l 131— (lH,71’ =60628.
О Из приведенных выражений читатель, возможна, заметил, что в данной методике в качестве распределения критерия IV используется аппроксимирующее распределение Sb Джонсона (см. гл. б).
J
Графическое представление вероятностей
339
3. Так как п = 10. полагаем k = 5. Из табл. X находим: а10— 0,5739; ёв= 0,3291; .... о0= 0,0399. Используя формулу (8.25), получаем
b = 0,5739 (583 — 303) + 0,3291 (515 — 338) + ...
... + 0,0399(469 —461) = 239,113.
4. По формуле (8.26) находим
5. Вычисленное значение W превышает табличное 50%-ное значение W = 0,938, полученное из табл. XI для п = 10.
6. Из табл. XII находим, что для л = 10 f = —3,262, ?| = 1,471 и е = 0,3660. Подставляя эти значения в формулу (8.27), получаем
0,943 — 0,366 1—0,943
z = —3,262+ 1,-Из табл. I находим
P{z<0,143| =0,557.
Таким образом, приближенная вероятность получить число, не превышающее вычисленное значение W, если выборка берется из нормально распределенной совокупности, оказалась равной 0,557. Поскольку эта вероятность высока, мы заключаем, что вследствие наличия ограниченных данных нет оснований отвергать допущение о том, что количество бензина, потребляемого различными автомобилями на определенную поездку, будет достаточно точно описано норм а л ьн ым р аспределением.
Критерий W можно также использовать для оценки допущения о справедливости логарифмически нормального распределения. В данном случае критерий применяется к десятичным или натуральным логарифмам наблюдаемых значений. Это объясняется тем, что если логарифмы значений имеют нормальное распределение, то первоначальные наблюдения распределены по логарифмически нормальному закону (см. гл. 3). Далее приводится пример применения критерия № для оценки допущения о логарифмически нормальном распределении. Теоретическое обоснование применимости критерия № для проверки нормальности распределения и зго связь с графическим представлением вероятностей описаны в )аботе Шапиро и Уилка [8.11].
Критерий для проверки допущения об экспоненциальном распределении — начало отсчета известно (критерий №Е0). Экспонен-
Г лава 8
цнальное распределение |см. формулу (3.19)] можно обобщить на случай двухпараметрической модели, когда один параметр (X) является параметром масштаба распределения, а второй (ц) определяет начало распределения, т. е. точку, выше которой лежат все наблюдения. Плотность распределения имеет вид
f (х; X, ц) = Xe_x<*-il), jx<x-<oo, —оо < р < оо, Х>0.
(8-28) ' При последующем изложении будем считать, что параметр ц равен нулю. Эго условие не приводит к потере общности. Ес.и же параметр не равен нулю, но известен, то вычитаем ц из каждого наблюдения. Полученное распределение будет иметь начало в пулевой точке, и все последующие результаты будут справедлп вы. Критерий для случая, когда параметр р не известен, рассматривается ниже.
Методика оценки соответствия случайной выборки, содержащей от 7 до 35 наблюдений”, экспоненциальному распределению : нулевым центром называется проверкой с помощью критерия WEU и состоит в следующем.
Этап 1. Вычисляем критерий
. (М
GS*)
где х, (t = 1, 2, ..., л) — п наблюденных значений, а х — эмпирическое среднее.
Этап 2. Определяем, не находится ли вычисленное значение WE0 вне 95%-ного и 90%-пого интервалов, показанных в табл. XIII, при различных значениях п. Это двусторонний критерий, т. е. слишком малые и слишком большие ^значения указывают на отсутствие экспоненциальности21. Таким образом, если вычисленное значение IFE0 лежит вне 95%-ного интервала, то вероятность того, что рассматриваемая выборка взята из совокупности, распределенной по экспоненциальному закону с принятым началом отсчета, составляет менее 0,05. Значения WE0, лежащие вне 90%-ного интерва-
|) Для выборок другого объема еще не составлены таблицы для npouei тилей распределения критерия IFE,,. ..
2> 90%-ный интервал заключен между 5-м и 95-м процентилями Pac"[L деления критерия, если дзнные распределены по экспоненциальному зако У-
Графическое представление вероятностей
ла, рассматриваются аналогично, но в этом случае вероятность не превышает 0,1.
Рассмотрим следующий пример. В десяти полигонных испытаниях системы слежения, используемой для сопровождения объектов. были получены следующие ошибки, выраженные в градусах: 0,09; 0,10; 0.13; 0,15; 0,16;.0,19; 0,20; 0,21; 0,23 и 0,27. Требуется определить, справедливо ли принятое на основе этих данных допущение о том, что эта случайная величина распределена по экспоненциальному закону. Так как наименьшая возможная ошибка равна нулю, полагаем р= 0 и применяем критерий WE0. Из имеющихся данных находим, что
Хх,= 1,73, 254=0,3291 и п-10.
Т=1 .-=1 ‘
По формуле (8.29) вычисляем
= 0.0,9.
Из табл. XII находим, что для л = 10 критерий WE0= 0,010 значительно меньше нижней границы 95%-ного интервала, равной 0,025. Таким образом, вероятность того, что ошибка определения местоположения распределена по экспоненциальному закону с математическим ожиданием = 0, меньше 0,05.
Более подробно этот критерий и его теоретическое обоснование рассматриваются в неопубликованной работе Шапиро и Уилка 18.171.
Критерий для проверки допущения об экспоненциальном распределении — начало отсчета неизвестно (критерий WE). Для проверки справедливости допущения о том, что данная выборка, содержащая от 7 до 35 наблюдений11, взята из совокупности, имеющей экспоненциальное распределение (8.28), когда оба параметра ц и >. неизвестны, используется следующая мегодика, называемая проверкой с помощью критерия WE.
Этап 1. Вычисляем критерий
<7 ,)> ( ""‘-"Г
WE = - <-'> = , (8.30)
fc, (йН
‘ Л
[ О Для выборок другого объема еще не составлены таблицы для процентилей распределения критерия WE.
342
Г лава 8
где хг (Z == 1, 2.п) —_п наблюденных значений, xt ~
наименьшее значение, а х — эмпирическое среднее.
Этап 2. Сравниваем вычисленное значение WE с 95%-ным ц 90%-ным интервалами, данными в табл. XIV в конце этой книги. Это двусторонний критерий, т. е. слишком большие и слишком малые значения указывают на отсутствие экспо-ненцнальности. Так, если вычисленное значение лежит вне 95 %-кого или 90%-ного интервала, то вероятность того, что наблюдаемое значение взято из экспоненциально распределенной совокупности, соответственно меньше 0,05 или 0,1.
Используя пример о системе слежения, определим, возможно ли применение экспоненциального распределения с произвольным центром в качестве статистической модели для ошибки определения местоположения объекта. По формуле (8.30) находим, что
- Ш.73/10)-0,091» _ 0 23.
0,3291— [(1,73)»/10]
Используя табл. XIV, видим, что верхняя граница 90%-ного интервала для WE равна 0,231, т. е. вероятность того, что эти данные распределены по экспоненциальному закону, составляет лишь 0,1. Таким образом, экспоненциальное распределение с двумя параметрами неприемлемо в качестве статистической модели для ошибки местопол ожени я.
Более подробно теоретические аспекты этого критерия рассматриваются в неопубликованной работе Шапиро и Уилка [8.171-Другой пример. Применение критерия F для проверки справедливости допущения об экспоненциальном и логарифмически нормальном распределениях иллюстрируется на следующем примере, подчеркивающем важность проверки допущений о распределениях.
В табл. 8.5 приводятся данные о времени безотказной работы для 20 систем наведения. На основе этих данных предполагается определить надежность системы при работе в течение десяти часов, считая, что время безотказной работы распределено по экспоненциальному закону с — 0. Прежде чем проводить анализ, было решено использовать критерий WE0 для проверки справедливости принятого допущения.
Из имеющихся данных получаем
=2972794, Ёх, = 4444, и=20.
Графическое представление вероятностей
3-13
По формуле (8.29) вычисляем
=OJOO
Из табл. XII находим, что 95%-ный интервал для п = 20 лежит от 0,021 до 0,090. Так как вычисленное значение 1ГЕ0 находится вне этого интервала, вероятность того,’что полученные данные могут иметь экспоненциальное распределение, составляет менее 0,05.
Надежность системы слежения при работе ее в течение 10 час при экспоненциальном распределении времени безотказной работы можно вычислить как
ю
P„=l—F(10; k)= 1—J О
Вместо неизвестного параметра X в этом уравнении используется оценка >., вычисленная на основе полученных данных. По формуле (3.43) эта оценка находится как отношение общего числа отказов к общему времени испытаний:
л 20
X = —_= 0,0045. 4444 ’
Таким образом, оценка надежности системы равна е<-o.oo4S)to= = 0,9560. Однако полученный результат неверен, поскольку он основан на модели, которая оказалась неприемлемой. Изучение данных показывает, что в действительности менее чем за 10 час произошло четыре из 20 отказов.
Таблица 8.5
Время безотказной работы для 20 систем наведения, час
1 20 95 268
4 40 106 459
5 40 125 827
6 60 151 840
15 93 200 10S9
Рассмотрим другую модель. Из физических соображений предполагаем, что для описания времени безотказной работы может подойти логарифмически нормальное распределение. Эту гипотезу можно проверить с помощью критерия IV7 для нормального распре
344
Глава 8
деления, беря вместо первоначальных наблюдений десятичные или натуральные логарифмы времени безотказной работы.
С помощью формул (8.24) — (8.26) получаем
ю
S (tfaa-r+i — Уй
где i/z — логарифм i-ro упорядоченного наблюдения, а значения а, берутся из табл. X. Для имеющихся данных находим, чт< Г = 0,9625.
Подставляя в формулу (8.27) значения f = —5,153, iq = 1.801 и е = 0,2359, полученные из табл. XII для п = 20, определяем приближенную вероятность того, что найденное значение IV' меш. ше вычисленного, считая, что истинным распределением являете логарифмически нормальное. Эго приводит к значению г = 0,19 Из табл. I находим, что искомая вероятность равна Р (г <. 0,19) -= 0,57. Таким образом, на основе этих данных логарифмически нормальное распределение оказывается приемлемой моделью для времени безотказной работы. Надежность системы при работе е< в течение 10 час, основанная па этой модели, равна
Pw = 1 — F(ln 10; |х, в) =
In ю
= I - J (2'»=)"’'' “Р [ - Т “И-
Вместо неизвестных параметров ц и а используются их выборочно, оценки. С помощью формул (6.13а) н (6.13в) для этих данных полу-
чаем |х 4,15 и s = 1,93. Таким образом, нам нужна вероятно, i того, что нормированная нормальная случайная величина прини мает значение, превышающее
Из табл. I находим, что эта вероятность равна 0,83. Эта Оценка безотказной работы системы в течение 10 час существенно отличается от полученной при допущении об экспоненциальном распредели' нии времени безотказной работы и находится в лучшем согласии с полученными данными.
Графическое представление вероятностей
34
Критерий согласия хи-квадрат
Введение. Наиболее давно и широко используемой и, по-видимому, наиболее гибкой методикой оценки допущений о распределениях является проверка с помощью критерия хи-квадрат. Для применения этого критерия полученные данные группируются по интервалам частот и сравниваются с ожидаемым числом наблюдений для принятого распределения. На основе этого сравнения вычисляется критерий, который приближенно следует распределению хи-квадрат (см. гл. 3) только в том случае, если модель выбрана правильно. Если модель выбрана неправильно, то значение критерия превысит значение случайной величины, распределенной по закону хи-квадрат. Чтобы определить, не находятся ли полученные данные в явном противоречии с принятой моделью, можно использовать табл. IV (помещенную в конце книги), которая дает процентили распределения хи-квадрат. Конкретный пример вычислений описан ниже; читатель, интересующийся этим вопросом, включая теоретическое обоснование метода, более подробно, отсылается к работе Кочрена 18.141.
Основным преимуществом критерия хи-квадрат является его гибкость. Его можно легко использовать для проверки допущения о любом распределении, даже не зная значений параметров распределения. Основными его недостатками являются нечувствительность к обнаружению адекватной модели, когда число наблюдений невелико, и зачастую необходимость группирования данных по произвольным интервалам, что может оказать влияние на результат проверки.
Порядок работы. Проверка с помощью критерия хи-квадрат производится следующим образом:
Этап 1. Находим оценки для каждого из неизвестных параметров принятого распределения. После того как полученные данные будут сгруппированы по интервалам, следует использовать точный метод максимального правдоподобия. Однако на практике для удобства к исходным данным могут быть применены различные методы нахождения оценок параметров, рассмотренные в этой книге.
Этап 2. Разделим полученные данные на k интервалов и определим вероятность попадания в каждый интервал случайной величины, имеющей принятое распределение. Рассмотрим два метода выполнения этой работы. Первый из них применяется в том случае, когда данные первоначально были распределены по интервалам или могут быть разбиты по этим интервалам естественным образом. Это будет иметь, место в случае дискретного распределения, например пуассоиовско-
346
Г лава 8
го. Второй метод применяется, когда данные первоначально не разбиваются на интервалы.
Метод 1. Число интервалов k, на которые разбиваются полученные данные, подчиняется требованию, чтобы для принятой модели ожидаемое число наблюдений в каждом интервале (см ниже) было не менее пяти. Если в каком-либо интервале число наблюдений окажется меньше пяти, то его нужно объединить с соседним интервалом (или интервалами) таким образом, чтобы ожидаемое число наблюдений в объединен ном интервале было не меньше пяти1 2’.
Пусть CL, и CUt обозначают соответственно нижнюю и верхнюю границы Лго интервала. Затем для нахождения оценки
P(CLl^x<CUl), i=l,2, (8.31)
т. е. вероятности попадания случайного наблюдения в каж дый из интервалов, используется принятое распределение (с использованием оценок для параметров).
Метод 2. В данном случае выбор k более произволен. Когда число наблюдений п велико (например, более 200), одно из возможных правил состоит в выборе в качестве k целого числа, ближайшего к
K'-4[0,75(n—I)1]’'1 (8.32)
(8.12), [8.15]. При умеренных значениях п одно хорошее правило выбора k состоит в выборе как можно большего значения k при условии, что оно не должно превышать п/5:>. Границы интервала xt, х2, хк определяются с помощью теоретического распределения (с использованием оценок параметров) как такие значения, что
Р(х<х.) = Ilk, Р(х<х,)=4-.........Р(х<хЬ1) =
Нижняя граница первого интервала и верхняя границ:.’ последнего интервала являются соответственно наименьшим и наибольшим значениями, которые может принимать слу
1) Зачастую это означает, что предельные наблюдения должны объединяться п критерий оказывается нечувствительным к отклонениям от принятой модели для крайних значений распределения. В связи с этим некоторые авторы предлагают брать меньшие интервалы и в определенных случая соответствующим образом корректировать вычисленное значение | о > 4
2) Отсюда ожидаемое число наблюдений на интервал меньше пяти, см-, впрочем, предыдущую сноску.
Графическое представление вероятностей
347
чайная величина. Мы установили границы интервалов таким образом, что для каждого интервала вероятность попадания случайной величины в данный интервал оценивается как Ilk.
Этап 3. Умножаем каждую вероятность попадания наблюдений в интервал на объем выборки п. Получаем математическое ожидание Е( числа наблюдений в каждом интервале для принятой теоретической модели. Применяя первый метод, находим Е„ умножая вероятности (8.31) на л. Для второго метода
(=1,2.......II. (8.33)
Этап 4. Если данные не были предварительно табулированы, подсчитываем число наблюдений в каждом интервале. Обозначаем это число как М,, где i = 1,2......k. В противном случае
находим М, непосредственно.
Этап 5. Вычисляем критерий
Х‘=2 (8.34)
Заметим, что при использовании второго метода это выражение проще:
Х*--г(2 ' (8-35)
Этап 6. Сравниваем вычисленное значение у® с табличными процентилями для распределения хи-квадрат (табл. IV), беря k — —г—1 степеней свободы, где г—число параметров, оценки которых находились па этапе 1. (Более полные таблицы процентилей распределения хи-квадрат даются в книге Хартера 18.161.) Большие значения у2 означают, что наблюденные данные противоречат принятой модели. Например, если вычисленное выше значение у1 превышает табличное значение хи-квадрат для а = 0,95, то вероятность того, что полученные данные имеют принятое распределение, не превышает 0,05, н модель часто отвергается как не удовлетворяющая требованиям. В этом случае полезно сравнить фактические частоты с ожидаемыми, чтобы увидеть, какие интервалы оказывают наибольшее влияние на величину у/. Это сравнение показывает характер отклонений от принятой модели.
348
Глава 8
Критерий хи-квадрат будет использован для оценки приемлемости экспоненциального распределения в качестве модели для времени безотказной работы систем наведения, данные по которым приведены в табл. 8.5. В этом примере данные не сгруппированы естественным образом, поэтому для разбиения данных по интервалам используется второй метод.
Порядок проверки состоит в следующем:
Этап J. Используя методы, рассмотренные в гл. 3, ранее мы полу
чили X = 0,0045.
Этап 2. Так как п = 20, формула"(8.32) неприменима. Вместо этой число интервалов k выбирается равным л/5, поэтому /г = = 20/5 — 4. Согласно формуле (3.20), функция экспоненциального распределения имеет вид л (/; X) = 1 — e~fl Границы интервалов находим, полагая
P(x<jrJ=l =-Ц = 0,25,
Р (,v < х,) = 1 _ >= JL _ 0,50,
P(x<xs)=l =-Ц = 0,75
и решая эти уравнения относительно xlt х2 и х3.
Так, х, = 64, ха — 154 и х3 = 308. Так как экспоненциально распределенная случайная величина (при |j. = 0) изменяется от 0 до «>, нижняя граница первого интервала равна нулю, а верхняя граница последнего интервала равна «5. Вероятность попадания случайной величины в любой из интервалов равна 0,25.
Эгап 3. Математическое ожидание числа наблюдений в интервале для принятой теоретической модели находится по формуле (8.33) и составляет Е, — rilk = 5 для i = 1, 2, 3, 4.
Этап 4. Фактическое число наблюдений /И; в г-м интервале находится непосредственно по исходным наблюдениям в табл. 8.5. Сравнение с Et дается в табл. 8.6.
Этап 5. Используя формулу (8.35), находим критерии хи-квадрат
(9s + 5s + 2“ + 4») — 20 = 5,2.
Графическое представление вероятностей
349
Таблица 8.6
Сравнение фактических и ожидаемых данных, сгруппированных в интервалы, при допущении об экспоненциальном распределении времени безотказной работы системы наведения
Интервал Фактическое число наблюдений ЛЦ Ожидаемое числб наблюдений для выбранной модели Е[
0-63,9 9 5
64,0—153,9 5 5
154,0—307.9 2 5
308,0 к более 4 5
Этап 6. Так как на основе имеющихся данных находилась оценка только одного параметра, то г = 1, поэтому число степеней свободы рассматриваемой случайной величины, распределенной по закону хи-квадрат, равно k—г— 1 = 4— 1—I = — 2. Обращаясь к табл. IV, для двух степеней свободы находим
Р (Z’(2) > 6,0) = 0,05
или
P1Z? (2) >4,6) = 0,10.
Следовательно, вероятность получить значение у_2= 5,2 для принятой теоретической модели заключена между 0,05 и 0,10. Таким образом, вероятность того, что полученные наблюдения распределены по экспоненциальному закону, мала. Из табл. 8.6 также видно, что наибольшие отклонения от принятой модели наблюдаются в области наименьших значений, т. е. в области, представляющей наибольший интерес в данной задаче.
Рассмотрим еще одну задачу, иллюстрирующую случай, когда данные были первоначально сгруппированы. В мастерской по ремонту клистронов должна быть разработана новая система регулирования запасов, обеспечивающая минимальные издержки. Одним из требуемых видов входных данных является число деталей, используемых каждую неделю. Предполагается, что оно подчиняется закону Пуассона. Чтобы оценить приемлемость этой модели, данные за год о недельной потребности, показанные в первых двух столбцах табл. 8.7, проверялись с помощью критерия хи-квадрат,
Порядок проверки состоит в следующем:
350
Глава 8
Таблица 8.7 Фактический еженедельный расход деталей определениого типа в течение года я ожидаемый расход при выборе пуассоновского
распределения
Число деталеЯ, расходуемых за неделю Ожидаемое число недель при выборе пуассоновского распределения
педель Л1(
0 18 15,7
18 18,8
2 8 11,3
3 5| 4,5 |
4 2| 8 1.4 6,2
5 0.3 1
Всего 52 52
Этап 1. По формуле (4.10) оценка параметра пуассоновского распределения находится как отношение числа использованных деталей к числу недель:
Ч-и
Этап 2. Интервалы образуются естественным образом в зависимости от числа деталей, израсходованных за неделю: 0, 1 и т. д. Ожидаемые вероятности для каждого интервала находятся из таблиц для пуассоновского распределения [4.8] при
2
3
4
5 и более
0,301
0,361
0,217
0,087
0,026
0,007
Этап 3. Умножая эти вероятности на 52, получаем математическое ожидание Е,, показанное в третьем столбце табл. 8.7. В последних трех интервалах математическое ожидание меньше пяти, поэтому как фактические, так и ожидаемые значения для этих интервалов объединяются.
Этап 4. Находим число Л1( фактических наблюдений в каждом интервале, показанное во втором столбце табл. 8.7.
Графическое представление вероятностей 351
Этап 5. Па формуле (8.34) вычисляем критерий хи-квадрат:
. (18—15)7)* , (18-18,8)» , (8-11,3)» , (8-6,2)» _ .
* ~ 15,7 *“ 18,8 11,3 "г 6,2 ’ '
Этап 6. Применяя интерполяцию, из табл. IV для 4—1 — 1=2 степеней свободы находим, что вероятность Р(уг (2) > 1,86) приближенно равна 0,4. Таким образом, наблюденные данные не противоречат допущению о пуассоновском распределении недельного расхода деталей.
ЛИТЕРАТУРА
8.1. W i 1 k М. В., G п а п a d е s 1 к а в R., Н и у е 11 М. J., Probability Plots For the Gamma Distribution. Technometrics. 4. 1 (1962).
8.2. Kao J. H. K-, A Summary of Some New Techniques on Failure Analysis, Proc. 6th. Nat. Syrnp. Reliability Quality Control in Electronics, pp. 190—201, 1960.
8.3. Gurebel E. J., Statistics of Extremes, Columbia University Press, New York, 1958. Имеется русский перевод: Гуибель Э., Статистика экстремальных значений, изд-во <Мир». 1965.
8.4. Blom G-, Statistical Estimates and Transformed Beta-Variables, John Wiley. New York, 1958.
8.5. C h e г n о i f FL, Lieber man G. J.. Use of Normal Probability Paper, J. Am. Statist. Assn , 49. 778 (1954).
8.6. Harter H. L., Expected Values of Normal Order Statistics, Biometrika, 48, 1951 (1961).
8.7. Kimball В. I-'., On the Choice of Plotting Positions on Probabilily Paper, J. Am. Statist. Assn., 55, 546 (1960).
8.8. D a v ie s O. L., Statistical Methods in Research and Production, 3rd ed.. Hafner, New York, 1957.
8.9. DixonW. J.. Massey F. J., Introduction to Statistical Analysis, 2nd ed., McGraw-Hill, New York. 1957.
8.10. Aitken A. C., On Least Squares and Linear Combination of Observations, Proc. Royal. Soc. Edinburgh, 55. 42 (1935).
8.11. S h a p i г о S. S., W i 1 k M. B-, An Analysis of Variance Test for Normality (complete samples). Biometrika, 52, 591 (1965).
8.12. Wi lliams C. A., On the Choice of the Number and Width of Classes for the Chi-square Test of Goodness of Fit, Jour. Am. Stat. Assn., 45. 77 (I960). , , „
8.13. Bartholomew D. .1.. Testing for Departure from the Exponential Distribution, Biometrika, 44. 253 (1957).
8.14. Cochran W. G.. The у» Test of Goodness of Fit, Ann. Math. Statist.. 23, 315 (1952).
8.15. Mann IT. B-. Wai d A., On the Choice of the Number of Intervals in tire Application of the Test, A nn. Math. Statist., 13, 306 (1942).
8.16. Harter H. L.. New Tables of the Incomplete Gamma-Function Ratio and of Percentage Points of the Chi-square and Beta Distributions, Aerospace Research Laboratory, U. S. Air Force, Dayton, Ohio. 1964.
8.17. ShapiroS. S., W i 1 k M. B., Testing for Distributional Assumptions — Exponential and Uniform Distributions (неопубликованная рукопись). _ ,
8.18. SarhanA. E„ Gr eenberg B. G., Contributions to Order Statistics. John Wiley, New York, 1962.
_ ТАБЛИЦЫ к>
Значения интегральной функция нормированного нормального распределения1) 7?(!/) = (21!) ’ je Z,,idz </0.00(0,01)4,99 Таблица 1
и 0.00 0,0i 0,02 0,03 0.04 0.06 0.06 0.07 0,08 0,09
0,0 0,1 0,2 0.3 0,4 0.5000 0.5398 0,5'93 0.6179 0,6554 0,5040 0.5438 0,5832 0.6217 0,6591 0,5080 0,5478 0,5871 0.6255 0,6628 0,5120 0,5517 0,5910 0,6293 0,6654 0,5160 0,5557 0,5948 0,6331 0,6700 0,5199 0,5596 0,5987 0,6368 0,6736 0,5239 0,5636 0,6026 0,6406 0,6772 0,5279 0.5675 0,6064 0,6443 0,6808 0,5319 0,5714 0,6103 0,6480 0,6844 0,5359 0.5753 0,6141 0.6517 0,6879
0,5 0.6 0.7 0,8 0,9 0,6915 0.7257 0.7580 0.7881 0,8159 0,6950 0,7291 0,7611 0,7910 0,8186 0.6985 0,7324 0.7642 0.7939 0,8212 0.7019 0.7357 0,7673 0,7967 0,8238 0.7054 0.7389 0,7703 0,7995 0.8264 0,7088 0,7422 0,7734 0,8023 0,8289 0,7123 0,7454 0,7764 0,8051 0,8315 0,7157 0,7486 0,7794 0,8078 0,8340 0,7190 0,7517 0.7823 0,8106 0,8365 0,7224 0,7549 0,7852 0,8133 0,8389
1,0 1.1 1.2 1.3 1,4 0,8413 0,8643 0,8849 0,90320 0,91924 0,8438 0,8665 0,8869 0,90490 0,92073 0,8461 0,8686 0.8888 0,90658 0,92220 0.8485 0,8708 0,8907 0.90824 0,92364 0,8508 0,8729 0,8925 0,90988 0,92507 0,8531 0,8749 0.8944 0,91149 0,92647 0,8554 0.8770 0,8962 0,91309 0,92785 0,8577 0,8790 0,8980 0,91466 0,92922 0.8599 0,8810 0,8997 0.91621 0,93056 0,8621 0,8830 0,90147 0,91774 0,93189
1.5 1,6 1,7 1.8 1.9 0,93319 0.94520 0.95543 0,96407 0,97128 0,93448 0,94630 0,95637 0,96485 0.97193 0.93574 0,94738 0,95728 0.96562 0.97257 0.93699 0.94845 0,95818 0.96638 0,97320 0,93822 0,94950 0,95907 0,96712 0,97381 0.93943 0,95053 0,95994 0,96784 0,97441 0,94062 0,95154 0,96080 0,96856 0,97500 0,94179 0,95254 0,96164 0,96926 0,97558 0,94295 0,95352 0.96246 0,96995 0,97615 0,94408 0,95449 0,96327 0.97062 0,97670
2,0 2.1 0,97725 0,98214 0,98610 0,97778 0,98257 0,08645 0,97831 0.G830J) 0,98679 0,97882 0,98341 0.98713 0,97932 0.98382 0,98745 0,97982 0,98422 0,98778 0.98030 0,98461 0,98809 0,98077 0,98500 0,98840 0,9812-1 0,98537 0,98870 0,98169 0.98574 0,98899
2,3 0.98928 0,98956 0,98983 0,9*0097 0,9’0358 0,9*0613 0,9*0863 0,9*1106 0,9*134-1 0,9*1576 0,9=3613
2,4 0,9'-'J 802 0.9’2024 0,9*2240 0,9’2451 0,9=2656 0,9*2857 0,9*3053 0,9*3244 0,9=3431
2,5 1.9’3790 0,9’3963 0,94132 0,9*4297 0,9*4457 0,9*4614 0,9*4766 0,9*4915 0,9*5060 0.9*5201
2,6 0.9’5339 0,0’5473 0,9’5604 0,9*5731 0,9*5855 0,9*5975 0,9’6093 0,9=6207 0.9*6319 0,9*6427
2,7 ), 9’6533 0,9’6636 0,9’6736 0,9*6833 0,9*6928 0,9*7020 0,9*7110 0,9=7197 0,9*7282 0,9*7365
2,8 ), 9-7445 0,9’7523 0,9’7599 0,9*7673 0,9*7744 0,9*7814 3,9=7882 0.9*7948 0,9=8012 0,9=8074
2,9 0.9’8134 0,9’8193 0,9’8250 0,9*8305 0,9*8359 0,9=8411 0,9*8462 0,9*8511 0,9*8559 0,9*8605
3,0 0.9’8650 0,9’8694 0.9’8736 0.9*8777 0,9*8817 0,9*8856 0,9*8893 0.9*8930 0,9=8965 0,9’2636 0,9*8999
3,1 ), 9*0324 0,9’0646 0,9*0957 0.9я1260 0,9’1553 0.9’1836 0,9*2112 0,9’2378 0.9’2886
3,2 ), 9’3129 0,9’3363 0,9’3590 0,9*3810 0,9’4024 0.9’4230 0,9’4429 0,9’4623 0,9’4810 0,9’4991
3,3 1.9’5166 0,9’5335 0,9’5499 0.9’5658 0,9’5811 0,9’5959 0,9’6103 0,9’6242 0,9’6376 0,9’6505
3,4 0.9’6631 0,9’6752 0,9’6869 0,9’6982 0,9’7091 0,9’7197 0,9’7299 0,9’7398 0,9’7493 0,9’7585
3.5 0,9’7674 0,9*7759 0,9*7842 0,9’7922 0,9*7999 0,9’8074 0,9’8146 0,9*8215 0,9*8282 0,9’8347
3,6 1,9’8409 0,9’8469 0,9’8527 0,938583 0,9’8637 0,9’8689 0,9’8739 0,9’8787 0,9’8834 0,9’8879
3,7 1,9’8922 0,9*8364 0,9’0039 0,9'0426 0,9'0799 0,94158 0,9'1504 0,9'1838 0,9'2159 0,9'2468
3.8 1,9’2765 0,9'3052 0.9’3327 0,9’3593 0,9'3848 0,9'4094 0,9'4331 0,9'4558 0,9'4777 0,9'4988
3.9 0,9’5190 0,9’5285 0,9’5573 0,9’5753 0,9'5926 0,9'6092 0,9'6253 0,9'6406 0,9'6554 0,9'6696
4,0 0,9’6833 0,9’6964 0,9'7090 0,9’7211 0,9*7327 0,9'7439 0,9'7546 0,9'7649 0,9'7748 0,9'7843
4,1 1.9'7934 0,9'8022 0,9’8106 0,9’8186 0,9'8263 0,9'8338 0,9'8409 0.9'8477 0,9'8542 0.9'8605
4,2 1,9’8665 0,9*8723 0,9'8778 0,9’8832 0,9'8882 и.9'8931 0,9'8978 0,9’0226 0,9’0655 0,9*1066
4,3 1,94460 0,94837 0,9’2199 0.9--2545 0,9*2876 0.9’3193 0,9*3497 0.9’3/88 0.9’4066 0,9-4332
4.4 0,94587 0,9’4831 0,9’5065 0,9’5288 0,9’5502 0,9’5706 0,9*5902 0,9*6089 0,9'6268 0,9’6439
4,5 0.9’6602 0.9*6759 0,9=6908 0.9’7051 0.9’7187 0,9’7318 0,9’7442 0,9’7561 0.9’7675 0,9’7784
4.6 1.9’7888 0,9*7987 0.9*8081 0,9’8172 0,9’4258 0,9*8340 0,9*8419 0,9’8494 0,9’8566 0,9’8634
4,7 1.9’8699 0,9’8761 0,9’8821 0,9’8877 0,9’8931 0,9’8983 0,9*0320 0,9’0789 0,9’1235 0,9’1661
4.8 1.9’2067 0,9’2453 0,9’2822 0,9*3173 0,9’3508 0,9’3827 0,9*4131 0,9’4420 0,9’4696 0,9*4958
4.9 0,9’5208 0,9’5446 0,9’5673 0,9’5889 0,9’6094 0,9’6289 0,9’6475 0,9’6652 0,9’6821 0,9’6981
О Из книги Haiti A.. Statistical Tables and Formulas, John Wiley, 1952.
354
Таблица ll
Значения коэффициента 1ду>я_]. используемого для вычисления двустороннего доверительного интервала для математического ожидания1)
ДУ n — I 0,90 0,95 0.99
1 6,314 12,71 63,66
2 2,920 4.303 9,925
3 2,353 3,182 5,841
4 2,132 2,776 4,604
5 2,015 2.571 4,032
6 1,943 2,447 3.707
7 1.895 2,365 3,499
8 1,860 2.306 3,355
9 1,833 2,262 3,250
10 1,812 2,228 3,169
11 1,796 2,201 3,106
12 1,782 2.179 3,055
13 1,771 2,160 3,012
14 1,761 2,145 2,977
15 1,753 2,131 2,947
16 1,746 2,120 2,921
17 1,740 2,110 2,898
18 1,734 2,101 2,878
19 1,729 2.093 2,861
20 1.725 2.086 2,845
21 1,721 2,080 2,831
22 1,717 2,074 2,819
23 1,714 2,069 2,807
24 1,711 2,064 2,797
25 1,708 2,060 2,787
26 1,706 2,056 2,779
27 1,703 2.052 2,771
28 1,701 2,048 2,763
29 1,699 2.045 2,756
30 1,697 2,042 2,750
40 1 .684 2,021 2,704
50 1,676 2,009 2,678
60 1,671 2,000 2.660
80 1,664 1,990 2,639
100 1,660 1,984 2,626
200 1,653 1,972 2,601
500 1.648 1,965 2,586
°° 1,645 1,960 2,576
Большая часть этой таблицы с разрешения автора и издателей перепечатана из книги F I s h е г R. Л., Yales F., Statistical Tables. Oliver and Boyd. Edinburgh. England, 1953.
355
Таблица HI
Значения коэффициента <ду, n_jr используемого для вычисления одностороннего доверительного интервала для математического ожидания1)
a — ДУ 0.90 0.95 0.99
I 3,078 6,314 31,82
2 1,886 2,920 6,965
3 1,638 2,353 4,541
4 1,533 2,132 3,747
5 1.476 2.015 3,365
6 1,440 ,943 3,143
7 1,415 ,895 2,998
8 1,397 ,860 2,896
9 1,383 ,833 2,821
10 1,372 ,812 2,764
11 1,363 ,796 2,718
12 1,356 ,782 2,681
13 1,350 ,771 2,650
14 1,345 ,761 2,624
15 1,341 ,753 2,602
16 1,337 .746 2,583
17 1,333 ,740 2,567
18 1,330 ,734 2,552
19 1,328 1,729 2,539
20 1.325 1.725 2,528
21 1,323 1,721 2,518
22 1,321 ,717 2,508
23 1,319 ,714 2,500
24 1,318 .711 2,492
25 1,316 1,708 2,485
26 1,315 1,706 2,479
27 1,314 1,703 2,473
28 1,313 1,701 2,467
29 1,311 1,699 2,462
30 1,310 1,697 2,457
40 1,303 ,684 2,423
50 1,298 ,676 2,403
60 1,296 .671 2,390
80 1,292 ,664 2,374
100 1,290 1.660 2.365
200 1,286 .653 2,345
500 1,283 .648 2,334
CO 1,282 1,645 2,326
'^Большая часть этой таблицы с разрешения автора и издателей перепечатана нз книги F i s h с г R. Л., YatcsF., Statistical Tables, Oliver and Boyd. Edinburgh, Englund. 1953.
356 Процентили распределении хи-квадратЧ 357 Таблица IV
0.С05 0,010 0.C2S 0,05 0.10 0.20 0.30 0.41 0,60 0.60 0,70 0,80 0.90 0,95 0,975 0.990 0.995 T
5= ё S
I 0,0'393 0.03157 0,03982 0,0г393 0,0158 0,0642 0,148 0.2; 0.455 0.708 1.07 1,64 2.71 3,84 5,02 6,63 7,88 1
2 0,0100 0,0201 0,0506 0,103 0,211 0,446 0,713 1 J’'- 1,39 1,83 2,41 3,22 4,61 5.99 7,38 9.21 10,6 2
3 0.0717 0,115 0,216 0.352 0,584 1,00 1.42 1 .87 2.37 2,95 3,67 4,64 6,25 7.81 9,35 11,3 12.8 3
4 0,207 0,297 0,48-1 0,711 1,06 1,65 2,19 2,75 3,36 4.04 4,88 5,99 7.78 9,49 11.1 13,3 14,9
5 0,412 0,554 0,831 1,15 1.61 2,34 3,00 3,66 4.35 5,13 6,06 7,29 9.24 11.1 12,8 15,1 16,7 5
6 0,676 0.872 1,24 1,64 2,20 3,07 3,83 4.57 5.35 6,21 7,23 8.56 10,6 12.6 14,4 16,8 18,5 6
7 0,989 1,24 1.69 2,17 2,83 3,82 4,67 5.49 6,35 7,28 8.38 9,80 12,0 14,1 16,0 18,5 20.3 7
8 1,34 1,65 2,18 2.73 3,49 4,59 5.53 6,42 7,34 8,35 9,52 11.0 13,4 -15.5 17,5 20,1 22,0 8
9 1,73 2,09 2,70 3.33 4.17 5,38 6,39 7.36 8,34 9,41 10,7 12,2 14.7 16,9 19.0 21,7 23.6 9
10 2,16 2,56 3,25 3,94 4,87 6,18 7,27 8,30 9,34 10,5 11.8 13,4 16,0 18.3 20,5 23,2 25,2 10
11 2,60 3,05 3,82 4,57 5,58 6.99 8,15 9,24 10,3 11,5 12,9 14,6 17,3 19.7 21,9 24.7 26.8 11
12 3,07 3,57 4,40 5.23 6,30 7,81 9.03 10,2 Н.З 12,6 14,0 15,8 18,5 21,0 23,3 26.2 28.3 12
13 3,57 4.11 5,01 5,89 7,04 8,63 9.93 11.1 12,3 13.6 15.1 17,0 19,8 22.4 24,7 27,7 29,8 13
14 4,07 4,66 5,63 6,57 7,79 9,47 10,8 12,1 13.3 14,7 16,2 18.2 21,1 23.7 26,1 29.1 31.3 14
15 4,60 5,23 6,26 7,26 8,55 10.3 П.7 13,0 14,3 15,7 17.3 19,3 22.3 25,0 27,5 30,6 32,8 15
16 5,14 5,81 6.91 7,96 9,31 Н.2 12,6 14,0 15,3 16,8 18,4 20.5 23,5 26,3 28,8 32,0 34.3 16
17 5,70 6,41 7,56 8,67 10.1 12.0 13,5 14.9 16.3 17,8 19,5 21.6 24,8 27,6 30,2 33.4 35,7 17
18 6,26 7,01 8,23 9,39 10,9 12,9 14,4 15,9 17,3 18,9 20,6 22,8 26,0 28,9 31,5 34,8 37,2 18
19 6.84 7.63 8.91 Ю,1 11.7 13,7 15,4 16,9 18.3 19,9 21,7 23,9 27,2 30,1 32,9 36,2 38,6 19
20 7,43 8,26 9,59 10,9 12,4 14.6 16.3 17,8 19.3 21,0 22.8 25.0 28,4 31,4 34.2 37,6 40,0 20
21 8,03 8,90 10,3 11.6 13.2 15,4 17.2 18,8 20,3 22.0 23.9 26,2 29.6 32,7 35,5 38,9 41,4 21
22 8,64 9,54 11,0 12.3 14,0 16,3 18.1 19,7 21.3 23.0 24,9 27,3 30.8 33,9 36,8 40,3 42,8 22
23 9,26 10,2 П.7 13.1 14,8 17,2 19,0 20.7 22.3 24,1 26,0 28.4 32,0 35,2 38,1 41,6 44,2 23
24 9,89 10,9 12.4 13,8 15,7 18,1 19,9 21,7 23,3 25.1 27.1 29.6 33,2 36,4 39,4 43,0 45,6 24
25 10,5 11,5 13,1 14,6 16,5 18,9 20.9 22,6 24,3 26,1 28,2 30,7 34,4 37,7 40,6 44.3 46,9 25
26 11,2 12,2 13.8 15,4 17,3 19,8 21,8 23.6 25,3 27.2 29,2 31,8 35,6 38,9 41,9 45,6 48,3 26
27 11,8 12,9 14,6 16.2 18.1 20,7 22.7 24,5 26.3 28.2 30,3 32,9 36,7 40,1 43,2 4< ,0 49,6 27
28 12,5 13.6 15.3 16.9 18.9 21.6 23.6 25,5 27,3 29,2 31,4 34,0 37.9 41,3 44,5 48,3 51,0 28
29 13,1 14,3 16,0 17,7 19,8 22,5 24.6 26.5 28,3 30,3 32,5 35,1 39.1 42,6 45.7 49.6 52,3 29
30 13,8 15,0 16,8 18,5 20,6 23,4 25.5 27.4 29,3 31,3 33.5 36,3 40,3 43,8 47,0 50,9 53,7
35 17,2 18,5 20,6 22.5 24,8 27,8 30,2 32,3 34,3 36,5 38,9 41,8 46,1 49,8 53.2 57,3 60.3 35
40 20,7 22,2 24,4 26,5 29.1 32,3 34.9 37,1 39,3 41,6 44.2 47,3 51,8 55,8 59,3 63,7 66,8
45 24,3 25.9 28.4 30,6 33,4 36,9 39,6 42.0 44,3 46,8 49,5 52.7 57,5 61,7 65,4 70,0 73,2 45
50 28,0 29,7 32,4 34,8 37,7 41.4 44,3 46,9 49.3 51,9 54.7 58,2 63,2 67,5 71.4 76,2 79,5 50
75 47.2 49,5 52,9 56,1 59,8 64,5 68,1 ?1.3 74,3 77.5 80,9 85,1 91,1 96,2 100,8 106,4 110,3
100 67,3 70,1 74.2 77,9 82,4 87,9 92,1 95,8 j 99,3 102,9 106.9 111,7 118,5 124,3 129,6 135,6 140.2
*)B сокращенном виде таблица перепечатана из книги Hold A.. SUIhtlWl Tables ForilHsi.-'-. John Wiley. New York. 1952. —
г
2,146
,44W
0,2438
0,0767
0.05IS
0*2448
".И?” 0.2328 0.1760
””13”
0,4747
0.4397
0.4100
0.2190 0,2147
0.2105 0.2060
1.546
1.187
0.9681
0.7127 О,КЮ4
0,0842
0.0828
0.0815
0,4487 0,3921 0,3490
0,3150
1.040 1,143 ”. W.
0,6384
0,2794
0,2716
0.2643
0.3172
0.3066
0.2967
1.6814
1.6251
1.5780
I, облегчающие подбор распределений Зи Джонсона')
Значения —
•) На книги J о h n s о п N. L-. Tables to Facilitate Fitting S., Frequency Curves. Biomct'* ' 62. jip. 547-558 (1966).
0,1106 0,1035
0.0914 0,0820 0.0745
0,0684 0,0633 0.05S9 0.0552
0.0510
0,0491 0.0466 0,0444
0.0424 0,0406
0,0390 0.0374 0.0361 fl. KU-
0.033?
0.0326 u.llSiG 0.0307 0.0298
0.0290
0.0283 0,0276
0.0263 0,0257 0.0251
9(0241
”. ”21” 0,0232
0.0227
0.0223
0.0219 1'1,0216 0,0212
0.ОЙ»
P.O.'-o
0,021)2 0,0198
0,0195
0,0190
0.0185
0.0180
0.0175
0,0171
0,7373 0,4834 (1.3620 0,2905
0,2435 0,2102 О,1853 0,1601
0.1507
0.1381
0,1276 0,1188
0.7747
1 '
0.4523
0,3775
0,0989
0.0893 0,0852 0,0816
0.0783 I'. ”732
0,071» 0,0в76
0.0655 0,0635 0.0616
0.0599 0.0583
0.0568 0.0553 0.0540 0,0527 0.0515 о.оэд
0,0483 0.0473 (1.0464
0.0465 0,1)447 0,0439 0.0431
0.0424
0,0417 0.0410
0,0404
0,0392
0.0380
0.0370 О.
0.0351
0,0342
0,2106 0,1943 0.1806 0.1689 0.1583
0.1499 0,1421
0.1352 0.1290 0.1234
0.1184 0.1138 I). 10!»
D.IIK7 0.1022
0.0989 0,0958 0.0930 0.0904 0.0879
0.0856
0.0814 0.0795
”.'*777 0,0760 ”.”7:3 0.0728 0.0713
0.0699
0,0686 (1.0673
<>,I
0,06.18
0,0599
0.0590
0.0572
0.2153
8,2031 0,1923 0,1828
0.1743
0.1666
0.1477 0,1424 0.1376
0.1331
0,1251 0,1215 0,1132
0.1151 «.1121
0.1094 0.1067 0. ь-чз 0,-1020 0,0098 0.0977 0,0957 0,0938
0,0920 0,0903 0.0887
0.0871
3.189
1,056
1.133 0.8620
0.6997
0.5907 (1.5125
0.4536 0,4076
0,3707
0,34<М 0,3151 0,2937 0,2752
0,2451 0,2327
0.2216 (1,2117
0,2027 0,1946 0.1872 0,1804 0,1742
0.1684 0,1631 0,1582 0,1536 0.1493
0,1453 0,1415 0.1380
0.1347 0,1315 0,1286 0,1258
0.1231 0.1206
0.1159 0.1137 СИ, '1116 и. и:-” (1.1077
0,1059 0.1042 0,1025 0.1009 0.6993
0,0964
0.0912
0.0888 0.0866
0,9115 U,?’A'.
0,6515
0.5723
0,5113
0.4829
0.4234
0.3907
0.3632
0.3396
0,3192
0,3014
0.2857
0.2717
(1,2480 0.2378 0,2286 0.2201 0,2123
0,2052 0.1086 ”.1"25 0,1868
0.1766 0.1719 0,1676 0,1635
0,1596 0.1560
0,1461 0,1432
0,1404 0.1377 0.1352 О,1327 0.1304
.0,1282 о,|260 0.1240 0,1220
0.1201
0,1165 О,1132 0,1101
0.1073 0,1046
1.023 0.8814 0.7733
0.6902
2,139
1.614
1.302
1,095
0.9470
2. НИ 1.687 1.378 1.169
1,013
0.” . 0,8132 0.7407
0,3426 1 (1,3099
0,2961
0,2836
0.2723
0,2620
0.-1664 0.4288
0,4048 0.3836 0,3648
.0,3479
I 3/25 II.ЗИИ I ®'Э 0.2952
0,23-18
0.6WO 0,4744 0,4484 0,4254
0,4060 0,3866 0.3696 0.3647
0,3411
CL39I3
0.3765 0,362!
0,3504
<Ъ221Б 0,2151
0,2091 0.2035 0,1983 0.1933 0.J8S7 0,1843 0,1802 0.1762 0.1723 0,1690
0.1656 0.1624 0.1594 0.1565 0.1537
0.1510 0.1485 0,1460 11.1437
0.2921
0.28Ю
0,2709 0,2646 II. ?/•”
0.1371 0.1332 0,1295 0,1261 0.1229 0.1199
0.2581 0,2504
0,2433 H.L/.6
; I.
0.2245
0.2190
.2! ?-S
0.1999 и. I№7
0.1918 (1,1680 0.1844 0,1810
0.1777
0.1746 (1,1716 0.1687 ".1'6”
0,1633
0.1583
0.1537
0.1494 0.1454 0,1417
0.1382
0.1349
0.1991 0,1956
0.1922 0.1891 0.1860
0,1802 0.1749
0.1699 0,1653 0.1610
0.1570 0.1532
0.217J 0,2426 0.2377 и.'.'М 0,2287
0,2246 0.2206
OI209S (1,2059 ол?»
359 Продолжение табл. V
0,55 0,® 0.65 0.7Q 0,75 0.80 0,85 0,90 0.95 1,00
3 8 2,284 3.383
9 1.783 2.426
LO 1,469 1.906 2.621 4.104
4 1 1.253 1.677 2,060 2.886
4,2 I.UW 1.3-19 1.705 2.264 1.801)
4.3 (1,97-18 1.182 1,460
. 1,054 1,250 1.589 1.302
4.5 048033 0,9527 1,142
4.6 0,7399 0.87<S 1.033 1.240 1.522 1,931 2.602 4,029
4,7 0,6865 0.8024 0,9434 1.121 1.353 1.221 1,076 2.167 3.038 2,473
”.6410 : I 0,8699 1.024 1,861
0,8”r..l 1.114 1.335 1,641 2.100 2.407 -3.538
5,0 0.5675 0,6539 0,7560 0.8761 1.025 1.215 1.469 1,832
0.5374 0,6170 0.7092 0.8154 0.9509 1.117 1,333 1.629 2,071 2.832
5 2 0.5106 0.5845 0.6693 ll “(187 0,8877 1.C34 1,221 1.470 1.342 2.356
0,4568 0.5556 0,6341 0,7252 0.8331 0.9542 1.128 2.072
0.4ГЛЗ 0.5298 6.602-8 0.6869 o,7:<6 ”.9i»9 1.050 1.236 1,147 1.839 1,657
5A 0.4459 0,5066 0.5749 0.6530 0.7419 0.8515 0;0826 1,361
5*7 5,8 0,4283 0,4856 0.5498 0.6226 0.7067 0,80® 0.7647 0.9243 1.071 1,259 1,172 1.510
”.4i"- 0,4665 0.5270 0.5053 o,6“3!-. 0.8732 1,006 1.390
0.3975 0,4491 0.5063 0.67(16 0.6437 0,7.284 0.8282 0,9485 1.259
5.9 D.5SI” 0.4331 1.1,48?” 0.5481 o,l.il№ П.К942 ”.7881 11..4Ц8:.' 1.203 1.129
6,0 0.3714 0,4184 0.4701 0.5276 0.15924 U.6663 0,7521 0,8338 0,9765
0.3598 0,4049 0.4542 0.5088 0.5700 0,6396 , 0.7197 <1.8138 0;9M5 1.006
0,3923 (1,-1395 11.191,7 0,5496 0,-6308 ”.П1К’ 0,6904 0,6637 0,7780 1.008
0.3390 I, il-ll'l O.4KS -1,4/75 ”./!»” 0,7456 0,7161 0.8420
".329? (1,3897 0.4131 0.5134 0.6392 ”.9132
6:5 0.3209 0,3595 0,4013 0,4470 0,4973 0,5535 0.6160 0.6892 0,8729
0,3123 0.3500 0,3903 0,4341 0.4824 0.5359 0.5962 0,6646 0.7435 0,836*1
0.3799 0.4221 ”. 1—1 ”.5:97 ”.”770 0.6419 0.7164
0,3702 0.4109 ”.4 7”: ”.5015 0.5592 0,6209 0.6914 0.//30
П 0.3611 (1,400-1 0,4433 0.4904 0,5427 0.5951 0,6683 0,7453
7,0 0.2839 0.3172 0.3524 0.3905 0,4318 0,4772 0,5273 0.5835 0,6470 0.7198
0.2778 0.310! 0,3443 0,3812 0,421! 0.4648 0.5130 0,5666 0.6272 0,6962
7,2 0,2719 0,3034 0,3366 0.3723 (1.4110 0.4531 0,4421 0,4995 0.5509 0.5362 0,6087 ”.67:4
(1,2664 0.2967 0,3293 0.36-10 0.-1014 0.4868 0.5915 ”.•'541
n,’6li ”,:-224 11.356: 0,3924 ”.43:8 ”.4749 ”..’2'1 0.5754
7.6 0.256! 0,2849 0,3159 0.348G 0.3838 0.4920 0,4636 0.6094 0.6593 0,6175
7 6 0,2513 0,2795 0,3006 0.3415 0.3757 (1,4127 0.4530 0.1972 0.5463 0,6010
0,2467 <1.2423 11.2. 12 ”,2087 ”,.’347 ”.Ж” ” J 12:1 ”.4Ж 0.5328 ' .»/"
7 8 0,2632 11,2080 0,3283 0.3607 0.3956 0.433-1 О.!”!? 0,5503 II
7.0 8.0 ”.2li.fi с.2У?« ”,.’537 ”. .-I” H..IC44
0.2341 0,2809 11(2871 0,3163 0,3470 0,380! 0,4158 0.4546 0.4971 0.Б442
О 8,3 0,2303 0,2556 0.2822 (,1.310В 0,3407 0.3729 0.4076 0.4452 0,4864 0.5309
0,271'4 ..,30. >< ”..'40 ”.Mf.ii ii.l :'f»
” i (1,2720 0.301)1 ”.32”8 0.3594 0.3Й23 0,427,9 II. 4667 ”.l’””2
0,2195 0.2435 । . 20.-7 0.2952 0,3232 0,353) 0,3852 0,4199 (1.4576 0.4987
0,2163 0.2397 0.2643 0,2904 0,3179 (1.3471 0.3764 0,4122 0,4488 0.4888
8.6 0,2132 11.2362 0,2603 0,2859 0.3127 0.3413 (1,3719 0,4045 0.4405 0,4793
O.2I01 0.2327 0,2564 0,2812 0.307? 0,3358 0.3657 0.3978 0,4326 0.4702
”.2726 o.277f ”.3i»: O.39IC ”.47 IS 0.4616
n.iOi: ",2.-62 0.2490 0.273( 0,2985 0,3253 0,3204 0.3539 0,3484 (1.3845 0.4175 0.4533
9.0 0.2016 0,2231 0.2455 0.2691 0,2941 0.3783 0,4105 0.44S4
0,1964 0,2172 0,2389 0.2617 0.2858 0.3111 O.338C 0,3666 0.397-1 0,3852 0.4305
0,1916 0.2117 0,2328 0,25 f 0.302c 0.3'.-: ”.3V-8
0.248'. 0.37^ ”.244 0. .7143 ”.3457 ”.3»' 0,4042
10.0 0,2421 11.263$ O,2S« 1.1.310! 0.336” 0.3634 0.39Й
- - 0.2365 0.2575 0.2798 0.3030 0.3275 0,3637 0.3816
360
Продолжение табл. V
i.os; 1,10 1.16 1,20 1.25 1.30 1.35 1,40 1.45
2.4ГЗ 2.099 1,871 1.692 1.547 1.428 1,327 1,241 1,167 1.1(2 1.1'44 0,9933 0.9477 0.960 0.8694 0.8356 0,8246 0.7762 0.7о'Х1 0.7258 0,7'34 0,6825 0.6630 0.6448, 0.6278 0.6117 0,5967 0.5825 ".ж-." 0.6563 0.5443 0,5328 0.52» 0.6 99 0.5'18 0.4924 0.4834 0.4748 0,4666 0,4587 0.4511 0.4439 0.4369 0.43 2 0.4237 0.4175 0.41 IS 0.4001 0,3895 0.3796 0.3703 0.3615 0.3S33 0.3455 3.543 2.874 2,451 2.149 1,921 1,741 1,596 1,475 1.373 1.285 1,210 1,143 1,085 1.132 0,9857 ".'J4)5 0.9:53 0.87Г5 0,8386 0.8 03 0,7823 0.7573 0,7342 0,7126 0.6924 0.6736 0.6569 0.6393 0,6237 0.6' 89 0.595' 0,58t8 0.5693 0.5574 о. >161 0.5354 0.5251 015154 0,6'61'1 014971 0.4885 0,4813 0.4724 0.4648 0.4576 0,45 6 0,4438 0.4311 0.4192 0.4 82 0.3978 0.3881 013789 0,3763 2,535 2.224 1.990 1,8'5 1.656 1.531 1,427 1,337 1.259 1.190 1.130 1.076 1,(28 0,9843 <>,9444 0.9 83 0.8753 0,8450, 0.817(1 0,7910 0.7670 0,7445 0.7236 0.7049 0.6857 0,6684 0,6521 0,6368 0.6223 0.6(85 0.5B55 ". -»л 0,6714 0,5691 0.5'194 o.ow.i 0,5295 0,52.2 0,5112 0,5'27 0.4945 0.4866 0,4790 0.4646 0,4513 0.4389 0,4273 0,4165 <1.4'63 0.8908 3.686 3.124 2,654 2.325 2,(79 1.885 1.729 1.699 1.490 1.396 1.315 1.243 1,189 1,124 1,(74 IJ28 (1,9871 0,9495 0,9|5l 0.8834 0.8642 0,8272 0.7786 0,7568 0,7364 0,7172 0,6991 0,6822 0,6661 0.6510 0,0360 0,623’1 O.OH'l 0.5978 0.5861 0,5749 0.5642 0.554* 0.5443 0.5349 О.Г.Л 0,5174 0,5912 0,4862 • 1.472Л 0,4593 0,4472 0,4858 0.4252 2.823 2.459 2.192 1.984 1.817 1.679 1,563 1.464 1.379 1,3*3 1.237 1.178 1.125 1.077 1,1’34 0.9945 0.9584 0.9251 0.8S4S 0,8661 0.8397 0,8152 0.7923 0.77l9 0,75'7 0.7318 0,714 1 0.6972 0,6612 0.6663 0,6521 0.6385 0.6133 0.6016 0.59 4 0.5797 0,5695 0.5597 0,5413 0.5243 0,5 86 0.4941 0.4674 0.4678 0.4559 5,110 3,712 3.154 2.635 2.335 2.1'6 1.924 1.775 1.650 1.544 1.452 1.372 1.238 1.182 1.132 1.' 86 I.('44 1.0C6 0.97(6 0.9382 0.9:83 0,88 5 0.8546 0.83'4 0,8078 0.7866 0,7667 0.748,1 Q.73-3 M.T nil, 0.6977 0.6827 0.6685 0.6549 0.642) 0.6.1'7 0.6181 o.e 67 0.5S57 0,5664 0,5485 0.532) 0.5167 0,5'25 0,4691 2.S25 2.259 2.C55 1.89'1 1.752 1.636 1.537 1.450 1.374 L2J6 1.192 1.143 1.(99 1.(58 (<S85) 0,9542 0.9246 0.8973 о.ьПб 0,8477 0.8252 0.8 42 (*J.M3 0.7656 0.748 1 0.7312 0,7154 0,70 3 (1.6861 0.6724 0.6SIM 0,6352 l .61.11 0.5927 0.8739 0.5566 (1154 4 <1.5254 3.929 3,213 2,768 2.455 2.217 2.(29 1.875 1.746 i .nap 1Л57 1.384 1,319 1.261 1.2 7 1.159 1,115 1.075 1.(38 г ,’9722 0.0436 0.9163 0.89 8 018669 0.8445 0.8234 0.7848 0.7671 ('.75 .3 0,7343 0.7102 0.6910 0.6654 0.6421 0.6205 0.6 >07 0.5823 0.51363 6.W-0.5347 0.5209 2.43’1 2.2 2 2.1'24 1.677 1.752 1.646 1.554 1.473 1,337 1.279 1,227 MS' 1.136 1.196 lit 26 019943 0.9651 0.9377 019122 0.888'2 0.SS57 0.8445 0.8245 0.8 56 0.7877 0,7546 0.7247 0.6975 0.6727 0.6499 0.8289 0,6 95 015915 0.5748 0,5592
361
IIродолжение табл. V
ч к 1.55 1.60 1,65 1,70 1.75 1,80 1.85 1,90 1,95 2,00
5. \
6.0 2,459 3.813
2.240 3.192
8.2 8.3 2,167 2.795 2.510
1.924
1;8 3 2.291 •
8.5 1,698 2.115
8.6 1,6'7 1.969 2,601 4.603
8.7 1,527 1.846 2.366 3.582
8.8 1.456 1.71' 2,181 3.161
8.9 1.31.2 1,647 2,130 2.719
9.0 1.334 1.566 1,91.2 2,467
о 1 1,282 1.403 1.793 2,269 2.08
9.2 1.234 1.428 1.697
9.3 1,199 1.370 1.613 1.973
1,159 1.316 1.539 1.856 2.382 3.679
9.5 1.112 1.268 1.472 1.758 2,2.8 3,147
9.6 1.078 1.223 1,412 1,670 2.i'62 2.703
1.046 1.182 1,357 1.592 1.938 2.535
9.8 1.013 1.144 1.337 1.523 1.831 2.3(5
0.S88I 1.Ю9 1.261 1,460 1.738 2.172
10.0 0.5619 1,1176 1.219 t.656 2,1'36
10.1 0.9374 1,046 1.180 1.351 1.582 1,923 1,819
10.2 '.).! 142 1.017 1.144 1.304 1.516 2.310 3.475
10,3 U/7--I 0,99'6 1,110 1.200 1.457 1.731 2.158 3.036
И).-1 С,8718 0.9655 l.l 79 1,22' 1.4'2 1.652 2/28 2,7/.
10,5 0.8523 0,9419 1/5.0 1,183 1.353 1.682 1.917 2,495
10.6 0.8338 0,9196 1.022 1.148 1.307 1,518 1.820 2.313
10.7 0.8163 О.89Й О.'.".-») 1,115 1.205 1,461 1,734 2.11,3
10.8 <.',7!'.6 0,8785 0.9721 1/85 1,226 1.408 1.658 2/30
10.9 0.7837 0,8596 0,9490 1,157 1.190 1.35 > 1.590 1,927 1.832 2.331 3.612
11.0 0,7686 0.8416 0,9274 1,030 1.150 1.316 1.528
II. 1 0.7541 0.8246 0.9069 1,005 1.124 1.274 1.472 1,748 2.185 3.131
11.2 0.74 3 0.8 83 0,8874 0.9811 1/95 1.236 1.423 1.673 2/58 2,8'4
4.7272 0.7928 0,8689 0,958.- 1.1'67 1.2 1 1.373 1,6’5 1,950 2,565
11.4 H.7I.I5 0.77ft> ('.«513 0,9375 1/41 1,168 1.329 1 /-Il 1,855 2.377
11.5 0,71.24 0,7638 0,8346 0.9174 1.016 1.137 1,289 1,489 1,771 2.224
11.6 0,6977 0.75лЗ 0,8186 0.8983 0,9928 l.K'8 1.251 1,438 1.696 1.629 2.096
11.7 ".<7'/, 11.7.171 0,8 34 П.36 1 O.'IT.S I /80 1,(54 1,216 1,183 1,391 1.985
11.8 0.7248 0.7888 0,7749 0.8828 (1,9499 1,347 1.3,7 1,568 1.869
11,9 0.6535 0.7129 V 816.3 0.9.1'» 1/3’1 1.152 1.512 1.804
' 12.0 0,6486 0,7014 0.7615 0.83'.6 0,9112 1.007 1.124 1,270 1,461 1,728
12.1 0.6393 0,7487 0.8155 0.8932 (1.9851 1/96 1.235 1.414 1.370 1.660
12.2 0.6297 11 0.7384 0.6 II 0.8701 0.9644 1,071 1.202 1,171 1,598
12.3 0.62'8 . I.'VT. 0.72V. 0.7873 r.s/v (1.9417 1/46 1.33'1 1,5-12
12,4 i'Z-122 0,6598 0.7132 O,774'i 0.8441 0.926'1 1/24 1,143 1.293 1.490
12.5 0.6 39 0,6503 0,7623 0,7613 0,8291 0,9.81 1,002 1,115 1,258 1.443
R 0.5959 0,6411 0.6323 0.6918 0,7491 0,8148 0,891» 0.9811 1/90 1,225 1.399
12 7 ' ..— 1 tl.W 0.7374 II 0.8747 0.9614 1/66 1.194 1.358
12.8 0.58 6 г.6237 0.6719 0,7261 0,7879 0.8442 0.9427 1/43 1.165 1.320
0.5733 0.6154 0.6624 0,7152 O.7.-..2 0.9243 1,021 1,138 1.284 1,251
13.0 0,5662 0.6774 0.6533 0,7047 0,7630 0,8299 0.9778 1.000 1,112
— 0,7400 0,8"30 0,8758 0,9614 1.064 1.190
(3 4 _ _ 0,7187 0,7781 0.8-165 0.9263 1.021 1,136
0.Й98Х M.7.V.I 0.81(15 0.8941 1.088 1.045
1 i S 0,681)2 И.7.1..'» 0.7945 0.8646 0.9466
14.0 — — — 0.0628 0,7136 0,7712 0,8373 0,9141 1,005
1 4 ° 0,6464 0.6949 0,7496 0,8121 0.8842 0.9690
14.4 O/’-H 0.6774 0,729.5 n.7886 0.856») I’.'.'.C'J
14.6 0.6160 . 9 0,7106 0.7668 0.8310 0.8072 <.!*//•
14.8 0,6451 <'.74»l
L 15.0 - -* — — 0,5900 0,6308 0.6763 0,7273 0,7851 0,8514
Значения ц
1.662
2.136
I .«01
1,728
1.561
1.881
1,567
1,401
1.407
1.391
1.381
1,454
1,446
1.431
1,691
1,578
1,665
1.552
1.541
L3SO
1;8Я
i/l'J
1,508 1.498 1.489
3.943
1,688 1,669 1.652
1,035 1,619
3.705 3.295 №01 I
-w
1,393 1.381 1,370 1,359
1.349
0.05 0,10 0.15 0.20 0,25 0.30 0,35
4,671 3.866 3,396 3.081 2.852 .'// 2.5:i5 2.420 2/2: 2.242 -'.17! 2.109 2.054 2.005 .961 .921 .885 1,852 ,822 .793 .7,;.' .743 .721 .699 .1380 .661 .643 .627 .611 .596 .582 .563 .556 .543 .532 .520 .510 199 ,490 .480 .471 .462 454 445 438 430 423 415 408 395 383 371 360 349 4,787 3,927 8,435 3)108 2.872 2;692 2,648 2,431 2,333 2,250 2.178 2,115 2.0И 2,010 1.966 1.925 1.889 1,855 1.825 1,796 1,770 1.745 1.723 1.702 1.682 1.553 1.545 1.628 1.613 1.598 1.583 1.570 1.557 1.545 1,533 1.522 1.511 1.501 1.491 1,481 1.472 1.463 1.455 1,446 1,438 1.431 1.423 1.416 1.409 1.390 1.383 1,372 1.361 1.350 5,004 4.036 3.503 3, L56 2.908 2.719 2.57) 2.450 2.3® 2.264 2,190 2.126 2,069 2.018 1.973 1.932 1,896 1.881 1.830 1,801 1.775 1.761'1 1.727 1,705 1,685 1.666 1.648 1.631 1,615 1,660 1.586 1.572 1,559 1,547 1.535 1.524 1,513 1.502 1.492 1.483 1.47+ 1.465 1.456 1.448 1.440 1.432 1.425 1.418 1.411 1.397 I.38S 1.373 1.362 *1 5,369 4.208 3.607 3.227 2.960 2.760 3.604 2.477 2.372 2.283 2.207 2.441 2,082 2,030 1.984 1.942 1,904 1.869 1.837 1.808 1.781 1.756 1,732 1,711 1,690 1.671 1,633 1.636 1,619 1.604 1.590 1.576 t.663 1,560 1,538 1.527 1,516 1.505 1,495 1.485 1.476 1.467 I.// 1,4® 1.442 1.43-1 1.427 1.419 1.442 1.399 1.386 1.374 1.363 1.352 5.902 4.469 3.759 3,328 3,033 2.816 2.6 IS 2.513 2,402 2.309 2.229 2.160 2.100 2,046 1.998 1.955 1.916 1.860 1,847 1.817 1.790 1.764 1.740 1,718 1,697 1,677 1.653 1.641 1,625 1.609 1.59 1 1.SS0 1.567 1.554 1,542 1.530 1.519 1.309 1,498 .469 .479 .470 .461 .453 .445 .437 .429 .422 ,415 .401 .388 L365 1.354 7,204 4,875 3.079 3.467 3.132 2.890 2.707 2.501 2,442 2.343 2.2.9S 2.186 2.122 2.066 2.016 1.971 1.030 1.8'3 1,860 1.829 1.600 1,774 1.749 1.726 1.705 1.685 1.666 1.648 1.631 1,615 1.600 1.586 1.572 1.559 1.547 1.515 1.524 1.513 1.502 1.402 1.483 1.474 1.465 1.456 1.448 1,440 1.432 1.425 1,418 1,404 1.391 1.379 1.367 1.356 4,300 3,663 3,266 2,989 2/753 2.623 2.492 2.385 /?/ 2,217 2,150 2,090 2.033 1.991 1.048 1,910 l,87S 1.643 1,813 1,786 1.7M 1.737 1,715 1.694 1,674 1.656 1.639 1.623 1.60? 1,593 1.579 1,565 1.553 1.341 1.520 1.518 1.507 1.497 1.487 1.478 1,469 1.460 1,452 1Л36 1.428 1.421 1.407 1.394 1.382 1.370 1.359 1.349 1.339
2.ГС5 2,"15 1,973 1.9,30 1.893
1,859 1.829 1.800 1.774 1,749
1.725
i;&«
1,631
1.615
1.600
1.586
1,573
I,’547
I .’524 1.513
1.503
1.493
1.483
1.474
1.465
1Л40
Таблица VI
2.157 2./.
2.097
2,044 1.997
1.954 1.915
i;sso 1,847
1.817
1.789 1,764
1,740 1.718 1,697 1,677
1.859
l.OO.l 1.869
, 1.808 .1,781
1.691
Продолясвние табл. VI
1.509
I.4S9
1.489
1.480
1Л38 1.430
1.496 1,4»? 1,477
1.468 1.460
1.81
1.443
3,424
3,116 2,872
2,694 2,552 2,436 /)>/
2,255
2,183
2,120 2,065
2,015 1.971
1,931
1.649
1/33
1.617
1.456 1,458 1,450 1,442
1,434 1,426
1,419 1,412 1,405
1.399
3,776 3,346 3,049
2;S30 2.66! //" 2,414 2,320
2,240 2,170 ///
2,055 2,007
1.ШИ
1,770 1,746
1.724 1.703
1,683 1,664 1.647 1,630
1,614
1,599 I.f.s-.
1,572 1,559
1,547
L524 1.513
1.465
1,457
1,448
1,440
1,433 1,425
1,418
1.405 !// I .ЭИ
3,294
3,013 2,804
2,641
3,510
2,401
2,309
2,231
2,162
2,100
2,049
2,001 1,958
1.919
1,884 1,851
1.821
1,794
I ,7»l> 1,744 1,722
1,701 1,681
1,663
1.G4S 1,629
1,613
1,598
1/584 1,671
1,558
1.546
I ./I
1,623
1,512
1,502
1,492
1.483
1,473
1,4/
1.456
1,448 1.440.
1,432
1,425
1,418
3,669
3,269 2,996 2,791 2,631
2,502
2,395 2.3<M
2,159 2,099
2,045
1318
1,883
1,850 !//
1,767
1,721
1.700
1,681
1,662 1,645
1.628 l."!3 !//
1,584 1.671
1,534 I// 1,513
1,502 1,492 1,483 1.474 1,465
1,456 1.448 1,440 1,433
1,404
1,398 1.391
2,503
2.
2.^
2,160
2,100 2.048
2.000 1,958 1.918
1,884 1,851 1.82!
1.7'11
1.768
2.641
oil 2,403 //:: 2.234
2,185 2,105
f;ss2
1,887 I.85S 1,824
2.4472 2.529 2.418 2,325
2,245 2.176 2,115 2.0/
2,012
1,989 1,929 1,893 1,850 1,830
3,093
2,868
2,694
2,655
2,262 2,191 2,128
2,073
2,023 1,979 1,939 1.902 1,868
1,704 1,664
1.663
1,646
1 /./“ 1/14 1,599
1,572 1,559 1,547 i //
1,624
1.513 I./-.I
1,493 1.483
1,474
1.408
1.648 /// 1,616 l,60l
1,573
1.561
1,537
1,504
1,494
1,485
1,476
1.467?
1,590 1,576 1.863 1,651
1,539 l./S 1/17 1.Г/7 1,497
1,478 1,469 1,46!) 1,452
1,444
1.429 1,422
1,415
1.401 1,389
Ь693 1,671
1,643 1,631
I //> 1,810
1,600 1,490
1,481 1,472 1.463
2,592
2,472 2,371
2,285
2.211
2,146
2.089
2,038 1,992
1,013
1,879 1,847 1.818
1,791
1,766
1.742
1,721
1,700 1.681 1,663
2,799
2,641 )'//
2,406
2,315
2,237
2,170
2.11"
2/7
2.009
1,967
1,860
1,830
1.802
1.776
1.572 1,659 1,547 1,538 1.524
1,614 I. Ml 1,494 1,484 1.475
1,467 1,458 1,450 1.442 1.434
1Л39 1.431
367
Продолжение табл. VII
а =0,025
I = 0,975
2.п;
„,1Г.
V1' ’ р е а г so п Е. S., Н а г 11 е у Н. О.. BiometrlKa Tables Гог Statisticians. Vol. I
Cambridge University Press, 1954.
Таблица ]/ц
Значения а-х процентилей нормированного распределения Пирсона при заданных fi, и £а. (В случае положительной асимметрии т. е. при Нз > 0. процентили отрицательны.)!» а = 0,05
}“ 0,01 0,03 0,05 0,10 0,15 0.20 0.30 0.40 0,50 0.60 0.70 0.80
1.56 -
1.61 1.56 1.51
1.111 1. by I.-':. I-'- 1,46 1.40 1.35
I . -,5 J .til I,M 1,55 1.45 1.41 1.33
1,® 1,61 1 1 5 7 1.-63 I.4-. 1.3' 1.30
1,65 1.62 1.59 1,57 1.54 1,51 1.48 1.42 1.35 1.20 — — —
1.64 1.62 1.59 1.58 1.55 1.52 1.49 1.44 1.39 1.33 1.27
1,64 1.61 '.,5'1 1. 58 1,56 1.53 1 0 1.46 1 4' 1.37 1.31 1,25
1.64 1.61 1,59 1,58 : 65 1 , 1,51 1.47 1,43 I..- i.57
i 1,61 1,69 1.58 1.48 1,1 1.41 1 33
1.63 t.eu 1.59 1,58 1,55 1,54 1,52 1,49 1,40 1.42 1.39 1.35 1.31
1.62 1,60 1.59 1,57 .56 1,54 1.52 1.49 1.46 1.43 i ,,
1.62 1 C(| 1.57 1,49 1.47 1.44 1 1
1.62 .'•h 1.58 1. 7 1.52 1.50 1,47 : .17 ‘ ! ''
1.58 l.‘7 I.M 1 1,70 1.48 1,45 ' 4,<
>,«. .09 1,68 1.57 .55 1.53 1.52 1,50 1.48 1,46 1,44 1,41 1,39
1.60 .58 *1 1.56 .55 1.53 1.52 1.50 1,48 1.46 1.44 1.42 1,40
я = 0,95
0.10 0.15 0,20 0,30 0,40 0.50 0,60 0,70 0,80 0,90 1,00
2.00 2,04 2,06 -
2.05 2.08 2.11 2,15 — — —- — — W
2.08 2.11 2.14 2,18 2.22 — — — Ч- —• —
2,09 2,13 2.15 2,20 2,24 2,27 — — — —
2.10 2,13 2.16 2,21 2,25 2.28 2.32 — — —
2.11 2.14 2, Hi 2,21 2,23 2,29 2.32 2.45 2.38 —
2. II 2.14 2.16 2.21 2,213 2.28 2,32 2,35 2,38 2,41 —
2.14 2,16 2.20 2.24 2,28 2,31 2.34 2,37 2.41 2,44
2,11 2.13 2.16 2,20 2.24 2.27 2,30 -2.33 2.36 2.40 2,43
2.11 2.13 2,15 2,19 2.23 2.26 2.29 2.32 2,35 2,38 2.41
2,10 2.13 2.15 2.19 2,22 2.25 2.28 2.31 2.34 2.37 2,40
2,10 2,13 2,15 2.18 2.22 2.25 2.28 2.31 2.33 2.36 2,39
2.10 2,12 2,14 2,18 2.21 2.24 2,27 2.30 2.32 2.35 2,38
2,10 2.12 2.14 2.17 2.21 2.23 2.26 2.29 2.31 2.33 2.36
2,09 2.12 2.14 2,17 2,2) 2.23 2,25 2,28 2,30 2.33 2.35
368
369
а= 0,01
Продол жение табл. VII
а = 0,005
Продолжение табл. VII
\ 3.
0,00 0,01 0,03 0.05 0.10 0,15 0.20 0.30 0,40 0.50 0.60 0,70 0.80 0.93 г. \ 0,00 9.01 0.03 0,06 0,10 0,15 0,20 0,30 0.40 0.50 0,00 0,70 0.80 0,90 I.ГО
1.8 1,70 — . 1.8 1.71 -
2,0 1.87 1.77 1.69 1.62 . 2,0' 1.92 1,80 1,71» 1,64 — — — — — — — — —
2.2 2.01 1.91 1.83 1.76 1.64 1.55 1,45 2.2 2.10 1.99 I.S9 1.82 1,68 1.56 1,46
2.4 2.12 2.(3 1.95 1,89 1.77 1,68 1.59 1.43 — 2.4 2.26 2,14 2.04 1,9/ 1.83 1.71 1.62 1.44 — I, —г —л — —— •—
2.6 2.21 2.12 2.05 1,99 1.88 1.79 1 70 1;56 1 1: 2.6 2.38 2.27 2,18 2,12 1.98 1.87 1.77 1.68 1.42 — — — — —i —-
2.8 2.27 2,19 2,13 2,08 1.98 1.89 1.31 1.66 1.52 1.39 ' 2,8 2,49 2.38 2,30 2,23 2,10 1.99 1,89 1.71 1.65 1.41 — — г* — —
3.0 2.33 2.25 2.19 2.14 2.05 1.97 1.90 1.76 1 АО 1.50 1,33 , 3.0 2.58 2.4S 2.39 2,33 2,21 2.11 2.01 1,8-1 I.6S 1,53 1.40 — — — —i
3.2 2.37 2.29 2.24 2.J9 2.11 2.'3 1.96 1.84 1.71 1.59 1,48 1.37 1.26 3,2 2,65 2,5о 2.48 2.42 2,30 2.20 2.11 1.95 1,79 1,65 1.51 1.39 1.27 — —
3.4 2,4'1 2.33 2.28 2.24 2.16 2,09 2.12 1.00 1.79 1.68 1,57 1,46 1.36 3,4 2.71 2.61 2,54 2.48 2.38 2.28 2,20 2.04 1,90 1.76 1.62 1.50 1,38 1.27 —
3,6 2.43 2.36 2,31 2.27 2.20 2.13 2.С7 1.96 1.86 1,76 1.65 1,55 1.45 1 3) 3.6 2.76 2,67 2,60 2,04 2,44 2.35 2.27 2.13 1.00 1,85 1.72 1,60 Мб 1.37 1,27
3.8 2.45 2,39 2.34 2.30 2.23 2.17 2.11 2.01 1.91 1.82 1.72 1.62 1.53 1.43 1,3; 3.8 2.80 2.71 2.65 2,60 2,50 2,41 2,34 2.20 2,07 1,94 1.82 1,70 1,58 1.47 1.37
4.0 2.47 2.41 2.36 2.33 2.26 2.20 2.15 2.05 1.06 1.87 1.76 1.69 1,60 1,51 4.(1 2.S3 2.75 2,69 2.64 2,54 2,47 2,39 2,26 2.14 2.62 1,9» 1,78 1.67 1.56 1.4S
4.2 2.49 2.43 2.38 2.35 2.28 2.23 2.18 2.(0 2.00 1.92 1.83 1.75 1.66 1.58 । 4,2 2.87 2,79 2,72 2.68 2,5В 2.51 2.44 2,32 2,20 2,(9 1,97 1.86 1.75 1.65 1,54
4 .Л 2.50 2.44 2,40 2.37 а. 31 2,25 2.21 2.12 2.04 1.96 1.88 1.80 4 4 2.90 2,82 2,76 2.71 2,62 2.55 2,49 2.37 2.25 2.15 2.04 1,93 1.83 1.73 1.62
4.6 2.51 2.46 2.42 2.38 2.32 2.27 2.23 2.15 2.67 2.00 1.92 1,84 ' 4.6 2,92 2,85 2.79 2.74 2.66 2,59 2,52 2.41 2,30 2,20 2,10 2.00 1.90 1.80 1.70
4,8 2,52 2.47 2.43 2.40 2.34 2.29 2.25 2.17 2, 10. 2.113 1.06 1.68 1,81 1.74 1.67 4.8 2,9(1 2,87 2,81 2,77 2,69 2,82 .2,66 2,45 2,35 2,25 2,1,15 2,(5 1,90 1.87 1.77
5,0 2.53 2,48 2.44 2.41 2,36 2.31 2.27 2.1'9 2.12 2.CG 1.09 1,92 1,35 1.79 1.7? Й.О 2.96 2.89 2,83 2.79 2,71 2.65 2,59 2,48 2.39 2,29 .2,20 2.11 2,01 1,02 1,84
= 0,99 = 0 995
0.00 0,01 0.03 0,05 0.10 0. IS 0.20 0.33 0,40 0,60 0,® 0,70 0.80 0,90 1.06 0.00 0,01 0.03 0,05 0.10 0.15 (1,20 0.30 0,40 0.50 0.60 0,70 0.80 0,90 1.00
’ \
1.70 1.8 1.71
2.0 1,87 1.95 2.00 2.03 ' 2,0 1.92 2,01 2,06 2,09
2.2 2.01 2.10 2.15 2.18 2.22 2.24 2;25 2.2 2,10 2.19 2.24 2,27 2.31 2,33 2,35 — — — —‘ — —• — —
2.4 2.12 2.2П 2.25 2,28 2.33 2.36 2.38 2,40 - 2.4 2.26 2,35 2,41 2.« 2,40 2,52 2,53 2.53 —’ — — — — — —
2.6 2.21 2.28 2.33 2,36 2.42 2.48 2.51 2,52 2.6 2.38 2.48 2,54 2,57 2,63 2.66 2.68 2.70 2,69 — — —- — —
2,8 2,27 2.34 2,39 2,43 2,48 2.52 2.66 2,59 2,61 2,63 — — — — — 2.8 2,49 2.58 2,64 2,68 2,73 2,77 2,80 2,83 2,8-1 2,83 — — — —
3,0 2.33 2.40 2.44 2.48 2,53 2,56 2.59 2.64 2,68 2;70 2,71 ’ 3.0 2,68 2,66 2,72 2.76 2,82 2,80 2.89 2.93 2.S5 2,9В 2,95 — — — , —
3.2 2,37 2.44 2,48 2.51 •' 2.69 2,63 2.68 2.72 2.75 2.77 2.79 2.Я0 — 3.2 2,66 2.73 2.79 2.83 2.89 2,03 2.00 3,01 3,04 3,66 3.07 3.06 3,04 — —
3,4 2.40 2.47 2.51 2.54 2.59 3 У? 2.U6 2,71 2.75 2.79 2.82 2.84 2,86 2,87 2.71 2,79 2.85 2.88 2,95 2,99 3.02 3,07 3.11 3,13 3,15 3,16 3,15 3,14 —
3.6 2,43 2.49 2.53 2.68 2,61 .68 2.74 2.78 2.81 2.85 2.87 2.9 ' 2,91 2.93 3.6 2.76 2.84 2.89 2.93 2,99 3.03 3,07 3,12 3.16 3,19 3,22 3,23 3,24 3,24 3,23
3.8 2,46 2,51 2.55 2.68 2,63 2.67 2.70 2,75 2,80 2.83 2,87 2.93 2.82 2,95 2.97 3.8 2,80 2,88 2,93 2,97 3,03 3.07 3,11 3,15 3.20 3,24 3,27 3.29 3.30 3,31 3,32
4 0 2.47 2.53 2,57 2,60 2.65 2.68 2.71 2.77 2.81 2.85 2.88 2.91 2.94 2,97 2.99 4.0 2.83 2,91 2.96 з.оо 3.66 3.10 3.14 3,20 3.24 3,28 3,31 3,34 3,36 3.37 3.83
4 2 2,49 2.54 2.58 2.61 2.66 2.69 2.73 2.78 2.82 2,86 2.-9 2.92 2.95 2.98 3.01 4.2 2,87 2,94 2.99 3,03 3,69 3,13 3.17 3.22 3,27 3.31 3,34 3.37 3,40 3.42 2.43
Л 4 2.50 2.59 2.62 2.67 2.70 2.73 2.78 2.83 2,86 2,90 2.93 2.96 2.99 3,1’2 4.4 2.90 2.97 3.62 З.С5 3,11 3.15 3.19 3.25 3,29 3,33 3,37 3,40 3,42 3,45 3,47
4 6 2.51 2.57 2.61 2.63 2,68 2.71 2.70 2.83 2.87 2.90 2.94 2.97 3,00 3.03 4.6 2,92 2.99 З.С4 3,07 3.13 3.17 3.21 3.27 3,31 3.36 3,39 3,42 3,44 3,47 3,50
4.8 2.32 2.58 2.61 2,64 2.66 2.72 2.75 2.80 2.84 2,87 2,9! 2.94 2,97 3,00 3,03 4,8 2.94 3.01 3.06 3.69 3,15 3,19 3.23 3,28 3.33 3.37 3,41 3,44 3,47 3,49 3,62
5,0 2,53 2.58 2.62 2,64 2,69 2,72 2.75 2,80 2.84 2.88 2.01 2.95 2,97 3,00 3.03 ,5.0 2,96 3,03 3.07 3.11 3,16 3.21 3.24 3.30 3.3S 3,39 3.43 3.4G 3,49 3.52 3,64
370
Таблица VIII
Случайные числа (X10s). равномерно распределенные в интервале (0;1)Н
10097 37542 08422 99019 12807 32533 04805 68953 02529 99970 76520 64894 19645 09376 80157 13586 74296 09303 70715 36147
66065 74717 34072 76850
31060 10805 45571 82406
85269 77602 02051 65692
63573 32135 05325 47048
73796 45753 03529 64778
98520 17767 14905 68607
11805 05431 39808 27732
83452 99634 06288 98083
88685 40200 86507 58401
99594 67348 87517 64969
65481 17674 17468 50950
80124 35635 17727 08015
74350 99817 77402 77214
69916 26803 66252 29148
09893 20505 14225 68514
91499 14523 68479 27686
80336 94598 26940 36858
44104 81949 85157 47954
12550 73742 11100 02040
63606 49329 16505 34484
61196 90446 26457 17774
15474 45266 95270 79953
94557 28573 67897
42481 16213 97344 08721
23523 78317 73208 89837
04493 52494 75246 33824
00549 97654 64051 88159
35963 15307 26898 09354
59808 09391 45427 26842
46058 85236 01390 92286
32179 00597 87379 25241
69234 61406 20117 45204
19565 41430 01758 75379
45155 14938 19476 07246
94864 31994 36168 10851
98086 24826 45240 28404
33185 16232 41941 50949
80951 00406 96382 70774
7V752 49140 71961 28296
18633 32537 98145 06571
74029 43902 77557 32270
54178 45611 80993 37143
11664 49883 52079 84827
48324 77928 31249 64710
69074 94138 87637 91976
34673 24805 23209 38311 64032 54876 24037 02560 31165 36653 80959 20636 15953 88676 98951 09117 10402 34764 74397 16877
36697 36170 65813 39885
35303 42614 86799 07439
68665 74818 73053 85247
90553 57548 28468 28709
35808 34282 60935 20344
22109 40555 60970 93433
50725 68248 29405
13746 70078 18475 40610
36766 67951 90364 76493
91826 08928 03785 61368
58047 76974 73039 57186
45318 22374 21115 78253
43236 00210 45521 64237
36936 87203 76621 13990
46427 56788 96297 78822
46162 83554 94750 89923
70297 34135 53140 33340
32979 26575 57600 40881
12860 74697 96644 89439
40219 52563 43651 77082
51924 33729 65394 59593
59367 83848 82396 10118
54622 44431 91190 42592
16868 48767 03071 12059
68935 91416 26252 29663
45862 51025 61962 79335
96119 63896 54692 82391
33351 35462 77974 50024
83609 49700 13021 24892
77281 44077 93910 83647
05567 07007 86743 17157
15956 60000 18743 92423
40419 21585 66674 36806
43667 94543 59047 90033
34888 81553 01540 35456
44999 08896 39094 73407
89435 48581 88695 41994
20151 23387 25016 25298
69861 02591 74852 20539
31010 24674 05455 61427
97790 17119 52527 58021
05335 12969 56127 19255
59381 71539 09973 33440
02295 36870 32307 57546
35584 04401 10518 21615
39292 74945 00822 91665
35080 33606 04436 27659 12171 76833
11199
23403
18623
83491
35273
291711 09732 88579 25624 88435
50500 73998
52775
68711
29609
23478
67851
77817
11062
34113
40218 16544
14385 537i'.i
96286 02655
94400 56418
54382 14598
37089 20048
42050 82341
22222 06413
28707 25815 07207 31790
42582 60527
33211 59466
92927 4597.'
25701 46670
05522 82562
65337 23287
90103 78565
70617
85394 97118
84962 20826 05014
35441 37548
94624 00387 77938
80814 36040
88461 15020 01848
12472 29529 39333 20106 42941
11838 91.3 .-. 85207 69541 51176
31880 73043 6П71 59579 91930 .51748 90324 23356 09994
>) Таблица составлена фирмой РЭНД: Л Million Random Digits with IM ООО Normal The Free Press. Macmillan. I8SE.,
371
Таблица IX
Таблица случайных чисел, имеющих нормированное нормальное распределение О * -4>, /
1.276— 1,218— 0,453— 0,350— 0.723
я п о>382
1,377— 1,257— 0,495
2.334 0.337- ‘
1,136— 0,612
0,414 0.011— 0.666
............ 1,237-
0,759
0,464- _____
0,107— 0.131
0,924— 1,911
1.048
0.347
0,637
2,176
0,037 2.816
0,393
3.436
1.667— 0’847
1.132- 0,410;
0,609
1,185— 0,944— 1,604— 0,185 а а,а . ,,а 2 682 2 8|j
0,248— 0,719 0,450 2,247
1.170
0,294
1.210
2,647
0.398
0,846
0,654
0,522 ___________
1.288— 0,539— 0,824- 0,244
0,318 ___.._____
0,699— 0.368- 0,344 л пм 2.927 1,688
0,619- 0,265-
0.928— 2,416
0,995— 2.907
0,231 "
0.676
0,733
1,099— 0,314— 0,394— 0,633—
0,653 0,219 0,681—1,129
1,322— 0,315— 0,732— 1,348—
„ = « а ,аа 0,297— 0,276
0,433— 0,545 0,428 0,297— 0,276 1,173— 0,355— 0,035 0,359 0,930
0,734 0,931
2,043— 0,290— 0,404
1.484 0,616 _____
_____ 0,543— 0,486 0,074- 0,916—1,314 Л о.бю " 0,076
0,340— 0.789
0,377— 0,433—
" “’° 0,869
---- 0,038—
0,364— 2,626—
0,769— 1.607
1,808— 1,126— 0’,379
1,040— 1,168— 0,485 ______ ...... ...__
0,258— 0,300— 0,591— 0,545— 0,018 0,485—
1.531— 0.490— 2,071 ™'
1,103 1,090 0,212
1,151 1,676— 0,384
1.444 1,092- 0.478 1,185- 0,338- 1,134— 1,133 1,393 0,814
0,936— 1,036 0,024 0,926- 0,797- • -•
Л 0,434-
0,558
0,560- 0,203 0,871—
0,752
0.119 ______
1,070- 0,010
0,746 0,149 ...... ________
0,549- 0,192 0,334—1.373
0,482 п
0,170— 0.479—
1,372 1,769 1,057— 1.646 0,481 0,854 0.535— 1,607 0,428 0,615— 0,148— 1.144— 0.913 0,684 1,043 1.148—1,056— 0,635 0,328—1.221 — 0.3-18 0,970 0,017- 1,217 0,974—
0,284 0,458 1,307 1,625— 0.629—
1.016— 0.360 0,119— 2,331 1,672
1,603 0.952- 0.566—1,600 0,465 0,190— 1,479 0.986— 1,249 1,934 0,722— 0,925 0,783 0,402— 0,619
1,696- 1,879 0,063 0.132 0,682 2.543— 1.333— 1,987 0,668 0.360 0,359— 0.193 1.023— 0,222— 0,616— 0.248 0,088—1,379— 0.295 0.115— 0,099— 1,376— 1,047 0,872— 2,200—
0,463— 1,281— 2,514— 0,675 1,145 0,503 1,434 0,290 0,397 0.837—
0.857— 0,371— 0,216- 0.148 2,106— 0,122— 1,107 1.039- 0,636— 0,860— 1,632 0,586 0.468— 0,386— 0,354—
2,072 1.445— 0,680— 0.224 0,120— 0,435— 0,375— 0.985— 0,585— 0.203— 0,876 1,227— 2,647— 0,745— 1,797 0.833 1.289 0,022- 0.431— 0.582 0,891— 0.332 0,453— 1,127— 2.085
0.644 0,233— 0,153— 1.098 0,757 0.105 0.171— 0.110—1,145— 0.878 1,192— 1,770 0.003— 0.369 0,052 0,042- 0.553 0,770 0,321 0.489-0,498 1.072 1,567 0,302 1,157
0,469—0,090—1.171
0,600— 0,592— 0,610 0,096—1,375— 0,331 0,336- 1,152— 0,533 0.833— 0,554 0,051— 0,944— 0.440— 0.212— 0,118 2,045— 1,977— 1,133— 0.338 1,291— 0,399— 1,209— 0,248— 0,480 0.504— 0,056— 0,131 — 0,048 1.879 1.053— 0.840 0.246- 0,237 1,312— 1,951 0,110 0,251 0,116 0,957— 0,070 1.358- 1,245—0,959— 1,297-1,826 1.272 0,945— 0,49-1 0,050
0,544 0,417- 0,666— 0,104— 0,253— 1.927 1,183 1,211 1,765 0.035
0,060- 1,319— 0.785 0,430— 0.298— 0,621— 0,618- 0,209 0,979 0.906 1.334— 1,425 0,812- 0.748 1,093— 1,083 0,667- 0,223— 1,592- 1,278-0.973— 0.120— 1,594— 0,996— 1.244— 1.453— 0,686 0,075— 0.243— 0,170— 0,895- 1,458- 6,539— 0.159- 0,420— 0,203 1.234— 2,381 0,388— 0.063— 1,753 0,571- 1,223 0,126— 0,034 0,556— 0.024 0,126 1,250 0,615— 1,231— 0,547 0,634 — 0,836— 0.719— 0,766 0,574— 1,153— 0,520 1.018— 0.722— 1,508— 0.489 0.496— 0,025—
0,039— 0,460— 0,393 2,012 1,356 0.909— 0,328—1,021 1,613-1.560 0,647 1,029 1,526 0,237 1,328— 0,367— 0.378 0,601 1,996—0,738— 0,720— 1,403 0,698 0.370— 0.551—
') Таблица составлена ЛнрмоП РЭНД; Л •«. The Free Press. MiteniUJan. 1956.
Million Random Digits with 1П0000 Normal Devla-
Коэффициенты 7п.<4„ используемые при проверке ня нормальность с помощью
Tdftwqa X
критерия W, для п=3 (0 50
Н 16 1в 17 J8
0,7071 0,6872 0.6646 0,6431 0,6233 0,6052 0,5888 0,5739 0,5601 0 5475 0 5359 0 5251 О 5150 О 5П56 0 ловя п ляяв
0,1677 0,2413 0,2806 0,3031 0,3164 0,3244 0 3291 0 3315 oS 0 3325 0 3318 0*3306 SS J'S О®
0,0875 0,1401 0,1743 0.1976 0.2141 О^ОО Mg g.3 SS SJ«S SS S3 S3
0,0561 0,0947 0,1224 0.1429 0,1586 0,1707 0.1802 0,1878 0,1939 0,1988 0.2027
0,0399 0,0695 0.0922 0,1099 0,1240 0,1353 0.1447 0,1524 0 1587
0,0303 0,0539 0,0727 0.0880 0.1005 0.1109 0,1197 0.0240 0,0433 0,0593 0,0725 0.0837 0,0196 0,0359 0,0496 _________________________________________________________________ 0,0163
25 2» 27 28 29 30 31 32
10
11
12
13
14
15
16
0,4808 0,4734 0.4643 0,4590 0.4542 0,4493 0.4450 0,440" 0 4366 0 4328 0 49Q1 n 49.44 n мм n лян n uu n .i«w
0,3232 0.32 И 0,3185 0.3156 0,3126 0,3098 0.3069 0 3043 0 3018 01 W> 0 2968 0 2944 OW? о'здод п’здтг Ж
Ж Ж Ж И’7! "-2?63 °:255" О 2543 ОS 0.2522 О^б б^ЭЭ 0*2W Ж 0*2468 О 24S1 8’S
°-2131 °’2139 °-2145 °.21® 0,2151 0^2152 O^IBl 0 2150 0 2148 0 2145 0 2141 0 2137 о 2147
; !>! л’!?лл 0,1764 0,1787 0,1807 0,1822 0,1836 0,1848 0,1857 0.1864 0*1870 0 4874 0 1878 0 1880 о'Тйя?
0,1271 0,1334 0,1399 0,1443 0,1480 0,1512 0,1539 0,1563 0.1584 0 1601 0 1616 01630 01641 01651 n’lfifin n’lfUW
°® Ж Ж °'“50 °-1201 °-'245 <<'2«3 03316 0J 346 0 J 372 ОДЗЭб Ж S*lw О IS о’Ж 0’1475
0,0612 0,0711 0.0804 0,0878 0,0941 0,0997 0,1046 0,1089 0,1128 0,1162 0 119'’ 0 1219 0*1243' й'1265 019Я4 n'rwi'l
0,0303 0,0422 0,0530 0,0618 0,0696 0,076-1 0,0823 0,0876 0,0923 0 0965 0*1002 0*1036 0*1066 0*1094 o’tltR n'tijn
0,0140 0,0263 0.0368 0.0459 0,0539 0,0610 0^672 Л Ж Ж И*Ж 0*.S ИД 0,«)61 S*S
0,0)22 0,0228 0.0321 0,0403 0,0476 0.0540 0,0598 0,0650 0.0697 0 0739 0 0777 О 0812 0 0844
0,0107 0,0200 0,0284 0,0358 0,0424 0.0483 0,0537 ОД1585 0*0629 0,*0669 0*0706
0.0094 0.Q178 0.0253 0.0320 0.0381 0,0435 0.0485 0,0530 0,*0572 0,0084 0,0159 0,0227 0,0289 0.0344 0,0395 0 0441 0,0076 0,0144 0,0206 0,0262 0.0314 0,0068 0.0131 0,0187 ___________________________________________________________________________________________________________ 0,0062
Продолжение табл. X
35 36 37 38 39 40 41 42 43 44 45 48 47 48 49 50
1 0,4096 0,4068 0,4040 0,4015 0,3989 0,3964 0,3940 0,3917 0,3894 0,3872 0,3850 0,3830 0,3808 0,3789 0,3770 0,3751
2 0,2834 0,2813 0,2794 0,2774 0,2755 0,2737 0,2719 0,2701 0,2684 0,2667 0,2651 0,2635 0,2620 0,2604 0,2589 0,2574
3 0*2427 0,2415 0,2403 0,2391 0,2380 0,2368 0.2357 0,2345 0.2334 0,2323 0.2313 0.2302 0.2291 0,2281 0,2271 0,2260
4 0,2127 0,2121 0,2116 0,2110 0,2104 0,2098 0,2091 0,2085 0,2078 0,2072 0,2065 0.2058 0,2052 0,2045 0,2038 0,2032
5 0*1883 0,1883 0,1883 0,1881 0,1880 0,1878 0,1876 0,1874 0,1871 0,1868 0,1865 0,1862 0,1859 0,1855 0.1851 0,1847
6 0,1673 0,1678 0,1683 0,1686 0.1689 0,1691 0,1693 0,1694 0,1695 0.1695 0.1695 0,1695 0,1695 0,1693 0.1692 0.1691
7 0,1487 0,1496 0,1505 0,1513 0,1520 0,1526 0,1531 0,1535 0.1539 0.1542 0,1545 0.1548 0,1550 0.1551 0,1553 0,1554
8 0,1317 0,1331 0,1344 0,1356 0,1366 0,1376 0.1384 0,1392 0,1398 0,1405 0,1410 0.1415 0,1420 0,1423 0,1427 0,1430
9 0,1160 0,1179 0.1196 0,1211 0,1225 0,1237 0,1249 0,1259 0,1269 0,1278 0.1286 0,1293 0,1300 0,1306 0,1312 0.131/
10 0,1013 0.1036 0,1056 0.1075 0.1092 0,1108 0.1123 0.1136 0,1149 0,1160 0,1170 0.1180 0,118^.0,1197 0,1205 0.1212
II 0,0873 0,0900 0,0924 0,0947 0,0967 0,0986 0,1004 0,1020 0.1035 0.1049 0.1062 0,1073 0,1085 0,1095 0,1105 0,1113
12 0^0739 0^0770 0.0798 0,0824 0,0848 0,0870 0,0891 0,0909 0,0927 0,0943 0,0959 0.0972 0.0986 0.0998 0.1010 0,1020
13 0,0610 0.0645 0,0677 0,0706 0,0733 0,0759 0.0782 0,0804 0,0824 0,0842 0,0860 0,0876 0.0892 0,0906 0,0919 0,0932
14 0,0484 0Д1523 0,0559 0,0592 0,0622 0,0651 0.0677 0,0701 0,0724 0,0745 0,0765 0,0783 0,0801 0,0817 0,0832 0,0846
15 0,0361 0,0404 0.0444 0.0481 0,0515 0.0546 0,0575 0.0602 0.0628 0,0651 0,0673 0.0694 0,0713 0.0731 0.0748 0,0/64
16 0,0239 0,0287 0,0331 0,0372 0.0409 0.0444 0,0476 0.0506 0,0534 0,0560 0,0584 0.0607 0,0628 0,0648 0,0667 0.0685
17 0,0119 0,0172 0.0220 0,0264 0,0305 0,0343 0,0379 0,0411 0,0442 0,0471 0,0497 0,0522 0.0546 0,0568 0,0588 0,0608
18 0 0057 0,0110 0,0158 0,0203 0,0244 0,0283 0,0318 0,0352 0,0383 0,0412 0,0439 0.0465 0,0489 0.0511 0,0532
19 ’ * о 0053 0.0101 0,0146 0.0188 0,0227 0,0263 0.0296 0,0328 °-0357 °-0385 °'0411 °-М36 О'СМ59
on 0,0049 0,0094 0,0136 0,0175 0.0211 0.0245 0,(1277 0,0307 0,0335 0.0361 0,0386
<>, ' 0,0045 0,0087 0,0126 0 0163 0,0197 0.0229 0,0259 0,0288 0,0314
0 0042 о'о081 ОДО!» 0,0153 0,0185 0,0215 0.0244 ,“ * 0 0039 0.0076 0.01110,0143 0,0174
0,0037 0,0071 0,0104 24 0,0035
374
375
Таблица XI
Процентили критерия W, используемого для проверки на нормальность, для п = 3 (1) 50
л 1 2 8 Ю й
3 0,753 0,756 0,767 0,789 0.959
4 0.687 0.707 0,748 0,792 0.935
5 0.686 0,715 0,762 0,806 0.927
6 0,713 0,743 0,788 0,826 0.927
7 0,730 0,760 0.803 0.838 0.928
8 0.749 0,778 0,818 0,851 0.932
9 0.764 0,791 0,829 0,859 0.935
10 0,781 0,806 0,842 0,869 0.938
0,792 0,817 0,850 0,876 0,940
12 0.805 0,828 0,859 0,883 0,943
13 0.814 0,837 0,866 0,889 0.945
14 0,825 0.846 0,874 0.895 0,947
15 0,835 0,855 0.881 0,901 0.950
16 0,844 0,863 0.887 0,906 0,952
17 0.851 0,869 0,892 0,910 0.954
18 0,858 0,874 0,89/ 0,914 0.956
19 0,863 0,879 0,901 0,917 0,957
20 0,868 0,884 0,905 0.920 0,959
21 0,873 0,888 0.908 0,923 0.960
22 0,878 0,892 0,911 0.926 0,961
23 0.881 0,895 0,914 0.928 0,962
24 0.884 0,898 0,916 0,930 0,963
25 0.888 0.901 0,918 0,931 0,964
26 0,891 0,904 0,920 0,933 0,965
27 0,894 0,906 0,923 0,935 0,965
28 0.896 0,908 0,924 0,936 0,966
29 0,898 0,910 0,926 0,937 0,966
30 0,900 0.912 0,927 0,939 0,967
31 0,902 0.914 0,929 0,940 0,967
32 0,904 0,915 0,930 0,941 0,96.8
33 0,906 0,917 0,931 0,942 0.968
34 0,908 0,919 0,933 0,943 0,969
35 0,910 0,920 0,934 0.944 0,969
36 0,912 0,922 0,935 0,945 0,970
;37 0,914 0,924 0,936 0.946 0.970
38 0,916 0,925 0,938 0,947 0,971
39 0,917 0,927 0,939 0.948 0,971
40 0,919 0,928 0,940 0,949 0,972
41 0.920 0,929 0,941 0,950 0,972
42 0,922 0,930 0,942 0,951 0,972
43 0,923 0.932 0.943 0,951 0,973
44 0,924 0,933 0,944 0,952 0,973
45 0,926 0,934 0,945 0,953 0;973
46 0,927 0,935 0,945 0,953 0.974
47 0,928 0,936 0,946 0,954 0,9/4
48 0,929 0,937 0.947 0,954 0,974
49 0.929 0,937 0,947 0,955 0,974
50 0,930 0,938 0,947 0,955 0,974
Таблица XII
Постоянные, используемые для нахождения вероятности получения вычисленного значения 117 при проверке на нормальность
п 7 1 * п Т 0 ‘
3 —0,625 0,386 0,7500 'XI -5,905 1,905 0.1980
4 —1,107 0,714 0,6297 28 —5,988 1,915 0,1943
5 —1,530 0,935 0,5521 29 —6,074 1,934 0,1907
6 —2,010 1.138 0,4963 30 -6,160 1,949 0,1872
7 —2,356 1,245 0.4533 31 —6,248 1,965 0,1840
8 —2,696 1,333 0,4186 32 —6,324 1,976 0,1811
9 —2,968 1,400 0,3900 33 —6,402 1,988 0,1781
10 —3,262 1,471 0,3660 34 —6,480 2,000 0,1755
11 —3,485 1,515 0,3451 35 —6,559 2,012 0.1727
12 —3,731 1,571 0,3270 36 —6,640 2,024 0,1702
13 —3,936 1,613 0,3111 37 —6,721 2,037 0,1677
14 —4,155 1,655 0,2969 38 —6,803 2,049 0,1656
15 —4,373 1,695 0,2842 39 -6,887 2,062 0,1633
16 —4,567 1.724 0,2727 40 —6,961 2,075 0,1612
17 —4,713 1,739 0,2622 41 —7,035 2,088 0,1591
18 —4,885 1,770 0,2528 42 —7,111 2,101 0,1572
19 —5,018 1,786 0,2440 43 —7,188 2,114 0,1552
20 —5,153. 1,802 0,2359 44 —7,266 2,128 0,1534
21 -5,291 1.818 0,2264 45 —7,345 2,141 0,1516
22 —5,413 1.835 0,2207 46 -7,414 2,155 0,1499
23 —5,508 1,848 0,2157 47 —7,484 2,169 0,1482
24 —5,605 1,862 0,2106 48 —7,555 2,183 0,1466
25 —5,704 1,876 0,2063 49 —7,615 2,198 0,1451
26 —5,803 1,890. 0.2020 50 —7,677 2,212 0,1436
376 Процентили для критерия WE0 Таблица XII/ Процентили для критерия WE 377 Таблица XIV
05%-ныП интервал 90%-ный интервал 96%М<ЫЙ интервал 90%-ный интервал
нижняя верхняя нижняя верхняя
| граница ГрЯП'ИПН граница граница граница Рраицца
0,025 0,260 0,033 0,225 7 0,062 0,404 0,071 0,358
8 0,025 0,230 0,032 0,200 8 0,05-1 .0,342 0,062 0,301
9 0,025 0,205 0,031 0,177 9 0,050 0,301 . 0,058 0,261
10 0,025 0,184 0,030 0,159 10 0,049 0,261 0.056 0,231
11 0,025 0.166 0,030 0,145 11 0,046 0,234 0,052 0,208
12 0,025 0,153 0,029 0,134 12 0,044 0,215 0,050 0,191
13 0,025 0.140 0,028 0,124 ! 13 0,040 0,195 0,046 0,173
14 0,024 0.128 0,027 0,115 14 0,038 0,178 0.043 0,159
15 0,024 0,119 0,026 0,106 15 0,036 0,163 0,040 0,145
16 0,023 0,113 0,025 0,098 16 0,034 0,150 0,038 0,134
17 0,023 0,107 0,024 0.093 17 0,030 0,135 0,034 0,120
18 0,022 0,101 0,024 0,087 18 0,028 0,123 0,031 0,109
19 0,022 0,096 0,023 0,083 19 0,026 0,114 0,029 0,102
20 0,021 0,090 0,023 0,077 20 0,025 0,106 0,028 0,095
21 0,020 0,085 0,022 0,074 21 0,024 0,101 0,(&7 0,(©1
22 0,020 0,080 0,022 0,069 22 0,023 0,094 0,026 0,084
23 0,019 0,075 0,021 0,065 23 0,022 0,087 0,025 0,078
24 0.019 0,069 0,021 0,062 24 0,021 0,082 0,024 0,074
25 0,018 0,065 0,020 0,058 25 0,021 0,078 0.023 0,070
26 0,018 0,062 0,020 0,056 26 0,020 0,073 0.022 0,066
27 0,017 0,058 0,020 0,054 27 0,020 0,070 0,022 0,063
28 0,017 0,056 0,019 0,052 28 0,019 0,067 0,021 0.061
29 0,016 0,054 0,019 0,050 29 0.019 0,064 0,021 0,058
30 0,016 0,053 0,019 0,048 30 0,018 0,060 0,020 0,054
31 0,016 0,051 0,018 0,047 31 0,017 0,057 0,019 0,052
32 0,015 0,050 0,018 0,045 32 0,017 0,055 0,019 0,050
33 0,015 0,048 0,018 0,044 , 33 0,017 0.053 0,018 0,048
34 0,014 0,046 0,017 0,043 34 0,017 0,051 0,018 0,047
35 0,014 0,045 0,017 0,041 35 0,016 0,049 0,018 0,045
СИСТЕМАТИЗИРОВАННАЯ БИБЛИОГРАФИЯ
Как уже указывалось в начале книги, мы не пытались рассматривать здесь псе области теории вероятностей и математической статистики, представляющие интерес для инженеров. Например, мало или даже ничего не было сказано о статистическом выводе, планировании экспериментов в промышленности, теории массового обслуживания. К счастью, все эти вопросы достаточно полно изложены во многих книгах; по этой причине здесь приводится довольно обширная библиография. Вся она делится на следующие категории:
Общие приложения — элементарный уровень
Общие приложения — средний уровень
Общие приложения — высший уровень
Общая теория — элементарный уровень
Общая теория — средний уровень
Общая теория — высший уровень
Учебники и руководства
Программированные учебники (самоучители)
Планирование экспериментов
Теория вероятностен, теория случайных процессов, теория массового обслуживания
Методы теории надежности
Теория статистических решений
Статистический контроль качества
Другие специальные приложения
Общие статистические таблицы
Другие вопросы
Перечень литературы ограничен книгами, которые хотя бы частично предназначаются для инженеров и научных работников. В список не включены книги, представляющие интерес главным образом для специалистов в области психологии, экономики, управления торгово-промышленными предприятиями и других общественных наук. Кроме того, за исключением категории «Общая теория — высший уровень», сюда пе попали книги, представляющие интерес главным образом для математиков.
При отнесении книги к определенной категории нам, естественно, встречались случаи, когда книга находится на стыке двух
Систематизированная библиография
379
разделов. Например, куда следует отнести книгу о методах математической статистики, написанную для приложений в области контроля качества,— к категории «Общие приложения» или «Статистический контроль качества»? Как следует классифицировать книгу, в которой рассматриваются главным образом общие приложения, но некоторые главы посвящены планированию экспериментов? (В обоих случаях мы решили отнести их к категории «Общие приложения».) »
На книгах, отнесенных к первым шести категориям, необходимо остановиться особо. Им свойственны два общих признака: они предполагают отсутствие предварительной подготовки в облает теории вероятностей и математической статистики, и в отличие от последующих книг, посвященных определенным разделам, изложение материала в них носит общий характер. Мы относим книгу к категории «прикладной», если в ней главное внимание уделяется приложениям, несмотря на то, что рассматриваются также и основные теоретические положения. Книга считается «теоретической», если в ней главным образом рассматриваются теоретические положения, несмотря на то что иногда включаются и приложения (нет необходимости говорить, что нашу книгу мы рассматриваем как прикладную). Уровень изложения характеризует общую степень сложности (математической или иного характера), ожидающей читателя. Для прикладных книг «элементарный» уровень обычно (но не всегда) предполагает знание математики в объеме высшего учебного заведения и алгебры в объеме колледжа, книги «среднего» уровня предполагают знание математического анализа (мы относим эту книгу к категории среднего уровня), а «высший» уровень требует более глубокой математической подготовки. Книги, отнесенные к категории теоретических, обычно требуют более глубокого знания математики, чем соответствующие прикладные книги. Заметим, что под уровнем мы не имеем в виду количество охваченного материала. Книга может охватывать огромный материал в элементарном изложении или в ней на высшем уровне могут быть изложены только самые основные принципы. Некоторое представление об объеме включенного материала можно почерпнуть из названия книги.
В перечень включены лишь те книги, которые нам хорошо известны. Список этот не является исчерпывающим, и включение той или иной книги не следует рассматривать как отражение ее достоинств. (Обзор многих книг, опубликованных до I960 г., дается в книге Бакленда и Фокса, отнесенной к категории «Другие вопросы».)
Систематизированная библиография завершается перечислением основных журналов по математической статистике и смежным вопросам.
380
Систематизированная библиография
ОБЩИЕ ПРИЛОЖЕНИЯ — ЭЛЕМЕНТАРНЫЙ УРОВЕНЬ
В г own lee К. A., Industrial Experimentation, 3rd ed., Chemical Publishing, Tudor, New York. 1962.
Имеется русский перевод: Браунли ^К. А., Статистические исследования на производстве^ ИЛ, 1949.
С I а г k С. Е.. Introduction to Statistics, Wiley, New York, 1953.
Dixon W. J.. Massey F. J., Jr., introduction to Statistical Analysis, 2nd ed.. McGraw-Hill, New York. 1957.
Freund .1.. Modern Elementary Statistics. 2nd ed.. Prentice-Hall, Englewood Cliffs, N. J.. I960.
Fryer H. C., Concepts and Methods of Experimental Statistics, Allyn and Bacon, Boston. 1966.
Fryer II. C., Elements of Statistics. Wiley. New York. 1954.
Hoel P. G., Elementary Statistics, Wiley, New York, 1960.
Hantsberger D. V.. Elements of Statistical Inference, Allyn and
Bacon, Boston, 1961.
LeemingJ. J. Statistical Methods for Engineers. Blackie. London, 1963.
Moroney M. J.. Facts from Figures, Penguin, Baltimore, 1956.
M о s t e 11 e r F , R о u г кe R. E. K-, Thomas G. B.. Jr., Probability with Statistical Applications, Addison-Wesley, Reading, Mass..
Parrott L. G., Probability and Experimental Errors in Science, Wilev. New York. 1961.
Que non i I Ic M. H.. Rapid Statistical Calculations, Hafner, New York, I960.
Volk W , Applied Statistics for Engineers, McGraw-Hill. New York. 1958.
Wai Ils W A , Roberts H. V., Statistics: A New Approach. Free Press, New York. 1956.
Wort ha rn A. W., Smit h T. E., Practical Statistics in Experiment Design, Dalias Publishing House, Dallas, 1959.
Young H. D., Statistical Treatment of Experimental Data, McGraw-Hill. New York, 1962.
ОБЩИЕ ПРИЛОЖЕНИЯ - СРЕДНИЙ УРОВЕНЬ
Benue t 1 C. A., Fran kli n N. L, Statistical Analysis in Chemistry and the Chemical Industry, Wiley. New York, 1954.
Bowker A. H . Lieber ma n G. J.. Engineering Statistics, Pren-tice-Hall, Englewood-Gliffs, N. J . 1959.
Dav i e s O. L., ed., Statistical Methods In Research and Production, 3rd ed., Hafner, New York, 1957.
Fг у T. C., Probability and Its Engineering Uses, 2nd ed., Van Nostrand. Princeton. N. J , 1965.
Имеется русский перевод: Фрай Т„ Теория вероятностей, для инженеров, Гостехиздат, М—Л., 1934.
GouIdenC. Н. Methods of Statistical Analysis, 2nd ed., Wilev, New York, 1952.
Johnson N. L.. Leone F. C., Statistics and Experimental Design in Engineering and the Physical Sciences, v. 1—2, Wiley. New York, 1964.
Lindgren B. W., McElrath G. W., Introduction to Probability and Statistics, Macmillan, New York, 1959.
Ma ndel J.. The Statistical Analysis of Experimental Data, Wiley, New York. 1964.
M i I I e г 1.. F re u n d J. E.. Probability and Statistics for Engineers Prentice-Hall, Englewood Cliffs. N. J.,’1965.
Систе-матизированнан библиография
381
Os tie В., Statistics in Research. 2nd ed-, Iowa State University Press, Ames, 1963.
Parsdi n e C. G., R i ve I t В. H.. Statistical Methods for Technologists, Van Nostrand. Princeton, N. J., 1960,
Snedecor G. W., Statistical Methods^ 5th ed., Iowa State Univ. Press, Ames. 1956.
W i I ks S. S., Elementary Statistical Analysis. Princeton University Press. Princeton. N. J., 1948.
Wine R. L., Statistics for Scientists and Engineers. Prentice-Hall, Englewood Cliffs, N. .1., 1964. ,
ОБЩИЕ ПРИЛОЖЕНИЯ -ВЫСШИЙ УРОВЕНЬ
Brownlee К. A., Statistical Theory and Methodology in Science and Engineering, 2nd ed., Wiley, New York, 1965.
E h r e n f e lid S.. L i tl a u e r S.. Introduction to Statistical1 Method, McGraw-Hill, New York. 1964.
Guttmann 1.. WiTksS. S., Introductory Engineering Statistics, Wiley. New York, 1965.
H a 1 d A„ Statistical Theory with Engineering Applications, Wiley, New York. 1952.
Имеется русский перевод: Хальд А., Математическая статистика с техническими приложениями, ИЛ, 1956.
ОБЩАЯ ТЕОРИЯ - ЭЛЕМЕНТАРНЫЙ УРОВЕНЬ
BrunkH. D-. Introduction to Mathematical Statistics, 2nd ed., Blaisdell, Waltham, Mass., 1965.
Cramer H.. Elements of Probability Theory, Wiley, New York. 1955.
Dav I d F. N-, Probability Theory for Statistical Methods, Cambridge Univ., Press. England, 19'19.'
Fraser D., Statistics, An Introduction, Wiley, New York, 1958.
Freund J. E., Mathematical Statistics, Prentice-Hall, Englewood Cliffs, N. J., 1962.
GoldbergS., Probability, An Introduction. Prentice-Hall, Englewood Cliffs, N. J., 1960.
Hedges J. L., Jr.. Lehmann E. L., Basic Concepts of Probability and Statistics,. Holden-Day, San Francisco, 1964.
Hoel P. G., I nlroduction to Mathematical Statistics, 3rd ed., Wiley, New York. 1962.
Kurtz T.. Basic Statistics, Prentice-Hall. Englewood Cliffs, N. J.. 1963.
LindgrenB. W.. Statistical Theory. Macmillan, New York. 1962.
Munroe M. E.. Theory of Probability, McGraw-Hill, New York, 1951.
Ney ma nJ., First Course in Probability and Statistics, Holt, Rinehart and Winston, New York, 1950.
W a dswort It G. P., В г у a n J. H., Introduction to Probability and Random Variables. McGraw-Hill, New York, 1960.
W e a t h e r b u r n С. E., First Course in Mathematical Statistics, Cambridge University Press, England, 1949.
W о 1 f F. 1... Elements of Probability and Statistics, McGraw-Hill, New York, 1962.
382 Систематизированная библиография
ОБЩАЯ ТЕОРИЯ — СРЕДНИЙ УРОВЕНЬ
Alexander Н. W.. Elements of Mathematical Statistics, Wiley, New York, 1961.
Anderso n R. L, В a n с г о f t T. A., Statistical Theory in Research. McGraw-Hill, New York, 1952.
Birnbaum Z. W.. Introduction to Probability and Mathematical Statistics. Harper and Row, New York. 1962.
F i sz M-, Probability Theory and Mathematical Statistics. 3rd ed.. Wiley. Ney York. 1963.
Freeman H. A., introduction to Statistical Inference. Addison-Wesley. Reading, Mass, 1963.
Hamii to n W. C., Statistics in Physical Science, Ronald. Oxford, 1964.
Harr i s B.. Theory of Probability, Addison-Wesley. Reading, Mass., 1966.
Hogg R. V.. CraigA. T., Introduction to Mathematical Statistics. 2nd ed., Macmillan. New York. 1965.
KenneyJ. F., К e ер Iin g E. S.. Mathematics of Statistics, part I, 3rd ed.; part 2. 2nd ed.. Van Nostrand, Princeton, N. J.. 1954.
Meyer P. L.. Introductory Probability and Statistical Applications, Addison-Wesley, Reading. Mass., 1965.
Mood A. M , Graybill F. A.. Introduction to the Theory of Statistics, 2nd ed., McGraw-Hill. New York, 1963.
P f e r P" Concepts of Probability Theory, McGraw-Hill, New York,
Thorp E. 0., Elementary Probability, Wiley, New York. 1966.
T u с кег H. G., Introduction to Probability and Mathematical Statistics, Academic Press. New York, 1962.
ОБЩАЯ ТЕОРИЯ—ВЫСШИЙ УРОВЕНЬ
А 1 t к е n А. €., Statistical MatheiTiatics, Wiley Interscience, New York. 1952,
Cramer H., Mathematical Methods of Statistics, Princeton University Press. Princeton. N. J.. 1946.
Имеется русский перевод: Крамер Г.. Математические методы статистики, ИЛ, 1948.
Ke п d a I I М. G.. S t u а г t A.. Advanced Theory of Statistics, v. 1: Distribution Theory, Hafner, New York, 1958.
Имеется русский перевод: Кендал л М., Стью а р т А.. Теория распределений, изд-во «Наука», 1966.
v. 2: Statistical Inference and Statistical Relationship, 1961; v. 3: Planning and Analysis and Time Series, Hafner, New York (в печати)
W i I k s S. S., Mathematical Statistics, 2nd ed., Wiley, New York, 1962.
УЧЕБНИКИ И РУКОВОДСТВА
Bauer E. L., A Statistical Manual for Chemists, Academic Press. New York. 1960.
Bowker A. H.. L ie be r ma n Q. J.. Handbook of Industrial Statistics, Prentice-Hall. Englewood Cliffs. N. J., 1955.
В u r i ng t о n R., Ma у D. C., Handbook of Probability and Statistics, with Tables, McGraw-Hill. New York, 1953.
Crow E. L„ David F. A.. M a x f i e 1 d M. W., Statistics Manual with Examples Taken from Ordnance Development, Dover, New York.
Систематизированная библиография
383
F г е u n d .1. Е.. Livermore Р. Е., М i 1 I е г I., Manual of Experimental Statistics, Prentice-Hall, Englewood Cliffs, N. .1., I960.
N a t re 1 1 a M. G.. Experimental Statistics. Nat. Bun Std. (U. S.), Handbook, 91, U. S. Government Printing Office, 1961.
ПРОГРАММИРОВАННЫЕ УЧЕБНИКИ (САМОУЧИТЕЛИ)
Dixon J. R., A Programmed Introduction to Probability, Wiley, New York. 1964. Introductory Statistics (Secondary Mathematics), v. I: Descriptive Statistics; v. 2:’ Statistical Inference. Watts. New York. 1964.
McCol lough C., VanAttaL.. Statistical Concepts; A Program for Self-Instruction, McGraw-Hill. New York, 1963.
ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ
Chew V., ed., Experimental Design in Industry. Wiley, New York, 1958.
Cochran W. G.. Cox G. M., Experimental Designs. 2nd ed., Wiley, New York, 1957.
Cox D. R., Planning of Experiments. Wiley, New York, 1958.
D a v i e s O. L., ed., Design and Analysis of Industrial Experiments, 2nd ed.. Hafner, New York. 1956.
Federer W. T.. Experimental Design: Theory and Application, Macmillan, New York, 1955.
Fisher R. A., Design of Experiments. 7th ed.. Hafner. New York, 1960. H i с к s C. R.. Fundamental Concepts in the Design of Experiments, Holl, Rinehart and Winston, New York, 1961.
Имеется русский перевод: Хикс Ч.. Основные принципы планирования эксперимента, изд-во «Мир». 1967.
К е m р t h о г п е О., Design and Analysis of Experiments, Wiley, New York, 1952.
Quenouille M. H., Design and Analysis of Experiment. Hafner, New York. 1953.
ТЕОРИЯ ВЕРОЯТНОСТЕЙ, ТЕОРИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ И ТЕОРИЯ МАССОВОГО ОБСЛУЖИВАНИЯ
Bailey N., Elements of Stochastic Processes with Applications to the Natural Sciences, Wiley, New York. 1964.
Cox D. R., Renewal Theory, Wiley, New York, 1962.
Имеется русский перевод: Кокс Д. Р.. Теория восстановления, изд-во «Советское радио», 1967.
Сох D. R., Smith W. L., Queues. Wiley, New York, 1961.
Имеется русский перевод: Кокс Д. Р.. Смит В. Л., Теория очередей, изд-во «.Мир», 1966.
Feller W., Introduction to Probability Theory and Its Applications, v. 1. 2nd ed.. 1957; v. 2. 1965; Wiley, New York.
Имеется русский перевод: Феллер В., Введение в теорию вероят-
ностей и ее приложения, изд-во «Мир», т. 1, 2-е изд., 1964; т. 2, 1967.
Ke meny J. G,, S п е I I J, L., Finite Markov Chains, Van Nostrand.
Princeton, N. .1.. 1959.
Morse P. M., Queues, Inventories and Maintenance. Wilev. New York.
1958.
384
Систематизированная библиография
Р*Ка1ЙА: N₽™3“iiy-I?6"do‘n “d s,°"“"c '««“ P 3 York” f960A'°dern Probabili,y ТЬеогУ aild I,s Applications. Wiley, New Parzen E., Stochastic Processes, Holden-Day. San Francisco. 1962 5 3 Hill New ¥огке™96? °f ^ueueing Theory with Applications. McGraw-Имеется русский перевод: СаатнТ. Л-. Элементы теории массового обслуживания и ее приложения, изд-во «Советское радио». 1965.
ТЕОРИЯ НАДЕЖНОСТИ
ARINC Киыгй, CorpMltan Relirtlltly Englnetrlng. Prenllce-HM, Engle-wOOtl Uli I IS. IN. J., 196'1.
8 ” Wife” RNew YoPrk.%6s'' " " F" ТЙ™'У »' Reliability.
Имеется русский перевод: Барлоу Р., Проше нФ.. Математи-ческаи теория надежности, изд-во «Советское радио». 1969.
В ’ Cliffs* N J К1е9б|Ь'1ИУ Theory and Praclice' Prentice-Hall. Englewood Имеется русский перевод: Б азовский И., Надежность. Теория и практика, изд-во «Мир», 1965.
В и с k 1 an <1 W. R.. Statistical Assessment of the Life Characteristic, Haf ner. New York, 1964.
Calabro S R.. Reliability Principles and Practices. McGraw-Hill, New York. 1962.
Имеется русский перевод: Калабро С. Р.. Принципы и практические вопросы надежности, изд-во «Машиностроение». 1966.
Haviland R. Р.. Engineering Reliability and Long Life Design. Van Nostrand. Princeton, N. J., 1964.
Имеется русский перевод: ХевилендР., Инженерная нвде.ж-иость и расчет на долговечность. М,—Л., изд-во «Энергия». 1966.
L a n d е г s R R. Reliability and Product Assurance, Prentice-Hall. Englewood Cliffs, N. J.. 1963.
Lloyd D. K-, L у p о w M., Reliability: Management Methods and Mat hematics. Prentice-Hall, Englewood Cliffs. N. J., 1962
Имеется русский перевод: Ллойд Д. К.. Липов М., Надежность. Организация исследования, методы, математический аппарат, изд-во «Советское радио», 1964.
Р ' Vliffs* CN V El$)63PrinClpleS °f Reliab,Iily' Prenlice-Hall, Englewood
R 0 V,?,.r l.s, N- Mathematical Methods in Reliability Engineering. McGraw HiII. New York, 1964.
Sa "d‘e r.,G>, SYs,em Reliability Engineering. Prentice-Hall. Englewood Cliffs, N. J., 1963.
Имеется русский перевод. С а и д л e p Дж , Техника надежности систем. изд-во «Наука». 1966.
Z е I е п М.. ed., Statistical Theory of Reliability, University of Wisconsin Press, Madison, 1963.
ТЕОРИЯ СТАТИСТИЧЕСКИХ РЕШЕНИЙ
В г o s s I. D., Design for Decision. Macmillan, New York, 1953.
Ghernoff H., Moses L., Elementary Decision Theory. Wiley, New York. 1459 } J
Систематизированная библиография
Имеется русский перевод: Чернов Г.. Мозес Л- Е.. Элементарная теория статистических решений, изд-во «Советское радио», 1962.
S с h 1 а 1 I е г R.. Introduction and Statistics for Business Decisions, McGraw-Hill. New York. 1961.
S c h I a i i e r R., Probabilitv and Statistics for Business Decisions, McGraw-Hill. New York, 1959.
Weiss L., Statistical Decision Theory, McGraw-Hill, New York, 1961.
СТАТИСТИЧЕСКИЙ КОНТРОЛЬ КАЧЕСТВА
В и г г I, W., Engineering Statistics and Quality Control. McGraw-Hill. New York, 1953.
Cowden D. J., Statistical Methods in Quality Control, Prentice-Hall, Englewood Cliffs. N. J., 1957.
Имеется русский перевод: Коуден Д. Д.. Статистические методы контроля качества, нзд-во «Фнзматгиз», 1961.
Duncan A. J., Quality Control and Industrial Statistics, 3rd ed.. Irwin.
Homewood, ill., 1965.
Enrick N. L., Quality Control. 5th ed., Industrial Press, New York. 1966.
Grant E. 1... Statistical Quality Control., 3rd ed.. McGraw-Hill, New York, 1964.
Hansen B., Quality Control, Prentice-Hall, Englewood Cliffs, N. .1.. 1963.
Schrock E. M.. Quality Control and Statistical Methods, 2nd ed., Reinhold, New York, 1950.
Tippett L. H. C-, Technological Application of Statistics. WUev, New York, 1950.
ДРУГИЕ СПЕЦИАЛЬНЫЕ ПРИЛОЖЕНИЯ
A e I p n I-. S.. Analysis of Straight-Line Data, Wiley, New York, 1959.
Ailchlson J„ Brown A. C., Lognormal Distributions, Cambridge University Press, New York, 1957.
David H. A., The Method of Paired Comparisons, Hafner. New York. 1963.
Draper N., Smith H., Applied Regression Analysis, Wilev, New York. 1966.
Ezekiel M., Fox K. A., Methods of Correlation and Regression Analysis. 3rd cd., Wiley, New York, 1959. Имеется русский перевод: E з e-к и e л М.. Фокс К- А.. Методы анализа Корреляций и регрессий линейных я криволинейных, изд-во «Статистика», 1966.
Tinney D. .1.. Probit Analysis, rev. ed.. Cambridge University Press, New York. 1963.
Fisher R. A., Statistical Methods for Research Workers. 13th ed., Prentice-Hall. Englewood Cliffs, N. J.. 1958.
Guenther W. C., Analysis of Variance. Prentice-Hall. Englewood Cliffs, N. J.. 1963.
G umbel E. .1., Statistics of Extremes. Columbia University Press, New York, 1958. Имеется русский перевод: ГумбельЭ., Статистика экстремальных значений, нзд-во «Мир», 1965.
Kendall М. G., Course in Multivariate Analysis, Hafner. New York, 1957.
Mace A. E.. Sample Size Determination. Reinhold. New York, 1964.
Maxwell A. E.. Analyzing Qualitative Data, Wiley, New York, 1961.
386
Систематизированная библиография
Siege) S., Nonparametric Statistics for the Behavioral Sciences, McGraw-Hill. New York. 1956.
Walsh J. E., Handbook of Nonparametric Statistics, v. 1. 1962; v. 2, 1965; Van Nostrand. Princeton, N. J..
We t her i 1 I G. B., Sequential Methods in Statistics, Wiley, New York,
1966.
Williams E. J., Regression Analysis, Wiley, New York, 1959.
You de n W. J.. Statistical Methods for Chemists, Wiley, New York, 1951.
ОБЩИЕ СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ
A г к i n Н., С о I t о n R., Tables for Statisticians, 2nded., Barnes and Noble, New York, 1963.
Beyer W. H., Handbook of Tables for Probability and Statistics, The Chemical Rubber Company, Cleveland, 1966.
Fisher R. A.. Y ates F., Statistical Tables for Biological, Agricultural and Medical Research, 6th ed.. Hafner, New York. 1964.
G г e e n w о о d J. A.. Hart ley H. O., Guide to Tables in Mathematical Statistics. Princeton University Press, Princeton. N- J., 1962.
Hal d A.. Statistical Tables and Formulas. Wiley, New York. 1952.
Owen D.. Handbook of Statistical Tables, Addison-Wesley, Reading. Mass., 1962.
Имеется русский перевод: О у э и Д- Б.. Сборник статистических таблиц. ВЦ АН СССР, 1966.
Pearson Е. S.. Hartley Н. A., eds., Biometrika Tables for Statisticians, v. I. Cambridge University Press, England, 1954.
ДРУГИЕ ВОПРОСЫ
В u c k 1 a n d W. R., Fox R., Bibliography of Basic Texts and Monographs on Statistical Methods, Hafner, New York. 1963.
H u f f D.. Geis I., How to Lie with Statistics. Norton, New York, 1954.
Kendall M.. В u c k I a n d W. R.. Dictionary of Statistical Terms. 2nd ed.. Hafner, New York. I960.
Kendall M., D о i g A. L., Bibliography of Statistical Literature.
v. I. 1950—1958; v. 2. 1940—1949; v. 3. Hafner, New York (в печати)
Mosteller F.. Fifty Challanging Problems in Probability, Addison-Wes-ley. Reading. Mass., 1965.
Savage I. R.. Bibliography of Nonparametric Statistics. Harvard Uni versify Press. Cambridge, Mass., 1962.
ЖУРНАЛЫ ПО МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ И СМЕЖНЫМ ВОПРОСАМ
Annals of Mathematical Statistics
(издается Обществом математической статистики)
Applied Statistics
(издается Королевским статистическим обществом)
The Australian Journal of Statistics
(факультет математической статистики Сиднейского университета. Австралия)
Biometrics
(журнал Биометрического общества американской статистической ассоциации)
Систематизированная библиография
Biometrika
(издается отделом биометрики университетского колледжа. Лондон) Industrial Quality Control
(издастся Американским обществом по контролю качества)
Journal if the American Statistical Association
(издается Американской статистической ассоциацией)
Journal of the Royal Statistical Society, серия В, методологическая (издается Королевским статистическим обществом)
Management Science »
(издается Институтом научных методов управления)
Operations Research
(издается Американским обществом по исследованию операций)
Sankhya
(индийский журнал по математической статистике)
Statistical Theory and Method Abstracts
(издается Международным статистическим институтом. Гаага. Нидерланды)
The Statistician
(издается Институтом статистики, Лондон. Великобритания) Technometrics
(журнал по применению математической статистики в физике, химии и технике, издаваемый Американским обществом по контролю качества и Американской статистической ассоциацией)
Теория вероятностей и ее приложения (издается в СССР)
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Аппроксимация биномиального распределения нормальным 171 ------пуассоновским 190. 204 — гамма-распределения нормальным
Аппроксимирующие распределения
Арифметическое среднее 18 Асимметрия 59
Байеса теорема 30—33
Бернулли испытания 164
Бета-распределение 103, 150. 159,
279. 333
Бета-функция неполная 112
Бумага вероятностная 302
------для распределения Вейбулла 327
------— хи-квадрат 324
-----------экстремальных значе-
ний типа I 330
—322 лога1”1'1’мнчески нормальная
------нормальная 305, 307, 317
Графическое представление вероят ностей 301—351
Йельта-метод, см. Метод моментов ецнль 66
Дисперсия 58. 171, 203
— линейной функции случайной величины 83
— характеристики системы 265
Доверительный интервал 93
— предел 95, 174
----верхний 95
----нижний 95
— уровень 94
Дополнение множества 18
Законы теории вероятностей 25
Интенсивность отказов 125, 144
— событий 184
Интервал между доверительными границами 280
Венна диаграмма 18. 20
Вероятность апостериорная 33
— априорная 33
— условная 30
Взаимно исключающие множества 19
Время безотказной работы 130
Выборка случайная 47
— цензурированная 110
Квантиль 65
Ковариация 81, 99
Коэффициент корреляции 81
Критерий согласия 336
----- хн-квадрат 345
— W 337
— WE 341
- WE0 339
Гамма-распределение 103. 143. 146.
158. 278
Гамма-функция неполная 105
Гистограмма 48
Математическое ожидание 48, 171. 203
-----упорядоченного наблюдения 333
.189
Математическое ожидание функция случайной величины 55 ---характеристики системы 264
Медиана 51
— эмпирическая 53
Метод максимального правдоподобия 108. 130
— моментов 108, 264
— Монте-Карло 177, 273, 285
— ПЕРТ 113 .
Множество 17
— пустое 18, 19
— элементарных исходов 17, 23
Мода 52
— эмпирическая 53
Момент распределения 57
— характеристики системы 293
— центральный 63, 268
Моментная производящая функция 58
Объединений множеств 18
Объем выборки 280
— совокупности 177
Определение вероятности 15
--- классическое 16
— — субъективное 16
— — эмпирическое 16
Островершинность распределения
Оценка выборочного среднего 130
— несмещенная 63
— смещенная 63
— эмпирическая 63
Параметр компонента 8
— масштаба 86
— распределения 47
— формы 86
— характеризующий центр распределения 48—57
Пересечение множеств 18
Плотность распределения 42, 44
--- эмпирическая 48
Подмножество 17
Получение случайных чисел 276
Преобразование случайных величин 206
Пространство выборок 23, 36
Процентиль 65
— эмпирический 67
Разложение в ряд Грема-Шарлье 232
-------Эджворта 232
Размах междецилевый 67
Распределение асимптотическое типа 1 для максимальных значений 135
----типа I для минимальных значений 135
----типа III для минимальных значений 135
— безусловное (компоненты многомерной случайной величины) 75
— биномиальное 164, 176, 192. 194. 200. 278
- Вейбулла 125, 132, 154, 159, 278. 327
— времени безотказной работы 143
— геометрическое 181, 182, 193, 197
— гипергеометрическое 180, 192. 194
— двумерное 67, 71
— Джонсона 233
----$в 236, 237, 248, 278
----S, 234, 240
----Sy 234, 238, 253, 279
дискретное 164
— Коши 119, 123, 154, 159
— логарифмически нормальное 119. 120. 143, 150, 159, 240, 278
— многомерное 79
— мультиномиальное 164, 178, 192, 194
— непрерывное 86
— нормальное 60, 62, 87, 146. 158
— — двумерное 97, 98
----многомерное 97
---- свернутое 97
— одномерное 67
— отрицательное биномиальное см. Распределение Паскаля
— параболическое 118
- Паскаля 181, 183, 193, 197
— Пирсона 255
----типа 1, см. Бета-распределение
-------Ill, см. Гамма-распределение
— полуиормальное 96. 146
— полутреугольное 119
390
— прямоугольное, см. Распределение равномерное
— пуассоновское 184—191, 193, 197, 201, 278
—^равномерное 62. 117, 150. 159,
— релеевское 119. 122, 154, 159
— совместное 68. 71
— треугольное 118
— условное 77
— хи-квадрат НО, 223. 278, 324
— экспоненциальное 110, 146, 158, 278, 324
— экстремальных значений 134, 154, 159, 330
— эрланговское НО. 111
Свертка 227
Случайные величины 36
-----вспомогательные 214, 224
-----дискретные 39
-----коррелированные 271
-----независимые ?6
-----непрерывные 39
— — нормированные 89
События 23
-----взаимно исключающие 27
— независимые 24. 26
Среднее, см. Математическое ожидание
— эмпирическое 94, 337
Среднее квадратическое отклонение 58
Статистический толерантный интервал 96
Степени свободы 111
Условная функция отказов 126
Функция распределения 40
— — случайных величин 48, 207
----линейная 83
— трех случайных величин 220
Центральная предельная теорема 91,
Чебышева неравенство 59
Числа псевдослучайные 277
— случайные 276
Эксцесс 62
Элемент выборки 23
— множества 17
Якобиан 209
391
ОГЛАВЛЕНИЕ
От редактора русского издания ...................................... 5
Предисловие......................................................... '
Гяаеа I. Введение
1.1.Применение теории вероятностей и математической статистики 12
1.2. Содержание книги....................................... 13
Глава 2. Вероятность и случайная величина
15
2,1. Определения вероятности............................
Классическое определение вероятности (принцип равных возможностей)...................................... .
Частотное (или эмпирическое) определение вероятности . Субъективное определение вероятности ...............
2.2. Понятия теория множеств............................
Объединение множеств (операция «пли»)...............
Пересечение множеств (операция «и»).................
Дополнение множества (операция «не»)................
2.3. Bi роятность и теория множеств.....................
2.4. Законы теории вероятностей , ......................
2.5. Условная вероятность и теорема Байеса..............
2.6. Случайные величины и их распределения..............
Понятие случайной величины..........................
Распределение дискретной случайной Величины . . . Плотность распределения и интегральная функция распределения непрерывной случайной величины..............
Дополнительные замечания и определения .....
2.7. Параметры, характеризующие центр распределения . . Математическое ожидание, или среднее значение . . . Медиана ................................................
Мода ...............................................
Сравнение параметров, характеризующих центр распределения ..............................................
Определение математического ожидания, медианы и моды по результатам наблюдений...........................
2.8. Математическое ожидание функции случайной величины
2.9. Другие характеристики распределений................
Моменты распределения...............................
392
Оглавление
Дисперсия и среднее квадратическое отклонение ........
Асимметрия ...........................................
Экцесс................................................
Оценка центральных моментов по результатам наблюдений
2.10. Квантили, процентили и снизанные с ними характеристики
2.11. Двумерные и многомерные распределения...............
Общие понятия ........................................
Безусловное распределение компоненты многомерной случайной величины.......................................
Независимость случайных величин.......................
Условные распределения ...............................
Характеристики многомерных распределений ....
2.12. Дисперсия линейной функции случайной величины . -
59
62
63
65
67
67
75
76
77
79
83
Глава 3. Непрерывные распределения................................ 86
3.1. Нормальное распределение.............................. 87
Характер модели.......................................... 87
Адекватность нормального распределения как физической модели.................................................. 91
Оценка параметров нормального распределения и доверительный интервал для р................................... 93
ПолунорМальпое распределение............................. 96
Двумерное нормальное распределение....................... 97
3.2. Гамма-распределение и связанные с ним распределения . 103
Характер модели........................................ 103
Аппроксимация гамма-распределения нормальным распределением ............................................... 107
Оценка параметров гамма-распределения................... 108
Обобщенная форма гамма-распределения.................... По
Частные случаи гамма-распределения: эрланговское. хи-квадрат и экспоненциальное распределения................ 110
3.3. Бета-распределение п связанные с ням распределения . . 112
Характер модели........................................ 112
Оценка параметров бета-распределення.................... 117
Обобщенная форма бета распределения..................... 117
Частный случай бета-распределення: равномерное распределение ................................................ 117
Частные случаи бета-распределення: треугольное и параболическое распределения.................................. 118
3J. Статистические модели, связанные с нормальным распределением: логарифмически нормальное распределение, распределение Релея и распределение Коши.............. 119
Общий характер моделей......................... 119
Логарифмически нормальное распределение .... 119
Распределение Релея............................. ... 122
Распределение Коши..................................... 123
3.5. Статистические модели, используемые при испытаниях на долговечность и в теории надежности ....... 125
Характер задачи........................................ 125
Интенсивность отказов.......................... 125
Экспоненциальное распределение как статистическая модель для времени безотказной работы......................... 128
Распределение Вейбулла ................................ 132
Распределения экстремальных значений .................... 134
Гамма-распределение и логарифмически нормальное распределение как статистические модели для времени безотказной работы................................................... 143
3.6. Сводка непрерывных распределении ....... 145
Глава 4. Дискретные распределения
164
4.1. Биномиальное и мультиномиальное распределения . . 164
Биномиальное распределение ,............................ 164
Математическое ожидание и дисперсия биномиального распределения п аппроксимация биномиального распределения нормальным.............................................. 171
Оценка параметра р биномиального распределения . . 176
Влияние объема совокупности .... 177
Обобщение на случай k возможных всходов: мультиномиальное распределение ...................................... 178
4.2. Гнпергеометрическое распределение.................... 180
4.3. Геометрическое распределение, распределение Паскаля и отрицательное биномиальное распределение.................... 181
4.4. Пуассоновское распределение.......................... 184
Статистическая модель................................... 184
Оценка параметра А .................................... 187
Адекватность пуассоновского распределения .... 190
Аппроксимация биномиального распределения пуассоновским и другие соотношения..............................
4.5. Сводка дискретных распределений....................
Приложение 4А. Вывод выражений для математического ожидания н дисперсии случайной величины, распределенной по биномиальному закону ..........................
Приложение 4Б, Вывод формулы, задающей пуассоновское распределение ........................................
Приложение 4В. Вывод выражений для математического ожидания и дисперсии случайной величины, распределенной по пуассоновскому закону..............................
Приложение 4Г. Пуассоновское распределение как аппроксимация биномиального распределения ..................
Глава 5. Преобразование случайных величин ........
5.1. Функции дискретных случайных величин...............
5.2. Функция одной непрерывной случайной величины . . .
5.3. Функции двух и более непрерывных случайных величин Основной метод .........................................
Пример .............................................
Другой способ исключения z..........................
Пример функции трех случайных величин ..............
Обобщение предыдущего примера к выводу формулы, задающей распределение хи-квадрат........................
Пример использования зависимых вспомогательных случайных величин .........................................
5.4. Некоторые полезные общие результаты................
g 8 8 S Й в
Глава 6. Аппроксимация эмпирическими распределениями . . .
6.1. Распределения Джонсона............................
Общие положения.....................................
Выбор семейства распределений Джонсона..............
Оценка параметров семейства распределений St Джонсона (логарифмически нормального распределении) .... Оценка параметров семейства распределений Sb Джонсона Оценка параметров семейства распределений iSu Джонсона
6.2. Распределения Пирсона.................'...........
6.3. Некоторые заключительные замечания................
Глава 7. Получение выводов о характеристике системы на основе данных о параметрах компонентов..............................
7.1. Применение центральной предельной теоремы для линейных систем .................................................
7.2. Получение моментов системы.........................
Постановка задачи ..................................
Вычисление математического ожидания характеристики системы ............................................
Пример вычисления математического ожидания характеристики системы........................................
Вычисление дисперсии характеристики системы ....
Вычисление третьего и четвертого центральных моментов характеристики системы .............................
Распределение тока в электрической цепи ............
Вычисление моментов в примере о проверке системы . . Коррелированные случайные величины .................
Обзор метода .......................................
W 7.3. Моделирование методом Монте-Карло.....................
Общие положения.....................................
Методы получения случайных чисел....................
Объем выборки и интервал между доверительными границами
7.4. Сравнение методов.................................
7.5. Другие случаи применения метода Монте-Карло ....
Приложение 7А. Вывод формул (7.3) и (7.6) .... Приложение 7Б. Выражения для моментов характеристики системы, когда случайные параметры компонентов корре-
gKSgaSSSSggg йй S SSS В ssggg egg g
лнрованы.............................................. 293
Приложение 7В. Методы получения случайных величин, имеющих различные распределения, с помощью таблиц нормированных случайных величин с равномерным и нормальным распределениями ................................. 295
Глава 8. Графическое представление вероятностей и проверка допущений о распределениях........................................... 300
8.1. Графическое представление вероятностей ..... 301
Введение ................................................ 301
Порядок работы е случае нормального распределения . . 301
Графики вероятностей для других распределений . . . 322
Основы построения графиков вероятностей ..... 333
8.2. Проверки допущений о распределениях ...... Введение ...............................................
Проверки с помощью критерия П7......................
Критерий согласия хи-квадрат........................
Таблицы ................................................
Систематизированная библиография........................
Предметный указатель ...................................
Sag